序
《大數據導論——大數據思維與創新應用》是中國人民解放軍陸軍工程大學青年學者何明教授及其科研團隊的又一佳作,也可看作3年前出版的《互聯網+思維與創新》一書的姊妹篇。正如作者所言:“大數據好比價值密度低的‘貧礦’,大數據應用好比‘沙海淘金’‘大海撈針’,其間充滿了不確定性和偶然性。”因此,大數據思維的基本出發點是“變廢為寶”,從海量的、看似無用的數據中發現潛在的利用價值。與傳統的小數據相比,大數據來源廣泛、獲取容易,但對其進行挖掘利用要困難得多。在信息社會中,數據被視為與物質、能量同等重要的社會資源,大數據是一種稀釋的資源,不同數據均彌足珍貴,隻是在價值的顯現程度上有差異。因此,我們不能對大數據視而不見或毫不可惜地丟棄海量數據。大數據思維有助於拓展我們對數據價值的認識,更重要的是啟示我們要善於發現大數據、關注大數據、管好大數據。
該書多次強調,與傳統的數據分析相比,數據挖掘得到的是關聯關繫而不是因果關繫。許多看似毫不相關的事實,其背後隱藏著千絲萬縷的聯繫。從哲學意義上講,大數據分析是用宏觀整體思維替代抽樣統計思維,是用有偏差的數據分析替代精確的數值計算,是用定量的計算思維替代定性的理性思維。用相關性改變人們長期以來對因果關繫的偏愛,是認識論的一次深刻轉型。通過大數據可獲得萬物間相互聯繫的特殊規律,這些規律有一定預見能力,豐富了人們的知識,但大數據的不足之處是缺乏演繹能力,人們隻能知其然而不知其所以然。經過實踐的檢驗,這些規律或許被認為是客觀規律,或許需要二次解讀和理性分析。總之,數據挖掘已成為科學研究的第四範式,是對試驗觀察、理論推導、模擬仿真等方法的補充。但我們不能滿足於關聯規律的發現,隻有揭示了數據內在的因果關繫,纔能更深入地理解和科學地運用這些客觀規律。
該書專闢一章論述大數據技術。大數據技術本身不是一門學科,而是一種方法,它與雲計算、機器學習等新技術密切相關。面對海量異構、動態變化、質量低劣的數據,傳統的數據處理方法難以為繼,而新的處理分析技術還不夠成熟。與國外相比,我們在大數據技術方面還有一定差距,但也有相對優勢,比如有廣泛的大數據資源,網民的數量位居世界之首,有的省市成立了“大數據發展局”“大數據管理局”,許多智慧城市建設將大數據應用作為亮點……我們有理由相信,在技術、產業的相互促進下,我國的大數據應用必將後來居上。
該書雖冠名“大數據”,但在介紹典型產業的創新應用時,也包含了小數據的運用。平心而論,兩種數據之間並無嚴格的界限,況且在發展數字化、信息化的道路上,小數據的共享、挖掘、安全等問題還沒有得到很好的解決,大數據又提出了新的挑戰。為此,不少學者呼吁,在數據資源利用上,不能抓“大”放“小”、盲目跟風,對大數據的創新應用期望值不宜過高,更不能減少對小數據應用的研究。
該書內容深入淺出,並配有大量的應用案例,可作為規劃、管理人員理解大數據的入門指南,也可作為大數據教學、科研人員的參考資料。隨著我國信息化建設的深入和普及,我們相信將會有新的素材、新的案例不斷補充進來,使該書內容更加翔實。在此,謹祝願我國大數據應用之樹枝繁葉茂,祝願我國大數據產業發展日新月異。
中國工程院院士
2019年3月
前 言
隨著人工智能、5G及區塊鏈技術的發展,大數據進入了深度發展時期,在政府服務、工業生產、科學研究等領域得到了空前應用,已成為事關國家經濟社會發展的戰略性資源。我國對運用大數據加強社會各領域建設極其重視,“一帶一路”“京津冀協同發展”“軍民融合”等戰略與大數據緊密相關,各級政府也陸續成立了大數據管理機構。黨的十九大報告指出,要推動互聯網、大數據、人工智能和實體經濟深度融合;《2019年國務院政府工作報告》中指出,要深化大數據、人工智能等研發應用。因此,大數據對社會各行各業的支撐作用和影響會繼續加強。
從哲學層面看,大數據思維是一種全新的思維模式。傳統的自然思維模式誕生於依賴小數據和精確性的時代,看重精確性和因果關繫,是信息缺乏的產物。大數據思維模式主要側重考慮數據的整體性和相關性,一開始會與人類直覺相矛盾,但接受數據的不精確和不完美,反而使人類能夠更好地預測未來和理解世界,幫助人類進一步接近事實的真相。
本書立足於當前大數據在各行各業的發展現狀,根據理論創新與實踐應用相結合的原則,較全面地介紹了大數據時代、戰略、思維、產業和技術,並結合當前國家省市機構體制改革背景,選取市場監管、綜合交通、農業農村、政務服務、公共安全、醫療健康等行業的創新應用,闡述了如何運用大數據更好地履行政府職能和提升企業效益。本書內容包括10章:第1章擁抱大數據時代;第2章概覽大數據戰略;第3章從哲學、運營、理政、創新等角度剖析大數據思維;第4章跟蹤大數據產業進展;第5章介紹大數據技術;第6章至第9章分別分析市場監管大數據、綜合交通大數據、農業農村大數據及其他行業大數據應用案例;第10章展望大數據的未來。
全書內容經過多次討論和修改纔得以定稿,力求能夠繫統梳理國內外大數據相關成果,創新大數據思維,並做到邏輯嚴謹、文字順暢、深入淺出,以期為大數據從業人員、研究人員和政府決策人員提供借鋻和啟發。盡管本書編寫時投入了大量的資源和精力,但書中仍難免存在錯誤和疏漏之處,敬請廣大讀者批評指正。
感謝江蘇省社會公共安全應急管控與指揮工程技術研究中心、江蘇省社會公共安全科技協同創新中心和江蘇省應急處置工程研究中心為本書編寫提供案例支持。本書的出版得到國家重點研發計劃2018YFC0806900、國家自然科學基金(青年)71901217,中國博士後科學基金資助項目2018M633757,江蘇省重點研發計劃BE2015728、BE2016904、BE2017616、BE2018754、BE2019762等項目的支持。
感謝、李功淼、張玉恆、肖毅、徐兵、張喬、王文、劉葉芳、仇功達、楊雲、張斌、顧凌楓、楊鋮和劉祖均等人為本書所做的工作。特別感謝我的博士後導師戴浩院士,他以嚴謹的學術態度認真審閱了書稿,並對書稿提出了細致且有針對性的修改意見,使本書增色不少。
何 明
2019年3月