我們為什麼要認識數據的本質
一場以大數據為核心的智能盛宴
時下仿佛大家都在談人工智能,就像當年人人都在談大數據一樣。
在不同場合上,阿裡巴巴的馬雲、百度的李彥宏及騰訊的馬化騰分別談過自己對人工智能的看法和觀點。這種對話有點兒像金庸小說中的華山論劍。到底是氣宗( 大數據)還是劍宗(人工智能)更有戰略意義?我認為,兩者是相輔相成的。經歷了互聯網20年的發展,我們已經積累了足夠多的數據去驅動一場“智能盛宴”,以大數據為核心的人工智能漸露端倪。
2010年,“數據科學家”這個稱謂的發明者帕蒂爾(D.J.Patil)和傑夫·哈默巴赫(Jeff Hammerbacher)認為,一切應該以產品為中心,從數據獲取、數據清洗、搭建和管理數據設施、原型開發、產品設計等方面,去實踐數據的價值。我在阿裡就經歷了從“數據產品”到“數據作為產品”的階段,後者其實纔是大數據的真正產物,也是人工智能的源泉。
誰掌握“完美信息”,誰就將擁有整個世界
剛開始進入數據行業時,我一直秉承著這樣一個理念:在“假設數據都是可獲取的”基礎上,思考問題。隨著整個社會數據化程度的進一步加深,以及人與物之間的高度互聯,以前很多信息的盲點被快速解開。由不同領域積累下的數據形成的“完美信息”漸露端倪,這其實是一個數據從量變到質變的過程。這一“完美信息”具有無限潛能,足以讓人工智能所向披靡,催生各種智能場景,並讓其如潮湧至。智能時代,秉承“假設數據都是可獲取的”這一思維方式,纔可讓你比別人更勝一籌,從而做到心中有數。
現實中,我們從數據收集、整合、判斷,以至行動、再到反饋的過程並不完美,而形成數據閉環繫統的阻力往往是人為因素居多。谷歌無人駕駛汽車項目的偉大之處正是給了我們重要的啟發,讓我們意識到自動化及智能化所需要的數據閉環繫統是如何做到了既封閉又開放,其中的裡應外合正是未來的發展趨勢。我在阿裡就經歷了4個不同階段:數據驅動決策、數據驅動流程、數據驅動產品、數據驅動業務。在此過程中,你會發現,數據驅動的目標越模糊、數據越零散、人的互動環節越多,智能項目開展起來就越喫力。
從數據戰略到數據治理,別讓數據成為累贅
如前所述,數據資源的積累是發展數字經濟的前提。企業在向往智能時代所帶來的機遇的同時,更要為企業的未來目標制定數據戰略。企業不僅要關注自己現在有什麼數據,更要了解未來會欠缺什麼。然後,再去探討欠缺的部分有多少可以靠自己補充,有多少需要求助他人、與他人合作以實現補充。有人把數據比喻為電能,這個比喻很生動,但與電能不一樣的是,數據是可以被重復使用的。所以從戰略意義上來說,第二使用權的合規性變得非常微妙。
大數據背後的邏輯是數據積累越多越好,在過去兩三年,很多企業都相信有了大量數據資源後,就能對企業的業務產生更大價值。但人們往往很快就會發現,除了技術能力之外,如何妥當地管理、利用這些資源並非易事:安全合規是一方面,降低數據使用的阻力及風險也是困難重重。所以我一直倡議,數據治理不是數據部門的工作,而是公司總體的戰略。這意味著,“本性純善”的大數據也容易變成一個累贅。
數據是一種信仰,“善”用纔是本質
2016年,一場圍棋大戰讓人類引以為傲的智力頂配瞬間被AlphaGo踐踏得體無完膚。而在我看來,這場大戰其實不過是一幫人贏了另一幫人,而且大部分人僅注意到了智“能”,而忽略了它與智“慧”的差別:“能”是能力的表現,而“慧”是心除雜念,將智能用在具有的地方。同樣的科技能力是被善用還是被濫用隻有一線之差。
幾千年來,人類習慣了生存在信息稀缺的年代,大數據與人工智能則為人們帶來了曙光,同時也引發了擔憂。暫且撇開我們會不會被機器人侵略這個問題,人類真的已經充分利用了自己的潛能了嗎?數據是一種信仰,我們應該善用這個寶藏,為人類創造更美好的世界。
經歷了這大半人生,作為數據分析師,我希望借助《數據的本質》這本書,在我人到中年時,交出一份人生中期職業報告,把自己的所見、所學彙總在書中,這樣,既作自娛亦可作他樂。
最後,感謝大家多年來的支持!