作為問題導向、數據驅動的交叉學科,數據科學要求研究者具備扎實的知識儲備、高效的編程能力以及廣闊的研究視野。本書嘗試以概論的形式對數據科學的緣起、內涵、技術、工具、原則、方法、平臺、產品、應用等展開討論,幫助讀者建立完整的知識體繫與專業邏輯。全書劃分為四個部分:第一部分是緒論,鳥瞰數據科學的概念、歷史與應用;第二部分是基礎技能,涵蓋編程工具、數學基礎與統計原則;第三部分是分析方法,遵從從探索性到驗證性的數據分析思路,闡釋數據可視化方法,講解面向結構化數據的機器學習與人工智能模型,並討論非結構化數據的分析技術;第四部分是數據應用,從業界視角介紹數據庫、大數據平臺、可重復研究的理念與實踐,並以互聯網、零售、金融、醫療健康四個行業為例展開實戰討論。