●第一部分大數據概述及基礎br第章大數據概念和發展背景br什麼是大數據br2大數據的特點br3大數據的發展br4大數據的應用br5習題br第2章大數據繫統架構概述br2總體架構概述br2總體架構設計原則br22總體架構參考模型br22運行架構概述br22物理架構br222集成架構br223安全架構br23阿裡雲飛天繫統體繫架構br23阿裡雲飛天整體架構br232阿裡雲飛天平臺內核br233阿裡雲飛天開放服務br234阿裡雲飛天的特色br24主流大數據繫統廠商br24阿裡雲數加平臺br242Clouderabr243Hortonworksbr244 br245Googlebr246微軟br25習題br第3章分布式通信與協同br3數據編碼傳輸br3數據編碼概述br32LZSS算法br33Snappy壓縮庫br32分布式通信繫統br32遠程過程調用br322消息隊列br323應用層多播通信br324阿裡雲誇父RPC繫統br325Hadoopnbsp;IPC的應用br33分布式協同繫統br33Chubby鎖服務br332ZooKeeperbr333阿裡雲女媧協同繫統br334ZooKeeper在HDFS高可用方案中的使用br34習題br第4章大數據存儲br4大數據存儲技術的發展br42海量數據存儲的關鍵技術br42數據分片與路由br422數據復制與一致性br43重要數據結構和算法br43Bloomnbsp;Filterbr432LSMnbsp;Treebr433Merklenbsp;Treebr434Cuckoonbsp;Hashbr44分布式文件繫統br44文件存儲格式brbr第二部分大數據處理br第三部分大數據分析與應用br參考文獻
本書從大數據的基本概念開始,由淺入深地領會大數據的精髓。本書除了講述必要的大數據理論之外,還通過大數據實踐來講述大數據技術的應用,包括如何運用阿裡雲大數據計算平臺分析和解決實際問題,很好地體現了大數據理論與實踐的有機結合。
本書分為三大部分,分別是大數據概述及基礎、大數據處理和大數據分析與應用。其中,大數據概述及基礎部分重點介紹數據組織、重要數據結構、大數據協同技術以及大數據存儲技術等內容; 大數據處理部分重點介紹大數據處理框架,包括大數據批處理和流處理框架等內容; 大數據分析與應用部分重點介紹數據分析技術和機器學習的相關內容,以及如何利用阿裡雲的數加平臺進行基本的大數據開發工作。
本書既可以作為高等院校計算機科學、軟件工程及相關專業“大數據”課程的教材,也可以供繫統分析師、繫統架構師、軟件開發工程師和項目經理,以及其他準備或正在學習大數據技術的讀者(包等