作 者:朱松嶺 著
定 價:59
出 版 社:機械工業出版社
出版日期:2018年05月01日
頁 數:223
裝 幀:平裝
ISBN:9787111596783
●前言
●第一篇 數據大圖和數據平臺大圖
●第1章 數據大圖 2
●1.1 數據流程 2
●1.1.1 數據產生 3
●1.1.2 數據采集和傳輸 5
●1.1.3 數據存儲處理 6
●1.1.4 數據應用 7
●1.2 數據技術 8
●1.2.1 數據采集傳輸主要技術 9
●1.2.2 數據處理主要技術 10
●1.2.3 數據存儲主要技術 12
●1.2.4 數據應用主要技術 13
●1.3 數據相關從業者和角色 14
●1.3.1 數據平臺開發、運維工程師 14
●1.3.2 數據開發、運維工程師 15
●1.3.3 數據分析工程師 15
●1.3.4 算法工程師 16
●1.3.5 業務人員 16
●1.4 本章小結 17
●部分目錄
本書分為三篇。第壹篇:從整體上給出數據大圖和數據平臺大圖,主要介紹數據的主要流程、各個流程的關鍵技術、數據的主要從業者及他們的職責等;數據平臺大圖分離線和實時分別給出數據平臺架構、關鍵數據概念和技術等;第二篇:介紹離線數據開發的主要技術,包含Hadoop、Hive、維度建模等,另外此部分還將綜合上述各種離線技術給出離線數據處理實戰;第三篇:集中介紹實時數據處理的各項技術,包含Storm、SparkSteaming、Flink、Beam等。
Preface前 言為什麼要寫這本書念念不忘,終有回響。 撰寫一本數據開發相關書的念頭始於筆者學習數據知識的早期,當時筆者遍尋市面上所有的數據書籍,卻沒有發現一本繫統化且從項目實踐角度突出重點的數據開發書籍。 筆者非常理解某領域初學者的苦衷,對於他們來說,最重要的不是具體的API、安裝教程等,而是先找到該領域的知識圖譜,有了它,就可按圖索驥,有針對性地去學。 對於大數據技術來說,上述需求更甚。一方面,由於社區、商業甚至個人原因,大數據的技術可以說是五花八門、琳瑯滿目,初學者非常容易不知所措,不知從哪裡下手。另一方面,從理論上來說,互聯網上幾乎可以查到所有的大數據技術,比如在百度上搜索、問知乎,但這些都是碎片化等