出版社:機械工業出版社 ISBN:9787111565611 商品編碼:12656073213 品牌:文軒 出版時間:2017-05-01 代碼:69 作者:穆罕默德·古勒(MohammedGuller
" 作 者:(美)穆罕默德·古勒(Mohammed Guller) 著;趙斌,馬景,陳冠誠 譯 定 價:69 出 版 社:機械工業出版社 出版日期:2017年05月01日 頁 數:249 裝 幀:平裝 ISBN:9787111565611 ●譯者序 ●前言 ●致謝 ●第1章大數據技術一覽1 ●1.1Hadoop2 ●1.1.1HDFS3 ●1.1.2MapReduce5 ●1.1.3Hive5 ●1.2數據序列化6 ●1.2.1Avro6 ●1.2.2Thrift6 ●1.2.3ProtocolBuffers7 ●1.2.4SequenceFile7 ●1.3列存儲7 ●1.3.1RCFile8 ●1.3.2ORC8 ●1.3.3Parquet9 ●1.4消息繫統9 ●1.4.1Kafka10 ●1.4.2ZeroMQ11 ●部分目錄 本書是關於大數據和Spark的一個簡明手冊。它將助你學習如何用Spark來完成很多大數據分析任務,其中覆蓋了高效利用Spark所需要知道的重要主題:如何使用SparkShell進行交互式數據分析、如何編寫Spark應用、如何在Spark中對大規模數據進行交互分析、如何使用SparkStreaming處理高速數據流、如何使用Spark進行機器學習、如何使用Spark進行圖處理、如何使用集群管理員部署Spark、如何監控Spark應用等。本書還對其他配合Spark一起使用的大數據技術進行了介紹,包括HDFS、Avro、Parquet、Kafka、Cassandra、HBase、Mesos等。本書也對機器學習和圖的概念進行了介紹。 (美)穆罕默德·古勒(Mohammed Guller) 著;趙斌,馬景,陳冠誠 譯 穆罕默德·古勒,Glassbeam的首席架構師,主要負責不錯分析和預測分析產品的開發。他是大數據和Spark專家,經常受邀在與大數據相關的會議上發表演講。他對於新產品構建、大數據分析和機器學習充滿熱情。
" |