Hadoop實戰手冊
作 者:Jonathan R. Owens 著作 傅傑 等 譯者
定 價:59
出 版 社:人民郵電出版社
出版日期:2014年03月01日
頁 數:242
裝 幀:平裝
ISBN:9787115337955
●第1章Hadoop分布式文件繫統——導入和導出數據
●1.1介紹
●1.2使用Hadoopshell命令導入和導出數據到HDFS
●1.3使用distcp實現集群間數據復制
●1.4使用Sqoop從MySQL數據庫導入數據到HDFS
●1.5使用Sqoop從HDFS導出數據到MySQL
●1.6配置Sqoop以支持SQLServer
●1.7從HDFS導出數據到MongoDB
●1.8從MongoDB導入數據到HDFS
●1.9使用Pig從HDFS導出數據到MongoDB
●1.10在Greenplum外部表中使用HDFS
●1.11利用Flume加載數據到HDFS中
●第2章HDFS
●2.1介紹
●2.2讀寫HDFS數據
●2.3使用LZO壓縮數據
●2.4讀寫序列化文件數據
●2.5使用Avro序列化數據
●2.6使用Thrift序列化數據
●2.7使用ProtocolBuffers序列化數據......
內容簡介
這是一本Hadoop實用手冊,主要針對實際問題給出相應的解決方案。歐文斯等編著的《Hadoop實戰手冊》特色是以實踐結合理論分析,手把手教讀者如何操作,並且對每個操作都做詳細的解釋,對一些重要的知識點也做了必要的拓展。全書共包括3個部分,**部分為基礎篇,主要介紹Hadoop數據導入導出、HDFS的概述、Pig與Hive的使用、ETL和簡單的數據處理,還介紹了MapReduce的調試方式;第二部分為數據分析不錯篇,主要介紹不錯聚合、大數據分析等技巧;第三部分為繫統管理篇,主要介紹Hadoop的部署的各種模式、添加新節點、退役節點、快速恢復、MapReduce調優等。
《Hadoop實戰手冊》適合各個層次的Hadoop技術人員閱讀。通過閱讀《Hadoop實戰手冊》,Hadoop初學者可以使用Hadoop來進行數據處理,Hadoop工程師或者數據挖掘工程師可以解決復雜的業務分析,Had......
Jonathan R. Owens 著作 傅傑 等 譯者
Jonathan R.Owens:軟件工程師,擁有Java和C++技術背景,*近主要從事Hadoop及相關分布式處理技術工作。目前就職於comScore公司,為核心數據處理團隊成員。comScore是一家知名的從事數字測量與分析的公司,公司使用Hadoop及其他定制的分布式繫統對數據進行聚合、分析和管理,每天處理超過400億單的交易。
Jon Lentz:comScore核心數據處理團隊軟件工程師。他更傾向於使用Pig腳本來解決問題。在加入comScore之前,他主要開發優化供應鏈和分配固定收益證券的軟件。
Brian Femi......
"