●第1章 大數據概述
● 1.1 大數據時代的數據特點
● 1.2 大數據時代的發展趨勢――數據將成為資產
● 1.3 大數據時代處理數據理念的改變
● 1.3.1 要全體不要抽樣
● 1.3.2 要效率不要絕對準確
● 1.3.3 要相關不要因果
● 1.4 大數據時代的關鍵技術
● 1.5 大數據時代的典型應用案例
● 1.5.1 塔吉特超市精準營銷案例
● 1.5.2 谷歌流感趨勢案例
● 1.5.3 證券行業案例
● 1.5.4 某運營商大數據平臺案例
● 1.6 Hadoop概述和介紹
● 1.6.1 Hadoop發展歷史和應用現狀
● 1.6.2 Hadoop的特點
● 1.6.3 Hadoop的生態繫統
●第2章 Cloudera大數據平臺介紹
● 2.1 Cloudera簡介
● 2.2 Cloudera的Hadoop發行版CDH簡介
●部分目錄
對於入門和學習大數據技術的讀者來說,大數據技術的生態圈和知識體繫過於龐大,可能還沒有開始學習就已經陷入眾多的陌生名詞和泛泛的概念中。本書的切入點明確而清晰,從Hadoop 生態繫統的明星 Cloudera 入手,逐步引出各類大數據基礎和核心應用框架。本書分為18章,繫統介紹Hadoop 生態繫統大數據相關的知識,包括大數據概述、Cloudera Hadoop平臺的安裝部署、HDFS分布式文件繫統、MapReduce計算框架、資源管理調度框架YARN 、Hive數據倉庫、數據遷移工具Sqoop、分布式數據庫HBase、ZooKeeper分布式協調服務、準實時分析繫統Impala、日志采集工具Flume、分布式消息繫統Kafka、ETL工具Kettle、Spark計算框架等內容,很後給出兩個綜合實操案例,以鞏固前面所學的知識點。本書既適合Hadoop初學者、大數據技術工程師和大數據技術愛好等