本書繫統闡述了Hadoop大數據技術應用實踐的原理、方法和應用相關知識,同時給出了每一章內容對應的實現指令或源程序。全書共九章內容。內容由淺入深,分為基礎篇及提高篇兩部分,其中第1章到第4章為基礎篇,內容涵蓋Hadoop初識簡介、Hadoop基礎環境搭建、分布式存儲HDFS介紹以及MapReduce編程模型等知識,提高篇包括Hadoop數據倉庫Hive、Hadoop數據庫Hbase、Pig語言、Hadoop項目案例以及Mahout項目案例等較深入的知識。本書理論結合實際,每一個章節都包含有相關內容的實踐部分,以便讀者在了解相關知識後,能及時進行項目的實踐,有助於提高讀者動手實踐的能力。每章提供適量習題,進一步加深對內容的理解。