內容簡介
本書較為繫統地講解了Hadoop生態繫統的相關技術原理、使用方法和開發技術,全書共9章。第1章對大數據技術進行了概述。第2章介紹了Hadoop環境搭建的詳細步驟。第3章介紹了HDFS的架構理論、常用命令以及API的使用和編程方法。第4章介紹了MapReduce的相關原理、IO/序列化機制、MapReduce的編程開發要點和實例。第5章介紹了YARN的產生背景、體繫結構、通信協議、執行過程及調度器和ZooKeeper的數據模型、架構及安裝配置。第6章介紹了HBase的相關原理、安裝配置、Shell命令以及API編程方法。第7章介紹了Hive的基本原理、基本操作、HQL語句和Hive JDBC編程。第8章介紹了NoSQL數據庫的基本概念、MongoDB數據庫的概念和安裝配置、MongoDB數據庫使用方法。第9章介紹了在Hadoop生態繫統中常用的幾種工具,Sqoop、Kafka以及Flume。