●第1章大數據概論
1.1大數據的特征
1.2大數據的發展前景
1.2.1大數據的應用場景
1.2.2大數據的未來發展
1.3大數據生態體繫與Hadoop
1.3.1Hadoop的發展史
1.3.2大數據生態體繫
1.3.3Hadoop架構
1.4本章總結
第2章環境準備
2.1安裝VMware
2.2安裝CentOS
2.3安裝遠程終端
2.3.1安裝Xshell
2.3.2安裝SecureCRT
2.4虛擬機配置
2.4.1網絡配置
2.4.2網絡IP地址配置
2.4.3主機名配置
2.4.4防火牆配置
2.4.5一般用戶配置
2.4.6克隆虛擬機
2.5本章總結
第3章Hadoop快速上手
3.1集群角色
3.1.1Hadoop集群的主要角色
3.1.2YARN的主要組成部分
3.2本地模式
3.2.1安裝
3.2.2運行官方示例程序
3.3接近分布式模式
3.3.1SSH免密登錄
3.3.2shell腳本準備
3.3.3集群配置
3.3.4NameNode格式化問題
3.3.5配置歷史服務器與日志聚集功能
3.3.6Hadoop集群啟停腳本
3.3.7集群時間同步
3.4本章總結
第4章分布式文件繫統HDFS
4.1HDFS概述
4.1.1HDFS背景及定義
4.1.2HDFS的基本架構
4.2HDFS的shell操作
4.2.1命令大全
4.2.2命令行命令實操
4.3HDFS的API操作
4.3.1客戶端環境準備
4.3.2HDFS文件上傳案例
4.3.3HDFS文件下載案例
4.3.4HDFS文件重命名案例
4.3.5HDFS文件刪除案例
4.3.6HDFS文件詳情查看案例
4.3.7HDFS文件和文件夾判斷案例
4.4HDFS的讀/寫流程
4.4.1HDFS中的數據塊大小
4.4.2寫數據流程
4.4.3讀數據流程
4.5HDFS的工作機制
4.5.1NameNode和SecondaryNameNode的工作機制
4.5.2EditLog和FsImage文件解析
4.5.3檢查點時間設置
4.5.4DataNode的工作機制
4.5.5數據完整性
4.6本章總結
第5章分布式計算MapReduce
5.1MapReduce概述
5.1.1MapReduce定義
5.1.2MapReduce核心思想
5.2MapReduce編程入門
5.2.1官方示例程序WordCount源碼
5.2.2編程規範
5.2.3WordCount案例實操
5.3Hadoop的序列化
5.3.1序列化概述
5.3.2Writable接口
5.3.3序列化案例實操
5.4MapReduce框架原理之InputFormat數據輸入
5.4.1切片與MapTask並行度決定機制
5.4.2Job提交流程源碼和FileInputFormat切片源碼詳解
5.4.3FileInputFormat切片機制總結
5.4.4TextInputFormat
5.4.5CombineTextInputFormat切片機制
5.4.6CombineTextInputFormat案例實操
5.5MapReduce框架原理之shuffle機制
5.5.1shuffle機制
5.5.2分區
5.5.3分區案例實操
5.5.4WritableComparable排序
5.5.5WritableComparable排序案例實操(全排序)
5.5.6WritableComparable排序案例實操(區內排序)
5.5.7Combiner合並
5.5.8Combiner合並案例實操
5.6MapReduce框架原理之OutputFormat數據輸出
5.6.1OutputFormat接口的實現類
5.6.2自定義OutputFormat類的案例實操
5.7MapReduce工作流程
5.8Join
5.8.1ReduceJoin
5.8.2ReduceJoin案例實操
5.8.3MapJoin
5.8.4MapJoin案例實操
5.9數據清洗
5.10Hadoop中的數據壓縮
5.10.1數據壓縮概述
5.10.2壓縮參數配置
5.10.3壓縮案例實操
5.11本章總結
第6章資源調度器YARN
6.1YARN概述
6.1.1基本架構
6.1.2工作機制
6.2YARN的資源調度器和調度算法
6.2.1FIFO調度器
6.2.2容量調度器
……