了得網圖書_劍指大數據 Hadoop學習精要圖書

作者:尚硅谷教育編

定價:105

出版社:電子工業出版社

出版日期:2022年11月01日

頁數:308

裝幀:平裝

ISBN:9787121443923

●第1章大數據概論
1.1大數據的特征
1.2大數據的發展前景
1.2.1大數據的應用場景
1.2.2大數據的未來發展
1.3大數據生態體繫與Hadoop
1.3.1Hadoop的發展史
1.3.2大數據生態體繫
1.3.3Hadoop架構
1.4本章總結
第2章環境準備
2.1安裝VMware
2.2安裝CentOS
2.3安裝遠程終端
2.3.1安裝Xshell
2.3.2安裝SecureCRT
2.4虛擬機配置
2.4.1網絡配置
2.4.2網絡IP地址配置
2.4.3主機名配置
2.4.4防火牆配置
2.4.5一般用戶配置
2.4.6克隆虛擬機
2.5本章總結
第3章Hadoop快速上手
3.1集群角色
3.1.1Hadoop集群的主要角色
3.1.2YARN的主要組成部分
3.2本地模式
3.2.1安裝
3.2.2運行官方示例程序
3.3接近分布式模式
3.3.1SSH免密登錄
3.3.2shell腳本準備
3.3.3集群配置
3.3.4NameNode格式化問題
3.3.5配置歷史服務器與日志聚集功能
3.3.6Hadoop集群啟停腳本
3.3.7集群時間同步
3.4本章總結
第4章分布式文件繫統HDFS
4.1HDFS概述
4.1.1HDFS背景及定義
4.1.2HDFS的基本架構
4.2HDFS的shell操作
4.2.1命令大全
4.2.2命令行命令實操
4.3HDFS的API操作
4.3.1客戶端環境準備
4.3.2HDFS文件上傳案例
4.3.3HDFS文件下載案例
4.3.4HDFS文件重命名案例
4.3.5HDFS文件刪除案例
4.3.6HDFS文件詳情查看案例
4.3.7HDFS文件和文件夾判斷案例
4.4HDFS的讀/寫流程
4.4.1HDFS中的數據塊大小
4.4.2寫數據流程
4.4.3讀數據流程
4.5HDFS的工作機制
4.5.1NameNode和SecondaryNameNode的工作機制
4.5.2EditLog和FsImage文件解析
4.5.3檢查點時間設置
4.5.4DataNode的工作機制
4.5.5數據完整性
4.6本章總結
第5章分布式計算MapReduce
5.1MapReduce概述
5.1.1MapReduce定義
5.1.2MapReduce核心思想
5.2MapReduce編程入門
5.2.1官方示例程序WordCount源碼
5.2.2編程規範
5.2.3WordCount案例實操
5.3Hadoop的序列化
5.3.1序列化概述
5.3.2Writable接口
5.3.3序列化案例實操
5.4MapReduce框架原理之InputFormat數據輸入
5.4.1切片與MapTask並行度決定機制
5.4.2Job提交流程源碼和FileInputFormat切片源碼詳解
5.4.3FileInputFormat切片機制總結
5.4.4TextInputFormat
5.4.5CombineTextInputFormat切片機制
5.4.6CombineTextInputFormat案例實操
5.5MapReduce框架原理之shuffle機制
5.5.1shuffle機制
5.5.2分區
5.5.3分區案例實操
5.5.4WritableComparable排序
5.5.5WritableComparable排序案例實操（全排序）
5.5.6WritableComparable排序案例實操（區內排序）
5.5.7Combiner合並
5.5.8Combiner合並案例實操
5.6MapReduce框架原理之OutputFormat數據輸出
5.6.1OutputFormat接口的實現類
5.6.2自定義OutputFormat類的案例實操
5.7MapReduce工作流程
5.8Join
5.8.1ReduceJoin
5.8.2ReduceJoin案例實操
5.8.3MapJoin
5.8.4MapJoin案例實操
5.9數據清洗
5.10Hadoop中的數據壓縮
5.10.1數據壓縮概述
5.10.2壓縮參數配置
5.10.3壓縮案例實操
5.11本章總結
第6章資源調度器YARN
6.1YARN概述
6.1.1基本架構
6.1.2工作機制
6.2YARN的資源調度器和調度算法
6.2.1FIFO調度器
6.2.2容量調度器
……

Hadoop是使用最廣泛的大數據處理框架之一，在大數據領域有著極其重要的地位，掌握Hadoop可以讓學習者對大數據的理解更進一步。本書是基於Hadoop 3.1.3編寫的，從大數據的特點和處理難點入手，逐步講解Hadoop的起源和發展。從搭建Hadoop的學習環境開始，依次對Hadoop的三大功能模塊進行重點講解，並且結合大量案例，細致地講解HDFS、MapReduce、YARN的內核原理和調優方法，還會擴展講解Hadoop的高可用實現、在生產環境中的調優方法及源碼解讀。

本書廣泛適用於大數據的學習者與從業人員，是大數據學習的推薦書籍。

尚硅谷教育編

尚硅谷教育是一家專業的IT教育培訓機構，開設了JavaEE、大數據、HTML5前端等多門學科，在互聯網上發布的JavaEE、大數據、HTML5前端、區塊鏈、C語言、Python等技術視頻教程廣受贊譽。

商品搜索

商品分类

【醫學】

【各大出版社】