●前言
二維碼索引
項目1 預備知識
任務1 VirtualBox虛擬機安裝與配置
任務2 在VirtualBox中安裝Ubuntu虛擬機
任務3 安裝和配置遠程連接工具Xshell
任務4 安裝和配置遠程連接工具Xftp
任務5 Linux基礎知識
項目2 準備Hadoop環境
任務1 配置JDK
任務2 配置SSH免密碼登錄
任務3 Hadoop文件和目錄結構
項目3 搭建Hadoop大數據平臺
任務1 配置單機模式Hadoop
任務2 配置偽分布模式Hadoop
任務3 配置集群模式Hadoop
任務4 安裝ZooKeeper組件
任務5 配置高可用模式Hadoop
任務6 HDFS
任務7 Hadoop調優
任務8 安裝Hive數據倉庫
任務9 搭建Spark計算平臺
項目4 使用Java語言編寫MapReduce程序
任務1 安裝與配置Maven本地倉庫
任務2 配置IDEA編程環境
任務3 編寫第一個Java應用程序
任務4 編寫Hadoop經典程序WordCount
任務5 分析通信基站數據
項目5 使用Python語言編寫MapReduce程序
任務1 WordCount案例
任務2 母嬰產品銷售數據分析
任務3 通信基站數據分析
項目6 Hadoop繫統的常見故障及應對
任務1 Hadoop繫統日志結構及分析
任務2 NameNode單節點故障的風險預防
任務3 硬件故障及應對
任務4 Hadoop繫統的隱私安全
任務5 Hadoop繫統的未來
項目7 Hadoop繫統運維
任務1 用Ambari搭建Hadoop及生態組件
任務2 動態增加和刪除Hadoop節點
任務3 從SecondaryNameNode恢復NameNode
任務4 Zabbix安裝與配置
任務5 Ansible基礎
任務6 使用Ansible部署Hadoop集群
任務7 Docker安裝與應用
任務8 使用Docker部署Hadoop集群
參考文獻
本書以任務為載體,以實施過程為主線,將知識點穿插到任務實施過程中,知識體繫的構建循序漸進、由易到難、由淺入深,符合普遍認知規律。 本書以Hadoop大數據平臺為重點,主要內容包括預備知識、準備Hadoop環境、搭建Hadoop大數據平臺、使用Java語言編寫MapReduce程序、使用Python語言編寫MapReduce程序、Hadoop繫統的常見故障及應對和Hadoop繫統運維。 本書適合作為各類職業院校大數據技術及相關專業的教材,也可以作為大數據愛好者的自學參考用書。 為便於教學,本書配有電子資源,選擇本書作為授課教材的教師可登錄機械工業出版社教育服務網(www.cmpedu.com)免費注冊後進行下載或聯繫編輯(010-88379194)咨詢。本書還配有二維碼,讀者可直接掃描二維碼觀看微課視頻,方便教學。