●上篇 基礎實驗篇
實驗1 部署全分布模式Hadoop集群
1.1 實驗目的、實驗環境和實驗內容
1.2 實驗原理
1.2.1 Linux基本命令
1.2.2 vim編輯器
1.2.3 Java基本命令
1.2.4 SSH安全通信協議
1.2.5 Hadoop
1.3 實驗步驟
1.3.1 規劃部署
1.3.2 準備機器
1.3.3 準備軟件環境
1.3.4 獲取和安裝Hadoop
1.3.5 配置全分布模式Hadoop集群
1.3.6 關閉防火牆
1.3.7 格式化文件繫統
1.3.8 啟動和驗證Hadoop
1.3.9 關閉Hadoop
1.3.10 實驗報告要求
1.4 拓展訓練——部署偽分布模式Hadoop集群
1.4.1 規劃部署
1.4.2 準備機器
1.4.3 準備軟件環境
1.4.4 和安裝Hadoop
1.4.5 配置Hadoop
1.4.6 格式化文件繫統
1.4.7 啟動和驗證偽分布模式Hadoop集群
1.4.8 關閉偽分布模式Hadoop集群
思考與練習題
參考文獻
實驗2 實戰HDFS
2.1 實驗目的、實驗環境和實驗內容
2.2 實驗原理
2.2.1 初識HDFS
2.2.2 HDFS的體繫架構
2.2.3 HDFS文件的存儲原理
2.2.4 HDFS接口
2.3 實驗步驟
2.3.1 啟動Hadoop集群
2.3.2 使用HDFS Shell
2.3.3 使用HDFS Web Ul
2.3.4 搭建HDFS的開發環境Eclipse
2.3.5 使用HDFS Java API編程
2.3.6 關閉Hadoop集群
2.3.7 實驗報告要求
2.4 拓展訓練——搭建HDFS NameNode HA
思考與練習題
參考文獻
實驗3 MapReduce編程
3.1 實驗目的、實驗環境和實驗內容
3.2 實驗原理
3.2.1 MapReduce的編程思想
3.2.2 MapReduce的作業執行流程
3.2.3 MapReduce Web
3.2.4 MapReduce Shell
……
實驗4 部署ZooKeeper集群和實戰ZooKeeper
實驗5 部署全分布模式HBase集群和實戰HBase
實驗6 部署本地模式Hive和實戰Hive
下篇 拓展實驗篇
實驗7 部署Spark集群和Spark編程
實驗8 實戰Sqoop
實驗9 實戰FIume
實驗10 實戰Kafka
內容簡介
本書作為《Hadoop大數據原理與應用》(本書作者編寫,西安電子科技大學出版社出版)的配套實驗教程,繫統介紹了Hadoop生態繫統中各個開源組件的相關知識和實踐技能。全書分為“基礎實驗篇”和“拓展實驗篇”兩篇,共10章,涉及數據采集、數據存儲與管理、數據處理與分析等大數據應用生命周期中各階段典型組件的部署、使用和基礎編程方法。“基礎實驗篇”內容包括部署全分布模式Hadoop集群、實戰HDFS、MapReduce編程、部署ZooKeeper集群和實戰ZooKeeper、部署全分布模式HBase集群和實戰HBase、部署本地模式Hive和實戰Hive;“拓展實驗篇”內容包括部署Spark集群和Spark編程、實戰Sqoop、實戰Flume、實戰Kafka。
本書內容翔實,案例豐富,操作過程詳盡,並配有完整的立體化資源,既可作為高等院校研究生、本科生的大數據技術原理與應用課程的實驗指......