●項目一走進大數據1
●任務1概述大數據的內涵2
●任務2關注大數據的影響6
●任務3認識常見的大數據計算模式11
●任務4釐清大數據處理的基本流程14
●任務5大數據應用大顯神通15
●任務6大數據的發展及面臨的挑戰18
●【同步訓練】22
●項目二Ubuntu及服務安裝配置23
●任務1安裝UbuntuServer24
●任務2搭建FTP繫統33
●任務3搭建MySQL數據庫繫統37
●任務4安裝UbuntuDesktop41
●【同步訓練】47
●項目三Hadoop集群部署48
●任務1構建集群繫統49
●任務2SSH證書登錄54
●任務3Hadoop部署與使用56
●【同步訓練】76
●項目四MapReduce編程77
●部分目錄
全書共十個項目,除了項目一介紹大數據基礎理論外,其餘項目均以實戰為主線,內容循序漸進,逐步深入,圍繞大數據技術的應用層層展開。內容主要包括大數據的基本概念、Ubuntu及服務安裝配置、Hadoop集群部署、MapReduce編程、HBase數據庫部署與應用、Hive數據倉庫安裝與應用、Pig數據分析、Sqoop數據遷移、Spark部署及數據分析等知識,很後以大數據技術的具體應用介紹了MapReduce大數據編程、Mahout的K-Means計算、決策樹和隨機森林的分類預測、頻繁項集運算和關聯分析等知識。本書秉承“實踐為主、理論夠用,注重實用”原則,將實驗環節及實操內容融入各個知識點與課程教學中,以便讀者能更好地學習和掌握大數據關鍵技術。