大數據讓我們以一種靠前的方式,通過對海量數據進行分析,獲得有巨大價值的產品和服務,很終形成變革之力。本書圍繞Hadoop和Spark這兩個主流技術進行講解,主要內容包括Hadoop環境配置、分布式文件繫統HDFS、分布式計算框架MapReduce、資源調度框架YARN與Hadoop新特性、大數據數據倉庫Hive、離線處理輔助繫統、Spark Core、 Spark SQL、Spark Streaming等知識。為保證很優學習效果,本書緊密結合實際應用,利用大量案例說明和實踐,提煉含金量十足的開發經驗。本書使用Hadoop和Spark進行大數據開發,並配以完善的學習資源和支持服務,包括視頻教程、案例素材下載、學習交流社區、討論組等終身學習內容,為開發者帶來多方面的學習體驗。