大數據分析涉及數據存儲、數據處理、統計分析、數據可視化等技術問題。本書通過Hadoop和阿裡雲的MaxCompute架構介紹了大數據的數據存儲、數據處理的原理。因為Hadoop等大數據存儲和處理平臺大多基於Linux操作繫統,所以本書也介紹了Linux操作繫統的基本使用方法。另外,本書還介紹了關繫型數據庫的重要原理、SQL語言及數據倉庫的概念。統計學是數據分析的基礎理論,本書概括了常用的統計學理論。數據可視化也是數據分析的重要工具,本書介紹了常用的圖表、可視化的原則及可視化的工具。本書適合作為阿裡雲大數據分析師ACA認證考試的學習教材,也可作為學校或培訓機構大數據分析等相關課程的教材,還可供大數據從業者和愛好者閱讀參考。