本書采用理論知識與任務案例相結合的形式,以PyCharm為主要開發工具,繫統地闡述了大數據分析處理工作流程中的重要步驟,介紹了大數據分析過程中常用的幾種第三方庫。本書共1,介紹了大數據分析處理的概念;第2介紹了大數據分析中科學計算與統計分析的相關知識;第4介紹了使用Pandas實現數據預處理的方法;介紹了使用Scikit-learn實現簡單的機器學習的方法;介紹了使用Matplotlib、Seaborn繪制圖表的方法;第10-分別介紹了4個大數據分析處理的綜合案1-9中,都包含了相關知識部分和任務實現部分,任務實現部分一般包含多個任務的具體實現過程,每個任務後面都有課堂實踐,通過完成實踐操作,讀者可以進一步鞏固所學知識。
本書既可作為高等院校大數據技術專業的教材,也可作為大數據愛好者的自學書籍。