●第1章 數據分析工程師的職責
1.1 數據分析的世界
1.1.1 數據分析行業現狀
1.1.2 數據分析與Python
1.1.3 什麼是數據科學家
1.1.4 什麼是數據分析工程師
1.1.5 數據處理(預處理)的重要性
1.2 機器學習的定位和流程
1.2.1 什麼是機器學習
1.2.2 機器學習以外的選擇
1.2.3 機器學習的任務
1.2.4 機器學習的處理流程
1.3 數據分析的常用軟件包
1.3.1 什麼是軟件包
1.3.2 第三方軟件包的介紹
第2章 Python及其執行環境
2.1 構建執行環境
2.1.1 安裝Python正式版本
2.1.2 venv:Python的虛擬環境
2.1.3 pip命令
2.1.4 Anaconda
2.2 Python的基礎
2.2.1 Python語法
2.2.2 基本語法
2.2.3 標準程序庫
2.3 Jupyter Notebook
2.3.1 Jupyter Notebook是什麼
2.3.2 安裝
2.3.3 基本操作
2.3.4 簡便用法
2.3.5 所需環境的準備
第3章 數學基礎
3.1 數學公式的基礎知識
3.1.1 公式和符號
3.1.2 數學符號
3.1.3 函數
3.2 線性代數
3.2.1 向量及其運算、
3.2.2 矩陣及其運算
3.3 基礎解析
3.3.1 微分與積分的意義
3.3.2 簡單的函數微分與積分
3.3.3 微分與函數的值
3.3.4 偏微分
3.4 概率與統計
3.4.1 統計的基礎
3.4.2 數據的可視化方法
3.4.3 數據及其關繫性
3.4.4 概率
3.4.5 概率分布
3.4.6 概率與函數
第4章 利用標準庫進行實踐分析
4.1 NumPy
4.1.1 NumPy概述
4.1.2 用NumPy處理數據
4.1.3 NumPy的各種功能
4.2 pandas
4.2.1 pandas概述
4.2.2 讀寫數據
4.2.3 數據處理
4.2.4 時間序列數據
4.2.5 缺失值的處理
4.2.6 數據合並
4.2.7 統計數據的處理
4.3 Matplotlib
4.3.1 Matplotlib概述
4.3.2 繪圖對像
4.3.3 圖表類型和輸出方式
4.3.4 樣式
4.4 scikit-learn
4.4.1 預處理
4.4.2 分類
4.4.3 回歸
4.4.4 降維
4.4.5 評估模型
4.4.6 超參數優化
4.4.7 聚類
第5章 應用:數據采集和加工
5.1 數據采集
5.1.1 什麼是“爬蟲”
5.1.2 爬蟲環境的準備
5.1.3 下載網頁
5.1.4 從網頁素
5.1.5 提取信息的一覽表
5.1.6 網頁抓取的注意事項
5.1.7 後續步驟
5.2 自然語言處理
5.2.1 安裝所需的庫
5.2.2 詞素分析
5.2.3 詞袋
5.2.4 TF-IDF
5.2.5 極性判定
5.2.6 總結
5.3 圖像數據處理
5.3.1 準備要處理的圖像
5.3.2 圖像數據基礎知識
5.3.3 簡單的圖像處理
5.3.4 數據化的圖像
5.3.5 使用機器學習進行圖像分類
5.3.6 總結
參考文獻
大數據時代,數據分析成為各行各業非常重要的工作,如機器學習、深度學習、數據科學、市場營銷分析、企業決策制定等,都離不開數據分析。《Python數據分析教科書》就是一本介紹使用Python進行數據分析的入門書,詳細介紹了成為數據分析工程師推薦的技能,如數據獲取和加工、數據可視化、編程基礎、數據分析所需的基礎數學知識、機器學習的流程和執行方法等。學完本書,讀者能掌握Python的基本語法和Jupyter Notebook的使用方法,數據預處理知識,NumPy、pandas、Matplotlib和scikit-learn等軟件庫的使用方法,以及利用現有算法實現機器學習的方法。另外,對網絡爬蟲、自然語言處理和圖像數據處理等機器學習中經常用到的知識也進行了簡要介紹。本書采用雙色印刷,語言淺顯易懂,並用中小實例輔助理解,特別適合有一定編程基礎想從事數據分析工作的人員學習,也適合作為想從事人工智能工作的等