數據科學與分析 Python語言實現
作 者: (英)赫蘇斯·羅格爾-薩拉查(Jesus Rogel-Salazar) 著 白皓 等 譯
定 價: 69
出?版?社: 機械工業出版社
出版日期: 2019年04月01日
頁 數: 223
裝 幀: 平裝
ISBN: 9787111623175
●譯者序
前言
讀者指南
章數據科學家的試驗與磨難1
1.1數據?科學?數據科學!1
1.2數據科學家:現代鹿角兔4
1.3數據科學工具9
1.4從數據到洞察力:數據科學工作流11
1.4.1識別問題13
1.4.2獲取數據13
1.4.3數據挖掘13
1.4.4建模與評價13
1.4.5表征與互動14
1.4.6數據科學:一個迭代過程14
1.5總結15
第2章Python:完全不同的編程語言16
2.1為何是Python?為何不是?17
2.1.1使用Shell或不使用Shell19
2.1.2使用iPython/JupyterNotebook20
2.2初探Python21
2.2.1基本類型21
2.2.2數字21
2.2.3字符串22
2.2.4復數23
2.2.5列表24
2.組27
2.2.7字典29
2.3控制流31
2.3.1if...elif...else31
2.3.2while32
2.3.3for33
2.3.4try...except34
2.3.5函數36
2.3.6腳本和模塊39
2.4計算和數據處理41
2.4.1矩陣操作和線性代數41
2.4.2NumPy數組和矩陣42
2.4.3索引和切片45
2.5“熊貓”前來救駕46
2.6繪圖和可視化庫:Matplotlib50
2.7總結52
第3章能夠探知的機器:機器學習和模式識別53
3.1認知模式53
3.2人工智能和機器學習54
3.3數據很好,但也需要其他支持56
3.4學習、預測和分類57
3.5機器學習和數據科學58
3.6特征選擇59
3.7偏差、差異和正規化:平衡法60
3.8一些有用的措施:距離和相似性61
3.9注意“維度的詛咒”64
3.10Scikit-learn是我們的朋友67
3.11訓練和測試70
3.12交叉驗證72
3.13總結75
第4章關繫難題:回歸76
4.1變量之間的關繫:回歸76
4線性回歸78
4.3普通最小二乘法80
4.4大腦與身體:單變量回歸83
4.5對數變換90
4.6使任務更容易:標準化和擴展93
4.6.1正則化或單位縮放94
4.6.2z-Score縮放95
4.7多項式回歸96
4.8方差–偏差權衡99
4.9收縮:選擇運算符和Ridge101
4.10總結105
第5章鹿角兔和野兔:聚類107
5.1聚類107
5.2k–均值聚類108
5.2.1聚類驗證110
5.2.2k–均值實際操作112
5.3總結115
第6章獨角獸和馬:分類116
6.1分類116
6.1.1混淆矩陣117
6.1.2ROC和AUC119
6.2使用KNN算法分類121
6.3邏輯回歸分類器126
6.3.1邏輯回歸的解釋129
6.3.2邏輯回歸的應用130
6.4使用樸素貝葉斯算法進行分類136
6.4.1樸素貝葉斯分類器139
6.4.2樸素貝葉斯分類的應用140
6.5總結144
第7章決策:分層聚類、決策樹和集成技術145
7.1分層聚類145
7.2決策樹150
7.3集成技術160
7.3.1套袋164
7.3.2助推164
7.3.3隨機森林165
7.3.4層疊和混合166
7.4集成技術實踐167
7.5總結171
第8章少即多:降維172
8.1降維172
8.2主成分分析175
8.2.1PCA實踐177
8.2.2PCA在鳶尾花數據集中的應用180
8.3奇異值分解183
8.4推薦繫統187
8.4.1基於內容的過濾實踐188
8.4.2協同過濾實踐191
8.5總結195
第9章內核秘訣:支持向量機197
9.1支持向量機和內核方法197
9.1.1支持向量機199
9.1.2內核的技巧204
9.1.3SVM實踐:回歸205
9.1.4SVM實踐:分類208
9.2總結212
附錄Scikit-learn中的管道213
參考文獻217
內容簡介
本書由前IBM首席數據科學家撰寫,旨在為勵志成為數據科學家的讀者給出一個可行的實踐指南。從Python入門開始,逐步實現數據分析、機器學習等通用算法,進而討論數據科學家的典型工作流程,很後從實踐入手,由淺入深,精選決策樹、降維技術、支持向量機等數據分析案例,讓讀者能逐步理解晦澀的公式理論並上手操作,可以滿足不同層次的讀者需求。
(英)赫蘇斯·羅格爾-薩拉查(Jesus Rogel-Salazar) 著 白皓 等 譯