作 者:李燁 著
定 價:99.8
出 版 社:人民郵電出版社
出版日期:2021年10月01日
頁 數:336
裝 幀:平裝
ISBN:9787115573261
1.針對AI入門讀者,從最基本的原理及學習意義入手,以模型為驅動,帶領讀者喫透機器學習模型。2.本書內含精心設計的數據量較小的簡易版實例,讓讀者可以直觀了解模型的運行原理。3.作者總結了自身的實踐經驗,整理了構建數據集、選擇特征、調參、驗證模型的方法。4.基本的原理+常見的案例+極小數據樣本,助你輕松入門機器學習。5.微軟全球副總裁洪小文、微軟技術官韋青等人作序推薦。6.通過學習這本書,你將收獲:AI技術崗位求職知識儲備各大模型與算法觸類旁通極簡版實例體驗實際應用配套數據+代碼等
●第一部分緒論
第1章為什麼要學原理和公式推導2
1.1學模型就要學公式推導嗎2
1.2學習原理的必要性3
第2章學習機器學習原理,改變看待世界的方式6
2.1破除迷信6
2.2追本溯源7
2.3精進看待世界的方法8
第3章如何學習機器學習10
3.1以模型為驅動,了解機器學習的本質10
3.2反復學習,從記憶到掌握10
3.3數學需要多精深11
3.4基本的數學概念12
3.5學機器學習,編程是必須的嗎13
3.6日常學習小提示14
第二部分基本原理
第4章機器是如何學習的16
4.1機器學習的基本原理17
4.2有監督學習與無監督學習18
4.2.1有監督學習19
4.2.2無監督學習19
4.3機器學習的三要素:數據、模型和算法20
4.3.1數據20
4.3.2模型22
4.3.3算法24
第5章模型的獲取和改進26
5.1獲取模型的過程26
5.2訓練集、驗證集和測試集27
5.3訓練的過程27
第6章模型的質量和評價指標30
6.1分類模型評價指標:準確率、召回率和F1分數30
6.2指標對應的是模型和數據集31
6.3模型的偏差和過擬合32
第7章最常用的優化算法——梯度下降法34
7.1學習目標34
7.2凸函數35
7.3梯度下降法37
7.4梯度下降法的超參數38
7.5梯度下降的難點39
第三部分有監督學習(基礎)
第8章線性回歸42
8.1第一個機器學習模型42
8.1.1從數據反推公式42
8.1.2綜合利用訓練數據,擬合線性回歸函數44
8.1.3線性回歸的目標函數44
8.1.4線性=直線?45
8.1.5用線性回歸模型擬合非線性關繫46
8.2梯度下降法求解目標函數47
8.2.1確定目標函數的凸性48
8.2.2斜率、導數和偏微分49
8.2.3使用梯度下降法求解目標函數51
8.2.4通用線性回歸模型的目標函數求解52
8.2.5線性回歸的超參數54
8.3編寫線性回歸訓練/預測程序55
第9章樸素貝葉斯分類器57
9.1分類與回歸57
9.2貝葉斯定理58
9.2.1貝葉斯公式58
9.2.2常見的貝葉斯公式59
9.3用樸素貝葉斯算法進行分類61
9.3.1樸素貝葉斯算法61
9.3.2一款極簡單的樸素貝葉斯分類器62
9.4條件概率的參數66
9.4.1兩個學派67
9.4.2極大似然估計法69
9.4.3正態分布的極大似然估計70
9.4.4用代碼實現樸素貝葉斯模型72
第10章邏輯回歸74
10.1非線性邏輯回歸函數的由來75
10.1.1指數增長75
10.1.2邏輯函數76
10.1.3追本溯源的理論學習79
10.1.4線性與非線性80
10.2用來做分類的回歸模型81
10.2.1邏輯回歸的模型函數81
10.2.2邏輯回歸的目標函數82
10.3實例及代碼實現85
10.4處理多分類問題88
第11章決策樹91
11.1什麼是決策樹91
11.1.1直觀理解決策樹91
11.1.2構建決策樹93
11.2幾種常用算法93
11.2.1ID393
11.2.2C4.594
11.2.3CART96
11.3決策樹告訴你去哪兒聚餐98
11.3.1訓練數據98
11.3.2特征選取98
11.3.3用ID3算法構造分類樹100
11.3.4後剪枝優化決策樹103
11.3.5用決策樹對餐館進行分類104
第四部分有監督學習(進階)
第12章SVM108
12.1線性可分和超平面108
12.1.1二分類問題108
12.1.2特征的向量空間模型108
12.1.3線性可分109
12.1.4超平面110
12.2線性可分SVM111
12.3直觀理解拉格朗日乘子法115
12.3.1可視化函數及其約束條件116
12.3.2拉格朗日乘子法118
12.4對偶學習算法124
12.4.1對偶問題124
12.4.2強對偶性及求解對偶問題126
12.4.3通過對偶問題求解主問題126
12.5求解線性可分SVM的目標函數127
12.5.1目標函數127
12.5.2線性可分SVM的對偶問題128
12.5.3使用對偶算法求解線性可分SVM的步驟128
12.5.4SMO算法133
12.6線性SVM,間隔由硬到軟134
12.6.1從線性可分SVM到線性SVM134
12.6.2對偶法很優化線性SVM主問題138
12.6.3線性SVM的支持向量140
12.7非線性SVM和核函數142
12.7.1非線性分類問題142
12.7.2非線性SVM144
12.7.3核函數145
12.7.4數據歸一化149
第13章SVR151
13.1嚴格的線性回歸151
13.2寬容的SVR152
13.2.1模型函數152
13.2.2原理152
13.2.3SVR的兩個松弛變量153
13.3SVR的主問題和對偶問題154
13.4支持向量與求解線性模型參數156
13.5SVR的核技巧157
第14章直觀認識SVM和SVR159
14.1SVM實例159
14.1.1線性可分SVM159
14.1.2線性SVM162
14.1.3接近線性不可分的數據164
14.1.4核函數的作用166
14.1.5RBF核函數的威力169
14.1.6其他核函數170
14.2SVR實例171
第15章HMM174
15.1一些基本概念174
15.2數學中的HMM176
15.3HMM的3個基本問題178
15.4一個例子179
15.5HMM3個基本問題的計算181
15.5.1概率計算問題181
15.5.2預測算法184
15.5.3學習算法185
15.6HMM實例186
第16章CRF189
16.1概率無向圖模型189
16.1.1勢函數和團190
16.1.2Hammersley-Clifford定理190
16.1.3性質190
16.2CRF192
16.3線性鏈CRF193
16.3.1線性鏈CRF的形式化表示195
16.3.2線型鏈CRF的3個基本問題197
第五部分無監督學習
第17章從有監督到無監督:由KNN引出K-means202
17.1發展趨勢204
17.2KNN算法205
17.2.1KNN算法原理205
17.2.2有監督學習算法KNN與無監督學習算法K-means205
17.2.3KNN的K206
第18章K-means——最簡單的聚類算法208
18.1常用的幾種距離計算方法208
18.2K-means210
18.3實例214
第19章譜聚類——無須指定簇數量的聚類217
19.1算法實現217
19.2算法原理219
19.3實例224
第20章EM算法——估計含有隱變量的概率模型的參數226
20.1含有隱變量的概率模型226
20.2EM算法基本思想227
20.2.1近似極大化227
20.2.2真正的目標229
20.3EM算法的推導過程230
20.3.1優化目標230
20.3.2應用EM算法230
20.4EM算法步驟233
第21章GMM235
21.1將“混”在一起的樣本各歸其源235
21.1.1個體與集體235
21.1.2已知每個簇的原始分布237
21.1.3已知分布條件下的樣本歸屬238
21.1.4學習概率密度函數參數239
21.1.5同分布的混合模型241
21.2用EM算法求解GMM242
21.2.1高斯分布242
21.2.2GMM246
21.2.3用EM算法學習GMM的參數248
21.2.4GMM實例250
第22章PCA253
22.1利用數學工具提取主要特征253
22.1.1泛濫成災的特征維度253
22.1.2降低數據維度255
22.1.3PCA的原則256
22.1.4PCA的優化目標257
22.2用SVD實現PCA262
22.2.1PCA優化算法262
22.2.2PCA的作用263
22.2.3SVD264
22.2.4用SVD實現PCA266
22.2.5直接用SVD降維266
22.2.6SVD&PCA實例267
第六部分機器學習應用
第23章認識聊天機器人272
23.1聊天機器人的基本類型272
23.2世界上第一款聊天機器人273
23.3聊天機器人簡史274
23.4聊天機器人的實現技術276
第24章開發一款問題解決型機器人278
24.1回答問題的基礎三步278
24.2多輪對話的上下文管理278
24.3分層結構279
24.4極簡版繫統架構280
24.5開發流程283
第25章聊天機器人的語言理解285
25.1收集語料286
25.2標注數據286
25.3劃分數據集287
25.4構建向量空間模型288
25.5訓練模型290
25.6測試模型292
第26章應用聚類模型獲得聊天機器人語料293
26.1從用戶日志中挖掘訓練語料293
26.2語料對標注的影響294
26.3分析用戶日志294
26.4對用戶日志語料進行聚類295
第七部分從機器學習到深度學習
第27章人工智能和神經網絡298
27.1人工智能、機器學習和深度學習298
27.2什麼是神經網絡300
27.3神經網絡的訓練302
第28章深度學習的興起和發展305
28.1神經網絡的歷史沿革305
28.2認識深度學習307
28.3不同種類的深度學習網絡307
28.3.1CNN307
28.3.2RNN309
28.3.3LSTM310
第29章深度學習的願景、問題和應用313
29.1深度學習的願景313
29.2深度學習的現實314
29.3機器學習與深度學習314
29.4深度學習的落地點315
29.4.1語音處理315
29.4.2圖像處理316
29.4.3自然語言處理317
29.5深度學習的局限317
本書從機器學習的基本原理入手,以常見模型為驅動,配以精心設計的實踐案例,為大家呈現了機器學習理論知識和應用方法。書中運用Python語言及scikit-learn庫實現了幾大常見機器學習模型的訓練程序和預測程序,讓讀者能夠理論聯繫實際,在學習、工作中應用機器學習。本書適合打算入門機器學習的人閱讀。