●第1章為什麼需要集成學習001
1.1混合訓練數據003
1.2混合模型004
1.3混合組合008
1.4本章小結009
第2章混合訓練數據011
2.1決策樹013
2.2數據集采樣018
2.2.1不替換采樣(WOR)018
2.2.2替換采樣(WR)019
2.3Bagging(裝袋算法)021
2.3.1k重交叉驗證024
2.3.2分層的k重交叉驗證026
2.4本章小結028
第3章混合模型029
3.1投票集成030
3.2硬投票031
3.3均值法/軟投票033
3.4超參數調試集成036
3.5水平投票集成038
3.6快照集成044
3.7本章小結046
第4章混合組合047
4.1Boosting(提升算法)048
4.1.1AdaBoost(自適應提升算法)049
4.1.2GradientBoosting(梯度提升算法)051
4.1.3XGBoost(特別梯度提升算法)053
4.2Stacking(堆疊算法)055
4.3本章小結058
第5章集成學習庫059
5.1ML-集成學習060
5.1.1多層集成063
5.1.2集成模型的選擇064
5.2通過Dask擴展XGBoost069
5.2.1Dask數組與數據結構071
5.2.2Dask-ML076
5.2.3擴展XGBoost079
5.2.4微軟LightGBM082
5.2.5AdaNet088
5.3本章小結090
第6章實踐指南092
6.1基於隨機森林的特征選擇093
6.2基於集成樹的特征轉換096
6.3構建隨機森林分類器預處理程序103
6.4孤立森林進行異常點檢測110
6.5使用Dask庫進行集成學習處理114
6.5.1預處理115
6.5.2超參數搜索117
6.6本章小結121
致謝122
《集成學習入門與實戰:原理、算法與應用》通過6章內容全面地解讀了集成學習的基礎知識、集成學習技術、集成學習庫和實踐應用。其中集成學習技術包括采樣、Bagging、投票集成、Boosting、AdaBoost、梯度提升、XGBoost、Stacking、隨機森林、決策樹等,從混合訓練數據到混合模型,再到混合組合,邏輯嚴謹、逐步講解;同時也對ML-集成學習、Dask、LightGBM、AdaNet等集成學習庫相關技術進行了詳細解讀;最後通過相關實踐對集成學習進行綜合性應用。本書配有邏輯框圖、關鍵代碼及代碼分析,使讀者在閱讀中能夠及時掌握算法含義和對應代碼。
本書適合集成學習的初學者和機器學習方向的從業者和技術人員閱讀學習,也適合開設機器學習等算法課程的高等院校師生使用。