Scala機器學習 構建現實世界機器學習和深度學習項目
作 者: (德)雷祖爾·卡裡姆(Rezaul Karim) 著 張世勇,劉波 譯
定 價: 99
出?版?社: 機械工業出版社
出版日期: 2019年10月01日
頁 數: 316
裝 幀: 平裝
ISBN: 9787111635130
●譯者序
原書前言
章保險賠償程度分析//1
1.1機器學習和學習過程//1
1.1.1典型的機器學習工作過程//2
1.2超參數調整和交叉驗證//4
1.3分析和預測保險賠償程度//6
1.3.1動機//6
1.3.2數據集的描述//6
1.3.3對數據集的探索性分析//6
1.3.4數據預處理//10
1.4LR用於預測保險索賠的嚴重性//13
1.4.1使用LR開發保險賠償嚴重性預測模型//14
1.5GBT回歸用於預測保險索賠嚴重性//18
1.6使用隨機森林回歸算法提升性能//23
1.6.1隨機森林用於分類和回歸//23
1.7比較分析和模型部署//29
1.7.1基於Spark的大規模數據集模型部署//33
1.8小結//34
第2章電信客戶流失分析與預測//35
2.1流失分析的原理以及實現//35
2.2流失分析過程//36
2.2.1數據集的描述//38
2.2.2探索性分析(EDA)和特征工程//38
2.3LR用於流失預測//47
2.4用於流失預測的SVM//52
2.5用於客戶流失預測的DT//55
2.6用於預測客戶流失的隨機森林//61
2.7選擇要部署的最佳模型//66
2.8小結//68
第3章基於歷史和實時數據預測高頻比特幣價格//69
3.1比特幣、加密貨幣和在線交易//69
3.1.1最先進的比特幣自動交易//71
3.1.2訓練//72
3.1.3預測//72
3.2原型的不錯數據管道//73
3.3收集歷史和實時價格數據//74
3.3.1歷史數據集//74
3.3.2將歷史數據轉換為時間序列//75
3.3.3通過CryptocompareAPI處理實時數據//77
3.4針對預測的模型訓練//80
3.5Web服務:ScalaPlay//85
3.5.1通過AkkaActor實現並發//86
3.5.2Web服務工作流程//86
3.6預測價格並評估模型//91
3.7使用ScalaPlay框架來演示預測//92
3.7.1為何選擇RESTful架構//92
3.7.2項目結構//93
3.7.3運行ScalaPlayWeb應用程序//95
3.8小結//96
第4章人口規模聚類與民族預測//99
4.1人口規模聚類和區域民族//99
4.1.1針對遺傳變異的機器學習//100
4.21000基因項目數據集描述//100
4.3算法、工具和技術//102
4.3.1H2O和SparklingWater//102
4.3.2ADAM用於大規模基因組數據處理//105
4.3.3無監督機器學習//1064.3.4K均值的原理//107
4.3.5用於進行地理民族預測的DNN//108
4.4配置編程環境//110
4.5數據預處理和特征工程//112
4.5.1模型訓練和超參數調整//117
4.5.2使用隨機森林進行民族預測//123
4.6小結//126
第5章主題建模:更好地洞察大型文本//127
5.1主題建模和文本聚類//127
5.1.1LDA算法的工作原理//129
5.2使用SparkMLlib和StanfordNLP進行主題建模//131
5.2.1實現//131
5.3其他主題模型與LDA的可擴展性//139
5.4部署經過訓練的LDA模型//140
5.5小結//144
第6章開發基於模型的電影推薦引擎//145
6.1推薦繫統//145
6.1.1協同過濾方法//145
6.1.2效用矩陣//147
6.2基於Spark的電影推薦繫統//148
6.2.1針對電影相似性基於商品的協同過濾//148
6.2.2基於Spark的模型推薦//153
6.3選擇和部署最佳模型//161
6.4小結//164
第7章使用Q-learning和ScalaPlay框架進行期權交易//165
7.1強化學習與監督學習和無監督學習//165
7.1.1使用強化學習//166
7.1.2強化學習中的符號、策略和效用//166
7.2簡單Q-learning算法實現//169
7.2.1Q-learning算法的組成部分//169
7.2.2QLearning模型驗證//1797.2.3使用訓練模型進行預測//179
7.3使用Q-learning開發期權交易Web應用程序//179
7.3.1問題描述//180
7.3.2實現期權交易Web應用程序//182
7.3.3評估模型//189
7.3.4將期權交易應用程序封裝為ScalaWeb應用程序//191
7.3.5運行和部署說明//197
7.3.6模型部署//199
7.4小結//199
第8章使用深度神經網絡進行銀行電話營銷的客戶訂購評估//200
8.1通過電話營銷進行客戶訂購評估//200
8.1.1數據集描述//200
8.1.2安裝ApacheZeppelin並開始使用//202
8.1.3對數據集的研究與分析//204
8.1.4數字特征統計//214
8.1.5實施客戶訂購評估模型//215
8.1.6超參數調整和特征選擇//225
8.2小結//227
第9章使用自動編碼器和異常檢測進行欺詐分析//228
9.1異常值和異常檢測//228
9.2自動編碼器和無監督學習//231
9.2.1自動編碼器的工作原理//231
9.2.2使用自動編碼器實現高效的數據表示//232
9.3開發欺詐分析模型//233
9.3.1數據集的描述和使用線性模型//233
9.3.2問題描述//234
9.3.3準備編程環境//234
9.3.4輔助類和方法//254
9.4超參數調整和特征選擇//255
9.5小結//256
0章使用遞歸神經網絡識別人類活動//258
10.1使用RNN//258
10.1.1上下文信息和RNN的體繫結構//258
10.1.2RNN和長期依賴性問題//260
10.1.3LSTM網絡//261
10.2使用LSTM模型識別人類活動//263
10.2.1數據集的描述//263
10.2.2為Scala設置和配置MXNet//264
10.3為HAR實現LSTM模型//266
10.4調整LSTM超參數和GRU//281
10.5小結//283
1章使用卷積神經網絡進行圖像分類//284
11.1DNN的圖像分類和缺點//284
11.2CNN架構//285
11.2.1卷積運算//286
11.2.2池化層和填充操作//287
11.2.3DL4j中的卷積和子采樣操作//288
11.3使用CNN進行大規模圖像分類//295
11.3.1問題描述//296
11.3.2圖像數據集的描述//296
11.3.3整個項目的工作流程//297
11.3.4CNN圖像分類的實現//298
11.4調整和優化CNN超參數//315
11.5小結//316
內容簡介
《Scala機器學習:構建現實世界機器學習和深度學習項目》通過“保險賠償程度分析”“電信客戶流失分析與預測”“基於歷史和實時數據預測高頻比特幣價格”“人口規模聚類與民族預測”“主題建模:更好地洞察大型文本”“開發基於模型的電影推薦引擎”“使用 Q-learning和Scala Play框架進行期權交易”“使用深度神經網絡進行銀行電話營銷的客戶訂購評估”“使用自動編碼器和異常檢測進行欺詐分析”“使用遞歸神經網絡識別人類活動”和“使用卷積神經網絡進行圖像分類”等11個完整的項目,結合Spark ML、H2O、Zeppelin、DeepLearning4j和MXNet等流行機器學習庫以及一些經典數據集為讀者介紹了機器學習項目的詳細開發流程。《Scala機器學習:構建現實世界機器學習和深度學習項目》主要針對數據分析師、深度學習愛好者和開發人員,他們雖具有一定的背景知識,但是對於實際項目的開發過程接......
(德)雷祖爾·卡裡姆(Rezaul Karim) 著 張世勇,劉波 譯