●前言
致謝
關於作者
關於技術審校人員
第1章 機器學習介紹
1.1 人工智能和機器學習用例
1.1.1 零售業
1.1.2 交通運輸
1.1.3 金融服務
1.1.4 醫療保健和生物技術
1.1.5 制造業
1.1.6 政府部門
1.2 機器學習與數據
1.3 機器學習方法
1.3.1 有監督學習
1.3.2 無監督學習
1.3.3 半監督學習
1.3.4 強化學習
1.4 深度學習
1.5 神經網絡
1.6 卷積神經網絡
1.7 特征工程
1.7.1 特征選擇
1.7.2 特征重要性
1.7.3 特征提取
1.7.4 特征構建
1.8 模型評估
1.8.1 準確率
1.8.2 精度
1.8.3 召回率
1.8.4 F1度量
1.8.5 AUROC
1.9 過擬合與欠擬合
1.10 模型選擇
1.11 總結
1.12 參考資料
第2章 Spark和Spark MLlib介紹
2.1 概述
2.2 架構
2.3 執行Spark應用程序
2.3.1 集群模式
……
第3章 有監督學習
第4章 無監督學習
第5章 推薦
第6章 圖分析
第7章 深度學習
本書介紹如何利用Spark平臺上的實際文檔和示例來構建大型企業級機器學習應用。
在過去10年中,機器學習領域取得了一繫列突破性進展。這些突破性進展正在對我們的生活和各行各業產生深遠影響。
本書首先對Spark和SparkMLlib做了介紹,除標準SparkMLlib庫之外,還介紹了更強大的第三方機器學習算法和庫。在本書的最後解釋了通過對多個實際用例,以幫助讀者了解機器學習知識在實際生活中的應用。
本書內容:
機器學習、Spark和SparkMLlib2.4.x的相關內容。
使用XGBoost4J-Spark和LightGBM庫實現Spark上的快速梯度提升。
利用Spark的孤立森林算法實現異常檢測。
使用支持多種語言的SparkNLP和StanfordCoreNLP庫。
使用Alluxio內存等