作 者:[愛爾蘭]瓦伊巴夫·韋爾丹(Vaibhav Verdhan) 著 梁平、譚穎 譯 著 梁平//譚穎 譯
定 價:68
出 版 社:清華大學出版社
出版日期:2022年01月01日
頁 數:244
裝 幀:平裝
ISBN:9787302594659
"通過使用Python開發用例,全面理解監督學習算法。讀者將學習監督學習概念、Python編碼、數據集、上佳實踐、常見問題和陷阱的解決方案,以及為結構化數據和文本、圖像數據集實現算法的實用知識。 《Python監督學習》首先介紹機器學習,重點區分監督、半監督和無監督學習的特點與不同。接下來講解回歸和分類問題,包括背景數學知識,算法(線性回歸、邏輯回歸、決策樹、KNN、 樸素貝葉斯),高級算法(隨機森林、支持向量機、梯度增強),以及神經網絡。所有的等
●第1章 監督學習簡介 11.1 什麼是機器學習 21.1.1 數據分析、數據挖掘、機器學習和人工智能之間的關繫 21.1.2 數據、數據類型和數據源 41.2 機器學習與軟件工程的差異 61.3 機器學習的統計和數學概念 91.4 監督學習算法 151.4.1 回歸與分類問題 171.4.2 監督學習算法步驟 181.5 無監督學習算法 201.5.1 聚類分析 201.5.2 PCA 211.6 半監督學習算法 221.7 技術棧 221.8 機器學習的普及性 231.9 機器學習使用案例 241.10 小結 26第2章 回歸分析監督學習 282.1 所需技術工具包 292.2 回歸分析及案例 292.3 什麼是線性回歸 302.4 度量回歸問題的有效性 342.4.1 案例1:創建簡單線性回歸 402.4.2 案例2:住宅數據集簡單線性回歸 422.4.3 案例3:住宅數線性回歸 472.5 非線性回歸分析 522.6 識別非線性關繫 552.7 回歸模型面臨的挑戰 572.8 回歸的基於樹方法 592.9 案例分析:使用決策樹解決油耗問題 612.10 回歸的集成方法 642.11 案例分析:使用隨機森林解決油耗問題 662.12 基於樹方法的特征選擇 692.13 小結 71第3章 分類問題監督學習 733.1 所需技術工具包 743.2 假設檢驗及p值 743.3 分類算法 763.4 評估解決方案準確度 813.5 案例分析:信用風險 843.6 分類的樸素貝葉斯方法 953.7 案例分析:人口普查數據的收入預測 973.8 分類的k最近鄰方法 1043.9 案例分析:k最近鄰 1073.9.1 數據集 1083.9.2 業務目標 1083.10 分類的基於樹算法 1143.11 決策樹算法類型 1173.12 小結 120第4章 監督學習高級算法 1234.1 所需技術工具 1244.2 提升算法 1244.3 支持向量機(SVM) 1354.3.1 二維空間的SVM 1364.3.2 KSVM 1374.3.3 使用SVM的案例分析 1394.4 非結構化數據的監督學習算法 1444.5 文本數據 1444.5.1 文本數據案例 1454.5.2 文本數據面臨的挑戰 1464.5.3 文本分析建模過程 1474.5.4 文本數據提取及管理 1494.5.5 文本數據預處理 1504.5.6 從文本數據提取特征 1524.6 案例分析:采用自然語言處理的客戶投訴分析 1564.7 案例分析:采用詞嵌入的客戶投訴分析 1604.8 圖像數據 1634.8.1 圖像數據案例 1644.8.2 圖像數據面臨的挑戰 1654.8.3 圖像數據管理過程 1664.8.4 圖像數據建模過程 1674.9 深度學習基礎 1674.9.1 人工神經網絡 1674.9.2 激活函數 1694.9.3 神經網絡的損失函數 1714.9.4 神經網絡優化 1724.9.5 神經網絡訓練過程 1734.10 案例分析1:在結構化數據上建立分類模型 1764.11 案例分析2:圖像分類模型 1804.12 小結 185第5章 端到端模型開發 1875.1 所需技術工具 1885.2 機器學習模型開發 1885.3 步驟1:定義業務問題 1895.4 步驟2:數據發現階段 1905.5 步驟3:數據清理和準備 1935.5.1 數據集中的重復值 1945.5.2 數據集的分類變量處理 1955.5.3 數據集中存在的缺失值 1975.6 數據集中的不平衡 2025.7 數據集中的離群值 2055.8 數據集中其他常見問題 2075.9 步驟4:EDA 2095.10 步驟5:機器學習模型構建 2155.10.1 數據訓練/測試集分割 2155.10.2 為分類算法找到很好閾值 2195.10.3 過擬合與欠擬合問題 2195.10.4 關鍵利益相關人討論並迭代 2235.10.5 提交最終模型 2235.11 步驟6:模型部署 2235.12 步驟7:文檔化 2295.13 步驟8:模型更新和維護 2295.14 小結 230
主要內容● 綜述使用Python完成監督學習的基本構造塊和概念● 為結構化數據以及文本和圖像開發監督學習的解決方案● 解決過擬合、特征工程、數據清理和交叉驗證等問題,構建**擬合模型● 了解從業務問題定義到模型部署和模型維護的端到端模型開發周期● 使用Python創建監督學習模型時,避免常見的陷阱並遵循**實踐
[愛爾蘭]瓦伊巴夫·韋爾丹(Vaibhav Verdhan) 著 梁平、譚穎 譯 著 梁平//譚穎 譯
Vaibhav Verdhan在數據科學、機器學習和人工智能方面擁有12年以上的經驗。他是一位具有工程背景的工商管理碩士,也是一位善於實踐的技術專家,具有敏銳的透徹理解和分析數據的能力。他曾在跨地理區域和零售、電信、制造、能源和公用事業領域引領多個機器學習和人工智能項目。目前和家人居住在愛爾蘭,擔任首席數據科學家。