![](/c3/11030151099.jpg)
出版社:人民郵電出版社 ISBN:9787115435101 商品編碼:11030151099 品牌:文軒 出版時間:2016-11-01 代碼:79 作者:印度GopiSubramanian薩伯拉曼尼安
"![](https://img10.360buyimg.com/imgzone/jfs/t1/102105/7/33921/65220/637ad2fbE3747b3ac/8e9da447b03cae40.jpg)
![](http://img14.360buyimg.com/cms/jfs/t1/203358/9/26405/134589/62f4a34cEcdefae53/84e082ed3b03dbc0.jpg) 作 者:印度 Gopi Subramanian 薩伯拉曼尼安 著 方延風 劉丹 譯 定 價:79 出 版 社:人民郵電出版社 出版日期:2016年11月01日 頁 數:380 裝 幀:簡裝 ISBN:9787115435101 本書從講解如何在數據科學中應用Python開始,陸續介紹了Python的工作環境,如何用Python分析數據,以及數據挖掘的概念,然後又擴展到機器學習。本書還涵蓋了縮減原則、集成方法、隨機森林、旋轉森林和超樹等方面的內容,這些都是一個成功的數據科學專家所必需掌握的。閱讀本書,你將學會:■ 揭示數據科學算法的完整範疇;■ 高效地掌握和使用numpy、scipy、scikit-learn和matplotlib等Python庫;■ 了解進階回歸方法的建模和變量選擇;■ 進一步有效理解集成方法等 ●目錄章 Python在數據科學中的應用11.1 簡介 21.2 使用字典對像 21.2.1 準備工作 21.2.2 操作方法 21.2.3 工作原理 31.2.4 更多內容 41.2.5 參考資料 61.3 使用字典的字典 61.3.1 準備工作 61.3.2 操作方法 61.3.3 工作原理 71.3.4 參考資料 71.4  組 71.4.1 準備工作 71.4.2 操作方法 81.4.3 工作原理 91.4.4 更多內容 121.4.5 參考資料 121.5 使用集合 131.5.1 準備工作 131.5.2 操作方法 131.5.3 工作原理 141.5.4 更多內容 151.6 寫一個列表 161.6.1 準備工作 161.6.2 操作方法 161.6.3 工作原理 181.6.4 更多內容 191.7 從另一個列表創建列表——列表推導 201.7.1 準備工作 201.7.2 操作方法 201.7.3 工作原理 201.7.4 更多內容 211.8 使用迭代器 221.8.1 準備工作 221.8.2 操作方法 231.8.3 工作原理 231.8.4 更多內容 241.9 生成一個迭代器和生成器 241.9.1 準備工作 251.9.2 操作方法 251.9.3 工作原理 251.9.4 更多內容 251.10 使用可迭代對像 261.10.1 準備工作 261.10.2 操作方法 261.10.3 工作原理 271.10.4 參考資料 271.11 將函數作為變量傳遞 281.11.1 準備工作 281.11.2 操作方法 281.11.3 工作原理 281.12 在函數中嵌入函數 281.12.1 準備工作 291.12.2 操作方法 291.12.3 工作原理 291.13 將函數作為參數傳遞 291.13.1 準備工作 291.13.2 操作方法 291.13.3 工作原理 301.14 返回一個函數 301.14.1 準備工作 311.14.2 操作方法 311.14.3 工作原理 311.14.4 更多內容 321.15 使用裝飾器改變函數行為 321.15.1 準備工作 321.15.2 操作方法 321.15.3 工作原理 331.16 使用lambda創造匿名函數 341.16.1 準備工作 341.16.2 操作方法 351.16.3 工作原理 351.17 使用映射函數 351.17.1 準備工作 361.17.2 操作方法 361.17.3 工作原理 361.17.4 更多內容 361.18 使用過濾器 371.18.1 準備工作 371.18.2 操作方法 371.18.3 工作原理 381.19 使用zip和izip函數 381.19.1 準備工作 381.19.2 操作方法 381.19.3 工作原理 381.19.4 更多內容 391.19.5 參考資料 401.20 從表格數據使用數組 401.20.1 準備工作 401.20.2 操作方法 411.20.3 工作原理 411.20.4 更多內容 421.21 對列進行預處理 431.21.1 準備工作 441.21.2 操作方法 441.21.3 工作原理 451.21.4 更多內容 451.22 列表排序 461.22.1 準備工作 461.22.2 操作方法 461.22.3 工作原理 461.22.4 更多內容 471.23 采用鍵排序 471.23.1 準備工作 481.23.2 操作方法 481.23.3 工作原理 491.23.4 更多內容 491.24 使用itertools 521.24.1 準備工作 521.24.2 操作方法 521.24.3 工作原理 53第2章 Python環境 552.1 簡介 552.2 使用NumPy庫 552.2.1 準備工作 552.2.2 操作方法 562.2.3 工作原理 582.2.4 更多內容 642.2.5 參考資料 642.3 使用matplotlib進行繪畫 642.3.1 準備工作 642.3.2 操作方法 642.3.3 工作原理 662.3.4 更多內容 722.4 使用scikit-learn進行機器學習 732.4.1 準備工作 732.4.2 操作方法 732.4.3 工作原理 752.4.4 更多內容 812.4.5 參考資料 82第3章 數據分析——探索與爭鳴 833.1 簡介 843.2 用圖表分析單變量數據 853.2.1 準備工作 853.2.2 操作方法 863.2.3 工作原理 873.2.4 參考資料 923.3 數據分組和使用點陣圖 923.3.1 準備工作 933.3.2 操作方法 933.3.3 工作原理 953.3.4 參考資料 973.4 為多變量數據繪制散點陣圖 973.4.1 準備工作 983.4.2 操作方法 983.4.3 工作原理 993.4.4 參考資料 1003.5 使用熱圖 1013.5.1 準備工作 1013.5.2 操作方法 1013.5.3 工作原理 1023.5.4 更多內容 1043.5.5 參考資料 1053.6 實施概要統計及繪圖 1053.6.1 準備工作 1053.6.2 操作方法 1063.6.3 工作原理 1073.6.4 參考資料 1103.7 使用箱須圖 1103.7.1 準備工作 1103.7.2 操作方法 1103.7.3 工作原理 1113.7.4 更多內容 1123.8 修補數據 1133.8.1 準備工作 1133.8.2 操作方法 1133.8.3 工作原理 1143.8.4 更多內容 1153.8.5 參考資料 1163.9 實施隨機采樣 1163.9.1 準備工作 1163.9.2 操作方法 1173.9.3 工作原理 1173.9.4 更多內容 1183.10 縮放數據 1183.10.1 準備工作 1183.10.2 操作方法 1183.10.3 工作原理 1193.10.4 更多內容 1193.11 數據標準化 1213.11.1 準備工作 1213.11.2 操作方法 1213.11.3 工作原理 1223.11.4 更多內容 1223.12 實施分詞化 1233.12.1 準備工作 1233.12.2 操作方法 1233.12.3 工作原理 1243.12.4 更多內容 1253.12.5 參考資料 1273.13 刪除停用詞 1273.13.1 操作方法 1283.13.2 工作原理 1293.13.3 更多內容 1303.13.4 參考資料 1303.14 詞提取 1303.14.1 準備工作 1313.14.2 操作方法 1323.14.3 工作原理 1323.14.4 更多內容 1333.14.5 參考資料 1333.15 執行詞形還原 1343.15.1 準備工作 1343.15.2 操作方法 1343.15.3 工作原理 1353.15.4 更多內容 1353.15.5 參考資料 1353.16 詞袋模型表示文本 1363.16.1 準備工作 1363.16.2 操作方法 1363.16.3 工作原理 1383.16.4 更多內容 1403.16.5 參考資料 1413.17 計算詞頻和反文檔頻率 1423.17.1 準備工作 1423.17.2 操作方法 1423.17.3 工作原理 1443.17.4 更多內容 145第4章 數據分析——深入理解 1464.1 簡介 1464.2 抽取主成分 1474.2.1 準備工作 1484.2.2 操作方法 1494.2.3 工作原理 1514.2.4 更多內容 1524.2.5 參考資料 1544.3 使用核PCA 1544.3.1 準備工作 1544.3.2 操作方法 1544.3.3 工作原理 1564.3.4 更多內容 1594.4 使用奇異值分解抽取特征 1604.4.1 準備工作 1614.4.2 操作方法 1614.4.3 工作原理 1624.4.4 更多內容 1634.5 用隨機映射給數據降維 1644.5.1 準備工作 1644.5.2 操作方法 1654.5.3 工作原理 1664.5.4 更多內容 1674.5.5 參考資料 1684.6 用NMF分解特征矩陣 1684.6.1 準備工作 1694.6.2 操作方法 1704.6.3 工作原理 1724.6.4 更多內容 1754.6.5 參考資料 176第5章 數據挖掘——海底撈針 1775.1 簡介 1775.2 使用距離度量 1785.2.1 準備工作 1785.2.2 操作方法 1795.2.3 工作原理 1805.2.4 更多內容 1835.2.5 參考資料 1845.3 學習和使用核方法 1845.3.1 準備工作 1845.3.2 操作方法 1855.3.3 工作原理 1865.3.4 更多內容 1875.3.5 參考資料 1875.4 用k-means進行數據聚類 1885.4.1 準備工作 1885.4.2 操作方法 1905.4.3 工作原理 1915.4.4 更多內容 1925.4.5 參考資料 1935.5 學習向量量化 1935.5.1 準備工作 1935.5.2 操作方法 1945.5.3 工作原理 1975.5.4 更多內容 1995.5.5 參考資料 1995.6 在單變量數據中找出異常點 2005.6.1 準備工作 2005.6.2 操作方法 2025.6.3 工作原理 2035.6.4 更多內容 2055.6.5 參考資料 2075.7 使用局部異常因子方法發現異常點 2075.7.1 準備工作 2075.7.2 操作方法 2085.7.3 工作原理 2105.7.4 更多內容 216第6章 機器學習1 2176.1 簡介 2176.2 為建模準備數據 2186.2.1 準備工作 2186.2.2 操作方法 2186.2.3 工作原理 2216.2.4 更多內容 2226.3 查找最近鄰 2236.3.1 準備工作 2246.3.2 操作方法 2266.3.3 工作原理 2276.3.4 更多內容 2296.3.5 參考資料 2306.4 用樸素貝葉斯分類文檔 2306.4.1 準備工作 2326.4.2 操作方法 2326.4.3 工作原理 2386.4.4 更多內容 2426.4.5 參考資料 2426.5 構建決策樹解決多類問題 2436.5.1 準備工作 2446.5.2 操作方法 2476.5.3 工作原理 2496.5.4 更多內容 2516.5.5 參考資料 252第7章 機器學習2 2537.1 簡介 2537.2 回歸方法預測實數值 2547.2.1 準備工作 2557.2.2 操作方法 2567.2.3 工作原理 2597.2.4 更多內容 2637.2.5 參考資料 2677.3 學習L2縮減回歸——嶺回歸 2677.3.1 準備工作 2687.3.2 操作方法 2687.3.3 工作原理 2717.3.4 更多內容 2737.3.5 參考資料 2767.4 學習L1縮減回歸——LASSO 2767.4.1 準備工作 2777.4.2 操作方法 2777.4.3 工作原理 2807.4.4 更多內容 2837.4.5 參考資料 2837.5 L1和L2縮減交叉驗證迭代 2837.5.1 準備工作 2847.5.2 操作方法 2847.5.3 工作原理 2887.5.4 更多內容 2947.5.5 參考資料 295第8章 集成方法 2968.1 簡介 2968.2 理解集成——掛袋法 2978.2.1 準備工作 2988.2.2 操作方法 2988.2.3 工作原理 3008.2.4 更多內容 3048.2.5 參考資料 3058.3 理解集成——提升法 3058.3.1 準備工作 3078.3.2 操作方法 3078.3.3 工作原理 3128.3.4 更多內容 3198.3.5 參考資料 3198.4 理解集成——梯度提升 3208.4.1 準備工作 3218.4.2 操作方法 3218.4.3 工作原理 3258.4.4 更多內容 3308.4.5 參考資料 330第9章 生長樹 3319.1 簡介 3319.2 從生長樹到生長森林——隨機森林 3329.2.1 準備工作 3339.2.2 操作方法 3339.2.3 工作原理 3369.2.4 更多內容 3409.2.5 參考資料 3429.3 生成超隨機樹 3429.3.1 準備工作 3439.3.2 操作方法 3439.3.3 工作原理 3459.3.4 更多內容 3499.3.5 參考資料 3499.4 生成旋轉森林 3499.4.1 準備工作 3509.4.2 操作方法 3509.4.3 工作原理 3539.4.4 更多內容 3589.4.5 參考資料 3580章 大規模機器學習——在線學習 35910.1 簡介 35910.2 用感知器作為在線學習算法 36010.2.1 準備工作 36110.2.2 操作方法 36210.2.3 工作原理 36310.2.4 更多內容 36610.2.5 參考資料 36710.3 用隨機梯度下降解決回歸問題 36710.3.1 準備工作 36910.3.2 操作方法 36910.3.3 工作原理 37010.3.4 更多內容 37310.3.5 參考資料 37510.4 用隨機梯度下降解決分類問題 37510.4.1 準備工作 37610.4.2 操作方法 37610.4.3 工作原理 37710.4.4 更多內容 37910.4.5 參考資料 380 Python作為一種不錯程序設計語言,憑借其簡潔、易讀及可擴展性日漸成為程序設計領域備受推崇的語言,並成為數據科學家的推薦閱讀之一。本書詳細介紹了Python在數據科學中的應用,包括數據探索、數據分析與挖掘、機器學習、大規模機器學習等主題。每一章都為讀者提供了足夠的數學知識和代碼示例來理解不同深度的算法功能,幫助讀者更好地掌握各個知識點。本書內容結構清晰,示例完整,無論是數據科學領域的新手,還是經驗豐富的數據科學家都將從中獲益。 印度 Gopi Subramanian 薩伯拉曼尼安 著 方延風 劉丹 譯 Gopi Subramanian是一名數據科學家,他在數據挖掘與機器學習領域有著超過15年經驗。在過去的10年中,他設計、構思、開發並領導了數據挖掘、文本挖掘、自然語言處理、信息提取和檢索等多個項目,涉及不同領域和商務垂直繫統。他在美國和印度的專利局共計申請了10多項專利,並以自己的名義出版了許多書籍。 ![](https://img10.360buyimg.com/imgzone/jfs/t1/147514/7/5440/73116/5f34a3beE3ba58783/f5b2391383f5625c.jpg)
" |