作 者:(澳)羅伯特·萊頓 著 亦念 譯
定 價:79
出 版 社:人民郵電出版社
出版日期:2020年03月01日
頁 數:253
裝 幀:平裝
ISBN:9787115528025
本書由淺入深地介紹了數據挖掘的基礎知識;圖文並茂,同時提供了種類繁多的Python庫來支持具體實踐;第二版更新了示例和代碼,每一章都引入了新的算法和技術。本書將手把手指引你:基於過去結果預測體育賽事勝負根據行文風格確定文檔作者調用API下載社會媒體或其他在線服務的數據集在復雜數據集中尋找並提取合適的特征創建解決現實問題的模型運用各種各樣的數據集,設計並開發數據挖掘應用利用深度神經網絡完成圖像中的對像檢測
●版權信息
譯者序
前言
致謝
第1章數據挖掘入門
1.1什麼是數據挖掘
1.2使用Python和JupyterNotebook
1.3親和性分析的簡單示例
1.4商品推薦
1.5分類的簡單示例
1.6什麼是分類
1.7本章小結
第2章用scikit-learn估計器解決分類問題
2.1scikit-learn估計器
2.2預處理
2.3流水線
2.4本章小結
第3章用決策樹預測獲勝球隊
3.1加載數據集
3.2決策樹
3.3體育賽事結果預測
3.4隨機森林
3.5本章小結
第4章用親和性分析推薦電影
4.1親和性分析
4.2電影推薦問題
4.3Apriori算法的原理與實現
4.4本章小結
第5章特征與scikit-learn轉換器
5.1特征提取
5.2特征的選取
5.3特征創建
5.4主成分分析
5.5創建自己的轉換器
5測試
5.7組裝成型
5.8本章小結
第6章用樸素貝葉斯算法探索社交媒體
6.1消歧
6.2從社交媒體下載數據
6.3文本轉換器
6.4樸素貝葉斯
6.5樸素貝葉斯的應用
6.6從模型中找出有用的特征
6.7本章小結
第7章用圖挖掘實現推薦關注
7.1加載數據集
7.2從Twitter獲取關注者信息
7.3創建圖
7.4尋找子圖
7.5本章小結
第8章用神經網絡識別驗證碼
8.1人工神經網絡
8.2創建數據集
8.3訓練與分類
8.4預測單詞
8.5本章小結
第9章作者歸屬問題
9.1文檔的作者歸屬
9.2獲取數據
9.3功能詞的使用
9.4支持向量機
9.5語法
9.6安然(Enron)數據集
9.7組裝成型
9.8評估
9.9本章小結
第10章聚類新聞文章
10.1發現熱門話題
10.2從任意網站提取文本
10.3為新聞文章分組
10.4k-均值算法
10.5聚類集成
10.6在線學習
10.7本章小結
第11章用深度神經網絡實現圖像中的對像檢測
11.1對像分類
11.2應用場景
11.3深度神經網絡
11.4TensorFlow簡介
11.5使用Keras
11.6GPU優化
11.7應用
11.8本章小結
第12章大數據處理
12.1大數據
12.2MapReduce
12.3應用MapReduce
12.4樸素貝葉斯預測
12.5提取博客文章
12.6訓練樸素貝葉斯
12.7組裝成型
12.8在亞馬遜EMR基礎設施上訓練
12.9本章小結
附錄A下一步工作
本書以實踐為宗旨,對數據挖掘進行了詳細地入門引導。本書囊括了比賽結果預測、電影推薦、特征提取、好友推薦、破解驗證碼、作者歸屬、新聞聚類等大量經典案例,並以此為基礎提供了大量練習和額外活動。在練習中,本書介紹了數據挖掘的基本工具和基本方法;在額外活動中,本書為深入了解數據挖掘指明了方向。本書適合希望應用Python進行數據挖掘的程序員閱讀。