作 者:(美)本傑明·約翰斯頓 等 著 唐盛 譯
定 價:129
出 版 社:清華大學出版社
出版日期:2020年07月01日
頁 數:392
裝 幀:平裝
ISBN:9787302557685
"在沒有標簽數據的情況下,無監督學習是一種有效且實用的解決方案。本書將指導讀者完成使用Python進行無監督學佳實踐,以結合使用無監督學習技術和Python庫從非結構化數據中提取有意義的信息。本書首先說明了基本聚類如何在數據集中查找相似的數據點。精通k均值算法及其操作原理後,讀者將了解什麼是降維(Dimensionality Reduction)以及在哪裡應用。隨著學深入,讀者還將掌握各種神經網絡技術以及了解如何通過它們改善自己的模型。在研究無監督學應用程序時,我們還將學習如何挖掘Twitt等
●章聚類
1.1簡介
1.2無監督學習與有監督學習
1.3聚類的識別
1.3.1識別聚類
1.3.2二維數據
1.3.3練習1:識別數據中的聚類
1.4關於k均值聚類
1.4.1無數學k均值演練
1.4.2對於k均值聚類的深度演練
1.4.3替代距離度量——曼哈頓距離
1.4.4更深的維度
1.4.5練習2:用Python計算歐幾裡得距離
1.4.6練習3:以距離的概念形成聚類
1.4.7練習4:從頭開始實現k均值
1.4.8練習5:通過優化實現k均值
1.4.9聚類性能:輪廓分數
1.4.10練習6:計算輪廓分數
1.4.11活動1:實現k均值聚類
1.5小結
第2章分層聚類
2.1介紹
2.2聚類刷新
2.3分層的組織結構
2.4分層聚類簡介
2.4.1執行分層聚類的步驟
2.4.2分層聚類的演練示例
2.4.3練習7:建立分層結構
2.5鏈接
2.5.1鏈接概述
2.5.2活動2:應用鏈接標準
2.6凝聚分層聚類與分裂分層聚類
2.6.1練習8:使用scikit-learn實現凝聚分層聚類
2.6.2活動3:比較k均值和分層聚類
2.7關於k均值與分層聚類
2.8小結
第3章鄰域聚類方法和DBSCAN
3.1介紹
3.1.1聚類方法
3.1.2作為鄰域的聚類
3.2關於DBSCAN
3.2.1DBSCAN深度
3.2.2DBSCAN算法的演練
3.2.3練習估鄰域半徑大小的影響
3.2.4DBSCAN屬性——鄰域半徑
3.2.5活動4:從頭開始實現DBSCAN
3.2.6DBSCAN屬性——少點
3.2.7練習10:評估少點閾值的影響
3.2.8活動5:比較DBSCAN與k均值和分層聚類
3.3DBSCAN與k均值和分層聚類
3.4小結
第4章降維和PCA
4.1介紹
4.1.1降維的定義
4.1.2降維的應用
4.1.3維數的詛咒
4.2降維技術
4.2.1概述
……
第5章自動編碼器
第6章t分布隨機鄰域嵌入算法
第7章主題建模
第8章購物籃分析
第9章熱點分析
附錄
本書詳細闡述了與無監督機器學習開發相關的基本解決方案,主要包括聚類、分層聚類、鄰域聚類方法和DBSCAN、降維和PCA、自動編碼器、t分布隨機鄰域嵌入算法、主題建模、購物籃分析、熱點分析等內容。此外,本書還提供了相應的示例、代碼,以幫助讀者進一步理解相關方案的實現過程。本書適合作為高等院校計算機及相關專業的教材和教學參考書,也可作為相關開發人員的自學教材和參考手冊。