作 者:米霖 編
定 價:69
出 版 社:清華大學出版社
出版日期:2020年09月01日
頁 數:272
裝 幀:平裝
ISBN:9787302543886
"8年實戰經驗,帶你搞定R語言數據分析,有理論,有應用,有技巧繫統:從數據讀取、網絡爬蟲,到數據分析方法,應有盡有 全面:介紹了最常用的12種數據分析方法實戰:針對每種方法,都給出了實現代碼,拿來就用圖解:提供了59張數據分析圖,方便讀者學習免費提供配套學習視頻+源程序下載"
●第1章數據分析項目的流程
1.1數據分析項目中的角色
1.2數據分析項目的階段
1.2.1制定目標
1.2.2收集數據
1.2.3數據處理和分析
1.2.4構建模型
1.2.5評估模型
1.2.6展示結果
1.2.7部署與維護模型
1.3總結
第2章數據的讀取
2.1RData數據
2.2readr高效讀取數據
2.3讀取Excel數據
2.4讀取SPSS、SAS、STATA數據
2.5化語言操作數據庫
……
本書首先介紹數據分析的方法論,然後介紹數據分析的相關模型方法,並進一步通過數據分析案例,講解數據分析的思維、方法及模型實現過程。本書重點介紹R語言在數據分析方面的應用,讓讀者能夠快速地使用R語言進行數據分析、構建模型。本書分為17章,內容包括:使用R語言獲取數據、數據分析中的數據處理與數據探索、生存分析、主成分分析、多維縮放、線性回歸模型、邏輯回歸模型、聚類模型、關聯規則、隨機森林、支持向量機、神經網絡、文本挖掘、社交網絡分析,以及關於R語言數據分析的延伸內容:H2O機器學習和R語言爬蟲。本書內容通俗易懂,案例豐富,實用性強,特別適合R語言的入門讀者和進階讀者閱讀,也適合數據分析人員、數據挖掘人員等其他數據科學從業者。另外,本書也適用於統計學、計算機、機器學習、數學等相關專業的本科生、研究生使用。
米霖 編
米霖,畢業於華中農業大學,本科數學專業,研究生統計學專業,8年R語言項目經驗,擅長機器學習、統計模型。曾開發了多門R語言相關課程,課程包括《Shiny 初級教程》《R包開發》《H2O機器學習模型》《信用評分模型開發》《R語言文本挖掘》等,學員累計超過5000人。完成過很多數據分析項目,例如廣告虛假流量識別項目(通過虛假流量數據的挖掘幫助企業了的營銷成本),信貸中的信用評分項目,電商風控項目等。