內容簡介
本書的內容安排基本上按照數據科學的步驟及思維, 所有討論都基於實際數據案例並通過R 和Python 兩種軟件實現. 內容包括數據及探索性數據分析、數據整理及清理、有監督學習的10 種分類及回歸機器學習方法、無監督學習的兩種方法. *後簡要介紹網絡爬蟲技術, 供讀者參考. 在課程內容的選擇、課程進度及授課方式, 必須給任課教師以*的自由度和自主權,一切依學生的基礎、條件及需要而定. 我們應該介紹對學生*有幫助的內容, 而不是某些陳舊教條所認為“應該灌輸” 的內容; 應該使學生的思維空間向無限的可能開放, 而不是約束在一個被主觀認為“正確” 的狹隘方向. 科學就是在這種開放無拘束的環境下不斷發展的.