本書是介紹機器學習技術的綜合指南,從基礎的統計學原理和R語言編程知識,到核心的機器學習理論和算法分析,以及機器學習模型的評估和改進方法,再到機器學習技術在大數據平臺上的應用,書中都有詳細介紹。
本書主要在第1版的基礎上增加了兩個部分:*個是關於時間序列模型的新章節(第 9 章),這是一個源於統計學的傳統主題。第二個新增的章節是深度學習(第 11 章),它是機器學習的一個迅速崛起的子領域。除了增加這兩個章節之外,本書中的文本和代碼會以一種讀者友好的新格式來整體呈現。新版會繼續專注於使用流行的統計編程語言 R 來構建用例。對於深度學習這樣的主題,我們建議采用 Python 語言來配合 TensorFlow 這樣的框架。但是,在第2版中,我們會向讀者展示如何在 TensorFlow 中使用 R 語言編程,因此如果讀者隻熟悉 R,可以暫時無須學習 Python。與第1版一樣,我們通過各種實際用例保持了機器學習理論與應用的良好平衡,為讀者提供了一個真正全面的機器學習主題集合。