本書首先介紹數據科學,然後指導讀者安裝和搭建數據分析編程環境所需的軟件包。在機器 學習中,主要學習3項技術:監督學習、無監督學習和強化學習。我們也會用到基本的分類與回 歸技術,如支持向量機、決策樹以及邏輯回歸等。 在前面章節的學習中,讀者將學習到Python語言中用於處理大型數據集的基本函數、數據 結構,用於矩陣計算的NumPy包和Pandas包,如何使用Matplotlib繪制自定義圖表,以及應用 Boosting算法XGBoost(梯度提升)進行預測分析等。 在後面的章節中,將會學習用於圖像識別的卷積神經網絡(CNN)、深度學習算法。讀者將掌 握如何向神經網絡饋入人類語言、讓模型處理復雜的文本信息以及構建人類語言處理繫統進行結 果預測等。 學習完本書,讀者可以掌握和使用很多新的數據科學算法,並且有信心使用本課程以外的工 具或庫進行操作。