作 者:範淼,徐晟桐 著
定 價:99
出 版 社:清華大學出版社
出版日期:2022年10月01日
頁 數:736
裝 幀:平裝
ISBN:9787302614241
"該書幫助大量對機器學習、數據挖掘感興趣的讀者朋友整合時下 的基於Python語言的程序庫:如Scikit-learn,NLTK,XGBoost,TensorFlow等,並且針對現實中遇到的數據,甚至是Kaggle競賽(時下世界 的機器學習競賽平臺)中的分析任務,快速搭建有效的機器學習繫統。同時,作者力求減少讀者為了理解本書,而對編程技能、數學背景的過分依賴;進而降低機器學習模型的實踐門檻,讓更多的興趣愛好者體會到使用經典模型以及近期新的高效方法解決實際問題的樂趣。同時,筆者對每一個等
●第1部分 入門篇
第1章 全書指南3
1.1Python編程3
1.2數據分析5
1.3機器學習6
1.3.1任務9
1.3.2經驗10
1.3.3性能11
1.4Kaggle競賽13
1.5Git代碼管理14
1.6章 末小結15
第2章 基本環境搭建與配置16
2.1Windows操作繫統下基本環境的搭建與配置16
2.1.1查看Windows的版本與原始配置16
2.1.2下載並安裝Anaconda3(Windows)17
2.1.3使用Anaconda Navigator創建虛擬環境python_env(Windows)19
2.1.4在虛擬環境python_env下使用Anaconda Navigator安裝Jupyter Notebook與PyCharm Professional(Windows)20
2.2macOS操作繫統下基本環境的搭建與配置21
2.2.1查看macOS的版本與原始配置21
2.2.2下載並安裝Anaconda3(macOS)23
2.2.3使用Anaconda Navigator創建虛擬環境python_env(macOS)24
2.2.4在虛擬環境python_env下使用Anaconda Navigator安裝
2.3.1查看Ubuntu的版本與原始配置26
2.3.2下載並安裝Anaconda3(Ubuntu)27
2.3.3在終端中創建虛擬環境python_env(Ubuntu)28
2.3.4在虛擬環境python_env下使用conda命令安裝Jupyter Notebook(Ubuntu)29
2.4Jupyter Notebook使用簡介31
2.4.1在虛擬環境python_env下啟動Jupyter Notebook31
2.4.2創建一個.ipynb文件32
2.4.3試運行.ipynb文件內的Python 3程序33
2.5PyCharm使用簡介34
2.5.1在虛擬環境python_env下啟動PyCharm34
2.5.2基於虛擬環境python_env的Python 3.8解釋器創建一個.py文件35
2.5.3試運行.py文件內的Python 3程序35
2.6章 末小結37
第2部分 基礎篇
第3章 Python編程基礎41
3.1Python編程環境配置41
3.1.1基於命令行/終端的交互式編程環境41
3.1.2基於Web的交互式開發環境42
3.1.3集成式開發環境43
3.2Python基本語法44
3.2.1賦值44
3.2.2注釋45
3.2.3縮進46
3.3Python數據類型46
3.4Python數據運算49
3.5Python流程控制53
3.5.1分支語句53
3.5.2循環控制55
3.6Python函數設計56
3.7Python面向對像編程57
3.8Python編程庫(包)導入60
3.9Python編程綜合實踐62
3.10章 末小結63
第4章 pandas數據分析64
4.1pandas環境配置65
4.1.1使用Anaconda Navigator搭建和配置環境66
4.1.2使用conda命令搭建和配置環境66
4.2pandas核心數據結構67
4.2.1Series68
4.2.2DataFrame69
4.3pandas讀取/寫入文件數據70
4.3.1讀取/寫入CSV文件數據70
4.3.2讀取/寫入JSON文件數據73
4.3.3讀取/寫入Excel文件數據76
4.4pandas數據分析的常用功能80
4.4.1添加數據80
4.4.2刪除數據83
4.4.3查詢/篩選數據84
4.4.4修改數據86
4.4.5數據統計87
4.4.6數據排序89
4.4.7函數應用90
4.5pandas數據合並92
4.6pandas數據清洗93
4.7pandas數據分組與聚合95
4.8章 末小結97
第5章 Scikit-learn單機機器學習98
……
第3部分 進階篇
第6章 PyTorch/TensorFlow/PaddlePaddle深度學習185
第7章 PySpark-ML分布式機器學習262
第4部分 實踐篇
第8章 Kaggle競賽實踐301
第9章 Git代碼管理334
後記352
本書在不涉及大量數學模型與復雜編程知識的前提下,從零開始逐步帶領讀者熟悉並掌握當下流行的基於Python 3的數據分析,以及支持單機、深度和分布式機器學習的開源程序庫,如pandas、Scikit-learn、PyTorch、TensorFlow、PaddlePaddle、PySpark-ML等。全書分4部分。入門篇包括對全書核心概念的指南性介紹,以及在多種主流操作繫統(Windows、macOS、Ubuntu)上配置基本編程環境的詳細說明。基礎篇涵蓋Python 3的編程基礎、基於pandas的數據分析,以及使用Scikit-learn解決大量經典的單機(單核/多核)機器學習問題。進階篇介紹如何使用PyTorch、TensorFlow、PaddlePaddle搭建多種深度學習網絡框架,以及如何基於PySpark的ML編程庫完成一些常見的分布式機器學習任務。實踐篇利用全書所講授等