出版社:西安電子科技大學出版社 ISBN:9787560656670 商品編碼:10028931194287 包裝:平裝 出版時間:2020-06-01 代碼:41 作者:張曉
"基本信息 書名:Python大數據基礎 定價 作者:張曉 出版社:西安電子科技大學出版社 出版日期:2020-06-01 ISBN:9787560656670 字數: 頁碼: 版次:1 裝幀:平裝 開本:16開 商品重量: 編輯推薦
內容提要
本書介紹了大數據處理中的數據采集、數據存儲、數據預處理、數據分析與挖掘等內容,還介紹了使用Python語言進行大數據處理的方法。全書共8章。章簡要介紹大數據的概念、大數據處理的過程和涉及的不同方面,以及使用Python解決大數據問題的優勢。第2章介紹如何安裝和準備Python編程環境,包括編譯器、集成開發環境(IDE)的安裝,以及第三方包的管理和安裝方法。第3章介紹獲取數據的方法,即如何使用爬蟲技術從網站獲取網頁,並通過解析網頁獲取其中的數據。第4章介紹數據存儲和使用的方法,包括操作常見類型文件的方法,以及操作關繫型數據庫和NoSQL數據庫的方法。第5章介紹如何使用NumPy和Pandas操作數組、矩陣以及如何使用其中的數功能。第6章介紹數據預處理的概念,並介紹數據清洗、數據集成、數據轉換和數據規約的方法。第7章介紹數據挖掘的常見模型,並介紹利用scikit-learn進行有監督分類、回歸預測以及聚類分析的方法。第8章介紹數據可視化基礎,包括可視化的過程和如何選擇合適的圖表,並介紹了利用Matplotlib繪制常見的圖表。 本書的、2章是基礎,第3~8章分別介紹了大數據處理的某一環節。這些章節的內容相互獨立,讀者在自學時可根據興趣和時間調整學習順序。
目錄
作者介紹
序言
" |