產品名稱:Python網絡爬蟲從入門到實... 是否是套裝:否 書名:Python網絡爬蟲從入門到實踐 Python網絡爬蟲從入門到實踐 代碼:49 出版社名稱:機械工業出版社 出版時間:2017年9月 作者:無 ISBN編號:9787111578413
" Python網絡爬蟲從入門到實踐 作 者:唐松,陳智銓 編著 定 價:49 出 版 社:機械工業出版社 出版日期:2017年09月01日 頁 數:244 裝 幀:平裝 ISBN:9787111578413 ●推薦序 ●推薦序二 ●前言 ●前言二 ●第1章網絡爬蟲入門 ●1.1為什麼要學網絡爬蟲 ●1.1.1網絡爬蟲能帶來什麼好處 ●1.1.2能從網絡上爬取什麼數據 ●1.1.3應不應該學爬蟲 ●1.2網絡爬蟲是否合法 ●1.2.1Robots協議 ●1.2.2網絡爬蟲的約束 ●1.3網絡爬蟲的基本議題 ●1.3.1Python爬蟲的流程 ●1.3.2三個流程的技術實現 ●2章編寫第1個網絡爬蟲 ●2.1搭建Python平臺 ●2.1.1Python的安裝 ●2.1.2使用pip安裝第三方庫 ●2.1.3使用編譯器Jupyter編程...... 內容簡介 本書將介紹如何使用Python編寫網絡爬蟲程序獲取互聯網上的大數據。本書包括三部分內容:基礎部分、進階部分和項目實踐。基礎部分(靠前~6章)主要介紹爬蟲的三個步驟(獲取網頁、解析網頁和存儲數據),並通過諸多示例的講解,讓讀者從基礎內容開始繫統性地學習爬蟲技術,並在實踐中提升Python爬蟲水平。進階部分(第7~12章)包括多線程的並發和並行爬蟲、分布式爬蟲、更換IP等,幫助讀者進一步提升爬蟲水平。項目實踐部分(靠前3~16章)使用本書介紹的爬蟲技術對幾個真實的網站進行抓取,讓讀者能在讀完本書後根據自己的需求寫出爬蟲程序。無論是否有編程基礎,隻要是對爬蟲技術感興趣的讀者,本書就能帶領讀者從入門到進階,再到實戰,一步步了解爬蟲,終寫出自己的爬蟲程序。 爬蟲程序是DT(Data Technology,數據技術)收集信息的基礎,程序員爬取目標網站的資料後,就可以分析和建立應用了。我們關心的是科技如何給人家';#: 來實效,進而實現目標和理想,不能應用的技術稱為魔術,JI能用J:表演。我們十分關注讀者能否把握爬蟲概念,所以相關的技術結合不同的實例講解,希望能指導讀者完成整個數據采集的流程。 Python是一個簡單、有效的語言,爬蟲所需的獲取、存儲、整理等流程都可以使用Python繫統地實現。此外,絕大部分計算機也町以直接使用Python語言或簡單地安裝Python繫統,相信讀者一定能輕松地把Python作為爬蟲的主要技術。 動心者,當具有大本大源DT的核心是從信息的源頭去理解和分析,以做出能打動對...... "
|