![](http://img.alicdn.com/imgextra/i1/2455124912/TB2BaZFonmWBKNjSZFBXXXxUFXa_!!2455124912-0-item_pic.jpg)
產品名稱:精通Python網絡爬蟲-核心... 是否是套裝:否 書名:精通Python網絡爬蟲-核心技術、框架與項目實戰 精通Python網絡爬蟲-核心技術、框架與項目實戰 代碼:69 出版社名稱:機械工業出版社 出版時間:2017年3月 作者:韋瑋 作者地區:中國大陸 ISBN編號:9787111562085
" 精通Python網絡爬蟲 作 者:韋瑋 著 定 價:69 出 版 社:機械工業出版社 出版日期:2017年03月01日 頁 數:294 裝 幀:平裝 ISBN:9787111562085 ●前言 ●第一篇理論基礎篇 ●第1章什麼是網絡爬蟲3 ●1.1初識網絡爬蟲3 ●1.2為什麼要學網絡爬蟲4 ●1.3網絡爬蟲的組成5 ●1.4網絡爬蟲的類型6 ●1.5爬蟲擴展——聚焦爬蟲7 ●1.6小結8 ●第2章網絡爬蟲技能總覽9 ●2.1網絡爬蟲技能總覽圖9 ●2.2搜索引擎核心10 ●2.3用戶爬蟲的那些事兒11 ●2.4小結12 ●第二篇核心技術篇 ●第3章網絡爬蟲實現原理與實現技術15 ●3.1網絡爬蟲實現原理詳解15 ●3.2爬行策略17 ●3.3網頁更新策略18 ●3.4網頁分析算法20...... 內容簡介 這是一本實戰性的網絡爬蟲秘笈,不僅講解了如何編寫爬蟲,而且還講解了流行的網絡爬蟲的使用。全書分為4個部分:第壹部分對網絡爬蟲做了概要性的介紹,主要介紹了網絡爬蟲的常識和所涉及的技術概覽;第二部分是本書的重點之一,詳細講解了網絡爬蟲的核心技術,包括網絡爬蟲的實現原理與實現技術、Urllib庫和URLError庫的異常處理、正則表達式與Cookie的使用、Fiddler的使用、爬蟲的瀏覽器偽裝技術、爬蟲的定向抓取技術等;第三部分講解了流行的爬蟲框架Scrapy的使用、架構和不錯應用,是目前關於Scrapy詳細的講解;第四部分是3個實戰案例,講解了博客爬蟲、圖片爬蟲和模擬登陸爬蟲的編寫方法。 韋瑋 著 韋瑋,資歷網絡爬蟲技術專家、大數據專家和軟件開發工程師,從事大型軟件開發與技術服務多年,現任重慶韜翔網絡科技有限公司創始人兼CEO,國家專利發明人。精通Python技術,在Pyttlon網絡爬蟲、Python機器學、Python數據分析與挖掘、PythonWeb開發等多個領域都有豐富的實戰經驗。CSDN、51CTO、天善智能等科技類社區和媒體的特邀專家和講師,輸出了大量高質量的課程和文章,深受用戶喜愛。 Preface?前 言為什麼寫這本書網絡爬蟲其實很早就出現了,最開始網絡爬蟲主要應用在各種搜索引擎中。在搜索引擎中,主要使用通用網絡爬蟲對網頁進行爬取及存儲。 隨著大數據時代的到來,我們經常需要在海量數據的互聯網環境中搜集一些特定的數據並對其進行分析,我們可以使用網絡爬蟲對這些特定的數據進行爬取,並對一些無關的數據進行過濾,將目標數據篩選出來。對特定的數據進行爬取的爬蟲,我們將其稱為聚焦網絡爬蟲。在大數據時代,聚焦網絡爬蟲的應用需求越來越大。 目前在國內Python網絡爬蟲的書籍基本上都是從國外引進翻譯的,國內的本版書籍屈指可數,故而我跟華章的副總編楊福川策劃了這本書。本書的撰寫過程中各方面的參考資料非常少,因此完成本書所花費的精力相對來說是非常大的。&...... "![](http://img.alicdn.com/imgextra/i1/2455124912/TB2BaZFonmWBKNjSZFBXXXxUFXa_!!2455124912-0-item_pic.jpg)
|