內容簡介
隨著大數據時代到來,網絡信息量也變得更多更大,基於傳統搜索引擎的局限性,網絡爬蟲應運而生。範傳輝編著的《Python爬蟲開發與項目實戰》從基本的爬蟲原理開始講解,通過介紹Pthvon編程語言和Web前端基礎知識引領讀者入門,之後介紹動態爬蟲原理以及Scrapy爬蟲框架,很後介紹大規模數據下分布式爬蟲的設計以及PySpider爬蟲框架等。
本書主要特點:
由淺入深,從Pvthon和Web前端基礎開始講起,逐步加深難度,層層遞進。
內容詳實,從靜態網站到*態網站,從單機爬蟲到分布式爬蟲,既包含基礎知識點,又講解了關鍵問題和難點分析,方便讀者完成進階。
實用性強,本書共有9個爬蟲項目,以繫統的實戰項目為驅動,由淺及深地講解爬蟲開發中所需的知識和技能。
難點詳析,對js加密的分析、反爬蟲措施的突破、去重方案的設計、分布式爬蟲的開發進行了細致的講解。