[ 收藏 ] [ 简体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • 網絡爬蟲案例教程(Python·微課視頻版)
    該商品所屬分類:計算機/網絡 -> 計算機/網絡
    【市場價】
    292-424
    【優惠價】
    183-265
    【作者】 主編:韓瑩,副主編:袁靜 
    【所屬類別】 圖書  計算機/網絡  計算機理論 
    【出版社】清華大學出版社 
    【ISBN】9787302619635
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787302619635
    叢書名:清華開發者書庫.Python

    作者:主編:韓瑩,副主編:袁靜
    出版社:清華大學出版社
    出版時間:2022年12月 


        
        
    "

    產品特色

    編輯推薦

    從實戰出發,適合初學者,緊跟 章節案例,理清代碼實現,很快掌握編寫Python爬蟲程序。

     
    內容簡介

    本書主要以純案例驅動的形式,分別使用和結合使用requests庫、selenium庫,從互聯網上收集數據。主要內容包括收集靜態網頁數據,網頁解析,JSON數據,JSON解析,多級翻頁,cookie和session,驗證登錄,多線程,數據的存儲,收集到的數據包括靜態網頁數據、json、圖片、音頻、視頻等數據,並對獲取的數據進行清洗。適合Python初學者,也適合研究Python的廣大科研人員、學者、工程技術人員。本教材采用純的案例,和簡單的注釋,其他一些先修的知識是在其他課程有開設。

    作者簡介

    韓瑩,防災科技學院教師,講授“數據科學與大數據”課程,本教材采用純的案例,和簡單的注釋,其他一些先修的知識是在其他課程有開設。

    目錄
    第1章緒論
    1.1網絡爬蟲的基本概念
    1.2網絡爬蟲的基本流程
    1.2.1發起請求
    1.2.2獲取響應內容
    1.2.3解析內容
    1.2.4持久化保存數據
    1.3網絡爬蟲的合法性問題
    1.4反爬蟲技術
    1.4.1Useragent控制訪問
    1.4.2IP限制訪問
    1.4.3設置請求間隔
    1.4.4通過參數加密和JavaScript腳本
    1.4.5通過robots.txt來限制爬蟲

    第1章緒論


    1.1網絡爬蟲的基本概念


    1.2網絡爬蟲的基本流程


    1.2.1發起請求


    1.2.2獲取響應內容


    1.2.3解析內容


    1.2.4持久化保存數據


    1.3網絡爬蟲的合法性問題


    1.4反爬蟲技術


    1.4.1Useragent控制訪問


    1.4.2IP限制訪問


    1.4.3設置請求間隔


    1.4.4通過參數加密和JavaScript腳本


    1.4.5通過robots.txt來限制爬蟲


    1.5網絡爬蟲的預備知識


    1.5.1統一資源定位器


    1.5.2超文本傳輸協議


    1.5.3超文本標記語言


    1.6開發語言和開發環境


    1.6.1開發語言


    1.6.2第三方請求庫


    1.6.3開發工具


    第2章Requests庫


    2.1安裝Requests庫


    2.2Requests庫發送請求


    2.3查看響應內容


    2.3.1查看響應狀態碼


    2.3.2查看響應的文本信息


    2.3.3解決亂碼問題


    2.3.4二進制碼響應內容


    2.3.5JSON響應內容


    2.4定制請求頭部Headers


    2.5Chrome瀏覽器開發者工具面板


    2.5.1打開開發者工具面板


    2.5.2Elements面板


    2.5.3Network面板


    2.6GET請求單個網頁的爬取案例


    2.6.1不帶參數的GET請求


    2.6.2攜帶參數的GET請求


    第3章JSON數據爬取


    3.1Ajax


    3.1.1Ajax技術


    3.1.2分析數據來源


    3.2JSON


    3.2.1JSON語法規則


    3.2.2訪問JSON數據


    3.2.3JSON文件讀寫操作


    3.2.4JSON數據校驗和格式化


    3.3Ajax異步動態加載的數據爬蟲


    3.3.1帶參數的POST請求爬蟲


    3.3.2多個網頁多鏈接GET請求爬蟲綜合案例


    3.4POST請求的兩種參數格式


    3.4.1Form Data類型


    3.4.2Request Payload類型


    第4章XPath解析及網頁數據爬取


    4.1XPath簡介及安裝


    4.2XPath節點


    4.2.1基本值節點


    4.2.2節點關繫


    4.3XPath語法


    4.3.1選取節點語法


    4.3.2謂語


    4.3.3選取未知節點


    4.3.4選取若干路徑


    4.3.5初步使用XPath案例


    4.4XPath表達式


    4.4.1定位XPath搜索框


    4.4.2在網頁上寫XPath表達式


    4.5爬取HTML文檔數據案例


    4.6爬取多頁HTML文檔數據案例


    4.6.1翻頁在參數裡


    4.6.2翻頁在URL中


    4.7圖片爬蟲案例


    4.7.1單張圖片爬取


    4.7.2多頁多幅圖片爬蟲案例


    4.7.3多類多頁多圖爬蟲案例


    第5章IP代理


    5.1IP代理的作用


    5.2IP代理使用方法


    5.3搭建IP池


    5.3.1獲取單頁IP


    5.3.2獲取多頁IP


    5.3.3檢測IP有效性 


    5.3.4建立IP池


    5.4付費IP代理使用


    第6章Selenium庫


    6.1Selenium安裝及環境配置


    6.1.1Selenium安裝


    6.1.2環境配置


    6.1.3環境測試


    6.2Selenium簡單使用及配置


    6.2.1打開網頁


    6.2.2規避偽裝機制


    6.2.3常見的配置項


    6.3Seleni素定位操作


    6.3.1查素


    6.3.2通過I素


    6.3.3通過nam素


    6.3.4通過clas素


    6.3.5通過ta素


    6.3.6通過lin素


    6.3.7通過partial_lin素


    6.3.8通過XPat素


    6.3.9通過CS素


    6.3.10通過B素


    6.4Selenium等待機制


    6.4.1固定等待


    6.4.2隱式等待


    6.4.3顯式等待WebDriverWait


    6.5Selenium控制瀏覽器


    6.5.1瀏覽器的常見操作


    6.5.2不同窗口之間切換


    6.5.3鼠標事件


    6.5.4鍵盤事件


    6.5.5定位Frame/IFrame


    6.5.6頁面下拉


    6.5.7窗口截圖


    6.5.8文件上傳


    6.6Selenium爬蟲案例


    6.6.1單頁爬取案例


    6.6.2多頁爬取案例


    第7章Requests與Selenium結合使用


    7.1Selenium模擬登錄


    7.1.1Selenium程序模擬登錄


    7.1.2手動輸入數據模擬登錄


    7.2Cookie與Session機制


    7.2.1Cookie機制


    7.2.2Session機制


    7.3Requests、Cookie、Selenium結合使用


    7.4Selenium和Requests結合下載音樂


    7.4.1單首音樂下載


    7.4.2多首音樂下載


    第8章異步爬蟲


    8.1基本概念


    8.2串行下載多個視頻


    8.3使用線程池下載多個視頻


    8.3.1Multiprocessing


    8.3.2Threading


    8.4使用協程下載多個視頻


    第9章正則表達式


    9.1正則函數


    9.1.1re.match函數


    9.1.2re.search函數


    9.1.3re.sub函數


    9.1.4re.compile函數


    9.1.5re.findall函數


    9.1.6re.finditer函數


    9.1.7re.split函數


    9.2正則表達式模式及實例


    9.3正則表達式實例


    9.3.1匹配字符串


    9.3.2匹配字符組


    9.3.3區間匹配


    9.3.4特殊字符匹配


    9.3.5取反


    9.3.6快捷匹配數字和字符


    9.3.7匹配空白字符


    9.3.8單詞邊界


    9.3.9快捷方式取反


    9.3.10開始和結束


    9.3.11匹配任意字符


    9.3.12可選字符


    9.3.13重復


    9.3.14重復區間


    9.3.15開閉區間


    9.4正則表達式進階


    9.4.1分組


    9.4.2或者條件


    9.4.3分組的回溯引用


    9.4.4斷言


    第10章數據清洗


    10.1數據分析流程


    10.2數據清洗的概念及流程


    10.3數據清洗常用方法


    10.3.1讀取數據


    10.3.2初步探索數據


    10.3.3簡單處理數據


    10.3.4重復值處理


    10.3.5異常值處理


    10.3.6處理缺失值


    10.3.7爬取數據


    10.3.8增加特征值


    10.3.9格式與內容清洗


    10.3.10數據持久化保存


    第11章綜合爬蟲案例


    11.1數據爬取


    11.1.1單線程爬取“前程無憂”


    11.1.2多線程爬取“英纔網”


    11.1.3多線程爬取“前程無憂”


    11.2簡單數據清洗


    11.2.1導入庫


    11.2.2初識數據


    11.2.3簡單數據處理


    11.2.4處理重復值


    11.2.5處理空值


    11.2.6字段內容清洗


    11.2.7提取並增加特征值


    11.2.8處理異常值


    11.2.9數據保存


    參考文獻


     

    前言
    現階段,隨著大數據和人工智能技術的研究不斷深入發展,網絡數據采集與清洗越來越具有較為廣泛的應用範圍。本書是為“數據采集與清洗”課程編寫的教材,其內容選取符合教學大綱要求,以案例驅動展開,兼顧內容的廣度和深度,適用面廣。
    本書的第1章主要闡述網絡爬蟲的基本概念、基本流程、爬蟲合法性問題、反爬蟲技術以及爬蟲的預備知識。第2~9章主要講解爬蟲的各種技術,分別討論Requests庫、JSON數據爬取、XPath解析及網頁數據爬取、IP代理、Selenium庫、Selenium與Requests結合使用、異步爬蟲、正則表達式等基本技術的實現; 爬取的內容包括HTML文檔、JSON數據、圖片、音頻、視頻,以及這些類型數據的持久化保存。第10章講解數據的簡單清洗。第11章講解一個綜合案例,結合Requests和Selenium,分別采用單線程和多線程實現對不同網站的數據爬取,並進行相應的數據清洗操作。

    現階段,隨著大數據和人工智能技術的研究不斷深入發展,網絡數據采集與清洗越來越具有較為廣泛的應用範圍。本書是為“數據采集與清洗”課程編寫的教材,其內容選取符合教學大綱要求,以案例驅動展開,兼顧內容的廣度和深度,適用面廣。
    本書的第1章主要闡述網絡爬蟲的基本概念、基本流程、爬蟲合法性問題、反爬蟲技術以及爬蟲的預備知識。第2~9章主要講解爬蟲的各種技術,分別討論Requests庫、JSON數據爬取、XPath解析及網頁數據爬取、IP代理、Selenium庫、Selenium與Requests結合使用、異步爬蟲、正則表達式等基本技術的實現; 爬取的內容包括HTML文檔、JSON數據、圖片、音頻、視頻,以及這些類型數據的持久化保存。第10章講解數據的簡單清洗。第11章講解一個綜合案例,結合Requests和Selenium,分別采用單線程和多線程實現對不同網站的數據爬取,並進行相應的數據清洗操作。
    全書采用Python為主要描述語言。Python是一種面向對像的高級通用腳本編程語言,其語法簡潔,簡單易懂。相比其他語言,Python更容易配置,在字符處理方面靈活,並且在爬蟲程序開發中具有先天的優勢,是開發者的編程語言。Python初被用於編寫Shell(自動化腳本),伴隨著版本不斷更新以及語言新功能的加入,其作為爬蟲編程語言優勢更加突出。因此,越來越多的開發者選擇Python用於大型爬蟲項目開發。Python自帶有多種爬取模板,可以利用Requests和Selenium第三方庫模擬人工瀏覽器訪問的行為,實現起來便捷; 爬蟲程序爬取網頁之後,需要對網頁進行諸如過濾標簽、提取文本等處理。Python擁有簡短的文檔處理功能,能夠用簡短代碼處理絕大部分文檔。
    從課程性質上來講,“數據采集與清洗”是一門專業選修課,側重於應用。它的教學要求是: 理解互聯網大數據采集的主要技術; 掌握各種典型爬蟲的技術原理、技術框架、實現方法、主要開源包的使用; 理解對爬蟲采集到的網頁數據的處理方法及文本處理,並會使用Python進行技術實現。本書的學習過程通過案例驅動的方式展開,幫助讀者貫穿爬蟲、數據清洗的過程,培養讀者掌握從互聯網上采集數據的技術,能夠獨立完成數據采集和清洗工作,對培養學生的數據處理能力、信息分析與應用能力、信息表達能力具有重要作用,為後期的生產實習、畢業設計以及未來的工作奠定一定的實踐基礎。
    本書內容以實戰為主,適合高等院校相關專業的學生閱讀,可以作為數據科學與大數據專業的本科或專科教材,也可以作為信息類相關專業的選修教材,也適合Python培訓機構作為實訓教材。講課學時可設置為30~40學時。本書文字通俗,簡單易懂,便於自學,也可供從事大數據處理等工作的科技人員參考。隻需要掌握Python程序設計便可以學習本書。


    配套資源
    為了方便教學,本書配有微課視頻、教學課件、源代碼。
    (1) 獲取微課視頻方式: 
    讀者可以先掃描本書封底的文泉雲盤防盜碼,再掃描書中相應的視頻二維碼,即可觀看教學視頻。
    (2) 其他資源可先掃描本書封底的文泉雲盤防盜碼,再掃描下方二維碼,即可獲取。


     


    教學課件


     



    源代碼

















     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部