| | | Python數據整理 | 該商品所屬分類:圖書 -> 數據庫 | 【市場價】 | 817-1184元 | 【優惠價】 | 511-740元 | 【作者】 | 提爾塔吉奧蒂·薩卡舒布哈迪普·羅伊喬 | 【出版社】 | 機械工業出版社 | 【ISBN】 | 9787111655787 | 【折扣說明】 | 一次購物滿999元台幣免運費+贈品 一次購物滿2000元台幣95折+免運費+贈品 一次購物滿3000元台幣92折+免運費+贈品 一次購物滿4000元台幣88折+免運費+贈品
| 【本期贈品】 | ①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
| |
版本 | 正版全新電子版PDF檔 | 您已选择: | 正版全新 | 溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。 *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。 *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。 | | | | 內容介紹 | |
出版社:機械工業出版社 ISBN:9787111655787 商品編碼:70572679029 品牌:文軒 出版時間:2020-06-01 代碼:99 作者:提爾塔吉奧蒂·薩卡,舒布哈迪普·羅伊喬
" 作 者:(美)提爾塔吉奧蒂·薩卡,(印)舒布哈迪普·羅伊喬杜裡 著 馬羚 等 譯 定 價:99 出 版 社:機械工業出版社 出版日期:2020年06月01日 頁 數:296 裝 幀:平裝 ISBN:9787111655787 ●譯者序 前言 第1章Python數據整理入門1 1.1引言1 1.2Python數據整理3 1.3列表、集合、組和字符串3 1.3.1列表4 練習1:訪問列表成員4 練習2:生成列表5 練習3:遍歷列表並檢查成員7 練習4:列表排序8 練習5:生成隨機列表9 活動1:處理列表10 1.3.2集合11 1.3.3字典13 練習6:訪問和設置字典中的值13 練習7:遍歷字典14 練習8:再次討論唯一值列表問題14 練習9:刪除字典中的值15 練習10:字典推導式16 1.組16 練習11組17 1.3.5字符串18 練習12:訪問字符串18 練習13:字符串切片19 練習14:字符串拆分與合並20 活動2:分析多行字符串並生成專享單詞數量21 1.4小結22 第2章高級數據結構和文件處理23 2.1引言23 2.2高級數據結構23 2.2.1迭代器24 練習15:迭代器介紹24 2.2.2棧25 練習16:在Python中實現棧26 練習17:使用用戶定義的方法實現棧26 2.2.3Lambda表達式28 練習18:用Lambda表達式證明三角恆等式28 練習19:用於排序的Lambda表達式29 練習2素成員檢查30 2.2.4隊列30 練習21:在Python中實現隊列31 活動3:Permutations、迭代器、Lambda、列表32 2.3Python基本文件操作33 練習22:寫入和讀取環境變量33 練習23:打開和關閉文件34 練習24:逐行讀取文件36 練習25:寫入文件37 活動4:設計專屬CSV解析器38 2.4小結39 第3章NumPy、pandas和Matplotlib簡介40 3.1引言40 3.2NumPy數組操作40 練習26:從列表中創建NumPy數組41 練習27:兩個NumPy數組相加42 練習28:NumPy數組的數學運算43 練習29:NumPy數組的高級數學運算43 練習30:使用arange和linspace生成數組44 練習31:創建多維數組45 練習32:二維數組的維度、形狀、大小和數據類型46 練習33:全零、全一、隨機、單位矩陣和向量46 練習34:reshape和ravel函數48 練習35:索引和切片49 練習36:數組操作(數組-數組、數組-標量和通用函數)52 3.3pandas的DataFrame54 練習37:創建pandas序列55 練習38:pandas序列和數據處理56 練習39:創建pandasDataFrame57 練習40:查看部分DataFrame58 練習41:創建和刪除新的列或行61 3.4NumPy和pandas的統計與可視化63 3.4.1基本描述性統計——集中趨勢和分布65 3.4.3隨機變量與概率分布66 3.4.4統計和可視化中的數據整理68 3.4.5DataFrame的基本描述性統計計算68 練習43:從均勻分布生成隨機數68 練習44:從二項分布和條形圖生成隨機數69 練習45:從正態分布和直方圖生成隨機數70 練習46:從DataFrame計算描述性統計71 練習47:內置繪圖實用工具74 活動5:從CSV文件生成統計數據75 3.5小結75 第4章深入學習Python數據整理77 4.1引言77 4.2選取子集、過濾和分組77 4.2.1選取子集78 練習48:從Excel文件加載和檢查超市的銷售數據78 練習49:unique函數80 4.2.2條件選擇與布爾過濾81 練習50:設定和重置索引84 4.2.3分組86 練習51:GroupBy方法86 4.3處理缺失值和檢測異常值89 4.3.1pandas中的缺失值89 練習52:用fillna填充缺失值91 練習53:用dropna刪除缺失值93 4.3.2使用簡單的統計測試進行異常值檢測94 4.4合並數據的方法:concat、merge和join96 練習54:concat方法96 練習55:merge方法(通過公共鍵)97 練習56:join方法100 4.5pandas的實用方法102 4.5.1隨機抽樣102 練習57:使用sample方法隨機抽樣102 4.5.2value_counts方法103 4.5.3數據透視表功能104 練習58:按列值排序——sort_values方法105 練習59:使用apply方法實現用戶自定義函數的靈活性107 活動6:成人收入數據集的使用109 4.6小結110 第5章適應不同類型的數據源112 5.1引言112 5.2從不同的基於文本的(和非文本的)源中讀取數據112 5.2.1本章提供的數據文件113 5.2.2本章需安裝的庫113 5.2.3從CSV文件中讀取文件113 練習60:從缺少表頭的CSV文件中讀取數據113 練習61:讀取不以逗號為分隔符的CSV文件115 練習62:重置CSV文件的表頭116 練習63:讀取CSV文件時跳過初始行和頁腳116 練習64:結合使用skiprows和nrows來讀取小塊數據118 5.2.4使用sheet_name從Excel文件讀取數據並處理不同的sheet_name120 5.2.5從文本文件中讀取數據121 練習65:讀取一般分隔的文本文件121 5.2.6從非文本源中讀取數據121 練習66:從URL中直接讀取HTML表121 練習67:從JSON文件中讀取數據123 練習68:從PDF文件讀取表格數據124 5.3BeautifulSoup4和網頁解析簡介126 練習69:使用BeautifulSoup讀取HTML文件並提取內容127 練習70:DataFrame和BeautifulSoup131 練習71:以Excel文件格式導出DataFrame132 練習72:使用bs4棧文檔中的URL133 活動7:從網頁讀取表格數據並創建DataFrame133 5.4小結134 第6章學習數據整理的隱藏秘密135 6.1引言135 6.2高級列表推導式和zip函數136 6.2.1生成器表達式簡介136 練習73:生成器表達式136 練習74:一行生成器表達式137 練習75:提取包含單個單詞的列表138 6.2.2zip函數140 練習76:zip函數140 練習77:處理雜亂的數據140 6.3數據格式化141 6.3.1%運算符141 6.3.2使用format函數143 練習78:使用{}表示數據144 6.4識別並清除異常值145 練習79:數值數據中的異常值146 練習80:使用z-score去除異常值148 練習81:字符串的模糊匹配149 活動8:異常值和缺失數據的處理150 6.6小結151 第7章高級網絡抓取和數據收集152 7.1引言152 7.2網絡抓取和BeautifulSoup庫的基礎152 7.2.1Python中的庫152 7.2.2requests庫153 練習82:使用requests庫從Wikipedia主頁獲取響應153 練習83:檢查網絡請求的狀態154 練習84:創建一個函數來解碼響應的內容並檢查其長度155 7.2.3BeautifulSoup庫156 練習85:從BeautifulSoup對像中提取人類可讀的文本156 練習86:使用高級bs4技術提取相關文本160 練習87:創建一個緊湊函數來從Wikipedia主頁提取“Onthisday”文本163 7.3從XML讀取數據164 練習88:創建XML文件並讀取素對像164 練習89:查素)中的各素165 7.3.1從本地XML文件讀取數據到ElementTree對像166 練習90:遍歷樹,找到根,並探索所有子節點的標簽和屬性166 練習91:使用text方法提取有意義的數據167 7.3.2使用循環提取和輸出人均GDP信息168 練習92:查找並輸出每個國家的所有鄰國169 練習93:通過網絡抓取獲得的XML數據的簡單使用演示169 7.4從API讀取數據172 7.4.1定義基URL(或API端點)172 練習94:定義和測試從API提取國家數據的函數173 7.4.2使用內置的JSON庫讀取和檢查數據174 7.4.3輸出所素175 7.4.4使用函數提取包含關鍵信息的DataFrame176 練習95:通過建立一個國家信息的小型數據庫來測試這個函數177 7.5正則表達式的基礎178 7.5.1網絡抓取中的正則表達式178 練習96:使用match方法檢查模式是否與字符串或序列匹配179 7.5.2使用compile方法創建正則表達式程序179 練習97:編譯程序以匹配對像180 練習98:在匹配中使用附加參數來檢查特定位置的匹配180 7.5.3正則表達式中的search方法182 練習99:正則表達式中的search方法182 練習100:使用Match對像的span方法來定位匹配模式的位置182 練習101:使用search進行單字符模式匹配的示例183 練習102:字符串開頭或結尾的模式匹配示例184 7.5.4多種匹配模式185 練習103:多字符模式匹配示例185 練習104:貪婪匹配與非貪婪匹配186 練習105:控制重復次數的匹配187 練習106:匹配字符集188 練習107:在正則表達式中使用OR運算符190 7.5.5findall方法191 活動9:從古騰堡提取Top100的電子書191 活動10:通過讀取API構建自己的電影數據庫192 7.6小結193 第8章關繫數據庫管理繫統和結構化查詢語言195 8.1引言195 8.2RDBMS和SQL概述196 8.2.1RDBMS是如何組織的196 8.2.2SQL196 8.3使用RDBMS(MySQL/ tgreSQL/SQLite)199 8.3.1使用SQLite處理單個表199 練習108:連接到SQLite中的數據庫199 練習109:SQLite中的DDL和DML命令200 練習110:對數據庫中的值進行排序202 練習111:更改表的結構並更新新添加的字段202 練習112:對表中的值進行分組203 8.3.2數據庫中的關繫映射204 練習113:刪除行208 練習114:RDBMS和DataFrame209 活動11:從數據庫正確檢索數據210 8.4小結212 第9章數據整理在現實生活中的應用213 9.1引言213 9.2將所學知識應用於現實生活中的數據整理任務213 活動12:數據整理任務——修復聯合國數據214 活動13:數據整理任務——清理GDP數據215 活動14:數據整理任務——合並聯合國數據和GDP數據216 活動15:數據整理任務——將新數據連接到數據庫217 9.3數據整理拓展延伸217 9.3.1成為數據科學家所需的額外技能217 9.3.2大數據和雲技術的基礎知識218 9.3.3數據整理的地位219 9.3.4掌握機器學習的技巧和竅門220 9.4小結221 附錄活動實施步驟222 本書是一本實用的Python數據整理入門教程。書中全面、繫統地闡釋數據整理和提煉過程背後的所有核心思想,通過大量的練習和實例,幫助你全方位理解並掌握相關概念、工具和技術。 全書內容共分為9章,第1章詳細介紹數據整理的重要性及工作重點,並介紹Python的基本數據結構及其實現;第2章是本書的基礎,闡述Python中的高級數據結構和操作繫統的文件操作功能;第3章著重描述Python中NumPy、pandas和Matplotlib三個基本庫的基礎知識;第4章深入分析pandas DataFrames的相關知識;第5章介紹應用於現實生活的網頁抓取的數據整理技術;第6章提出現實生活中發生的數據問題,並學習如何解決這些問題;第7章學習如何從網頁、XML文件和API中收集數據;第8章解釋數據庫的概念,包括數據庫的創建、操作和控制,以及如何將表格轉換為pandasDataFrame;第9章將前面所學的知識等
" | | | | | |