[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

Python數據清洗 圖書
該商品所屬分類:圖書 -> 數據庫
【市場價】
1004-1456
【優惠價】
628-910
【作者】 邁克爾·沃克爾 
【出版社】清華大學出版社 
【ISBN】9787302609360
【折扣說明】一次購物滿999元台幣免運費+贈品
一次購物滿2000元台幣95折+免運費+贈品
一次購物滿3000元台幣92折+免運費+贈品
一次購物滿4000元台幣88折+免運費+贈品
【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
版本正版全新電子版PDF檔
您已选择: 正版全新
溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
*. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
*. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
*. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
內容介紹



出版社:清華大學出版社
ISBN:9787302609360
商品編碼:10058492751362

品牌:文軒
出版時間:2022-07-01
代碼:119

作者:邁克爾·沃克爾

    
    
"



作  者:(美)邁克爾·沃克爾 著 劉亮 譯
/
定  價:119
/
出 版 社:清華大學出版社
/
出版日期:2022年07月01日
/
頁  數:720
/
裝  幀:平裝
/
ISBN:9787302609360
/
目錄
●第1章將表格數據導入Pandas中1
1.1技術要求1
1.2導入CSV文件2
1.2.1準備工作2
1.2.2實戰操作3
1.2.3原理解釋5
1.2.4擴展知識6
1.2.5參考資料7
1.3導入Excel文件7
1.3.1準備工作8
1.3.2實戰操作8
1.3.3原理解釋13
1.3.4擴展知識13
1.3.5參考資料14
1.4從SQL數據庫中導入數據14
1.4.1準備工作15
1.4.2實戰操作15
1.4.3原理解釋19
1.4.4擴展知識21
1.4.5參考資料21
1.5導入SPSS、Stata和SAS數據21
1.5.1準備工作22
1.5.2實戰操作22
1.5.3原理解釋28
1.5.4擴展知識29
1.5.5參考資料30
1.6導入R數據30
1.6.1準備工作30
1.6.2實戰操作31
1.6.3原理解釋33
1.6.4擴展知識34
1.6.5參考資料34
1.7保留表格數據35
1.7.1準備工作36
1.7.2實戰操作36
1.7.3原理解釋39
1.7.4擴展知識39
第2章將HTML和JSON導入Pandas中41
2.1技術要求41
2.2導入簡單的JSON數據41
2.2.1準備工作42
2.2.2實戰操作42
2.2.3原理解釋47
2.2.4擴展知識48
2.3通過API導入更復雜的JSON數據48
2.3.1準備工作49
2.3.2實戰操作50
2.3.3原理解釋52
2.3.4擴展知識53
2.3.5參考資料53
2.4從網頁中導入數據53
2.4.1準備工作54
2.4.2實戰操作55
2.4.3原理解釋58
2.4.4擴展知識59
2.5持久保存JSON數據59
2.5.1準備工作60
2.5.2實戰操作60
2.5.3原理解釋62
2.5.4擴展知識63
第3章衡量數據好壞65
3.1技術要求66
3.2初步了解數據66
3.2.1準備工作66
3.2.2實戰操作67
3.2.3原理解釋70
3.2.4擴展知識71
3.2.5參考資料71
3.3選擇和組織列71
3.3.1準備工作72
3.3.2實戰操作72
3.3.3原理解釋77
3.3.4擴展知識77
3.3.5參考資料78
3.4選擇行79
3.4.1準備工作79
3.4.2實戰操作79
3.4.3原理解釋86
3.4.4擴展知識87
3.4.5參考資料87
3.5生成分類變量的頻率87
3.5.1準備工作88
3.5.2實戰操作88
3.5.3原理解釋91
3.5.4擴展知識92
3.6生成連續變量的摘要統計信息92
3.6.1準備工作92
3.6.2實戰操作93
3.6.3原理解釋95
3.6.4參考資料96
第4章識別缺失值和離群值97
4.1技術要求97
4.2尋找缺失值97
4.2.1準備工作98
4.2.2實戰操作98
4.2.3原理解釋101
4.2.4參考資料101
4.3用一個變量識別離群值102
4.3.1準備工作102
4.3.2實戰操作102
4.3.3原理解釋109
4.3.4擴展知識109
4.3.5參考資料110
4.4識別雙變量關繫中的離群值和意外值110
4.4.1準備工作111
4.4.2實戰操作112
4.4.3原理解釋118
4.4.4擴展知識119
4.4.5參考資料119
4.5檢查變量關繫中的邏輯不一致情況119
4.5.1準備工作119
4.5.2實戰操作120
4.5.3原理解釋126
4.5.4參考資料126
4.6使用線性回歸來確定具有重大影響的數據點126
4.6.1準備工作127
4.6.2實戰操作127
4.6.3原理解釋129
4.6.4擴展知識130
4.7使用k最近鄰算法找到離群值130
4.7.1準備工作130
4.7.2實戰操作131
4.7.3原理解釋133
4.7.4擴展知識133
4.7.5參考資料134
4.8使用隔離森林算法查找異常134
4.8.1準備工作134
4.8.2實戰操作134
4.8.3原理解釋137
4.8.4擴展知識138
4.8.5參考資料138
第5章使用可視化方法識別意外值139
5.1技術要求139
5.2使用直方圖檢查連續變量的分布140
5.2.1準備工作140
5.2.2實戰操作141
5.2.3原理解釋146
5.2.4擴展知識147
5.3使用箱形圖識別連續變量的離群值147
5.3.1準備工作148
5.3.2實戰操作148
5.3.3原理解釋153
5.3.4擴展知識153
5.3.5參考資料153
5.4使用分組的箱形圖發現特定組中的意外值154
5.4.1準備工作154
5.4.2實戰操作154
5.4.3原理解釋159
5.4.4擴展知識159
5.4.5參考資料160
5.5使用小提琴圖檢查分布形狀和離群值160
5.5.1準備工作160
5.5.2實戰操作161
5.5.3原理解釋165
5.5.4擴展知識166
5.5.5參考資料166
5.6使用散點圖查看雙變量關繫166
5.6.1準備工作167
5.6.2實戰操作167
5.6.3原理解釋172
5.6.4擴展知識173
5.6.5參考資料173
5.7使用折線圖檢查連續變量的趨勢173
5.7.1準備工作173
5.7.2實戰操作173
5.7.3原理解釋178
5.7.4擴展知識179
5.7.5參考資料179
5.8根據相關性矩陣生成熱圖179
5.8.1準備工作180
5.8.2實戰操作180
5.8.3原理解釋182
5.8.4擴展知識183
5.8.5參考資料183
第6章使用Series操作清洗和探索數據185
6.1技術要求186
6.2從PandasSeries中獲取值186
6.2.1準備工作186
6.2.2實戰操作187
6.2.3原理解釋190
6.3顯示PandasSeries的摘要統計信息190
6.3.1準備工作191
6.3.2實戰操作191
6.3.3原理解釋193
6.3.4擴展知識195
6.3.5參考資料195
6.4更改Series值195
6.4.1準備工作195
6.4.2實戰操作195
6.4.3原理解釋198
6.4.4擴展知識199
6.4.5參考資料199
6.5有條件地更改Series值199
6.5.1準備工作199
6.5.2實戰操作200
6.5.3原理解釋203
6.5.4擴展知識205
6.5.5參考資料206
6.6評估和清洗字符串Series數據206
6.6.1準備工作206
6.6.2實戰操作206
6.6.3原理解釋210
6.6.4擴展知識211
6.7處理日期211
6.7.1準備工作211
6.7.2實戰操作212
6.7.3原理解釋216
6.7.4參考資料217
6.8識別和清洗缺失的數據217
6.8.1準備工作217
6.8.2實戰操作217
6.8.3原理解釋221
6.8.4擴展知識221
6.8.5參考資料221
6.9使用k最近鄰算法填充缺失值222
6.9.1準備工作222
6.9.2實戰操作222
6.9.3原理解釋223
6.9.4擴展知識224
6.9.5參考資料224
第7章聚合時修復混亂數據225
7.1技術要求226
7.2使用itertuples遍歷數據226
7.2.1準備工作226
7.2.2實戰操作227
7.2.3原理解釋229
7.2.4擴展知識230
7.3使用NumPy數組按組計算彙總231
7.3.1準備工作231
7.3.2實戰操作231
7.3.3原理解釋233
7.3.4擴展知識234
7.3.5參考資料234
7.4使用groupby組織數據234
7.4.1準備工作234
7.4.2實戰操作234
7.4.3原理解釋237
7.4.4擴展知識237
7.5通過groupby使用更復雜的聚合函數237
7.5.1準備工作238
7.5.2實戰操作238
7.5.3原理解釋242
7.5.4擴展知識243
7.5.5參考資料244
7.6結合groupby使用用戶定義的函數244
7.6.1準備工作244
7.6.2實戰操作244
7.6.3原理解釋247
7.6.4擴展知識247
7.6.5參考資料248
7.7使用groupby更改DataFrame的分析單位248
7.7.1準備工作249
7.7.2實戰操作249
7.7.3原理解釋250
第8章組合DataFrame251
8.1技術要求252
8.2垂直組合DataFrame252
8.2.1準備工作252
8.2.2實戰操作253
8.2.3原理解釋256
8.2.4參考資料256
8.3進行一對一合並256
8.3.1準備工作258
8.3.2實戰操作258
8.3.3原理解釋262
8.3.4擴展知識263
8.4按多列進行一對一合並263
8.4.1準備工作263
8.4.2實戰操作263
8.4.3原理解釋266
8.4.4擴展知識266
8.5進行一對多合並266
8.5.1準備工作267
8.5.2實戰操作267
8.5.3原理解釋271
8.5.4擴展知識271
8.5.5參考資料271
8.6進行多對多合並271
8.6.1準備工作272
8.6.2實戰操作272
8.6.3原理解釋276
8.6.4擴展知識277
8.7開發合並例程277
8.7.1準備工作277
8.7.2實戰操作278
8.7.3原理解釋279
8.7.4參考資料280
第9章規整和重塑數據281
9.1技術要求282
9.2刪除重復的行282
9.2.1準備工作282
9.2.2實戰操作283
9.2.3原理解釋285
9.2.4擴展知識286
9.2.5參考資料286
9.3修復多對多關繫286
9.3.1準備工作287
9.3.2實戰操作287
9.3.3原理解釋291
9.3.4擴展知識292
9.3.5參考資料292
9.4使用stack和melt將數據由寬變長292
9.4.1準備工作293
9.4.2實戰操作293
9.4.3原理解釋297
9.5使用wide_to_long處理多列297
9.5.1準備工作297
9.5.2實戰操作297
9.5.3原理解釋299
9.5.4擴展知識299
9.6使用unstack和pivot將數據由長變寬300
9.6.1準備工作300
9.6.2實戰操作300
9.6.3原理解釋302
第10章用戶定義的函數和類303
10.1技術要求303
10.2用於查看數據的函數303
10.2.1準備工作304
10.2.2實戰操作304
10.2.3原理解釋307
10.2.4擴展知識308
10.3用於顯示摘要統計信息和頻率的函數308
10.3.1準備工作308
10.3.2實戰操作309
10.3.3原理解釋313
10.3.4擴展知識313
10.3.5參考資料313
10.4識別離群值和意外值的函數314
10.4.1準備工作314
10.4.2實戰操作315
10.4.3原理解釋319
10.4.4擴展知識319
10.4.5參考資料319
10.5聚合或合並數據的函數319
10.5.1準備工作320
10.5.2實戰操作320
10.5.3原理解釋325
10.5.4擴展知識325
10.5.5參考資料326
10.6包含更新Series值邏輯的類326
10.6.1準備工作326
10.6.2實戰操作326
10.6.3原理解釋330
10.6.4擴展知識331
10.6.5參考資料331
10.7處理非表格數據結構的類331
10.7.1準備工作332
10.7.2實戰操作333
10.7.3原理解釋336
10.7.4擴展知識336
內容簡介
本書詳細闡述了與Python數據清洗相關的基本解決方案,主要包括將表格數據導入Pandas中、將HTML和JSON導入Pandas中、衡量數據好壞、識別缺失值和離群值、使用可視化方法識別意外值、使用Series操作清洗和探索數據、聚合時修復混亂數據、組合DataFrame、規整和重塑數據、用戶定義的函數和類等內容。此外,本書還提供了相應的示例、代碼,以幫助讀者進一步理解相關方案的實現過程。



"
 
網友評論  我們期待著您對此商品發表評論
 
相關商品
【同作者商品】
邁克爾·沃克爾
  本網站暫時沒有該作者的其它商品。
有該作者的商品通知您嗎?
請選擇作者:
邁克爾·沃克爾
您的Email地址
在線留言 商品價格為新臺幣
關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
返回頂部