[ 收藏 ] [ 繁体中文 ]  
臺灣貨到付款、ATM、超商、信用卡PAYPAL付款,4-7個工作日送達,999元臺幣免運費   在線留言 商品價格為新臺幣 
首頁 電影 連續劇 音樂 圖書 女裝 男裝 童裝 內衣 百貨家居 包包 女鞋 男鞋 童鞋 計算機周邊

商品搜索

 类 别:
 关键字:
    

商品分类

  •  管理

     一般管理学
     市场/营销
     会计
     金融/投资
     经管音像
     电子商务
     创业企业与企业家
     生产与运作管理
     商务沟通
     战略管理
     商业史传
     MBA
     管理信息系统
     工具书
     外文原版/影印版
     管理类职称考试
     WTO
     英文原版书-管理
  •  投资理财

     证券/股票
     投资指南
     理财技巧
     女性理财
     期货
     基金
     黄金投资
     外汇
     彩票
     保险
     购房置业
     纳税
     英文原版书-投资理财
  •  经济

     经济学理论
     经济通俗读物
     中国经济
     国际经济
     各部门经济
     经济史
     财政税收
     区域经济
     统计 审计
     贸易政策
     保险
     经济数学
     各流派经济学说
     经济法
     工具书
     通货膨胀
     财税外贸保险类考试
     英文原版书-经济
  •  社会科学

     语言文字
     社会学
     文化人类学/人口学
     新闻传播出版
     社会科学总论
     图书馆学/档案学
     经典名家作品集
     教育
     英文原版书-社会科学
  •  哲学

     哲学知识读物
     中国古代哲学
     世界哲学
     哲学与人生
     周易
     哲学理论
     伦理学
     哲学史
     美学
     中国近现代哲学
     逻辑学
     儒家
     道家
     思维科学
     马克思主义哲学
     经典作品及研究
     科学哲学
     教育哲学
     语言哲学
     比较哲学
  •  宗教

  •  心理学

  •  古籍

     经部  史类  子部  集部  古籍管理  古籍工具书  四库全书  古籍善本影音本  中国藏书
  •  文化

     文化评述  文化随笔  文化理论  传统文化  世界各国文化  文化史  地域文化  神秘文化  文化研究  民俗文化  文化产业  民族文化  书的起源/书店  非物质文化遗产  文化事业  文化交流  比较文化学
  •  历史

     历史普及读物
     中国史
     世界史
     文物考古
     史家名著
     历史地理
     史料典籍
     历史随笔
     逸闻野史
     地方史志
     史学理论
     民族史
     专业史
     英文原版书-历史
     口述史
  •  传记

  •  文学

  •  艺术

     摄影
     绘画
     小人书/连环画
     书法/篆刻
     艺术设计
     影视/媒体艺术
     音乐
     艺术理论
     收藏/鉴赏
     建筑艺术
     工艺美术
     世界各国艺术概况
     民间艺术
     雕塑
     戏剧艺术/舞台艺术
     艺术舞蹈
     艺术类考试
     人体艺术
     英文原版书-艺术
  •  青春文学

  •  文学

     中国现当代随笔
     文集
     中国古诗词
     外国随笔
     文学理论
     纪实文学
     文学评论与鉴赏
     中国现当代诗歌
     外国诗歌
     名家作品
     民间文学
     戏剧
     中国古代随笔
     文学类考试
     英文原版书-文学
  •  法律

     小说
     世界名著
     作品集
     中国古典小说
     四大名著
     中国当代小说
     外国小说
     科幻小说
     侦探/悬疑/推理
     情感
     魔幻小说
     社会
     武侠
     惊悚/恐怖
     历史
     影视小说
     官场小说
     职场小说
     中国近现代小说
     财经
     军事
  •  童书

  •  成功/励志

  •  政治

  •  军事

  •  科普读物

  •  计算机/网络

     程序设计
     移动开发
     人工智能
     办公软件
     数据库
     操作系统/系统开发
     网络与数据通信
     CAD CAM CAE
     计算机理论
     行业软件及应用
     项目管理 IT人文
     计算机考试认证
     图形处理 图形图像多媒体
     信息安全
     硬件
     项目管理IT人文
     网络与数据通信
     软件工程
     家庭与办公室用书
  •  建筑

     执业资格考试用书  室内设计/装潢装修  标准/规范  建筑科学  建筑外观设计  建筑施工与监理  城乡规划/市政工程  园林景观/环境艺术  工程经济与管理  建筑史与建筑文化  建筑教材/教辅  英文原版书-建筑
  •  医学

     中医
     内科学
     其他临床医学
     外科学
     药学
     医技学
     妇产科学
     临床医学理论
     护理学
     基础医学
     预防医学/卫生学
     儿科学
     医学/药学考试
     医院管理
     其他医学读物
     医学工具书
  •  自然科学

     数学
     生物科学
     物理学
     天文学
     地球科学
     力学
     科技史
     化学
     总论
     自然科学类考试
     英文原版书-自然科学
  •  工业技术

     环境科学
     电子通信
     机械/仪表工业
     汽车与交通运输
     电工技术
     轻工业/手工业
     化学工业
     能源与动力工程
     航空/航天
     水利工程
     金属学与金属工艺
     一般工业技术
     原子能技术
     安全科学
     冶金工业
     矿业工程
     工具书/标准
     石油/天然气工业
     原版书
     武器工业
     英文原版书-工业技
  •  农业/林业

     园艺  植物保护  畜牧/狩猎/蚕/蜂  林业  动物医学  农作物  农学(农艺学)  水产/渔业  农业工程  农业基础科学  农林音像
  •  外语

  •  考试

  •  教材

  •  工具书

  •  中小学用书

  •  中小学教科书

  •  动漫/幽默

  •  烹饪/美食

  •  时尚/美妆

  •  旅游/地图

  •  家庭/家居

  •  亲子/家教

  •  两性关系

  •  育儿/早教

  •  保健/养生

  •  体育/运动

  •  手工/DIY

  •  休闲/爱好

  •  英文原版书

  •  港台图书

  •  研究生
     工学
     公共课
     经济管理
     理学
     农学
     文法类
     医学

  •  音乐
     音乐理论

     声乐  通俗音乐  音乐欣赏  钢琴  二胡  小提琴
  • Pandas數據分析快速上手500招(微課視頻版)
    該商品所屬分類:計算機/網絡 -> 數據庫
    【市場價】
    496-718
    【優惠價】
    310-449
    【作者】 羅帥、羅斌 
    【所屬類別】 圖書  計算機/網絡  數據庫  數據庫理論 
    【出版社】清華大學出版社 
    【ISBN】9787302624110
    【折扣說明】一次購物滿999元台幣免運費+贈品
    一次購物滿2000元台幣95折+免運費+贈品
    一次購物滿3000元台幣92折+免運費+贈品
    一次購物滿4000元台幣88折+免運費+贈品
    【本期贈品】①優質無紡布環保袋,做工棒!②品牌簽字筆 ③品牌手帕紙巾
    版本正版全新電子版PDF檔
    您已选择: 正版全新
    溫馨提示:如果有多種選項,請先選擇再點擊加入購物車。
    *. 電子圖書價格是0.69折,例如了得網價格是100元,電子書pdf的價格則是69元。
    *. 購買電子書不支持貨到付款,購買時選擇atm或者超商、PayPal付款。付款後1-24小時內通過郵件傳輸給您。
    *. 如果收到的電子書不滿意,可以聯絡我們退款。謝謝。
    內容介紹



    開本:16開
    紙張:膠版紙
    包裝:平裝-膠訂

    是否套裝:否
    國際標準書號ISBN:9787302624110
    作者:羅帥、羅斌

    出版社:清華大學出版社
    出版時間:2023年03月 

        
        
    "

    產品特色

    編輯推薦

    問題描述 解決方案 真實源碼 效果截圖 視頻教學, 精選500案例,附贈36個可視化案例,提供完整源碼,邊看邊做邊學 。優化數據分析,提高工作效率 ;告別重復勞動,蛻變職場精英

     
    內容簡介

    本書采用“問題描述 解決方案”模式,通過500個案例介紹了使用Pandas進行數據分析和數據處理的技術亮點。全書共分為8章,主要案例包括:讀寫CSV、Excel、JSON、HTML等格式的數據;根據行標簽、列名和行列數字索引篩選和修改數據,使用各種函數根據數據大小、日期範圍、正則表達式、lambda表達式、文本類型等多種條件篩選數據;統計NaN(缺失值)的數量、占比,根據規則填充和刪除NaN;在DataFrame中增、刪、查、改行列數據,計算各種行差、列差、極差以及直接對兩個DataFrame進行加、減、乘、除運算和比較差異;將寬表和長表相互轉換,創建交叉表和各種透視表;對數據分組結果進行求和、累加、求平均值、求極差、求占比、排序、篩選、重采樣等多種形式的分析,將分組數據導出為Excel文件。本書還附贈36個數據可視化案例,如根據指定的條件設置行列數據的顏色和樣式,根據行列數據繪制條形圖、柱形圖、餅圖、折線圖、散點圖、六邊形圖、箱形圖、面積圖等。 本書適於作為數據分析師、物流分析師、金融分析師、數據產品開發人員、人工智能開發人員、市場營銷人員、辦公管理人員、Python程序員等各行各業人員的案頭參考書,無論對於初學者還是專業人士,本書都極具參考和收藏價值。

    目錄


    第1章 DataFrame 1
    001 使用隨機數創建一個DataFrame 1
    002 使用字母設置DataFrame的行標簽 2
    003 使用日期設置DataFrame的行標簽 3
    004 使用月份設置DataFrame的行標簽 4
    005 使用月初日期設置DataFrame的行標簽 5
    006 使用星期日設置DataFrame的行標簽 6
    007 使用日期範圍設置DataFrame的行標簽 7
    008 使用等差日期設置DataFrame的行標簽 8
    009 使用時間差設置DataFrame的行標簽 9
    010 根據工作日移動DataFrame的行標簽 10
    011 使用shift()移動DataFrame的行標簽 11



    第1章  DataFrame 1
    001  使用隨機數創建一個DataFrame 1
    002  使用字母設置DataFrame的行標簽 2
    003  使用日期設置DataFrame的行標簽 3
    004  使用月份設置DataFrame的行標簽 4
    005  使用月初日期設置DataFrame的行標簽 5
    006  使用星期日設置DataFrame的行標簽 6
    007  使用日期範圍設置DataFrame的行標簽 7
    008  使用等差日期設置DataFrame的行標簽 8
    009  使用時間差設置DataFrame的行標簽 9
    010  根據工作日移動DataFrame的行標簽 10
    011  使用shift()移動DataFrame的行標簽 11
    012  根據日期差修改DataFrame的行標簽 11
    013  在日期行標簽中禁止使用法定節假日 12
    014  在日期行標簽中排除自定義的節假日 13
    015  在日期行標簽中增加或減少分鐘數 14
    016  指定DataFrame的列數據為行標簽 15
    017  在DataFrame中移除現有的行標簽 16
    018  使用列表設置DataFrame的行標簽 17
    019  使用字典修改DataFrame的行標簽 17
    020  使用lambda修改DataFrame的行標簽 18
    021  在多層索引的DataFrame中設置行標簽 19
    022  使用字典修改DataFrame的多層行索引 20
    023  根據DataFrame創建笛卡兒積多層索引 20
    024  使用rename()修改DataFrame的列名 22
    025  使用strip()修改DataFrame的列名 22
    026  使用set_axis()修改DataFrame的列名 23
    027  使用字典修改DataFrame的列名 24
    028  為DataFrame的列名添加前綴或後綴 24
    029  根據DataFrame的列名獲取列索引數字 25
    第2章  讀取數據 27
    030  從CSV格式的字符串中讀取數據 27
    031  從CSV格式的文本文件中讀取數據 28
    032  從星號分隔的文本文件中讀取數據 28
    033  從制表符分隔的文本文件中讀取數據 29
    034  從空格分隔的文本文件中讀取數據 29
    035  讀取文本文件的數據並自定義列名 30
    036  讀取文本文件的數據並重命名列名 31
    037  根據列名讀取文本文件的部分數據 31
    038  從文本文件中讀取lambda篩選的列 32
    039  讀取文本文件的數據並設置列名前綴 33
    040  讀取文本文件的數據並設置列類型 33
    041  讀取文本文件並使用lambda修改列 34
    042  讀取文本文件並使用自定義函數修改列 35
    043  讀取文本文件並設置True和False 36
    044  讀取文本文件的數據並跳過指定行 37
    045  讀取文本文件的數據並跳過奇數行 37
    046  讀取文本文件的數據並跳過倒數n行 38
    047  讀取文本文件並將列類型轉為日期類型 39
    048  讀取文本文件的數據並解析日期列數據 40
    049  讀取文本文件的數據並合並日期列數據 41
    050  從壓縮格式的文本文件中讀取數據 42
    051  把DataFrame的數據保存為文本文件 43
    052  從Excel文件中讀取單個工作表的數據 44
    053  從Excel文件中讀取多個工作表的數據 45
    054  從Excel文件中讀取工作表的前n行數據 46
    055  從首行跳過n行讀取Excel工作表的數據 47
    056  從末尾跳過n行讀取Excel工作表的數據 48
    057  跳過指定行讀取Excel工作表的部分數據 49
    058  從Excel文件中讀取工作表的偶數行數據 50
    059  從Excel文件中讀取工作表的偶數列數據 51
    060  根據列號讀取Excel文件的工作表數據 52
    061  讀取Excel工作表的數據且取消默認列名 53
    062  讀取Excel工作表的數據且自定義列名 53
    063  讀取Excel工作表的數據並指定行標簽 54
    064  在讀取Excel工作表數據時解析千分位符 55
    065  把DataFrame的數據保存為Excel文件 56
    066  在保存Excel文件時不保留默認的行標簽 57
    067  使用read_json()函數讀取JSON數據 58
    068  將DataFrame的數據保存為JSON文件 59
    069  從指定的網頁中讀取多個表格的數據 60
    070  將DataFrame的所有數據轉換為網頁代碼 62
    071  將DataFrame的部分數據轉換為網頁代碼 63
    072  根據當前剪貼板的數據創建DataFrame 64
    073  將DataFrame的所有數據保存到剪貼板 65
    074  將DataFrame的部分數據保存到剪貼板 66
    第3章  篩選數據 67
    075  根據指定的列名篩選整列數據 67
    076  使用eq()在指定列中篩選數據 68
    077  使用ne()在指定列中篩選數據 68
    078  使用lt()在指定列中篩選數據 69
    079  在指定列中根據平均值篩選數據 70
    080  使用le()在指定列中篩選數據 70
    081  使用gt()在指定列中篩選數據 71
    082  使用ge()在指定列中篩選數據 72
    083  根據行標簽的大小篩選數據 73
    084  根據行標簽的範圍篩選數據 73
    085  根據行標簽步長篩選偶數行數據 74
    086  根據指定的日期切片篩選數據 75
    087  根據指定的日期範圍篩選數據 76
    088  根據指定的月份範圍篩選數據 76
    089  在日期類型的列中按日篩選數據 77
    090  根據日期列的差值篩選數據 78
    091  使用loc篩選並修改單個數據 79
    092  使用loc篩選並修改多個數據 79
    093  使用loc篩選並修改多行單列數據 80
    094  使用loc篩選並修改單行多列數據 81
    095  使用loc篩選並修改多行多列數據 82
    096  使用loc根據切片篩選並修改數據 83
    097  使用loc篩選並修改單行數據 84
    098  使用loc篩選並修改多行數據 84
    099  使用loc篩選並修改單列數據 85
    100  使用loc篩選並修改多列數據 86
    101  使用loc篩選並修改多層數據 87
    102  使用loc篩選並輸出DataFrame 87
    103  使用loc根據大小篩選數據 88
    104  使用loc根據字符串長度篩選數據 89
    105  使用loc根據數值範圍篩選數據 90
    106  在loc中使用all()篩選多列數據 90
    107  在loc中使用any()篩選多列數據 91
    108  使用loc篩選數據且指定輸出列 92
    109  使用loc篩選IndexSlice結果 92
    110  使用loc根據後一行篩選列 93
    111  在loc中使用lambda篩選列 94
    112  使用loc根據負數步長倒序篩選列 94
    113  使用loc根據負數步長倒序篩選行 95
    114  使用iloc篩選並修改單個數據 96
    115  使用iloc篩選並修改多個數據 96
    116  使用iloc篩選並修改多行單列數據 97
    117  使用iloc篩選並修改單行多列數據 98
    118  使用iloc篩選並修改多行多列數據 99
    119  使用iloc根據列表篩選並修改數據 99
    120  使用iloc篩選並修改單列數據 100
    121  使用iloc篩選並修改多列數據 100
    122  使用iloc篩選並修改單行數據 101
    123  使用iloc篩選並修改多行數據 102
    124  使用iloc篩選並輸出DataFrame 103
    125  使用iloc根據指定的步長篩選數據 103
    126  使用iloc篩選不連續的多行數據 104
    127  在iloc中使用numpy篩選多行數據 105
    128  在iloc中使用numpy篩選多列數據 106
    129  在iloc中使用lambda篩選偶數行數據 106
    130  使用at篩選並修改單個數據 107
    131  使用iat篩選並修改單個數據 108
    132  使用last()篩選後幾天的數據 108
    133  使用truncate()根據行標簽篩選數據 109
    134  使用truncate()根據日期範圍篩選數據 110
    135  使用between()根據日期範圍篩選數據 110
    136  使用between()根據數值範圍篩選數據 111
    137  使用between_time()根據時間篩選數據 112
    138  使用contains()在指定列中篩選文本 113
    139  使用contains()不區分大小寫篩選文本 114
    140  在contains()中使用或運算符篩選文本 115
    141  在contains()中使用正則表達式篩選文本 115
    142  使用endswith()根據結束字符篩選文本 116
    143  使用startswith()根據開始字符篩選文本 117
    144  使用match()根據多個開始字符篩選數據 118
    145  使用isnumeric()篩選全部為數字的數據 119
    146  使用isin()篩選在指定列表中的數據 120
    147  使用isin()篩選未在指定列表中的數據 120
    148  使用isin()篩選指定列的前n行數據 121
    149  使用isin()篩選指定列小的前n行數據 122
    150  在apply()中調用自定義函數篩選數據 122
    151  在鏈式語句中調用自定義函數篩選數據 123
    152  在apply()中使用lambda篩選數據 124
    153  在鏈式語句中調用lambda篩選數據 125
    154  在applymap()中使用lambda篩選數據 126
    155  使用apply()篩選指定列首次出現的數據 126
    156  使用apply()根據日期範圍篩選數據 127
    157  使用apply()根據數值範圍篩選數據 128
    158  使用select_dtypes()根據類型篩選列 129
    159  使用select_dtypes()根據類型反向篩選列 129
    160  使用filter()根據指定的列名篩選列 130
    161  使用filter()根據指定的條件篩選列 131
    162  使用filter()根據正則表達式篩選列 131
    163  使用filter()根據指定的行標簽篩選行 132
    164  使用filter()根據正則表達式篩選行 133
    165  在query()中使用比較運算符篩選數據 134
    166  在query()中使用多個運算符篩選數據 134
    167  使用query()根據平均值篩選數據 135
    168  使用query()根據兩列差值篩選數據 136
    169  使用query()根據多列數值大小篩選數據 136
    170  使用query()篩選多列均存在的數據 137
    171  使用query()根據指定列表篩選數據 138
    172  使用query()根據外部變量篩選數據 139
    173  使用query()根據日期範圍篩選數據 139
    174  使用query()篩選包含指定字符的數據 140
    175  使用query()根據行標簽篩選數據 141
    176  使用query()組合多個條件篩選數據 142
    177  使用query()以鏈式風格篩選數據 142
    178  使用eval()組合多個條件篩選數據 143
    179  使用rolling()根據樣本篩選數據 144
    180  使用sample()根據占比篩選隨機子集 145
    181  使用apply()根據指定條件篩選數據 146
    182  在DataFrame中篩選所有數據 146
    183  根據在列表中指定的多個列名篩選列 147
    184  根據在集合中指定的多個列名篩選列 148
    第4章  清洗數據 150
    185  統計DataFrame每列的NaN數量 150
    186  統計DataFrame每行的NaN數量 151
    187  統計DataFrame每行的非NaN數量 151
    188  統計DataFrame每列的NaN數量占比 152
    189  統計DataFrame每行的NaN數量占比 153
    190  統計DataFrame每行的非NaN數量占比 154
    191  使用isna()在列中篩選包含NaN的行 155
    192  使用notna()在列中篩選不包含NaN的行 155
    193  使用isnull()在列中篩選包含NaN的行 156
    194  使用isnull()在列中篩選不包含NaN的行 156
    195  在DataFrame中篩選包含NaN的列 157
    196  在DataFrame中篩選包含NaN的行 158
    197  在DataFrame中篩選不包含NaN的列 158
    198  在DataFrame中篩選不包含NaN的行 159
    199  在DataFrame中刪除包含NaN的行 160
    200  在DataFrame中刪除包含NaN的列 160
    201  在DataFrame中刪除全部是NaN的行 161
    202  在DataFrame中刪除全部是NaN的列 162
    203  在DataFrame中根據NaN占比刪除列 162
    204  在指定的列中刪除包含NaN的行 163
    205  在指定的行中刪除包含NaN的列 164
    206  使用fillna()根據指定值填充NaN 164
    207  使用fillna()在指定列中填充NaN 165
    208  使用fillna()根據列平均值填充NaN 166
    209  使用fillna()填充指定列的首個NaN 167
    210  使用fillna()實現自動向下填充NaN 168
    211  使用fillna()實現自動向上填充NaN 169
    212  使用applymap()填充DataFrame的NaN 169
    213  使用mask()填充DataFrame的NaN 170
    214  根據分組已存在的數據填充分組的NaN 171
    215  使用transform()根據分組平均值填充NaN 171
    216  將小數點前後有空格的數據修改為NaN 172
    217  在format()中使用指定字符標注NaN 173
    218  使用指定的顏色高亮顯示所有的NaN 174
    219  自定義函數設置NaN的顏色 174
    220  自定義函數設置NaN的背景顏色 175
    221  自定義函數設置非NaN的顏色 176
    222  自定義函數設置非NaN的背景顏色 177
    223  在DataFrame中強制NaN排在首位 177
    224  讀取Excel文件並設置NaN的對應值 178
    225  讀取Excel文件並按列設置NaN的對應值 179
    226  讀取文本文件並設置NaN的對應值 180
    227  讀取文本文件並按列設置NaN的對應值 181
    第5章  整理數據 183
    228  使用apply()轉換指定列的數據類型 183
    229  使用apply()轉換所有列的數據類型 184
    230  使用to_numeric()轉換列的數據類型 184
    231  使用astype()轉換指定列的數據類型 185
    232  使用astype()將百分數轉換為浮點數 186
    233  使用astype()轉換千分位符的數字 186
    234  使用astype()將其他時間轉為北京時間 187
    235  根據日期類型列的日期解析星期 188
    236  根據日期類型列的日期解析季度 188
    237  使用lower()將指定列的字母變為小寫 189
    238  使用rjust()在指定列左端補充字符 190
    239  使用ljust()在指定列右端補充字符 191
    240  使用center()在指定列兩端補充字符 191
    241  使用lstrip()刪除指定列左端字符 192
    242  使用rstrip()刪除指定列右端字符 193
    243  使用strip()刪除指定列左右兩端字符 193
    244  使用get()提取指定列指定位置的字符 194
    245  使用slice()提取指定列的多個字符 195
    246  使用count()統計指定列的字符個數 195
    247  使用repeat()在指定列中重復字符 196
    248  使用replace()在指定列中替換文本 197
    249  使用replace()在指定列中替換字母 197
    250  在replace()中使用正則表達式替換 198
    251  在replace()中使用lambda替換 199
    252  使用slice_replace()替換指定切片 199
    253  在apply()中調用自定義函數修改數據 200
    254  在apply()中調用lambda修改數據 201
    255  使用apply()刪除%符號並轉換數據 202
    256  使用mask()根據指定條件修改數據 202
    257  使用where()根據指定條件修改數據 203
    258  使用replace()在指定列中替換數據 204
    259  使用replace()在指定行中替換數據 205
    260  在map()中使用字典修改數據 205
    261  在map()中使用lambda修改數據 206
    262  使用map()格式化指定列的數據 207
    263  使用map()將浮點數轉換為百分數 207
    264  使用map()根據時間差計算天數 208
    265  在DataFrame的末尾增加新行 209
    266  在DataFrame的中間插入新行 209
    267  根據行標簽在DataFrame中刪除行 210
    268  根據條件在DataFrame中刪除行 211
    269  在多層索引的DataFrame中刪除行 211
    270  使用duplicated()篩選重復行 212
    271  使用drop_duplicates()刪除重復行 213
    272  在指定列中使用drop_duplicates() 214
    273  根據表達式初始化DataFrame的新增列 215
    274  使用map()初始化DataFrame的新增列 215
    275  計算DataFrame的單列數據並新增列 216
    276  計算DataFrame的多列數據並新增列 217
    277  使用assign()在DataFrame中新增列 218
    278  使用assign()根據lambda表達式新增列 218
    279  使用列表初始化DataFrame的新增列 219
    280  使用apply()根據列表成員增加新列 220
    281  使用apply()計算多列數據增加新列 220
    282  使用apply()把列表成員擴展成多列 221
    283  使用partition()將一列拆分成兩列 222
    284  使用split()將一列拆分成多列 223
    285  使用extract()將一列拆分成兩列 224
    286  使用extract()將一列拆分成多列 224
    287  在extract()中根據正則表達式拆分列 225
    288  使用cat()以拼接字符串方式合並列 226
    289  根據字符串日期列拆分年月日列 227
    290  根據日期類型的列拆分年月日列 227
    291  使用加號運算符拼接年月日列 228
    292  使用to_datetime()拼接年月日列 229
    293  根據索引在DataFrame中插入列 230
    294  根據列名在DataFrame中刪除列 230
    295  根據條件在DataFrame中刪除列 231
    296  使用concat()按行拼接DataFrame 232
    297  使用append()按行拼接DataFrame 233
    298  使用concat()分組拼接DataFrame 234
    299  使用concat()按列拼接DataFrame 235
    300  使用concat()提取兩個DataFrame的交集 236
    301  使用merge()根據同名列合並DataFrame 237
    302  使用merge()根據指定列合並DataFrame 238
    303  使用merge()以指定方式合並DataFrame 239
    304  使用join()根據索引列按列合並DataFrame 240
    305  使用combine_first()合並DataFrame 241
    306  使用combine()根據參數合並DataFrame 242
    307  使用Pandas的merge()合並DataFrame 243
    308  使用merge_ordered()合並DataFrame 244
    309  使用merge_asof()合並DataFrame 245
    310  使用compare()比較兩個DataFrame 246
    311  使用align()補齊兩個DataFrame的列 247
    312  在DataFrame中垂直移動指定的行數 248
    313  在DataFrame中水平移動指定的列數 248
    314  使用round()設置DataFrame的小數位數 249
    315  使用update()更新DataFrame的數據 250
    316  使用clip()修剪DataFrame的數據 251
    317  使用clip()根據列表按列修剪數據 251
    318  使用replace()在DataFrame中替換數據 252
    319  使用replace()執行多值對應替換 253
    320  使用replace()替換所有行列的字母 253
    321  在replace()中使用正則表達式替換 254
    322  在replace()中使用多個正則表達式 255
    323  使用apply()修改DataFrame的數據 256
    324  使用applymap()修改DataFrame 256
    325  使用transform()修改DataFrame 257
    326  使用transform()按行修改DataFrame 258
    327  在DataFrame中按列相加指定的列表 258
    328  在DataFrame中按行相加指定的列表 259
    329  在DataFrame中按列相減指定的列表 260
    330  在DataFrame中按行相減指定的列表 261
    331  在DataFrame中按列相乘指定的列表 261
    332  在DataFrame中按行相乘指定的列表 262
    333  在DataFrame中實現各行數據連乘 263
    334  在DataFrame中按列除以指定的列表 263
    335  在DataFrame中按行除以指定的列表 264
    336  使用add()實現兩個DataFrame相加 265
    337  使用sub()實現兩個DataFrame相減 265
    338  使用mul()實現兩個DataFrame相乘 266
    339  使用div()實現兩個DataFrame相除 267
    340  使用sum()在DataFrame中按列求和 267
    341  使用sum()在DataFrame中按行求和 268
    342  使用apply()在DataFrame中按列求和 269
    343  使用apply()在DataFrame中按行求和 270
    344  使用agg()在DataFrame中按列求和 270
    345  使用agg()在DataFrame中按行求和 271
    346  使用select_dtypes()實現按列求和 272
    347  使用select_dtypes()實現按行求和 272
    348  使用expanding()累加前n個數據 273
    349  使用apply()按行累加各列的數據 274
    350  使用apply()按列累加各行的數據 275
    351  使用apply()計算每列數據的平均值 275
    352  使用apply()計算每行數據的平均值 276
    353  使用apply()計算每行值的比值 276
    354  使用apply()計算每列值的比值 277
    355  使用apply()計算每列數據的極差 278
    356  使用apply()計算每行數據的極差 278
    357  使用diff()計算DataFrame的行差 279
    358  使用diff()計算DataFrame的列差 280
    359  使用diff()計算指定列的差值 281
    360  使用diff()計算差值並篩選數據 281
    361  使用shift()按行計算移動平均值 282
    362  使用shift()按列計算移動平均值 283
    363  使用rolling()按行計算移動平均值 284
    364  使用rolling()居中計算移動平均值 284
    365  使用rolling()計算移動極差 285
    366  在rolling()中設置小觀測期 286
    367  使用pct_change()計算增減百分比 287
    368  使用apply()獲取每列數據的值 288
    369  使用apply()獲取每列數據的中位數 288
    370  使用describe()獲取指定列的值 289
    371  使用agg()獲取所有列的值 290
    372  使用tolist()獲取DataFrame的數據 291
    373  根據行標簽順序排列DataFrame 292
    374  根據行標簽大小排列DataFrame 292
    375  倒序排列DataFrame並重置行標簽 293
    376  在DataFrame中根據單個列名排序 294
    377  在DataFrame中根據多個列名排序 294
    378  在DataFrame中根據文本長度排序 295
    379  在DataFrame中降序排列所有的列 296
    380  在DataFrame中倒序排列所有的列 297
    381  在DataFrame中自定義所有列順序 297
    382  在DataFrame中根據列表調整列順序 298
    383  使用rank()根據大小生成排名序號 299
    384  使用value_counts()統計列成員數量 300
    385  使用value_counts()統計列成員占比 300
    第6章  透視數據 302
    386  使用melt()將寬表轉換為長表 302
    387  使用pivot()將長表轉換為寬表 303
    388  使用stack()將寬表轉換為長表 304
    389  使用unstack()將長表轉換為寬表 304
    390  使用stack()將多行數據轉換成一行 305
    391  使用crosstab()根據行列創建交叉表 306
    392  使用crosstab()創建交叉表並計算合計 307
    393  使用explode()將列表成員擴展為多行 307
    394  使用explode()篩選互為好友的數據 308
    395  使用explode()在組內容之前插入組名 309
    396  使用pivot_table()根據指定列進行分組 310
    397  使用pivot_table()獲取分組平均值 311
    398  使用pivot_table()獲取多級分組平均值 312
    399  使用pivot_table()實現多級分組並求和 313
    400  使用pivot_table()對不同列執行不同函數 314
    401  使用transpose()實現行列數據交換 315
    第7章  分組聚合 316
    402  使用groupby()根據單列數據分組求和 316
    403  使用groupby()根據多列數據分組求和 317
    404  使用groupby()分組並對指定列數據求和 317
    405  在groupby()中設置分組鍵為非索引列 318
    406  重命名在使用groupby()分組之後的列名 319
    407  自定義在使用groupby()分組之後的列名 320
    408  使用groupby()分組並統計各組的個數 321
    409  使用groupby()分組並獲取各組的明細 321
    410  使用groupby()分組並獲取多級分組明細 322
    411  使用groupby()分組並遍歷各組的明細 323
    412  使用groupby()分組並計算各組移動平均值 324
    413  使用groupby()分組並計算各組累加值 325
    414  使用groupby()分組並獲取各組值 326
    415  使用groupby()分組並獲取各組第二大值 327
    416  使用groupby()分組並添加各組合計 328
    417  使用groupby()分組並添加分組占比 329
    418  使用groupby()分組求和並禁止排序 330
    419  使用groupby()根據lambda進行分組 331
    420  使用groupby()根據行標簽進行分組 332
    421  使用groupby()根據索引年份進行分組 333
    422  使用groupby()根據年份月份進行分組 334
    423  使用groupby()根據星期進行分組 335
    424  使用groupby()根據日期進行分組 336
    425  使用groupby()根據列名進行分組 336
    426  使用groupby()根據字典進行分組 337
    427  使用groupby()根據字典類型進行分組 338
    428  使用groupby()根據自定義函數進行分組 339
    429  使用groupby()根據指定字符進行分組 340
    430  使用groupby()根據返回值進行分組 341
    431  使用groupby()根據Grouper進行分組 341
    432  在分組指定列中查找互為相反數的數據 342
    433  使用resample()實現日期重采樣分組 343
    434  使用resample()實現先分組再重采樣 344
    435  使用cut()根據連續型數據進行分組 346
    436  使用cut()進行分組並設置分組的標簽 347
    437  使用cut()進行分組並計算各組平均值 348
    438  使用qcut()根據指定的個數進行分組 348
    439  根據索引層對多層索引的DataFrame分組 349
    440  使用agg()獲取分組指定列的值 351
    441  使用agg()獲取分組某幾列的值 351
    442  使用agg()自定義分組之後的新列名 352
    443  使用agg()根據字典自定義分組新列名 353
    444  使用agg()轉換分組之後的合計數據 354
    445  使用agg()轉換分組之後的列數據類型 355
    446  使用agg()通過lambda計算分組極差 356
    447  使用agg()通過自定義函數計算分組極差 357
    448  在agg()中調用帶多個參數的自定義函數 358
    449  使用pipe()計算各個分組指定列的極差 359
    450  使用filter()篩選分組指定列的合計 359
    451  使用filter()篩選分組指定列的值 360
    452  使用filter()篩選分組指定列的平均值 361
    453  使用filter()篩選分組指定列的所有值 362
    454  使用filter()篩選分組指定列的某個值 363
    455  使用filter()篩選分組成員的個數 364
    456  使用filter()篩選分組大於某值的數據 365
    457  使用apply()獲取分組某列的值 366
    458  使用apply()獲取分組數值列的值 366
    459  在apply()中使用lambda計算分組列差 367
    460  在apply()中使用lambda計算分組差值 368
    461  在apply()中使用DataFrame返回分組差值 369
    462  在apply()中調用自定義函數統計分組指標 370
    463  使用apply()將分組數據導出為Excel文件 371
    464  使用unstack()以寬表風格輸出多級分組 372
    465  使用quantile()計算各個分組的分位數 373
    466  使用rank()獲取各個成員在分組中的序號 374
    467  使用transform()計算平均值並篩選分組 375
    468  使用drop_duplicates()刪除分組重復數據 376
    第8章  可視化數據 377
    469  使用format()自定義列的數據格式 377
    470  使用format()將浮點數轉為百分數 377
    471  在format()中使用lambda重置列 378
    472  使用指定的顏色設置所有列的背景顏色 379
    473  使用自定義函數設置指定列的背景顏色 379
    474  使用自定義函數設置指定行的背景顏色 380
    475  使用自定義函數設置交錯的行背景顏色 381
    476  使用自定義函數設置列切片的背景顏色 382
    477  使用applymap()根據條件設置背景顏色 383
    478  使用指定的顏色設置所有列的數據顏色 383
    479  使用自定義函數設置指定列的數據顏色 384
    480  使用自定義函數設置指定行的數據顏色 385
    481  使用自定義函數設置交錯的行數據顏色 386
    482  使用自定義函數設置列切片的數據顏色 387
    483  在所有列中根據值的大小設置背景顏色 387
    484  在指定列中根據值的大小設置背景顏色 388
    485  在所有列中根據值的大小設置數據顏色 389
    486  在指定列中根據值的大小設置數據顏色 390
    487  使用指定顏色高亮顯示分位包含的數據 390
    488  使用指定顏色高亮顯示所有列的值 391
    489  使用指定顏色高亮顯示指定列的值 392
    490  使用指定顏色高亮顯示所有列的小值 393
    491  使用指定顏色高亮顯示指定列的小值 393
    492  使用自定義函數設置每列的值顏色 394
    493  使用自定義函數設置每列的小值顏色 395
    494  使用指定顏色高亮顯示所有行的值 396
    495  使用指定顏色高亮顯示指定行的值 396
    496  使用指定顏色高亮顯示所有行的小值 397
    497  使用指定顏色高亮顯示指定行的小值 398
    498  根據大小使用漸變色按列設置數據顏色 398
    499  根據大小使用漸變色按行設置數據顏色 399
    500  根據大小使用漸變色按列設置背景顏色 400



    IV



    V


     


     


     


     


     

    前言



    Pandas是近比較熱門的一個分析結構化數據的工具包,它提供了高性能、易使用的數據結構和數據分析方法,其所提供的各種數據處理方法、工具基於數理統計學。Pandas 的命名來源並非“熊貓”,而是衍生自計量經濟學的術語“panel data(面板數據)”和“Python data analysis(Python數據分析)”。Pandas的目標是成為 Python 數據分析實踐與實戰的高級工具,其長遠目標是成為強大、靈活、可以支持任何語言的開源數據分析工具。




    Pandas是近比較熱門的一個分析結構化數據的工具包,它提供了高性能、易使用的數據結構和數據分析方法,其所提供的各種數據處理方法、工具基於數理統計學。Pandas 的命名來源並非“熊貓”,而是衍生自計量經濟學的術語“panel data(面板數據)”和“Python data analysis(Python數據分析)”。Pandas的目標是成為 Python 數據分析實踐與實戰的高級工具,其長遠目標是成為強大、靈活、可以支持任何語言的開源數據分析工具。
    Jupyter Notebook是一個基於 Web的交互式開發環境,用戶可以在其中編寫代碼、運行代碼、查看並保存結果,這些特性使其成為一款執行端到端數據科學工作流程的便捷工具,它常用於數據清理、統計建模、構建和訓練機器學習模型、可視化數據等用途。本書所有使用Python語言編寫的Pandas實戰案例均在Jupyter Notebook開發環境中完成,因此建議讀者在測試和學習本書實戰案例時也使用Jupyter Notebook。特別需要說明的是:建議從Anaconda官網下載安裝Anaconda 3,裡面包含Jupyter Notebook、Python 3.8.8、Pandas 1.3.3、numpy 1.20.1、matplotlib 3.4.1等大量的工具包,也可以根據需要在線升級相關工具包的版本。
    全書共分為8章,簡述如下。
    第1章主要列舉了在DataFrame中使用各種形式的日期設置行標簽、修改行標簽、修改列名以及修改多層行標簽、創建笛卡兒積多層索引、根據列名獲取列索引數字等。
    第2章主要列舉了將CSV、Excel、JSON、HTML等格式的數據讀入DataFrame,以及將DataFrame的數據寫入CSV、Excel、JSON、HTML等格式的文件,甚至直接訪問剪貼板數據等。
    第3章主要列舉了使用loc根據行標簽和列名篩選和修改單行數據、單列數據、多行數據、多列數據、多行多列數據、單個數據、多個數據;使用iloc根據行列索引數字篩選和修改單行數據、單列數據、多行數據、多列數據、多行多列數據、單個數據、多個數據;使用各種函數根據數據大小、日期範圍、正則表達式、lambda表達式、文本類型等多種條件篩選數據。
    第4章主要列舉了在DataFrame的行列中統計NaN(缺失值)的數量、占比,以及根據向上填充、向下填充等規則填充NaN的多個案例;同時列舉了根據要求刪除包含NaN的行或列、自定義NaN的顏色等案例;以及在讀取Excel文件時如何處理NaN等案例。
    第5章主要列舉了在DataFrame中新增行、插入行、刪除行、刪除重復行,新增列、刪除列、拆分列、合並列、合並同構或異構的DataFrame,根據指定的規則修改數據、裁剪數據,計算各種行差、列差、極差以及直接對兩個DataFrame進行加、減、乘、除運算和比較差異等。
    第6章主要列舉了寬表和長表的相互轉換,根據DataFrame的行列數據創建交叉表以及使用pivot_table()創建各種透視表等。
    第7章主要列舉了根據指定的要求在DataFrame中對數據進行分組,並對分組結果進行求和、累加、求平均值、求極差、求占比、排序、篩選、重采樣等多種形式的分析,以及將分組數據導出為Excel文件等。
    第8章主要列舉了在DataFrame中根據指定的條件設置行列數據的顏色和樣式等。
    本書後還附贈36個數據可視化案例,如根據行列數據繪制條形圖、柱形圖、餅圖、折線圖、散點圖、六邊形圖、箱形圖、面積圖等,請讀者掃描“目錄”下方的二維碼下載查看。
    本書案例豐富、實用性強、技術新穎、貼近實戰、思路清晰、代碼簡潔、知識精煉、高效直觀、通俗易懂、操作性強。本書配套教學視頻,讀者可先掃描封底的刮刮卡內二維碼,獲得權限,再掃描書中對應章節處的二維碼,即可觀看視頻。本書提供所有案例的完整代碼,讀者可掃描“目錄”下方的二維碼下載查看。
    本書為黑白印刷,書中提到的彩色高亮等效果無法直接體現,請讀者觀看教學視頻,以視頻中的顯示效果為準。
    全書所有內容和思想並非一人之力所能及,而是凝聚了眾多熱心人士的智慧並經過充分的提煉和總結而成,在此對他們表示崇高的敬意和衷心的感謝!由於時間關繫和作者水平原因,少量內容可能存在認識不全面或偏頗的地方,以及一些疏漏和不當之處,敬請讀者批評指正。

    羅帥  羅斌        2022年於重慶渝北    
    II



    23


     


     


     


     


     

















     
    網友評論  我們期待著您對此商品發表評論
     
    相關商品
    在線留言 商品價格為新臺幣
    關於我們 送貨時間 安全付款 會員登入 加入會員 我的帳戶 網站聯盟
    DVD 連續劇 Copyright © 2024, Digital 了得網 Co., Ltd.
    返回頂部