●章 數據分析概況 /1 1.1 數據分析定義(What) /2 1.2 數據分析作用(Why) /4 1.3 數據分析步驟(How) /5 1.3.1 明確分析目的和思路 /6 1.3.2 數據收集 /7 1.3.3 數據處理 /9 1.3.4 數據分析 /9 1.3.5 數據展現 /10 1.3.6 報告撰寫 /10 1.4 數據分析的三大誤區 /12 1.5 常用的數據分析工具 /13 1.5.1 Excel /13 1.5.2 SPSS /14 1.5.3 R語言 /15 1.5.4 Python語言 /16 第2章 Python 概況 /17 2.1 Python簡介 /18 2.2 Python特點 /19 2.3 Python模塊 /20 2.3.1 函數 /20 2.3.2 模塊 /24 2.4 Python使用場景 /27 2.5 Python 2與Python 3 /28 2.6 Python與數據科學 /29 2.7 Anaconda簡介 /30 2.8 安裝Anaconda /31 2.8.1 Anaconda /31 2.8.2 安裝Anaconda /33 2.9 使用Anaconda /37 2.9.1 PyCharm 與Spyder /37 2.9.2 Anaconda 開始菜單 /38 2.9.3 Spyder 工作界面簡介 /39 2.9.4 項目管理 /40 2.9.5 代碼提示 /43 2.9.6 變量瀏覽 /44 2.9.7 圖形查看 /44 2.9.8 幫助文檔 /45 第3章 編程基礎 /47 3.1 數據類型 /48 3.1.1 數值型 /48 3.1.2 字符型 /50 3.1.3 邏輯型 /56 3.2 賦值和變量 /57 3.2.1 賦值和變量 /57 3.2.2 變量命名規則 /58 3.3 數據結構 /59 3.3.1 列表 /59 3.3.2 字典 /63 3.3.3 序列 /66 3.3.4 數據框 /72 3.3.5 四種數據結構的區別 /80 3.4 向量化運算 /81 3.5 for 循環 /83 3.6 Python 編程注意事項 /87 第4章 數據處理 /90 4.1 數據導入與導出 /91 4.1.1 數據導入 /91 4.1.2 數據導出 /99 4.2 數據清洗 /100 4.2.1 數據排序 /101 4.2.2 重復數據處理 /102 4.2.3 缺失數據處理 /106 4.2.4 空格數據處理 /109 4.3 數據轉換 /110 4.3.1 數值轉字符 /110 4.3.2 字符轉數值 /112 4.3.3 字符轉時間 /113 4.4 數據抽取 /115 4.4.1 字段拆分 /116 4.4.2 記錄抽取 /121 4.4.3 隨機抽樣 /127 4.5 數據合並 /130 4.5.1 記錄合並 /130 4.5.2 字段合並 /133 4.5.3 字段匹配 /135 4.6 數據計算 /140 4.6.1 簡單計算 /140 4.6.2 時間計算 /141 4.6.3 數據標準化 /142 4.6.4 數據分組 /144 第5章 數據分析 /148 5.1 對比分析 /149 5.2 基本統計分析 /152 5.3 分組分析 /155 5.4 結構分析 /158 5.5 分布分析 /159 5.6 交叉分析 /162 5.7 RFM 分析 /164 5.8 矩陣分析 /173 5.9 相關分析 /176 5.10 回歸分析 /178 5.10.1 回歸分析簡介 /178 5.10.2 簡單線性回歸分析 /180 5.10.3 多重線性回歸分析 /185 第6章 數據可視化 /189 6.1 數據可視化簡介 /190 6.1.1 什麼是數據可視化 /190 6.1.2 數據可視化常用圖表 /190 6.1.3 通過關繫選擇圖表 /191 6.2 散點圖 /192 6.3 矩陣圖 /203 6.4 折線圖 /210 6.5 餅圖 /215 6.6 柱形圖 /217 6.7 條形圖 /222
內容簡介
本書從解決工作實際問題出發,提煉總結工作中Python 常用的數據處理、數據分析實戰方法與技巧。本書力求通俗易懂地介紹相關知識,在不影響學習理解的前提下,盡可能地避免使用晦澀難懂的Python 編程、統計術語或模型公式。本書定位是帶領Python 數據分析初學者入門,並能解決學習、工作中大部分的問題或需求。入門後如還需要進一步進階學習,可自行擴展閱讀相關書籍或資料,學習是永無止境的,正所謂“師傅領進門,修行在個人”。
"前 言 《誰說菜鳥不會數據分析》繫列圖書自上市以來,已擁有數十萬讀者與粉絲,口口相傳,成為職場人士案頭必備的參考用書。同時非常榮幸地獲得書刊發行業協會授予的“全行業優秀暢銷品種”稱號,這離不開廣大讀者的厚愛與支持。有讀者告訴我們,每次閱讀都會有新的體會與收獲,這讓我們很開心。 隨著雲計算、互聯網、電子商務和物聯網的飛速發展,世界已經逐步邁入大數據時代。數據分析、機器學習等數據科學技術也相應流行起來,主流的數據科學技術,都將Python 作為主要的計算工具。Python 越來越被大家熟悉和認可,成為數據分析師的新寵兒,特別是在互聯網行業。 市面上Python 數據分析的相關書籍基本上多數由IT 人員編寫,寫作角度相對側重技術層面,很多基礎知識點和編寫的代碼並無詳細介紹,並且在數據分析思維體繫方面相對薄弱,學習門檻非常高,讓非IT 專業朋友......
"