作 者:喜樂君 著
定 價:139
出 版 社:電子工業出版社
出版日期:2021年08月01日
頁 數:356
裝 幀:平裝
ISBN:9787121417641
"從業務視角出發,總結了不同階段的代表性工具(Excel、SQL、Tableau)背後的共同點和差異,總結了“樣本範圍、問題描述和問題答案”的分析方法,並借助“層次”的概念與高級計算、結構化分析前後關聯,為業務用戶走向高級分析指明了一條鮮明的道路。在層次分析的基礎上,把可視化分析分為結果分析、特征分析和結構化分析3 個階段,借助Tableau 字段維度和問題層次的概念,精彩地闡述了“大數據分析是多維度、結構化分析”的觀點。《業務可視化分析: 從問題到圖形的Tableau方法》從問題出發闡等
●第1篇從業務和問題出發的可視化體繫
第1章我的故事:業務分析需要可視化2
1.1生活/工作面前,我們都一樣.2
1.2帶著問題啟程6
第2章奠基:業務可視化分析的價值.7
2.1古往今來,分析的終極目的是輔助決策7
2.2決策:獲得信息、做出判斷10
2.3簡單可視化:幫助領導更快地獲得信息11
2.4交互可視化:可視化是假設驗證的工具14
2.5高級可視化:分布、相關性分析與結構化分析16
2.6Tableau:敏捷BI助力決策分析18
第3章地平線:問題分析的方法與數據基礎.20
3.1問題的結構化分析與“第一字段分類”21
3.2分析的動態過程:聚合是本質23
3.2.1Excel數據透視表:拖曳即聚合23
3.2.2SQL的聚合查詢:窗口式查詢24
3.2.3TableauVizQL可視化聚合查詢.26
3.3行級別明細數據是聚合的起點,是分析的原料27
3.3.1數據表中包含的數據常識:數據類型與分類.27
3.3.2理解數據表行級別的業務邏輯及其專享性.34
3.3.3聚合度是以數據表行級別為基準點的、衡量問題層次高低的尺度.37
3.4直接聚合:基於行級別的直接聚合類型40
3.4.1描述規模:總和、平均值、計數.40
3.4.2描述數據的波動程度:方差和標準差.41
3.4.3關注個體、走向分布:百分位函數及優選值、最小值、中位數.44
3.5從數據到問題的關鍵:“第三字段分類”47
3.5.1第三字段分類:行級別計算與聚合計算.47
3.5.2理解聚合計算中的典型代表:“比值聚合”.49
3.6間接聚合:基於視圖聚合的二次聚合50
3.6.1“復雜問題”的兩個方向特征.50
3.6.2基於直接聚合的二次聚合:大數據的OLAP分析51
3.7從問題分析視角看數據分析的發展階段57
3.7.1小數據時代的多角度明細展示.57
3.7.2數據統計時代的聚合彙總57
3.7.3大數據時代的結構化分析58
第4章啟程:可視化構建方法與擴展路徑60
4.1從聚合到圖形:第二字段分類與圖形構成要素60
4.1.1可視化坐標空間:坐標繫與坐標軸.62
4.1.2“第二字段分類”與坐標軸.63
4.1.3可視化視覺模式與圖形類型.70
4.1.4可視化的意義描述74
4.27種主要的問題類型及其主要圖形.75
4.2.1傳統三大圖及其局限性76
4.2.2文本表:側重度量指標的高密度展現.78
4.2.3分布分析的三大典型圖形78
4.2.4相關性:散點圖與雙軸折線圖.82
4.2.5地理位置可視化83
4.3從基本問題類型到復雜圖形的延伸方法綜述85
4.3.1從問題分析到圖形增強分析的完整路徑.85
4.3.2基於行列的空間擴展:分區與矩陣.86
4.3.3基於標記的增強分析:分層繪制方法.89
4.3.4基於坐標軸的擴展:雙軸、同步與多軸的合並處理.96
4.3.5基於參考線的擴展:增加視圖聚合的二次聚合.97
第2篇問題的7種基本類型與可視化方法
第5章從問題到圖形的可視化邏輯.102
5.1從問題到圖形的啟蒙與進化102
5.1.1《用圖表說話》中的三步走方法.102
5.1.2“問題的字段解析方法”與基本問題類型.103
5.2可視化圖形分類方法與可視化過程105
5.2.1FT可視化詞典.105
5.2.2DataPoints中的數據可視化過程107
5.2.3Abela的“圖形推薦”邏輯108
5.2.4面向IT的Echarts分類與Tableau.109
第6章排序與對比(部分與部分).111
6.1基本條形圖與多個離散維度條形圖111
6.1.1並排條形圖(side-by-sidebar):離散字段並排構成分區.112
6.1.2條形圖矩陣:離散字段交叉構成矩陣.113
6.1.3矩陣實例:日歷矩陣條形圖.114
6.1.4堆疊條形圖:你喜歡喝什麼咖啡.116
6.1.5比例條形圖:把堆疊條形圖轉化為占比分析.118
6.2包含多個度量坐標軸的條形圖119
6.2.1字段重要性遞減的多種布局方式.119
6.2.2考慮字段關繫的雙軸布局方式.120
6.2.3並排條形圖:多個絕對值度量字段的對比.122
6.2.4重疊條形圖:多個絕對值度量字段的包含關繫.124
6.3字段類型和屬性對可視化的影響125
6.3.1字段類型和屬性對顏色的影響.125
6.3.2“絕對值”與比值:字段屬性對標記選擇的影響.127
6.4坐標軸的調整與組合128
6.4.1默認零點:除非必要,謹慎更改.129
6.4.2坐標軸“倒序”:有些數據越大越差.129
6.4.3絕對值刻度與百分位刻度130
6.4.4從“等距坐標軸”到“不等距坐標軸”.131
6.4.5棒棒糖圖:虛擬雙軸132
6.5以條形圖為底色的進階與高級圖形133
6.5.1靶心圖:在排序基礎上增加對比關繫.133
6.5.2“進度條”:展示單一對比關繫的條形圖變種.135
6.5.3結構化分析實例:條形圖的“高級化”.138
第7章時間序列與序列相關性140
7.1時間序列的構成140
7.2折線圖的多種延伸形式141
7.2.1時間的層次與連續/離散屬性.141
7.2.2並排折線圖和矩陣折線圖143
7.2.4多維度折線圖、堆疊面積圖、百分比堆疊面積圖.144
7.2.3包含時序的柱狀圖與結構化分析.147
7.3包含多個度量的時間序列149
7.3.1時間序列中的雙軸與柱狀圖.149
7.3.2雙軸的改變:柱狀圖與折線圖的結合.150
7.3.3基於公共基準的多軸合並151
7.4時間序列與條形圖的結合:甘特圖及其變種152
7.4.1標準甘特圖:沿著連續日期延伸.152
7.4.2股票蠟燭圖:兩個甘特圖的重疊.154
7.4.3跨度圖:“偽裝的甘特圖樣式”.155
7.4.4階梯圖:以階梯方式表達“跨度”.157
7.5日期的高級轉化:絕對日期與相對日期159
7.5.1原理:何為絕對和相對時間軸.159
7.5.2“公共基準”案例:產品在不同時間段的業績對比.160
7.5.3“公共基準”案例:客戶復購分析.163
7.6時序分析中度量的處理與高級圖形166
7.6.1聚合度量的累計彙總處理166
7.6.2絕對值與同比雙軸圖:同比或環比的比率.167
7.6.3排序圖:絕對值轉化為相對排序.168
7.6.4高級案例:地平線圖――借助高級計算處理度量.170
7.7坡面圖:次序字段的前後變化174
7.8在趨勢中增加對比關繫:雙折線增加陰影區175
第8章占比(部分與總體占比).179
8.1占比問題類型與餅圖179
8.2樹狀圖:占比與層次關繫181
8.3初級:餅圖作為輔助圖形查看結構184
8.4中級:結合計算自定義分組及其占比186
8.4.1行級別分組:使用組和行級別計算自定義分組.186
8.4.2特定層次的分組:使用集和高級計算動態分組.187
8.5中級:使用多種方法展示類別的占比189
8.5.1方法一:使用“隱藏”功能分析單一類別占比.189
8.5.2方法二:使用“行級別計算”分析單一類別占比.190
8.5.3方法三:使用“篩選和高級計算”分析單一類別占比.191
8.6高級圖形:環形圖、旭日圖、南丁格爾玫瑰圖192
8.6.1環形圖:最簡單的雙層次結構.192
8.6.2旭日圖:雙層占比193
8.6.3南丁格爾玫瑰圖及個人建議.194
第9章文本表及其延伸形式196
9.1文本表的關鍵場景:優選聚合與“總分結構”196
9.2交叉表的優勢與推薦場景198
9.3讓交叉表更實用:增加可視化修飾的方法200
9.3.1典型交叉表的樣式與說明200
9.3.2簡易法:基於度量名稱的顏色修飾.201
9.3.3簡易法:基於單一度量的突出顯示表.203
9.3.4高級法:基於坐標軸和標記的“文本自定義”.204
9.3.5高級法:使用自定義字段邏輯控制形狀或其他.208
9.4讓簡單豐富起來:善用工具提示與儀表板互動209
9.5文字雲與氣泡圖:不常使用和不推薦的圖形211
9.6總結:用好“三圖一表”,展開業務面紗212
第10章大數據的關鍵:超越個體、走向分布.214
10.1從個體分析到分布分析214
10.2直方圖:分布分析第一圖215
10.2.1簡單直方圖:使用數據桶(bin)在數據表行級別創建直方圖216
10.2.2高級直方圖:使用高級聚合計算和數據桶生成直方圖區間.217
10.2.3基於RFM模型的客戶分布分析219
10.3箱線圖:離散分布與異常發現221
10.4帕累托圖:特殊的頭部集中分布222
10.4.1橫軸百分位處理:將離散維度序列轉化為連續百分位坐標軸.224
10.4.2縱軸累計百分比處理:連續度量的百分位轉化.224
10.4.3空間分類處理:帕累托圖的顏色分類和互動篩選.225
10.5自定義分布分析:參考線與參考分布模型227
10.5.1使用多條“百分比”參考線構建區間.228
10.5.2自定義百分位分布區間229
10.5.3分位數分布區間230
10.5.4標準差分布與“質量控制圖”和“六西格瑪區間”.230
第11章超越經驗,走向探索:廣義相關性分析.234
11.1散點圖與參考分區:波士頓矩陣234
11.2中級:散點圖矩陣和“散點圖松散化”237
11.3高級:用皮爾遜繫數生成相關值矩陣241
11.4層次關繫:多個維度字段之間的結構關繫.244
11.5次序字段的流向分析:漏鬥圖和桑基圖247
11.5.1漏鬥圖(上):基於次序字段的變化.247
11.5.2漏鬥圖(下):基於度量值的變化.250
11.5.3桑基圖:多階段的流向變化(簡要).252
11.6瀑布圖:多個數值的依賴關繫253
11.7雷達圖:多角度的綜合關繫256
11.8相關性或因果關繫:基於空間的流行病學案例.259
第12章特殊的分布:地理空間分析.264
12.1地理空間和地理圖層264
12.2點圖與熱力圖:地理空間分布265
12.3符號地圖與填充地圖267
12.4自定義地理空間與空間矩陣270
12.4.1為數據點增加緩衝區270
12.4.2自定義地理空間:素周期表”.271
12.4.3高級案例:使用表計算自定義空間矩陣.272
12.5路徑地圖:兩種數據結構,兩種繪制方式274
12.6地理空間圖形的說明275
第3篇超越:從可視化分析走向結構化洞察
第13章樣本控制與假設驗證:交互.279
13.1在Excel、SQL、Tableau中構建分析樣本.279
13.1.1Excel與SQL中的靜態篩選.279
13.1.2在Tableau中創建篩選的基本方法281
13.2樣本控制的形式與歸類282
13.2.1快速篩選器的常見形式與優先級.282
13.2.2關聯篩選器和共用篩選器285
13.3基於中間變量的高級樣本控制286
13.4樣本控制的高級形式:指定層次的條件篩選289
13.4.1指定層次條件篩選的3種方式.289
13.4.2購物籃關聯分析的樣本解讀――量化篩選條件.290
13.5性能:邏輯計算位置對篩選的影響293
13.5.1篩選的本質與篩選的標準位置.293
13.5.2在聚合過程中間接篩選的“非標準操作”及其代價.295
13.5.3不同篩選方法的高級分類與適用場景.296
第14章從表像到本質:結構化分析是業務可視化分析的靈魂.299
14.1結構化分析是通往業務探索的必由之路299
14.1.1結構化分析是業務復雜性的要求.300
14.1.2結構化分析的基本形式301
14.2可視化分析中常見的層次及其組合關繫303
14.2.1行級別層次、問題層次及聚合度.303
14.2.2結構化分析的基本類型305
14.3結構化分析的幾種典型場景和案例305
14.3.1交易的利潤結構分析:主視圖引入行級別層次的聚合.305
14.3.2客戶的利潤結構分析:主視圖引入更低層次的聚合.307
14.3.3客戶矩陣分析:當前視圖層次引入獨立層次的聚合.309
14.3.4環形圖:當前視圖層次引入更高聚合度層次的聚合.310
14.4結構化分析的高級形式:嵌套LOD的多遍聚合313
14.4.1客戶購買力:使用嵌套LOD完成多遍聚合.313
14.5通用的層次分析方法316
14.5.1結構化分析與“問題結構”.316
14.5.2層次分析的4個步驟317
14.6和結構化分析相反的“努力”方法318
14.6.1“形式大於內容”的圖形318
14.6.2缺乏代表性和意義的指標321
14.6.3缺乏互動性的圖表321
14.6.4不符合直覺的設計322
第15章歸來:成為優秀的業務分析師的個人建議.323
15.1好奇、探索和持續學習的欲望,是前進的源泉323
15.2學習理解原理,方能舉一反三、事半功倍324
15.3深入理解業務,方能立於不敗之地325
15.4分析要從明細開始,過度整理會遠離真相326
15.6循序漸進,不要好高騖遠328
後記&參考資料.330
對廣大的業務分析師而言,業務分析(或者稱為商業分析)應該從業務和問題出發,可視化是實現的方法,輔助決策是最終的目的。本書以業務分析為起點,介紹了“樣本範圍、問題描述和問題答案”的解析方法,以及聚合過程、連續與離散的字段分類,共同作為業務分析、可視化分析的理論基礎。本書借助敏捷BI工具Tableau,詳細介紹了7種基本問題類型(排序、時序、占比、文本、分布、相關性、地理)及其對應的基本圖形,並介紹了基於標記、坐標軸、參考線、計算的增強分析方法。本書的目的是讓讀者從“三圖一表”的結果分析,經由分布和相關性的特征分析,走向業務分析中的關鍵領域――多個問題的結構化分析。