●第1章 數據新聞概述
1.1 數據新聞的概念
1.2 制作數據新聞
1.2.1 人纔需求
1.2.2 技術需要
1.2.3 制作流程
1.3 數據新聞獲獎作品賞析
1.3.1 全球數據新聞獎獲獎作品
1.3.2 世界新聞視覺設計大賽SND獲獎作品
1.3.3 凱度信息之美獲獎作品
1.3.4 全球西格馬獎獲獎作品
小結
習題1
第2章 獲取數據
2.1 政府、國際組織與第三方機構的公開數據
2.2 政府信息公開申請數據
2.3 眾包搜集數據
2.4 搜索引擎的使用
2.4.1 搜索指令
2.4.2 百度搜索工具
2.4.3 百度高級搜索頁面
2.5 數據轉換和存儲
2.5.1 PDF格式轉換為Excel格式
2.5.2 在線轉換工具Zamzar
2.5.3 瀏覽器插件
2.5.4 結構化信息表格化
2.5.5 批量下載文件
2.6 綜合案例
2.6.1 使用聯合國數據庫
2.6.2 獲取北京市歷年常住人口數量
2.6.3 獲取“新冠肺炎”疫情數據
小結
習題2
第3章 數據清理
3.1 “髒數據”(Dirty Data)
3.1.1 “髒數據”的成因
3.1.2 “髒數據”的表現形式
3.2 數據清理/分析工具
3.3 清理“髒數據”
3.3.1 安裝OpenRefine環境
3.3.2 創建項目(導入數據)
3.3.3 主界面
3.3.4 歸類(Facet)
3.3.5 文本過濾器(Text filter)
3.3.6 格(Edit cells)
3.3.7 編輯列(Edit column)
3.3.8 變換(Transpose)
3.3.9 排序(Sort)
3.3.10 視圖(View)
3.3.11 導出(Export)
3.3.12 函數
3.3.13 正則表達式
3.4 數據清理的原則
3.5 數據清理綜合案例
3.5.1 使用Excel查找重復記錄
3.5.2 使用OpenRefine清理UniversityData數據
3.5.3 使用OpenRefine獲取和解析HTML數據
3.5.4 OpenRefine清理hospitals數據
小結
習題3
第4章 數據分析
4.1 數據合理性分析
4.1.1 內部合理性
4.1.2 外部合理性
4.2 使用Excel簡單分析數據
4.2.1 Excel常用函數
4.2.2 篩選
4.2.3 數據透視表
4.2.4 在透視表裡做篩選
4.3 使用pandas庫分析數據
4.3.1 讀取和查看數據
4.3.2 其他常見的pandas函數
4.4 綜合案例
4.4.1 使用Excel分析招聘數據
4.4.2 使用pandas分析泰坦尼克號數據
小結
習題4
第5章 數據分析和可視化工具Tableau
5.1 數據可視化
5.2 數據可視化工具
5.3 Tableau的下載和安裝
5.4 創建第一個可視化作品
5.4.1 首次數據連接
5.4.2 首次創建多種圖表
5.4.3 首次創建儀表板
5.4.4 首次輸出
5.5 連接數據
5.5.1 在圖表中查看數據
5.5.2 簡單數據連接
5.5.3 使用多個數據源
5.5.4 合並數據
5.5.5 提取數據
5.5.6 數據類型
5.6 數據視圖
5.6.1 工作表和工作簿
5.6.2 數據視圖界面
5.6.3 制作文本表、突出顯示表和熱圖
5.6.4 制作條形圖
5.6.5 制作線圖
5.6.6 制作地圖
5.6.7 制作餅圖
5.6.8 制作樹狀圖
5.6.9 制作填充氣泡圖
5.6.10 制作甘特圖
5.6.11 制作散點圖
5.6.12 制作雙組合圖和面積圖
5.6.13 制作盒須圖
5.6.14 制作靶心圖
5.6.15 制作特殊圖形
5.7 高級分析功能
5.7.1 Tableau常用函數
5.7.2 數據聚合
5.7.3 注釋
5.7.4 計算
5.7.5 簡單預測
5.7.6 合計
5.7.7 參數
5.7.8 分層
5.7.9 分組
5.7.10 “頁面”功能區
5.7.11 制作直方圖
5.7.12 背景圖像
5.7.13 集
5.7.14 空間文件
5.8 儀表板
5.8.1 創建儀表板
5.8.2 布局容器
5.8.3 編輯儀表板
5.8.4 儀表板和工作表
5.8.5 操作
5.9 故事
5.10 作品發布
5.10.1 文件類型
5.10.2 發布
5.10.3 打印
5.11 作品賞析
5.11.1 Is Your Country Good at Reducing CO2 Emissions?
5.11.2 Cabs in NYC
5.11.3 Measuring the Penguinsat Palmer Station
5.12 綜合案例:動態熱帶氣旋圖
小結
習題5
第6章 其他數據新聞制作工具
6.1 圖表繪制工具庫ECharts
6.1.1 獲取ECharts
6.1.2 繪制一個簡單的圖表
6.1.3 編輯圖表
6.2 標簽雲
6.3 可視化工具kepler
6.4 可視化工具flourish
6.5 可視化工具hanabi
小結
習題6
參考文獻
本書緊密圍繞數字媒體環境下新聞人在數據新聞制作中的實際需求,基於案例全面介紹數據新聞制作的流程。本書理論與實踐結合,主要內容包括:數據新聞的概念和制作流程,公開數據的獲取、申請和搜索方法,數據轉換和存儲方法,“髒數據”的成因及表現形式,常見的數據清理和分析工具,基於OpenRefine環境清理“髒數據”的過程和方法,數據清理原則和數據分析,數據可視化的概念,Tableau制作數據圖表的方法和技巧,以及其他常用的數據可視化制作工具。
本書通俗易懂,結構嚴謹,層次清晰,案例豐富,特別適合高等院校相關專業學生和網絡編輯、新媒體記者閱讀,有一定工作經驗的數據新聞制作者也可以從本書學習到大量高級實用的功能和技巧。