●第一章數據分析概述
1.1數據分析的定義
1.2數據分析的意義
1.3數據分析的常見類型及作用
1.3.1數據分析的常見類型
1.3.2數據分析的作用
1.4數據分析的一般步驟
1.4.1明確分析目的和思路
1.4.2數據收集
1.4.3數據處理
1.4.4數據分析實施
1.4.5數據展現
1.4.6報告撰寫
本章小結
第二章數據分析的常用工具
2.1數據處理工具:Excel
2.1.1Excel簡介
2.1.2Excel實踐環境
2.1.3Excel數據處理與分析
2.2數據庫:MySQL
2.2.1MySQL簡介
2.2.2MySQL實踐環境
2.2.3MySQL基本操作
2.3數據可視化:PowerBI
2.3.1PowerBI簡介
2.3.2PowerBI實踐環境
2.3.3PowerBI數據分析及可視化
2.3.4Excel用戶使用PowerBI
2.4大數據分析工具
2.4.1SPSS可視化統計分析工具
2.4.2Python程序設計語言
2.4.3Hive數據倉庫工具
本章小結
第三章數據收集與存儲
3.1數據庫與數據倉庫
3.1.1數據庫
3.1.2數據倉庫
3.1.3數據庫與數據倉庫的區別
3.2數據
3.2.1數據與大數據
3.2.2數據的類型
3.2.3數據的呈現形式
3.3數據的來源
3.3.1第二手數據
3.3.2第一手數據
3.4數據的存儲
3.4.1大數據給存儲帶來的挑戰
3.4.2數據存儲的分類
3.4.3網絡存儲技術
3.4.3虛擬存儲
本章小結
第四章數據預處理
4.1數據清洗
4.1.1數據標準化處理
4.1.2缺失數據的處理
4.1.3離群值及重復數據的處理
4.2數據變換
4.2.1最小-優選規範化
4.2.2零-均值規範化
4.2.3小數定標規範化
4.2.4不一致數據的處理
4.3數據規約
4.3.1屬性規約
4.3.2數值規約
本章小結
第五章常用的數據分析方法
5.1描述性統計分析
5.1.1均值分析
5.1.2頻數分析
5.1.3百分比分析
5.1.4眾數和中位數
5.1.5交叉分析
5.1.6同比分析
5.1.7環比分析
5.1.8其他
5.2探索性數據分析
5.2.1相關分析
5.2.2回歸分析
5.2.3方差分析
5.2.4顯著性檢驗分析
5.2.5聚類分析
5.2.6主成分分析與因子分析
5.2.7對應分析
本章小結
第六章數據建模
6.1模型的形式化描述
6.2建模的基本過程
6.3建模的特征工程
6.3.1特征提取
6.3.2特征選擇
6.3.3降維
6.4建模的常用算法與選擇
6.4.1監督學習
6.4.2無監督學習
6.5模型的驗證與評估
6.5.1評估指標概述
6.5.2模型狀態評估
本章小結
第七章數據可視化呈現
7.1選擇合適的數據呈現方式
7.2數據如何演變為圖表
7.3常見圖表的制作與呈現
7.3.1如何創建一個完整的圖表
7.3.2Excel中的基本圖表創建
7.3.3柱形圖
7.3.4條形圖
7.3.5折線圖
7.3.6餅圖
7.3.7散點圖
7.3.8矩陣圖
7.3.9氣泡圖
7.3.10雷達圖
7.3.11箱型圖
7.3.12地圖熱力圖
本章小結
第八章數據分析報告的撰寫
8.1分析報告的寫作原則
8.1.1主題要突出
8.1.2結構要嚴謹
8.1.3觀點和材料要統一
8.1.4語言力求準確、簡潔、通俗易懂
8.2基於數據分析的推導過程
8.2.1第一步——感知問題
8.2.2第二步——提出假說
8.2.3第三步——選擇表征
8.2.4第四步——收集數據
8.2.5第五步——分析驗證
8.3結論邏輯可讀性
8.4報告圖表化
8.5數據分析報告範例
8.5.1引言
8.5.2背景及意義
8.5.3數據分析方法
8.5.4總結
本章小結
參考文獻
後記
公需科目的課程內容每年會有一定的調整。目前已經開發的公需科目教材有《知識產權基礎》《創新知識基礎》《項目管理基礎》《人工智能應用》。其中,前三本由上海社會科學院出版社出版,《人工智能應用》2019年5月由我社出版,至2020年9月銷量已達三四萬冊。今年,上海繼續工程教育協會擬開發課程“數據分析基礎”,為理工科類專業技術人員新增公需科目培訓課程,並開發《數據分析基礎》教材。開發專業技術人員公需科目繼續教育圖書,一能為框架協議相關工作的開展起個好頭,落實三服務方針,二能為上海分社增加新的圖書產品線,三能助力上海地區以及其他地區的專業技術人員繼續教育工作,豐富專業技術人員的知識面,四能使集團出版圖書緊跟時代熱點。