●第1章數據科學概論
1.1數據和大數據
1.1.1數據
1.1.2數據化進程
1.1.3大數據
1.2數據科學理論基礎
1.2.1數據科學發展歷程
1.2.2數據科學的概念
1.2.3數據科學的主要內容
1.3數據科學應用實踐
1.3.1數據科學家
1.3.2數據科學工作流程
1.3.3數據科學實踐案例
1.4小結
1.4.1本章總結
1.4.2擴展閱讀材料
1.5習題
1.6參考資料
第2章數學基礎
2.1線性代數
2.1.1向量
2.1.2矩陣
2.1.3矩陣導數
2.1.4實例:利用SVD進行評分預測
2.2概率統計
2.2.1隨機事件與概率
2.2.2條件概率與事件獨立性
2.2.3隨機變量及其數字特征
2.2.4數理統計
2.2.5信息論
2.2.6實例:利用樸素貝葉斯算法進行文本分類
2.3優化理論
2.3.1基本概念
2.3.2優化問題的一般形式
2.3.3優化方法
2.3.4實例:SVM分類器
2.4圖論基礎
2.4.1圖的定義
2.4.2圖的概念
2.4.3圖的矩陣表示
2.4.4拉普拉斯矩陣與譜
2.4.5實例:譜聚類算法
2.5小結
2.5.1本章總結
2.5.2擴展閱讀材料
2.6習題
2.7參考資料
第3章Python語言初步
3.1Python語言概述
3.1.1Python語言簡介
3.1.2Python語言環境搭建
3.2Python的基本用法
3.2.1組
3.2.2字符串
3.2.3字典
3.2.4條件與循環語句
3.2.5函數
3.2.6文件
3.2.7綜合實例
3.3重要庫的使用方法與案例
3.3.1NumPy
3.3.2Pandas
3.3.3SciPy
3.3.4Matplotlib
……
第4章數據預處理
第5章分析方法初步
第6章數據科學實踐
第7章數據科學的重要研究領域
第8章大數據處理技術簡介
本書主要介紹數據科學的通識入門知識,可以作為高等院校數據科學與大數據專業的專業基礎課程教材。該書以“建立知識體繫、掌握基本原理、學會初級實踐、了解前沿技術”為原則,為數據科學與大數據及相關專業的學生深入學習數據科學和大數據技術奠定基礎。該書繫統講授數據科學的基本概念和知識體繫、數據分析的基本流程和方法(包括數據預處理、回歸、聚類、分類等智能分析技術)、大數據分析的基本T具,並以Python語言為例,通過大量實例和練習講授初級的數據分析技術。該書通過繫統全面的理論介紹與豐富翔實的程序實踐相結合,幫助數據科學與大數據及相關專業的學生樹立大數據意識,學習數據科學的知識體繫,掌握基本的數據處理方法。本書適合作為數據科學與大數據及相關專業學生的教材,也可作為大數據開發工程師的參考書。