●第1章 緒論
1.1 日益增長的數據
1.1.1 大數據的基本概念
1.1.2 大數據的基本特征
1.1.3 大數據的發展歷程
1.2 人工智能初窺
1.2.1 人工智能的歷史
1.2.2 人工智能的發展現狀
1.2.3 人工智能的發展前景
1.2.4 大數據與人工智能
第2章 數據工程
2.1 數據工程的一般流程
2.2 數據獲取
2.2.1 數據采集方法
2.2.2 大數據采集平臺
2.3 數據存儲與數據倉庫
2.3.1 數據存儲
2.3.2 數據倉庫
2.4 數據預處理
2.4.1 數據清理
2.4.2 數據集成
2.4.3 數據變換
第3章 機器學習算法
3.1 算法概述
3.1.1 線性回歸
3.1.2 邏輯回歸
3.1.3 線性判別分析
3.1.4 分類與回歸樹分析
3.1.5 樸素貝葉斯
3.1.6 k最近鄰算法
3.1.7 學習矢量量化
3.1.8 支持向量機
3.1.9 Bagging和隨機森林
3.1.10 Boosting和AdaBoost
3.2 支持向量機算法
3.2.1 線性支持向量機
3.2.2 非線性支持向量機
3.2.3 支持向量機算法求解
3.3 邏輯回歸算法
3.3.1 線性回歸算法
3.3.2 邏輯回歸
3.3.3 用PyTorch實現邏輯回歸算法
3.4 聚類算法
3.4.1 K-Means聚類
3.4.2 均值漂移聚類
3.4.3 基於密度的聚類方法
3.5 機器學習算法總結
3.5.1 邏輯回歸和樸素貝葉斯
3.5.2 邏輯回歸和支持向量機
3.5.3 Bagging、隨機森林和Boosting
第4章 深度學習
4.1 神經網絡基礎知識
4.1.1 深度神經網絡
4.1.2 正向傳播
4.1.3 激活函數
4.2 神經網絡的訓練
4.2.1 神經網絡的參數
4.2.2 向量化
4.2.3 價值函數
4.2.4 梯度下降和反向傳播
4.3 神經網絡的優化和改進
4.3.1 神經網絡的優化策略
4.3.2 交叉驗證
4.3.3 正則化方法
4.4 卷積神經網絡
4.4.1 卷積運算
4.4.2 池化層
4.4.3 CNN實例
……
第5章 大數據存儲
第6章 Hadoop MapReduce解析
第7章 Spark解析
第8章 分布式數據挖掘算法
第9章 PyTorch解析
第10章 案例:Hadoop平臺的搭建和數據分析
第11章 案例:基於Spark的搜索引擎日志用戶行為分析
第12章 案例:使用Spark實現數據統計分析及性能優化
第13章 案例:使用Spark和HBase實現商品批量存儲
第14章 案例:使用Keras進行人臉關鍵點檢測
第15章 案例:使用PyTorch實現基於詞級別的情感分析
第16章 案例:短語視覺定位
第17章 案例:使用PyTorch進行視覺問答
第18章 案例:使用Hadoop和MapReduce分布式計算語料中單詞出現的頻數
第19章 案例:使用多種機器學習算法實現基於用戶行為數據的用戶分類器
第20章 案例:構建蘋果葉病病害分類模型
附錄A 用戶歷史充值情況數據表
附錄B 用戶各類訂單餘額情況
附錄C 各省用戶收到公示消息後的充值情況
參考文獻