●第1章導論
1.1數據挖掘的起源
1.2數據挖掘的定義
1.3數據挖掘的應用領域
1.4數據挖掘的過程
1.4.1CRISP-DM模型
1.4.2SEMMA模型
1.5數據挖掘的任務
1.6數據挖掘工具和共享資源
1.6.1數據挖掘軟件
1.6.2數據挖掘共享數據集
1.6.3共享的數據挖掘算法軟件包
1.7數據挖掘發展趨勢
1.8本章小結
習題
第2章數據、統計特征及數據預處理
2.1數據與數據類型
2.1.1數據集的特性
2.1.2數據集類型
2.2數據統計特征
2.2.1頻率和眾數
2.2.2百分位數
2.2.3位置度量:均值和中位數
2.2.4離散度量:極差和方差
2.2彙總統計
2.3數據預處理
2.3.1數據清理
2.3.2數據集成
2.3.3數據變換
2.3.4數據歸約
2.3.5離散化和概念分層
2.4距離和相似性度量
2.4.1對像之間的距離
2.4.2數據集之間的距離
2.4.3相似性度量
2.5本章小結
習題
第3章數據倉庫及聯機分析處理
3.1數據倉庫概念
3.1.1數據倉庫定義及關鍵特征
3.1.2數據倉庫與傳統數據庫繫統的區別
3.1.3數據倉庫的體繫結構
3.1.4幾種數據倉庫模型
3.數據庫
3.2數據倉庫建模
3.2.1數據立方體
3.2.2多維數據模型的模式
3.3數據倉庫設計與實現
3.3.1設計視圖
3.3.2設計方法
3.4本章小結
習題
第4章回歸分析
4.1線性回歸分析
4.1線性回歸分析
4.1線性回歸分析
4.2非線性回歸分析
4.3邏輯回歸分析
4.4本章小結
習題
第5章數據分類與預測
5.1分類定義
5.2分類挖掘一般過程
5.3決策樹分類法
5.3.1決策樹概念
5.3.2經典決策樹分類方法
5.3.3ID3算法
5.3.4C4.5算法
5.3.5C5.0算法
5.3.6CART算法
5.3.7決策樹分類算法評估
5.3.8案例分析:決策樹算法應用於電信客戶流失分析
5.4貝葉斯分類方法
5.4.1貝葉斯算法基本原理
5.4.2樸素貝葉斯分類方法
5.5k-近鄰分類方法
5.5.1k-近鄰算法描述
5.5.2k-近鄰算法的優缺點
5.5.3案例分析:乘坐式割草機分類銷售
5.6人工神經網絡分類方法
5.6.概念
5.6.2神經網絡模型
5.6.3神經網絡的應用
5.7利用BP神經網絡預測岩溶塌陷
5.7.1確定BP神經網絡拓撲結構
5.7.2提取原始數據
5.7.3數據預處理
5.7.4建立岩溶塌陷預測的BP神經網絡挖掘模型
5.7.5岩溶塌陷預測
5.8本章小結
習題
第6章關聯分析
6.1相關概念
6屬性的關聯規則挖掘
6.2.1Apriori算法及效率分析
6.2.2CARMA算法
6.2.3兩種算法的比較分析
6.屬性的關聯規則挖掘
6.4關聯規則的合並
6.5關聯規則的優化
6.5.1支持度與可信度的局限
6.5.2興趣度的引入
6.5.3提升度的引入
6.6洗浴時間與學習成績的關聯分析
……