●第1章 導論
1.1 CART運用實例
1.2 統計問題
1.3 方法大綱
第2章 樹構建的實用指南
2.1 樹構建素
2.2 結點分裂
2.3 終端結點
2.4 軟件的下載和運用
第3章 邏輯斯諦回歸
3.1 邏輯斯諦回歸模型
3.2 邏輯斯諦回歸分析實例
第4章分類樹
4.1 結點不純度
4.2 終端結點的確定
4.2.1 誤分類成本
4.2.2 成本復雜度
4.2.3 嵌套很優子樹
4.3 的標準誤
4.4 基於樹的耶魯妊娠結果研究分析
4.5 替代剪枝方法
4.6 局部交叉驗證
4.7 基於樹的分析和邏輯斯諦回歸分析的比較
4.8 缺失數據
4.8.1 聯合缺失法
4.8.2 代理分裂
4.9 樹的穩定性
4.10 用於評判治療效果的樹
4.11 補充
第5章 基於樹的分析案例
5.1 流行病學中的風險因素分析
5.1.1 背景
5.1.2 分析
5.2 客戶信用評估
第6章 隨機森林與確定性森林
6.1 隨機森林介紹
6.2 最小的森林
6.3 重要性得分
6.3.1 基尼重要性
6.3.2 深度重要性
6.3.3 置換重要性
6.3.4 優選條件重要性
6.4 不確定性預測變量的隨機森林
6.5 加權特征選擇的隨機森林
6.6 確定性森林
6.7 交互作用說明
第7章 刪失數據的分析:例子
7.1 介紹
7.2 基於樹的西部協作組研究數據分析
第8章 刪失數據的翁析:概念和經典方法
8.1 生存分析的基礎
8.1 .Kaplan-Meier曲線
8.1.2 Log-Rank檢驗
8.2 刪失數據的參數回歸
8.2.1 刪失數據的線性回歸
8.2.2 Cox比例風險回歸
8.2.3 西部協作組研究數據的重分析
第9章 刪失數據的分析:生存樹和隨機森林
9.1 分裂準則
+9.1.1 Gordon和Olshen法則
9.1.2 差別優選化
9.1.3 似然函數的使用
9.1.4 直接推廣
9.2 剪枝生存樹
9.3 隨機生存森林
9.4 實現
9.5 西部協作組研究數據的生存樹分析
9.6 生物標志物對於老年死亡率的組合預測
第10章 連續響應變量的回歸樹和自適應性樣條
10.1 樣條模型的樹表示以及新生兒體重的分析
10.2 回歸樹
10.3 MARS模型簡介
10.4 修正的MARS前向算法
10.5 MARS後向刪除算法
10.6 很優結點
10.7 結點的
10.7.1 最小跨度
10.7.2 極大相關繫
10.7.3 對MARS前向算法的修正
10.8 光滑自適應性樣條
10.8.1 平滑化線性截斷基函數
10.8.2 三次基函數
10.9 數值例子
第11章 縱向數據分析
11.1 嬰兒生長曲線
11.2 通用模型及符號定義
11.3 混合效應模型
11.4 半參數模型
11.5 自適應樣條模型
11.5.1 已知協方差結構
11.5.2 未知協方差結構
11.5.3 模擬實例
11.5.4 兩個公開數據集的再分析
11.5.5 嬰兒生長曲線分析
11.5.6 評論
1l.6 回歸樹在縱向數據中的應用
1l.6 .l案例:舊金山的艾滋病毒
第12章離散響應分析
12.1 參數方法:二分響應
12.1.1 對數線性模型
12.1.2 邊際模型
12.1.3 參數估計
12.1.4 脆弱性模型
12.2 分類樹:多維二分響應
12.2.1 結點內同質性
12.2.2 終端結點
12.2.3 計算問題
12.2.4 參數解釋
12.3 應用:BROCS數據的分析
12.3.1 背景
12.3.2 樹的構建
12.3.3 數值結果說明
12.3.4 備選方法
12.3.5 預測效果
12.4 有序縱向響應
12.5 BROCS數據集分析:對數線性模型
第13章 附錄
13.1 自動運行RTREE的代碼腳本
13.2 手動運行RTREE的代碼腳本
13.3 .inf文件
參考文獻
索引
許多重要結果(包括疾病、死亡以及金融信貸)的發生往往有多種復雜的途徑。我們一直缺乏有效刻畫這些途徑及其非線性和交互特性的方法。本書重點介紹遞歸劃分策略,以期解決上述難題。本書為第二版,它的一大亮點是涵蓋許多重要實例,大多數實例來自流行病學、生物信息學、分子遺傳學、生理學、社會人口學、銀行和市場營銷領域。作者深入淺出地闡述重要概念和計算方面的統計問題,並認真討論現實或科學問題的背景,提供一繫列實質性的獨特見解。除了強調樹方法的基本遞歸劃分策略,本書還從預測和解釋的角度為森林方法提供了全新的材料。如何判斷各種因素對結果的影響,是統計分析的一個核心問題。通過遺傳學和流行病學的例子,作者介紹了隨機和確定性森林的生成方法,從而回答了統計分析的核心問題。確定性森林比隨機森林的構造更容易重復,從而更易於解釋。本書還增加了對生存森林和治療效果有效性評估問題的分析。