●前言
第1章 引言 1
1.1 統計學在天文學中的位置 1
1.2 天文研究中統計決策的流程 2
1.3 關於本書和主要參考書目 3
參考文獻 4
第2章 概率論基礎 6
2.1 觀測科學的不確定性 6
2.2 隨機事件與樣本空間 6
2.3 事件之間的相互關繫及運算 7
2.4 概率的一般定義與性質 8
2.5 條件概率及與之有關的三個公式 10
2.6 相互獨立的事件 12
2.7 隨機變量的分布函數 12
2.8 離散分布和連續分布 13
2.9 分位數函數 20
2.10 隨機變量的數字特征 20
2.11 隨機變量的函數的分布 23
2.12 多維隨機變量及其分布 25
2.13 隨機變量的獨立性和條件分布 26
2.14 多維隨機變量的數字特征 28
2.15 多維隨機變量函數的分布 30
2.16 大數定理和中心極限定理 32
第3章 概率分布函數 35
3.1 多項分布族 35
3.2 泊松分布 36
3.2.1 泊松分布的天文背景 36
3.2.2 泊松分布的數學性質 38
3.2.3 泊松過程 39
3.3 正態分布和對數正態分布 44
3.3.正態分布 44
3.3.正態分布族 45
3.4 帕累托分布及其推廣 47
3.4.1 帕累托分布 47
3.4.2 帕累托分布的推廣 48
3.5 伽馬分布族 49
3.6 貝塔分布族 51
3.7 Z 分布族 51
3.8 t分布族 52
3.8.1 一維連續型隨機變量的分布密度圖 54
3.8.2 一維連續型隨機變量的累積分布圖 56
3.8.3 二維連續型隨機變量的分布圖 58
參考文獻 61
第4章 數理統計基礎和描述統計 62
4.1 基本概念 62
4.1.1 總體和樣本 62
4.1.2 統計量和樣本的數字特征 63
4.1.3 樣本數字特征的分布 64
4.2 抽樣定理 67
4.3 描述統計 71
4.3.1 MATLAB中的數字特征函數 71
4.3.2 統計圖 74
4.4 核密度估計 77
4.4.1 核密度函數 77
4.4.2 帶寬的選取 79
4.4.3 多維核密度估計 80
4.4.4 核密度估計的MATLAB實現 81
參考文獻 90
第5章 參數估計 91
5.1 統計推斷的天文學背景 91
5.2 點估計原則 91
5.3 點估計技術 92
5.3.1 矩法 92
5.3.2 最小二乘法 93
5.3.3 優選似然法 94
5.3.4 計算優選似然估計的EM算法 97
5.3.5 估計量好壞標準 100
5.4 誤差理論 102
5.4.1 線性函數的誤差傳播 103
5.4.2 誤差傳播公式 104
5.5 置信區間 105
5.5.1 置信區間和顯著水平 105
5.5.2 正態總體的期望值和方差的置信區間 106
5.5.3 大樣本單參數的置信區間估計 109
5.5.4 求置信區間的一般方法 110
5.5.5 多個參數的置信區間 112
5.6 用MATLAB求點估計和置信區間 114
參考文獻 117
第6章 假設檢驗 118
6.1 假設檢驗的基本思想 118
6.2 雙側檢驗和單側檢驗 119
6.3 兩類風險 120
6.4 正態總體的參數檢驗 121
6.4.1 單正態總體檢驗 121
6.4.2 成數檢驗 121
6.4.3 兩正態總體參數的檢驗 122
6.5 假設檢驗中的P值檢驗方法 123
6.6 擬合性檢驗 124
6.6.1 皮爾遜卡方檢驗 124
6.6.2 科爾莫戈羅夫-斯米爾諾夫檢驗 126
6.6.3 克拉默-馮 麥斯型統計量 127
6.6.4 斯米爾諾夫雙樣本檢驗 133
6.6.5 k樣本安德森-達林檢驗 135
6.7 遊程數R檢驗 136
6.8 符號檢驗 137
6.9 似然比檢驗 139
6.10 獨立性檢驗 140
6.11 樣本相關繫數的檢驗 141
6.11.1 經典相關性檢驗 142
6.11.2 貝葉斯相關檢驗 145
6.11.3 等級相關繫數 146
6.11.4 置換檢驗 149
6.12 假設檢驗的MATLAB實現 149
6.12.1 正態分布的假設檢驗 149
6.12.2 遊程數檢驗 152
6.12.3 擬合優度檢驗 154
6.12.4 符號檢驗 156
6.12.5 列聯表的獨立性檢驗 157
參考文獻 158
第7章 貝葉斯統計 160
7.1 先驗分布與後驗分布 160
7.1.1 三種信息 160
7.1.2 貝葉斯公式 160
7.2 先驗分布的確定 163
7.2.1 基於經驗的先驗分布 163
7.2.2 利用邊緣分布確定先驗分布 164
7.2.3 共軛先驗分布 165
7.2.4 無信息先驗分布 166
7.2.5 優選熵方法確定先驗分布 167
7.3 貝葉斯推斷 168
7.3.1 貝葉斯點估計及其誤差估計 168
7.3.2 可信區域 169
7.4 貝葉斯模型的選擇 173
7.4.1 貝葉斯後驗比 173
7.4.2 貝葉斯證據及其計算 173
7.4.3 貝葉斯因子 175
7.4.4 貝葉斯信息準則 175
7.5 P值檢驗和貝葉斯因子檢驗的比對 178
7.6 貝葉斯計算 179
參考文獻 184
第8章 蒙特卡羅方法簡介 185
8.1 隨機數的產生 185
8.1.1 基於(0,1)均勻分布的隨機數 185
8.1.2 基於極限定理產生的隨機數 186
8.1.3 舍選法 187
8.1.4 較復雜的抽樣 190
8.1.5 隨機向量的抽樣方法 192
8.2 減少方差的抽樣技巧 193
8.2.1 一個積分的例子 193
8.2.2 MC方法的誤差 196
8.2.3 重要抽樣 196
8.2.4 控制變量法 198
8.2.5 分層抽樣 199
8.3 重采樣方法 199
8.3.1 自舉法 200
8.3.2 刀切法 205
8.4 實驗模擬的實例 209
8.4.1 李-馬公式的檢驗 209
8.4.2 平滑處理對相關繫數臨界值的影響 212
8.4.3 擬合參數誤差的MC估計 215
8.4.4 根據視向速度差的分布確定雙星樣本的比例 216
參考文獻 220
第9章 回歸分析 221
9.線性回歸分析 221
9.1.1 基本問題 221
9.1.2 回歸模型 222
9.1.3 參數估計 223
9.1.4 線性模型的顯著性檢驗 226
9.線性回歸 229
9.2.1 回歸模型 230
9.2.2 參數估計 231
9.2.3 偏差平方和分解 232
9.2.4 回歸方程和回歸繫數的假設檢驗 233
9.2.5 非嵌套模型的戴維森-麥金農J檢驗 234
9.2.6 回歸診斷 236
9.3 回歸分析的MATLAB函數 237
9.3.1 線性回歸函數 237
9.3.2 多項式擬合交互式工具 239
9.3.3 非線性回歸函數 241
9.3.4 逐步回歸 244
參考文獻 249
第10分析方法 250
10.1 聚類分析 250
10.1.1 問題的提出 250
10.1.2 距離和相似繫數 251
10.1.3 數據的類型及其標準化 252
10.1.4 繫統聚類法 254
10.1.5 動態聚類法 258
10.2 主成分分析 263
10.2.1 總體的主成分 264
10.2.2 主成分的性質 266
10.2.3 樣本的主成分 268
10.2.4 樣本主成分分析的MATLAB實現 272
10.3 判別分析 276
10.3.1 距離最小判別準則 276
10.3.2 貝葉斯判別 279
10.3.3 費希爾判別準則 282
10.3.4 判別效果的檢驗和判別準則的評價 284
10.3.5 判別分析的MATLAB實現 285
參考文獻 289