作 者:(加)卡梅隆 戴維森-皮隆 著 辛願,鐘黎,歐陽婷 譯
定 價:89
出 版 社:人民郵電出版社
出版日期:2017年01月01日
頁 數:232
裝 幀:平裝
ISBN:9787115438805
·國際傑出機器學習專家、地平線機器人技術創始人和CEO、前百度研究院執行院長餘凱博士,騰訊專家研究員嶽亞丁博士推薦、審校·內容涉及Python語言庫PyMC,以及相關的工具,包括NumPy\\SciPy\\Matplotlib,無需復雜的數學分析,通過實例、從編程的角度介紹貝葉斯分析方法,大多數程序員都可以入門並掌握。本書的內容特色:·學習貝葉斯思維方式·理解計算機如何進行貝葉斯推斷·利用PyMC Python庫進行編程來實現貝葉斯分析·利用PyMC建模以及調試·測試模型的擬合優度等
●第1章貝葉斯推斷的哲學1
1.1引言1
1.1.1貝葉斯思維1
1.1.2貝葉斯推斷在實踐中的運用3
1.1.3頻率派的模型是錯誤的嗎?4
1.1.4關於大數據4
1.2我們的貝葉斯框架5
1.2.1不得不講的實例:拋硬幣5
1.2.2實例:圖書管理員還是農民6
1.3概率分布8
1.3.1離散情況9
1.3.2連續情況10
1.3.3什麼是12
1.4使用計算機執行貝葉斯推斷12
1.4.1實例:從短信數據推斷行為12
1.4.2介紹我們的第一板斧:PyMC14
1.4.3說明18
1.4.4後驗樣本到底有什麼用?18
1.5結論20
1.6補充說明20
1.6.1從統計學上確定兩個l值是否真的不一樣20
1.6.2擴充到兩個轉折點22
1.7習題24
1.8答案24
第2章進一步了解PyMC27
2.1引言27
2.1.1父變量與子變量的關繫27
2.1.2PyMC變量28
2.1.3在模型中加入觀測值31
2.1.4最後……33
2.2建模方法33
2.2.1同樣的故事,不同的結局35
2.2.2實例:貝葉斯A/B測試38
2.2.3一個簡單的場景38
2.2.4A和B一起41
2.2.5實例:一種人類謊言的算法45
2.2.6二項分布45
2.2.7實例:學生作弊46
2.2.8另一種PyMC模型50
2.2.9更多的PyMC技巧51
2.2.10實例:挑戰者號事故52
2.2.11正態分布55
2.2.12挑戰者號事故當天發生了什麼?61
2.3我們的模型適用嗎?61
2.4結論68
2.5補充說明68
2.6習題69
2.7答案69
第3章打開MCMC的黑盒子71
3.1貝葉斯景像圖71
3.1.1使用MCMC來探索景像圖77
3.1.2MCMC算法的實現78
3.1.3後驗的其他近似解法79
3.1.4實例:使用混合模型進行無監督聚類79
3.1.5不要混淆不同的後驗樣本88
3.1.6使用MAP來改進收斂性91
3.2收斂的判斷92
3.2.1自相關92
3.2.2稀釋95
3.2.3pymc.Matplot.plot()97
3.3MCMC的一些秘訣98
3.3.1聰明的初始值98
3.3.2先驗99
3.3.3統計計算的無名定理99
3.4結論99
第4章從未言明的偉大定理101
4.1引言101
4.2大數定律101
4.2.1直覺101
4.2.2實例:泊松隨機變量的收斂102
4.2.3如何計算Var(Z)106
4.2.4期望和概率106
4.2.5所有這些與貝葉斯統計有什麼關繫呢107
4.3小數據的無序性107
4.3.1實例:地理數據聚合107
4.3.2實例:Kaggle的美國人口普查反饋比例預測比賽109
4.3.3實例:如何對Reddit網站上的評論進行排序111
4.3.4排序!115
4.3.5但是這樣做的實時性太差了117
4.3.6推廣到評星繫統122
4.4結論122
4.5補充說明122
4.6習題123
4.7答案124
第5章失去一隻手臂還是一條腿127
5.1引言127
5.2損失函數127
5.2.1現實世界中的損失函數129
5.2.2實例:優化“價格競猜”遊戲的展品出價130
5.3機器學習中的貝葉斯方法138
5.3.1實例:金融預測139
5.3.2實例:Kaggle觀測暗世界大賽144
5.3.3數據145
5.3.4先驗146
5.3.5訓練和PyMC實現147
5.4結論156
第6章弄清楚先驗157
6.1引言157
6.2主觀與客觀先驗157
6.2.1客觀先驗157
6.2.2主觀先驗158
6.2.3決策,決策……159
6.2.4經驗貝葉斯160
6.3需要知道的有用的先驗161
6.3.1Gamma分布161
6.3.2威沙特分布162
6.3.3Beta分布163
6.4實例:貝葉斯多臂老虎機164
6.4.1應用165
6.4.2一個解決方案165
6.4.3好壞衡量標準169
6.4.4擴展算法173
6.5從領域專家處獲得先驗分布176
6.5.1試驗輪盤賭法176
6.5.2實例:股票收益177
6.5.3對於威沙特分布的專業提示184
6.6共軛先驗185
6.7傑弗裡斯先驗185
6.8當N增加時對先驗的影響187
6.9結論189
6.10補充說明190
6.10.1帶懲罰的線性回歸的貝葉斯視角190
6.10.2選擇退化的先驗192
第7章貝葉斯A/B測試195
7.1引言195
7.2轉化率測試的簡單重述195
7.3增加一個線性損失函數198
7.3.1收入期望的分析198
7.3.2延伸到A/B測試202
7.4超越轉化率:t檢驗204
7.4.1t檢驗的設定204
7.5增幅的估計207
7.5.1創建點估計210
7.6結論211
術語表213
本書基於PyMC語言以及一繫列常用的Python數據分析框架,如NumPy、SciPy和Matplotlib,通過概率編程的方式,講解了貝葉斯推斷的原理和實現方法。該方法常常可以在避免引入大量數學分析的前提下,有效地解決問題。書中使用的案例往往是工作中遇到的實際問題,有趣並且實用。作者的闡述也盡量避免冗長的數學分析,而讓讀者可以動手解決一個個的具體問題。通過對本書的學習,讀者可以對貝葉斯思維、概率編程有較為深入的了解,為將來從事機器學習、數據分析相關的工作打下基礎。本書適用於機器學習、貝葉斯推斷、概率編程等相關領域的從業者和愛好者,也適合普通開發人員了解貝葉斯統計而使用。
(加)卡梅隆 戴維森-皮隆 著 辛願,鐘黎,歐陽婷 譯
卡梅隆戴維森-皮隆,接觸過數學在多個領域的應用——從基因和疾病的動態演化,到金融價格的隨機模型。他對於開源社區主要的貢獻包括這本書以及lifelines項目。Cameron成長於加拿大的安大略省圭爾夫市,而就讀於滑鐵盧大學以及莫斯科獨立大學。如今他住在安大略省渥太華市,並在電商領軍者Shopify工作。