作 者:[奧地利]托馬斯·哈斯爾萬特(Thomas Haslwanter) 著 李銳 譯
定 價:79
出 版 社:人民郵電出版社
出版日期:2018年12月01日
頁 數:224
裝 幀:平裝
ISBN:9787115493842
近年來Python生態繫統不斷完善,Python這門語言已經成為科學計算的流行語言,它為統計數據分析提供了強大的操作環境。本書主要介紹了Python在統計數據分析中的應用,內容涵蓋連續、離散和分類數據的常見統計檢驗,以及線性回歸分析、生存分析和貝葉斯統計等主題。本書的特色:針對每種檢驗方法,提供了Python解決方案的代碼和數據,以及便於實際操作的Python示例。借此,讀者可以重現這些問題並加強他們對這些統計分析方法的理解。本書所用數據主要來自生命科學和醫學科學,因此對這些領域等
●第 一部分 Python和統計學第 1章 為什麼學習統計學 2第 2章 Python 42.1 開始 42.1.1 慣例 42.1.2 發行版和包 52.1.3 安裝Python 72.1.4 安裝R和rpy2 82.1.5 個性化IPython/Jupyter 92.1.6 Python資源 122.1.7 第 一個Python程序 132.2 Python數據結構 142.2.1 Python數據類型 142.2.2 索引和切片 162.2.3 向量和數組 172.3 IPython/Jupyter:一個交互式的Python編程環境 182.3.1 Qt控制臺的第 一個會話 192.3.2 Notebook和rpy2 212.3.3 IPython小貼士 232.4 開發Python程序 242.4.1 將交互式命令轉化為一個Python程序 242.4.2 函數、模塊和包 262.4.3 Python小貼士 302.4.4 代碼版本控制 312.5 Pandas:用於統計學的數據結構 312.5.1 數據處理 312.5.2 分組(Grouping) 332.6 Statsmodels:統計建模的工具 342.7 Seaborn:數據可視化 352.8 一般慣例 362.9 練習 36第3章 數據輸入 383.1 從文本文件中輸入 383.1.1 目視檢查 383.1.2 讀入ASCII數據到Python中 383.2 從MS Excel中導入 423.3 從其他格式導入數據 43第4章 統計數據的展示 454.1 數據類型 454.1.1 分類數據 454.1.2 數值型 464.2 在Python中作圖 464.2.1 函數式和面向對像式的繪圖方法 474.2.2 交互式繪圖 484.3 展示統計學數據集 524.3.1 單變量數據 534.3.2 &nbs變變量繪圖 594.4 練習 61第二部分 分布和假設檢驗第5章 背景 635.1 總體和樣本 635.2 概率分布 645.2.1 離散分布 645.2.2 連續分布 655.2.3 期望值和方差 655.3 自由度 665.4 研究設計 665.4.1 術語 675.4.2 概述 675.4.3 研究類型 685.4.4 實驗設計 695.4.5 個人建議 725.4.6 臨床研究計劃 73第6章 單變量的分布 746.1 分布的特征描述 746.1.1 分布中心 746.1.2 量化變異度 766.1.3 分布形狀的參數描述 796.1.4 概率密度的重要展示 816.2 離散分布 826.2.1 伯努利分布 826.2.2 二項分布 836.2.3 泊松分布 856.3 正態分布 866.3.1 正態分布的例子 886.3.2 中心極限定理 886.3.3 分布和假設檢驗 896.4 來自正態分布的連續型分布 906.4.1 t分布 906.4.2 卡方分布 926.4.3 F分布 946.5 其他連續型分布 956.5.1 對數正態分布 966.5.2 韋伯分布 966.5.3 指數分布 976.5.4 均勻分布 986.6 練習 98第7章 假設檢驗 1007.1 典型分析步驟 1007.1.1 數據篩選和離群值 1007.1.2 正態性檢驗 1017.1.3 轉換 1047.2 假設概念、錯誤、p值和樣本量 1047.2.1 一個例子 1047.2.2 推廣和應用 1057.2.3 p值的解釋 1067.2.4 錯誤的類型 1077.2.5 樣本量 1087.3 靈敏度和特異度 1107.4 受試者操作特征(ROC)曲線 113第8章 數值型數據的均值檢驗 1148.1 樣本均值的分布 1148.1.1 單樣本均值的t檢驗 1148.1.2 Wilcoxon符號秩和檢驗 1168.2 兩組之間的比較 1178.2.1 配對t檢驗 1178.2.2 獨立組別之間的t檢驗 1188.2.3 兩組之間的非參數比較:Mann-Whitney檢驗 1188.2.4 統計學假設檢驗與統計學建模 1188.3 多組比較 1208.3.1 方差分析(ANOVA) 1208.3.2 多重比較 1238.3.3 Kruskal–Wallis檢驗 1258.3.4 兩因素方差分析 1268.3.5 三因素方差分析 1268.4 總結:選擇正確的檢驗方法進行組間比較 1278.4.1 典型的檢驗 1278.4.2 假設的例子 1288.5 練習 129第9章 分類數據的檢驗 1319.1 單個率 1319.1.1 置信區間 1319.1.2 解釋 1329.1.3 例子 1329.2 頻數表 1339.2.1 單因素卡方檢驗 1339.2.2 卡方列聯表檢驗 1349.2.3 Fisher準確檢驗 1369.2.4 McNemar檢驗 1399.2.5 Cochran's Q檢驗 1409.3 練習 141第 10章 生存時間分析 14410.1 生存分布 14410.2 生存概率 14510.2.1 刪失 14510.2.2 Kaplan–Meier生存曲線 14610.3 在兩組間比較生存曲線 148第三部分 統計建模第 11章 線性回歸模型 15011.1 線性相關 15011.1.1 相關繫數 15011.1.2 秩相關 15111.2 一般線性回歸模型 15211.2.1 例子1:簡單線性回歸 15311.2.2 例子2:二次方擬合 15311.2.3 決定繫數 15411.3 Patsy:公式的語言 15511.4 用Python進行線性回歸分析 15811.4.1 例子1:擬合帶置信區間的直線 15811.4.2 例子2:嘈雜的二次多項式 15911.5 線性回歸模型的結果 16211.5.1 例子:英國的和酒精 16211.5.2 帶有截距的回歸的定義 16511.5.3 R2值 16511.5.4 調整後的R2值 16511.5.5 模型的繫數和它們的解釋 16811.5.6 殘差分析 17111.5.7 異常值 17411.5.8 用Sklearn進行回歸 17511.5.9 結論 17611.6 線性回歸模型的假設 17711.7 線性回歸模型結果的解釋 18011.8 Bootstrapping 18011.9 練習 181第 12章 &nbs數據分析 18212.1 可相關 18212.1.1 散點圖矩陣 18212.1.2 相關性矩陣 18212.2 多重線性回歸 184第 13章 離散數據的檢驗 18513.1 等級資料的組間比較 18513.2 Logistic回歸 18613.3 廣義線性模型 18813.3.1 指數族分布 18913.3.2 線性預測器和連接函數 18913.4 有序Logistic回歸 18913.4.1 問題定義 18913.4.2 優化 19113.4.3 代碼 19113.4.4 性能 191第 14章 貝葉斯統計學 19314.1 貝葉斯學派與頻率學派的解釋 19314.2 計算機時代的貝葉斯方法 19514.3 例子:用馬爾可夫鏈蒙特卡洛模擬分析挑戰者號災難 19514.4 總結 198參考答案 199術語表 219參考文獻 223
本書以基礎的統計學知識和假設檢驗為重點,簡明扼要地講述了Python在數據分析、可視化和統計建模中的應用。主要包括Python的簡單介紹、研究設計、數據管理、概率分布、不同數據類型的假設檢驗、廣義線性模型、生存分析和貝葉斯統計學等從入門到高級的內容。本書利用Python這門開源語言,不僅在直觀上對數據分析和統計檢驗提供了很好的理解,而且在相關數學公式的講解上也能夠做到深入淺出。本書的可操作性很強,配套提供相關的代碼和數據,讀者可以依照書中所講,復現和加深對相關知識的理解。本書適合對統計學和Python有興趣的讀者,特別是在實驗學科中需要利用Python的強大功能來進行數據處理和統計分析的學生和研究人員。
[奧地利]托馬斯·哈斯爾萬特(Thomas Haslwanter) 著 李銳 譯
作者簡介托馬斯·哈斯爾萬特(Thomas Haslwanter)在學術機構中有超過10年的教學經驗,是林茨上奧地利州應用科學大學(University of Applied Sciences Upper Austria in Linz)醫學工程繫的教授,瑞士蘇黎世聯邦理工學院講師,並曾在澳大利亞悉尼大學和德國圖賓根大學擔任過研究員。他在醫學研究方面經驗豐富,專注於眩暈癥的診斷、治療和康復。在深入使用Matlab十五年後,他發現Python非常強大,並將其用於統計數據分析、聲音和圖像處理以及生物仿真應用。譯者簡介李銳,復旦大學公共衛生學院流行病與生物統計專業博士生,Python、等