●前言
●章引言
●1.1作為科學的統計
●1.1.1統計是科學
●1.1.2模型驅動的歷史及數據驅動的未來
●1.1.3數據中的信息是由觀測值數目及相關變量的數目決定的
●1.2傳統參數模型和機器學習算法模型
●1.2.1參數模型比算法模型容易解釋是偽命題
●1.2.2參數模型的競爭模型的對立性和機器學習不同模型的協和性
●1.2.3評價和對比模型
●1.3國內統計教學及課本的若干誤區
●1.3.1假設檢驗的誤區:不能拒絕就接受?
●1.3.2p值的誤區
●1.3.3置信區間的誤區
●1.3.4樣本量是多少纔算大樣本?
●1.3.5用31個省市自治區數據能做什麼?
●1.3.6彙總數據(比如部分均值)和原始觀測值的區別
●1.4R軟件入門
●1.4.1簡介
●1.4.2安裝和運行小貼士......
內容簡介
本書包括的內容有:經典線性回歸、廣義線性模型、縱向數據(分層模型),機器學習回歸方法(決策樹、bagging、隨機森林、mboost、人工神經網絡、支持向量機、k很近鄰方法)、生存分析及Cox模型、經典判別分析與logistic回歸分類、機器學習分類方法(決策樹、bagging、隨機森林、adaboost、人工神經網絡、支持向量機、k很近鄰方法)。其中,縱向數據(分層模型)及生存分析及Cox模型的內容可根據需要選用,所有其他的內容都應該在教學中涉及,可以簡化甚至忽略的內容為一些數學推導和某些不那麼很好的模型,不可以忽略的是各種方法的直觀意義及理念