統計學主要是用來研究如何有效地收集、處理和分析實際數據的一門學科,統計學的本質在於挖掘原始數據中的潛在信息,通過有效且有針對性的統計分析與推斷,為解決實際問題提供具有參考價值的建議。在2011年以前,統計學科分別隸屬於兩個一級學科,即應用經濟學和數學;2011年以後,國務院學位委員會通過了新的學位授予和人纔培養學科目錄,統計學科上升為一級學科。這一方面說明了統計學這個學科本身的重要性,為未來統計學的快速發展提供了更加廣闊的舞臺和空間,同時這也對高等院校人纔培養模式提出了新的要求。
經國務院學位委員會批準,我國自2011年起開始招收培養應用統計專業碩士,到目前已經連續招收了六屆,且全國每年招生規模不斷擴大。該專業學位設置的主要目的是為政府部門、大中型企業、咨詢和研究機構培養高層次、應用型統計專門人纔。相對於學術性碩士的培養而言,應用統計專業碩士培養的主要特點是“高層次、應用型”。從課程設置體繫來看,“應用數理統計”課程是應用統計專業碩士培養最為重要的基礎課和核心課,是後繼各類專業課的基礎。從學科定義上來看,數理統計主要是用來研究如何有效地收集、處理和分析數據的一門學科,通過對隨機現像有限次的觀測或試驗得到的數據進行歸納、分析,並據此對整體的數量規律性做出推斷或判斷。數理統計既強調統計理論數學闡述,如參數估計、非參數估計、相關與回歸分析等,同時又非常注重統計方法的實際應用,數理統計對統計數據分析方法的影響是顯著的,在對應用統計專業碩士的培養中發揮著重要作用。
鋻於應用統計專業碩士推出的時間較短,國內有針對性的數理統計教材很少,為了適應應用統計專業碩士培養快速發展的新形式,我們著手編寫了本書。作者認為,“數理統計”作為應用統計專業碩士教學的一門基礎課,在課程內容選編上既要體現不同於本科課程內容的“高層次”,又要體現出不同於傳統學術型碩士課程內容的“應用型”,盡量做到理論方法與應用的有機融合。考慮到某些結論的證明過程過於煩瑣,初學者往往感到困惑,在編寫過程中我們強調方法的應用,淡化理論證明,注重案例教學。
值得注意的是,計算機的誕生與迅猛發展,為數據處理提供了強有力的技術支持。統計的學習與使用離不開計算機,離不開統計軟件。目前常用的統計軟件主要有SPSS、SAS、MATLAB、STATISTICA、R語言等。R 軟件作為一種免費的開源統計軟件,已經在統計學、運籌學、生物信息學、經濟學、工程學等諸多領域得到廣泛應用。由於設計上的特點,R語言並不局限某一類問題。配合不同的功能擴展包,以及各種靈活使用的基本工具,R 語言能夠應用的領域相當廣泛。在本書中,我們將采用R語言作為主要的教學軟件。對於一些常用的結論,我們將通過R語言來實現。本書強調統計方法的R語言實現也是基於應用的目的。
本書共分6章,其中第1章由姜玉英編寫,第2、3、6章由劉強編寫,第4、5章及附錄由王琳編寫,書中的大部分程序由王琳編寫,最後由劉強負責統一定稿。
本書內容涵蓋了概率論預備知識、統計基礎知識、參數估計、假設檢驗、區間估計及回歸分析。為了方便讀者學習和實際應用,本書在附錄中介紹了R語言的使用、非參數密度估計及非參數回歸等內容,以開闊讀者的應用視野。全部講授完本書大約需要48學時,如果將R軟件的學習與應用放到課後,則32學時左右即可完成本書內容的講授。
本書的初稿在首都經濟貿易大學應用統計專業碩士班講授過多年,雖然經過多次修改,總感不足,趁此出版之際,我們對講義又進行了大幅的整理與修訂,希望本書的出版能為應用統計專業碩士的教學貢獻一份綿薄之力。
在本書的撰寫過程中,北京工業大學薛留根教授、程維虎教授,首都經濟貿易大學統計學院紀宏教授、張寶學教授、馬立平教授都給予了極大的支持和熱心的幫助。電子工業出版社高等教育分社的譚海平社長和王二華編輯也為本書的出版付出了很大努力,在此一並表示感謝。本書的撰寫也得到了北京市青年撥尖人纔培育計劃項目(CIT&TCD201404133)和首都經濟貿易大學專業學位碩士教育繫列教材建設項目的資助。
由於作者水平有限,盡管盡了很大努力,但書中仍不免存在錯謬之處,懇請國內同行及讀者不吝指正。電子郵箱為:cuebliuqiang@163.com。
作 者
2016年11月