了得網圖書_心理統計學（第三版）（萬千心理）邵志芳中國輕工業出版社心

第1章心理學是一門統計性科學

1.1心理現像是隨機現像

1.2描述統計學與推斷統計學

1.3統計學的基本概念

1.4心理統計學的基本內容和學習方法

本章術語

練習與思考

第2章數據的種類和表征

2.1數據與數據的水平

2.2次數分布表

2.3次數分布圖

2.4多變量圖示法

本章術語

練習與思考

第3章常用特征量

3.1集中量

3.2差異量

3.3地位量

3.4偏態量和峰態量

本章術語

練習與思考

第4章概率基礎

4.1概率

4.2概率的運算

4.3條件概率及其應用

本章術語

練習與思考

第5章概率分布

5.1二項分布

5.2正態分布和t分布

5.3t分布、泊松分布與指數分布

本章術語

練習與思考

第6章抽樣技術與樣本平均數的抽樣分布

6.1抽樣技術與統計推斷

6.2樣本平均數的抽樣分布

6.3兩個樣本平均數之差的抽樣分布

本章術語

練習與思考

第7章平均數的參數估計

7.1參數估計

7.2總體平均數的參數估計

7.3兩總體平均數之差的參數估計

本章術語

練習與思考

第8章平均數的假設檢驗

8.1假設檢驗

8.2總體平均數的假設檢驗

8.3兩總體平均數之差的假設檢驗

8.4功效函數和效應量

本章術語

練習與思考

第9章總體方差與總體比例的統計推斷

9.1χ2分布與F分布

9.2總體方差的統計推斷

9.3總體比例的統計推斷

本章術語

練習與思考

第10章方差分析

10.1方差分析的基本原理

10.2單因素方差分析（完全隨機設計）

10.3多因素方差分析

本章術語

練習與思考

第11章相關分析

11.1相關與相關繫數

11.2積差相關

11.3等級相關

11.4質量相關與品質相關

11.5復相關分析與偏相關分析

本章術語

練習與思考

第12章回歸分析

12.線性回歸模型

12.線性回歸方程的檢驗

12.線性回歸方程的應用

12線性回歸模型

12.5非線性回歸模型

12.6含定性自變量的回歸分析——虛擬變量

12.7Logistic回歸

本章術語

練習與思考

第13章χ檢驗

13.1 χ2檢驗的基本概念

13.2單因素χ2檢驗

13.3雙因素χ2檢驗

13.4相關樣本的χ2檢驗

本章術語

練習與思考

第14章非參數檢驗

14.1單樣本遊程檢驗

14.2兩個獨立樣本的非參數檢驗

14.3兩個相關樣本的非參數檢驗

14.4秩次方差分析

本章術語

練習與思考

第15分析初步

15.1基本知識

15.2聚類分析

15.3判別分析

15.4探索性因素分析

15.5結構方程建模

本章術語

練習與思考

附錄一自測試卷

附錄二部分習題答案

附錄三統計用表

附錄四統計軟件與論文寫作

統計軟件用法

論文寫法

參考書目

第1章

心理學是一門統計性科學

本章提要

本章主旨

心理學研究的對像是隨機現像，其定量分析的基本手段是統計學；統計學包括描述統計學和推斷統計學，後者是現代統計學的主要內容。

本章要點

● 隨機現像有別於確定現像，需要統計學來研究其數量規律性。

● 心理現像是一種隨機現像，需運用統計學方法總結其數量規律性，所以心理學離不開統計學，是一門統計性科學。

● 統計學分為描述統計學和推斷統計學，前者研究各種特征量和概率分布，後者研究如何根據樣本信息推斷總體情況。

● 統計學的基本概念：隨機變量、個體、總體、樣本、統計量和參數。

● 心理統計學為心理學中不同類型的問題提供對應的統計分析方法。

導讀問題

● 心理學為什麼是一門統計性科學？

● “統計一下來賓人數”中的“統計”是不是現代統計學研究的主要內容？

● 從統計學角度說明，為什麼人們對同一個人往往有不同的評價？

● 要學好心理統計學，需要做哪些事情？

1.1 心理現像是隨機現像

1.1.1 什麼是隨機現像

我們平時遇到的各種現像，可以分為確定現像和隨機現像。下面列出這兩種現像的一些例子，讀者可以加以比較，體會一下兩者的差別。

確定現像：

■ 在1個標準大氣壓下，純水溫度降到0℃時會結冰。

■ 定量的氫氣在氧氣中燃燒生成定量的水。

■ 種豆得豆，種瓜得瓜。

■ 勻速直線運動的物體在相同時間內經過的距離相同。

■ 生命體受到刺激後一定有反應。

■ 對正常人而言，大運動量鍛煉會導致大量出汗。

■ 在計件工資制度下，員工可以精確計算自己的收入。

……

隨機現像：

■ 上海市每年7月7日的氣溫

■ 每年長江彙入大海的總水量

■ 播種等量的種子所得的收成

■ 上班路上花的時間

■ 同樣難度的卷子，有時考得好，有時考得差

■ 在婦產科醫院每天出生的新生兒中，有時男嬰多，有時女嬰多

■ 工廠每天產出的次品，有時多些，有時少些

……

可以看到，確定現像的特點是隻要知道一些必要的已知條件（例如“在1個標準大氣壓下”、“純水”、“0℃”），總可以得出確定的結果（“結冰”）。而隨機現像則不同，每一次觀察的結果都可能不同，例如，雖然都是上海市的7月7日，但是每年7月7日的氣溫都是不一樣的。

在因果關繫十分復雜的科學領域，即使在基本條件相同的情況下，每做一次觀察或試驗，都可能得到不同的結果。這意味著，我們往往無法根據已知的有限條件精確地預測結果，每做一次預測，也都可能出現偏差。我們將這種無法精確預測的現像，稱為隨機現像。它的定義可以表述為：在一定的條件下，可能出現也可能不出現，或者可能這樣出現也可能那樣出現的一類現像。

隨機現像之所以存在，是因為人類在預測此類現像時無法窮盡影響其發生和發展的全部原因（或因素）。從這個意義上講，任何現像都多多少少帶有一定的隨機性，完全確定的現像是很少的。就算是確定現像，如果進一步預測其具體情況，也可能變成隨機現像。例如，“種瓜得瓜”可以算作確定現像，但是種瓜之後能收獲多大的瓜，就不確定了。可以說，隨機現像遍及自然與社會之中。

1.1.2 隨機現像的數量規律性

這樣一來，隨機現像豈不成了“聽天由命”的代名詞？表面上看，隨機現像如此變化無常，似乎是沒有規律可循的。但是，在數學家看來，它們不僅有規律可循，而且有數量上的規律性。而統計學就是研究隨機現像的數量規律性的應用數學分支。

要總結出隨機現像的數量規律性，就需要大量試驗和觀察。不論是自然界中的還是社會生活中的隨機現像，都有一個共同特點：個別試驗或觀察的結果總是不確定的、雜亂無章的，但是將大量個別結果綜合起來，卻可以得到比較穩定的數量規律性。例如，醫院每天都有嬰兒出生，而且每天的性別比例都不同，但是長期的觀察和計算發現，新生兒的男女比例大約是106∶100。這個比例就是數量規律性的體現。還有，雖然每天上下班在路上用的時間都不一樣，但是可以計算出一個平均數；雖然我們不知道某個勤奮的學生下一次的考試成績，但是可以斷言，在其他條件相同的前提下，他取得好成績的可能性（概率）比懶惰者更大。這裡的平均數和概率也是數量規律性的指標。

此外，概率的分布也是數量規律性的表現形式。例如，學生的考試成績，往往呈兩頭少、中間多、左右對稱的正態分布，即高分和低分者少，中等分數者眾多（見圖1.1.1）。

圖1.1.1 正態分布圖

統計學建立在大量試驗和觀察的基礎上，這就是大數定理的由來。大數定理又稱大數法則：雖然每次觀察結果可能都不同（偶然性），但是大量重復觀察的結果可以形成穩定的數量特征（必然性）。大數定理對認識隨機現像具有普遍的指導意義，是統計學的理論基石。

對於隨機現像，雖然無法精確預測其結果，但是我們可以通過計算，判斷它出現的概率有多大，不出現的概率有多大；或者這樣出現的概率有多大，那樣出現的概率有多大。用概率來說話，這就是統計學家的工作。

1.1.3 心理學為什麼需要統計學

心理現像在很大程度上就是隨機現像。

當你與一位老朋友久別重逢，你的第一句話會表達怎樣的情感？你也許會表示驚訝（“怎麼是你？”），也許會表示高興（“我們終於又見面了！”），也許會表示抱怨（“怎麼這麼多年杳無音訊？”），等等。究竟先說哪一句，恐怕是隨機的。

如果請你隨口說出一種水果的名稱，你會說哪一種？很多人會說“蘋果”，因為它是水果中最典型、最常提到的樣例。但是，不是每個人都會說“蘋果”，有些人會說“梨子”，有些人會說“葡萄”、“橘子”等，這也是一種隨機現像。

如果一個心理學實驗要求你看到紅燈亮時盡快按下一個按鈕，並記錄你從燈亮到按下按鈕之間的反應時間。你每一次的反應時間肯定都是不同的——有時快，有時慢，是隨機的。

如果對一個人進行多次智力測驗，盡管這個人的各方面情況在短期內沒有發生顯著的變化，但是每次測得的智商也可能不同。所以心理測驗的結果也有很大的隨機性。

諸如此類的例子還可以舉出很多。總而言之，心理現像是一種隨機現像，要定量地研究隨機現像，就需要運用統計學方法來總結其數量規律性（例如，反應時間的平均數和標準差，智商的概率分布特點等）。因此，心理學需要統計學，它是一門統計性科學。

統計學在其發展過程中，逐步形成了數理統計學和應用統計學兩大分支。數理統計學以概率論為基礎，闡明統計學的數學原理，推導和證明有關的數學公式，從而為各個學科的研究者提供適用的數學工具和方法。應用統計學是數理統計學理論在各個學科領域的應用。現在，應用統計學已經在物理學、天文學、生物學、醫學、社會學等眾多學科領域廣泛“落戶”，這其中也包括心理學領域的應用統計學分支——心理統計學。

1.2 描述統計學與推斷統計學

1.2.1 描述統計學

人類最早的“結繩記事”就是一種原始的統計活動。後來，統計學帶上了很強的國家特征，因為要維護對國家的統治，統治者就必須通過統計了解和掌握本國的自然資源和人力物力等要素情況。統計學在我國更是有著悠久的歷史，距今4000多年前的夏朝就開始進行人口統計了。我國古代政治家商鞅把“十三數”（全國糧食儲存數、人口數、壯年男子數、壯年女子數、老年人數、兒童人數、官吏人數、士兵人數、靠遊蕩混飯喫的人數、商販人數、馬的匹數、牛的頭數和牲口草料數）作為反映基本國情的數量指標。可見，這時已經有了全國規模的人口調查制度，而且已經對人口按照年齡、職業等進行分組統計，甚至有了國民經濟各種數量的對比分析。

人類一開始的統計活動主要是描述性質的，就是將搜集到的統計資料所包含的信息用一些描述性的特征量盡可能簡潔而充分地反映出來。例如，一個國家的人口總數就是最簡單的特征量。如果細分，還可以分別計算男性與女性人口數、各年齡階段人口數、各行業從業者人數等。描述統計學闡述的就是搜集資料以及提煉和描述這些資料的方法，同時，它又是推斷統計學的基礎。

描述統計常用的特征量有集中量、差異量、地位量、相關量、偏態量和峰態量等。

■ 集中量描述數據的典型水平或集中趨勢，包括算術平均數、加權平均數、幾何平均數、中位數、眾數等。

■ 差異量描述數據分散（參差不齊）的程度，包括全距、平均差、方差、標準差、差異繫數等。

■ 地位量描述數據在全體數據中所處的地位，包括百分位數、百分等級（百分位）等。

■ 相關量描述兩個或多個變量之間的關聯程度，包括積差相關繫數、等級相關繫數、質與量的相關繫數和品質相關繫數等。

■ 偏態量和峰態量用來描述數據的分布特征——偏離正態的程度和高低寬窄的程度。

1.2.2 推斷統計學

大約在20世紀20年代之前，統計學的主要內容還是描述統計學。後來，推斷統計學逐漸發展起來，其地位越來越重要，而且在內容上也占有越來越大的比重，成為統計學的主干部分。推斷統計學就是運用概率論研究如何根據樣本信息推斷樣本來自的總體的相應信息，它包括參數估計和假設檢驗這兩種形式（分別詳見第7章和第8章）。

描述統計學中提到的所有特征量都可以分為樣本的和總體的。參數估計就是根據樣本的特征量（統計量）來估計總體的相應特征量（參數）。例如，在編制智力測驗時，需要了解各年齡階段男女人口的平均成績，以此作為今後計算智商的標準（又稱“常模”）。但是，我們不大可能對全國所有人實施測驗，於是，我們隨機抽取一部分參試者（例如，每個年齡段抽取800名男女參試者）作為樣本，然後根據這些參試者完成智力測驗的平均成績（樣本統計量）來估計各年齡段的全國男女人口的平均成績（總體參數）。

假設檢驗則是對總體的參數或分布形態的假設做出保留或拒絕的決策。例如，我們要考察A、B兩種條件對參試者的反應時間有無顯著影響，但是不可能讓全世界的人都來參加實驗。這時我們可以抽取兩組參試者作為樣本，一組在A條件下進行操作，另一組在B條件下完成相同的任務，然後比較兩組參試者的平均反應時間有沒有顯著差異。雖然隻有很少一部分人參加了我們的實驗，但是其結論是針對所有人的。比較的步驟是，先假設兩種條件下的參試者的反應時間沒有顯著差異，再進行相應的統計運算，根據得到的概率，最終確定是否保留這個假設。

將描述統計學與推斷統計學結合起來，就可以清晰地看到統計學其實可以被看作一個研究過程：以繫統的方式搜集和整理資料，進而根據這些資料做出與總體相關的決策。

1.3 統計學的基本概念

1.3.1 隨機變量

統計學研究的是隨機現像的數量規律性。為了數學表述的方便，我們將表示隨機現像的各種可能結果的變量稱為隨機變量。這裡說的“各種可能結果”是隨機變量的可能取值。隨機現像和隨機變量隻是表述上的不同：如果說隨機現像“可以這樣發生，也可以那樣發生”，那麼隨機變量就“可以取這個值，也可以取那個值”。

隨機變量的取值可以是質的不同，也可以是量的不同。擲出的一枚硬幣落地後是正面朝上還是反面朝上，就是兩個不同的取值，且兩者間是質的不同；新生兒的性別，可以是男性，也可以是女性，也是不同質的取值。但是，考試的得分、心理測驗的分數、完成一項任務的用時以及正確率等，則是量的不同。

量的差異本身就是用數字表示的，例如，考試成績。質的差異可以用文字符號表示，也可以用數字表示，例如，用“H”表示正面朝上，用“T”表示反面朝上；或者用5、4、3、2、1分別表示優、良、中、及格、不及格等。

引入隨機變量的概念，是為了更好地對隨機現像進行定量的研究。因為單是知道隨機變量可以取哪些值是不夠的，還要研究它取各個值的可能性（概率）。

1.3.2 個體、總體和樣本

在統計學中，每一個原始數據都是從個體那裡獲得的。例如，要研究人的智力，就要編制一個能夠比較有效地測定智力的量表，然後纔能進行測驗和評定。從每個人那裡，我們都能得到一個（或一繫列）原始數據（觀察值）。這裡說的每個人就是“個體”，他們都有一個共同特性——智力水平。如果能測定世界上每一個人的智力，那就知道了“人”這個總體的智力情況。不過，限於人力、物力、經費和時間，對全世界每個個體都進行測定是不可能的。隻能抽取一部分個體進行測定，這一部分個體就組成了一個樣本。我們往往根據樣本的情況來推斷總體的情況。

根據這樣的關繫，可以為個體、總體與樣本分別下一個定義：

個體是我們所研究的隨機現像的載體，具有我們感興趣的某種共同特性，是組成總體的基本單位；

總體是具有某（些）共同特性的個體的總和；

樣本是從總體中抽取的作為觀測對像的一部分個體。

總體有無限總體和有限總體之分。如果一個總體包含的個體數目是無限的，就稱為無限總體；如果一個總體包含的個體數目是有限的，就稱為有限總體。例如，我們要研究今年某市小學一年級男生的肺活量情況，這時，該市今年入學的所有小學一年級男生就構成了一個有限總體。可是，當我們更籠統地說要研究小學一年級男生的身高時，從理論上來講，古今中外的小學一年級男生都應該成為研究對像，這就沒有一個明確的數目了，因而是一個無限總體。另外，就算隻對一個學生進行測量，如果我們對他進行無數次的測量（至少從理論上可以這樣假設），則測量得到的一切可能結果也可形成一個無限總體，隻不過這時的個體不是學生本人，而是測量所得的值——觀察值。總體是有限總體還是無限總體，可能會影響該選擇何種統計運算方法。

樣本對推斷統計學有特殊的意義。統計推斷就是根據樣本信息來推斷總體的情況。由於各種客觀條件的限制，我們無法將總體中的所有個體都觀察一遍，這時更是必須抽取樣本。不僅如此，在保證一定的研究精度的前提下，抽樣的個體數總是越少越好。

樣本中包含的個體數稱為樣本容量，一般用n表示。樣本容量越大，樣本的數字特征就越接近總體，從而能更精確地反映總體的情況。但是，容量過大則沒有必要，那樣反而會失去降低研究成本的意義。一般來說，n≥30的樣本稱為大樣本，n＜30的樣本稱為小樣本。大樣本和小樣本所用的統計方法不一定相同。

在生活中，廣義的總體—樣本關繫無處不在。例如，我們通常會根據一個人的行為表現來判斷其人品。可是，我們隻能觀察到其一部分行為（相當於樣本），以此來估計其人品（相當於總體）。由於觀察到的樣本不同，我們就可能對同一個人做出不同的評價。

1.3.3 參數和統計量

總體和樣本有很多共同點：都是由一定數量的個體構成的，都可以計算出各種數量指標（例如，平均數、標準差、比例和相關繫數等）。但是它們之間畢竟存在著整體和部分的關繫。為了指稱時的方便，統計學家將總體和樣本的數量指標區分開來，分別稱為參數和統計量。根據總體中所有個體的觀察值計算出來的數量指標

（即總體平均數、總體標準差、總體比例和總體相關繫數等）被稱為參數，它們是總體上的數字特征；根據樣本中所有個體的觀察值計算出來的數量指標（即樣本平均數、樣本標準差、樣本比例和樣本相關繫數等）則被稱為統計量，它們是樣本上的數字特征。參數一般用希臘字母表示，統計量一般用拉丁字母表示。統計推斷就是根據樣本統計量來推斷相應的總體參數。例如，我們可以根據樣本平均數X來推斷總體平均數μ，根據樣本標準差S來推斷總體標準差σ，根據樣本相關繫數r來推斷總體的相關繫數ρ，等等。

致讀者

親愛的讀者：

2009年，中國輕工業出版社“萬千心理”出版了拙作《心理統計學》。在不到3年的時間裡，這本書受到廣泛的歡迎，許多師生給了我熱情的鼓勵和有益的建議。2012年，在“萬千心理”的支持下，本書第二版問世。在第二版的修訂過程中，我又從多位長期從事心理統計學教學的老師那裡獲得了許多教益，他們分別是南京師範大學鄧鑄老師、東北師範大學王景英老師、原西南大學鳳四海老師和首都師範大學方平老師。在這裡，再次表示感謝！

一轉眼，又是3年過去了。2016年上半年，本書入選了華東師範大學精品教材建設專項項目，這意味著要對本書進行一次新的修訂，意味著本書又向著成為精品的目標邁進了一步。

本書前兩版的特色

本書前兩版的編寫和修訂原則是以學生為中心，順應學習的規律。對每一節課，教師都應該根據學生特點設置明確具體的教學目標、脈絡清楚的內容體繫和靈活多變的實踐情境。

課堂上要做到的，在教材中就應該得到充分的體現。故本書的前兩版都力求做到以下三點：

第一，明確具體的教學目標——在學習每一章的具體內容之前，要為學習者構建一個目標繫統。為此，本書從第5章開始，每一章都以該章能解決什麼樣的實際問題開頭。讀者看了這個開頭，就可以知道，對於搜集到的數據，統計學家會提出什麼樣的問題。等學完這一章，再回過頭來看開頭這些問題，想想自己能否回答這些問題。如果讀者看到問題就能說出應當采取何種方法解答，知道運用這些方法時需要注意些什麼，學習的目標基本上就達到了。

第二，脈絡清楚的內容體繫——教學需要脈絡清楚、循序漸進地呈現內容。本書對課程內容的編排以理清心理統計學的內容體繫為原則，著重體現知識之間的聯繫，並將其與現實生活中的統計性思考相對照。這樣做的根本目的同樣是幫助學生弄清何種問題適合用何種統計學方法求解。為了幫助讀者更順暢地閱讀和使用本書，在各章開頭都有“本章提要”，告知這一章的主旨和重點內容，說明該章能解決什麼樣的問題；各章最後又將重要的術語和原理（附英文）加以總結，以便查閱。本書還特意在一些重點、難點處增加了些方塊貼士，它們有的是解釋性的（幫助理解原理），有的是提示性的（聯繫前後內容，幫助記憶和思考），有的是警示性的（避免粗心造成的忽視和混淆），還有的是啟發性的（闡述統計思想）。

第三，靈活多變的實踐情境——幫助學習者掌握各種變式情形。心理統計學的實踐性很強，隻有不斷地運用，纔能熟練而靈活地掌握。為此，本書收錄了大量例題和習題，並為部分習題提供了參考答案（以方便自學者）。熟悉了這些例題和習題，今後遇到實際問題時，即使一時不能準確選擇統計分析方法，至少也可以憑借對題目的熟悉感選出可能找到解法的大致章節。

當然，這不是在鼓勵讀者做大量的習題。相反，在認真完成了適量的習題後，更需要讀者自身的統計實踐。其實，無論是在生活還是工作中，隻要你是一個有心人，就可以搜集到各種數據。針對這些數據，選用合適的統計方法加以分析，把分析結果與老師、同學、同事和朋友們分享。假以時日，你就會喜歡上統計學這門學科，並且逐漸能夠靈活運用。

本書第三版的修訂原則

本次在保留前兩版特色的基礎上，根據以下原則進行了修訂：

（1）配合課堂教學改革，將其編寫成“課前便於自學理解、課中便於練習討論、課後便於檢索使用”的教材。

（2）兼顧不同類型和學習能力的學生，兼顧讀者的不同需要（如考研復習、使用SPSS等軟件、畢業論文數據處理等）。增補近年來使用得越來越多的統計分析方法，例如，偏相關分析、虛擬變量、logistic回歸等。

（3）加強教材的教學性特征。進一步優化各章原有的內容提要、導讀問題、復雜概念辨析、易錯之處提醒、各種方法之間的聯繫、實際生活中的統計學、術語、實習題等內容；附錄中還首次加入了3份自測試卷，供學習者檢驗學習效果。

（4）內容分層：將教學內容分為基礎內容、拓展內容（正文中的方框內容和帶有“★”號的章節）、統計軟件使用和論文寫作中的統計分析結果報告方式（歸入附錄四），便於使用者選擇教學內容。

在課時緊張的情況下，可以精簡部分內容，例如條件概率、功效函數、關於總體比例的假設檢驗、多列相關、品質相關、偏相關分析、虛擬變量、logistic回歸、科克倫Q檢驗、單樣本遊程檢驗、柯爾莫哥洛夫－斯米爾諾夫檢驗等。但是，建議不要整章或大面積地刪減。例如，如果整個略去“非參數檢驗”，學生將來遇到計量水平低的數據時，可能連思考的方向都沒有，或者用錯了統計方法也意識不到。

關於統計軟件，特別提醒一下初學者：在完整掌握統計學基本理論體繫之前，最好不要對軟件形成依賴，否則很容易在復雜的數據面前選錯統計方法。其實，在扎實掌握基本原理、了解相關術語的英文表述之後，學習統計軟件的效率極高，幾乎可以無師自通。

最後，再次衷心地感謝各位讀者對本書的支持和關注。尤其是感謝我的學生王健、趙娟、餘嵐、程陶、杜逸旻、徐笑含、張盈琤和彭曉琴等在本書成書過程中的細致糾錯，以及家人的支持。

邵志芳

2016 年 5 月 1 日

於華東師範大學

商品搜索

商品分类

【醫學】

【各大出版社】

【医学】

【各大出版社】

內容簡介

作者簡介

目錄

精彩書摘

前言/序言