第1章
心理學是一門統計性科學
本章提要
本章主旨
心理學研究的對像是隨機現像,其定量分析的基本手段是統計學;統計學包括描述統計學和推斷統計學,後者是現代統計學的主要內容。
本章要點
● 隨機現像有別於確定現像,需要統計學來研究其數量規律性。
● 心理現像是一種隨機現像,需運用統計學方法總結其數量規律性,所以心理學離不開統計學,是一門統計性科學。
● 統計學分為描述統計學和推斷統計學,前者研究各種特征量和概率分布,後者研究如何根據樣本信息推斷總體情況。
● 統計學的基本概念:隨機變量、個體、總體、樣本、統計量和參數。
● 心理統計學為心理學中不同類型的問題提供對應的統計分析方法。
導讀問題
● 心理學為什麼是一門統計性科學?
● “統計一下來賓人數”中的“統計”是不是現代統計學研究的主要內容?
● 從統計學角度說明,為什麼人們對同一個人往往有不同的評價?
● 要學好心理統計學,需要做哪些事情?
1.1 心理現像是隨機現像
1.1.1 什麼是隨機現像
我們平時遇到的各種現像,可以分為確定現像和隨機現像。下面列出這兩種現像的一些例子,讀者可以加以比較,體會一下兩者的差別。
確定現像:
■ 在1個標準大氣壓下,純水溫度降到0℃時會結冰。
■ 定量的氫氣在氧氣中燃燒生成定量的水。
■ 種豆得豆,種瓜得瓜。
■ 勻速直線運動的物體在相同時間內經過的距離相同。
■ 生命體受到刺激後一定有反應。
■ 對正常人而言,大運動量鍛煉會導致大量出汗。
■ 在計件工資制度下,員工可以精確計算自己的收入。
……
隨機現像:
■ 上海市每年7月7日的氣溫
■ 每年長江彙入大海的總水量
■ 播種等量的種子所得的收成
■ 上班路上花的時間
■ 同樣難度的卷子,有時考得好,有時考得差
■ 在婦產科醫院每天出生的新生兒中,有時男嬰多,有時女嬰多
■ 工廠每天產出的次品,有時多些,有時少些
……
可以看到,確定現像的特點是隻要知道一些必要的已知條件(例如“在1個標準大氣壓下”、“純水”、“0℃”),總可以得出確定的結果(“結冰”)。而隨機現像則不同,每一次觀察的結果都可能不同,例如,雖然都是上海市的7月7日,但是每年7月7日的氣溫都是不一樣的。
在因果關繫十分復雜的科學領域,即使在基本條件相同的情況下,每做一次觀察或試驗,都可能得到不同的結果。這意味著,我們往往無法根據已知的有限條件精確地預測結果,每做一次預測,也都可能出現偏差。我們將這種無法精確預測的現像,稱為隨機現像。它的定義可以表述為:在一定的條件下,可能出現也可能不出現,或者可能這樣出現也可能那樣出現的一類現像。
隨機現像之所以存在,是因為人類在預測此類現像時無法窮盡影響其發生和發展的全部原因(或因素)。從這個意義上講,任何現像都多多少少帶有一定的隨機性,完全確定的現像是很少的。就算是確定現像,如果進一步預測其具體情況,也可能變成隨機現像。例如,“種瓜得瓜”可以算作確定現像,但是種瓜之後能收獲多大的瓜,就不確定了。可以說,隨機現像遍及自然與社會之中。
1.1.2 隨機現像的數量規律性
這樣一來,隨機現像豈不成了“聽天由命”的代名詞?表面上看,隨機現像如此變化無常,似乎是沒有規律可循的。但是,在數學家看來,它們不僅有規律可循,而且有數量上的規律性。而統計學就是研究隨機現像的數量規律性的應用數學分支。
要總結出隨機現像的數量規律性,就需要大量試驗和觀察。不論是自然界中的還是社會生活中的隨機現像,都有一個共同特點:個別試驗或觀察的結果總是不確定的、雜亂無章的,但是將大量個別結果綜合起來,卻可以得到比較穩定的數量規律性。例如,醫院每天都有嬰兒出生,而且每天的性別比例都不同,但是長期的觀察和計算發現,新生兒的男女比例大約是106∶100。這個比例就是數量規律性的體現。還有,雖然每天上下班在路上用的時間都不一樣,但是可以計算出一個平均數;雖然我們不知道某個勤奮的學生下一次的考試成績,但是可以斷言,在其他條件相同的前提下,他取得好成績的可能性(概率)比懶惰者更大。這裡的平均數和概率也是數量規律性的指標。
此外,概率的分布也是數量規律性的表現形式。例如,學生的考試成績,往往呈兩頭少、中間多、左右對稱的正態分布,即高分和低分者少,中等分數者眾多(見圖1.1.1)。
圖1.1.1 正態分布圖
統計學建立在大量試驗和觀察的基礎上,這就是大數定理的由來。大數定理又稱大數法則:雖然每次觀察結果可能都不同(偶然性),但是大量重復觀察的結果可以形成穩定的數量特征(必然性)。大數定理對認識隨機現像具有普遍的指導意義,是統計學的理論基石。
對於隨機現像,雖然無法精確預測其結果,但是我們可以通過計算,判斷它出現的概率有多大,不出現的概率有多大;或者這樣出現的概率有多大,那樣出現的概率有多大。用概率來說話,這就是統計學家的工作。
1.1.3 心理學為什麼需要統計學
心理現像在很大程度上就是隨機現像。
當你與一位老朋友久別重逢,你的第一句話會表達怎樣的情感?你也許會表示驚訝(“怎麼是你?”),也許會表示高興(“我們終於又見面了!”),也許會表示抱怨(“怎麼這麼多年杳無音訊?”),等等。究竟先說哪一句,恐怕是隨機的。
如果請你隨口說出一種水果的名稱,你會說哪一種?很多人會說“蘋果”,因為它是水果中最典型、最常提到的樣例。但是,不是每個人都會說“蘋果”,有些人會說“梨子”,有些人會說“葡萄”、“橘子”等,這也是一種隨機現像。
如果一個心理學實驗要求你看到紅燈亮時盡快按下一個按鈕,並記錄你從燈亮到按下按鈕之間的反應時間。你每一次的反應時間肯定都是不同的——有時快,有時慢,是隨機的。
如果對一個人進行多次智力測驗,盡管這個人的各方面情況在短期內沒有發生顯著的變化,但是每次測得的智商也可能不同。所以心理測驗的結果也有很大的隨機性。
諸如此類的例子還可以舉出很多。總而言之,心理現像是一種隨機現像,要定量地研究隨機現像,就需要運用統計學方法來總結其數量規律性(例如,反應時間的平均數和標準差,智商的概率分布特點等)。因此,心理學需要統計學,它是一門統計性科學。
統計學在其發展過程中,逐步形成了數理統計學和應用統計學兩大分支。數理統計學以概率論為基礎,闡明統計學的數學原理,推導和證明有關的數學公式,從而為各個學科的研究者提供適用的數學工具和方法。應用統計學是數理統計學理論在各個學科領域的應用。現在,應用統計學已經在物理學、天文學、生物學、醫學、社會學等眾多學科領域廣泛“落戶”,這其中也包括心理學領域的應用統計學分支——心理統計學。
1.2 描述統計學與推斷統計學
1.2.1 描述統計學
人類最早的“結繩記事”就是一種原始的統計活動。後來,統計學帶上了很強的國家特征,因為要維護對國家的統治,統治者就必須通過統計了解和掌握本國的自然資源和人力物力等要素情況。統計學在我國更是有著悠久的歷史,距今4000多年前的夏朝就開始進行人口統計了。我國古代政治家商鞅把“十三數”(全國糧食儲存數、人口數、壯年男子數、壯年女子數、老年人數、兒童人數、官吏人數、士兵人數、靠遊蕩混飯喫的人數、商販人數、馬的匹數、牛的頭數和牲口草料數)作為反映基本國情的數量指標。可見,這時已經有了全國規模的人口調查制度,而且已經對人口按照年齡、職業等進行分組統計,甚至有了國民經濟各種數量的對比分析。
人類一開始的統計活動主要是描述性質的,就是將搜集到的統計資料所包含的信息用一些描述性的特征量盡可能簡潔而充分地反映出來。例如,一個國家的人口總數就是最簡單的特征量。如果細分,還可以分別計算男性與女性人口數、各年齡階段人口數、各行業從業者人數等。描述統計學闡述的就是搜集資料以及提煉和描述這些資料的方法,同時,它又是推斷統計學的基礎。
描述統計常用的特征量有集中量、差異量、地位量、相關量、偏態量和峰態量等。
■ 集中量描述數據的典型水平或集中趨勢,包括算術平均數、加權平均數、幾何平均數、中位數、眾數等。
■ 差異量描述數據分散(參差不齊)的程度,包括全距、平均差、方差、標準差、差異繫數等。
■ 地位量描述數據在全體數據中所處的地位,包括百分位數、百分等級(百分位)等。
■ 相關量描述兩個或多個變量之間的關聯程度,包括積差相關繫數、等級相關繫數、質與量的相關繫數和品質相關繫數等。
■ 偏態量和峰態量用來描述數據的分布特征——偏離正態的程度和高低寬窄的程度。
1.2.2 推斷統計學
大約在20世紀20年代之前,統計學的主要內容還是描述統計學。後來,推斷統計學逐漸發展起來,其地位越來越重要,而且在內容上也占有越來越大的比重,成為統計學的主干部分。推斷統計學就是運用概率論研究如何根據樣本信息推斷樣本來自的總體的相應信息,它包括參數估計和假設檢驗這兩種形式(分別詳見第7章和第8章)。
描述統計學中提到的所有特征量都可以分為樣本的和總體的。參數估計就是根據樣本的特征量(統計量)來估計總體的相應特征量(參數)。例如,在編制智力測驗時,需要了解各年齡階段男女人口的平均成績,以此作為今後計算智商的標準(又稱“常模”)。但是,我們不大可能對全國所有人實施測驗,於是,我們隨機抽取一部分參試者(例如,每個年齡段抽取800名男女參試者)作為樣本,然後根據這些參試者完成智力測驗的平均成績(樣本統計量)來估計各年齡段的全國男女人口的平均成績(總體參數)。
假設檢驗則是對總體的參數或分布形態的假設做出保留或拒絕的決策。例如,我們要考察A、B兩種條件對參試者的反應時間有無顯著影響,但是不可能讓全世界的人都來參加實驗。這時我們可以抽取兩組參試者作為樣本,一組在A條件下進行操作,另一組在B條件下完成相同的任務,然後比較兩組參試者的平均反應時間有沒有顯著差異。雖然隻有很少一部分人參加了我們的實驗,但是其結論是針對所有人的。比較的步驟是,先假設兩種條件下的參試者的反應時間沒有顯著差異,再進行相應的統計運算,根據得到的概率,最終確定是否保留這個假設。
將描述統計學與推斷統計學結合起來,就可以清晰地看到統計學其實可以被看作一個研究過程:以繫統的方式搜集和整理資料,進而根據這些資料做出與總體相關的決策。
1.3 統計學的基本概念
1.3.1 隨機變量
統計學研究的是隨機現像的數量規律性。為了數學表述的方便,我們將表示隨機現像的各種可能結果的變量稱為隨機變量。這裡說的“各種可能結果”是隨機變量的可能取值。隨機現像和隨機變量隻是表述上的不同:如果說隨機現像“可以這樣發生,也可以那樣發生”,那麼隨機變量就“可以取這個值,也可以取那個值”。
隨機變量的取值可以是質的不同,也可以是量的不同。擲出的一枚硬幣落地後是正面朝上還是反面朝上,就是兩個不同的取值,且兩者間是質的不同;新生兒的性別,可以是男性,也可以是女性,也是不同質的取值。但是,考試的得分、心理測驗的分數、完成一項任務的用時以及正確率等,則是量的不同。
量的差異本身就是用數字表示的,例如,考試成績。質的差異可以用文字符號表示,也可以用數字表示,例如,用“H”表示正面朝上,用“T”表示反面朝上;或者用5、4、3、2、1分別表示優、良、中、及格、不及格等。
引入隨機變量的概念,是為了更好地對隨機現像進行定量的研究。因為單是知道隨機變量可以取哪些值是不夠的,還要研究它取各個值的可能性(概率)。
1.3.2 個體、總體和樣本
在統計學中,每一個原始數據都是從個體那裡獲得的。例如,要研究人的智力,就要編制一個能夠比較有效地測定智力的量表,然後纔能進行測驗和評定。從每個人那裡,我們都能得到一個(或一繫列)原始數據(觀察值)。這裡說的每個人就是“個體”,他們都有一個共同特性——智力水平。如果能測定世界上每一個人的智力,那就知道了“人”這個總體的智力情況。不過,限於人力、物力、經費和時間,對全世界每個個體都進行測定是不可能的。隻能抽取一部分個體進行測定,這一部分個體就組成了一個樣本。我們往往根據樣本的情況來推斷總體的情況。
根據這樣的關繫,可以為個體、總體與樣本分別下一個定義:
個體是我們所研究的隨機現像的載體,具有我們感興趣的某種共同特性,是組成總體的基本單位;
總體是具有某(些)共同特性的個體的總和;
樣本是從總體中抽取的作為觀測對像的一部分個體。
總體有無限總體和有限總體之分。如果一個總體包含的個體數目是無限的,就稱為無限總體;如果一個總體包含的個體數目是有限的,就稱為有限總體。例如,我們要研究今年某市小學一年級男生的肺活量情況,這時,該市今年入學的所有小學一年級男生就構成了一個有限總體。可是,當我們更籠統地說要研究小學一年級男生的身高時,從理論上來講,古今中外的小學一年級男生都應該成為研究對像,這就沒有一個明確的數目了,因而是一個無限總體。另外,就算隻對一個學生進行測量,如果我們對他進行無數次的測量(至少從理論上可以這樣假設),則測量得到的一切可能結果也可形成一個無限總體,隻不過這時的個體不是學生本人,而是測量所得的值——觀察值。總體是有限總體還是無限總體,可能會影響該選擇何種統計運算方法。
樣本對推斷統計學有特殊的意義。統計推斷就是根據樣本信息來推斷總體的情況。由於各種客觀條件的限制,我們無法將總體中的所有個體都觀察一遍,這時更是必須抽取樣本。不僅如此,在保證一定的研究精度的前提下,抽樣的個體數總是越少越好。
樣本中包含的個體數稱為樣本容量,一般用n表示。樣本容量越大,樣本的數字特征就越接近總體,從而能更精確地反映總體的情況。但是,容量過大則沒有必要,那樣反而會失去降低研究成本的意義。一般來說,n≥30的樣本稱為大樣本,n<30的樣本稱為小樣本。大樣本和小樣本所用的統計方法不一定相同。
在生活中,廣義的總體—樣本關繫無處不在。例如,我們通常會根據一個人的行為表現來判斷其人品。可是,我們隻能觀察到其一部分行為(相當於樣本),以此來估計其人品(相當於總體)。由於觀察到的樣本不同,我們就可能對同一個人做出不同的評價。
1.3.3 參數和統計量
總體和樣本有很多共同點:都是由一定數量的個體構成的,都可以計算出各種數量指標(例如,平均數、標準差、比例和相關繫數等)。但是它們之間畢竟存在著整體和部分的關繫。為了指稱時的方便,統計學家將總體和樣本的數量指標區分開來,分別稱為參數和統計量。根據總體中所有個體的觀察值計算出來的數量指標
(即總體平均數、總體標準差、總體比例和總體相關繫數等)被稱為參數,它們是總體上的數字特征;根據樣本中所有個體的觀察值計算出來的數量指標(即樣本平均數、樣本標準差、樣本比例和樣本相關繫數等)則被稱為統計量,它們是樣本上的數字特征。參數一般用希臘字母表示,統計量一般用拉丁字母表示。統計推斷就是根據樣本統計量來推斷相應的總體參數。例如,我們可以根據樣本平均數X來推斷總體平均數μ,根據樣本標準差S來推斷總體標準差σ,根據樣本相關繫數r來推斷總體的相關繫數ρ,等等。