[摘 要] 隨著心理學(xué)與多種學(xué)科的交叉融合,科學(xué)的研究方法與技術(shù)在心理學(xué)領(lǐng)域中得到了越來越普遍的應(yīng)用,對數(shù)據(jù)的分析與統(tǒng)計也成了心理學(xué)專業(yè)學(xué)生必備的一項重要技能。但對于本科生來說,在多種心理學(xué)課程中,心理統(tǒng)計學(xué)更為抽象,難以理解與掌握。以假設(shè)檢驗的α錯誤與β錯誤兩個重要的基礎(chǔ)概念為著眼點,先從最易于理解的刑事案件審判入手,再對兩個t檢驗例子進(jìn)行進(jìn)一步的研究,闡述了案例教學(xué)在心理統(tǒng)計學(xué)教學(xué)中的應(yīng)用,說明了案例式教學(xué)是促進(jìn)學(xué)生理解和運用心理統(tǒng)計學(xué)知識的重要方式。
[關(guān)鍵詞] 心理統(tǒng)計學(xué);案例教學(xué);α錯誤;β錯誤
[基金項目] 2019年度揚州大學(xué)“青藍(lán)工程”中青年學(xué)術(shù)帶頭人資助項目
[作者簡介] 安獻(xiàn)麗(1979—),女,河南開封人,醫(yī)學(xué)心理學(xué)博士,揚州大學(xué)教育科學(xué)學(xué)院副教授,主要從事情緒記憶及情緒調(diào)控研究。
[中圖分類號] G642.0? ?[文獻(xiàn)標(biāo)識碼] A? ?[文章編號] 1674-9324(2021)33-0145-04? ? [收稿日期] 2021-05-02
一、引言
心理學(xué)有一個短暫的歷史。美國著名的心理史學(xué)家墨菲曾說過,在1879年馮特建立第一個心理學(xué)實驗室之前,心理學(xué)一會“敲敲”生理學(xué)的門,一會“敲敲”倫理學(xué)的門,一會又“敲敲”認(rèn)識論的門,如同一個流浪兒。但自1879年之后,心理學(xué)不再依附于哲學(xué),而是邁入了一個新的時代,有了自己獨特的領(lǐng)域與名字,成了一門與物理學(xué)相似的學(xué)科。馮特在其1873—1874年出版的《生理心理學(xué)原理》中,把生理學(xué)和心理學(xué)聯(lián)合了起來,強(qiáng)調(diào)心理學(xué)采用生理學(xué)的實驗方法,以生理原因解釋心理事件,并經(jīng)生理學(xué)途徑完成對心理活動的自然主義理解。自第一個心理學(xué)實驗室建立以來,心理學(xué)實驗與量化研究在心理學(xué)領(lǐng)域變得越來越重要。
心理主義范式是科學(xué)主義心理學(xué)方法論的范式之一。這種范式將人視作自然界的組成部分,堅持心理學(xué)的自然科學(xué)定向,試圖引入自然科學(xué)的方法以構(gòu)建心理學(xué),強(qiáng)調(diào)客觀實證的研究立場,并以自然科學(xué)的模式闡述人的心理活動規(guī)律[1]。在當(dāng)代的心理學(xué)研究中,心理主義范式已得到廣泛的應(yīng)用。更重要的是,出現(xiàn)了心理學(xué)與多學(xué)科融合的趨勢。特別是在基礎(chǔ)研究領(lǐng)域,越來越多的心理學(xué)家開始關(guān)注認(rèn)知科學(xué),尤其是認(rèn)知神經(jīng)科學(xué)。認(rèn)知神經(jīng)科學(xué)強(qiáng)調(diào)對功能性核磁共振技術(shù)、事件相關(guān)電位技術(shù)、腦磁圖、單細(xì)胞記錄技術(shù)和腦損傷技術(shù)等的應(yīng)用。Rand和Ilardi認(rèn)為,認(rèn)知神經(jīng)科學(xué)是心理學(xué)和自然科學(xué)相互作用的結(jié)果[2],因此對認(rèn)知神經(jīng)科學(xué)的研究使心理學(xué)研究更加接近心理的自然法則。在這種多學(xué)科融合的基礎(chǔ)上,已經(jīng)產(chǎn)生了諸如神經(jīng)心理學(xué)、生理心理學(xué)、神經(jīng)認(rèn)知網(wǎng)絡(luò)、工程心理學(xué)等多種新興學(xué)科和研究領(lǐng)域。伴隨著這些研究領(lǐng)域的出現(xiàn),心理學(xué)也逐漸脫去其人文科學(xué)的外衣,朝著自然科學(xué)迅速前進(jìn)。
相應(yīng)地,“心理統(tǒng)計學(xué)”也成為心理學(xué)專業(yè)的一門重要基礎(chǔ)課程。但是由于統(tǒng)計學(xué)中存在大量的公式與抽象的概念,以及紛繁復(fù)雜的數(shù)據(jù)與相應(yīng)的數(shù)據(jù)統(tǒng)計方法,很多心理學(xué)專業(yè)的本科生與研究生對統(tǒng)計學(xué)望而生畏。那么,要幫助學(xué)生理解心理統(tǒng)計學(xué)抽象的術(shù)語及公式,以及學(xué)會靈活運用具體的統(tǒng)計方法分析數(shù)據(jù),就要通過一個或幾個獨特案例,在案例教學(xué)中讓學(xué)生自主思考和分析,進(jìn)而建立適合自己思考問題的方式,啟發(fā)學(xué)生獨立探索和分析解決問題的能力[3]。本文認(rèn)為,利用案例教學(xué),從實際案例入手,是促進(jìn)學(xué)生充分理解心理統(tǒng)計學(xué)基礎(chǔ)概念與知識體系的關(guān)鍵。下面以假設(shè)檢驗的兩類錯誤為例,談?wù)勈褂冒咐虒W(xué)方法提升心理統(tǒng)計學(xué)的教學(xué)效果。
二、案例導(dǎo)入
案例1:辛普森是20世紀(jì)90年代美國非常有名的橄欖球球星。在1994年的一個夜晚,辛普森的前妻和其前妻的男友被人殺死在自己的住宅里。由于辛普森無法提供不在場證據(jù),因此具有非常大的嫌疑,但警方也沒有強(qiáng)有力的證據(jù)證明辛普森就是罪犯。在這種情況下,最終判案結(jié)果只能由100名陪審員做出裁決。
在刑事案件審判中,如果有人持有異議,就無法做出有罪判決,同樣也不能無罪判決,犯罪嫌疑人只能繼續(xù)關(guān)押不得釋放。那么,就會出現(xiàn)以下兩種情況:一是犯罪嫌疑人確實無罪,但有5名陪審員認(rèn)為其有罪,所以犯罪嫌疑人會被繼續(xù)關(guān)押而得不到自由,此時相當(dāng)于陪審員的犯錯概率為0.05(p=0.05);二是犯罪嫌疑人確實有罪,但有10名陪審員認(rèn)為其無罪,因此法官無法做出有罪判決,即陪審員的錯誤裁決概率為0.1(p=0.1)。
案例2:假設(shè)現(xiàn)有兩本青少年學(xué)生的身體發(fā)育狀況記錄本,一本為男孩的信息,一本為女孩的信息,但是由于記錄本的封面丟失,工作人員不知道哪本是男孩的哪本是女孩的。已知同齡女生的平均身高為μ女=162cm,工作人員從兩本中任選一本并隨機(jī)抽取了容量n=36的樣本,檢查此樣本的平均身高是否高于162cm,這樣就可以判斷哪本是男孩哪本是女孩。針對此樣本,假設(shè)有兩種可能的結(jié)果,引導(dǎo)學(xué)生分析不同條件下可能會出現(xiàn)的錯誤結(jié)果。
案例2之結(jié)果一:“樣本均值X=164cm,樣本標(biāo)準(zhǔn)差S=6.5cm。那么,此記錄本是男孩的還是女孩的?”針對此問題,進(jìn)行如下檢驗:步驟1:提出假設(shè)。虛無假設(shè)H0:μ1≤μ女,即此記錄本上的身高不高于女生的平均身高;備擇假設(shè)H1:μ1>μ女,即此記錄本上的身高高于女生的平均身高。步驟2:計算統(tǒng)計量t值,結(jié)果t值為1.85。步驟3:做出統(tǒng)計決斷,設(shè)顯著性水平α=0.05,由于要檢驗此記錄本上的身高是否高于女生的平均身高,故采用單尾檢驗。已知n=36,故自由度df=36-1=35,查t的臨界值表得到臨界值t0.05=1.69,與臨界值比較:|t|=1.85>t0.05=1.69,因此p<0.05,故拒絕虛無假設(shè)H0,接受備擇假設(shè)H1,即認(rèn)為此記錄本屬于男孩。在圖1A中,可以認(rèn)為此樣本來自男生。而假如真實的情況是此樣本來自女生記錄本,則此統(tǒng)計決斷就出現(xiàn)了錯誤,即α錯誤或I類錯誤。
案例2之結(jié)果二:“樣本均值X=164cm,樣本標(biāo)準(zhǔn)差S=7.5cm。那么,此記錄本是男孩的還是女孩的?”檢驗步驟如下:步驟1:提出假設(shè)。虛無假設(shè)H0:μ1≤μ女,即此記錄本上的身高不高于女生的身高;備擇假設(shè)H1:μ1>μ女,即此記錄本上的身高高于女生的身高。步驟2:計算統(tǒng)計量t值,結(jié)果t值約為1.6。步驟3:做出統(tǒng)計決斷,設(shè)顯著性水平α=
0.05,由于要檢驗此記錄本上的身高是否高于女生的平均身高,故采用單尾檢驗。已知n=36,故自由度df=36-1=35,查t的臨界值表得到臨界值t0.05=
1.69,與臨界值比較:|t|=1.6
案例3:智能手機(jī)與電腦的便利性使得越來越多的研究者重視其在心理治療中的作用。Sarah等的考察基于智能手機(jī)與電腦的認(rèn)知行為療法(CBT)在治療抑郁癥上的療效差異[4]。假設(shè)將30名抑郁癥患者隨機(jī)分為兩組,每組各15名。一組使用手機(jī)App接受Mobile-CBT干預(yù),一組使用電腦程序接受Computer-CBT干預(yù)。一段時間后考察兩組的抑郁水平是否存在顯著差異,假設(shè)有如下兩種可能的結(jié)果。
案例3之結(jié)果一:“兩組樣本均值分別為
XMobile=12.5,XComputer=15,樣本標(biāo)準(zhǔn)差分別為
SMobile=3.2,SComputer=2.8。兩種治療途徑的療效有無顯著差異?”同樣,檢驗步驟如下:步驟1:提出假設(shè),虛無假設(shè)H0:μMoble-μComputer=0,即二者療效無顯著差異;備擇假設(shè)H1:μMoble-μComputer≠0,即二者療效有顯著差異。步驟2:計算統(tǒng)計量t值,結(jié)果t值為-2.2。步驟3:做出統(tǒng)計決斷,設(shè)顯著性水平α=0.05,由于沒有對兩種治療途徑的療效高低做出預(yù)測,故采用雙尾檢驗。已知各組n=15,故自由度df=15+15-2=28,查t的臨界值表得到臨界值t0.05=
2.048,與臨界值比較:|t|=2.2>t0.05=2.048,因此p<0.05,故拒絕虛無假設(shè)H0,接受備擇假設(shè)H1,即認(rèn)為兩種治療途徑的療效存在顯著差異。而假如真實的情況是二者療效并無顯著差異,則此統(tǒng)計決斷就出現(xiàn)了錯誤,即α錯誤或I類錯誤。
案例3之結(jié)果二:“兩組樣本均值分別為
XMobile=12.5,XComputer=14.5,樣本標(biāo)準(zhǔn)差分別為
SMobile=3.2,SComputer=2.8。兩種治療途徑的療效有無顯著差異?”規(guī)范的檢驗步驟如下。步驟1:提出假設(shè),虛無假設(shè)H0:μMoble-μComputer=0,即二者療效無顯著差異;備擇假設(shè)H1:μMoble-μComputer≠0,即二者療效有顯著差異。步驟2:計算統(tǒng)計量t值,結(jié)果t值為-1.94。步驟3:做出統(tǒng)計決斷,設(shè)顯著性水平α=0.05,由于沒有對兩種治療途徑的療效高低做出預(yù)測,故采用雙尾檢驗。已知各組n=15,故自由度df=15+15-2
=28,查t的臨界值表得到臨界值t0.05=2.048,與臨界值比較:|t|=1.94
三、兩類錯誤的概念及其關(guān)系
根據(jù)以上不同案例所假設(shè)的結(jié)果,引導(dǎo)學(xué)生認(rèn)識到α錯誤(也叫I類錯誤)是虛無假設(shè)為真而被拒絕的錯誤;β錯誤(也叫II類錯誤)是虛無假設(shè)為假而被接受的錯誤。基于此,讓學(xué)生進(jìn)一步思考如下問題:(1)α錯誤與β錯誤分別是多大;(2)α錯誤與β錯誤產(chǎn)生的原因是什么;(3)如何控制α錯誤與β錯誤。
從以上案例可以看出,在做統(tǒng)計決斷時,我們是依據(jù)一定的顯著性水平α,考察樣本統(tǒng)計量是否來自總體均值為特定值(如為零)的抽樣分布。當(dāng)H0為真而被拒絕時,我們的依據(jù)是概率為α的小概率事件發(fā)生了。α錯誤的大小可以看作設(shè)定的顯著性水平α,因此通過設(shè)定α水平的大小以控制α錯誤。α的大小雖然通常是人為規(guī)定的,但也有一定的依據(jù)[5],通常為0.05或0.01。而H0本身為真卻被拒絕,很大可能是因為樣本本身不具有代表性,如樣本中包含了一些極端的數(shù)據(jù)而導(dǎo)致其與總體存在很大差異,也可能是由于顯著性水平α的標(biāo)準(zhǔn)過于寬松[6]。
對于β錯誤,可以通過圖2幫助學(xué)生深入理解。本文案例2中,工作人員抽取的36名學(xué)生的身高均值為164cm,我們需檢驗此36人是否來自女生記錄本。基于此條件,可能出現(xiàn)多種結(jié)果,其中比較典型的結(jié)果可以用圖2來表示。其中A、B、C、D分別對應(yīng)以下四種情況:A.女生與男生的總體身高均值分別為162cm、165cm,抽樣標(biāo)準(zhǔn)誤差為1.6;B.女生與男生的總體身高均值分別為162cm、165cm,抽樣標(biāo)準(zhǔn)誤差為1.2;C.女生與男生的總體身高均值分別為162cm、167cm,抽樣標(biāo)準(zhǔn)誤差為1.6;D.女生與男生的總體身高均值分別為162cm、167cm,抽樣標(biāo)準(zhǔn)誤差為1.2。
在設(shè)置同樣的顯著性水平α=0.05的條件下,不同情況的β錯誤水平不同。圖2A與圖2C或圖2B與圖2D,在特定的抽樣誤差下,當(dāng)總體均值差異較小時,β錯誤較大,統(tǒng)計檢驗效力1-β就會較小,提示處理效應(yīng)的大小影響了β錯誤大小與統(tǒng)計檢驗效力。圖2A與圖2B或圖2C與圖2D顯示,在特定的總體均值差下,抽樣誤差較大時,β錯誤較大,統(tǒng)計檢驗效力1-β就會較小,提示實驗設(shè)計的靈敏度、樣本數(shù)據(jù)的變異性等影響了β錯誤的大小與統(tǒng)計檢驗效力。
從圖2可以看出,顯著性水平α的選取是影響I類錯誤的關(guān)鍵因素,但是如果為了控制I類錯誤而降低顯著性水平,則會增加犯II類錯誤的概率。如此看來,I類錯誤與II類錯誤如同蹺蹺板的兩端,似乎存在此消彼長的關(guān)系。那么如何在不增加α錯誤的條件下降低β錯誤的概率呢?圖2顯示,當(dāng)抽樣標(biāo)準(zhǔn)誤差降低時,β錯誤就會隨之降低,而抽樣標(biāo)準(zhǔn)誤差會受到樣本容量的直接影響,因此若想同時使犯兩類錯誤的概率都降低,可以通過增加樣本容量的途徑來實現(xiàn)。
四、結(jié)語
上述案例從最易于理解的計數(shù)數(shù)據(jù)入手,先讓學(xué)生初步理解統(tǒng)計決斷可能產(chǎn)生的錯誤,再以比較生活化的案例為例,讓學(xué)生從單樣本t檢驗理解α錯誤與β的含義,最后以比較專業(yè)的研究案例為例,讓學(xué)生從獨立樣本t檢驗理解α錯誤與β錯誤。在這些案例教學(xué)的基礎(chǔ)上,給學(xué)生概括出什么是α錯誤與β錯誤,并從不同的結(jié)果條件下,幫助學(xué)生理解α錯誤與β錯誤的關(guān)系及其大小。通過對實例的分析,一方面能夠幫助學(xué)生深入地理解課堂上所學(xué)習(xí)的心理統(tǒng)計學(xué)知識,另一方面能夠培養(yǎng)學(xué)生主動利用課堂知識分析實際問題的能力,最終應(yīng)用于現(xiàn)實生活與心理科學(xué)的問題研究中。在“心理統(tǒng)計學(xué)”課程的講授過程中,教師應(yīng)考慮學(xué)生的實際接受能力,以貼近學(xué)生生活的大量實例為基礎(chǔ),結(jié)合經(jīng)典的科學(xué)研究報告,促進(jìn)學(xué)生對課程知識內(nèi)容的理解與應(yīng)用,同時輔以統(tǒng)計軟件,減少學(xué)生學(xué)習(xí)的畏難情緒,由淺入深地讓學(xué)生樂于學(xué)習(xí),并最終學(xué)以致用。
參考文獻(xiàn)
[1]彭運石,袁俏.論科學(xué)心理學(xué)的三種范式[J].湖南師范大學(xué)教育科學(xué)學(xué)報,2009,8(5):114-117.
[2]Kevin L. Rand,Stephen S. Ⅱardi.Toward a Consilient Science of Psychology[J].Journal of Clinical Psychology,2005,61(1):7-20.
[3]張家軍,靳玉樂.論案例教學(xué)的本質(zhì)與特點[J].中國教育學(xué)刊,2004(1):51-53+65.
[4]Sarah Watts, Anna Mackenzie, Cherian Thomas et al.CBT for Depression: A Pilot RCT Comparing Mobile Phone vs. Computer[J].BioMed Central,2013,13(1):49.
[5]胡竹菁,戴海琦.心理學(xué)實驗研究的效果大小[J].心理學(xué)探新,2017,37(1):70-77.
[6]甘怡群,張軼文,鄒玲.心理與行為科學(xué)統(tǒng)計[M].北京:北京大學(xué)出版社,2005.
Application of Case Teaching in the Course of Psychological Statistics: Taking the Two Types of Errors in Hypothesis Testing as an Example
AN Xian-li
(School of Educational Science, Yangzhou University, Yangzhou, Jiangsu 225002, China))
Abstract: As the interdisciplinary integration of psychology with various disciplines, scientific research methods and techniques have been more and more widely used in the psychology research. Data analysis and statistics have become important skills for students majoring in psychology. However, for undergraduates, Psychological Statistics is more abstract and difficult to understand and master when compared with other psychology courses. By taking alpha and beta errors in hypothesis testing as an important example and using a criminal case trial and two t-test examples as the teaching cases, this paper elaborates the application of teaching cases in the teaching of Psychological Statistics. The results illustrates that case teaching is an important way to promote students to understanding and use the knowledge of Psychological Statistics.
Key words: Psychological Statistics; case teaching; alpha error; beta error