◆陳秋鳳 周防震 袁德培
試卷分析是教師完成教學(xué)工作的重要環(huán)節(jié)之一,學(xué)生成績(jī)分布是試卷分析的重要組成部分。成績(jī)正態(tài)分布是一種概率分布的特殊表現(xiàn)形式,在統(tǒng)計(jì)某次考試成績(jī)分布規(guī)律的時(shí)候,將成績(jī)按分?jǐn)?shù)段制成統(tǒng)計(jì)圖,如果成績(jī)分布圖中中等成績(jī)占最多數(shù),其余成績(jī)以中等成績(jī)?yōu)橹休S,向兩側(cè)逐次降低,則稱這次成績(jī)呈正態(tài)分布。然而在實(shí)踐中,教師在進(jìn)行學(xué)生成績(jī)分布的正態(tài)性分析時(shí)常常存在主觀臆斷,只要看到有“兩頭低、中間高”的趨勢(shì),就主觀認(rèn)為符合正態(tài)分布,否則就認(rèn)為不符合正態(tài)分布。
圖1為生物制藥工程與設(shè)備課程學(xué)生成績(jī)的頻次圖,可以看出成績(jī)分布與正態(tài)分布有些許偏差。教師在試卷分析時(shí)容易存在主觀偏見,即不加檢驗(yàn),認(rèn)為學(xué)生成績(jī)不符合正態(tài)分布。事實(shí)上,某次考試學(xué)生成績(jī)分布是否真正服從正態(tài)分布,需要進(jìn)行正態(tài)性檢驗(yàn)。
正態(tài)概率圖 概率圖(probability-probability plot,P-P plot)是以實(shí)際或觀察的累積頻率(X)對(duì)被檢驗(yàn)分布的理論或期望累積頻率作圖(Y)。如果所分析的數(shù)據(jù)來自正態(tài)分布,正態(tài)P-P圖圖形的散點(diǎn)應(yīng)該呈現(xiàn)一條直線。圖2為生物制藥工程與設(shè)備課程考試74個(gè)學(xué)生成績(jī)的P-P圖,可以看出散點(diǎn)近似在一條直線,中部散點(diǎn)較多地靠近直線上方。
分位數(shù)圖 分位數(shù)圖(quantile-quantile piot,Q-Q plot)是以實(shí)際或觀察的分位數(shù)(X)對(duì)被檢驗(yàn)分布的理論或期望分位數(shù)(Y)作圖。如果所分析的數(shù)據(jù)來自正態(tài)分布,則Q-Q圖上的數(shù)據(jù)點(diǎn)應(yīng)分布在從左下到右上的直線附件,否則數(shù)據(jù)點(diǎn)偏離直線較遠(yuǎn)。圖3為生物制藥工程與設(shè)備課程考試74個(gè)學(xué)生成績(jī)的Q-Q圖,可以看出散點(diǎn)近似在一條直線,且擬合程度比P-P圖(圖2)好,說明利用圖示法進(jìn)行正態(tài)性檢驗(yàn),Q-Q圖的效率比P-P圖高。
矩法 矩法(method of moment,又稱動(dòng)差法)是利用數(shù)學(xué)上的矩原理來檢驗(yàn)偏度和峰度。偏度指分布不對(duì)稱的程度和方向,用偏度系數(shù)(coefficient of skewness)來衡量,樣本偏度系數(shù)用g1表示,總體偏度系數(shù)用γ1表示;而峰度則指分布與正態(tài)曲線相比的冒尖程度或扁平程度,用峰度系數(shù)(coefficient of kurtosis)衡量,樣本峰度系數(shù)用g2表示,總體峰度用γ2表示。理論上,總體偏度系數(shù)γ1=0為對(duì)稱,γ1>0為正偏態(tài),γ1<0為負(fù)偏態(tài);總體峰度系數(shù)γ2=0為正態(tài)峰,γ2>0為尖峭峰,γ2<0為平闊峰。只有同時(shí)滿足對(duì)稱和正態(tài)峰兩個(gè)條件時(shí),才能認(rèn)為資料服從正態(tài)分布[1]。其中g(shù)1和g2統(tǒng)計(jì)量的計(jì)算公式為:
式中X為變量值,f為相同X值的個(gè)數(shù),n為樣本含量。當(dāng)用原始數(shù)據(jù)進(jìn)行計(jì)算時(shí),f=1。因此,上兩式無論n的大小均適用。g1和g2統(tǒng)計(jì)量的標(biāo)準(zhǔn)誤計(jì)算公式為:
g1和g2的抽樣分布近似正態(tài)分布,故可用μ檢驗(yàn)進(jìn)行正態(tài)性檢驗(yàn)。
1)建立假設(shè)檢驗(yàn),確定檢驗(yàn)標(biāo)準(zhǔn)。
H0:γ1=0且γ2=0,即總體服從正態(tài)分布。
H1:γ1≠0或(和)γ2≠0,即總體不服從正態(tài)分布。
α=0.10(欲不拒絕H0,α宜稍大以減少Ⅱ型錯(cuò)誤)。
2)計(jì)算檢驗(yàn)統(tǒng)計(jì)量。利用生物制藥工程與設(shè)備課程考試74個(gè)學(xué)生成績(jī)的原始數(shù)據(jù),f=1,X為74個(gè)學(xué)生成績(jī)。
令 ∑fX=∑X=6239,∑fX2=∑X2=531 843,∑fX3=∑X3=45 811 973,∑fX4=∑X4=3 985 200 975,按上述公式計(jì)算得g1和g2分別為-0.214 0和-0.279 5;σg1和σg2分別為0.279 2和0.551 7。故有:
3)確定P值,做出推斷結(jié)論。查μ界值表,雙尾檢測(cè),μ0.05=1.64,可見峰度P>0.05,偏度P>0.05。按照α=0.10水平,不能拒絕H0,無統(tǒng)計(jì)學(xué)意義,即尚不能認(rèn)為學(xué)生成績(jī)的總體不服從正態(tài)分布。
從學(xué)生成績(jī)頻次圖(圖1)直觀判斷,容易認(rèn)為生物制藥工程與設(shè)備課程學(xué)生成績(jī)的分布不符合正態(tài)分布;但圖示法(包括P-P法和Q-Q法)和矩法結(jié)果均顯示還不能認(rèn)為該課程學(xué)生成績(jī)的分布不服從正態(tài)分布,表明教師在進(jìn)行學(xué)生成績(jī)的正態(tài)性評(píng)價(jià)時(shí),僅從成績(jī)分布頻次圖進(jìn)行直觀判斷容易陷入“主觀”臆斷,科學(xué)的判斷需要借助于一定的正態(tài)檢驗(yàn)方法。P-P和Q-Q圖示法具有簡(jiǎn)單明了的特征,從本文可以看出,Q-Q圖示法(分位數(shù)圖法)擬合程度優(yōu)于P-P圖示法,說明其檢驗(yàn)效率更高更好。但圖示法只能定性,難以定量判斷,而矩法具有明顯的定量特征。盡管矩法涉及繁瑣的公式計(jì)算,但借助于常用統(tǒng)計(jì)分析軟件(如SPSS),很容易計(jì)算偏度(Skewness)系數(shù)g1和峰度(Kurtosis)系數(shù)g2兩個(gè)統(tǒng)計(jì)量[2],以及它們各自對(duì)應(yīng)的標(biāo)準(zhǔn)誤σg1和σg2。綜合認(rèn)為,借助SPSS等統(tǒng)計(jì)分析軟件,矩法分析結(jié)合假設(shè)檢驗(yàn),是教師進(jìn)行試卷分析時(shí)評(píng)價(jià)學(xué)生成績(jī)符合正態(tài)分布與否的客觀方法。■
[1]孫振球.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M].北京:人民衛(wèi)生出版社,2010.
[2]時(shí)立文.SPSS19.0統(tǒng)計(jì)分析從入門到精通[M].北京:清華大學(xué)出版社,2012.