曾 弦
(深圳市高級(jí)中學(xué) 廣東深圳 518040)
χ2檢驗(yàn)在 IBDP(International Baccalaureate Diplo?ma Programme)生物教學(xué)中主要有兩種用途:獨(dú)立性檢驗(yàn)和適合性檢驗(yàn),這兩者都適用于離散型數(shù)據(jù)的假設(shè)檢驗(yàn),其基本原理是通過(guò)χ2值的大小來(lái)檢驗(yàn)實(shí)際觀測(cè)值與理論值之間的偏離程度。獨(dú)立性檢驗(yàn)是判斷兩個(gè)或兩個(gè)以上因素之間是否具有關(guān)聯(lián)關(guān)系的假設(shè)檢驗(yàn);適合性檢驗(yàn)是比較觀測(cè)值與理論值是否符合的假設(shè)檢驗(yàn)。下面結(jié)合IBDP生物教材中的具體案例來(lái)詳細(xì)說(shuō)明。
獨(dú)立性檢驗(yàn)是研究?jī)蓚€(gè)或兩個(gè)以上因子彼此之間是相互獨(dú)立還是相互影響的一類統(tǒng)計(jì)方法。具體做法是,先提出無(wú)效假設(shè)(H0),假設(shè)所觀測(cè)的各屬性之間沒(méi)有關(guān)聯(lián),根據(jù)無(wú)效假設(shè)計(jì)算理論數(shù),在一定自由度下以給定的顯著性水平做出判斷,最后證明無(wú)效假設(shè)是否成立。若拒絕無(wú)效假設(shè)(H0),則說(shuō)明兩種因子之間的關(guān)聯(lián)是顯著的;若接受無(wú)效假設(shè)(H0),則說(shuō)明兩種因子之間無(wú)關(guān)聯(lián),是相互獨(dú)立的。獨(dú)立性檢驗(yàn)的形式有多種,常利用列聯(lián)表進(jìn)行檢驗(yàn),在生物學(xué)研究中常用2×2列聯(lián)表。在IBDP生物中獨(dú)立性檢驗(yàn)主要應(yīng)用于“生態(tài)學(xué)”這一章,用來(lái)檢驗(yàn)兩個(gè)物種的分布是否具有關(guān)聯(lián)性。
以2014年牛津大學(xué)出版社出版的IB Diploma Programme:Biology中第四章“生態(tài)學(xué)”中課后習(xí)題為例詳細(xì)說(shuō)明。
英國(guó)什羅普郡某山頂上的草地,這個(gè)地區(qū)在夏天有綿羊在此放牧,此外還有登山者在草地上穿過(guò)。草地上有凸起的小丘,上面長(zhǎng)著石楠(Calluna vulgaris)。對(duì)該處的肉眼觀察發(fā)現(xiàn),有一種苔蘚(Rhytidiadelphus squarrosus)與這種石楠有關(guān)。隨機(jī)調(diào)查統(tǒng)計(jì)了100個(gè)樣方的數(shù)據(jù),兩個(gè)物種的分布情況見(jiàn)表1。這兩個(gè)物種的分布是否具有關(guān)聯(lián)性?
表1 兩個(gè)物種的分布
解題步驟如下:
(1)構(gòu)建一個(gè)觀察值的列聯(lián)表:基于已知數(shù)據(jù)構(gòu)建一個(gè)2×2列聯(lián)表,即橫行分為兩組數(shù)據(jù),縱列也分為兩組數(shù)據(jù)(表2)。
表2 根據(jù)表1所構(gòu)建的列聯(lián)表
(2)假設(shè)兩個(gè)物種的分布沒(méi)有關(guān)聯(lián),計(jì)算理論值(理論值=行總和×列總和/總數(shù))。理論值的結(jié)果見(jiàn)表3。
表3 理論值的計(jì)算結(jié)果
(3)確定自由度:自由度有公式,df=(m-1)(n-1),m是行數(shù),n是列數(shù)。在生物學(xué)研究中常用2×2列聯(lián)表,故自由度常等于1。本題中自由度=(2-1)(2-1)=1。
(4)確定臨界值:要確定一個(gè)否定無(wú)效假設(shè)(H0)的概率標(biāo)準(zhǔn),這個(gè)概率標(biāo)準(zhǔn)叫做顯著性水平或者概率水平,記做α。α是人為規(guī)定的小概率界限,生物學(xué)研究中常取α=0.05和α=0.01兩個(gè)顯著水平,IBDP生物中常取α=0.05。
查χ2值表(常見(jiàn)用表)可以看出,α=0.05,df=1時(shí),臨界值為3.84。
(5)計(jì)算本題中的χ2值。
其中,f0表示觀察頻率;fe表示理論頻率。χ2=(57-42.2)2/42.2+(7-21.8)2/21.8+(9-23.8)2/23.8+(27-12.2)2/12.2=5.190 5+10.047 7+9.203 4+17.954 1=42.395 7。
(6)陳述無(wú)效假設(shè)H0和備擇假設(shè)H1,并使用卡方檢驗(yàn)的計(jì)算值對(duì)其進(jìn)行評(píng)估:無(wú)效假設(shè)H0:石楠和苔蘚的分布是相互獨(dú)立的;備擇假設(shè)H1:石楠和苔蘚的分布是有顯著關(guān)聯(lián)的。
計(jì)算出的卡方值42.395 7大于臨界值3.84,有證據(jù)表明這兩個(gè)物種之間存在5%的關(guān)聯(lián),即可以拒絕無(wú)效假設(shè)H0,接受假設(shè)H1,即石楠和苔蘚的分布是有顯著關(guān)聯(lián)的。
如計(jì)算出的卡方值小于或者等于臨界值3.84,則不能拒絕無(wú)效假設(shè)H0。沒(méi)有證據(jù)表明這兩個(gè)物種之間有5%的關(guān)聯(lián),即石楠和苔蘚的分布是相互獨(dú)立的。
比較觀測(cè)值與理論值是否符合的假設(shè)檢驗(yàn)叫適合性檢驗(yàn)。這種方法是先對(duì)樣本的理論值通過(guò)一定的理論分布推算出來(lái),再用實(shí)際觀察值與理論值比較,從而得出實(shí)際觀測(cè)值與理論值之間是否吻合的結(jié)論。在IBDP生物中適合性檢驗(yàn)主要應(yīng)用于遺傳學(xué)這一章,用來(lái)檢測(cè)所得的結(jié)果是否符合孟德?tīng)柗蛛x定律、自由組合定律等。
做適合性檢驗(yàn)時(shí),可以先提出無(wú)效假設(shè)H0:O-E=0,即觀察值與理論值之間沒(méi)有差異,再計(jì)算樣本的卡方值χ2,根據(jù)規(guī)定的顯著性水平α和自由度df從χ2值表(常見(jiàn)用表)中查出相應(yīng)的卡方值,如果計(jì)算出的卡方值大于查表所得卡方值,則拒絕無(wú)效假設(shè)H0,如果計(jì)算出的卡方值小于查表所得卡方值,則接受無(wú)效假設(shè)H0。
以2014年劍橋大學(xué)出版社出版的Biology for the IB Diploma中第十章“遺傳學(xué)”中課后習(xí)題為例詳細(xì)說(shuō)明。
例:孟德?tīng)枂我蜃与s交實(shí)驗(yàn)。有人種植了7 324株豌豆,在這一代中,他觀察到5 474株黃色種子植物和1 850株綠色種子植物。這一實(shí)際觀察值是否符合孟德?tīng)栆粚?duì)等位基因的遺傳規(guī)律,即黃色種子∶綠色種子=3∶1?
本例為判斷實(shí)際觀察值與理論比率是否相符的問(wèn)題,屬于典型的適合性檢驗(yàn)問(wèn)題。解題步驟如下:
(1)設(shè)置無(wú)效假設(shè)H0:黃色種子與綠色種子符合3∶1的比率。對(duì)于一個(gè)單因子雜交實(shí)驗(yàn)來(lái)說(shuō),理論的表型比率F1代是3∶1。如果計(jì)算7 324株植物,理論上,預(yù)期比率(E)將是5 493∶1 831(即3∶1)見(jiàn)表4。
表4 理論值的計(jì)算過(guò)程
其中,O表示觀察值;E表示理論。χ2=(5 474-5 493)2/5 493+(1 850-1 831)2/1 831=0.065+0.197=0.262。
(3)確定自由度:自由度df,即結(jié)果中的類別數(shù)減去1。此題中只有兩種類型(黃色種子和綠色種子),因此自由度df=2-1=1。
(4)找到自由度是1,顯著性水平為5%(0.05時(shí))的臨界卡方值,將計(jì)算出的卡方值與查表值比較。如果計(jì)算出的卡方值大于這個(gè)值意味著拒絕無(wú)效假設(shè)H0,即不符合3∶1的分離比;如果計(jì)算出的卡方值小于這個(gè)值意味著接受無(wú)效假設(shè)H0,即符合3∶1的分離比。在本題中計(jì)算出的卡方值是0.262,查表所得卡方值是3.841,0.262小于3.841,因此接受接受無(wú)效假設(shè)H0,假設(shè)觀察到的結(jié)果和預(yù)期結(jié)果之間沒(méi)有顯著差異,即結(jié)果符合3∶1的預(yù)期分離比。
生物學(xué)是一門實(shí)驗(yàn)學(xué)科,實(shí)驗(yàn)數(shù)據(jù)的分析和處理是非常重要的研究手段。我國(guó)高中生物學(xué)課程標(biāo)準(zhǔn)中沒(méi)有對(duì)生物數(shù)據(jù)的統(tǒng)計(jì)以及掌握程度做明確規(guī)定,教材中也沒(méi)有單獨(dú)設(shè)置的章節(jié)加以介紹,各類考試評(píng)價(jià)中也未有相關(guān)要求。學(xué)生在高中生物實(shí)驗(yàn)中獲得數(shù)據(jù),僅進(jìn)行記錄和簡(jiǎn)單的處理即可,沒(méi)有利用統(tǒng)計(jì)學(xué)的手段來(lái)對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行系統(tǒng)分析。生物統(tǒng)計(jì)學(xué)相關(guān)的內(nèi)容在我國(guó)往往被放在大學(xué)生物學(xué)專業(yè)講述。
IBDP生物學(xué)對(duì)實(shí)驗(yàn)數(shù)據(jù)的處理有較高的要求,2011年IBDP生物學(xué)大綱第一部分就是統(tǒng)計(jì)分析,明確學(xué)生必須掌握平均數(shù)、標(biāo)準(zhǔn)差、正態(tài)分布以及如何表示數(shù)據(jù)測(cè)量的誤差,并且能用統(tǒng)計(jì)學(xué)的方法進(jìn)行數(shù)據(jù)處理,如用t檢驗(yàn)來(lái)判斷數(shù)據(jù)間平均值之間是否存在顯著性差異,又或者偶然因素導(dǎo)致。2016年新修訂的IBDP生物學(xué)大綱另外增加了卡方檢驗(yàn)的內(nèi)容。這些足見(jiàn)IBDP生物對(duì)數(shù)據(jù)處理的重視程度,也顯示了實(shí)驗(yàn)科學(xué)在自然科學(xué)學(xué)科中的重要地位,這種能力的培養(yǎng)對(duì)于學(xué)生閱讀生物學(xué)文獻(xiàn)以及處理生物學(xué)實(shí)驗(yàn)數(shù)據(jù)是非常重要的。IBDP生物學(xué)作為一門實(shí)驗(yàn)學(xué)科,注重實(shí)驗(yàn)數(shù)據(jù)的規(guī)范表達(dá)和生物統(tǒng)計(jì)方法的應(yīng)用,這些應(yīng)是我國(guó)高中生物課程的借鑒之處。