復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)教研室(200032)
秦國友 趙耐青
?
·學(xué)術(shù)討論·
應(yīng)用t分布統(tǒng)計(jì)量和t檢驗(yàn)統(tǒng)計(jì)量介紹假設(shè)檢驗(yàn)原理
復(fù)旦大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)教研室(200032)
秦國友趙耐青
假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的一個(gè)重要內(nèi)容,也是醫(yī)學(xué)統(tǒng)計(jì)課堂教學(xué)的重點(diǎn)和難點(diǎn)之一。在講授這部分內(nèi)容時(shí),很多學(xué)生即使記住了相關(guān)的知識(shí)要點(diǎn),在理解和實(shí)際使用中可能會(huì)出現(xiàn)較多問題和偏差。
目前的醫(yī)學(xué)統(tǒng)計(jì)教材[1-4]對(duì)于假設(shè)檢驗(yàn)問題論述均是以單樣本t檢驗(yàn)為例,闡述假設(shè)檢驗(yàn)步驟和計(jì)算公式,最后得到t檢驗(yàn)統(tǒng)計(jì)量取值或借助統(tǒng)計(jì)軟件得到P值。在原假設(shè)H0成立情況下,如果t檢驗(yàn)統(tǒng)計(jì)量取值的絕對(duì)值大于t分布界值(也可以等價(jià)地?cái)⑹鰹镻值小于檢驗(yàn)水準(zhǔn)α),則這是一個(gè)小概率事件,對(duì)于一次隨機(jī)抽樣而言,一般是不會(huì)發(fā)生的,由此拒絕原假設(shè)H0而推斷備擇假設(shè)H1成立。
綜上所述,我們?cè)诮榻B假設(shè)檢驗(yàn)原理時(shí),僅僅以小概率事件作為拒絕H0的依據(jù)是有瑕疵的。為了敘述方便,本文將仍以單樣本單側(cè)t檢驗(yàn)為例,利用t分布統(tǒng)計(jì)量和t檢驗(yàn)統(tǒng)計(jì)量之間的關(guān)系,可以清晰地論述假設(shè)檢驗(yàn)原理。
假定X1,…,Xn是從正態(tài)分布總體N(μ,σ2)的一個(gè)隨機(jī)樣本,需要檢驗(yàn)的問題是:
H0∶μ=μ0H1∶μ>μ0
α=0.05
先舉例描述下列簡(jiǎn)單的統(tǒng)計(jì)性質(zhì):
1.t分布統(tǒng)計(jì)量:
(1)
2.構(gòu)造二個(gè)與t分布相似的統(tǒng)計(jì)量:
顯然統(tǒng)計(jì)量T1,統(tǒng)計(jì)量T2和t分布統(tǒng)計(jì)量的分布圖形狀是相同的,只是T1統(tǒng)計(jì)量和T2統(tǒng)計(jì)量的分布圖分別右平移2個(gè)單位和左平移1個(gè)單位。即:t分布統(tǒng)計(jì)量的分布圖的峰位置在t=0位置,統(tǒng)計(jì)量T1的分布圖的峰在T1=2位置和統(tǒng)計(jì)量T2的分布圖的峰在T2=-1位置,上述三個(gè)統(tǒng)計(jì)量的分布圖見圖1。
圖1 統(tǒng)計(jì)量的分布圖
t檢驗(yàn)統(tǒng)計(jì)量表達(dá)式如下
(2)
為了借助t檢驗(yàn)統(tǒng)計(jì)量與t分布統(tǒng)計(jì)量的關(guān)系詮釋假設(shè)檢驗(yàn)原理,可以把式(2)改寫為下式(3)
(3)
由式(3)可知,如果為真H0∶μ=μ0為真,t檢驗(yàn)=t分布統(tǒng)計(jì)量,若隨機(jī)抽樣得到的樣本,計(jì)算t檢驗(yàn)統(tǒng)計(jì)量出現(xiàn)t檢驗(yàn)>t0.05n-1的概率P(t檢驗(yàn)>t0.05,n-1|H0∶μ=μ0)=0.05,這是一個(gè)小概率事件。
由圖2所示,可知:當(dāng)H1∶μ>μ0為真時(shí),t檢驗(yàn)統(tǒng)計(jì)量>t分布界值tα,n-1的分布曲線下的面積為1-β較大甚至很大,即:t檢驗(yàn)統(tǒng)計(jì)量>t分布界值tα,n-1的概率較大或很大并且這個(gè)概率P(t檢驗(yàn)>t0.05,n-1|H1∶μ>μ0)就是檢驗(yàn)效能(Power)。
圖2 t檢驗(yàn)統(tǒng)計(jì)量分布示意圖
綜上所述,在H0∶μ=μ0為真情況下,如果隨機(jī)抽樣所得到的t檢驗(yàn)統(tǒng)計(jì)量的觀察值大于t分布界值tα,n-1是一個(gè)小概率事件,但在H1∶μ>μ0為真情況下,如果隨機(jī)抽樣所得到的t檢驗(yàn)統(tǒng)計(jì)量大于t分布界值tα,n-1不是一個(gè)小概率事件,并且其概率較大或很大,因此可以拒絕H0∶μ=μ0,推斷H1∶μ>μ0成立。
在許多醫(yī)學(xué)統(tǒng)計(jì)教材中常常強(qiáng)調(diào)了原假設(shè)的作用而相對(duì)忽略了對(duì)備擇假設(shè)的作用的論述。而備擇假設(shè)恰恰告訴我們?cè)谑裁辞闆r下拒絕原假設(shè)。只有將原假設(shè)和備擇假設(shè)結(jié)合起來,我們才可以作出正確的統(tǒng)計(jì)推斷。我們?cè)趯?shí)際中常用的P值的計(jì)算也是不僅僅基于H0∶μ=μ0而且還要考慮H1,才能基于是否為小概率事件進(jìn)行統(tǒng)計(jì)推斷的。通常P值的含義為在原假設(shè)成立的總體中抽樣出現(xiàn)比當(dāng)前樣本還要極端情況的概率。而這個(gè)定義中的極端情況就是指?jìng)鋼窦僭O(shè)成立的情況。
本文以單樣本單側(cè)t檢驗(yàn)為例,借助t分布與t檢驗(yàn)統(tǒng)計(jì)量之間的關(guān)系,較好地詮釋假設(shè)檢驗(yàn)的基本原理和思想,對(duì)于單樣本雙側(cè)t檢驗(yàn)和兩樣本成組t檢驗(yàn)同樣可以借助t分布與t檢驗(yàn)統(tǒng)計(jì)量之間的關(guān)系詮釋這些假設(shè)檢驗(yàn)的基本思想。在醫(yī)學(xué)統(tǒng)計(jì)的教學(xué)實(shí)踐中,我們通過這種方式對(duì)假設(shè)檢驗(yàn)進(jìn)行講授,并取得了良好的教學(xué)效果,學(xué)生對(duì)相關(guān)的知識(shí)點(diǎn)也有更好地理解和掌握。
[1]顏虹.醫(yī)學(xué)統(tǒng)計(jì)學(xué)(第二版).北京:人民衛(wèi)生出版社,2010.
[2]趙耐青,陳峰.衛(wèi)生統(tǒng)計(jì)學(xué).北京:高等教育出版社,2008.
[3]李康,賀佳,楊土保.醫(yī)學(xué)統(tǒng)計(jì)學(xué)(第6版).北京:人民衛(wèi)生出版社,2013.
[4]方積乾,徐勇勇,陳峰.衛(wèi)生統(tǒng)計(jì)學(xué)(第7版).北京:人民衛(wèi)生出版社,2013.
(責(zé)任編輯:郭海強(qiáng))
中央補(bǔ)助地方貴州省慢性病及其危險(xiǎn)因素監(jiān)測(cè)項(xiàng)目
劉濤,E-mail:liutao9099@163.com