代婷
濟(jì)南職業(yè)學(xué)院基礎(chǔ)部, 濟(jì)南 250014
對參數(shù)假設(shè)檢驗(yàn)中幾對關(guān)系的研究
代婷
濟(jì)南職業(yè)學(xué)院基礎(chǔ)部, 濟(jì)南 250014
A Research on several couples of relationships of the Hypothesis Testing
參數(shù)假設(shè)檢驗(yàn)中存在四對密切相關(guān)的概念:原假設(shè)與備擇假設(shè)、兩類錯誤、P-值法與臨界值法、區(qū)間估計(jì)與假設(shè)檢驗(yàn),深入了解這些概念及其原理之間的關(guān)系有利于準(zhǔn)確把握假設(shè)檢驗(yàn)的思想與方法。
參數(shù)假設(shè)檢驗(yàn);原假設(shè)與備擇假設(shè);兩類錯誤;P-值法與臨界值法;區(qū)間估計(jì)與假設(shè)檢驗(yàn)
假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷的一種重要方法,包括參數(shù)假設(shè)檢驗(yàn)和非參數(shù)假設(shè)檢驗(yàn),參數(shù)假設(shè)檢驗(yàn)即研究者事先對未知參數(shù)做出假設(shè),再利用樣本信息對做出的假設(shè)進(jìn)行檢驗(yàn)。其應(yīng)用可涉及社會生活中的各個領(lǐng)域,如經(jīng)濟(jì)管理、醫(yī)學(xué)研究、教育管理等。而假設(shè)檢驗(yàn)的應(yīng)用過程中,存在幾對關(guān)系,是正確理解和應(yīng)用的關(guān)鍵,若不能正確理解,便會導(dǎo)致方法失效,甚至帶來不良后果,因此有必要深入系統(tǒng)地對這幾對關(guān)系進(jìn)行研究。
按照假設(shè)檢驗(yàn)的原理及步驟,首先要根據(jù)問題對總體參數(shù)做一個嘗試性的假設(shè),該嘗試性的假設(shè)即為原假設(shè)H0,而后再定義另一個與原假設(shè)的內(nèi)容完全相反的假設(shè),記為H1,稱作備擇假設(shè)。在假設(shè)檢驗(yàn)的過程中,二者成對出現(xiàn),但在應(yīng)用中,如何建立原假設(shè)和備擇假設(shè)并不顯而易見,二者若交換,就會得到相反的結(jié)論。
例如,某品牌電視機(jī)生產(chǎn)廠家,聲稱其產(chǎn)品合格率達(dá)到95%以上,質(zhì)管部門隨機(jī)抽取了500臺進(jìn)行檢驗(yàn),經(jīng)檢驗(yàn),發(fā)現(xiàn)480臺為合格品,那么根據(jù)樣本數(shù)據(jù),有充分理由相信該廠家的說法嗎?(a=0.05)
解:首先經(jīng)判斷,確定檢驗(yàn)統(tǒng)計(jì)量為
說明Z未落入拒絕域,因此不能拒絕H0,即沒有理由認(rèn)為該產(chǎn)品合格率低于95%。
模式二,假設(shè)
同樣,Z未落入拒絕域,因此不能拒絕原假設(shè),即沒有理由認(rèn)為該產(chǎn)品合格率超過95%。
在上例中,同樣的樣本,同樣的檢驗(yàn)統(tǒng)計(jì)量,當(dāng)交換原假設(shè)和備擇假設(shè)后卻得到兩個不同的結(jié)論,從區(qū)間的角度來看,產(chǎn)生這一現(xiàn)象的原因是,在一定的顯著性水平 a下,模式一的接受域?yàn)椋篬-Za,+∞),交換原假設(shè)后,接受域?yàn)?-∞,Za],因此兩種情況下,接受域有公共交集[-Za,Za],當(dāng)樣本觀測值落入該交集后,則會產(chǎn)生相反的結(jié)論。因此,若想改變這種現(xiàn)象,可以適當(dāng)提高顯著性水平,從而縮小接受域的交集。另外,還要慎重選擇原假設(shè)。根據(jù)皮爾遜和奈曼的統(tǒng)計(jì)思想,當(dāng)原假設(shè)為真時,拒絕原假設(shè)(即第一類錯誤)的概率為顯著性水平a,而a一般很小,且可以控制,所以提倡設(shè)置原假設(shè)時,在控制第一類錯誤的概率a下,盡量使第二類錯誤的概率β小,即我們只對犯第一類錯誤的概率a加以限制,而對β的具體取值不用考慮,因此,假設(shè)檢驗(yàn)的目的更傾向于拒絕H0,而H0往往是受保護(hù)的,要想拒絕它需要很充分的證據(jù)。所以在設(shè)定原假設(shè)時,一般遵循如下原則:
1 ) 原假設(shè)往往是有事實(shí)依據(jù)的,沒有足夠的證據(jù)一般不能拒絕。
2 ) 應(yīng)把拒絕時導(dǎo)致的后果更嚴(yán)重的假設(shè)作為原假設(shè)。
3 ) 無論是單側(cè)檢驗(yàn),還是雙側(cè)檢驗(yàn),等號往往出現(xiàn)在原假設(shè)中,即如下三種形式:
假設(shè)檢驗(yàn)的基本思想是小概率原理,即認(rèn)為小概率事件在一次試驗(yàn)中幾乎不可能發(fā)生,但不等于絕對不發(fā)生,于是存在兩類錯誤,H0為真卻拒絕的錯誤為棄真錯誤,即第一類錯誤,其概率為顯著性水平a,是在研究設(shè)計(jì)時根據(jù)不同研究目的預(yù)先規(guī)定的允許犯第一類錯誤概率的最大值。反之,若H0不真而被接受,則形成取偽錯誤即第二類錯誤,其概率記作β。
在假設(shè)檢驗(yàn)的過程中,不對β進(jìn)行設(shè)置,因此,不能只根據(jù)檢驗(yàn)統(tǒng)計(jì)量的概率P>a就盲目接受H0,而只能說“不能拒絕H0”,相反,若p≤a,就可以明確下結(jié)論:拒絕H0,因?yàn)椋傅谝活愬e誤的概率不會超過事先制定的概率a。
以樣本均值與總體均值比較的單側(cè)Z檢驗(yàn)為例,說明a與β的關(guān)系。設(shè),若H0為真,由
則不能拒絕H0,此時犯第二類錯誤,概率為β,從圖中可見兩種錯誤之間的關(guān)系:
1 ) α+β不一定等于1;
2 ) 在其他條件不變的前提下,兩類錯誤一個增大,則另一個就減小。在圖中可見,當(dāng)臨界值Xα向右移動時,α減小,則β變大,反之亦然。
當(dāng)用檢驗(yàn)統(tǒng)計(jì)量的值來提供證明是否拒絕H0時,可以借助兩種方法:P-值法與臨界值法。P-值是一個概率值,是由檢驗(yàn)統(tǒng)計(jì)量的樣本觀測值得出的原假設(shè)可被拒絕的最小顯著性水平,用來衡量樣本對原假設(shè)的支持程度,P-值越小,說明對原假設(shè)的支持程度就越低。
臨界值是指導(dǎo)致拒絕原假設(shè)的檢驗(yàn)統(tǒng)計(jì)量的最大值。同樣以正態(tài)總體中均值μ的檢驗(yàn)為例,檢驗(yàn)統(tǒng)計(jì)量仍為,左側(cè)檢驗(yàn)時,若Z≤-Za,則拒絕H0,此時,-Za為臨界值,即標(biāo)準(zhǔn)正態(tài)分布的下側(cè)面積對應(yīng)于α的Z值;右側(cè)檢驗(yàn)時,若Z≥Za,則拒絕H0;雙側(cè)檢驗(yàn)時,|Z|≥-Za/2,則拒絕H0。
根據(jù)上述對P-值法和臨界值法的應(yīng)用原理的描述,可以得到兩者之間的關(guān)系為:
1 )、兩種方法計(jì)算所得出的有關(guān)假設(shè)檢驗(yàn)的結(jié)論肯定相同。
2 )、當(dāng)α= P 值時,則P-值法中統(tǒng)計(jì)量的值A(chǔ) 剛好等于臨界值。
3 )、P-值法能更充分驗(yàn)證結(jié)果的顯著程度,是一種實(shí)測顯著性水平,而臨界值法只能驗(yàn)證在給定的顯著性水平下是否顯著。
參數(shù)的區(qū)間估計(jì)與假設(shè)檢驗(yàn)都是用樣本來統(tǒng)計(jì)推斷總體的方法,兩者在理論和方法上具有很強(qiáng)的相通性。
以對總體均值進(jìn)行估計(jì)為例,在σ已知的情況下,總體均值的100(1-α)%置信區(qū)間估計(jì)為,說明在置信區(qū)間中,有100(1-α)%將總體均值包括在內(nèi),有100α%沒有將總體均值包括進(jìn)去,說明在原假設(shè)為真時,以概率α拒絕它。因此,構(gòu)造一個100(1-α)%置信區(qū)間并且當(dāng)區(qū)間不包括μ0時拒絕,等價于在顯著性水平α下進(jìn)行雙側(cè)假設(shè)檢驗(yàn)。
從上述兩種方法的相通上可以得出二者有著如下關(guān)系:
1 ) 兩者解決問題思想方法一致,都是利用樣本資料來推斷總體指標(biāo),在推斷過程中,選取同樣的統(tǒng)計(jì)量,使該統(tǒng)計(jì)量落在某個已知區(qū)間上的概率為 。
2 ) 兩種方法推斷的結(jié)果都有一定的可信度和風(fēng)險性。
3 ) 區(qū)間估計(jì)的置信度100(1-α)%與假設(shè)檢驗(yàn)中的顯著性水平 密切相關(guān),而置信區(qū)間與假設(shè)檢驗(yàn)中的接受域相同。
4 ) 對已知資料的掌握程度不同。區(qū)間估計(jì)對未知參數(shù)一無所知,利用樣本資料,在一定的保證程度下估計(jì)出它的可能范圍。而假設(shè)檢驗(yàn)對未知參數(shù)有所了解,但不能確定,因此在一定的顯著性水平下進(jìn)行判斷。
5 ) 由相同的統(tǒng)計(jì)量構(gòu)造的事件不同。區(qū)間估計(jì)得到的是一個大概率(100(1-α)%)事件,而假設(shè)檢驗(yàn)利用的是小概率(α)事件。
假設(shè)檢驗(yàn)在現(xiàn)實(shí)生活中應(yīng)用廣泛,但在應(yīng)用的過程中,若不能準(zhǔn)確把握其中的思想及運(yùn)算方法,則不能有效實(shí)現(xiàn)它的用途,本文沿著設(shè)置假設(shè)到完成檢驗(yàn)的過程,從深入剖析假設(shè)檢驗(yàn)中幾對重要關(guān)系出發(fā),對假設(shè)檢驗(yàn)的精髓進(jìn)行了深入的分析,希望為該推斷方法的學(xué)習(xí)與應(yīng)用提供參考。
[1]Anderson,D.R等.商務(wù)與經(jīng)濟(jì)統(tǒng)計(jì)[M](第10版).機(jī)械工業(yè)出版社 ,2010.1
[2]顏虹.醫(yī)學(xué)統(tǒng)計(jì)學(xué)[M](第2版).人民衛(wèi)生出版社 ,2010.8
[3]蘇再興,王志福等.從區(qū)間估計(jì)的角度思考假設(shè)檢驗(yàn)問題[J].科技信息 ,2010(25)
10.3969/j.issn.1001-8972.2012.18.016
代婷,1982年生人,女,漢族,山東濟(jì)南人,碩士,單位:濟(jì)南職業(yè)學(xué)院,研究方向:數(shù)學(xué)教育。
AbstractThere are 4 pairs of relationships in the Hypothesis Testing: null hypothesis and alternative hypothesis、two types of errors、the P-value method and the critical value method、Interval estimation and hypothesis testing,A thorough understanding of the relationships of these concepts and principles is very useful to grasp the thought and method of the Hypothesis Testing.
KeywordsParameter hypothesis testing; null hypothesis and alternative hypothesis; two types of errors; the P-value method and the critical value method; Interval estimation and hypothesis testing