摘要:本文通過對假設(shè)檢驗的原理的分析,說明了假設(shè)檢驗的方法是在一定情況下,否定原假設(shè),而不能肯定原假設(shè),舉例說明了交換原假設(shè)與備擇假設(shè),產(chǎn)生相反結(jié)果的原因,并指出了設(shè)定原假設(shè)與備擇假設(shè)的合理方法。
關(guān)鍵詞:假設(shè)檢驗;原假設(shè);備擇假設(shè);小概率事件
中圖分類號:G642 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-9324(2013)52-0093-02
在統(tǒng)計學(xué)教學(xué)實踐中,參數(shù)的假設(shè)檢驗占有獨特、重要的地位。在教學(xué)中,筆者發(fā)現(xiàn)大多數(shù)學(xué)生及統(tǒng)計工作者甚至個別青年教師假設(shè)檢驗的原理理解不到位,突出表現(xiàn)在對原假設(shè)與備擇假設(shè)的設(shè)定上覺得無從下手,掌握不好,有時在判斷結(jié)論上會出現(xiàn)截然相反的結(jié)論,這種情況的發(fā)生,使得在教學(xué)過程中引起混淆,甚至懷疑假設(shè)檢驗本身的正確性?;诖?,本人談幾點看法。
一、假設(shè)檢驗的基本思想及基本原理
假設(shè)檢驗是事先對總體參數(shù)或分布形式作出某種假設(shè),隨后由所抽取的樣本構(gòu)成檢驗統(tǒng)計量,根據(jù)統(tǒng)計中的小概率原理,即“小概率事件在一次試驗中幾乎不可能發(fā)生的”。依據(jù)樣本信息,對于提出的假設(shè)作出判斷:是接受,還是拒絕,這種基本思想是帶有概率性質(zhì)的“反證法”。為了判斷一個“結(jié)論”是否成立,先假設(shè)該“結(jié)論”成立,稱此“結(jié)論”成立為原假設(shè),記為H0,與之對立的“結(jié)論”,稱為備擇假設(shè),記為H1,在原假設(shè)H0成立的前提下運用統(tǒng)計分析的方法進(jìn)行推導(dǎo)和計算,如果得到一個不合理(小概率事件在一次試驗中發(fā)生了)的現(xiàn)象,就有理由懷疑原假設(shè)H0的正確性,從而拒絕原假設(shè)H0。反之,若沒有出現(xiàn)上述這種不合理現(xiàn)象的發(fā)生,就沒有理由拒絕原假設(shè)H0,即可以接受原假設(shè)H0。由于樣本的隨機性,無論是拒絕H0,還是接受H0,我們都無法保證假設(shè)檢驗的結(jié)果絕對或者是完全的正確,也可能會出現(xiàn)錯誤判斷,從而導(dǎo)致犯兩類錯誤。第Ⅰ類錯誤一般叫做“棄真”錯誤:如果原假設(shè)H0為真時,錯誤地拒絕了H0,那么就犯了棄真錯誤,記為P{拒絕H0|H0為真}=α,α為顯著性水平。第Ⅱ類錯誤一般叫做“取偽”錯誤:如果原假設(shè)H0不真時,錯誤地接受了H0,那么就犯了取偽錯誤,記為P{接受H0|H0不真}=β。由于犯兩類錯誤的概率不能同時控制變小,通常我們控制犯第Ⅰ類錯誤的概率,使它不超過a,這里所說的“顯著性”是“顯著性不合理”,是指只有當(dāng)H0成立時,顯著不合理的狀態(tài)才拒絕H0,否則就要“接受”H0,這里的接受是指不拒絕H0,原因是由于沒有獲得充分的理由拒絕H0而勉強接受而已。因此,使用顯著性檢驗時,當(dāng)檢驗結(jié)果為拒絕H0時,結(jié)論比較可靠,是很有說服力的,因為檢驗結(jié)果為拒絕H0時,犯錯誤的概率不超過α,換一句話說,我們有1-α的把握相信這種拒絕H0是正確的。反過來,如果獲得“不拒絕”原假設(shè)的結(jié)論,那么“接受”原假設(shè)就顯得沒有說服力,所以這是僅僅表明的是樣本數(shù)據(jù)與原假設(shè)沒有矛盾,但這并不能說明原假設(shè)是應(yīng)該被接受的,不拒絕并不等于接受,那么如何合理地設(shè)立原假設(shè)和備擇假設(shè)呢?
二、原假設(shè)H0及備擇假設(shè)H1的確定
從經(jīng)常遇到的實際問題的背景來看,我們真正感興趣的可能是備擇假設(shè),因為接受備擇假設(shè)可能表明會得到特別意義的結(jié)論,或意味著采取某種重要決斷,因此,對備擇假設(shè)應(yīng)取慎重態(tài)度,沒有充足的理由不能輕易接受。一般來說,應(yīng)遵循以下原則來確定原假設(shè)與備擇假設(shè)。第一、把具有保守經(jīng)驗的選擇為原假設(shè),也就是設(shè)為原假設(shè)應(yīng)該是不能被輕易否定的結(jié)論,這些結(jié)論通常是指原有的基本理論、基本方法、基本狀況等,也可以說是公認(rèn)的、經(jīng)驗的、歷史的一些結(jié)論。在假設(shè)檢驗中,由于原假設(shè)已經(jīng)默認(rèn)為真,對應(yīng)著大概率的情況,在沒有獲取足夠的證據(jù)時是否定不了它的,要想把這種默認(rèn)改變,那么所對應(yīng)的樣本觀測值就必須有顯著性的發(fā)生改變。而對于那些不能輕易否定的結(jié)論,在沒有足夠的理由證明它的錯誤之前,人們總是不會做出輕易否定的結(jié)論,這就是通常把不能被輕易否定的結(jié)論作為原假設(shè)的基本原理和基本依據(jù)。特別地,在進(jìn)行單側(cè)檢驗時,一般取與預(yù)想結(jié)果的相反面為原假設(shè)。比如說,當(dāng)病人前來問診時,醫(yī)生要對病情作出診斷,這時醫(yī)生可能會犯“無病看成有病”或者“有病看成無病”的錯誤,而這兩種結(jié)果相對比較來說,更嚴(yán)重的錯誤是把“有病看成無病”的結(jié)論,所以應(yīng)將“看病的人有病”作為原假設(shè)H0,“看病的人無病”作為備擇假設(shè)H1。
三、實例應(yīng)用,對假設(shè)檢驗一個誤區(qū)的解釋
在統(tǒng)計學(xué)教學(xué)實踐中,有些學(xué)生甚至是教師,對于下面的假設(shè)檢驗問題常常會得出一個令人困惑的結(jié)論。問題如下:從某廠生產(chǎn)的一批燈泡中隨機地抽取20只進(jìn)行壽命測試。由測試結(jié)果計算得這批燈泡的平均壽命為x=1960(小時),s=2000(小時)。假定燈泡壽命服從正態(tài)分布:X~N(μ,σ2)其中μ,σ均未知。那么在顯著性水平α=0.05下能否認(rèn)為這批燈泡的平均壽命達(dá)到國家標(biāo)準(zhǔn)2000小時?
對上述問題,給出以下有兩種解法,確得到了截然相反的結(jié)論。
解法1:提出原假設(shè)H0:μ≥2000備擇假設(shè)H1∶μ<2000,作檢驗統(tǒng)計量T=■,顯然,該統(tǒng)計量符合自由度為19的T分布,即:T=■~t(19).
結(jié)合假設(shè),確定拒絕域的形式為{T<-t0.05(19)}由α=0.05,查t分布表,定出臨界值-t0.05(19)=-1.729,從而求出拒絕域 {T<-1.729}.由測試結(jié)果得到:
T=■=■=-0.894,
由于T>-1.729,作出接受假設(shè)H0的判定,即認(rèn)為這批燈泡的平均壽命達(dá)到國家標(biāo)準(zhǔn)2000小時.
解法2:提出原假設(shè)H0:μ<2000備擇假設(shè)H1μ≥2000,
作檢驗統(tǒng)計量T=■,顯然,該統(tǒng)計量符合自由度為19的T分布,即:T=■~t(19).
結(jié)合假設(shè)確定拒絕域的形式{T>t0.05(19)}由α=0.05,查t分布表,定出臨界值t0.05(19)=1.729,從而求出拒絕域{T>1.729}。由測試結(jié)果得到:T=■=■=-0.894,
由于T<1.729,作出接受假設(shè)H0:μ<2000的判定,即認(rèn)為這批燈泡的平均壽命未達(dá)到國家標(biāo)準(zhǔn)2000小時。
我們看到,隨著問題提法的不同(把哪個斷言作為原假設(shè)的不同),得出了截然相反的兩種結(jié)論。對同一問題,為什么出現(xiàn)這種結(jié)果,錯在哪里?基于上述過程也使得一些對統(tǒng)計思想不甚理解的人感到迷惑不解。實際上,以上問題的解法,是基于我們不同的著眼點。在解法1中,提出原假設(shè)H0:μ≥2000是依據(jù)該廠產(chǎn)品以往的質(zhì)量和信譽一直良好,達(dá)到國家標(biāo)準(zhǔn),所以對其斷言已有了較大的信任度,沒有充分的理由就難以改變我們對該廠產(chǎn)品的信任度,所以一開始就對該廠產(chǎn)品持有肯定的態(tài)度。解法2中,提出原假設(shè)H0:μ<2000是根據(jù)該廠產(chǎn)品一直質(zhì)量較差,信譽低,沒有達(dá)到國家標(biāo)準(zhǔn),從一開始我們就對該廠產(chǎn)品質(zhì)量持有懷疑態(tài)度,如果不是很有利于該廠產(chǎn)品質(zhì)量的良好結(jié)果,那么就很難改變對該廠的看法。因此我們的著眼點不同,也就決定了所得到的相應(yīng)的結(jié)論。從實際問題來看,對同一問題進(jìn)行分析時選取不同的原假設(shè)是具有不同含義的,也就是說,原假設(shè)和備擇假設(shè)在設(shè)定的本質(zhì)上是帶有一定的主觀因素和情感的。這樣,在解決某一個具體的實際問題時,由于不同的人感興趣的問題不同,研究的目的不同,出發(fā)點也不相同,即使是研究同一個問題,也可能會提出完全相反的原假設(shè)和備擇假設(shè)。如果把原假設(shè)和備擇假設(shè)兩者的意義交換,那么,原假設(shè)和備擇假設(shè)受保護(hù)的地位就會發(fā)生轉(zhuǎn)變,這樣的話,原來努力去論證正確的備擇假設(shè)就變成研究人員想辦法收集證據(jù)予以達(dá)到反對的假設(shè),這就改變了研究人員的研究初衷和研究目的。所以,進(jìn)行假設(shè)檢驗的關(guān)鍵應(yīng)該是合理地選取原假設(shè)和備擇假設(shè)。對于同一個實際問題,在顯著性水平α之下,由于原假設(shè)和備擇假設(shè)不同,所進(jìn)行的假設(shè)檢驗將會導(dǎo)致不同的研究意義和研究目的。
假設(shè)檢驗是統(tǒng)計分析中的一種重要方法,理論上,假設(shè)檢驗中的原假設(shè)和備擇假設(shè)可以以任意的方式設(shè)定。但在實際問題中應(yīng)合理、辯證地選取原假設(shè)和備擇假設(shè),這樣可以得到更明確而有效的結(jié)論.在統(tǒng)計學(xué)的假設(shè)檢驗教學(xué)過程中,如何設(shè)定原假設(shè)和備擇假設(shè),這種基本的問題我們應(yīng)重點強調(diào)清楚,有助于學(xué)生對假設(shè)檢驗的清晰、透徹理解, 能夠使學(xué)生更好地掌握假設(shè)檢驗的思想方法,具體在實踐中應(yīng)用假設(shè)檢驗方法解決實際問題,并對后續(xù)的理論學(xué)習(xí)產(chǎn)生良好的作用。
參考文獻(xiàn):
[1]李延忠,孫艷,等.概率論與數(shù)理統(tǒng)計[M].北京:高等教育出版社,2011.
[2]吳贛昌.概率論與數(shù)理統(tǒng)計[M].北京:中國人民大學(xué)出版社,2008.
作者簡介:孫艷(1964-),女,學(xué)士,副教授。