楊桂元,劉德志
(安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
參數(shù)假設(shè)檢驗(yàn)中的若干基本問(wèn)題研究
楊桂元,劉德志
(安徽財(cái)經(jīng)大學(xué) 統(tǒng)計(jì)與應(yīng)用數(shù)學(xué)學(xué)院,安徽 蚌埠 233030)
文章對(duì)參數(shù)統(tǒng)計(jì)檢驗(yàn)中的基本原理、勢(shì)函數(shù)與兩類(lèi)錯(cuò)誤、檢驗(yàn)的 p值和單邊檢驗(yàn)的假設(shè)與拒絕域等若干基本問(wèn)題進(jìn)行了研究,并分析了它們之間的關(guān)系,闡明了參數(shù)的區(qū)間估計(jì)和假設(shè)檢驗(yàn)的關(guān)系,揭示了參數(shù)統(tǒng)計(jì)推斷的本質(zhì)。
參數(shù)統(tǒng)計(jì)檢驗(yàn);兩類(lèi)錯(cuò)誤;勢(shì)函數(shù);p值;拒絕域
隨著科學(xué)技術(shù)和生產(chǎn)的不斷發(fā)展,數(shù)理統(tǒng)計(jì)的應(yīng)用更加廣泛。而統(tǒng)計(jì)假設(shè)檢驗(yàn)問(wèn)題在統(tǒng)計(jì)推斷中占有很重要的地位。人們常常假設(shè)總體為正態(tài)分布,在正態(tài)總體下衍生出了統(tǒng)計(jì)學(xué)的三大分布——t分布、F分布和χ2分布,產(chǎn)生了與此相關(guān)的抽樣分布,并且研究了正態(tài)總體期望和方差的各種統(tǒng)計(jì)推斷問(wèn)題。區(qū)間估計(jì)和假設(shè)檢驗(yàn)是統(tǒng)計(jì)推斷中的重要內(nèi)容,是兩個(gè)不同的統(tǒng)計(jì)概念,但它們又有著密切的聯(lián)系,在某種意義下是同一問(wèn)題的兩個(gè)方面。這兩種統(tǒng)計(jì)推斷方法都是通過(guò)對(duì)具體問(wèn)題的隨機(jī)抽樣所得到的樣本觀(guān)察值,用數(shù)理統(tǒng)計(jì)學(xué)的方法進(jìn)行統(tǒng)計(jì)分析并做出判斷。深刻理解參數(shù)假設(shè)檢驗(yàn)中的若干基本問(wèn)題,了解統(tǒng)計(jì)推斷中參數(shù)的假設(shè)檢驗(yàn)與區(qū)間估計(jì)之間的關(guān)系、不同類(lèi)型的假設(shè)檢驗(yàn)適用范圍及應(yīng)注意的問(wèn)題,對(duì)正確的掌握和應(yīng)用統(tǒng)計(jì)推斷方法是極為重要的。然而這部分內(nèi)容不易理解,從而初學(xué)者和實(shí)際應(yīng)用的工作者在解決具體問(wèn)題時(shí)會(huì)遇到一些困難。本文將就此問(wèn)題展開(kāi)討論。
在假設(shè)檢驗(yàn)中,常把一個(gè)被檢驗(yàn)的假設(shè)稱(chēng)為原假設(shè)或者零假設(shè),用H0表示。通常將不應(yīng)輕易加以否定的假設(shè)作為原假設(shè),當(dāng)H0被拒絕時(shí)而接受的假設(shè)稱(chēng)為備擇假設(shè),用H1表示,它們常常成對(duì)出現(xiàn)。
由樣本(x1,x2,…,xn)對(duì)假設(shè)進(jìn)行推斷總是通過(guò)一個(gè)恰當(dāng)?shù)慕y(tǒng)計(jì)量T(x1,x2,…,xn)完成的,該統(tǒng)計(jì)量T(x1,x2,…,xn)稱(chēng)為檢驗(yàn)統(tǒng)計(jì)量。使原假設(shè)被拒絕的樣本觀(guān)測(cè)值所在區(qū)域稱(chēng)為拒絕域,一般它是樣本空間Ω的子集,并用W表示,Wˉ稱(chēng)為接受域;統(tǒng)計(jì)量T(x1,x2,…,xn)的拒絕域記為T(mén)(W)。
假設(shè)檢驗(yàn)的基本原理是小概率事件原理,即:概率很小的事件在一次試驗(yàn)中實(shí)際上是不可能發(fā)生的;基本方法是“反證法”,若小概率事件發(fā)生則拒絕原假設(shè)H0從而接受備擇假設(shè)H1,否則接受原假設(shè)H0。
對(duì)于給出的拒絕域W,由于抽樣的隨機(jī)性,我們做出的判斷不可能絕對(duì)正確,它可能會(huì)犯兩類(lèi)錯(cuò)誤。
第一類(lèi)錯(cuò)誤:當(dāng)H0為真時(shí),但(x1,x2,…,xn)∈W ,從而拒絕H0。這種錯(cuò)誤稱(chēng)為第一類(lèi)錯(cuò)誤,又稱(chēng)為“棄真錯(cuò)誤”,其發(fā)生的概率通常記為α,即
就是假設(shè)檢驗(yàn)的顯著性水平。
第二類(lèi)錯(cuò)誤:在H0不真時(shí),但(x1,x2,…,xn)∈Wˉ,從而接受H0。這種錯(cuò)誤稱(chēng)為第二類(lèi)錯(cuò)誤,又稱(chēng)為“納偽錯(cuò)誤”或你“取偽錯(cuò)誤”,其發(fā)生的概率通常記為β,即
定義1設(shè)檢驗(yàn)問(wèn)題 H0:θ∈Θ0vs H1:θ∈Θ1的拒絕域?yàn)閃,則樣本觀(guān)測(cè)值(x1,x2,…,xn)落入拒絕域W內(nèi)的概率稱(chēng)為該檢驗(yàn)的勢(shì)函數(shù),即
其中,Θ0,Θ1是參數(shù)空間兩個(gè)互不相交的子集。
由兩類(lèi)錯(cuò)誤的概率α、β與勢(shì)函數(shù)的意義,可知它們之間的關(guān)系為:
由此可以看出,當(dāng)α減小時(shí),c也減小,而c的減小必導(dǎo)致β的增大;當(dāng)β減小時(shí),c會(huì)增大,而c的增大必導(dǎo)致α的增大。故得到兩類(lèi)錯(cuò)誤的關(guān)系:
(1)在樣本容量n一定時(shí),α與β不能同時(shí)減小,α的減小必導(dǎo)致β的增大;β的減小必導(dǎo)致α的增大。
(2)要使α與β同時(shí)減小,則只有加大樣本容量n,但又增加了檢驗(yàn)的成本這在有些情況下又是不現(xiàn)實(shí)的。一般情況下控制α,使β盡量小。
定義2對(duì)檢驗(yàn)問(wèn)題 H0:θ∈Θ0vs H1:θ∈Θ1,如果一個(gè)檢驗(yàn)滿(mǎn)足對(duì)任意的θ∈Θ0,都有
則稱(chēng)該檢驗(yàn)是顯著性水平為α的顯著性檢驗(yàn),簡(jiǎn)稱(chēng)水平為α的檢驗(yàn)。
可見(jiàn),顯著性水平α就是用來(lái)控制犯第一類(lèi)錯(cuò)誤的概率的。最常見(jiàn)的選擇是α=0.05,有時(shí)也選擇α=0.1或α=0.01。
假設(shè)檢驗(yàn)的結(jié)論通常是簡(jiǎn)單的,在給定的顯著水平α下,不是拒絕原假設(shè)就是接受原假設(shè)。然而有時(shí)也會(huì)出現(xiàn)這樣的情況:在一個(gè)較大的顯著水平下得到拒絕原假設(shè)的結(jié)論,而在一個(gè)較小的顯著水平下卻得到相反的結(jié)論。檢驗(yàn)的 p-值是一個(gè)非常重要的概念,許多統(tǒng)計(jì)應(yīng)用軟件(如Excel、SPSS、EViews等)檢驗(yàn)的輸出結(jié)果都有檢驗(yàn)的p-值(p-value),可以根據(jù) p-值和任意給定的顯著性水平α直接作出接受或拒絕原假設(shè)H0的結(jié)論。
定義3在一個(gè)假設(shè)檢驗(yàn)問(wèn)題中,利用樣本觀(guān)測(cè)值能夠做出拒絕原假設(shè)的最小顯著性水平稱(chēng)為檢驗(yàn)的p值。
引進(jìn)檢驗(yàn)的p值的概念有明顯的好處:首先,它比較客觀(guān),避免了事先確定顯著水平;其次,由檢驗(yàn)的p值與人們心目中顯著性水平α進(jìn)行比較可以很容易做出檢驗(yàn)的結(jié)論:
(1)如果α≥p,則在顯著性水平α下拒絕H0;
(2)如果α<p,則在顯著性水平α下應(yīng)保留H0。
設(shè)T為檢驗(yàn)統(tǒng)計(jì)量,T0為由檢驗(yàn)統(tǒng)計(jì)量得到的觀(guān)察值,針對(duì)原假設(shè)和備擇假設(shè)由T0為臨界值確定的拒絕域?yàn)閃0,檢驗(yàn)的 p值為:
對(duì)于正態(tài)總體參數(shù)的u檢驗(yàn)和t檢驗(yàn)等對(duì)稱(chēng)的情形有:
其他檢驗(yàn)的p值可以類(lèi)似推出。
對(duì)于參數(shù)的單側(cè)檢驗(yàn)比較難于掌握的是原假設(shè)的設(shè)定和拒絕域的確定。單側(cè)檢驗(yàn)原假設(shè)H0的設(shè)定應(yīng)遵從以下原則:
(1)H0不能輕易被否定;(2)等號(hào)包含在原假設(shè)H0內(nèi);(3)根據(jù)問(wèn)題的背景來(lái)設(shè)定原假設(shè)。
由于原假設(shè)H0中參數(shù)的設(shè)定不是一個(gè)常數(shù),而是一個(gè)范圍。在H0成立的條件下,檢驗(yàn)統(tǒng)計(jì)量在拒絕域內(nèi)取值的概率只能通過(guò)不等式來(lái)確定,由此可以得到拒絕域是概率不超過(guò)α的更小概率得事件。
根據(jù)以下兩種單邊檢驗(yàn)情況具體討論:
①σ已知時(shí)的u檢驗(yàn)
其中,tα(n-1)和 t1-α(n-1)=-tα(n-1)分別表示自由度為n-1的t分布的α和1-α的上側(cè)分位數(shù)。
另外,單個(gè)正態(tài)總體方差的檢驗(yàn),兩個(gè)正態(tài)總體均值差和方差比的檢驗(yàn)都符合以上的結(jié)論,即拒絕域是概率不超過(guò)α的小概率事件。
其他的各種情況同理,此不贅述。
[1]茆詩(shī)松,程依明等.概率論與數(shù)理統(tǒng)計(jì)教程[M].北京:高等教育出版社,2004.
[2]楊桂元.概率論與數(shù)理統(tǒng)計(jì)[M].北京:電子科技大學(xué)出版社,2004.
O212
A
1002-6487(2012)24-0013-02
安徽省高等學(xué)校人文社科基金重點(diǎn)項(xiàng)目;安徽財(cái)經(jīng)大學(xué)教學(xué)研究項(xiàng)目(ACJYZD201213)
楊桂元(1957-),男,安徽蕭縣人,教授,研究方向:數(shù)量經(jīng)濟(jì)學(xué)。
劉德志(1982-),男,山東濟(jì)寧人,講師,碩士,研究方向:隨機(jī)分析。
(責(zé)任編輯/亦 民)