楊 剛
(陜西理工學(xué)院數(shù)學(xué)與計(jì)算機(jī)科學(xué)學(xué)院,陜西 漢中723000)
同數(shù)理統(tǒng)計(jì)教材相比,一般統(tǒng)計(jì)學(xué)教材中假設(shè)檢驗(yàn)的方法和步驟常常顯得十分簡潔、直觀,但這樣做的缺點(diǎn)也很明顯:一些數(shù)學(xué)推理過程被屏蔽起來,解題過程十分抽象、步驟間跨度較大,推理不清晰。這樣的教材對非統(tǒng)計(jì)學(xué)專業(yè)和非數(shù)學(xué)專業(yè)的教師、學(xué)生而言無疑大大加重了他們講解、學(xué)習(xí)這門課程的難度,使他們感到假設(shè)檢驗(yàn)的過程十分抽象,令人困惑。因此在教學(xué)過程中,把這些被許多統(tǒng)計(jì)學(xué)教材沒有涉及到的推理內(nèi)容搞清楚是十分必要的。
為了檢驗(yàn)?zāi)臣僭O(shè)是否成立,先假定它正確,然后根據(jù)樣本信息,觀察由此假設(shè)而導(dǎo)致的結(jié)果是否合理,從而判斷是否接受原假設(shè)。
假設(shè)檢驗(yàn)使用了一種類似于“反證法”的推理方法,它的特點(diǎn)是[1]:
(1)先假設(shè)總體某項(xiàng)假設(shè)成立,計(jì)算其會(huì)導(dǎo)致什么結(jié)果產(chǎn)生。若導(dǎo)致不合理現(xiàn)象產(chǎn)生,則拒絕原先的假設(shè)。若并不導(dǎo)致不合理的現(xiàn)象產(chǎn)生,則不能拒絕原先假設(shè),從而“接受”原先假設(shè)。
(2)它又不同于一般的反證法。所謂不合理現(xiàn)象產(chǎn)生,并非指形式邏輯上的絕對矛盾,而是基于小概率原理。
小概率原理是指發(fā)生概率很小的隨機(jī)事件在一次實(shí)驗(yàn)或個(gè)別實(shí)驗(yàn)中是幾乎不可能發(fā)生的。如果在原假設(shè)成立的前提下發(fā)生了小概率事件,則認(rèn)為原假設(shè)是不合理的;反之,如果小概率事件沒有發(fā)生,則沒有證據(jù)拒絕原假設(shè)。
假設(shè)檢驗(yàn)是基于樣本資料來推斷總體特征的,而這種推斷是在一定概率置信度下進(jìn)行的,而非嚴(yán)格的邏輯證明。因此,置信度大小的不同,有可能做出不同的判斷。
在雙側(cè)檢驗(yàn)問題中,一般統(tǒng)計(jì)學(xué)教材中的解題步驟簡潔、清晰,但推理過程含混、抽象,甚至一些推理略而不提。不妨以一個(gè)總體的總體均值和正態(tài)總體方差的假設(shè)檢驗(yàn)為例。
例1:某機(jī)床廠加工一種零件,根據(jù)經(jīng)驗(yàn)知道,該廠加工零件的橢圓度近似服從正態(tài)分布,其總體均值為μ0=0.081mm。今換一種新機(jī)床進(jìn)行加工,抽取n=200個(gè)零件進(jìn)行檢驗(yàn),得到的橢圓度均值為0.076mm,樣本標(biāo)準(zhǔn)差為s=0.025mm。問新機(jī)床加工零件的橢圓度的均值與以前有無顯著差異[2]?(α=0.05)。
許多統(tǒng)計(jì)學(xué)教材中對此題的求解過程如下:解:H0:μ=0.081,認(rèn)為新舊機(jī)床加工零件的橢圓度的均值沒有顯著差異;
H1:μ≠0.081,認(rèn)為新舊機(jī)床加工零件的橢圓度的均值有顯著差異;
由題意可知這是一個(gè)雙側(cè)檢驗(yàn)問題,拒絕域應(yīng)該在抽樣分布曲線的左、右尾部,如圖1所示。
由題意可知,μ0=0.081mm,s=0.025mm,=0.076mm,n=200。由于大樣本,故可以用z統(tǒng)計(jì)量。
在顯著性水平α=0.05下,拒絕H0,認(rèn)為新舊機(jī)床加工零件的橢圓度的均值有顯著差異。
圖1 雙側(cè)檢驗(yàn)示意圖
在上述解法中,為什么本題是雙側(cè)檢驗(yàn)而不是左單側(cè)檢驗(yàn)或右單側(cè)檢驗(yàn),因其講述不清,沒有令人可信的數(shù)學(xué)推理過程,因此很有必要把上面解題過程中為什么采用雙側(cè)檢驗(yàn)的原因搞清楚。
由于要檢驗(yàn)的假設(shè)涉及總體均值,故可借助于樣本均值來判斷。因?yàn)槭铅痰臒o偏估計(jì)量。所以,若H0為真,則不應(yīng)太大,又1),故衡量的大小可歸結(jié)為衡量的大小[3]。于是可以選定一個(gè)適當(dāng)?shù)恼龜?shù)k,當(dāng)觀察值滿足時(shí),拒絕假設(shè)H0。反之,當(dāng)觀察值滿足時(shí),接受假設(shè)H0。因?yàn)楫?dāng)H0為真時(shí)),由標(biāo)準(zhǔn)正態(tài)分布分位數(shù)的定義:
令k=zα/2,當(dāng)時(shí),拒絕 H0;當(dāng)時(shí),不拒絕H0。
這就是一般統(tǒng)計(jì)學(xué)教材中進(jìn)行雙側(cè)假設(shè)檢驗(yàn)時(shí)沒有涉及到的內(nèi)容(甚至一些數(shù)理統(tǒng)計(jì)教材中也沒有涉及到)。
設(shè)總體 X ~ N(μ,σ2),其中μ、σ2均未知,X1,X2,…,Xn為來自總體X的樣本(樣本容量為n),由樣本可以計(jì)算出樣本方差為s2。(已知顯著性水平為α)
如果遇到如下的雙側(cè)檢驗(yàn)問題:H0:σ2=,H1:σ2≠,其中σ0為已知常數(shù)。
由于s2是σ2的無偏估計(jì),則當(dāng)H0為真時(shí),比值在1的附近擺動(dòng),此值不應(yīng)該過分大于1或者過分小于1。由抽樣分布的相關(guān)定理可知:
當(dāng)H0為真時(shí)取作為統(tǒng)計(jì)量則拒絕域的形式為:
P(當(dāng) H0為 真, 拒 絕為了計(jì)算方便,習(xí)慣上取由χ2分位數(shù)的定義得:
又因?yàn)閚=26,α=0.02,由題意可用χ2檢驗(yàn)。查表 可 得(n - 1)=(25)= 44.314,(n-1)=(25)=11.524,故拒絕域?yàn)椋?/p>
在上述推理的基礎(chǔ)上,關(guān)于正態(tài)總體方差的雙側(cè)檢驗(yàn)問題常常在統(tǒng)計(jì)學(xué)教材中就可以按照下列例2所示的簡潔過程進(jìn)行假設(shè)檢驗(yàn)。這也是統(tǒng)計(jì)學(xué)教材中強(qiáng)調(diào)統(tǒng)計(jì)方法的具體應(yīng)用,淡化推理推導(dǎo)的思想的具體體現(xiàn)。
例2:某廠生產(chǎn)的某種型號(hào)的電池,其壽命長期以來服從方差σ2=5 000(h2)的正態(tài)分布,現(xiàn)有一批這種電池,從它的生產(chǎn)情況來看,壽命的波動(dòng)性有所變化?,F(xiàn)隨機(jī)取26只電池,測出其壽命的樣本方差s2=9 200(h2)。問根據(jù)這一數(shù)據(jù)能否推斷這批電池的壽命的波動(dòng)性較以往的有顯著的變化?(α=0.02)
解:由題意:H0:σ2=5 000,H1:σ2≠5 000,
不妨以一個(gè)總體的總體均值的右單側(cè)假設(shè)檢驗(yàn)為例。
例3:某工廠生產(chǎn)的一種電子元件,在正常情況下,其使用壽命X(h)服從正態(tài)分布 N(2 500,1202)。某日從該廠生產(chǎn)的一批這種電子元件中隨機(jī)抽取16個(gè),測得樣本均值假定電子元件壽命的方差不變,問能否認(rèn)為該日生產(chǎn)的這批電子元件的壽命均值不小于2 500(h)?(α=0.05)
首先分析問題:由題意可以設(shè)計(jì)原假設(shè)和備擇假設(shè)如下:
H0:μ≥2 500;H1:μ<2 500,這里μ0=2 500,σ0=120。又由抽樣分布的相關(guān)定理可選z=作為統(tǒng)計(jì)量。又因?yàn)槭铅痰臒o偏估計(jì),當(dāng)H0成立時(shí)大一些較為合理,它較小就不合理了,因此較小是小概率事件。如果記P(z<b)=α,但是,由于μ≥μ0。因此,μ0不是正態(tài)總體的均值,從而z的分布未知,在此我們無法求得b值。為此,再另選一個(gè)統(tǒng)計(jì)量它服從標(biāo)準(zhǔn)正態(tài)分布。當(dāng)H0成立時(shí),有z*≤z,于是有:P(z<b)≤P(z*<b),這表明事件(z<b)是比事件(z*<b)發(fā)生的概率還要小的小概率事件[4]。因此,只要令P(z*<b)=α,由于z*服從標(biāo)準(zhǔn)正態(tài)分布,查表得b=-zα,從而有:P(z<-zα)≤α,于是H0的拒絕域?yàn)椋簔<-zα。
在上述推理的基礎(chǔ)上,許多統(tǒng)計(jì)學(xué)教材上的解法如下:
解:H0:μ≥2 500,認(rèn)為該日生產(chǎn)的這批電子元件的壽命均值不顯著小于2 500(h);
H1:μ<2 500,認(rèn)為該日生產(chǎn)的這批電子元件的壽命均值顯著小于2 500(h);
又因?yàn)椋害?=2 500,σ0=120,n=16,故可以采用z統(tǒng)計(jì)量
又因?yàn)轱@著性水平α=0.05,查表得zd=z0.05=1.645,此 時(shí)-2.17,故z<-zα,于是拒絕H0,接受H1。即認(rèn)為該日生產(chǎn)的這批電子元件的壽命均值μ顯著小于2 500(h)。
對于一個(gè)總體參數(shù)的其他假設(shè)檢驗(yàn)問題可以按照類似的方法進(jìn)行推理,此處不再贅述。
假設(shè)檢驗(yàn)是推斷統(tǒng)計(jì)的重要內(nèi)容之一,對它進(jìn)行深入的理解和掌握是十分重要的。但由于現(xiàn)行的許多統(tǒng)計(jì)學(xué)教材變重應(yīng)用而輕推理的思想的影響,導(dǎo)致假設(shè)檢驗(yàn)求解過程被簡化、淡化。殊不知這從另一方面反而加重了教師、學(xué)生學(xué)習(xí)統(tǒng)計(jì)學(xué)的難度,在某些院校一定程度上造成了這門課程教師不愿教或教不透,學(xué)生不愿學(xué)或?qū)W不懂的局面,建議在統(tǒng)計(jì)學(xué)教材中應(yīng)該適當(dāng)補(bǔ)充一些基本的推理、推導(dǎo)過程,這樣才能使這門課程顯得比較通俗易懂。
[1]MBA智庫百科.假設(shè)檢驗(yàn)[OL].廈門:MBA智庫百科,2008[2012-04-26].http://wiki.mbalib.com/wiki/假設(shè)檢驗(yàn).html.
[2]賈俊平,何曉群,金勇進(jìn).統(tǒng)計(jì)學(xué)[M].4版.北京:中國人民大學(xué)出版社,2009:212-214.
[3]教學(xué)資源庫.遼寧石油化工大學(xué)-概率論與數(shù)理統(tǒng)計(jì)教案08[OL].上海:教學(xué)資源庫,2008[2012-04-26].http://down.math.org.cn/dispbbs.asp?boardid=40&Id=3504.
[4]李曉紅.假設(shè)檢驗(yàn)中原假設(shè)的選取問題[J].平原大學(xué)學(xué)報(bào),2006,23(6):122-124.