宋繼革
一、引言
推斷統(tǒng)計中的一個重要內(nèi)容,就是假設(shè)檢驗。通過多年的教學實踐,發(fā)現(xiàn)學生對這部分教學內(nèi)容接受困難。甚至在畢業(yè)多年之后,還坦言,自己當時沒有搞清楚。通過思考,引入了一個“中大獎”判斷的例子,將假設(shè)檢驗的基本思想與方法串連起來,取得了非常好的教學效果。
二、案例的引入
假設(shè)檢驗是統(tǒng)計學一個非常重要的內(nèi)容,思想性強。學生們往往把假設(shè)檢驗這部分內(nèi)容當成數(shù)學來學,忽略了其中的部分主觀性。原假設(shè)與備擇假設(shè)、小概率原理、兩類錯誤、拒絕域與接受域、P值檢驗等概念本身的邏輯性與連貫性,需要一個背景簡單的案例串連起來,以便取得良好的教學效果。
1、“中大獎”問題的提出
如果,作為統(tǒng)計學教師的我,今天向大家宣布:我昨天買了一張彩票,中了500萬。你們信不信?信的同學有自己的理由:這是老師說的。不信的同學也有理由:可能性太小了。這就需要統(tǒng)計學意義上的假設(shè)檢驗。
2、原假設(shè)與備擇假設(shè)概念的引入
誰來做假設(shè)檢驗?zāi)??是不信的同學,他們希望收集證據(jù),以支持不信的觀點。這就是假設(shè)檢驗的主觀性,它是有立場的。假設(shè)檢驗不是純粹的數(shù)學。
原假設(shè):研究者想收集證據(jù)予以反對的假設(shè)稱為原假設(shè),記為 ;備擇假設(shè):研究者想收集證據(jù)予以支持的假設(shè)稱為備擇假設(shè),記為 。這里,原假設(shè)應(yīng)該是“老師說的是真話”,備擇假設(shè)應(yīng)該是“老師說的是假話”。 原假設(shè)與備擇假設(shè)是“非此即彼”的關(guān)系。
3、小概率原理與顯著性水平的引入
一個事件如果發(fā)生概率很小,那么它在一次試驗中是不可能發(fā)生的。通常把5%作為一個界限,發(fā)生概率在5%以下的事件,被稱為小概率事件。如果老師說的話,連5%的可能性都沒有,我們就有充分的理由拒絕相信。假設(shè)檢驗的核心思想就是,在肯定原假設(shè)的基礎(chǔ)上,是不是會引起小概率事件?如果發(fā)生了小概率事件,就拒絕原假設(shè);如果沒有發(fā)生小概率事件,就不能拒絕原假設(shè)。這個5%,就是顯著性水平。我們可以設(shè)的更小,以增加說服力。
4、兩類錯誤
其實,我們無論是信,還是不信,都無法避免出錯。棄真錯誤:原假設(shè)為真,拒絕原假設(shè)。取偽錯誤:原假設(shè)為假,接受原假設(shè)。我們拒絕老師說的話,認為他不可能中大獎時,有可能犯棄真錯誤;我們接受老師說的話,認為他中了大獎,有可能犯取偽錯誤。一般認為,需要控制棄真錯誤的概率,使之不超過5%、1%等。
5、拒絕域與接受域、P值檢驗
基本概念了解之后,拒絕域與接受域、P值檢驗不過是具體操作過程,來進行判斷了。我們可以到彩票站收集樣本數(shù)據(jù),發(fā)現(xiàn)中大獎的概率不足5%,甚至不足萬分之一。中大獎完全是一個小概率事件,拒絕原假設(shè),理由是充分的,犯錯誤的概率很小,遠低于顯著性水平。
三、假設(shè)檢驗基本原理的實際應(yīng)用
1、問題分析
由統(tǒng)計資料得知,去年某地區(qū)新生兒平均體重為3190克,標準差80克?,F(xiàn)從今年新生兒中隨機抽取了100個,測得其平均體重為3210克,請問今年與上一年相比新生兒體重有無明顯差異?
20克的差異究竟意味著什么呢?兩種觀點。第一種觀點: 20克的差異不過是抽樣的隨機性引起的,也就是說抽取的100個新生兒中恰好有幾個超重的,拉高了平均值。不需要進一步調(diào)查分析。第二種觀點:20克的差異太大了,抽樣的隨機性不足以解釋這么大的差異。有必要進一步調(diào)查分析。所以,假設(shè)檢驗工作是由持第二種觀點的人做的。
2、原假設(shè)與備擇假設(shè)的確定
原假設(shè)是研究者想收集證據(jù)予以反對的假設(shè)。進行假設(shè)檢驗的人,是持第二種觀點的人。所以,原假設(shè)應(yīng)該是:“今年與去年相比,新生兒體重沒什么變化”,備擇假設(shè)則與之相反,應(yīng)該是:“今年與去年相比,新生兒體重有明顯變化”。我們把它用數(shù)學語言來描述,就是: (這是一個雙側(cè)檢驗, 過大或是過小,都將導致推翻原假設(shè))
3、檢驗統(tǒng)計量的確定
假設(shè)檢驗從邏輯上說,是一種反證法,在肯定原假設(shè)的基礎(chǔ)上,看看是不是能推導出一個小概率事件。如果說,“今年與去年相比,新生兒體重沒什么變化”是正確的話,那么根據(jù)中心極限定理, 。這就是我們構(gòu)造的檢驗統(tǒng)計量。樣本均值是一個均值為總體均值,方差為總體方差的N分之一倍。
4、拒絕域和接受域的確定
令 =0.05,即顯著性水平為5%。我們犯第一類錯誤的概率不超過5%, =±1.96。這樣,接受域和拒絕域就確定下來了。如果原假設(shè)是正確的,檢驗統(tǒng)計量落入接受域的概率為0.95。
5、計算檢驗統(tǒng)計量的值,作出推斷: ,落入拒絕域,我們有充分的理由拒絕原假設(shè),20克的差異無法用抽樣隨機性解釋。結(jié)論:去年與今年相比,新生兒的平均體重確實有明顯差異(原因不屬于統(tǒng)計學的研究范圍)。如果原假設(shè)是正確的,導致一件真實發(fā)性的事件成為不可能的小概率事件。所以,我們拒絕原假設(shè)是有充分理由的。
(作者單位:滄州師范學院經(jīng)濟管理學院)