◎?qū)O含笑
(石家莊鐵路職業(yè)技術(shù)學(xué)院,河北 石家莊 050041)
在實(shí)際生活中,對(duì)總體參數(shù)的研究具有極大的價(jià)值,有利于決策者作出正確的統(tǒng)計(jì)推斷.參數(shù)研究主要包括參數(shù)的估計(jì)和檢驗(yàn),參數(shù)估計(jì)適用于總體分布已知但參數(shù)未知時(shí)對(duì)參數(shù)的研究.參數(shù)估計(jì)有多種方法,常見的方法有矩估計(jì)法、極大似然法、最小二乘法、貝葉斯估計(jì)法等.參數(shù)估計(jì)的研究非常廣泛,并在各個(gè)領(lǐng)域展現(xiàn)出了獨(dú)有的效用和價(jià)值.楊智勇等人研究了參數(shù)估計(jì)在巖土工程場(chǎng)地勘測(cè)中的應(yīng)用,提出了考慮場(chǎng)地多源勘測(cè)數(shù)據(jù)三維空間相關(guān)性的土體參數(shù)概率密度函數(shù)估計(jì)方法,該研究方法為融合多源勘測(cè)數(shù)據(jù)的場(chǎng)地土體參數(shù)不確定性量化提供了一種有效分析工具.楊艷艷等人研究了參數(shù)估計(jì)在機(jī)器學(xué)習(xí)中的應(yīng)用,提出了基于群?jiǎn)l(fā)式算法的機(jī)器學(xué)習(xí)參數(shù)尋優(yōu)方法,該方法的參數(shù)尋優(yōu)能力和效率都優(yōu)于主流的網(wǎng)格搜索算法并且具有良好的可拓展性.李瓊芳等人研究了參數(shù)估計(jì)在暴雨強(qiáng)度預(yù)測(cè)中的應(yīng)用,高精度的暴雨強(qiáng)度公式是城市防洪排澇基礎(chǔ)設(shè)施建設(shè)規(guī)劃設(shè)計(jì)的重要依據(jù).李瓊芳等人提出的基于系統(tǒng)微分響應(yīng)的暴雨強(qiáng)度公式參數(shù)率定方法能夠快速尋找到參數(shù)真值,不僅效率高且能夠避免陷入局部最優(yōu),對(duì)提升暴雨強(qiáng)度公式精度具有重要參考價(jià)值.
在實(shí)際應(yīng)用中,對(duì)總體參數(shù)可能預(yù)先有所了解,這時(shí)會(huì)對(duì)總體參數(shù)提出假設(shè),通過(guò)樣本的信息驗(yàn)證提出的假設(shè)是否成立,這就是參數(shù)的假設(shè)檢驗(yàn).但假設(shè)檢驗(yàn)邏輯性強(qiáng),初學(xué)者很難理解其背后包含的原理以及含義.與此同時(shí),假設(shè)檢驗(yàn)在許多領(lǐng)域都有顯著的價(jià)值,何寧輝等人在變壓器故障診斷中引入假設(shè)檢驗(yàn),該模型的診斷準(zhǔn)確性相比于傳統(tǒng)診斷方法有較大提升.石則強(qiáng)等人研究了假設(shè)檢驗(yàn)在汽車排放實(shí)驗(yàn)室比對(duì)中的應(yīng)用研究,該研究方法能夠得到比對(duì)結(jié)果的真實(shí)情況.高宇等人探討了假設(shè)檢驗(yàn)在生物學(xué)中的應(yīng)用,以期為生物學(xué)數(shù)據(jù)的統(tǒng)計(jì)分析提供新的思路.喬俊峰考慮了假設(shè)檢驗(yàn)在艦船通信網(wǎng)絡(luò)信息安全中的應(yīng)用,該加密模型相較于傳統(tǒng)的加密模型提高了加密的安全系數(shù).基于此,有效地降低假設(shè)檢驗(yàn)的學(xué)習(xí)難度具有一定的意義.本文深入地分析參數(shù)假設(shè)檢驗(yàn),加深學(xué)習(xí)者對(duì)假設(shè)檢驗(yàn)的理解,并通過(guò)Matlab實(shí)現(xiàn)基于參數(shù)假設(shè)檢驗(yàn)的質(zhì)檢算法,用以保證系統(tǒng)和零部件的可靠性以及檢驗(yàn)試驗(yàn)在不同的操作過(guò)程中是否有本質(zhì)上的區(qū)別.使用該算法進(jìn)行質(zhì)檢時(shí),質(zhì)檢人員只需要輸入樣本數(shù)據(jù)以及選擇檢驗(yàn)類型,便可得到最終結(jié)果,這不僅降低了質(zhì)檢人員的使用難度,而且提升了質(zhì)檢的有效性.
概率性質(zhì)的反證法
假定對(duì)總體的某種假設(shè)H0是正確的,那么不支持這一假設(shè)的事件A即為小概率事件,在一次試驗(yàn)中幾乎不可能發(fā)生,實(shí)際上可認(rèn)為是不發(fā)生的.若在一次抽樣試驗(yàn)中樣本觀察值導(dǎo)致事件A發(fā)生,與小概率不發(fā)生矛盾,則拒絕這一原假設(shè);否則就接受原假設(shè).
(1)原假設(shè)與備擇假設(shè)
統(tǒng)計(jì)中常把要檢驗(yàn)的假設(shè)稱為原假設(shè),記為H0,還需要建立一個(gè)與H0對(duì)立的假設(shè),稱為備擇假設(shè),記為H1.
(2)顯著性水平
α=P{拒絕原假設(shè)H0|H0為真}是公認(rèn)的小概率事件的概率值.
(3)兩類錯(cuò)誤
在假設(shè)檢驗(yàn)的過(guò)程中,對(duì)判定原假設(shè)是否為真,即作出決策的依據(jù)僅僅是一個(gè)樣本.由于樣本的隨機(jī)性,要進(jìn)行判斷就不可避免會(huì)發(fā)生錯(cuò)誤.
①當(dāng)原假設(shè)H0實(shí)際為真時(shí),也有可能是樣本觀察值導(dǎo)致小概率事件發(fā)生,而作出拒絕H0的判斷,稱為第一類錯(cuò)誤,又叫棄真錯(cuò)誤.犯第一類錯(cuò)誤的概率是顯著性水平α.
α=P{拒絕原假設(shè)H0|H0為真.}
②當(dāng)原假設(shè)H0實(shí)際為假時(shí),樣本觀察值未導(dǎo)致小概率事件發(fā)生,而作出接受H0的判斷,稱為第二類錯(cuò)誤,又叫取偽錯(cuò)誤.其發(fā)生的概率為β.
β=P{接受原假設(shè)H0|H0為假}.
圖1 兩類錯(cuò)誤關(guān)系圖
只有擴(kuò)大樣本量n,才能使α與β同時(shí)減小.在實(shí)際中,樣本量過(guò)大不現(xiàn)實(shí).通常情況下,我們會(huì)控制犯第一類錯(cuò)誤的概率,使之不超過(guò)α.原因有兩點(diǎn):
①通常情況下,人們認(rèn)為犯第一類錯(cuò)誤的后果更嚴(yán)重一些,因?yàn)榉傅谝活愬e(cuò)誤即錯(cuò)過(guò)了事實(shí)存在的真相.
②在實(shí)際計(jì)算中,犯第二類錯(cuò)誤的概率β計(jì)算比較復(fù)雜,因此更容易控制犯第一類錯(cuò)誤的概率.
(4)檢驗(yàn)統(tǒng)計(jì)量
用于檢驗(yàn)假設(shè)的統(tǒng)計(jì)量(統(tǒng)計(jì)量:不含未知參數(shù)的樣本函數(shù))是檢驗(yàn)統(tǒng)計(jì)量.文章只考慮正態(tài)總體均值和方差的檢驗(yàn),選取標(biāo)準(zhǔn)如下:
(5)拒絕域
拒絕域W1:拒絕原假設(shè)H0時(shí),樣本值觀察值(x1,x2,…,xn)所構(gòu)成的集合.
假設(shè)檢驗(yàn)根據(jù)拒絕域的形式分為雙邊檢驗(yàn)和單邊檢驗(yàn),單邊檢驗(yàn)又分為左邊檢驗(yàn)和右邊檢驗(yàn).劃分標(biāo)準(zhǔn)如下:
①拒絕域在兩邊稱為雙邊檢驗(yàn),如圖2所示.備擇假設(shè)表現(xiàn)為含有“≠”符號(hào).
圖2 雙邊檢驗(yàn)拒絕域
②拒絕域在右邊稱為右邊檢驗(yàn),如圖3所示.備擇假設(shè)表現(xiàn)為含有“>”符號(hào).
圖3 右邊檢驗(yàn)拒絕域
③拒絕域在左邊稱為左邊檢驗(yàn),如圖4所示.備擇假設(shè)表現(xiàn)為含有“<”符號(hào).
圖4 左邊檢驗(yàn)拒絕域
假設(shè)檢驗(yàn)的一般步驟歸納如下:
(1)根據(jù)實(shí)際情況,建立兩個(gè)完全對(duì)立的假設(shè);
(2)選擇合適的檢驗(yàn)統(tǒng)計(jì)量;
(3)依照實(shí)際情況確定顯著性水平,表述拒絕域形式;
(4)根據(jù)樣本信息,對(duì)總體參數(shù)作出判斷.
若樣本觀察值(檢驗(yàn)統(tǒng)計(jì)量)落入拒絕域W1內(nèi),則拒絕原假設(shè)H0;若樣本觀察值(檢驗(yàn)統(tǒng)計(jì)量)沒(méi)有落入拒絕域W1內(nèi),則接受原假設(shè)H0.
基于假設(shè)檢驗(yàn)的原理設(shè)計(jì)一種質(zhì)檢算法模型,并通過(guò)Matlab軟件中相關(guān)函數(shù)實(shí)現(xiàn)該模型.具體思路為:根據(jù)實(shí)際需求,設(shè)定合適的顯著性水平α.本文只考慮正態(tài)總體的假設(shè)檢驗(yàn),首先判斷是單個(gè)正態(tài)總體還是兩個(gè)正態(tài)總體的假設(shè)檢驗(yàn).如果是單個(gè)正態(tài)總體的假設(shè)檢驗(yàn),方差檢驗(yàn)則需選擇χ2檢驗(yàn)法.對(duì)于均值的假設(shè)檢驗(yàn),則需要進(jìn)一步判斷方差已知還是方差未知,方差已知時(shí)選擇U檢驗(yàn)法,方差未知時(shí)選擇t檢驗(yàn)法.如果是兩個(gè)正態(tài)總體的假設(shè)檢驗(yàn),均值檢驗(yàn)選擇t檢驗(yàn)法,方差檢驗(yàn)選擇F檢驗(yàn)法.然后,根據(jù)實(shí)際需求,選擇左邊檢驗(yàn)、右邊檢驗(yàn)或雙邊檢驗(yàn).該算法模型適用于解決正態(tài)總體均值和方差的假設(shè)檢驗(yàn),具體流程如圖5:
圖5 算法流程圖
例1[工藝改進(jìn)]為了驗(yàn)證新的操作方法是否能提高鋼的產(chǎn)率,在保證其他試驗(yàn)條件一樣的情況下,分別按照標(biāo)準(zhǔn)方法和新方法煉10爐鋼,其產(chǎn)率如下表所示:
產(chǎn)鋼量
設(shè)這兩個(gè)樣本是相互獨(dú)立的正態(tài)總體,μ和σ2均未知.按照新的方法能否提高鋼的產(chǎn)率(α=0.05)?
運(yùn)行程序,輸入必要參數(shù),演示如下:
輸入顯著性水平:
0.05
單個(gè)正態(tài)總體請(qǐng)輸入[1];兩個(gè)正態(tài)總體請(qǐng)輸入[2]:
2
對(duì)方差檢驗(yàn)請(qǐng)輸入[F];對(duì)均值檢驗(yàn)請(qǐng)輸入[J]:
J
請(qǐng)輸入樣本值:x=
[78.1,72.4,76.2,74.3,77.4,78.4,76.0,75.5,76.7,77.3]
請(qǐng)輸入樣本值:y=
[79.1,81.0,77.3,79.1,80.0,79.1,79.1,77.3,80.2,82.1]
雙邊檢驗(yàn)請(qǐng)輸入[0];右邊檢驗(yàn)請(qǐng)輸入[1];左邊檢驗(yàn)請(qǐng)輸入[-1]:
-1
運(yùn)行結(jié)果:
在顯著性水平0.05下,可以拒絕原假設(shè)H0,即μ1<μ2;
即在顯著性水平0.05下,新的操作方法能提高鋼的產(chǎn)率,其平均產(chǎn)鋼率要高于標(biāo)準(zhǔn)方法.
例2[故障排查]當(dāng)機(jī)器正常工作時(shí),機(jī)器切割金屬棒的平均長(zhǎng)度x為10.5 cm,從中隨機(jī)選取15段進(jìn)行測(cè)量,金屬棒的長(zhǎng)度x如下:
10.4 10.6 10.1 10.4 10.5 10.3 10.3 10.2
10.9 10.6 10.8 10.5 10.7 10.2 10.7
已知總體X~N(10.5,0.15),該機(jī)器工作是否正常?(α=0.05)
運(yùn)行程序,輸入必要參數(shù),演示如下:
輸入顯著性水平:
0.05
單個(gè)正態(tài)總體請(qǐng)輸入[1];兩個(gè)正態(tài)總體請(qǐng)輸入[2]:
1
對(duì)方差檢驗(yàn)請(qǐng)輸入[F];對(duì)均值檢驗(yàn)請(qǐng)輸入[J]:
J
請(qǐng)輸入樣本值:x=[10.4,10.6,10.1,10.4,10.5,10.3,10.3,10.2,10.9,10.6,10.8,10.5,10.7,10.2,10.7]
雙邊檢驗(yàn)請(qǐng)輸入[0];右邊檢驗(yàn)請(qǐng)輸入[1];左邊檢驗(yàn)請(qǐng)輸入[-1]:
0
如果總體方差已知,請(qǐng)輸入[u];如果總體方差未知,請(qǐng)輸入[t]:
u
請(qǐng)輸入已知的均值:
10.5
請(qǐng)輸入正態(tài)總體的標(biāo)準(zhǔn)差:
0.15
運(yùn)行結(jié)果:
在顯著性水平0.05下,可以接受原假設(shè)H0,即μ=10.5.
本文對(duì)假設(shè)檢驗(yàn)作了深入描述和分析,能幫助學(xué)習(xí)者更好地理解假設(shè)檢驗(yàn).同時(shí),基于參數(shù)假設(shè)檢驗(yàn)的基本原理和統(tǒng)計(jì)推斷中的常用方法,通過(guò)Matlab編程設(shè)計(jì)了工程質(zhì)檢算法模型,方便質(zhì)檢人員進(jìn)行質(zhì)量檢測(cè)和故障排查.但本文設(shè)計(jì)的質(zhì)檢模型比較單一,只能用于較簡(jiǎn)單的正態(tài)總體方差和均值的檢驗(yàn),如何設(shè)計(jì)更為有效且精確度高的質(zhì)檢模型仍需進(jìn)一步研究.
數(shù)學(xué)學(xué)習(xí)與研究2022年29期