胡嘉卉
【摘要】本文論述了在概率論與數(shù)理統(tǒng)計(jì)課程教學(xué)中開展數(shù)學(xué)實(shí)驗(yàn)的必要性以及應(yīng)用實(shí)踐,結(jié)論表明數(shù)學(xué)實(shí)驗(yàn)的開展既可以促進(jìn)學(xué)生對(duì)理論知識(shí)的理解,又能夠提高學(xué)生的應(yīng)用能力.
【關(guān)鍵詞】概率論與數(shù)理統(tǒng)計(jì);數(shù)學(xué)實(shí)驗(yàn);應(yīng)用
【基金項(xiàng)目】 2021河南工業(yè)大學(xué)本科教學(xué)研究項(xiàng)目(項(xiàng)目編號(hào): lxyjy202101);河南工業(yè)大學(xué)博士基金項(xiàng)目(項(xiàng)目編號(hào): 2020BS037).
1引言
在大數(shù)據(jù)背景下,計(jì)算機(jī)軟件及技術(shù)在各個(gè)學(xué)科領(lǐng)域內(nèi)廣泛應(yīng)用,概率論與數(shù)理統(tǒng)計(jì)中的理論和方法體現(xiàn)出越來越重要的作用.其中,數(shù)理統(tǒng)計(jì)中處理數(shù)據(jù)的方法應(yīng)用尤其廣泛,遍及理學(xué)、工學(xué)、管理學(xué)和農(nóng)學(xué)等專業(yè)領(lǐng)域.同時(shí),這門課程也成為機(jī)器學(xué)習(xí)和人工智能發(fā)展的重要數(shù)學(xué)支撐.概率論與數(shù)理統(tǒng)計(jì)是理工科高等院校的必修課程,是碩士研究生入學(xué)考試的重要內(nèi)容之一,好的教學(xué)效果不僅能為學(xué)生打下堅(jiān)實(shí)的理論基礎(chǔ),滿足其后續(xù)學(xué)習(xí)的需要,還有利于學(xué)生將所學(xué)知識(shí)應(yīng)用到專業(yè)實(shí)踐中去.然而,在大多數(shù)高等院校,這門課程目前的教學(xué)模式主要是教師通過板書以及PPT講解理論知識(shí),學(xué)生聽講并通過做作業(yè)對(duì)知識(shí)進(jìn)行鞏固.這種方式雖然能達(dá)到讓學(xué)生掌握理論知識(shí)的目的,但在這種教學(xué)模式下,學(xué)生往往會(huì)覺得課堂枯燥,知識(shí)抽象難懂,學(xué)習(xí)興趣不高,掌握不了所學(xué)知識(shí)的應(yīng)用方法,很難在后續(xù)的學(xué)習(xí)中把理論知識(shí)應(yīng)用到專業(yè)中去.為了提升教學(xué)效果,使學(xué)生能將所學(xué)知識(shí)與實(shí)踐相結(jié)合,我們?cè)谠姓n堂教學(xué)過程中適當(dāng)引入一些數(shù)學(xué)實(shí)驗(yàn),這樣不僅能夠增強(qiáng)師生互動(dòng),活躍課堂氣氛,還有利于提高學(xué)生的動(dòng)手能力.
筆者在教學(xué)過程中對(duì)部分重要且抽象的知識(shí)點(diǎn)應(yīng)用MATLAB軟件開展了數(shù)學(xué)實(shí)驗(yàn),幫助學(xué)生深刻地理解所學(xué)內(nèi)容,增強(qiáng)了學(xué)生的學(xué)習(xí)興趣,提升了教學(xué)效果.下面就筆者的教學(xué)實(shí)踐和效果進(jìn)行論述和分析.
2概率統(tǒng)計(jì)課程中的實(shí)驗(yàn)教學(xué)
2.1模擬擲硬幣實(shí)驗(yàn)
歷史上,很多數(shù)學(xué)家都做過拋硬幣實(shí)驗(yàn),他們通過多次反復(fù)投擲均勻硬幣,統(tǒng)計(jì)出硬幣正面向上的頻率,發(fā)現(xiàn)當(dāng)實(shí)驗(yàn)次數(shù)較少時(shí),頻率值隨機(jī)波動(dòng)幅度較大;當(dāng)實(shí)驗(yàn)次數(shù)較多時(shí),頻率值的隨機(jī)波動(dòng)幅度較小;隨著實(shí)驗(yàn)次數(shù)的逐漸增加,正面向上的頻率將逐漸穩(wěn)定于固定值0.5.
然而在課堂上,成千上萬次投擲真實(shí)硬幣來重現(xiàn)這一結(jié)論是不方便也不現(xiàn)實(shí)的.我們可以帶領(lǐng)學(xué)生一起編寫MATLAB程序來模擬擲硬幣實(shí)驗(yàn),記錄并觀察多次實(shí)驗(yàn)的結(jié)果,同樣可以得出相應(yīng)的結(jié)論.
例1通過生成隨機(jī)數(shù)模擬連續(xù)多次投擲硬幣的結(jié)果,規(guī)定隨機(jī)數(shù)小于0.5時(shí)為正面,否則為反面.記錄重復(fù)10次,100次,1000次,10000次,100000次,1000000次實(shí)驗(yàn)出現(xiàn)正面的頻率.
解 參考代碼如下:
frequency = zeros(6,1);
for m = 1 : 6
a=0;
A=rand(10^m,1);
for i = 1 : 10^m
if A(i,1) < 0.5
a=a+1;
end
end
frequency(m,1) = a/(10^m);
end
frequency
運(yùn)行結(jié)果列表如下:
表1列出了4組模擬結(jié)果.從結(jié)果可以看出,當(dāng)實(shí)驗(yàn)次數(shù)較少時(shí),比如10次,正面朝上的頻率波動(dòng)幅度比較大,最小0.3,而最大為0.7.但是隨著實(shí)驗(yàn)次數(shù)的增加,正面朝上的頻率逐漸穩(wěn)定于固定值0.5.學(xué)生通過計(jì)算機(jī)生動(dòng)地重現(xiàn)了歷史上幾位著名數(shù)學(xué)家做過的擲硬幣實(shí)驗(yàn),理解頻率和概率的關(guān)系.同時(shí),實(shí)驗(yàn)直觀地解釋了大數(shù)定律,即事件發(fā)生的頻率依概率收斂于事件的概率,概率是頻率的穩(wěn)定值.
2.2驗(yàn)證泊松定理
泊松定理當(dāng)n充分大(n≥20),而p較?。╬≤0.05)時(shí),服從二項(xiàng)分布的隨機(jī)變量X近似服從泊松分布,即P(X=k)=Cknpk(1-p)n-k≈λkk!e-λ,其中λ=np.
在課堂上,我們通過下面的例2,告訴學(xué)生如何用MATLAB中的命令計(jì)算二項(xiàng)分布的概率,從而避免分布律的復(fù)雜計(jì)算,然后通過調(diào)整參數(shù),驗(yàn)證泊松定理的結(jié)論.
例2某人對(duì)同一目標(biāo)進(jìn)行獨(dú)立射擊400次,設(shè)每次射擊時(shí)的命中率均為0.02,試求至少命中兩次的概率.
解設(shè)X表示400次射擊命中目標(biāo)的次數(shù),那么X~B(400,0.02),我們可以根據(jù)二項(xiàng)分布的分布律直接計(jì)算出答案0.9972.另外,由于此題的參數(shù)滿足泊松定理的條件,所以我們也可以用泊松分布的分布律近似計(jì)算概率.
同時(shí),常用分布的概率還可以利用MATLAB命令計(jì)算,學(xué)生恰當(dāng)應(yīng)用軟件,可以避免煩瑣的計(jì)算.
參考代碼如下:
X=0:400;
R=binopdf(X,400,0.02);
s=sum(R(3:401))
運(yùn)行結(jié)果為s=0.9972.這里學(xué)生可以看到,程序運(yùn)行結(jié)果和利用分布律計(jì)算的結(jié)果是一致的.
在此例子的基礎(chǔ)上,我們引導(dǎo)學(xué)生對(duì)參數(shù)做一些調(diào)整,通過繪制二項(xiàng)分布和泊松分布的曲線來驗(yàn)證泊松定理的結(jié)論.繪制的曲線如圖1和圖2所示.
從繪制出的圖像可以看出,當(dāng)p足夠小,n足夠大時(shí),即泊松定理的條件滿足時(shí),二項(xiàng)分布和泊松分布的分布律曲線是吻合的,如圖1所示的情形.而當(dāng)這個(gè)條件不滿足時(shí),如圖2所示,二者會(huì)出現(xiàn)較大偏差,此時(shí)不能用泊松分布近似二項(xiàng)分布.
2.3蒙特卡羅(Monte Carlo)模擬
蒙特卡羅模擬是一種計(jì)算方法,其原理是通過大量隨機(jī)樣本來求出一個(gè)系統(tǒng)中的未知量.該方法的一般實(shí)現(xiàn)過程為:先設(shè)計(jì)一個(gè)適當(dāng)?shù)碾S機(jī)實(shí)驗(yàn),使得某事件發(fā)生的概率與所求量有關(guān),然后大量重復(fù)該實(shí)驗(yàn),用事件發(fā)生的頻率代替概率,從而近似計(jì)算出所求.隨著計(jì)算機(jī)技術(shù)及軟件的發(fā)展,蒙特卡羅方法很適合通過計(jì)算機(jī)模擬實(shí)現(xiàn),這樣能夠節(jié)省大量成本.
例3用蒙特卡羅法計(jì)算圓周率π的近似值.
解 在一個(gè)邊長(zhǎng)為1 cm的正方形內(nèi)畫一個(gè)半徑為1 cm的14圓,然后在這個(gè)正方形內(nèi)生成均勻分布的隨機(jī)點(diǎn),落在圓內(nèi)的點(diǎn)數(shù)占總點(diǎn)數(shù)的π4,我們求出這個(gè)頻率,再乘以4,就得到π的近似值.通過不同數(shù)量的隨機(jī)點(diǎn)得到的π的近似值如下表所示.可以看出,隨機(jī)點(diǎn)越多,得到的π的近似值越精確,這也說明了隨著實(shí)驗(yàn)次數(shù)的增多,頻率逐漸趨于概率.
2.4參數(shù)的區(qū)間估計(jì)
如果得到樣本向量X,我們調(diào)用命令[mu,sigma,muci,sigmaci] = normfit(X,alpha),可以得到參數(shù)的極大似然估計(jì)值mu和sigma,以及置信系數(shù)為1-alpha的置信區(qū)間muci和sigmaci.在課堂上講到區(qū)間估計(jì)內(nèi)容時(shí),我們先講解教材中的方法,然后通過例4和例5說明如何應(yīng)用命令normfit求置信區(qū)間,比較得到的結(jié)果,并進(jìn)一步闡明我們對(duì)于置信系數(shù)的理解.
例4從某年級(jí)中隨機(jī)抽取10名女生,身高如下:162 cm,159 cm,168 cm,160 cm,157 cm,162 cm,163 cm,159 cm,170 cm,166 cm.求該年級(jí)女生平均身高的95%的置信區(qū)間.(假設(shè)女生身高服從正態(tài)分布)
解 我們先用教材中的方法解答,再調(diào)用命令normfit求解,然后進(jìn)行對(duì)比.
解法一: 設(shè)該年級(jí)女生的平均身高為μ,欲求滿足P(θ^1<μ<θ^2)=0.95的區(qū)間(θ^1,θ^2),先求滿足P-λ<X--μSn<λ=0.95的λ.由教材的附表查表可得λ=tn-1α2=t9(0.025)=2.26.
故PX--λSn<μ<X-+λSn=0.95,其中X-=162+…+16610=163,S2=1n-1∑ni=1(Xi-X-)2=18.43.所以μ的置信系數(shù)為95%時(shí),置信區(qū)間為(159.6,165.6).
解法二: 調(diào)用命令[mu,sigma,muci,sigmaci] = normfit(X,alpha),其中X為樣本向量,alpha=0.05.
參考代碼如下:
X = [162 159 168 160 157 162 163 159 170 166];
[mu,sigma,muci,sigmaci] = normfit(X,0.05)
運(yùn)行可得:
mu =162.6000
sigma =4.2216
muci =
159.5800
165.6200
sigmaci =
2.9038
7.7071
其中,mu和sigma分別為總體期望和標(biāo)準(zhǔn)差的極大似然估計(jì)值,muci為本題所求,即平均身高μ的95%的置信區(qū)間,這與上面的計(jì)算結(jié)果是一致的.sigmaci為總體標(biāo)準(zhǔn)差的95%的置信區(qū)間.
由此可見,在掌握了基本理論的前提下,適當(dāng)應(yīng)用軟件解決問題是快捷方便的.
例5假設(shè)X~N(10,4),模擬產(chǎn)生X的100組容量為24的重復(fù)觀測(cè)樣本數(shù)據(jù),對(duì)于每一組樣本數(shù)據(jù)利用normfit計(jì)算總體均值的0.95的置信區(qū)間,并考察在得到的100個(gè)置信區(qū)間中有多少個(gè)區(qū)間包含10.
解 參考代碼如下:
function n = ex4()
n=0;
for i=1:100
x =normrnd(10,2,24,1);
[m,s,sci] = normfit(x);
if sci(1)<10 && sci(2)>10
n=n+1;
end
end
該函數(shù)的四次運(yùn)行結(jié)果分別為n=96,n=95,n=96,n=99.該結(jié)果表明,如果置信系數(shù)為0.95,那么對(duì)于構(gòu)造的100個(gè)區(qū)間來說,大約會(huì)有95個(gè)包含參數(shù)μ.事實(shí)上,對(duì)于一個(gè)具體的區(qū)間,如例4中得到的(159.6,165.6),它或者包含μ,或者不包含μ,兩者必居其一,說它包含μ的概率是0.95并不合適.因此,置信系數(shù)0.95的意義是指多次重復(fù)抽樣構(gòu)造置信區(qū)間包含μ的頻率大約是95%.也就是說,置信系數(shù)實(shí)際上是對(duì)構(gòu)造置信區(qū)間的這種方法的可靠程度的整體評(píng)價(jià).這樣的教學(xué)模式一方面可以使學(xué)生學(xué)會(huì)應(yīng)用軟件中的命令進(jìn)行參數(shù)估計(jì),另一方面,也使學(xué)生更深刻地理解了置信系數(shù)和置信區(qū)間的含義.
2.5假設(shè)檢驗(yàn)
在講到假設(shè)檢驗(yàn)部分時(shí),除了給學(xué)生講授教材中的理論知識(shí)以及借助查表的檢驗(yàn)方法外,我們還向?qū)W生介紹了MATLAB中的命令,以使其快速地得到結(jié)論.
例6某工廠生產(chǎn)10 Ω的電阻,根據(jù)以往生產(chǎn)的電阻的實(shí)際情況,可認(rèn)為其電阻值服從正態(tài)分布,標(biāo)準(zhǔn)差σ=0.1 Ω.現(xiàn)隨機(jī)抽取10個(gè)電阻,測(cè)得它們的阻值為: 9.9 Ω,10.1 Ω,10.2 Ω,9.7 Ω,9.9 Ω,9.9 Ω,10 Ω,10.5 Ω,10.1 Ω,10.2 Ω,試問通過這10個(gè)實(shí)測(cè)值能否認(rèn)為該廠生產(chǎn)的電阻的平均阻值為10 Ω?
這個(gè)題目我們可以用教材上的方法結(jié)合查表來做,這是我們課堂上講授的基本理論和方法,是這部分內(nèi)容的基礎(chǔ).基于此,我們進(jìn)一步引導(dǎo)學(xué)生用MATLAB命令快速地解決問題,拓展學(xué)生的解題思路,增強(qiáng)學(xué)生對(duì)知識(shí)的理解和動(dòng)手解決問題的能力.
解 我們先采用教材上的方法解答,再調(diào)用命令ztest解答,并對(duì)得到的結(jié)論進(jìn)行對(duì)比.給定顯著性水平α=0.05.原假設(shè)H0:μ=10;對(duì)立假設(shè)H1:μ≠10.
解法一:選取適當(dāng)?shù)慕y(tǒng)計(jì)量,構(gòu)造小概率事件:
PX--μσn>λ=0.05
查表得到λ=1.96.由樣本值可得X-=10.05,將樣本值代入統(tǒng)計(jì)量得:
X--μσn=10.05-100.110=1.58<1.96
即統(tǒng)計(jì)量的取值落入接受域,故接受原假設(shè)H0.
解法二:應(yīng)用命令ztest,可以更方便地得到結(jié)論.
參考代碼如下:
X=[9.9 10.1 10.2 9.7 9.99.9 10 10.5 10.1 10.2];
sigma=0.1;
mu=10;
alpha=0.05;
h=ztest(X,mu,sigma,alpha,0)
運(yùn)行結(jié)果為h=0.
這表明,在顯著性水平α=0.05時(shí),接受原假設(shè)H0.可見應(yīng)用軟件解決問題減少了計(jì)算量,提高了效率.需要注意的是,雖然軟件的輔助可以給問題解決帶來方便,節(jié)省時(shí)間,但是我們并不能忽略基本理論和數(shù)學(xué)思想的講授,學(xué)生只有在理解并充分掌握了基礎(chǔ)數(shù)學(xué)理論的前提下,適當(dāng)應(yīng)用軟件,才能起到事半功倍的效果.
3結(jié)束語
在概率論與數(shù)理統(tǒng)計(jì)課程的教學(xué)中,教師適當(dāng)引入數(shù)學(xué)實(shí)驗(yàn),既可以加深學(xué)生對(duì)抽象理論知識(shí)的理解,豐富解決問題的思路,又可以提高學(xué)生應(yīng)用知識(shí)的能力,進(jìn)一步增強(qiáng)了學(xué)生的學(xué)習(xí)熱情,提高了學(xué)生的學(xué)習(xí)興趣,活躍了課堂氣氛,增強(qiáng)了教學(xué)效果.本文論述了課程中開展的數(shù)學(xué)實(shí)驗(yàn)的部分例子,它們都具有理論內(nèi)容重要、編程簡(jiǎn)單易行的特點(diǎn),非常適合在課堂教學(xué)過程中同時(shí)開展.在不同學(xué)時(shí)、不同專業(yè)的課程教學(xué)中,我們會(huì)根據(jù)總課時(shí)量、課程進(jìn)度、學(xué)生的學(xué)習(xí)能力等具體情況,適當(dāng)增加或者減少部分?jǐn)?shù)學(xué)實(shí)驗(yàn).如果授課對(duì)象是軟件應(yīng)用能力比較強(qiáng)的理工科學(xué)生,我們還可以通過布置作業(yè)的形式讓他們自行編程,實(shí)現(xiàn)一些簡(jiǎn)單的實(shí)驗(yàn),并把該作業(yè)成績(jī)按一定的權(quán)重計(jì)入期末總評(píng)成績(jī)中,以實(shí)現(xiàn)對(duì)學(xué)生學(xué)習(xí)效果的全方面、多角度考查.
【參考文獻(xiàn)】
[1]王松桂,張忠占,程維虎,等.概率論與數(shù)理統(tǒng)計(jì)(第三版) [M].北京: 科學(xué)出版社,2011.
[2]茆詩松,程依明,濮曉龍.概率論與數(shù)理統(tǒng)計(jì)(第二版) [M].北京: 高等教育出版社,2011.
[3]劉衛(wèi)國(guó).MATLAB程序設(shè)計(jì)教程(第三版) [M].北京: 中國(guó)水利水電出版社,2017.
[4]李娜,王丹齡,劉秀芹.數(shù)學(xué)實(shí)驗(yàn)概率論與數(shù)理統(tǒng)計(jì)分冊(cè) [M].北京: 機(jī)械工業(yè)出版社,2019.
[5]張崇岐,李光輝.統(tǒng)計(jì)方法與實(shí)驗(yàn) [M].北京: 高等教育出版社,2015.