都俊杰 鄒發(fā)偉 陳帆
摘要:中心極限定理是概率論與數(shù)理統(tǒng)計課程中一個重要的定理,銜接著概率論知識與數(shù)理統(tǒng)計的相關知識,既是教學重點又是難點。中心極限定理在很一般的條件下證明了無論隨機變量Xi服從什么分布,n個隨機變量的和∑nk=1Xk的極限分布是正態(tài)分布,本文僅介紹其中兩個最基本的結(jié)論并舉例應用。
關鍵詞:中心極限定理;正態(tài)分布;應用
中圖分類號:O212文獻標志碼:A文章編號:2095-9214(2016)03-0138-02前言
大數(shù)定律和中心極限定理是統(tǒng)計學的兩大基石,前者確保了統(tǒng)計推斷至少在樣本增大時可以無限接近真相,而后者則給出了大多數(shù)統(tǒng)計量分布的正態(tài)近似。大數(shù)定律只能從質(zhì)的方面描述隨機現(xiàn)象,而中心極限定理可以更進一步從量的方面描述隨機現(xiàn)象,所以中心極限定理比大數(shù)定律深刻實用得多,它是概率論與數(shù)理統(tǒng)計的基礎。
中心極限定理解決了大量獨立隨機變量和的近似分布問題,其結(jié)論表明:當一個量受許多隨機因素的共同影響而隨機取值,則它的分布就近似服從正態(tài)分布,而正態(tài)分布的許多完美理論,能幫助我們獲得實用簡單的統(tǒng)計分析結(jié)果,本文僅介紹其中的兩個最基本的結(jié)論,并通過舉例加以應用。
1.獨立同分布的中心極限定理
定理1設隨機變量X1,X2,…,Xn,…相互獨立、服從同一分布,且E(Xk)=μ,D(Xk)=σ2>0,(k=1,2,…,n,…),則隨機變量X1,X2,…,Xn,…之和∑nk=1Xk的標準化變量Yn=∑nk=1Xk-E(∑nk=1Xk)D(∑nk=1Xk)=∑nk=1Xk-nμnσ的分布函數(shù)Fn(x),對于任意的x,滿足:
limn→∞Fn(x)=limn→∞P∑nk=1Xk-nμnσ≤x=∫x-∞12πe-t22dt=φ(x)
注1當n充分大時,滿足均值為μ,方差為σ2>0的獨立同分布(無論服從什么分布)的隨機變量X1,X2,…,Xn…,它們的和∑nk=1Xk總是近似地服從正態(tài)分布,記作:
∑nk=1Xk-nμnσ近似~N0,1
即∑nk=1Xk-nμnσ=1n∑nk=1Xk-μσ/n=X-μσ/n近似~N0,1
即有X近似~N(μ,σ2n),于是有下面的推論:
當n充分大時,記Sn=X1+X2+…+Xn,可得如下的近似計算公式:
PSn-nμnσ≤x≈Φx
注2對任意a
Pa≤Sn≤b=Pa-nμnσ ≈Φb-nμnσ-Φx-nμnσ 例1某炮兵陣地對敵人的防御地段進行100次射擊,每次射擊中炮彈的命中數(shù)是一個隨機變量,其期望為2,方差為1.69,求在100次射擊中有180顆到220顆炮彈命中目標的概率。 解設Xk表示第k次射擊中的炮彈數(shù),則EXi=2,DXi=1.69,且S100=X1+X2+…+X100,應用中心極限定理,S100-100μ100σ近似服從N(0,1),由題意n=100,nμ=200,nσ=13 ,所以: P(180≤Sn≤220)=P180-20013≤Sn-20013≤220-20013 ≈Φ2013-Φ-2013=2Φ1.54-1 =0.8764 例2設各零件的質(zhì)量都是隨機變量,他們相互獨立且服從相同的分布,其期望為0.5kg,均方差為0.1 kg,問5000個零件的總重量超過2510 kg的概率是多少? 解由題意可知,Xi表示第i個零件的質(zhì)量,且E(Xi)=0.5,D(Xi)=0.12,n=5000,令X=∑5000i=1Xi表示5000個零件的總重量,由獨立同分布的中心極限定理: X-E(X)D(X)=X-5000×0.55000×0.1~N(0,1) P(X>2510)=1-P(X≤2510) =1-φ(2510-5000×0.55000×0.1) =1-φ(2)=1-0.9213=0.0787 2.棣莫弗-拉普拉斯定理 定理2設隨機變量ηn(n=1,2,…)服從參數(shù)為n,p(0 注1正態(tài)分布是二項分布的極限分布,當n充分大時,可用正態(tài)分布來計算二項分布的概率。且對任意的區(qū)間a,b有Pa≤ηn-npnp(1-p)≤b=∫ba12πe-t22dt.ηn-npnp(1-p)近似服從N(0,1)分布,而ηn近似服從N(np,np(1-p)).二項分布的隨機變量的概率可轉(zhuǎn)化為正態(tài)分布的概率來計算,計算方法如下: Pa≤ηn≤b=Pa-npnp(1-p)≤ηn-npnp(1-p)≤b-npnp(1-p) ≈Φb-npnp(1-p)-Φa-npnp(1-p)。 注2定理1和定理2這兩個中心極限定理都是研究可列個相互獨立的隨機變量的和的分布的,在一般條件下,當獨立的隨機變量的個數(shù)增加時,其和的分布趨于正態(tài)分布,也說明正態(tài)分布的重要性。 例3一個復雜系統(tǒng)由100個相互獨立的元件組成,在系統(tǒng)運行時每個元件損壞的概率為0.1,為使系統(tǒng)正常工作,至少必須有85個元件工作,求系統(tǒng)的可靠度(正常工作的概率)。 解以X表示100個元件中正常工作的元件數(shù),則X~B(100,0.9),由二項分布的正態(tài)近似,X-100×0.9100×0.9×0.1~N(0,1), P(X≥85)=1-P(X<85)=1-P(X-903<85-903) =1-φ(-53)=0.9525 例4產(chǎn)品為廢品的概率p=0.005,求1000件產(chǎn)品中廢品數(shù)不大于7的概率。 解1000件產(chǎn)品中的廢品數(shù)X服從二項分布,n=1000,p=0.005,np=5,np(1-p)≈2.2305,下面用三種方法計算 (1)由二項分布公式計算,P(X≤7)=∑7k=0Ck10000.005k0.9951000-k (2)用泊松公式計算, λ=np=5,查表P(X≤7)≈∑7k=0pk5≈0.866624 (3)用中心極限定理計算,P(X≤7)≈Φ7-52.2305≈Φ0.8968=0.8133 正態(tài)分布和泊松分布雖然都是二項分布的極限分布,但后者以n→∞,同時p→0,np→λ為條件,而前者則只要求n→∞這一條件,一般對于n很大p很小的二項分布,用正態(tài)分布來近似不如用泊松分布計算精確。 大數(shù)定律是研究隨機變量序列Xn依概率收斂的極限問題,而中心極限定理則是研究隨機變量序列Xn依分布收斂的極限問題,他們都是討論大量的隨機變量之和的極限行為,當X1,X2,…,Xn,…相互獨立且服從同一分布,且有大于0的有限方差時,大數(shù)定律和中心極限定理同時成立,但是通常中心極限定理比大數(shù)定律更為精確。 (作者單位:長江大學工程技術學院) 參考文獻: [1]秦川.概率論與數(shù)理統(tǒng)計(第二版)[M].湖南教育出版社,2013. [2]宗序平.概率論與數(shù)理統(tǒng)計(第三版)[M].機械工業(yè)出版社,2011. [3]陶偉.概率論與數(shù)理統(tǒng)計習題全解[M].國家行政學院出版社,2008. [4]王偉珠.論中心極限定理及應用[J].赤峰學院學報, 2013(10). [5]王筑娟.中心極限定理介紹[J].上海應用技術學院學報,2013(4).