張艷,周圣武,韓苗,索新麗
摘要:討論了伽馬分布的性質(zhì),給出伽馬分布的三個(gè)特例及中心極限定理形式,并利用極限分布,得到n充分大時(shí)x2(n)分布和n階愛爾朗分布的上α分位點(diǎn)的近似計(jì)算公式.最后,應(yīng)用伽馬分布給出了指數(shù)分布參數(shù)的置信區(qū)間并給出了應(yīng)用實(shí)例。
關(guān)鍵詞:伽馬分布;性質(zhì);極限分布;上分位數(shù)
中圖分類號(hào):O211.1?搖 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):1674-9324(2014)02-0057-02
一、引言
伽馬分布是概率統(tǒng)計(jì)中一類重要的分布,它和指數(shù)分布、x2分布、愛爾朗(Erlang)分布等一些常見的重要分布都有著密切的聯(lián)系。張永利[1]通過伽馬分布的可加性得到了構(gòu)造卡方分布和均勻分布的方法,本文將通過對(duì)伽馬分布的特征函數(shù)進(jìn)行研究,從特征函數(shù)出發(fā),推導(dǎo)伽馬分布關(guān)于尺度參數(shù)的可加性,研究伽馬分布及其三個(gè)特例的數(shù)字特征,以及強(qiáng)度為λ的泊松流的第n個(gè)事件出現(xiàn)時(shí)所需要時(shí)間長度的分布問題,應(yīng)用伽馬分布推導(dǎo)指數(shù)分布參數(shù)的區(qū)間估計(jì)形式,并給出應(yīng)用實(shí)例。
定義1.1[2] 若隨機(jī)變量X具有概率密度
f(x)=■xα-1e-βx x>0,0 x≤0.
其中α>0,β>0,則稱X服從參數(shù)為α,β的伽馬(Gamma)分布,記為X~?祝(α,β);α稱為形狀參數(shù),β稱為尺度參數(shù);?祝(α)=■xxα-1e-xdx為?祝函數(shù),伽馬分布因此而得名。?祝函數(shù)具有以下基本性質(zhì)[1]:?祝(α+1)=α?祝(α),?祝(1)=1,??!?■,特別,當(dāng)對(duì)于n取自然數(shù),有?祝(n)=(n-1)!.
伽馬分布的概率密度f(x)是單峰函數(shù),當(dāng)α>1時(shí),f(x) 在x=(α-1)/β處達(dá)到最大值,在α<1時(shí),縱軸為f(x)的漸近線。
二、伽馬分布的特例
設(shè)X~?祝(α,β),當(dāng)α,β取某些特殊值時(shí),伽馬分布可變?yōu)橐恍┏R姷姆植?
(1)當(dāng)α=1,β=λ時(shí),即X~?祝(1,λ),由?祝(1)=1可知 X的概率密度為
f(x)=λe-λx x>0,0 x≤0.
表明X服從參數(shù)為λ的指數(shù)分布,可見指數(shù)分布是伽馬分布的一個(gè)特例。
(2)當(dāng)α=■,β=■時(shí),即X~??!?,■,X的概率密度為f(x)=■x■e■ x>0,0 x≤0.
這也是自由度為n的x2分布隨機(jī)變量的概率密度,所以 X~x2(n),由此可見x2分布也是伽馬分布的一個(gè)特例。
(3)當(dāng)α=n,β=λ時(shí),即?祝(n,λ),由?祝(n)=(n-1)!可得
f(x)=■x■e■■ x>0,0 x≤0.
此分布稱為參數(shù)為n和λ的愛爾朗(Erlang)分布[4]。愛爾朗分布被廣泛應(yīng)用于排隊(duì)論與可靠性理論中,它描述了強(qiáng)度為λ的泊松流的第n個(gè)事件出現(xiàn)時(shí)所需要時(shí)間長度的分布。愛爾朗分布是伽馬分布的一個(gè)特例,而指數(shù)分布又是愛爾朗分布的一個(gè)特例,階數(shù)n=1的愛爾朗分布即為指數(shù)分布。
三、伽馬分布的基本性質(zhì)
命題3.1 設(shè)隨機(jī)變量X~?祝(α,β),則X的特征函數(shù) φ(t)為φ(t)=1-■■.
證 X的特征函數(shù)φ(t)為:φ(t)=E(eitX)=■eitxf(x)dx=■■xα-1e-(β-it)xdx,令(β-it)x=u,則上式化為
φ(t)=■■■■uα-1e-udu=■■■?祝(α)=1-■■
命題3.2 伽馬分布具有可加性,即若隨機(jī)變量X~?祝(α1,β),Y~?祝(α2,β),且相互獨(dú)立,則X+Y~?祝(α1+α2,β).
利用伽馬分布的特征函數(shù)證明可加性非常方便。
證 由特征函數(shù)的性質(zhì)可知,X+Y,Y與X的特征函數(shù)滿足φX+Y(t)=φX(t)φY(t),
由命題3.1可得,可以得到X+Y的特征函數(shù)為
φX+Y(t)=1-■■1-■■=1-■■1-■■
具有這種形式的特征函數(shù)的隨機(jī)變量服從參數(shù)為α1+α2,β的伽馬分布,故X+Y~?祝(α1+α2,β).
由命題3.2知,兩個(gè)具有相同尺度參數(shù)的相互獨(dú)立伽馬變量之和仍服從伽馬分布,即伽馬分布關(guān)于形狀參數(shù)具有可加性.此可加性對(duì)有限個(gè)具有相同尺度參數(shù)的相互獨(dú)立的伽馬分布變量的情形也是成立的。
命題3.3 具有參數(shù)為n和λ的愛爾朗分布的隨機(jī)變量可以分解為n個(gè)相互獨(dú)立的具有相同參數(shù)λ的指數(shù)分布的隨機(jī)變量之和。
證 設(shè)X1,X2,Λ,Xn相互獨(dú)立,且都服從參數(shù)為λ的指數(shù)分布.由指數(shù)分布與伽馬分布的關(guān)系可知Xt~?祝(1,λ)(i=1,2,L,n),再由命題3.2 可得
X1+X2+L+Xn~?祝(n,λ),
即?祝(n,λ)分布可以分解為n個(gè)相互獨(dú)立的分布參數(shù)為 λ的指數(shù)分布的隨機(jī)變量之和。
命題3.4 設(shè)X~?祝(α,β),則
E(xk)=■.
證 X的特征函數(shù)為φ(t)=1-■■,所以X的k階矩為
由命題3.4可知,若X~?祝(α,β),E(X)=α/β,E(X2)=α(α+1)/β2,由此可得X的方差為D(X)=α/β2.特別對(duì)于伽馬分布的三個(gè)特例有以下結(jié)論:
命題3.5 ①若X~?祝(1,λ),則E=(X)=■,D(X)=■;
②若X服從自由度為n的x2分布,即X~?祝(■,■),則 E(X)=n,D(X)=2n;
③若X~?祝(n,λ),則E(X)=■,D(X)=■.
四、極限定理
命題4.1 若Yn~?祝(nα,β),則對(duì)于任意實(shí)數(shù)x,有
■P■≤x=■■e■dt=Φ(x)
證 由于Yn可看成是n個(gè)相互獨(dú)立、服從同一?祝(α,β)分布的隨機(jī)變量X1,X2,Λ,Xn之和,即有Yn=■X■,且EXi=α/β,DXi=α/β2,i=1,2,L,n應(yīng)用獨(dú)立同分布的中心極限定理[2,3]有endprint
■P■≤x=■P■≤x=■■e■dt=Φ(x).
當(dāng)n充分大時(shí),近似地有:Yn~N(nα/β,nα/β2).
對(duì)于卡方分布和愛爾朗分布,當(dāng)n充分大時(shí),利用命題4.1的極限定理,可以近似得到這兩種分布的上分位數(shù)與標(biāo)準(zhǔn)正態(tài)分布的上分?jǐn)?shù)的關(guān)系,證明省略。
命題4.2 設(shè)x2α、?祝α(n,λ)、zα分別為卡方分布、愛爾朗分布和標(biāo)準(zhǔn)正態(tài)分布的上α分位點(diǎn),則當(dāng)n充分大時(shí),有 x2α(n)≈n+■zα,?祝α(n)≈■.
五、應(yīng)用
命題5.1 設(shè)總體X服從參數(shù)為λ的指數(shù)分布,X的樣本為X1,X2,Λ,Xn則
①參數(shù)λ的置信水平為1-α的置信區(qū)間為:■,■,
②指數(shù)分布均值的置信水平為1-α的置信區(qū)間為:■,■.
證 ①X~E(λ),注意到X~?祝(1,λ),則由命題3.3知:Y=nX=■Xi-?祝(n),其概率密度為fY(y)=■y■e■,y>00, y≤0,令Z=2λY=2nλX,則Z的概率密度為fZ(Z)=■fY■z=■e■■,z>00, z≤0=■e■■,z>00, z≤0 所以Z=2nλX~x2(2n),對(duì)于給定的置信水平1-α,由P{x■■(2n)<2nλX ②指數(shù)分布的均值■的置信水平為1-α的置信區(qū)間:■,■. 例5.1 某電子元件的使用壽命服從參數(shù)為λ的指數(shù)分布,現(xiàn)從一批這種電子元件中隨機(jī)抽取72只進(jìn)行測試,算得平均壽命為x=2580h,求這批電子元件的平均使用壽命的置信水平為0.95的置信區(qū)間。 解:樣本容量n=72,α=1-0.95=0.05,應(yīng)用x2(2n)分布的上α分位點(diǎn)的近似公式x■■(2n)≈2n+■zα/2,可得x■■(144)≈177.26,x■■(144)≈110.74, 所以這批電子元件的平均使用壽命的置信水平為0.95的置信區(qū)間為■,■≈■,■=(2095.88,3354.96) 注意:樣本比較大時(shí),也可依據(jù)極限定理,用正態(tài)分布對(duì)大樣本均值進(jìn)行區(qū)間估計(jì),對(duì)于參數(shù)為1/λ的指數(shù)分布,指數(shù)分布均值1/λ的置信水平為1-α的置信區(qū)間近似地為:■,■,對(duì)于本例,n=72是大樣本,可以用近似方法求平均使用壽命的置信水平為0.95的置信區(qū)間為(2095.88,3354.96).可見對(duì)于大樣本,兩種方法求得置信區(qū)間幾乎相同,但如果樣本容量較小,用前者給出的置信區(qū)間去做估計(jì)效果比較好。 參考文獻(xiàn): [1]張永利.關(guān)于伽馬分布及相關(guān)分布性質(zhì)的一點(diǎn)研究[J].大學(xué)數(shù)學(xué),2012.3:135-140. [2]周圣武,李金玉,周長新.概率論與數(shù)理統(tǒng)計(jì)(第二版)[M].北京:煤炭工業(yè)出版社,2007:105,127-138. [3]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)(第四版)[M].北京:高等教育出版社,2007:147-153. [4][美]Sheldon M.Ross著,鄭忠國,詹從贊譯.概率論基礎(chǔ)教程(第8版)[M].北京:人民郵電出版社,2010:174-180.
■P■≤x=■P■≤x=■■e■dt=Φ(x).
當(dāng)n充分大時(shí),近似地有:Yn~N(nα/β,nα/β2).
對(duì)于卡方分布和愛爾朗分布,當(dāng)n充分大時(shí),利用命題4.1的極限定理,可以近似得到這兩種分布的上分位數(shù)與標(biāo)準(zhǔn)正態(tài)分布的上分?jǐn)?shù)的關(guān)系,證明省略。
命題4.2 設(shè)x2α、?祝α(n,λ)、zα分別為卡方分布、愛爾朗分布和標(biāo)準(zhǔn)正態(tài)分布的上α分位點(diǎn),則當(dāng)n充分大時(shí),有 x2α(n)≈n+■zα,?祝α(n)≈■.
五、應(yīng)用
命題5.1 設(shè)總體X服從參數(shù)為λ的指數(shù)分布,X的樣本為X1,X2,Λ,Xn則
①參數(shù)λ的置信水平為1-α的置信區(qū)間為:■,■,
②指數(shù)分布均值的置信水平為1-α的置信區(qū)間為:■,■.
證 ①X~E(λ),注意到X~?祝(1,λ),則由命題3.3知:Y=nX=■Xi-?祝(n),其概率密度為fY(y)=■y■e■,y>00, y≤0,令Z=2λY=2nλX,則Z的概率密度為fZ(Z)=■fY■z=■e■■,z>00, z≤0=■e■■,z>00, z≤0 所以Z=2nλX~x2(2n),對(duì)于給定的置信水平1-α,由P{x■■(2n)<2nλX ②指數(shù)分布的均值■的置信水平為1-α的置信區(qū)間:■,■. 例5.1 某電子元件的使用壽命服從參數(shù)為λ的指數(shù)分布,現(xiàn)從一批這種電子元件中隨機(jī)抽取72只進(jìn)行測試,算得平均壽命為x=2580h,求這批電子元件的平均使用壽命的置信水平為0.95的置信區(qū)間。 解:樣本容量n=72,α=1-0.95=0.05,應(yīng)用x2(2n)分布的上α分位點(diǎn)的近似公式x■■(2n)≈2n+■zα/2,可得x■■(144)≈177.26,x■■(144)≈110.74, 所以這批電子元件的平均使用壽命的置信水平為0.95的置信區(qū)間為■,■≈■,■=(2095.88,3354.96) 注意:樣本比較大時(shí),也可依據(jù)極限定理,用正態(tài)分布對(duì)大樣本均值進(jìn)行區(qū)間估計(jì),對(duì)于參數(shù)為1/λ的指數(shù)分布,指數(shù)分布均值1/λ的置信水平為1-α的置信區(qū)間近似地為:■,■,對(duì)于本例,n=72是大樣本,可以用近似方法求平均使用壽命的置信水平為0.95的置信區(qū)間為(2095.88,3354.96).可見對(duì)于大樣本,兩種方法求得置信區(qū)間幾乎相同,但如果樣本容量較小,用前者給出的置信區(qū)間去做估計(jì)效果比較好。 參考文獻(xiàn): [1]張永利.關(guān)于伽馬分布及相關(guān)分布性質(zhì)的一點(diǎn)研究[J].大學(xué)數(shù)學(xué),2012.3:135-140. [2]周圣武,李金玉,周長新.概率論與數(shù)理統(tǒng)計(jì)(第二版)[M].北京:煤炭工業(yè)出版社,2007:105,127-138. [3]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)(第四版)[M].北京:高等教育出版社,2007:147-153. [4][美]Sheldon M.Ross著,鄭忠國,詹從贊譯.概率論基礎(chǔ)教程(第8版)[M].北京:人民郵電出版社,2010:174-180.
■P■≤x=■P■≤x=■■e■dt=Φ(x).
當(dāng)n充分大時(shí),近似地有:Yn~N(nα/β,nα/β2).
對(duì)于卡方分布和愛爾朗分布,當(dāng)n充分大時(shí),利用命題4.1的極限定理,可以近似得到這兩種分布的上分位數(shù)與標(biāo)準(zhǔn)正態(tài)分布的上分?jǐn)?shù)的關(guān)系,證明省略。
命題4.2 設(shè)x2α、?祝α(n,λ)、zα分別為卡方分布、愛爾朗分布和標(biāo)準(zhǔn)正態(tài)分布的上α分位點(diǎn),則當(dāng)n充分大時(shí),有 x2α(n)≈n+■zα,?祝α(n)≈■.
五、應(yīng)用
命題5.1 設(shè)總體X服從參數(shù)為λ的指數(shù)分布,X的樣本為X1,X2,Λ,Xn則
①參數(shù)λ的置信水平為1-α的置信區(qū)間為:■,■,
②指數(shù)分布均值的置信水平為1-α的置信區(qū)間為:■,■.
證 ①X~E(λ),注意到X~?祝(1,λ),則由命題3.3知:Y=nX=■Xi-?祝(n),其概率密度為fY(y)=■y■e■,y>00, y≤0,令Z=2λY=2nλX,則Z的概率密度為fZ(Z)=■fY■z=■e■■,z>00, z≤0=■e■■,z>00, z≤0 所以Z=2nλX~x2(2n),對(duì)于給定的置信水平1-α,由P{x■■(2n)<2nλX ②指數(shù)分布的均值■的置信水平為1-α的置信區(qū)間:■,■. 例5.1 某電子元件的使用壽命服從參數(shù)為λ的指數(shù)分布,現(xiàn)從一批這種電子元件中隨機(jī)抽取72只進(jìn)行測試,算得平均壽命為x=2580h,求這批電子元件的平均使用壽命的置信水平為0.95的置信區(qū)間。 解:樣本容量n=72,α=1-0.95=0.05,應(yīng)用x2(2n)分布的上α分位點(diǎn)的近似公式x■■(2n)≈2n+■zα/2,可得x■■(144)≈177.26,x■■(144)≈110.74, 所以這批電子元件的平均使用壽命的置信水平為0.95的置信區(qū)間為■,■≈■,■=(2095.88,3354.96) 注意:樣本比較大時(shí),也可依據(jù)極限定理,用正態(tài)分布對(duì)大樣本均值進(jìn)行區(qū)間估計(jì),對(duì)于參數(shù)為1/λ的指數(shù)分布,指數(shù)分布均值1/λ的置信水平為1-α的置信區(qū)間近似地為:■,■,對(duì)于本例,n=72是大樣本,可以用近似方法求平均使用壽命的置信水平為0.95的置信區(qū)間為(2095.88,3354.96).可見對(duì)于大樣本,兩種方法求得置信區(qū)間幾乎相同,但如果樣本容量較小,用前者給出的置信區(qū)間去做估計(jì)效果比較好。 參考文獻(xiàn): [1]張永利.關(guān)于伽馬分布及相關(guān)分布性質(zhì)的一點(diǎn)研究[J].大學(xué)數(shù)學(xué),2012.3:135-140. [2]周圣武,李金玉,周長新.概率論與數(shù)理統(tǒng)計(jì)(第二版)[M].北京:煤炭工業(yè)出版社,2007:105,127-138. [3]盛驟,謝式千,潘承毅.概率論與數(shù)理統(tǒng)計(jì)(第四版)[M].北京:高等教育出版社,2007:147-153. [4][美]Sheldon M.Ross著,鄭忠國,詹從贊譯.概率論基礎(chǔ)教程(第8版)[M].北京:人民郵電出版社,2010:174-180.