李光輝,張崇岐
(1.凱里學(xué)院數(shù)學(xué)科學(xué)學(xué)院,貴州凱里 556011;2.廣州大學(xué)經(jīng)濟(jì)與統(tǒng)計(jì)學(xué)院,廣東廣州 510006)
混合指數(shù)族分布的參數(shù)估計(jì)
李光輝1,張崇岐2
(1.凱里學(xué)院數(shù)學(xué)科學(xué)學(xué)院,貴州凱里 556011;2.廣州大學(xué)經(jīng)濟(jì)與統(tǒng)計(jì)學(xué)院,廣東廣州 510006)
構(gòu)造混合指數(shù)族分布,分別在正常工作條件下和恒加應(yīng)力加速壽命試驗(yàn)條件下的完全數(shù)據(jù)場(chǎng)合、定時(shí)截尾和定數(shù)截尾的情形下,利用EM算法估計(jì)混合指數(shù)族分布的參數(shù),綜合文獻(xiàn)進(jìn)而得到更一般的結(jié)論.最后通過(guò)模擬,討論了一種特殊的混合指數(shù)族分布的參數(shù)估計(jì)問(wèn)題.
混合分布;指數(shù)族分布;EM算法;加速壽命
對(duì)于混合分布很多文獻(xiàn)均有介紹[1-2],對(duì)其中的參數(shù)進(jìn)行估計(jì)的主要方法是利用EM算法. EM算法是近年發(fā)展很快且應(yīng)用很廣的一種算法,其最大的優(yōu)點(diǎn)是簡(jiǎn)單和穩(wěn)定.許多文獻(xiàn)已嘗試用EM算法來(lái)估計(jì)混合分布問(wèn)題,如混合伽瑪分布場(chǎng)合[3]、混合正態(tài)分布場(chǎng)合[4]、Weibull分布場(chǎng)合[5-6],一些文獻(xiàn)討論了在混合指數(shù)分布的場(chǎng)合下的參數(shù)估計(jì)問(wèn)題[6-10].關(guān)于混合分布的文獻(xiàn)中所涉及到的分布基本上都是指數(shù)族分布,因此,本文旨在構(gòu)造混合指數(shù)族分布,用EM算法對(duì)其中的參數(shù)進(jìn)行估計(jì),所得到的結(jié)果更具有一般性,在此條件下,文獻(xiàn)中所提到的混合分布都可視作混合指數(shù)族分布的特例.
指數(shù)族分布的密度函數(shù)為
其中,θ為參數(shù),本文討論的混合指數(shù)族分布的密度函數(shù)為
設(shè)樣本x1,x2,…,xn為取自密度為(1)的樣本,對(duì)于混合總體,本文使用如下記號(hào),記Θ=(p,θ1,θ2)′為未知的參數(shù)向量,以fji,F(xiàn)ji和sji分別表示樣本xi服從參數(shù)為θj的指數(shù)族分布的密度函數(shù),分布函數(shù)和生存函數(shù),有以下形式
并記fi和si分別表示樣本xi服從形如(1)的混合指數(shù)族分布的密度函數(shù)和生存函數(shù)
上述記號(hào)中都有j=1,2,i=1,2,…,n.
本文旨在導(dǎo)出混合指數(shù)族分布參數(shù)估計(jì)的統(tǒng)一迭代公式,逐一討論混合指數(shù)族分布在正常應(yīng)力和恒加應(yīng)力下的完全數(shù)據(jù)樣本和截尾數(shù)據(jù)樣本的參數(shù)估計(jì).通過(guò)討論一種特殊的混合指數(shù)族分布的參數(shù)估計(jì)問(wèn)題,并進(jìn)行模擬,說(shuō)明參數(shù)估計(jì)的收斂效果良好.
對(duì)于xi服從混合指數(shù)族分布fi,設(shè)Ii=為示性變量,Ii=1表示xi是取自f1i的總體,Ii=0表示xi是取自f2i的總體.由于xi取自于哪個(gè)總體是未知的,因而Ii是不可觀測(cè)的隨機(jī)變量.易得Ii~B(1,p),i=1,2,…,n,且之間相互獨(dú)立.
xi與Ii的聯(lián)合分布為g(xi,Ii;Θ)=(pf1i)Ii·[(1-p)f2i]1-Ii,由此Ii在xi給定的條件分布為
對(duì)于給定的初值Θ(0),利用EM算法對(duì)參數(shù)進(jìn)行估計(jì).
(1)(E-步) 求期望
(2)(M-步) 通過(guò)求解?Q(Θ,Θ(l-1))/?Θ=0極大化求Θ(l),即使得Q(Θ,Θ(l-1))=max Q(Θ(l),Θ(l-1)).由于log(fji)=log h(xi)+θjxi-b(θj),j=1,2.
對(duì)數(shù)似然函數(shù)的期望Q求導(dǎo)并令其等于0,可得
建立良好的安全責(zé)任制度是落實(shí)安全問(wèn)題的有效措施之一,建立安全責(zé)任制度首先因該有一個(gè)完整的安全責(zé)任體系,體系中應(yīng)該明確各級(jí)別管理人員、各部門(mén)工作人員以及崗位工人的責(zé)任,將責(zé)任進(jìn)行分解,使所有負(fù)責(zé)相關(guān)項(xiàng)目的人員都能夠明確自己的責(zé)任,對(duì)于每個(gè)項(xiàng)目都要根據(jù)項(xiàng)目的復(fù)雜情況配備相應(yīng)的安全管理人員,要保證項(xiàng)目一旦在哪個(gè)環(huán)節(jié)出現(xiàn)問(wèn)題能夠立刻找出責(zé)任人,使腳手架項(xiàng)目問(wèn)題能夠得到及時(shí)的解決。
2.1 定數(shù)截尾情形
設(shè)樣本容量為n的總體的前r個(gè)次序統(tǒng)計(jì)量x1,x2,…,xr取自密度為(1)的混合指數(shù)族分布的樣本,現(xiàn)要估計(jì)Θ可使用類(lèi)似的方法,對(duì)于xi服從混合指數(shù)族分布fi·,設(shè)Ii=1表示xi是取自f1i的總體,Ii=0表示xi是取自f2i的總體.由于xi取自于哪個(gè)總體是未知的,因而Ii是不可觀測(cè)的隨機(jī)變量.易得Ii~B(1,p),i=1,2,…,n,且之間相互獨(dú)立.
在定數(shù)截尾情形下,沒(méi)有截尾的樣本xi與Ii的聯(lián)合分布為g(xi,Ii;Θ)=(pf1i)Ii[(1-p)· f2i]1-Ii,由此Ii在xi給定的條件分布為
對(duì)于截尾的樣本,xi與Ii的聯(lián)合分布為g(xi,Ii;Θ)=(ps1i)Ii[(1-p)s2i]1-Ii,由此Ii在xi給定的條件分布為
對(duì)于給定的初值Θ(0),利用EM算法對(duì)參數(shù)進(jìn)行估計(jì).
(1)(E-步) 求期望
(2)(M-步) 對(duì)數(shù)似然函數(shù)的期望Q求導(dǎo)并令其等于0,通過(guò)求解?Q(Θ,Θ(l-1))/?Θ=0極大化求Θ(l).
2.2 定時(shí)截尾情形
對(duì)于樣本容量為n的總體,實(shí)驗(yàn)進(jìn)行到τ時(shí)刻即停止,有r個(gè)樣本失效,類(lèi)似之前的討論并沿用2.1中的記號(hào),可得到對(duì)數(shù)似然函數(shù)期望Q的形式為
4.1 定數(shù)截尾情形
在應(yīng)力水平Si下共有ni個(gè)樣品,其中有ri個(gè)樣品失效.
4.2 定時(shí)截尾情形
類(lèi)似之前的討論,沿用4.1中的記號(hào),設(shè)在應(yīng)力水平Si下截止到τi時(shí)刻停止實(shí)驗(yàn),共有ri個(gè)樣品失效,對(duì)于給定的初值Θ(0),利用EM算法對(duì)參數(shù)進(jìn)行估計(jì).
(1)(E-步) 求期望
為了驗(yàn)證EM算法在估計(jì)混合指數(shù)族分布時(shí)的效率,本文取2類(lèi)指數(shù)族分布:Γ分布與指數(shù)分布混合而成的分布,其密度函數(shù)的形式為
在此假設(shè)Γ分布中的形狀參數(shù)α=2為已知的.共生成40個(gè)隨機(jī)數(shù),這些數(shù)中有30個(gè)隨機(jī)數(shù)取自指數(shù)分布Exp(0.01)的總體,另外的10個(gè)隨機(jī)數(shù)取自Γ(0.2,2)的總體,混合以后從小到大排列如下:
如果給定參數(shù)的初值為Θ=(p,λ1,λ2)′=(0.5,0.1,0.2)′,在正常應(yīng)力條件下的完全樣本情形,經(jīng)過(guò)50次迭代,參數(shù)估計(jì)值收斂散點(diǎn)圖見(jiàn)圖1.
圖1 正常應(yīng)力條件下完全樣本參數(shù)估計(jì)值散點(diǎn)圖Fig.1 Scatter plot of complete sample parameter estimates under the condition of normal stress
從圖1可見(jiàn),在10次迭代以?xún)?nèi)參數(shù)估計(jì)值基本收斂,50次迭代后的參數(shù)估計(jì)值為
2個(gè)樣本是按照3:1的比例混合,在該估計(jì)中,雖然p值估計(jì)與真值有所偏差,但由于2組樣本在中間部分比較接近,故λ1,λ2的估計(jì)值與真值十分接近.
下面驗(yàn)證在恒加應(yīng)力定數(shù)截尾情形下的參數(shù)估計(jì).假設(shè)有2個(gè)加速應(yīng)力S1與S2,隨機(jī)生成100個(gè)隨機(jī)數(shù),按照4∶6的比例混合,且在2組應(yīng)力下的參數(shù)真值分別為:Θ1=(p,λ11,λ12)′=(0.40,0.01,0.20)′,Θ2=(p,λ21,λ22)′=(0.40,10.00,2.00)′,按10%的比例截尾.經(jīng)過(guò)50次迭代,參數(shù)估計(jì)值收斂散點(diǎn)圖見(jiàn)圖2.
從圖2可見(jiàn),在應(yīng)力S1下,經(jīng)過(guò)50次迭代,參數(shù)估計(jì)值基本收斂,在應(yīng)力S2下,經(jīng)計(jì)算,50次迭代后參數(shù)估計(jì)為(λ21,λ22)′=(8.385 920,1.497 890)′,與真值有一定偏差,導(dǎo)致偏差的原因一方面是由于定數(shù)截尾樣本中,后10個(gè)樣品數(shù)據(jù)為截尾數(shù)據(jù),造成樣本信息的部分損失;另一方面,由于指數(shù)族分布的混合壽命模型一般來(lái)說(shuō)很少具有穩(wěn)健性,高截尾方案的推斷比少量截尾方案更強(qiáng)的受到模型偏離的影響.
本文討論了混合指數(shù)族分布的參數(shù)估計(jì)問(wèn)題,EM算法是處理這類(lèi)問(wèn)題的有效方法.但如果混合指數(shù)族分布中所含未知參數(shù)較多,在利用EM算法對(duì)參數(shù)進(jìn)行估計(jì)時(shí),進(jìn)行到M步時(shí)需要解出似然函數(shù)極大值的參數(shù)解,很多情形下,方程組關(guān)于未知參數(shù)往往沒(méi)有顯示解,故只能求近似解,若在小樣本場(chǎng)合或缺失數(shù)據(jù)較多的情形下,參數(shù)估計(jì)的效率較低.如何有效地解決多參數(shù)混合分布的估計(jì)問(wèn)題仍有待進(jìn)一步研究.
圖2 (a)S1下參數(shù)估計(jì)值散點(diǎn)圖;(b)S2下參數(shù)估計(jì)值散點(diǎn)圖Fig.2 The scatter plot of parameter estimates under diagram S1and S2
[1] 王建康.混合分布理論及應(yīng)用[J].生物數(shù)學(xué)學(xué)報(bào),1995,3(10):87-92.
WANG JK.Mixture distribution and its application[J].JBiomath,1995,3(10):87-92.
[2] 王承煒,吳沖鋒,朱戰(zhàn)宇.混合分布理論研究[J].上海交通大學(xué)學(xué)報(bào),2004,38(3):335-339.
WANG CW,WU C F,ZHU Z Y.Research onmixture distribution hypothesis[J].JShanghai Jiaotong Univ,2004,38(3):335-339.
[3] DIEKINSON JP.On the resolution of a mixture of observations from two gamma distributions by the method ofmaximum likelihood[J].Metrika,1974,21:133-141.
[4] 皮六一,劉忠,茹詩(shī)松.持股市值、持股數(shù)貧、持股種類(lèi)的概率分布分析[J].應(yīng)用概率統(tǒng)計(jì),1998,14(4):286-394.
PIL Y,LIU Z,RU SS.Probability distribution analysis on market value,amount and varities of stocks[J].Chin JAppl Probab Statist,1998,14(4):286-394.
[5] 王繼霞,申培萍.定時(shí)截尾下Weibull分布參數(shù)估計(jì)的EM算法[J].河南師范大學(xué)學(xué)報(bào):自然科學(xué)版,2009,37(2):9-11.
WANG JX,SHEN P P.The EM algorithm of parameter estimation of Weibull distribution under Type-I censoring sample[J].JHenan Norm Univ:Nat Sci,2009,37(2):9-11.
[6] 李光輝,趙磊.基于Weibull分布的定期檢測(cè)的貯存系統(tǒng)可靠性模型[J].魯東大學(xué)學(xué)報(bào):自然科學(xué)版,2012,28(3):219-222.
LIG H,ZHAO L.The reliability model of periodically detecting storage system based on the Weibull distribution[J].Ludong Univ J:Nat Sci Edi,2012,28(3):219-222.
[7] 仲崇新,張志華.指數(shù)分布場(chǎng)合定時(shí)和定數(shù)截尾步進(jìn)應(yīng)力加速壽命試驗(yàn)的統(tǒng)計(jì)分析[J].應(yīng)用概率統(tǒng)計(jì),1991,7(1):52-60.
ZHONG C X,ZHANG ZH.Statistical analysis of types1 and 11 censoring data from step-stress accelerated life testingmodels under the exponential distribution[J].Chin JAppl Probab Statist,1991,7(1):52-60.
[8] 朱利平,盧一強(qiáng),茆詩(shī)松.混合指數(shù)分布的參數(shù)估計(jì)[J].應(yīng)用概率統(tǒng)計(jì),2006,22(2):137-150.
ZHU L P,LU Y Q,MAO SS.Estimation of parameters ofmixed exponential distribution[J].Chin JAppl Probab Statist,2006,22(2):137-150.
[9] 馬志明,劉瑞元,習(xí)麗.多個(gè)子總體混合分布的參數(shù)估計(jì)[J].西北民族大學(xué)學(xué)報(bào):自然科學(xué)版,2007,28(1):11-15.
MA ZM,LIU R Y,XI L.Parameter estimation ofmixed exponential distribution[J].JNorthwest Univ National:Nat Sci Edi,2007,28(1):11-15.
[10]嚴(yán)海芳,蔣卉.混合指數(shù)分布恒加應(yīng)力下的MCEM加速算法[J].湘潭大學(xué)自然科學(xué)學(xué)報(bào),2011,33(3):35-37.
YAN H F,JIANG H.MCEM algorithm of parameters estimation inmixture exponential distribution for constant stress accelerated[J].Nat Sci JXiangtan Univ,2011,33(3):35-37.
Estimation of parameters ofm ixed exponential fam ily distribution
LIGuang-hui1,ZHANG Chong-qi2
(1.School of Mathematics Sciences,Kaili University,Kaili556011,China;
2.School of Economics and Statistics,Guangzhou University,Guangzhou 510006,China)
This paper firstly constructs amixed exponential family distribution.Secondly,we employ the EM algorithm for themixed exponential family distributionmodel under the normal stress life time testwith full data or censored samples.Comprehensive literature then helps us getmore general conclusions.Finally,the paper discusses a specialmixed exponential family distribution parameters estimation through simulation.
mixture distribution;exponential family distribution;EM algorithm;accelerated life
O 212
A
【責(zé)任編輯:周 全】
1671-4229(2015)03-0010-07
2014-12-05;
2014-12-31
貴州省科學(xué)技術(shù)聯(lián)合基金資助項(xiàng)目(黔科合LH字[2014]7243);凱里學(xué)院2014年重點(diǎn)課題資助項(xiàng)目(z1401);凱里學(xué)院基礎(chǔ)數(shù)學(xué)重點(diǎn)學(xué)科建設(shè)資助項(xiàng)目(KZD2009001);國(guó)家自然科學(xué)基金資助項(xiàng)目(11271094).
李光輝(1985-),男,講師,碩士.E-mail:liguanghui1985@126.com