羅光華,張清水
(三明學(xué)院 教育與音樂學(xué)院, 福建 三明365004)
完全數(shù)據(jù)下混合weibull分布參數(shù)的MCMC估計(jì)
羅光華,張清水
(三明學(xué)院 教育與音樂學(xué)院, 福建 三明365004)
混合weibull分布是可靠性分析中的一類 重要的分布 ,假設(shè)樣本服 從二重混合weibull分 布,即可給出 后驗(yàn)參數(shù)估計(jì).本文采用基于Gibbs抽樣的馬爾科夫鏈蒙特卡羅方法(MCMC),設(shè)計(jì)了 用于參數(shù)Bayes估計(jì)的抽樣 方案,通過 模擬研究,與EM方法進(jìn)行比較.結(jié)果顯示,采用Bayes方法估計(jì)參數(shù)具有一定的優(yōu)越性.
混合weibull分布;完全數(shù)據(jù);Gibbs抽樣
混合Weibull分布是一個(gè)廣泛應(yīng)用于各類可靠性分析的重要分布,對于混合分布的參數(shù)估計(jì)算法,以往多采用極大 似然 法 或EM算法[1-3],而 傳統(tǒng)極 大 似 然法求 解 過 程相當(dāng)復(fù)雜,EM算法雖然有所簡化,但相應(yīng)的計(jì)算形式依然比較復(fù)雜.近年來,由于Bayes理論的活躍,讓基于Bayes理論的各種MCMC方法倍受關(guān)注,通過構(gòu)造平穩(wěn)的馬爾科夫鏈,對產(chǎn)生服從后驗(yàn)分布的隨機(jī)樣本進(jìn)行統(tǒng)計(jì)推斷[4-6].本文考慮在完全數(shù)據(jù)下,導(dǎo)出二重單參數(shù)weibull混合分布的參數(shù)完全條件后驗(yàn)分布后,利用Gibbs抽樣算法解決參數(shù)估計(jì)問題,結(jié)果顯示以Gibbs抽樣算法估計(jì)混合Weibull分布參數(shù)是一個(gè)行之有效的辦法.
MCMC方法是通過建立一個(gè)平穩(wěn)分布為 π(x)的馬爾科夫鏈,待此鏈運(yùn)行充分后,馬爾科夫鏈將比較穩(wěn)定,這時(shí)取值分布將與平穩(wěn)分布足夠接近,繼而得到一系列樣本X(1),X(2),…,X(n)做為來自 π(x)的樣本,基于這些樣本對函數(shù)g(X)使用蒙特卡羅積分近似得到數(shù)學(xué)期望
常用方法主要有Metropolis-Hastings抽樣法、Gibbs抽樣法及一些對應(yīng)的復(fù)合抽樣法,其中Gibbs抽樣法是最易實(shí)現(xiàn)且應(yīng)用最廣泛的一種MCMC方法[7-8].
Gibbs抽樣法可以看做是Metropolis-Hastings方法的特殊例子,利用完全條件分布族迭代抽樣,建立平穩(wěn)分布為 π (x)的馬爾科夫鏈:
(1)選擇初始值X0
(2)逐個(gè)生成
假設(shè)X=(x1,x2,…,xN)為給定的樣本數(shù)據(jù),服從二重weibull混合分布,其密度函數(shù)如下:
(0
0,λ2>0)相互獨(dú)立.
而待估參數(shù)為p,λ1,λ2利用貝葉斯估計(jì)理論可推導(dǎo)得其聯(lián)合后驗(yàn)密度
其中 π(p)、π(λ1)、π(λ2)分別為p,λ1,λ2的先驗(yàn)密度.
(1)由 π(U|X,p,λ1,λ2)產(chǎn)生U
由于各標(biāo)簽變量獨(dú)立可得后驗(yàn)密度
(2)由 π(p|X,U,λ1,λ2)產(chǎn)生p
通過式(2)可知p的后驗(yàn)密度只與U,X有關(guān),所以有
π(p|X,U,λ1,λ2,)∝π(p)gL(p,λ1,λ2|X,U),取p的先驗(yàn)密度為bera(α,β),則有
示性函數(shù)
(3)由 π(λj|X,U,p)產(chǎn)生 λj,j=1,2.
按照J(rèn)effreys準(zhǔn)則,λj的先驗(yàn)取為由貝葉斯公式得 λj后驗(yàn)密度
顯然
由于已知待估參數(shù)的后驗(yàn)分布,可以采用Gibbs抽樣法進(jìn)行抽樣,重復(fù)(1),(2),(3)步得到一系列樣本,去掉前n個(gè)不收斂的樣本后,根據(jù)(2.1)式利用余下樣本得到近似期望.
本文采用R軟件編寫抽樣算法及樣本處理[9-10],令不同的樣本數(shù)k從10到100,分別做隨機(jī)模擬500次,求得其期望、方差與均方誤差.假設(shè)混合模型(3.1)的真實(shí)參數(shù)(p,λ1,λ2) =(0.7,1,4),對于Gibbs抽樣,令p的先驗(yàn)服從Beta(1,1),取初始參數(shù)(p(0),λ1(0),λ2(0))=(0.5,2,1),各循環(huán)Gibbs抽樣15000次,確保樣本充分收斂,取后5000次抽樣做參數(shù)估計(jì).Gibbs抽樣估計(jì)與EM算法所得估計(jì)期望值見表1.
表1 各參數(shù)估計(jì)期望
可以看出,采用Gibbs抽樣法對二重混合weibull的估計(jì)是有效的,與EM估計(jì)算法結(jié)果相比,多數(shù)情況下,二者結(jié)果大致相當(dāng).但在小樣本情況下,采用Gibbs抽樣的各參數(shù)Bayes估計(jì)結(jié)果會(huì)優(yōu)于EM算法估計(jì),隨著樣本數(shù)的增加,二者估計(jì)結(jié)果互有優(yōu)劣,但無明顯差別.而均方誤差顯示Gibbs抽樣估計(jì)的偏差要好于EM算法 (圖1),同時(shí)Bayes估計(jì)的方差基本上小于采用EM算法的方差,這表明采用Gibbs抽樣的Bayes估計(jì)相對比較穩(wěn)定(圖2),并且只有在樣本數(shù)足夠多時(shí),二者的均方誤差與方差才接近.因此,當(dāng)樣本數(shù)較少時(shí),使用Bayes估計(jì)效果更好.
圖1 各參數(shù)估計(jì)的均方誤差(MSE)
圖2 各參數(shù)估計(jì)的方差(Var)
Bayes理論下的MCMC算法及其應(yīng)用是當(dāng)今很活躍的一個(gè)研究方向,本文采用Gibbs抽樣法對二重混合weibull分布的參數(shù)進(jìn)行Bayes估計(jì),得到了較好的估計(jì)效果,該方法具有形式簡單,易實(shí)現(xiàn)且計(jì)算量較小等優(yōu)點(diǎn).通過模擬比較發(fā)現(xiàn),Bayes估計(jì)不易受樣本數(shù)限制,估計(jì)偏差較小且穩(wěn)定性較好,在樣本數(shù)較少的情況下尤其適用.
〔1〕朱利平,盧一強(qiáng),茆詩 松.混合指數(shù)分布的參 數(shù) 估計(jì)[J].應(yīng)用概率統(tǒng)計(jì),2006,22(2):137-150.
〔2〕楊珂玲,韓慧芳.兩混合正態(tài)分布的參數(shù)估計(jì)方法[J].黃岡師范學(xué)院學(xué)報(bào),2006(03):16-19.
〔3〕 趙亞林.混合指數(shù)分布定數(shù)結(jié)尾時(shí)參數(shù)估計(jì)的Monte Carlo EM加速算法[J].科技通報(bào),2012,28(5):9-13.
〔4〕劉樂平,袁衛(wèi).現(xiàn)代貝葉斯分析 與 現(xiàn)代統(tǒng)計(jì) 推 斷[J].經(jīng)濟(jì)理論與經(jīng)濟(jì)管理,2004(6):50-54.
〔5〕劉國旺,熊健.基于MCMC方法的ARFIMA模型貝葉斯分析及實(shí)證研究[J].數(shù)理統(tǒng)計(jì)與管理,2012,31(3):434-439.
〔6〕朱慧明,曾惠芳,郝立亞.基于MCMC的貝葉斯變結(jié)構(gòu)金 融 時(shí) 序GARCH模 型 研 究[J].數(shù) 理 統(tǒng) 計(jì) 與 管 理, 2011,30(6):1009-1017.
〔7〕林靜.基于MCMC穩(wěn)態(tài)模擬的指數(shù)回歸模型及其應(yīng)用[J].運(yùn)籌與管理,2005,14(4):95-100.
〔8〕Larry Wasserman(張波,等譯).統(tǒng)計(jì) 學(xué)完全 教 程[M].北京:科學(xué)出版社,2008:313-339.
〔9〕Jim Albert.Bayesian Computation With R[M]. New York:Springer,2008:235-282.
〔10〕Ioannis N tzoufras.Bayesian Modeling using WinBUGS [M].New Jersey:Wiley,John&Sons,Inc,2009:305-325.
O212.8
A
1673-260X(2014)06-0009-03
三明學(xué)院自然科學(xué)基金項(xiàng)目(B201016/Q)
赤峰學(xué)院學(xué)報(bào)·自然科學(xué)版2014年12期