程 靜, 周菊玲
(新疆師范大學數學科學學院,烏魯木齊 830017)
Weibull廣泛應用在概率統計和可靠性分析中以及航空航天和生物醫(yī)學的壽命檢驗上[1]. 周曉東等[2]用貝葉斯統計方法討論并研究了刪失數據下的Weibull分布參數問題;陳惠[3]在已知變點個數的情況下利用貝葉斯方法研究了Weibull分布的回歸模型和變點問題;陳希孺[4]結合概率變點問題,介紹了極大似然估計方法、累計次數法和貝葉斯方法;程貝麗和周菊玲[5]利用極大似然法和貝葉斯方法研究了對數伽馬分布變點模型的估計;何朝兵[6]通過添加缺損的壽命變量數據得到了在左截斷右刪失數據下Weibull 分布的完全數據似然函數,利用MCMC 法對該分布參數多變點進行了貝葉斯估計;師義民[7]就定數截尾樣本討論研究了Weibull分布三參數的貝葉斯估計;Meryem和Birgoren[8]利用極大似然估計方法和貝葉斯方法求解了材料的可靠壽命,蒙特卡羅模擬表明在相同的精度水平上,貝葉斯方法所需的樣本量比極大似然估計方法更小. 溫艷清和劉寶亮[9]利用N-R 算法、CM 算法及修正的CM 算法計算了完全數據下的Weibull 分布的極大似然估計,并分析了這三種算法處理問題時的優(yōu)良性;戴迪昊等[10]參考數個氣象臺的樣本數據,對最大風速序列的變點結合三參數的Weibull分布進行檢驗和估計. 喬世君和張世英[11]在定時截尾下,結合Gibbs抽樣計算了Weibull 分布的貝葉斯估計,并且利用實際例子和經典的BLIE、BLUE 估計進行對比. 曾國桓[12]在定時截尾試驗下對兩參數威布爾分布的估計進行了研究. 李繼政等[13]利用Weibull分布對極值波高進行研究分析,且選取貝葉斯方法和最大似然估計分別估計未知參數,最終從樣本的擬合效果和設計波高計算兩個方面分析這兩種不同的估計方法所產生的效果. 對于Weibull分布變點的問題很少有人研究,本文利用極大似然估計和貝葉斯估計研究Weibull分布參數的變點估計問題,并通過隨機模擬對這兩種方法作比較.
設隨機變量X服從Weibull分布,其分布函數和密度函數表達式分別如下:
其中:θ為尺度參數,η為形狀參數,記為Weib(θ,η).
假設隨機變量Xi(i=1,2,…,n)相互獨立且滿足
其中尺度參數θ1、θ2>0,且θ1、θ2、m都是未知的,當θ1≠θ2時正整數m就是要討論的變點,該模型只有一個變點,稱為Weibull分布尺度參數的單變點模型.
下面研究形狀參數η為離散型隨機變量時,Weibull分布尺度參數θ的單變點模型的極大似然估計和貝葉斯估計.
設m為變點,當θ1≠θ2時,設X~Weib(θ,η),Xi(i=1,2,…,n)是總體的一個樣本,其似然函數為:
則對數似然函數為:
固定m,對θ1、θ2求極大,得:
基于貝葉斯方法處理分布模型變點問題時,為了更好地得到統計推斷結果,需引入先驗分布,而選取先驗分布一般通過分布的具體形式以及關于參數的歷史數據信息,為此我們對m、θ1、θ2取如下先驗分布:
1)對變點m取無信息先驗分布:
2)θ1、θ2的先驗分布為逆伽馬分布:
其中:a1>0,a2>0,b1>0,b2>0,m與θ1、θ2相互獨立,則參數m、θ1、θ2的聯合后驗分布為:
得到各參數的滿條件分布:
因為參數θ1、θ2的滿條件分布形式比較簡單,可以用Gibbs 抽樣. 變點m的滿條件分布較為復雜,用Gibbs抽樣比較困難,所以我們在這可以利用M-H算法進行抽樣. MCMC算法的具體步驟如下:
首先對極大似然估計進行模擬:
根據Weibull 分布的對數似然函數和極大似然估計式(5),利用R軟件對未知參數m、θ1、θ2進行估計,結果如表1所示.
表1 參數m、θ1、θ2的極大似然估計Tab.1 Maximum likelihood estimation of parameter m,θ1,θ2
下面進行貝葉斯估計的隨機模擬.
令n=200,取 參 數(m,θ1,θ2,η) 的 真 實 值 為(35,3,8,0.6),取M=20 000,B=10 000,根據參數m、θ1、θ2的滿條件分布進行MCMC模擬,結果如表2所示.
表2 參數m、θ1、θ2的貝葉斯估計Tab.2 Bayesian estimation of parameter m,θ1,θ2
圖1 是參數m的抽樣迭代過程,從圖中可以看出Gibbs 抽樣波動較小,絕大多數在變點附近,即估計效果較好. 圖2 是參數m的兩條迭代鏈軌跡,可以看出這兩條迭代鏈較穩(wěn)定且逐漸重合,即收斂性比較好.
圖1 參數m 的抽樣迭代過程Fig.1 Sampling iteration process of parameter m
圖2 參數m 的兩條迭代鏈軌跡Fig.2 Two iterative chain trajectories of parameter m
從隨機模擬結果來看,表1 中參數m、θ1、θ2的極大似然估計值與真值相差較大,精度不高;相比較表2三個參數的均值與真值差值較小,相對誤差不超過6%,MC誤差也較小,故整體上各參數的貝葉斯估計精度較高;各參數的標準差也比較小,說明數據比較穩(wěn)定.
綜上所述,Weibull分布參數的變點估計問題可以用MCMC方法實現,且估計效果都比較良好.