摘要:在Ⅱ型雙刪失樣本下,研究了逆Topp-Leone分布參數(shù)的極大似然估計,證明了極大似然估計的存在性和唯一性;基于未知參數(shù)的先驗分布為Gamma分布和Jeffrey分布,分別在三種不同損失函數(shù)下,得到逆Topp-Leone分布未知參數(shù)的Bayes估計。根據(jù)后驗密度函數(shù)得到預(yù)測密度,進而得到未來觀測值在三種損失函數(shù)下的預(yù)測估計值。為了比較在不同損失下Bayes估計的優(yōu)劣,采用數(shù)值模擬方法計算了各種估計的均值及均方誤差,結(jié)果表明在Linex損失下未知參數(shù)的Bayes估計量更接近真值,均方誤差最小。
關(guān)鍵詞:Ⅱ型雙刪失;逆Topp-Leone分布;Bayes估計;預(yù)測
中圖分類號:TP183" " " 文獻標(biāo)志碼:A" " " 文章編號:1008-4657(2024)04-0001-09
0" " " " 引言
Topp-Leone[ 1 ]分布是具有有限支撐的分布,在可靠性研究中得到了普遍的應(yīng)用。逆Topp-Leone分布是Hassan" A" S等[ 2 ]在2020年根據(jù)Topp-Leone分布構(gòu)造出來的。逆分布有助于研究隨機現(xiàn)象的其它性質(zhì),在經(jīng)濟、生物、工程技術(shù)、醫(yī)學(xué)、產(chǎn)品檢驗等方面有非常廣泛的應(yīng)用。很多學(xué)者研究了各種分布的逆分布的應(yīng)用,比如Sharma" V" K等[ 3 ]構(gòu)造了逆Lindley分布;Voda" V" G[ 4 ]提出了逆Rayleigh分布;Lin" C" T等[ 5 ]構(gòu)造了逆指數(shù)分布;Keller" A" Z等[ 6 ]構(gòu)造了逆Weibull分布;EL-Kader" R" I" A等[ 7 ]提出了Ⅰ型逆Pareto分布;AL-Fattah" A" M" A等[ 8 ]介紹了逆Kumaraswamy分布;Tweedie" M" C" K[ 9 ]介紹了逆高斯分布,并系統(tǒng)研究了此分布的基本特征和統(tǒng)計性質(zhì),并將其與高斯分布進行了對比。
Hassan" A" S等[ 2 ]不僅研究了逆Topp-Leone分布的統(tǒng)計性質(zhì)和參數(shù)估計,且通過實例說明了對給定的數(shù)據(jù)集此分布比逆Lindley、逆Rayleigh分布、逆指數(shù)分布擬合效果更好,因此逆Topp-Leone分布也是可靠性分析中一個重要模型。目前國內(nèi)外對這類分布的統(tǒng)計性質(zhì)進行研究的文獻較少,僅有Aijaz" A等[ 10 ]研究了全樣本下逆Topp-Leone分布參數(shù)在不同損失函數(shù)的Bayes估計,通過仿真分析得到在平方損失下Bayes估計的精度較高。在可靠性壽命試驗中,為了節(jié)省時間和成本,常采取刪失試驗,Ⅱ型雙刪失試驗是一種常見的獲取截尾數(shù)據(jù)的方法。在此試驗下樣本的似然函數(shù)比較簡潔,無論是經(jīng)典方法還是Bayes方法都比較方便,因此很多學(xué)者在Ⅱ型雙刪失樣本下研究了多種壽命分布的參數(shù)和可靠性指標(biāo)的估計問題,取得了很多研究成果[ 11-18 ]。然而,目前在Ⅱ型雙刪失樣本下逆Topp-Leone分布參數(shù)估計還沒有學(xué)者研究。本文將在Ⅱ型雙刪失樣本下研究逆Topp-Leone分布的參數(shù)的極大似然估計和Bayes估計,并推導(dǎo)后驗預(yù)測密度函數(shù),進而給出預(yù)測估計值,最后通過數(shù)值模擬進行對比分析。
1" " " " 極大似然估計
設(shè)隨機變量X服從逆Topp-Leone分布,其分布函數(shù)和概率密度函數(shù)分別為
F(x,θ)" =" 1 - , f(x,θ)" =" 2θx(1 + 2x)θ-1(1 + x)-2θ-1(1)
其中x ≥ 0,θ為形狀參數(shù)且θ" >" 0。
現(xiàn)從一批壽命服從逆Topp-Leone分布的產(chǎn)品中隨機抽取n個進行試驗,直到有s個產(chǎn)品失效時停止試驗,由于某些不可控因素導(dǎo)致前r" -" 1個數(shù)據(jù)丟失,其中s" ">" r" ≥ 1,設(shè)觀測值為xr,xr+1,…,xs,此為Ⅱ型雙刪失試驗,也稱為雙邊定數(shù)截尾試驗。令x*" =" (xr,xr+1,…,xs),在此試驗下樣本x*的似然函數(shù)為
L(x*" |" θ)" =" [F(xr,θ)][1 - F(xs,θ)] f(xi,θ)
把(1)式代入得到似然函數(shù)
L(x*" |" θ)" =" 1 - "2θxi(2)
對(2)式計算關(guān)于參數(shù) θ的偏導(dǎo),并令得
+ (n - s)ln +ln - "= 0(3)
方程(3)無法得到θ的顯式解,但可以證明關(guān)于θ的方程存在唯一解,下證明之。
令方程(3)左邊式子記為h(θ),則有
h′(θ) = - "- "< 0
故h(θ)在(0,+∞)是單調(diào)遞減的。且
h(θ) = +∞, h(θ) = (n - s)ln + ln < 0
由零點定理知方程(3)存在唯一解,可以用Brent迭代法求方程(3)的近似解,這個近似解就為參數(shù)θ的極大似然估計,記為θM。
2" "Bayes估計
設(shè)參數(shù)θ的先驗分布為Gamma分布,其密度函數(shù)為
π(θ) = θa-1e-bθ,θ > 0(4)
其中a,b為超參數(shù),且a > 0,b > 0。
由(2)式和(4)式可得到θ的后驗密度函數(shù)為
π(θ" |" x* )" = "= B-1(-1)jr-1" jθ e(5)
其中
Aj = -j ln "- ln - (n - s)ln;
B = (-1)jr-1" j.
參數(shù)θ的Bayes估計的優(yōu)劣程度不僅依賴于先驗分布,還依賴損失函數(shù)的形式[ 19 ],因此還有必要研究在不同的損失函數(shù)下參數(shù)θ的Bayes估計。下面將給出在幾類不同的損失函數(shù)下參數(shù)θ的Bayes估計。
定理1 在Ⅱ型雙刪失樣本下,若取θ的先驗分布為Gamma分布,則有下列結(jié)論:
1.在平方損失函數(shù)L(θ, δ) = (θ - δ)2下,逆Topp—Leone分布參數(shù)θ的Bayes估計為
θBS = (6)
2.在熵損失函數(shù)L(θ,δ) = n( - ln - 1)下,逆Topp—Leone分布參數(shù)θ的Bayes估計為
θBE = (7)
3.在Linex損失函數(shù)L(θ,δ) = ec(θ,δ) - c(θ,δ) - 1(c∈R,c≠0)下,逆Topp—Leone分布參數(shù)θ的Bayes估計為
θBL = - ln(8)
證明:1.在平方損失下,參數(shù)θ的Bayes估計為其后驗分布的數(shù)學(xué)期望,因此
θBS = ∫θπ(θ" |" x*)dθ = ∫θB-1(-1)jr-1" j θedθ
=
2.先對熵損失函數(shù)求參數(shù)θ的后驗期望,得到后驗風(fēng)險函數(shù)為
R(δ" |" x*) = E[L(θ,δ)] = n[δE(θ-1 |" x*) + E(lnθ |" x*) - lnδ - 1],
可以證明當(dāng)δ = [E(θ-1 |" x)]-1時,后驗風(fēng)險函數(shù)達到最小值,因此在熵損失下參數(shù)θ的Bayes估計為θBE" =" [E(θ-1 |" x)]-1。而
E(θ-1 |" x*) = ∫θ-1π(θ |" x*)dθ" =" ∫θ-1B-1(-1)jr-1" j θedθ
=
因此參數(shù)θ的Bayes估計為
θBE =" [E(θ-1 |" x)]-1 =
3.對Linex損失函數(shù)求關(guān)于參數(shù)θ的后驗期望,得到后驗風(fēng)險函數(shù)
R(δ" |" x*) = E[L(θ,δ)] = -ecδE(ecθ) - cE(θ) + cδ + 1
當(dāng)δ = -c-1ln E(e-cθ" |" x*)時,上式達到最小值,因此在熵損失函數(shù)下θ的Bayes估計為
θBL =" -c-1lnE(e-cθ" |" x*)
又因為
E(e-cθ" |" x*) =" ∫e-cθ" π(θ" |" x*)dθ" =" ∫e-cθ B-1(-1)jr-1" j θedθ
=
因此參數(shù)θ的Bayes估計為
θBL =" -ln E(e-cθ" |" x*) = -ln
當(dāng)Gamma先驗分布中超參數(shù)a = b = 0時就得到了Jeffrey先驗分布,此時只需要令(6)~(8)式中的a = b = 0,就得到了基于Jeffrey先驗分布,參數(shù)θ在平方損失、熵損失和Linex損失下的Bayes估計,分別記為θBS、θBE、θBL。
3" " 超參數(shù)的估計
參數(shù)θ的Bayes估計(6)-(8)式中還有超參數(shù)a和b需要估計,接下來估計超參數(shù)。根據(jù)先驗分布(4)式,可得到經(jīng)驗分布為
f (y) = ∫π(θ )f(y,θ)dθ" =" ,
F(y) = ∫f(y)dy" = 1 -
由于E(θ ) = ,若根據(jù)產(chǎn)品的先驗信息可以得到產(chǎn)品壽命的p分位數(shù)xp,則可以聯(lián)立以下方程組
1 - ?搖 = p = θ
就可以計算出超參數(shù)a和b。
若沒有先驗信息可以用,可取特殊值b = 1,再由矩估計原理令 = θ,得到超參數(shù)a的估計為a = θ。
4" " Bayes可信區(qū)間
前面討論了參數(shù)θ的點估計問題,接下來根據(jù)區(qū)間估計的定義計算參數(shù)θ的Bayes可信區(qū)間。
定理2" "若逆Topp-Leone分布中參數(shù)θ的后驗分布為(5)式,對任意0 < α < 1,則θ的可信水平為1 - α的可信區(qū)間為(θL,θU)。其中θL,θU滿足
∫π(θ" |" x*)dθ = ", ∫π(θ" |" x*)dθ = "(9)
5" "Bayes預(yù)測
基于給定的樣本,對未來觀測值的預(yù)測問題一直是統(tǒng)計學(xué)界的重要研究課題,這一部分將根據(jù)已有觀測值x* = (xr,xr+1,…,xs)對未來觀測值進行Bayes預(yù)測,假設(shè)第n + 1個觀測值為y = xn+1,取θ的先驗分布為Gamma分布,則y的后驗預(yù)測密度函數(shù)為
g(y" |" x*) = ∫π(θ" |" x*)f(y" |" θ)dθ
= (0 < y < +∞)(10)
定理3" "在Ⅱ型雙刪失樣本下,若取θ的先驗分布為Gamma分布,則有下列結(jié)論:
1.在平方損失函數(shù)L(θ,δ) = (θ - δ)2下,xn+1的Bayes預(yù)測估計值為
yB = (11)
2.在熵損失函數(shù)L(θ,δ) = n( - ln "- 1)下,xn+1的Bayes預(yù)測估計值為
yBE = (12)
3.在Linex損失函數(shù)L(θ,δ) = ec(θ-δ) - c(θ-δ) - 1(c∈R,c≠0)下,xn+1的Bayes預(yù)測估計值為
yBL = - ln(13)
證明:1.在平方損失函數(shù)下,xn+1的Bayes預(yù)測值為yB =" E(y" |" x*),從而有
yB = E(y" |" x*) = ∫yg(y" |" x*)dy
=
2.根據(jù)定理1的證明,在熵損失函數(shù)下,xn+1的Bayes預(yù)測值為yBE = [E(y-1" |" x*)]-1
而E(y-1" |" x*) = ∫y-1g(y" |" x*)dy
=
從而得到(12)式。
3.根據(jù)定理1的證明,在Linex損失函數(shù)下,xn+1的Bayes預(yù)測值為
yBL = -c-1lnE(e-cy" |" x*)(14)
其中E(e-cy" |" x*) = ∫e-cy g(y" |" x*)dy
=
把上式代入(14)式就得到(13)式。
同理,令a = b = 0時,參數(shù)θ的Gamma先驗分布就是Jeffrey先驗分布,此時只需要令(11)~(13)式中的a = b = 0,就得到了基于Jeffrey先驗分布,xn+1在平方損失、熵損失和Linex損失函數(shù)下的Bayes預(yù)測值,分別記為yB、yBE、yBL。
6" "數(shù)值模擬分析
假設(shè)一批產(chǎn)品的壽命服從逆Topp-Leone分布,下面用隨機模擬的方法產(chǎn)生一個服從逆Topp-Leone分布的樣本,具體過程如下:
1.產(chǎn)生一個容量為n且服從均勻分布U(0,1)的簡單隨機樣本,記為u1,u2,…,un,令
xi = (i = 1,2,…,n)
則xi為來自逆Topp-Leone分布的容量為n的簡單隨機樣本,給定r,s,則可以得到Ⅱ型雙刪失樣本x* = (xr,xr+1,…xs)。
2.取α = 0.05,利用Ⅱ型雙刪失樣本可以計算出參數(shù)θ的極大似然估計、Bayes估計(其中在Gamma先驗分布時,Bayes估計中超參數(shù)a = θM,b = 1)。
3.以上過程重復(fù)1 000次,可以得到參數(shù)θ的點估計的均值、均方誤差。
4.對于不同的θ,n,r,s分別重復(fù)以上過程,相關(guān)模擬結(jié)果列于表1中(括號內(nèi)為均方誤差)。
從表1數(shù)值模擬結(jié)果可以看出,在相同的條件下,參數(shù)θ的Bayes估計要優(yōu)于極大似然估計,體現(xiàn)了小樣本下Bayes估計的優(yōu)點;同時在Gamma先驗分布下參數(shù)的均方誤差要比在Jeffrey先驗分布中表現(xiàn)的要好,且在Gamma先驗分布下,當(dāng)損失函數(shù)為Linex損失時參數(shù)的估計效果最好;隨著樣本容量的增大,參數(shù)估計的均方誤差逐漸減小,估計均值越來越接近真值,故在利用Bayes方法估計時,合理選擇損失函數(shù)和樣本量,可以提高估計的精度。
7" " 實例分析
Hassan A S等在文獻[ 2 ]中給出了一組機器故障壽命數(shù)據(jù)(50個,可以認為其來源于服從逆Topp-Leone分布的總體):
這些數(shù)據(jù)服從參數(shù)θ ≈ 0.3777的逆Topp-Leone分布,給定不同的r和s可以得到多個Ⅱ型雙刪失樣本,利用這些樣本得到參數(shù)θ的極大似然估計和Bayes估計,計算結(jié)果如表2所示;另外θ的可信區(qū)間以及未來觀測值的預(yù)測值的計算結(jié)果如表3所示,其中置信水平為95%。
從表2和表3可以看出參數(shù)θ的Bayes估計落在可信區(qū)間內(nèi),且在Linex損失函數(shù)下,取Gamma先驗分布時,參數(shù)θ的Bayes估計更接近真值。
8" "結(jié)論
本文在Ⅱ型雙刪失樣本下討論了逆Topp-Leone分布的參數(shù)估計和預(yù)測問題。利用經(jīng)典統(tǒng)計法計算出極大似然估計,根據(jù)Bayes理論給出參數(shù)的Bayes估計和預(yù)測值。通過數(shù)值模擬得到各種估計量的均值和均方誤差,結(jié)果表明各種Bayes估計要優(yōu)于相應(yīng)的極大似然估計,且在Linex損失下參數(shù)估計的效果最好。本文雖然只研究了在2種先驗分布、3種損失函數(shù)下逆Topp-Leone分布參數(shù)的Bayes估計,但是在Ⅱ型雙刪失樣本下可以繼續(xù)討論其它先驗分布和損失函數(shù)情形下逆Topp-Leone分布參數(shù)估計問題,另外還可以在其他截尾樣本下討論逆Topp-Leone分布的統(tǒng)計性質(zhì)。
參考文獻:
[1]Topp C W,Leone F C. A family of J-shaped frequency functions[J]. Journal of the American Statistical Association,1955,50(269):209-219.
[2]Hassan A S,Elgarhy M,Ragab R. Statistical properties and estimation of inverted Topp-Leone distribution[J]. Journal of Statistics and Applications amp; Probability,2020,9(2):319-331.
[3]Sharma V K,Singh S K,Singh U,et al. The inverse Lindley distribution: a stress-strength reliability model with application to head and neck cancer data[J]. Jouranl of Industrial and Production Engineering,2015,32(3):162-173.
[4]Voda V G. On the inverse Rayleigh distributed random variable[J]. Rep. Statist. App. Res. Un. Japan.Sci. Engrs.,1972,19: 13-21.
[5]Lin C T,Duran B S,Lewis T O. Inverted gamma as a life distribution[J]. Microelectronics Reliability,1989,29(4):619-626.
[6]Keller A Z,Kamath A R. Alternative reliability models for mechanical systems[C]. 3rd International Conference on Reliability and Maintainability. Toulose,F(xiàn)rance,1982.
[7]EL-Kader R I A,AL-Dayian G R, AL-Gendy S A. Inverted Pareto Type I distribution:properties and estimation[J]. Journal of Facutlty of Commerce AL-Azhar University,2013,21:19-40.
[8]AL-Fattah A M A,EL-Helbawy A A,AL-Dayian G R. Inverted Kumaraswamy distribution: properties and estimation[J]. Pakistan Journal of Statistics,2017,33(1):37-61.
[9]Tweedie M C K. Statistical properties of inverse Gaussian distribution[J]. Annals of Mathematical Statistics,1957,28(2): 362-377.
[10]Aijaz A,Ain S Q,Tripathi R. Bayesian analysis of inverse Topp-Leone distribution under different loss functions[J]. Journal of Xi’an University of Architecture amp; Technology,2020,12(12):581-596.
[11]鄧嚴(yán)林.雙邊定數(shù)截尾下Topp-Leone分布的Bayes估計與預(yù)測[J].江西師范大學(xué)學(xué)報(自然科學(xué)版),2021,45(3):272-277.
[12]田霆.雙邊定數(shù)截尾下Weibull分布聯(lián)合置信區(qū)間探討[J].電子產(chǎn)品可靠性與環(huán)境試驗,2020,38(1):40-42.
[13]周潔,賀興時,劉俊利.雙邊定數(shù)截尾場合下Burr Ⅻ分布的Bayes估計[J].統(tǒng)計與決策,2014(20):25-27.
[14]李艷玲.雙邊定數(shù)截尾場合雙參數(shù)指數(shù)分布的貝葉斯預(yù)測[J].統(tǒng)計與決策,2014(11):68-70.
[15]楊君慧,師義民,鄢偉安.雙邊定數(shù)截尾試驗下廣義指數(shù)分布的可靠性分析[J].火力與指揮控制,2014,39(3):133-136.
[16]龍兵.定數(shù)雙截尾下Lomax分布形狀參數(shù)的貝葉斯估計[J].統(tǒng)計與決策,2016(18):15-18.
[17]李艷玲.Ⅱ型雙刪失場合雙參數(shù)指數(shù)分布的Bayes估計[J].統(tǒng)計與決策,2014(16):23-25.
[18]劉芹,周菊玲.雙邊定數(shù)截尾下Pareto分布的Bayes估計[J].棗莊學(xué)院學(xué)報,2022,39(5):29-33.
[19]茆詩松,王靜龍,濮曉龍.高等數(shù)理統(tǒng)計[M].北京:高等教育出版社,1998:367-369.
The Bayes Estimation of the Inverse Topp-Leone
Distribution under Type-Ⅱ Doubly Censored Sample
XI Changxina, LIU Huaa,b, ZHANG Linga
(a.School of Mathematics and Physics;b.Data Analysis Science Laboratory,
Jingchu University of Technology, Jingmen 448000, China)
Abstract: In the case of type-II doubly censored samples, the maximum likelihood estimation of the inverse Topp-Leone distribution is studied, and the existence and uniqueness of the maximum likelihood estimation are proved. The prior distribution based on the unknown parameters is Gamma distribution and Jeffrey distribution. Under three different loss functions, the Bayes estimation of the unknown parameters of the inverse Topp-Leone distribution is obtained. The predicted density is obtained from the posterior density function, and then the predicted estimated values of the future observations under the three loss functions are obtained. In order to compare the advantages and disadvantages of Bayes estimation under different losses, numerical simulation is used to calculate the mean value and mean square error of various estimators. The results show that the Bayes estimator of unknown parameters under Linex loss is closer to the true value, and the mean squared error is the smallest.
Key words:type-II doubly censoring; inverse Topp-Leone distribution; Bayes estimation; prediction