荀 立, 崔世崇, 朵 蘭
(長春工業(yè)大學(xué) 數(shù)學(xué)與統(tǒng)計學(xué)院, 長春 130012)
左截斷右刪失(LTRC)數(shù)據(jù)在生物醫(yī)學(xué)、 工程壽命試驗、 勞動力經(jīng)濟(jì)和保險精算等領(lǐng)域應(yīng)用廣泛. 對于這類數(shù)據(jù), 由于觀測到的數(shù)據(jù)不完全, 因此一般采用乘積限方法估計感興趣變量的分布函數(shù). 分布函數(shù)乘積限估計的反函數(shù), 稱為乘積限分位函數(shù). 兩個分位數(shù)的差稱為分位數(shù)差, 分位數(shù)差也可表示感興趣分布的離散程度, 比標(biāo)準(zhǔn)差更穩(wěn)健. 對于中位數(shù)對稱的兩個分位數(shù)差, 可以用來分析感興趣分布的對稱程度.
在右刪失數(shù)據(jù)下, 文獻(xiàn)[1]基于Kaplan-Meier乘積限研究了分位數(shù)差的估計及其漸近性質(zhì); 文獻(xiàn)[2]利用光滑經(jīng)驗似然方法得到了分位數(shù)差的置信區(qū)間. 對于LTRC數(shù)據(jù), 文獻(xiàn)[3-4]討論了分位剩余壽命的差和比的統(tǒng)計推斷問題; 文獻(xiàn)[5]基于Tsai-Jewell-Wang(TJW)乘積限, 研究了分位數(shù)差的估計及其大樣本性質(zhì); 文獻(xiàn)[6]進(jìn)一步計算了分位數(shù)差估計的強(qiáng)收斂速度和均方收斂速度. 由于TJW乘積限估計是階梯函數(shù), 因此對應(yīng)的乘積限分位函數(shù)也是階梯函數(shù). 如果總體分位函數(shù)連續(xù), 則用連續(xù)函數(shù)估計連續(xù)的總體分位函數(shù)更易表達(dá)感興趣變量的性質(zhì). 因此, 文獻(xiàn)[7]通過對乘積限分位函數(shù)進(jìn)行光滑處理, 提出了光滑分位函數(shù).
本文通過對文獻(xiàn)[7]的光滑分位函數(shù)做差, 得到總體分位數(shù)差的一個光滑估計, 利用經(jīng)驗過程的相關(guān)理論, 研究光滑分位數(shù)差估計的相合性、 漸近正態(tài)性等大樣本性質(zhì). 進(jìn)一步, 在均方誤差的意義下, 與TJW 乘積限分位函數(shù)的差進(jìn)行比較. 數(shù)值模擬結(jié)果表明: 在均方誤差意義下, 當(dāng)窗寬的取值低于0.05或高于0.25時, 根均方誤差比出現(xiàn)負(fù)值, 即此時的光滑估計沒有統(tǒng)計優(yōu)越性; 當(dāng)窗寬在0.05~0.25內(nèi)取值時, 光滑分位數(shù)差的估計效率比乘積限分位數(shù)差的估計效率高, 但光滑分位數(shù)差犧牲了估計的無偏性, 而且由于核函數(shù)的性質(zhì), 光滑分位數(shù)差估計仍是總體分位數(shù)差的漸近無偏估計.
其中Z(n)=max{Z1,…,Zn}.
(H2)k(·)是[-1,1]上的概率密度函數(shù), 對于整數(shù)r≥2, 有
例1設(shè)F(x)=1-e-x,H(x)=1-e-x,G(x)=1-e-2x,k(x)=I[-1,1](x)/2, 則有:
1)W(x)=1-e-2x,aG=aW>0,bG=bW=∞, 進(jìn)而有e-aW<1. 由于(1-y2)-2在[0,e-aW]上是連續(xù)、 有界、 單調(diào)遞增的函數(shù), 所以
2)k(x)為[-1,1]上的概率密度函數(shù), 且r=2.
命題1[9-10]若aG≤aW, 對某些b 其中: 2) 對λ>0,ε>0,C(z)≥ε及某個常數(shù)K, 有 命題2[11]?ε>0,F在[Q(p1)-ε,Q(p2)+ε]上兩次連續(xù)可導(dǎo), 0 (1) 證明: 由命題2, 有 由命題1及文獻(xiàn)[10]中推論2.2知, 因為f(Q(p))>0和f(Q(q))>0, 所以 對某個ξ1,ξ2: 0≤ξ1,ξ2≤1, 有 其中Q(r)(·)為Q(·)的r階導(dǎo)函數(shù). 由條件(H2), 有 其中 (2) 因為 由條件(H2)和中心極限定理, 有 其中式(2)成立. 由定理1的證明, 有 從而結(jié)論得證. 其中:kf(·)為一個核函數(shù); {an}n≥1是一個正的窗寬列, 當(dāng)n→∞時, 有an→0,nan→∞. 情形1) 50%刪失率和50%截斷率, 其中F(x)=1-e-x,H(x)=1-e-x,G(x)=1-e-2x; 情形2) 30%刪失率和25%截斷率, 其中F(x)=1-e-x,H(x)=1-e-3x/7,G(x)=1-e-30x/7. 選用高斯核函數(shù), 窗寬列為hn=…,0.05,0.08,0.10,0.12,0.15,0.18,0.20,0.22,0.25,…, 水平(p,q)=(0.75,0.25),(0.80,0.20),(0.95,0.75), 樣本容量n=50,100,200, 重復(fù)模擬500次, 計算兩個分位數(shù)差估計的根均方誤差比 其中估計的偏差、 方差和均方誤差分別記為Bias(·),Var(·)和MSE(·). 從偏差、 方差和均方誤差三方面比較兩個估計的效率, 其中根均方誤差比表示均方誤差意義下光滑估計提高的效率. 在上述兩種不同刪失率和截斷率下, 窗寬分別為hn=0.05,0.15,0.25的數(shù)值模擬結(jié)果分別列于表1~表6. 表1 刪失率為50%、 截斷率為50%、 窗寬為0.25的數(shù)值模擬結(jié)果 表2 刪失率為30%、 截斷率為25%、 窗寬為0.25的數(shù)值模擬結(jié)果 表3 刪失率為50%、 截斷率為50%、 窗寬為0.15的數(shù)值模擬結(jié)果 由表1可見: 兩個估計的偏差、 方差和均方誤差幾乎都隨樣本容量的增大而減小; 光滑估計的偏差普遍大于乘積限分位數(shù)差估計的偏差, 因為光滑方法犧牲了估計的無偏性; 但光滑估計是漸近無偏的; 光滑分位數(shù)差估計的方差和均方誤差都比乘積限分位數(shù)差估計值小, 表明此時在方差和均方誤差意義下, 光滑方法提高了估計效率; 根均方誤差比表示估計效率提高的比值, 例如, 樣本容量為50的四分位差θ(0.75,0.25)的兩個估計, 光滑方法將估計效率提高了1.609%, 對于更大的分位數(shù)差θ(0.80,0.20)和尾部分位數(shù)差θ(0.95,0.75)也有類似結(jié)果. 表2中分位數(shù)差θ(0.80,0.20)的兩個估計的根均方誤差比出現(xiàn)負(fù)值, 表明此時乘積限分位數(shù)差估計比光滑分位數(shù)差估計更有效, 光滑方法不具有統(tǒng)計優(yōu)越性. 表4的刪失率和截斷率與表3不同, 但得到了與表3類似的結(jié)果, 表明在適當(dāng)選擇的窗寬下, 不同的刪失率和截斷率對估計效率的提高無影響. 表5的結(jié)果類似表1, 對于刪失率為50%、 截斷率為50%、 窗寬為0.05的情形, 仍然有光滑分位數(shù)差估計的效率高于乘積限分位數(shù)差估計的結(jié)果. 表6的結(jié)果類似表2, 表明窗寬為0.05時, 光滑分位數(shù)差的估計效率并不比乘積限分位數(shù)差估計的效率高. 表4 刪失率為30%、 截斷率為25%、 窗寬為0.15的數(shù)值模擬結(jié)果 表5 刪失率為50%、 截斷率為50%、 窗寬為0.05的數(shù)值模擬結(jié)果 表6 刪失率為30%、 截斷率為25%、 窗寬為0.05的數(shù)值模擬結(jié)果 上述結(jié)果表明: 窗寬高于0.25或低于0.05時, 根均方誤差比出現(xiàn)負(fù)值, 此時光滑分位數(shù)差沒有統(tǒng)計優(yōu)越性; 當(dāng)窗寬在0.05~0.25內(nèi)取值時, 根均方誤差比大于0, 說明此時光滑分位數(shù)差估計比乘積限分位數(shù)差估計具有更高的效率. 注1本文根據(jù)文獻(xiàn)[7]的光滑分位函數(shù)定義總體分位數(shù)差的估計量, 并與文獻(xiàn)[5]定義的乘積限分位數(shù)差估計比較估計效率, 所有理論證明均在截斷變量、 壽命變量、 刪失變量相互獨立的條件下進(jìn)行. 對于壽命變量與刪失變量相依的情形, 根據(jù)文獻(xiàn)[12], 產(chǎn)生長度偏差右刪失(LBRC)數(shù)據(jù), 考慮LBRC數(shù)據(jù)下樣本分位數(shù)差的估計. 用本文方法, 在均方誤差意義下, 選擇適當(dāng)?shù)拇皩? 得到類似估計效率的改善結(jié)果列于表7~表11. 表7 刪失率為50%的LBRC數(shù)據(jù)下窗寬為0.25的數(shù)值模擬結(jié)果 表8 刪失率為30%的LBRC數(shù)據(jù)下窗寬為0.25的數(shù)值模擬結(jié)果 表9 刪失率為50%的LBRC數(shù)據(jù)下窗寬為0.15的數(shù)值模擬結(jié)果 表10 刪失率為30%的LBRC數(shù)據(jù)下窗寬為0.15的數(shù)值模擬結(jié)果 表11 刪失率為50%的LBRC數(shù)據(jù)下窗寬為0.05的數(shù)值模擬結(jié)果2 主要結(jié)果
3 數(shù)值模擬與分析