李華鵬,蔡 凱
(山西大同大學數(shù)學與計算機科學學院,山西大同 037009)
因變量缺失的變系數(shù)部分線性模型的有效估計
李華鵬,蔡 凱
(山西大同大學數(shù)學與計算機科學學院,山西大同 037009)
討論了因變量隨機缺失條件下變系數(shù)部分線性模型的估計問題。基于局部借補思想,使用局部線性方法和平均技巧同時得到了各個估計量的估計,進而給出了估計的漸近性質(zhì)。
變系數(shù)部分線性模型;隨機缺失;借補
統(tǒng)計中經(jīng)常碰到數(shù)據(jù)缺失的問題。處理缺失數(shù)據(jù)常用的方法有:基于完整數(shù)據(jù)的方法,加權(quán)方法及借補方法。人們也做了大量的工作。如Wang Qihua,Sun Zhihua[1]研究了當響應變量隨機缺失時部分線性模型的估計,用核方法回歸借補和邊緣概率逆加權(quán)方法相應給出了協(xié)變量和非參函數(shù)的估計,并用經(jīng)驗似然推斷方法給出了響應變量均值函數(shù)的估計;Chen Fan[2]研究了在響應變量為隨機缺失條件下廣義線性模型的局部擬似然估計,分別用局部擬似然方法,局部擬似然加權(quán)方法,局部擬似然借補方法給出了響應變量的估計,進一步給出了隨機缺失條件下的響應變量的均值函數(shù)的估計;李志強、薛留根[3]在協(xié)變量隨機缺失條件下,研究了廣義半?yún)?shù)模型的加權(quán)擬似然估計方法,給出了未知參數(shù)與非參數(shù)回歸函數(shù)的估計,并證明了所給出的加權(quán)擬似然估計的漸近正態(tài)性。三種常用的方法中,前兩種都沒有完全使用數(shù)據(jù),造成信息缺失,且當有較多缺失值時,估計的真實效果會大打折扣,這時僅靠增大窗寬也是不行的,這樣又產(chǎn)生了額外的偏差。對變系數(shù)部分線性模型[5-7],文中討論了當響應變量隨機缺失[8]時,在張日權(quán)[6]的工作基礎上,使用回歸借補估計方法(能克服以上缺點)給出估計量的有效估計,并得到了其漸進性質(zhì)。
考慮變系數(shù)部分線性模型其中Y為因變量,X∈R,U∈R,Z=(Zj,…,Zp)T∈Rp是協(xié)變量,常數(shù)項函數(shù)α0(·)和變系數(shù)函數(shù)αj(·)為R上的未知可測函數(shù)(j=1,…,p),隨機誤差ε滿足
處理缺失數(shù)據(jù),一種有效方法就是借補。張日權(quán)[6]用最小二乘法和平均方法同時求出了完整數(shù)據(jù)下α0(·),αj(·)的估計:
j=0,1,…,p。這里ej是一個第j+1個分量為1的(2p+2)維單位向量,V為n×(2p+2)矩陣,第i行
g1,g2為初始窗寬。
文中借鑒此法,在此基礎上令
則當δi=1時,=Y(jié)i;當δi=0時,
引入記號:令
T=(X,U,Z),V=(X,U),
(A1)假設X和U的聯(lián)合密度p(x,u),X的邊緣密度p1(x),U的邊緣密度p2(u)以及△(t)都是有二階連續(xù)偏導數(shù)且是正有界的。
(A2,Gi,gi(·)是二階可導的有有界支撐的核函數(shù),i=1,2。
(A3),都有連續(xù)一階導數(shù)且是正有界的。其中A*B是矩陣A和B的Hadamard積。令
引理 由假設條件及g2/g1→0,有
證明 由文獻[6]中定理2.1的結(jié)論和中心極限定理可得。
定理1 設上述假設條件成立,當h2/h1→0時,有
定理2 設上述假設條件成立及當g1/g2→0,g2/h1→0,h1/h2→0時,有
可得到
計算可得
Anε服從正態(tài)分布,且
由引理可算得
綜合(2)-(5)可知
定理2的證明完全類似定理1的討論可得。
[1]Wang Q H,Sun Z H.Estimation in partially linear models with missing responses at random[J].Journal of Multivariate Analysis.2007(98):1470-1493.
[2]Chen J W,F(xiàn)an J Q,Li K H,et al.Local quasi-likelihood estimation with data missing at random[J].Statica.Sinica.2006(16):1071-1100.
[3]李志強,薛留根.協(xié)變量隨機缺失的廣義半?yún)?shù)模型[J].北京工業(yè)大學學報,2007,33(7):761-765.
[4]Zhang R Q,Lu Y Q,Zhang T S.Functional-coefficient Partially Linear Time Series Models for Hydrological Forecasting[J].Advances and Application in Statistics,2006,6(1):57-69.
[5]張日權(quán),盧一強.變系數(shù)模型[M].北京:科學出版社,2004.
[6]張日權(quán).變系數(shù)部分線性模型的研究與分析[R].北京:中國科學院數(shù)學與系統(tǒng)科學研究所,2003.
[7]馮井艷,張志強,李華鵬.變系數(shù)模型誤差方差的估計[J].山西大同大學學報:自然科學版,2010,26(1):5-7.
[8]Roderick J A Little,Donald B Rubin.缺失數(shù)據(jù)統(tǒng)計分析[M].孫山澤譯.北京:中國統(tǒng)計出版社,2004.
〔編輯 高?!?/p>
Estimation in Functional-coefficient Partially Linear Regression Model with Data Missing at Random
LI Hua-peng,CAI Kai
(School of Mathematics and Computer Science,Shanxi Datong University,Datong Shanxi,037009)
A functional-coefficient partially linear regression model is considered when the responses are missing at random(MAR).Based on the method of the estimation with the imputed values,the local linear method and averaged technique are employed to give the estimators of all functions.Furthermore,the asymptotical normalities of all estimators are given.
functional-coefficient partially linear model;missing at random;local imputation
O211.7
A
1674-0874(2011)01-0007-02
2010-10-25
山西大同大學科學基金資助項目[2010K4]
李華鵬(1981-),男,河南周口人,碩士,助教,研究方向:數(shù)理統(tǒng)計。