摘要: 采用k階Poisson相依驅(qū)動(dòng)隨機(jī)系數(shù)混合算子整數(shù)值自回歸模型分析具有變量字符元素計(jì)數(shù)特征的數(shù)據(jù), 給出該模型的統(tǒng)計(jì)性質(zhì)和參數(shù)的條件極大似然估計(jì), 并證明估計(jì)量的漸近正態(tài)性. 數(shù)值模擬結(jié)果表明, 隨著樣本容量的增加, 參數(shù)估計(jì)逐漸收斂于真實(shí)值. 實(shí)際數(shù)據(jù)分析結(jié)果表明了該模型的有效性.
關(guān)鍵詞: k階自回歸模型; Po-DDRCMTINAR(k)模型; 混合稀疏算子; 條件極大似然估計(jì)
中圖分類號(hào): O212.1" 文獻(xiàn)標(biāo)志碼: A" 文章編號(hào): 1671-5489(2024)04-0866-12
k-Order Poisson Dependent-Driven Random CoefficientMixed Thinning Integer-Valued Autoregressive Model
LIU Xiufang1, ZHANG Xiaolei2, WANG Dehui3
(1. College of Mathematics, Taiyuan University of Technology, Taiyuan 030024, China;
2. College of Mathematics, Jilin University, Changchun 130012, China;3. School of Mathematics and Statistics, Liaoning University, Shenyang 110036, China)
Abstract: By using k-order Poisson dependent-driven random coefficient mixed thinning integer-valued autoregressive model, we analyzed data with the cou
nting of elements of variable character, gave" statistical properties of the model and conditional maximum likelihood estimation of parameters, and proved the asymptotic
normality of the estimators. The numerical simulation results show that as the sample size increases, the parameter estimation gradually converges
to the true value. The actual data analysis results" show" that the effectiveness of the proposed model.
Keywords: k-order autoregressive model; Po\|DDRCMTINAR(k) model; mixed thinning operator; conditional maximum likelihood estimation
0 引 言
由于時(shí)間序列數(shù)據(jù)來源的廣泛性和數(shù)據(jù)類型的多樣化, 因此需要更廣的隨機(jī)系數(shù)時(shí)間序列模型分析數(shù)據(jù). 目前, 具有整數(shù)特征的時(shí)間序列數(shù)據(jù)在現(xiàn)實(shí)生活中應(yīng)用廣泛. 文獻(xiàn)[1]基于二項(xiàng)算子提出了一階整數(shù)值自回歸(INAR(1))模型, 用于分析保險(xiǎn)公司每天收到的索賠數(shù)量; 文獻(xiàn)[2]討論了縱向計(jì)數(shù)數(shù)據(jù)的Poisson INAR(1)模型(PINAR(1)), 其中新息序列{εt}服從Poisson分布; 文獻(xiàn)[3]提出了一種基于Pegram和二項(xiàng)算子的平穩(wěn)非負(fù)一階整數(shù)值隨機(jī)變量模型(PegramINAR(1)); 文獻(xiàn)[4]進(jìn)一步將INAR(1)模型推廣到高階, 研究了INAR(p)模型的存在性和平穩(wěn)遍歷性; 文獻(xiàn)[5]得到了滿足INAR(p)模型的時(shí)間序列{Xt}的高階矩和累積量的差分方程, 并以狀態(tài)空間形式獲得了該模型的譜和雙譜密度函數(shù), 從而在頻域中對(duì)其進(jìn)行表征. 特別地, 文獻(xiàn)[1]中參數(shù)φ可能是隨時(shí)間變化的隨機(jī)變量, 這是因?yàn)棣湛赡苁芨鞣N環(huán)境因素的影響, 例如, 患者的生存概率受衛(wèi)生保健質(zhì)量和患者自身健康狀況等因素的影響. 因此, 研究隨機(jī)系數(shù)整數(shù)值自回歸模型有一定的應(yīng)用價(jià)值. 文獻(xiàn)[6]提出的一階隨機(jī)系數(shù)整數(shù)值自回歸模型RCINAR(1)分析了到醫(yī)院就醫(yī)的門診病人數(shù); 文獻(xiàn)[7]研究了觀測(cè)驅(qū)動(dòng)隨機(jī)系數(shù)整數(shù)值自回歸模型OD-RCINAR(1); 文獻(xiàn)[8]提出了一種新的具有隨機(jī)系數(shù)和零膨脹幾何邊際分布的平穩(wěn)一階整數(shù)值自回歸模型ZIGINARRC(1), 用于分析過度離散、 過多零點(diǎn)和自相關(guān)特征的計(jì)數(shù)數(shù)據(jù); 文獻(xiàn)[9]將RCINAR(1)模型擴(kuò)展為高階隨機(jī)系數(shù)整數(shù)值自回歸模型(RCINAR(p)), 并用極大似然法、 條件最小二乘法、 修正擬似然法和廣義矩法估計(jì)模型參數(shù); 文獻(xiàn)[10]提出了p階Poisson相依驅(qū)動(dòng)隨機(jī)系數(shù)整數(shù)值自回歸模型(Po-DDRCINAR(p)), 采用最小二乘法和擬似然法估計(jì)參數(shù), 并通過數(shù)值模擬及分析癲癇病數(shù)據(jù)驗(yàn)證了模型的有效性; 文獻(xiàn)[11]考慮了一個(gè)具有負(fù)二項(xiàng)邊際的一階平穩(wěn)整數(shù)值自回歸模型(NBINAR(1)), 用于分析盜竊計(jì)數(shù)數(shù)據(jù); 文獻(xiàn)[12]基于負(fù)二項(xiàng)算子提出了一階幾何整數(shù)值自回歸模型(NGINAR(1)), 用于分析細(xì)菌分解數(shù)量的數(shù)據(jù); 文獻(xiàn)[13]提出了一種新的季節(jié)性幾何整數(shù)值自回歸模型SGINAR(1), 并討論了該模型的一些基本概率統(tǒng)計(jì)特性; 文獻(xiàn)[14]將上述模型擴(kuò)展為高階情形, 提出了一個(gè)新的組合整數(shù)值自回歸模型CGINAR(p), 該模型具有幾何邊際分布, 并分析了美國(guó)每月的脊髓灰質(zhì)癥發(fā)病率數(shù)據(jù)及年太陽(yáng)黑子相對(duì)數(shù)數(shù)據(jù); 文獻(xiàn)[15]提出了p階混合整數(shù)值自回歸模型(SDMINAR(p)), 其隨機(jī)誤差項(xiàng)是序列相依的,該模型可用于分析過度離散的數(shù)據(jù); 文獻(xiàn)[16]提出了一種p階二態(tài)自激勵(lì)門限整數(shù)值自回歸(SETINAR(2,p))模型, 給出了參數(shù)估計(jì)和假設(shè)檢驗(yàn)方法, 并將該模型用于分析德國(guó)腦膜炎球菌病患者人數(shù); 文獻(xiàn)[17]研究了一種由獨(dú)立的負(fù)二項(xiàng)分布隨機(jī)變量驅(qū)動(dòng)的一階門限整數(shù)值自回歸模型NBTINAR(1); 文獻(xiàn)[18]在文獻(xiàn)[17]的基礎(chǔ)上研究了隨機(jī)項(xiàng)分布未知的情形, 考慮了參數(shù)的點(diǎn)估計(jì)和區(qū)間估計(jì)問題, 并提供了一種檢驗(yàn)數(shù)據(jù)非線性的方法; 文獻(xiàn)[19]針對(duì)具有變量字符元素計(jì)數(shù)特征的數(shù)據(jù), 提出了一階混合算子整數(shù)值自回歸模型, 其中變量字符元素計(jì)數(shù)特征即為元素可能在一段時(shí)間內(nèi)處于被動(dòng)狀態(tài), 并以這種方式對(duì)總數(shù)只添加0或1, 而在下一個(gè)計(jì)數(shù)間隔內(nèi), 由于某些原因, 元素可能處于主動(dòng)狀態(tài), 對(duì)計(jì)數(shù)值做出的貢獻(xiàn)更大且大于1; 文獻(xiàn)[20]將上述模型推廣到一階隨機(jī)系數(shù)混合算子整數(shù)值自回歸模型(RCMTINAR(1)), 用于分析生存概率受各種環(huán)境因素影響的數(shù)據(jù); 為分析具有可變字符元素計(jì)數(shù)特征的多變量數(shù)據(jù), 文獻(xiàn)[21]提出了高階相依驅(qū)動(dòng)隨機(jī)系數(shù)混合算子整數(shù)值自回歸模型. 本文基于文獻(xiàn)[21], 考慮隨機(jī)誤差項(xiàng)服從Poisson分布情形的k階相依驅(qū)動(dòng)隨機(jī)系數(shù)混合算子整數(shù)值自回歸模型:
Xt=∑ki=1αti·piXt-i+εt," t≥1,(1)
其中: αt1,αt2,…,αtk的概率分布為
P(αt1=α1, αt2=0, …, αtk=0)=φ1,P(αt1=0, αt2=α2, …, αtk=0)=φ2," "P(αt1=0, α
t2=0, …, αtk=αk)=φk,P(αt1=0, αt2=0, …, αtk=0)=φ0,(2)
φ0,φ1,…,φk非負(fù), 且∑ki=0φi=1; 在給定αti條件下, αti·pi=∑Xt-
ij=1W(ti)j, 這里非負(fù)整數(shù)值隨機(jī)變量Xt-i與計(jì)數(shù)序列W(ti)j相互獨(dú)立, 且{W(ti)j}是一個(gè)獨(dú)立同分布的隨機(jī)變量序列, 其分布為
W(ti)j=B(ti)j,w.p. pi,G(ti)j,w.p. 1-pi," pi∈[0,1],
B(ti)j服從Bernoulli(αti)分布, G(ti)j服從 Geometric(αti/(1+αti))分布, 其概率質(zhì)量函數(shù)為
P(G(ti)j=x)=αxti(1+αti)x+1, x=0,1,…, B(ti)j和G(ti)j對(duì)任意時(shí)間t相互獨(dú)立; 時(shí)變系數(shù){αti, 1
≤i≤k}對(duì)任意時(shí)間t是相互獨(dú)立同分布的, {εt}是獨(dú)立同分布的非負(fù)整數(shù)值序列, 并服從參數(shù)為λ的Poisson分布, 且{αti, 1≤i≤k}與{εt}相互獨(dú)立. 該模型稱
為Po-DDRCMTINAR(k)模型, 其參數(shù)是θ=(α1,…,αk,φ1,…,φk,p1
,…,pk,λ)′. 根據(jù)方程(2), 可得αit的均值、 方差以及αit與αjt(i≠j)之間的協(xié)方差分別為
E(αti)=αiφi, Var(αti)=α2iφi(1-φi), Cov(αti,αtj)=-αiαjφiφj.(3)
特別地, 當(dāng)參數(shù)p1=p2=…pk=1時(shí), 本文模型退化為文獻(xiàn)[10]提出的Po-DDRCINAR(k)模型. 本文對(duì)參數(shù)p1,p2,…,pk是否等于1, 即該模型是否退化為Po-DDRCIN
AR(k)模型進(jìn)行檢驗(yàn). 最后, 通過數(shù)值模擬和實(shí)例分析驗(yàn)證模型的有效性.
1 模型的統(tǒng)計(jì)性質(zhì)
假設(shè){Xt}是由模型(1)-(2)定義的Po-DDRCMTINAR(k)模型, 下面給出該模型的一些統(tǒng)計(jì)性質(zhì).
命題1 1) E(XtXt-1,…,Xt-k)=∑ki=1αiφiXt-i+λ;
2) 如果該模型是k階平穩(wěn)的, 則E(Xt)=λ1-∑ki=1αiφi-1;
3) Var(XtXt-1,…,Xt-k)=∑ki=1[αiφi(1+(1-2pi)αi)Xt-i+α2iφiX2t-i]
+2λ∑ki=1αiφiXt-i+λ2+λ-∑ki=1αiφiXt-i+λ2;
4) 令γj=Cov(Xt,Xt-j), 則γj=∑ki=1αiφiγj-i.
證明: 令Si=αti·piXt-i, 則Si的條件矩母函數(shù)為
MSiαti,Xt-i=pi(1-αti+αtiet)+(1-pi)11+αti-αtietXt-i,
因此, 可得Si的l階條件矩為E(Sliαti,Xt-i)=M(l)Siαti,Xt-i(0). 特別地, 有
E(Siαti,Xt-i)=αtiXt-i," E(S2iαti,Xt-i)=α2tiXt-i(1-Xt-i)+(αti+2(1-pi)α2ti)Xt-i,
進(jìn)一步, 可得
E(SiXt-i)=αiφiXt-i, E(S2iXt-i)=αiφi(1+(1-2pi)αi)Xt-i+α2iφiX2t-i,
從而可推出統(tǒng)計(jì)性質(zhì)1)~4)成立. 證畢.
根據(jù)文獻(xiàn)[21]中定理1, 可知在∑ki=1αiφilt;1, 0lt;αilt;1, 0lt;φilt;1, 0lt;pilt;1, 0lt;φ1+φ2+…+φklt;1及E(AtAt)的最大特征值小于1
成立的條件下, 模型{Xt}是平穩(wěn)遍歷的. 進(jìn)一步, 根據(jù)文獻(xiàn)[22], 通過以下結(jié)果給出模型{Xt}的嚴(yán)平穩(wěn)遍歷性.
定理1 滿足方程(1)-(2)的模型{Xt}是嚴(yán)平穩(wěn)遍歷的.證明: 首先證明模型{Xt}是嚴(yán)平穩(wěn)的. 只需證明對(duì)
t,k′gt;0和任意的x1,x2,…,xk′,
P(Xi=xi, 1≤i≤k′)=P(Xt+i=xi, 1≤i≤k′).
基于模型的定義, Xt是一個(gè)k階Markov過程. 不失一般性, 假設(shè)k≤k′, 則有
P(Xi=xi, 1≤i≤k′)=P(X1=x1)∏k′l=2P(Xl=xlXl-j=xl-j, 1≤j≤min{k,l-1}),(4)
P(Xt+i=xi, 1≤i≤k′)=P(Xt+1=x1)∏k′l=2P(Xt+l=xlXt+l-j=xl-j, 1≤j≤min{k,l-1}).(5)
再根據(jù)模型的定義及εt是一個(gè)獨(dú)立同分布的Poisson隨機(jī)變量序列, 可得方程(4),(5)的等號(hào)右邊相等, 從而證得該過程是嚴(yán)平穩(wěn)的.
下面證明該過程的遍歷性. 令A(yù)為序列Xt的任意不可變事件, 根據(jù)文獻(xiàn)[23]中定義2知, 只需證明P(A)=0或P(A)=1即可. 由于A是任意不可變事件, 因此存在B∈B(瘙綆∞),
使得對(duì)任意的t∈瘙綄, 滿足A={w(Xt,Xt-1,…)∈B}. 因?yàn)閄t∈N, 所以A={w(Xt,Xt-1,…)∈B∩N}. 如果F(Xt,Xt-1,…)是
一個(gè)由{Xt,Xt-1,…}生成的σ-域, 則對(duì)任意的t∈瘙綄, 有
A∈F(Xt,Xt-1,…),(6)
根據(jù)模型(1)-(2), 有
F(Xt,Xt-1,…)F(εt,V(t),εt-1,V(t-1),…), (7)
其中V(t)是Xt構(gòu)造中使用計(jì)數(shù)序列的符號(hào), 即混合算子運(yùn)算符序列. 根據(jù)Xt的定義知, {εt,V(t)}是一個(gè)獨(dú)立的隨機(jī)變量序列, 結(jié)合方程(6),(7), 對(duì)任意的t∈瘙綄,
有A∈F(εt,V(t),εt-1,V(t-1),…)或者等價(jià)地有
A∈∩-∞t=0F(εt,V(t),εt-1,V(t-1),…).
因此, 得到集合的無(wú)窮交集是一個(gè)尾σ\|代數(shù)滿足Kolmogorov 0-1律定理, 所以A是一個(gè)尾事件, 且有P(A)=0或P(A)=1. 從而遍歷性得證. 證畢.
上述統(tǒng)計(jì)性質(zhì)有利于獲得模型中參數(shù)估計(jì)量的漸近性質(zhì). 為得到參數(shù)的條件極大似然估計(jì), 下面給出模型的轉(zhuǎn)移概率:
Pθ(XtXt-1,…,Xt-k)=∑kj=1
∑Mtmj=0φjfε(Xt-mj)P(αj·pjXt-j=mjXt-1,…,Xt-k)+φ0fε(Xt),
其中fε(Xt-mj)=λXt-mje-λ(Xt-mj)!, m0=0, j=0,1,…,k. 并且
P(αj·pjXt-j=" mjXt-1,…,Xt-k)=(1-pj)Xt-jPNBXt-j
,αj1+αj=mj+" pXt-jjP(Bin(Xt-j,αj)=mj)+∑Xt-j-1i=1Xt-j
ipij(1-pj)Xt-j-i×" PBin(i,αj)+NBXt-j-i,αj1+αj=mj,
其中(1-pj)Xt-jPNBXt-j,αj1+αj=mj對(duì)應(yīng)的Mt是Xt, pXt-jjP(Bin(X
t-j,αj)=mj)和PBin(i,αj)+NBXt-j-i,αj1+αj=mj對(duì)應(yīng)的Mt是min{Xt,Xt-j}. 用ab表示二項(xiàng)組合, 則
PBin(i,αj)+NBXt-j-i,αj1+αj=mj=∑
min{mj,i}l=0ilX
t-j-i+mj-l-1Xt-j-i-1αmjj(1-αj)i-l(1+αj)mj-l+Xt-j-i.
為方便計(jì)算, 下面給出一些表達(dá)式:
Y(dj,ej)=dj+ej-1dj-1αj1+αjej11+αjdj,
Z(dj,ej)=djejαejj(1-αj)dj-ej," j=1,2,…,k,
r(dj,ej)=djejpejj(1-pj)dj-ej, q(di,ei)=λdi-eie-λ(di-ei)!, i=0,1,…,k, e0=0,
從而模型的轉(zhuǎn)移概率也可表示為
Pθ(XtXt-1,…,Xt-k)=" ∑kj=1φj∑Xtmj=0q(Xt,mj)(1-pj)Xt-jY(X
t-j,mj) +∑min{Xt,Xt-j}mj=0q(Xt,mj)×" pXt-jjZ(Xt-j,mj)+
∑Xt-j-1i=1r(Xt-j,i)∑min{mj,i}l=0Z
(i,l)Y(Xt-j-i,mj-l)+1-∑kj=1φjq(Xt,m0).(8)
2 參數(shù)的條件極大似然估計(jì)
下面基于模型的統(tǒng)計(jì)性質(zhì)和轉(zhuǎn)移概率討論模型中未知參數(shù)的條件極大似然估計(jì).
假設(shè)X0,X1,…,Xn是由Po-DDRCMTINAR(k)過程生成的隨機(jī)變量, 其真實(shí)參數(shù)值為θ0.
對(duì)數(shù)似然函數(shù)表示為l(θ)=∑nt=k+1log Pθ(XtXt-1,…,Xt-k), 其中Pθ(XtXt-1,…,Xt-k
)由方程(6)給出, 簡(jiǎn)記為Pθ. 本文模型的得分函數(shù)為
l(θ)αj=∑nt=k+11PθφjXt-j1+αj∑Xt-1mj=0(1-pj)Xt-jY(Xt-j+1,mj)q(Xt-1,mj)-
∑Xtmj=0(1-pj)Xt-jY(Xt-j,mj)q(Xt,mj)+φjXt-j1-αj×∑
min{Xt-1,Xt-j-1}mj=0pXt-jjZ(Xt-j-1,mj)q(Xt-1,mj)
-∑min{Xt,Xt-j}mj=0pXt-jjZ(Xt-j,mj)q(Xt,mj)+∑min{Xt,Xt-j}
mj=0φjq(Xt,mj)∑Xt-j-1i=1r(Xt-j,i)×i1-αj∑min{mj-1,i-1}
l=0Z(i-1,l)-∑min{mj,i}l=0Z(i,l)Y(Xt-j-i,mj-l)+
Xt-j-i1+αj∑min{mj-1,i}l=0Y(Xt-j-i+1,mj-l-1)-∑min{mj,i}l=0
Y(Xt-j-i,mj-l)Z(i,l),
l(θ)φj=∑nt=k+11Pθ∑Xtmj=0(1-pj)Xt-jY(Xt-j,mj)q(Xt,mj)+∑min{Xt,Xt-j}mj=0q(Xt,mj)×p
Xt-jjZ(Xt-j,mj)+∑Xt-j-1i=1r(Xt-j,i)∑min{mj,i}l=0Z(i,l)Y(Xt-j-i,mj-l)-q(Xt,m0),
l(θ)pj=∑nt=k+11Pθ{
-φjXt-j∑Xtmj=0(1-pj)Xt-j-1Y(Xt-j,mj)q(Xt,mj)+φjXt-j∑min{Xt,Xt-j}
mj=0q(Xt,mj)×pXt-j-1jZ(Xt-j,mj)+11-p
j∑Xt-j-2i=0r(Xt-j-1,i)-∑Xt-j-1i=1r(Xt-j,i)∑min{mj,i}l=0Z(i,l)Y(Xt-j-i,mj-l)},
l(θ)λ=∑nt=k+11Pθ
∑kj=1∑Xt-1mj=0φjq(Xt-1,mj)(1-pj)Xt-jY(Xt-j,mj)+∑min{Xt-1,Xt-j}m
j=0φjq(Xt-1,mj)×pXt-jjZ(Xt-j,mj)+∑Xt-j-1i=1r(Xt-j,i)∑
min{mj,i}l=0Z(i,l)Y(Xt-j-i,mj-l)+1-∑kj=1φjq(Xt-1,m0)-Pθ.
因此, 通過最大化條件對(duì)數(shù)似然函數(shù)或通過求解與得分函數(shù)相關(guān)的方程, 可推出未知參數(shù)θ的條件極大似然估計(jì)量.
下面給出Y,Z,r,q,P及其偏導(dǎo)數(shù)的相關(guān)遞推關(guān)系, 用于證明參數(shù)估計(jì)量的漸近正態(tài)性. 根據(jù)轉(zhuǎn)移概率和得分函數(shù), 可得Y,Z,r,q,P的表達(dá)式如下:
Y(dj,ej)=αjdjejY(dj+1,ej-1),(9)Z(dj,ej)=αjZ(dj-1,ej-1)+(1-αj)Z(dj-1,ej),(10)
r(dj,ej)=pjr(dj-1,ej-1)+(1-pj)r(dj-1,ej),(11)
Y(dj,ej)αj=dj1+αj[Y(dj+1,ej-1)-Y(dj,ej)],(12)
Z(dj,ej)αj=dj1-αj[Z(dj-1,ej-1)-Z(dj,ej)],(13)
r(dj,ej)pj=dj1-pj[r(dj-1,ej-1)-r(dj,ej)],(14)
q(dj,ej)λ=q(dj-1,ej)-q(dj,ej),(15)
2q(dj,ej)λ2=q(dj-2,ej)-2q(dj-1,ej)+q(dj,ej),(16)
Pθαj=" ∑Xtmj=0φjq(Xt,mj)(1-pj)Xt-jY(Xt-j,mj)αj+
∑min{Xt,Xt-j}mj=0φjq(Xt,mj)pXt-j
jZ(Xt-j,mj)αj+∑Xt-j-1i=1r(Xt-j,i)×" ∑min{mj,i}l=0Z(i
,l)αjY(Xt-j-i,mj-l)+Z(i,l)Y(Xt-j-i,mj-l)αj.(17)
根據(jù)式(9)~(17)可得如下命題.
命題2 -maxXt-j1+αj,Xt-j1-αj,2Xt-j1-α2j≤
log Pθαj≤maxXt-jαj(1+αj),Xt-jαj(1-αj),2Xt-jαj(1-α2j).
證明: 由于
logPθαj≥" 1Pθ-φjXt-j1+α
j∑Xtmj=0q(Xt,mj)(1-pj)Xt-jY(Xt-j,mj)-" Xt-j1-αj∑min{Xt,Xt-j}mj=
0q(Xt,mj)pXt-jjZ(Xt-j,mj)-∑min{Xt,Xt-j}mj=0φjq(Xt,mj)×
∑Xt-j-1i=1i1-αj+Xt-j-i1+αjr(Xt-j,i)∑min{mj,i}l=0Z(i,l)Y(Xt-j-i,mj-l),
所以log Pθαj≥-maxXt-j
1+αj,Xt-j1-αj,2Xt-j1-α2j.
另一方面, 根據(jù)式(9)~(17)有
log Pθαj≤" 1Pθ∑Xtmj=0φjq(Xt,mj)mjαj(1+αj)(1-pj)Xt-jY(Xt-j,mj)+" ∑min{Xt,Xt-j}mj=0φjq(Xt,mj)Xt-jαj(1-αj)pXt-jjZ(Xt-j
,mj)+∑Xt-j-1i=1r(Xt-j,i)×" ∑min{mj,i}l=0iαj(1-αj)
+mj-lαj(1+αj)Z(i,l)Y(Xt-j-i,mj-l)〗≤" maxXt-jαj(1+αj),X
t-jαj(1-αj),2Xt-jαj(1-α2j).
證畢.
3 參數(shù)估計(jì)量的漸近正態(tài)性
下面根據(jù)定理1、 命題2和式(9)~(17), 討論參數(shù)估計(jì)量的漸近正態(tài)性.
采用文獻(xiàn)[24-25]的方法證明估計(jì)量的漸近正態(tài)性. 首先給出如下正則條件:
(H1) 集合m: P(εt=m)=f(m,λ)=λmm!e-λgt;0不依賴于λ;
(H2) E(ε3t)=λ3+3λ2+λlt;∞;
(H3) P(εt=m)是三次連續(xù)可微的;
(H4) 對(duì)任意的λ′∈B(這里B是集合瘙綆的一個(gè)開子集), 存在λ′的一個(gè)領(lǐng)域U, 使得
∑∞k=0supλ∈U f(k,λ)lt;∞, ∑∞k=0supλ∈U f(k,λ)λlt;∞, ∑∞k=0supλ∈U2f(k,λ)λ2lt;∞;
(H5) 對(duì)于λ′∈B, 存在λ′的一個(gè)鄰域U和常數(shù)C1,C2,C3, 使得序列φ1(n)=C1n, φ11(n)=C2n2, φ111(n)=C3n
3, 當(dāng)n≥0時(shí), 對(duì)λ∈U和m≤n, 在過程{Xt}具有平穩(wěn)遍歷分布的條件下, P(εt)的非零概率密度函數(shù)f(m,λ)滿足:
f(k,λ)λ≤φ1(n)f(m,λ), 2f(k,λ)λ2≤φ11(n)f(m,λ), 3f(k,λ)λ3≤φ111(n)f(m,λ);
(H6) 記I(θ)=(σij)(3k+1)(3k+1)為Fisher信息矩陣, 這里i,j=1,2,…,3k+1, 且I(θ)是非奇異的, 并有I(θ)=
Elog Pθθi·log Pθθj.
下面給出文獻(xiàn)[24]中定理1.3的一種特殊形式.
定理2 假設(shè)正則條件(H1)~(H6)成立, 則θ的條件極大似然估計(jì)量具有漸近正態(tài)性, 且有
N(-θ)dN(0,I-1(θ))," N→∞.
證明: 根據(jù)文獻(xiàn)[25], 顯然滿足條件(H1)~(H4). 由k階相依驅(qū)動(dòng)隨機(jī)系數(shù)混合算子整數(shù)值自回歸模
型的定義知, 隨機(jī)項(xiàng)εt服從參數(shù)為λ的Poisson分布, 因此也滿足條件(H5). 下面只需證明滿足條件(H6), 從而只需證明下列結(jié)論成立:
1) Elog Pθαj2lt;∞;
2) Elog Pθφj2lt;∞;
3) Elog Pθpj2lt;∞, j=1,2,…,k;
4) Elog Pθλ2lt;∞;
5) Elog Pθαj·log Pθαqlt;∞, j≠q, j,q=1,2,…,k;
6) Elog Pθαj·log Pθφmlt;∞, j,m=1,2,…,k;
7) Elog Pθαj·log Pθpmlt;∞;
8) Elog Pθαj·log Pθλlt;∞;
9) Elog Pθφj·log Pθφqlt;∞;
10) Elog Pθφj·log Pθpmlt;∞;
11) Elog Pθφj·log Pθλlt;∞;
12) Elog Pθpj·log Pθpqlt;∞;
13) Elog Pθpj·log Pθλlt;∞.
首先證明結(jié)論1). 根據(jù)定理1和命題1, 可得Elog Pθαj2lt;C·E(X2k+1-j)lt;∞, 這里C是一個(gè)合適的常數(shù). 其次
證明結(jié)論2). 根據(jù)得分函數(shù)log Pθφj的表達(dá)式, 可
得Elog Pθφjlt;1
φjlt;∞, 從而Elog Pθφj2lt;∞. 再次, 對(duì)于
結(jié)論3), 根據(jù)得分函數(shù)log Pθpj的表達(dá)式, 有Elog Pθpjlt;C·E(
Xk+1-j)lt;∞, 因此Elog Pθpj2lt;C·EX2k+1-jlt;∞; 對(duì)于結(jié)論4), 根據(jù)條件(H5), 有l(wèi)og Pθλlt;φ1(Xk+1), 因此可得E
log Pθλ2lt;Eφ21(Xk+1)lt;∞. 最后, 基于結(jié)論1)~4)和條件(H5), 可得結(jié)論5)~13)成
立. 從而可定義Fisher信息矩陣I(θ), 同時(shí)根據(jù)條件(H6), 可得I(θ)是非奇異的. 證畢.
注1 當(dāng)新息序列{εt}的分布未知時(shí), 可令με=E(εt), σ2ε=Var(εt), 此時(shí)參數(shù)為θ=(α1,…,αk,
φ1,…,φk,p1,…,pk,με,σ2ε)′. 從而可采用文獻(xiàn)[26]中的修正擬似然估計(jì)法估計(jì)未知參數(shù), 基于修正擬似然估計(jì)量
θ重新獲得方差的估計(jì)量, 記為T-1(θ), 這里T(θ)的估計(jì)量為
(θ)=1n∑nt=k+1mt(θ)
mt(θ)′, 其中mt(θ)=(mt1(θ),…,mt,3k+2(θ))′,
mti(θ)=Xt-E(Xt|Xt-1,…,Xt-k)Varθ(XtXt-1
,…,Xt-k)·E(XtXt-1,…,Xt-k)θi," i=1,2,…,3k+2.
4 數(shù)值模擬
下面通過數(shù)值模擬評(píng)估條件極大似然估計(jì)量的小樣本性能. 考慮Po-DDRCMTINAR(2)模型. 采用估計(jì)量的有限樣本平均絕對(duì)偏差誤差(MADE)和均方誤差(MSE)進(jìn)行評(píng)價(jià), 其中
MADE=1M∑Mi=1-θ," MSE=1M
∑Mi=1(-θ)2,
這里表示θ的估計(jì)量, M表示重復(fù)模擬次數(shù). 考慮下列4組參數(shù)組合:
1) α1=0.3, α2=0.4, φ1=0.4, φ2=0.5, p1=0.45, p2=0.5, λ=0.3;
2) α1=0.3, α2=0.4, φ1=0.4, φ2=0.5, p1=0.45, p2=0.5, λ=0.5;
3) α1=α2=0.4, φ1=φ2=0.3, p1=0.45, p2=0.5, λ=0.3;
4) α1=α2=0.4, φ1=φ2=0.3, p1=p2=0.5, λ=0.5.
樣本容量的取值分別為n=100,300,500,800,1 000, 模擬實(shí)驗(yàn)重復(fù)500次. 圖1為樣本量n=100時(shí), Po-DDRCMTINAR(2)模型在4組參數(shù)下的路徑圖.
表1和表2列出了4組參數(shù)下該模型的條件極大似然估計(jì)結(jié)果. 由表1和表2可見, 隨著樣本量的增大, 絕對(duì)誤差和均方誤差都逐漸減小, 表明參數(shù)估計(jì)逐漸收斂到真實(shí)值.
本文對(duì)參數(shù)pi(i=1,2)是否為1進(jìn)行假設(shè)檢驗(yàn). 原假設(shè)H0: pi-1=0, 備擇假設(shè)H1: pi-1lt;0. 在參數(shù)組合1)下, 基于樣本量n=100,300,500,800,1 000和500次重復(fù)實(shí)驗(yàn), 計(jì)算檢驗(yàn)統(tǒng)計(jì)量t=i-1Var(i)的值. 參數(shù)p1相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量值分別為-1328 7,-2259 3,-3010 0,-3704 2,-4.273 9; 參數(shù)p2相應(yīng)的檢驗(yàn)統(tǒng)計(jì)量值分別為-1516 8,-2797 1,-3703 8,-4857 6,-5498 0. 當(dāng)顯著性水平α=0.05時(shí), 在小樣本n=100情況下, 參數(shù)pi(i=1,2)未通過顯著性檢驗(yàn), 即接受pi=1的假設(shè); 在其他樣本下參數(shù)pi(i=1,2)通過了顯著性檢驗(yàn), 即pi-1lt;0. 可見, 樣本量越大, 參數(shù)pi(i=1,2)統(tǒng)計(jì)量的值越小于臨界值, 參數(shù)pi-1lt;0可信度越高, 因此本文模型不會(huì)退化為Po-DDRCINAR(k)模型的可信度較高.
5 實(shí)例分析
考慮一組我國(guó)從2020年5月4日到2020年9月23日共143 d的全國(guó)新冠感染每日疑似病例數(shù)量. 數(shù)據(jù)變化范圍是0~18(http://www.nhc.gov.cn/wjw/xwdt/list_83.shtml). 該組數(shù)據(jù)的均值和方差分別是3.944 1和10.827 8. 圖2為該組數(shù)據(jù)的散點(diǎn)圖、 自相關(guān)(ACF)圖和偏自相關(guān)(PACF)圖. 由圖2, 本文考慮下列4種模型: Po-DDRCMTINAR(1),Po-DDRCMTINAR(2),Po-DDRCINAR(1)[10],Po-DDRCINAR(2)[10]. 表3列出了上述4種模型參數(shù)的極大似然估計(jì)和用于評(píng)價(jià)模型優(yōu)劣的AIC,BIC和HQ準(zhǔn)則[10]. 由表3可見, 本文提出的Po-DDRCMTINAR(1)模型分析該組數(shù)據(jù)的AIC,BIC和HQ值最小. 基于Po-DDRCMTINAR(1)模型, 圖3為擬合殘差的路徑圖、 直方圖、 ACF圖和PACF圖. 由圖3可見, 該模型的擬合殘差近似服從標(biāo)準(zhǔn)正態(tài)分布. 表明本文提出的一階Po-DDRCMTINAR(1)模型更適合分析該組數(shù)據(jù).
綜上, 本文提出了k階Poisson相依驅(qū)動(dòng)隨機(jī)系數(shù)混合算子整數(shù)值自回歸模型, 討論了該模型的統(tǒng)計(jì)性質(zhì)和參數(shù)的條件極大似然估計(jì), 證明了估計(jì)量的漸近正態(tài)性. 最后通過數(shù)值模擬和實(shí)例分析驗(yàn)證了模型的有效性.
參考文獻(xiàn)
[1] AL-OSH M A, ALZAID A A. First-Order Integer-Valued Autoregressive (INAR(1)) Process [J]. Journal of Time Series Analysis, 1987, 8(3): 261-275.
[2] BCKENHOLT U. An INAR(1) Negative Multinomial Regression Model for Longitudinal Count Data [J]. Psychometrika, 1999, 64(1): 53-67.
[3] KHOO W C, ONG S H, BISWAS A. Modeling Time Series of Counts with a New Class of INAR(1) Model [J]. Statistical Papers, 2017, 58(2): 393-416.
[4] DU J G, LI Y. The Integer-Valued Autoregressive (INAR(p)) Model [J]. Journal of Time Series Analysis, 1991, 12(2): 129-142.
[5] SILVA M E, OLIVEIRA V L. Difference Equations for the Hig
her Order Moments and Cumulants of the INAR(p) Model [J]. Journal of Time Series Analysis, 2005, 26(1): 17-36.
[6] ZHENG H T, BASAWA I, DATTA S. First-Order Random Coefficient Integer-Valued Autoregressive Pr
ocesses [J]. Journal of Statistical Planning and Inference, 2007, 137(1): 212-229.
[7] ZHENG H T, BASAWA I V. First-Order Observation-Driven Integer-Valued Autoregressive Processes [J]. Statistics and Probability Letters, 2008, 78(1): 1-9.
[8] BAKOUCH H S, MOHAMMADPOUR M, SHIROZHAN M. A Zero-Inflated Geometric INAR(1) Process with Random Coefficient [J]. Applications of Mathematics, 2018, 63(1): 79-105.
[9] ZHENG H T, BASAWA I V, DATTA S. Inference for pth-Order Random Coefficient Integer-Valued Autoregressive Processes [J]. Journal
of Time Series Analysis, 2006, 27(3): 411-440.
[10] LIU X F, WANG D H, DENG D L, et al. Maximum Likelih
ood Estimation of the DDRCINAR(p) Model [J]. Communications in Statistics: Theory and Methods, 2021, 50(24): 6231-6255.
[11] RISTIC' M M, NASTIC' A S, BAKOUCH H S.
Estimation in an Integer-Valued Autoregressive Process with Negative Binomial Marginals (NBINAR(1)) [J]. Communications in Statistics: Theory and Methods, 2012, 41(4): 606-618.
[12] RISTIC' M M, BAKOUCH H S, NASTIC' A S. A New Geometric First-Order Integer-Valued
Autoregressive (NGINAR(1)) Process [J]. Journal of Statistical Planning and Inference, 2009, 139(7): 2218-2226.
[13] TIAN S Q, WANG D H, CUI S. A Seasonal Geometric INAR Process Based on Negative Binomial Thinning Operator [J]. Statistical Papers, 2020, 61(6): 2561-2581.
[14] NASTIC' A S, RISTIC' M M, BAKOUCH H S. A Combined Geometric INAR(p) Model Based on
Negative Binomial Thinning [J]. Mathematical and Computer Modelling, 2012, 55(5/6): 1665-1672.
[15] LIU X F, ZHANG W K, YIN W Z, et al. Maximum Likelihood Estimation of the SDMINAR(p) Model to Analyze Some COVID-19
Data [J/OL]. Communications in Statistics: Simulation and Computation, (2022-11-04)[2023-11-25]. https://doi.org/10.1080/03610918.2022.2145486.
[16] YANG K, LI A, LI H, et al. High-Order Self-excited Threshold Integer-Valued Autore Gressive Model: Estimation and Testing [J
/OL]. Communications in Mathematics and Statistics, (2023-05-13)[2023-11-25]. https://doi.org/10.1007/s40304-022-00325-3.
[17] YANG K, WANG D H, JIA B T, et al. An Integer-Valued Threshold Autoregressive Process Based on Negative Binom
ial Thinning [J]. Statistical Papers, 2018, 59: 1131-1160.
[18] WANG X H, WANG D H, YANG K, et al. Estimation and Testing for the Integer-Valued Threshold Autoregressive Models Based on Negative
Binomial Thinning [J]. Communications in Statistics: Simulation and Computation, 2021, 50(6): 1622-1644.
[19] NASTIC' A S, RISTIC' M M, JANJIC' A D. A Mixed
Thinning Based Geometric INAR(1) Model [J]. Filomat, 2017, 31(13): 4009-4022.
[20] CHANG L Y, LIU X F, WANG D H, et al. First-Order Random Coefficient Mixed-Thinning Integer-Valued Autoregressive Model [J]. Jo
urnal of Computational and Applied Mathematics, 2022, 410: 114222-1-114222-24.
[21] LIU X F, WANG D H, CHEN H P, et al. A Class of kth-Order Dependence-Driven Random Coefficient Mixed Thinning Integer-Valued
Autoregressive Process to Analyse Epileptic Seizure Data and COVID-19 Data [J]. Australian and New Zealand Journal of Statistics, 2024, 66(2): 249-280.
[22] RISTIC' M M, NASTIC' A S. A Mixed INAR(p) Model [J]. Journal of T
ime Series Analysis, 2012, 33(6): 903-915.
[23] SHIRYAEV A N. Veroyatnost’ [M]. 2nd ed. Moscow:" Nauka, 1989: 441.
[24] BILLINGSLEY P. Statisrical Inference for Markov Processes [M]. Chicago: University of Chicago Press, 1961: 1-72.
[25] FRANKE J, SELIGMANN T. Conditional Maximum Likelihood Estimates for INAR(1) Processe
s and Their Application to Modelling Epileptic Seizure Counts [M]. Developments in Time Series Analysis. New York: Champman and Hall, 1993: 310-330.
[26] LI H, YANG K, WANG D H. Quasi-likelihood Inference
for Self-exciting Threshold Integer-Valued Autoregressive Processes [J]. Computational Statistics, 2017, 32(4): 1597-1620.
(責(zé)任編輯: 李 琦)