劉廣會(huì) 孫蝶
摘 要:基于半?yún)?shù)模型的特點(diǎn),結(jié)合縱向數(shù)據(jù)的基本特征,建立縱向數(shù)據(jù)下半?yún)?shù)指數(shù)回歸模型,并利用極大似然估計(jì)方法對(duì)該模型的參數(shù)進(jìn)行估計(jì),討論模型的Fisher信息矩陣,在此基礎(chǔ)上給出似然方程的Newton-Raphson迭代求解過程。
關(guān)鍵詞:縱向數(shù)據(jù);半?yún)?shù)指數(shù)回歸模型;極大似然估計(jì);Newton-Raphson迭代
一、模型引言
縱向數(shù)據(jù)是指對(duì)一組個(gè)體按照不同的時(shí)間或者空間順序重復(fù)觀察而得到的數(shù)據(jù)[1-2]。縱向數(shù)據(jù)最大的特點(diǎn)就是組內(nèi)數(shù)據(jù)相關(guān)而組間數(shù)據(jù)是獨(dú)立的。近年來,在生物統(tǒng)計(jì),醫(yī)學(xué)、經(jīng)濟(jì)學(xué)中對(duì)總線數(shù)據(jù)的下各種模型的研究引起國(guó)內(nèi)外廣大學(xué)者的追捧??v向數(shù)據(jù)主要是為了分析響應(yīng)變量與相關(guān)協(xié)變量之間的變化影響關(guān)系,并且經(jīng)常適用回歸分析的研究方法進(jìn)行研究。常用的回歸模型有參數(shù)模型E(y)=α+βx、非參數(shù)模型E(y)=α+f (x)、半?yún)?shù)模型E(y)=α+βx1+f (x2)等[3]。參數(shù)模型、非參數(shù)模型的縱向數(shù)據(jù)研究較為成熟。本文建立縱向數(shù)據(jù)下半?yún)?shù)指數(shù)分布回歸模型,并對(duì)模型中的參數(shù)進(jìn)行估計(jì)。
縱向數(shù)據(jù)半?yún)?shù)指數(shù)回歸模型
,,
其中是已知設(shè)計(jì)的點(diǎn)列,表示為第個(gè)個(gè)體在時(shí)刻相應(yīng)的個(gè)協(xié)變量的觀測(cè)值組成的向量,表示觀測(cè)的時(shí)間。是維未知回歸參數(shù)向量,是定義在區(qū)間上的光滑的未知函數(shù)。,,當(dāng)時(shí),與相互獨(dú)立。表示反應(yīng)變量在第個(gè)個(gè)體第次的觀測(cè)響應(yīng)值。
本文基于縱向數(shù)據(jù)建立指數(shù)回歸模型[4-6]
其中,的概率密度函數(shù)為
二、模型參數(shù)估計(jì)
應(yīng)用一般的線性回歸模型中的參數(shù)的估計(jì)方法,利用觀測(cè)到的數(shù)據(jù)得到模型中的未知參數(shù)和光滑未知函數(shù)估計(jì)表達(dá)式。這里的函數(shù)是關(guān)于時(shí)間的函數(shù)。
通常函數(shù)的逼近可以用表達(dá)式做近似代替。即設(shè)
,
其中 是基函數(shù)向量。
設(shè)對(duì)變量,
則有相應(yīng)的指數(shù)回歸模型為
,
其中,,為未知參數(shù)。
則的對(duì)數(shù)似然函數(shù)為
令
則有
故對(duì)求偏導(dǎo)數(shù)有
令
即
則得到未知參數(shù)的估計(jì)值為 ,但由于的估計(jì)值是非線性的方程組,因此用迭代方法求解。
三、信息矩陣
定義:設(shè)為正則分布族,。
記
定義
稱為分布族的信息陣。
建立在相關(guān)理論的基礎(chǔ)上,對(duì)對(duì)數(shù)似然函數(shù)求二階偏導(dǎo)數(shù),并計(jì)算的信息矩陣及其估計(jì)式
參數(shù)的信息矩陣是個(gè)二階偏導(dǎo)數(shù)所組成的方陣的負(fù)矩陣的期望,并記為。信息陣中每個(gè)元素與隨機(jī)變量的觀測(cè)值無關(guān)[7]。故
根據(jù)計(jì)算最大似然估計(jì)的基本理論,獲得的最大似然估計(jì)值的協(xié)方差矩陣為
并求得的最大似然估計(jì),帶入,從而得的估計(jì)值為
四、指數(shù)回歸模型的參數(shù)最大似然方程的迭代求解
迭代法的基本思路
設(shè)是關(guān)于參數(shù)的元函數(shù),要求出,使得
令
設(shè)為第次迭代所得的參數(shù)的值,帶入到和可以計(jì)算出和的值。在處將函數(shù)按照元函數(shù)的公式展開,展至二次項(xiàng)為即可,有
令
可以解出為,該式就是求解迭代法的一般公式[8]。
基于迭代方法的思路提出指數(shù)回歸模型的參數(shù)估計(jì)基本步驟:
作為對(duì)數(shù)似然函數(shù)的目標(biāo)函數(shù),即
此時(shí)令
由此可以得到指數(shù)模型的參數(shù)的最大似然估計(jì)的迭代式為
因此指數(shù)模型的參數(shù)的最大似然估計(jì)的迭代的計(jì)算步驟如下:
第一步:給定初始值,計(jì)算,并計(jì)算和。
第二步:將,和代入,求得。
第三步:由計(jì)算出,并計(jì)算出和,并將所獲得的,和值代入,求得。
第四步:重復(fù)第三步驟,當(dāng)達(dá)到時(shí),設(shè)定的誤差限,有
通過這種方法便可以獲得的最大似然估計(jì)。
參考文獻(xiàn)
[1] 田瑞琴.縱向數(shù)據(jù)下半?yún)?shù)回歸模型的統(tǒng)計(jì)推斷[D].北京:北京工業(yè)大學(xué),2014:168.
[2] 毛新娜.縱向數(shù)據(jù)的半?yún)?shù)回歸模型的研究[D].武漢:武漢理工大學(xué),2005:56.
[3] 閆莉.復(fù)雜數(shù)據(jù)下兩類回歸模型的統(tǒng)計(jì)推斷[M].北京:科學(xué)出版社,2016:235.
[4] 魏強(qiáng)強(qiáng),魏立力.半?yún)?shù)縱向數(shù)據(jù)的Logistic模型[J].四川理工學(xué)院學(xué)報(bào):自然科學(xué)版,2008,21(2):8-11.
[5] 張登峰.縱向數(shù)據(jù)半?yún)?shù)Possion回歸模型[J].廣西民族大學(xué)學(xué)報(bào):自然科學(xué)版,2013,19(4):52-54.
[6] 吳楠楠,袁永生,趙佩佩.縱向數(shù)據(jù)半?yún)?shù)混合效應(yīng)的Logistic模型[J].云南民族大學(xué)學(xué)報(bào):自然科學(xué)版,2016,25(3):234-239.
[7] 范金城,吳可法.統(tǒng)計(jì)推斷導(dǎo)引[M].北京:科學(xué)出版社,2001:308.
[8] 雷金貴,陳文兵.一類解非線性方程的Newton型迭代法[J].南京信息工程大學(xué)學(xué)報(bào):自然科學(xué)版,2009,1(4):377-378.