張菊芳 張小薇
摘要討論了線性混合隨機(jī)效應(yīng)模型在糖尿病臨床試驗(yàn)重復(fù)觀測(cè)數(shù)據(jù)中的應(yīng)用,在病人初始入組時(shí),采用不同治療方案得到重復(fù)觀測(cè)的血糖數(shù)據(jù),根據(jù)數(shù)據(jù)的圖示以及它們具有相關(guān)性的特點(diǎn),采用線性混合隨機(jī)效應(yīng)模型擬合數(shù)據(jù),通過(guò)參數(shù)和標(biāo)準(zhǔn)誤差的估計(jì)構(gòu)造檢驗(yàn)統(tǒng)計(jì)量,對(duì)臨床療效進(jìn)行評(píng)價(jià),并給出一種能較客觀地評(píng)價(jià)臨床療效的方法。
關(guān)鍵詞測(cè)量數(shù)據(jù);線性混合隨機(jī)效應(yīng)模型;評(píng)價(jià)
中圖分類(lèi)號(hào)O242文獻(xiàn)標(biāo)識(shí)碼A文章編號(hào) 1007-5739(2009)14-0330-02
1研究背景——臨床試驗(yàn)中的問(wèn)題
為了比較方案1和方案2 2種治療方案對(duì)糖尿病人的臨床療效水平,呂梁某醫(yī)院將171名糖尿病患者分成2組,一組104名患者,另一組67名患者,對(duì)這2組病人分別采用方案1和方案2治療。對(duì)每個(gè)患者分別在入組之前、入組之后1周、2周,測(cè)量患者的血糖值,3個(gè)時(shí)間點(diǎn)分別記為0、1、2,可得這2組的觀測(cè)數(shù)據(jù)分別為312個(gè)和201個(gè),具體見(jiàn)表1。
2種方案病人血糖值分布特點(diǎn)如圖1~2所示。對(duì)不同方案的觀測(cè)數(shù)據(jù)在不同時(shí)間點(diǎn)分別求平均值之后得到2種方案觀測(cè)平均值圖,如圖3所示。
從圖中可以看出,無(wú)論采用哪種治療方案,病人的平均血糖呈線性降低趨勢(shì),采用方案2的病人初始入組的平均血糖水平較高,然而直線的變化斜率大,需要做統(tǒng)計(jì)分析,以給出統(tǒng)計(jì)意義上2種臨床治療方案的療效是否顯著的結(jié)論。由于研究得到的觀測(cè)數(shù)據(jù)為重復(fù)觀測(cè)量數(shù)據(jù),其一般不滿足獨(dú)立性的要求,常用的統(tǒng)計(jì)方法,如t檢驗(yàn)、方差分析、一般線性模型等,不能揭示出其內(nèi)在特點(diǎn),勉強(qiáng)用之,甚至?xí)斐稍S多偏倚。
2線性混合效應(yīng)模型
混合效應(yīng)模型是研究非獨(dú)立數(shù)據(jù)常用的統(tǒng)計(jì)學(xué)模型之一,根據(jù)圖3采用線性混合隨機(jī)效應(yīng)模型擬合數(shù)據(jù)。線性混合效應(yīng)模型:
分別是對(duì)應(yīng)于p維固定效應(yīng)β和q維隨機(jī)效應(yīng)bi的ni×p和ni×q的矩陣。通常假定bi服從均值為零、方差為Di的正態(tài)分布,且對(duì)不同個(gè)體i,Di相同。假定εi=(εi1,L,ε■)τ是獨(dú)立的,服從均值為零、方差為σ2的正態(tài)分布,且εi和bi獨(dú)立。對(duì)于本文中研究的數(shù)據(jù),采用模型(1)擬合數(shù)據(jù),此時(shí)i=1,2;j=1,L,ni;n1=201,n2=312。Xij=(1,Groupi,Timeij,Groupi×Timeij);β=(β0,β1,β2,β3)′;bi=(bi0,bi1)′;Zij=(1,Timeij),其中,Group1=0,Group2=1分別對(duì)應(yīng)治療方案1和方案2。
根據(jù)上述線性混合效應(yīng)模型,由于E(Yij│Groupi=0,Timeij=0)=β0+β1Groupi+β2Timeij+β3Groupi×Timeij=β0;
E(Yij│Groupi=1,Timeij=0)=β0+β1Groupi+β2Timeij+β3Groupi×Timeij=β0+β1;
E(Yij│Groupi=0)=β0+β1Groupi+β2Timeij+β3Groupi×Timeij=β0+β2Timeij;
E(Yij│Groupi=1)=β0+β1Groupi+β2Timeij+β3Groupi×Timeij=(β0+β1)+(β2+β3)Timeij;
不難給出參數(shù)β=(β0,β1,β2,β3)′表示的含義,即:β0=在觀測(cè)初始點(diǎn)(0)方案2病人血糖的平均值;β1=在觀測(cè)初始點(diǎn)(0)方案1病人血糖的平均值-在在觀測(cè)初始點(diǎn)(0)方案2病人血糖的平均值;β2=方案2病人血糖變化的平均斜率;β3=方案1病人血糖變化的平均斜率-方案2病人血糖變化的平均斜率。
對(duì)線性混合隨機(jī)效應(yīng)模型中的參數(shù)估計(jì),文獻(xiàn)中關(guān)于它的研究已經(jīng)很多,這里只簡(jiǎn)單介紹2種估計(jì)的方法,令Z=(Z■■,Z■■)τ,b=(b■■,b■■)τ,D=diag(D1,D2),V=Cov(Zb+ε)=ZDZ′+σ2I,估計(jì)方法1:■=(X′V-1X)-1X′V-1Y;方法2:■=(X′X)-1X′Y,對(duì)于上述2類(lèi)估計(jì)方法,方法(1)是參數(shù)的最好線性無(wú)偏估計(jì),但是表達(dá)式中V包含有未知參數(shù),這些參數(shù)如果用極大似然估計(jì),必須通過(guò)迭代的方法,沒(méi)有顯示的估計(jì)表達(dá)式。相反,方法(2)避免了對(duì)方差V的未知參數(shù)的估計(jì),且是參數(shù)的無(wú)偏估計(jì)。
3實(shí)例分析
根據(jù)對(duì)線性混合效應(yīng)模型參數(shù)的解釋,本文研究對(duì)2種治療方案的療效評(píng)價(jià)問(wèn)題,即:H0:方案1與方案2治療的療效相同;H1:方案1與方案2治療的療效不同;可以轉(zhuǎn)化成對(duì)參數(shù)β1和β3的檢驗(yàn)問(wèn)題,即:H0:β1≥0與H1:β1<0;H0:β3≥0與H1:β3<0。對(duì)上述2個(gè)假設(shè)檢驗(yàn)問(wèn)題,通常采用的統(tǒng)計(jì)量為■1/■;■3/■。統(tǒng)計(jì)量在原假設(shè)下漸進(jìn)服從t分布。實(shí)際上,對(duì)于線性混合效應(yīng)模型參數(shù)的估計(jì)和檢驗(yàn)問(wèn)題,在R語(yǔ)言和SAS語(yǔ)言中已經(jīng)有現(xiàn)成的算法可以直接用,不需要自己編程實(shí)現(xiàn)。通過(guò)調(diào)用R語(yǔ)言的NLME命令,可得結(jié)果見(jiàn)表2。可以看出,2個(gè)檢驗(yàn)都拒絕原假設(shè)H0,也就是說(shuō)不僅病人入組時(shí)2組的平均血糖值有差異;而且對(duì)于不同組,經(jīng)過(guò)2周治療之后血糖的平均變化也有顯著差異。因此,治療方案1的臨床療效要好。
4參考文獻(xiàn)
[1] 黃坤,倪宗瓚,程薇波.混合線性模型在臨床試驗(yàn)中重復(fù)測(cè)量資料的應(yīng)用[J].現(xiàn)代預(yù)防醫(yī)學(xué),2005,32(11):1584-1585.
[2] 王小丹,高允鎖,郭敏.混合線性模型在臨床試驗(yàn)中的應(yīng)用[J].中國(guó)熱帶醫(yī)學(xué),2007,7(8):1475-1476.
[3] 趙晉芳,劉桂芬.重復(fù)測(cè)量線性混合模型中方差2協(xié)方差結(jié)構(gòu)的選擇[J].現(xiàn)代預(yù)防醫(yī)學(xué),2004,31(1):11-12.