王文琦
摘 要:本文基于美國(guó)艾滋病醫(yī)療實(shí)驗(yàn)機(jī)構(gòu)ACTG的193A研究中的一組非平衡重復(fù)測(cè)量數(shù)據(jù)分別構(gòu)建了線性混合效應(yīng)模型和非線性混合效應(yīng)模型。對(duì)長(zhǎng)期觀測(cè)得到的、包含測(cè)量誤差、缺失值和刪失值的復(fù)雜艾滋病臨床治療非平衡縱向數(shù)據(jù)(如CD4,CD8,病毒載量等),實(shí)際工作者常用簡(jiǎn)單的線性混合效應(yīng)模型替代,從而導(dǎo)致推斷精度不能令人滿意。本文嘗試對(duì)一組艾滋病臨床治療中出現(xiàn)的非平衡縱向數(shù)據(jù)構(gòu)建非線性混合效應(yīng)模型,并與實(shí)踐常用的線性混合效應(yīng)模型進(jìn)行比較,希望為此類復(fù)雜縱向數(shù)據(jù)建模實(shí)踐提供有較好參考價(jià)值的建模程序和參考模型。
關(guān)鍵詞:線性混合效應(yīng)模型;非線性混合效應(yīng)模型;非平衡縱向數(shù)據(jù)
0 前言
對(duì)于非平衡縱向數(shù)據(jù)的分析,許多工作者一般都用簡(jiǎn)單的線性混合效應(yīng)模型進(jìn)行建模,但是非平衡縱向數(shù)據(jù)具有刪失值,并且大多數(shù)非平衡縱向數(shù)據(jù)是非線性,用簡(jiǎn)單的線性混合效應(yīng)模型對(duì)其進(jìn)行建模有一定誤差,從而導(dǎo)致推斷精度不能令人滿意。我們發(fā)現(xiàn)非線性混合效應(yīng)模型能更好地?cái)M合非平衡縱向數(shù)據(jù)。所以,本文嘗試對(duì)艾滋病臨床數(shù)據(jù)建立非線性混合效應(yīng)模型并與線性混合效應(yīng)模型進(jìn)行比較。
1 模型理論介紹
線性混合效應(yīng)模型:在一般的線性模型(線性回歸模型、方差分析模型、協(xié)方差分析模型等)中假定解釋變量固定,即對(duì)被解釋變量的影響是固定的,不會(huì)隨個(gè)體的變化而變化。但是在多數(shù)搜集數(shù)據(jù)或者進(jìn)行試驗(yàn)的過(guò)程中,我們不能嚴(yán)格控制解釋變量,解釋變量是從一個(gè)總體中隨機(jī)抽取的一個(gè)樣本,在這樣的情況下,就有必要加入隨機(jī)效應(yīng)發(fā)展成新的模型來(lái)更好地?cái)M合數(shù)據(jù),在線性模型中加入隨機(jī)效應(yīng)就得到了我們所說(shuō)的線性混合效應(yīng)模型。線性混合效應(yīng)模型的一般形式為:
這里的,假設(shè)是獨(dú)立的,是已知協(xié)變量的適當(dāng)矩陣,表示固定效應(yīng)的系數(shù)和表示特定個(gè)體的隨機(jī)效應(yīng)。一般來(lái)說(shuō),的列是的一個(gè)子集。響應(yīng)向量服從以下一個(gè)多元正態(tài)分布:
其中表示在一些已知的常數(shù)下第個(gè)個(gè)體的次觀測(cè)值。這里表示是個(gè)體數(shù),是個(gè)體的觀測(cè)數(shù)。組內(nèi)誤差()應(yīng)該是相互獨(dú)立的均值為零和未知方差為的高斯隨機(jī)變量。該模型是非線性的,因?yàn)間或h是關(guān)于的非線性函數(shù)。表示未知的種群參數(shù)向量。個(gè)體矩陣是已知的,向量也表示未知的種群參數(shù),它們不出現(xiàn)在隨機(jī)效應(yīng)中。我們假設(shè)和是相互獨(dú)立的。
2 模型的建立與分析
本文運(yùn)用線性混合效應(yīng)模型和非線性混合效應(yīng)模型擬合該組數(shù)據(jù)。根據(jù)線性混合效應(yīng)模型的基本假設(shè),數(shù)據(jù)被認(rèn)為服從正態(tài)分布,所以在具體擬合數(shù)據(jù)時(shí)要先進(jìn)行正態(tài)性檢驗(yàn)。如果檢驗(yàn)結(jié)果顯示數(shù)據(jù)不服從正態(tài)分布,則要對(duì)數(shù)據(jù)做變換使其近似服從正態(tài)分布。
對(duì)比兩個(gè)模型的擬合精度可以發(fā)現(xiàn),模型B優(yōu)于模型A,總體上非線性混合效應(yīng)模型比線性混合效應(yīng)模型擬合該組數(shù)據(jù)要好。
3 結(jié)語(yǔ)
本文用線性混合效應(yīng)模型和非線性混合效應(yīng)模型對(duì)艾滋病數(shù)據(jù)進(jìn)行分析,并對(duì)模型的擬合精度進(jìn)行了比較,發(fā)現(xiàn)非線性混合效應(yīng)模型優(yōu)于線性混合效應(yīng)模型。非線性混合效應(yīng)模型提高了艾滋病數(shù)據(jù)擬合的精度,得到了更為準(zhǔn)確的模型。所以,在實(shí)際的數(shù)據(jù)分析工作中我們要根據(jù)數(shù)據(jù)的特點(diǎn)來(lái)選擇最優(yōu)的模型。
參考文獻(xiàn):
[1]L.Wu, A joint model for nonlinear mixed-effffects models with censoring and covariates measured with error, with application to AIDS studies, J. Am. Stat. Assoc. 2002,97:955-964.
[2]L.Wu, Exact and approximate inferences for nonlinear mixed-effffects models with missing covariates, J. Am. Stat. Assoc. 2004,99 :700-709.
[3]A.Ding,H.Wu,Assessing antiviral potency of anti-HIV therapies in vivo by comparing viral decay rates in viral dynamic models, Biostatistics2001, 2:13-29.
[4]E. Kuhn, M. Lavielle, Maximum likelihood estimation in nonlinear mixed effffects models, Comput. Statist. Data Anal. 2005,49:1020-1038.