陸軍軍醫(yī)大學軍事預防醫(yī)學系軍隊衛(wèi)生統(tǒng)計學教研室 (400038)
湯 寧 宋秋月 易 東 伍亞舟△
縱向數據是每個研究個體在不同時間點上的觀測值集合,它廣泛產生于教育、經濟、醫(yī)藥、社會學等領域。在醫(yī)學領域,主要應用于心理學、公共衛(wèi)生、藥物動力學、臨床試驗等方面。但是如何處理和分析這些數據一直是一個重難點,醫(yī)學研究者在處理和分析過程中常常忽略掉縱向數據的一些特點以及特定方法的適用條件,從而導致研究結果產生一定的偏性,有時甚至得出相反的結論,這對醫(yī)學研究的可靠性有很大影響。因此,如何基于研究目的和資料類型,并結合模型適用條件和特點來選取適當的建模方法是本文將要闡述的內容。
醫(yī)學縱向數據具有以下幾個特征:(1)時間序列性:在沒有任何外部干預的情況下,重復測量的反應變量可能會隨時間的推移發(fā)生變化;(2)時間間隔非均衡性:不同單位測量的時間點可能不同,同一單位測量的時間間隔可能也不同;(3)自相關性:同一觀測單位的各測量之間存在自相關性,不同測量之間的相關系數不同,從而可以定義不同的相關矩陣;(4)變量類型復雜性:反應變量類型多樣,可以是連續(xù)型變量,也可以是離散型變量;(5)線性與非線性:反應變量隨自變量的變化趨勢可能是線性的,也可能是非線性的;(6)數據不完整性:實際調查研究中,各種原因造成的失訪,使得縱向數據完整性難以保證,故常常存在缺失;(7)非正態(tài)性:縱向數據變量多,維度高,數據分布較難呈正態(tài)性。
根據縱向數據的特點和分析目的,常見的縱向數據建模方法有:(1)研究總體平均水平差異,比較組間或不同時間點差異性的方法,如:重復測量方差分析、協方差分析等;(2)研究總體平均發(fā)展趨勢和個體平均發(fā)展趨勢的差異,處理非正態(tài)且自相關縱向數據的方法,如:廣義估計方程、廣義線性混合效應模型;(3)研究非線性增長趨勢差異分析的方法,如:非線性混合效應模型;(4)研究時間發(fā)展軌跡差異分析的方法,如:多層線性模型、潛變量增長曲線模型。
1.重復測量方差分析
重復測量方差分析(repeated measures analysis of variance,RM-ANOVA)是在方差分析基礎上將總方差分解為組內、組間的變異以及因子的交互作用和隨機誤差造成的變異。組內變異可理解為各測量時間點的變異,組間變異即是處理因素的作用[1]。
RM-ANOVA的優(yōu)點是簡單易理解,是早期用于縱向數據分析的重要方法,但統(tǒng)計學家也深知其存在諸多的缺點:(1)該方法對資料要求嚴格,它不僅要求數據具有獨立性、正態(tài)性和方差齊性等條件,還要求滿足“球形”(sphericity)假設;(2)此外,它還要求各觀測單位的測量時點相同且間隔相等;(3)RM-ANOVA忽略了相同單位各次測量之間存在的相關性,而不能揭示其內在特點;(4)它主要描述總體的平均增長趨勢而不關注個體增長曲線存在的差異以及原因[2];(5)對缺失值一般作刪除處理,這往往造成較大的信息損失。以上眾多的缺點都限制了RM-ANOVA在縱向數據分析中的廣泛應用。
RM-ANOVA的應用主要是比較測量指標總體平均水平在各處理因素之間和各時間點之間的差異。謝洋[3]等用其比較了三種不同治療方案在慢性阻塞性肺中的療效;任寧[4]等人利用該方法分析了農藥對大鼠體重的影響。
2.廣義線性混合模型
1972年,Nelder和Wedderburn[5]對正態(tài)線性模型進行了推廣,建立了廣義線性模型(generalized linear model,GLM)。GLM通過非線性連接函數連接反應變量和線性預測變量,只要響應變量的概率分布是指數分布族的一員,就可由此來處理等級資料、計數資料。指數分布族包括高斯分布、多項式分布、泊松分布、伽馬分布、貝塔分布和 Dirichlet 分布等,線性模型只是廣義線性模型的特例。
雖然廣義線性模型(general linear model,GLM)解決了反應變量非正態(tài)的問題,但是要求其獨立性[6],忽略了相關性。1982年,Laird和Ware提出線性混合模型(linear mixed model,LMM),它運用方差-協方差矩陣來反映反應變量的異方差性和相關性。廣義線性混合模型(generalized linear mixed model,GLMM)則是廣義線性模型(GLM)和線性混合模型(LMM)的擴展[7-8],它通過在模型中納入隨機效應來解釋數據間的相關、過度離散、異質性等問題[9]。GLMM 的基本模型為[10]:
Y=μ+ε
(1)
μ=g-1(η)=g-1(Xβ+Zγ)
(2)
其中,Y是n×1維觀測向量;μ是觀測的預測向量;g-1(·)是單調可微連接函數g(·)的逆函數;X為協變量矩陣;Z為隨機效應變量矩陣;β和γ分別是模型的固定效應和隨機效應參數向量,隨機效應γ假設服從均數為0和方差矩陣為G的正態(tài)分布[6]。GLMM通過多種R矩陣和G矩陣的方差-協方差結構,解釋同一觀察單位不同時間重復測量結果的相關性,擬合各種反應變量的縱向數據[11-12]。
LMM是通過在均值中加入隨機效應,實現了對一般線性模型的推廣,而GLMM則是通過在線性預測部分引入隨機效應推廣了廣義線性模型[13],隨機效應的引入反映了不同對象之間的異質性以及同一對象不同觀測之間的相關性。當隨機效應滿足正態(tài)分布時,反應變量可以是指數家族中的任意分布。
GLMM能夠很好地處理離散型和具有相關性的資料[9]。GLMM包含了隨機效應,研究結論能夠推廣到整個人群,該模型比較適用于藥物的臨床評價。羅天娥[14]等人利用GLMM分析了某臨床試驗中乳腺治療儀合用乳塊康貼治療乳腺增生的療效;王玲[9]還介紹了其在多中心中藥臨床試驗中的應用。
3.廣義估計方程
1986年,Liang和Zeger首次介紹廣義估計方程(generalized estimating equations,GEE),它是在廣義線性模型和擬似然方法的基礎上提出的一種專門分析非獨立縱向數據的方法。
GEE與GLM的框架結構類似,通過一個非線性連接函數來連接反應變量和預測變量,進而處理離散型資料;并且,其要求對受試者的重復測量值提供一個“作業(yè)相關矩陣”,由此來表達縱向數據的組內相關性[15]。“作業(yè)相關矩陣”是廣義估計方程中的一個重要概念,表示因變量的各次重復測量值兩兩之間相關性的大小,盡管個體之間的相關性可能不盡相同,但其近似地表示個體之間平均的相關。針對不同的數據特點可定義不同的協方差結構,常用的協方差結構包括獨立結構(independence)、無結構相關(unstructured)、復合對稱結構(compound symmetry)、一階自相關結構(autoregressive order 1)、Toeplitz相關結構等[16]。GEE的具體構造可參閱文獻[17]。
GEE的一個特性是只要連接函數正確,總觀測次數足夠大,即使“作業(yè)相關矩陣”指定不完全正確,參數的可信區(qū)間和模型的其他統(tǒng)計量仍然漸近正確[17]。因而“作業(yè)相關矩陣”的選擇對參數估計的影響不大。GEE主要的優(yōu)勢:①能有效處理縱向數據中結局變量的相關性,也能處理離散型資料;②它放寬了分布假設,只要求正確指定邊際均值、方差以及連接函數;③當相關矩陣結構選擇不當時也能得到參數及其方差的一致性估計值[18]。其缺點在于:①由于其沒有完全指定聯合分布,不存在似然函數,因此基于似然的方法不適用于測試擬合、比較模型和進行參數推斷;②在樣本量較小時,基于經驗的標準誤差會低估真實的誤差。
GEE通常用于流行病學研究,特別是多點隊列研究,因為它們可以處理多類結果之間無法測量的相關性。如Lyman[19]等人將GEE應用于棒球手投擲傷影響因素的隊列研究;GEE也可用于臨床試驗研究,如夏彥[20]探討了其在某抑吐藥物的多中心隨機對照臨床試驗中的應用。
4.非線性混合效應模型
傳統(tǒng)的統(tǒng)計分析方法一般要求數據滿足線性條件,即變量間參數呈線性關系,然而實際研究工作中常常存在著不滿足線性條件的重復測量數據,如藥物在人體內吸收、分布、代謝和排出過程中的濃度變化。Sheiner于1977年提出了非線性混合效應模型(nonlinear mixed effects models,NONMEM),亦稱為多水平非線性模型或非線性分層模型[21]。非線性混合效應模型可作如下表述[22]:
yij=f(xij,φi)+eij
(3)
φi=Aiβi+Bibi
(4)
其中,yij為第i個個體第j次測量預測值;f(·)為非線性函數,如果其為線性,則退化為線性混合效應模型[22];xij為P維預測變量向量;eij為獨立正態(tài)分布隨機誤差向量;β為P維固定效應參數;bi為隨機效應因子;Ai、Bi為已知的設計矩陣。
非線性混合效應模型考慮了不同層次上的變異,同時也考慮了參數間的非線性關系,允許固定效應和隨機效應進入模型的非線性部分[23]。模型引入隨機效應來解釋反應變量間的相關性,通過建立具有隨機截距或隨機斜率的混合效應模型處理反應變量是分類變量的重復測量資料[16]。相對于線性模型的正態(tài)性假設,非線性模型對資料的分布無特殊要求,資料可以是正態(tài)資料,也可以是服從二項分布、泊松分布等指數分布的資料[23]。
非線性資料是醫(yī)學研究中常見的一種資料形式,常用于藥代動力學和非線性生長曲線研究。陸基宗[24]等人通過建立非線性混合效應模型研究了肝癌患者5-氟尿嘧啶血藥濃度檢測與測定的改進方法;T Lu[25]探討了其在HIV病毒人體動力學中的應用;J Almquist[26]則將其應用于酵母轉錄抑制因子Mig1動力學行為的研究。
5.多層線性模型
多層線性模型(hierarchical linear modeling,HLM),也稱多水平線性模型(multilevel linear model)、混合效應模型(mixed-effects model)、隨機效應模型(random-effect model)等,在不同應用領域中名稱不同[27]。HLM主要是用于分析具有層次結構(嵌套結構)數據的一種統(tǒng)計技術。嵌套數據結構,如學生嵌套于班級,班級嵌套于學校這樣的分層結構,每層結構中的個體具有一定的相似性。其模型構造如下[28]:
Yij=β0i+β1iXij+εij
(5)
β0i表示截距,其含義是第i個觀測對象的平均數;β1i是斜率,表示第i個觀測對象的變化速率;Xij代表第i個觀測對象在第j個觀測點時自變量X的取值;εij代表殘差[28]。它的截距和斜率是隨機的,還受到某些其他變量的影響,將其作為因變量,建立兩個第二層回歸方程:
β0i=γ00+γ01W1i+μ0i
(6)
β1i=γ00+γ11W1i+μ1i
(7)
γ00表示截距,γ01和γ11分別表示預測變量W1i和W1i的斜率,μ0i和μ1i通過這個過程分別模擬了1級變量對結果的影響以及2級變量對結果的影響。為簡化模型,第二層方程中只包含了一個預測變量,如果存在多個自變量,也可以加入模型。
HLM主要的優(yōu)點:能對個體在時間上的變化進行估計,不僅考慮了不同測量水平之間的差異,還考慮了不同個體水平之間的差異,并探索造成這些差異的原因。HLM的局限:它仍然是研究由幾個變量預測一個變量的相對簡單的回歸結構,必須以正態(tài)性和線性為基礎,不能處理變量之間間接的影響關系以及復雜的觀測變量和潛變量之間的關系[29];其次,HLM需要大量的樣本量才能獲得足夠的檢驗效力。
HLM在醫(yī)學上主要運用于心理學方面的追蹤研究,如胡寧[30]等人將其用于家庭功能與青少年問題行為關系的追蹤研究;Raudenbush[31]等將其用于已婚夫婦心理變化的研究。HLM其實在醫(yī)學上也有更廣泛的應用,如Halkitis[32]用其分析HIV藥物依從性與患者及治療特性的關系;Gazdzinski[33]用其研究酒精依賴者清醒時腦結構和認知的變化。
6.潛變量增長模型
潛變量增長模型(latent growth modeling,LGM)是以結構方程模型(SEM)為基礎的一種對個體隨時間的變化進行建模,并評估共變量的影響和多個結果之間的關系的方法[34-35]。它通過定義截距和斜率作為潛在因子的驗證性因素分析模型來描述追蹤數據的變化特征[36-37]。LGM基本結構如下[38]:
如圖1所示,以三個時間點(結局變量的三次測量)為例介紹LGM,V1、V2、V3分別為三次重復測量值,E1、E2、E3為三個時間點的測量誤差,潛變量增長曲線模型中有兩個潛在變量,第一個為截距因子(intercept),第二個為斜率因子(slope)[38]。截距因子表示個體的基線狀態(tài),描述了第一次測量時總體均值(Mi)的估計和變異(Di);斜率因子描述了個體軌跡增長速率的均值(Ms)和變異(Ds)[38]。
Vt=intercept+(t-1)slope+Et,t=1,2,3
(8)
intercept=μintercept+ζ0
(9)
slope=μslope+ζ1
(10)
本例中V1=intercept+E1,V2=intercept+slope+E2,V3=intercept+2slope+E3。兩個因子為隨機變量,每個個體都有各自的截距和斜率,有各自的均數和方差。ζ0和ζ1為增長因子與其各自總體均數的偏差。
圖1 兩因子的潛變量增長曲線模型圖示
由于LGM是使用SEM方法進行的,因此它們在統(tǒng)計方法方面有許多相同的優(yōu)點和缺點。LGM的優(yōu)點主要是描述了單個個體的發(fā)展軌跡,并分析了這些軌跡中的個體差異,它能夠研究這些個體差異的預測因素,回答哪些變量對發(fā)展速度有重要影響的問題。其他優(yōu)勢包括:能夠檢驗假設增長形式的充分性,納入固定和時變協變量,糾正觀測指標中的測量誤差,同時納入幾個結構的增長,并從數據中發(fā)展出一個共同的發(fā)展軌跡,從而排除隊列效應等。盡管LGM有眾多優(yōu)點,但并不是適用于所有的情況,如不等的觀測間隔、隨機數據缺失、聚類設計合并等情況[39]。
LGM在醫(yī)學上主要運用于心理學研究,如劉俊升[40]等人用于研究童年中晚期孤獨感的發(fā)展軌跡等。近年來該方法也被應用于其他領域,Brecht[41]等人將其應用于海洛因、可卡因、大麻等多藥物使用時間軌跡的研究。
縱向數據的統(tǒng)計分析策略可以從反應變量類型、主要分析目的和模型方法特點等方面進行考慮。從變量類型來看,可以分為連續(xù)型變量(定量變量)和離散型變量(類別變量)。當反應變量為連續(xù)型變量,服從正態(tài)分布又滿足線性條件時,理論上以上方法都可使用,但如果研究目的僅僅是想比較各組別總體平均水平的差異則建議采用重復測量方差分析,簡單方便。而廣義估計方程和廣義線性混合模型主要用于分析類別變量資料,他們都考慮了資料的相關性,并能較好的處理缺失值和非平衡數據。非線性混合模型則主要用于定量非線性資料的處理,多見于藥物動力學研究。多層線性模型和潛變量增長模型則多用于描述個體發(fā)展軌跡的差異及其影響因素,多應用于心理學和流行病學研究。
表1 常用縱向數據分析模型方法的特點
本文從醫(yī)學縱向研究的角度出發(fā),列舉了重復測量方差分析、廣義估計方程、廣義線性混合模型、非線性混合模型、多層線性模型、潛變量增長模型等幾種常用的統(tǒng)計分析方法,分析其各自的優(yōu)點以及缺點,并針對不同資料類型和研究目的提出了統(tǒng)計分析的策略。
近年來,縱向數據統(tǒng)計分析方法得到了長足的發(fā)展,其部分原因要得益于計算機統(tǒng)計軟件的發(fā)展,統(tǒng)計軟件的出現也使得數據的分析變得更為便捷簡單,但就是這種照葫蘆畫瓢的方式使得研究者們往往忽略了統(tǒng)計分析其背后的原理和假設條件,帶來的后果則是直接降低了研究結論的可靠性。因此,研究者應充分了解各類方法的優(yōu)缺點和適用條件,這是為研究數據選擇適當統(tǒng)計分析模型的必要條件。