劉媛媛 ,李長平 ,2,胡良平
(1.天津醫(yī)科大學(xué)公共衛(wèi)生學(xué)院,天津 300070;2.世界中醫(yī)藥學(xué)會聯(lián)合會臨床科研統(tǒng)計學(xué)專業(yè)委員會,北京 100029;3.軍事科學(xué)院研究生院,北京 100850
在醫(yī)學(xué)隨訪研究中,有時觀察結(jié)果并非在短期內(nèi)能夠出現(xiàn),而需要長期隨訪觀察,即采用追蹤隨訪(follow up)的方式來研究事物發(fā)展和變化的規(guī)律,如了解某藥物的長期療效、手術(shù)后的存活時間、惡性腫瘤手術(shù)后復(fù)發(fā)時間等,這類資料屬于隨訪資料[1]。由于隨訪資料的分析最初起源于對壽命長短的估計和預(yù)測,故稱為生存分析或生存時間分析。評價某種療法對疾病的效果時,研究者不僅需要觀察是否出現(xiàn)了其感興趣的終點事件(terminal event),還要考慮達(dá)到終點所經(jīng)歷的時間長短。因此,生存分析(survival analysis)是一種將是否出現(xiàn)終點事件與達(dá)到終點所經(jīng)歷的時間結(jié)合起來進(jìn)行分析的統(tǒng)計分析方法[2],已廣泛應(yīng)用于醫(yī)學(xué)研究領(lǐng)域,如現(xiàn)場追蹤研究、臨床療效與安全性評價研究、疾病預(yù)后分析等,生存時間的涵義也隨之拓展到更廣的范圍,又稱為時間-效應(yīng)分析(time-effect analysis)。與其他統(tǒng)計分析方法一樣,生存分析方法和理論的使用范圍較廣,不僅應(yīng)用于生物、醫(yī)學(xué)、衛(wèi)生、防疫和檢驗等領(lǐng)域,還可應(yīng)用于工程科學(xué)、社會學(xué)、心理學(xué)、經(jīng)濟(jì)學(xué)、保險精算學(xué)等。因此,本文將對生存資料相關(guān)概念及其常用統(tǒng)計分析方法進(jìn)行介紹。
生存分析主要研究的內(nèi)容如下。①描述(估計):即根據(jù)生存數(shù)據(jù)估計其所來自的總體的生存函數(shù)、風(fēng)險函數(shù)、概率密度函數(shù)以及由此而決定的其他相關(guān)指標(biāo)(如中位生存期等),繪制生存曲線;②比較:即比較不同處理組生存數(shù)據(jù)的相應(yīng)指標(biāo)之間的差別是否具有統(tǒng)計學(xué)意義,最常見的效應(yīng)指標(biāo)是生存函數(shù)和風(fēng)險函數(shù);③影響因素分析:其目的是研究影響生存時間長短的因素,或在排除一些因素影響的情況下研究某個或某些因素對生存函數(shù)或風(fēng)險函數(shù)等的影響;④預(yù)測:對具有不同因素水平個體的生存時間進(jìn)行估計或預(yù)測[3]。
1.2.1 生存時間和終點事件
生存時間(survival time)可以廣泛地定義為從規(guī)定的觀察起點到某一給定終點事件出現(xiàn)的時間。例如,一組精神疾病患者經(jīng)過治療出院后,記錄他們在未來一個時期內(nèi)各自出現(xiàn)復(fù)發(fā)的時間[4]。終點事件是研究者關(guān)注的事件,可以是某種疾病的發(fā)生、某種處理(治療)的反應(yīng)、病情復(fù)發(fā)或患者死亡等。
1.2.1.1 生存時間數(shù)據(jù)的分類
在臨床研究中,研究時間一般是固定的,而患者是逐個進(jìn)入試驗,所以,根據(jù)觀察結(jié)束時是否觀察到終點事件,可將生存數(shù)據(jù)分為完全數(shù)據(jù)(complete data)和截尾數(shù)據(jù)(censored data)[5]。在隨訪研究的過程中,對某些觀察對象已經(jīng)觀察到終點事件的發(fā)生,則稱其為生存時間的完全數(shù)據(jù),用t表示;在隨訪研究的過程中,若在觀察期內(nèi)由于某種原因?qū)δ承┯^察對象未能觀察到終點事件(例如在臨床療效研究中,患者因車禍等意外死亡,不屬于臨床療效的終點),不知道其確切的生存時間,則稱其為生存時間的截尾數(shù)據(jù)或刪失數(shù)據(jù),用t+表示。產(chǎn)生截尾數(shù)據(jù)的原因大致如下:①失訪;②至隨訪研究結(jié)束時結(jié)局仍未發(fā)生;③研究對象死于其他原因或出現(xiàn)嚴(yán)重藥物反應(yīng)而終止試驗或觀察。截尾生存時間的計算均為規(guī)定的起點至截尾點所經(jīng)歷的時間。
由于刪失產(chǎn)生的原因不同,刪失數(shù)據(jù)的類型也不同,主要有左刪失、右刪失和區(qū)間刪失數(shù)據(jù)等類型。①左刪失(left-censored):假設(shè)研究對象在某一時刻開始進(jìn)入研究接受觀察,在該時間點之前,研究者感興趣的事件已經(jīng)發(fā)生,但無法明確其具體時間,這種類型即為左刪失數(shù)據(jù);②右刪失(rightcensored):在進(jìn)行隨訪觀察中,對研究對象觀察的起始時間已知,但終點事件發(fā)生的時間未知,無法獲取具體的生存時間,只知道生存時間大于觀察到的時間,這種類型的生存時間稱為右刪失;③區(qū)間刪失(interval-censored):在實際的研究中,如果不能夠進(jìn)行連續(xù)的觀察隨訪,只能預(yù)先設(shè)定觀察時間點,研究人員僅能知道每個研究對象在隨訪區(qū)間內(nèi)是否發(fā)生終點事件,而不知道準(zhǔn)確的發(fā)生時間,這種刪失類型稱為區(qū)間刪失。
右刪失數(shù)據(jù)又可以分為I、II和III型。I型右刪失:從同一起點開始觀察到某規(guī)定時間結(jié)束觀察時,除了已經(jīng)發(fā)生終點事件的研究對象外,其余研究對象的觀察時間統(tǒng)一截止到某一固定時間點,這種刪失類型即為I型刪失。I型刪失的刪失時間是固定的,故又稱為定時刪失。I型刪失不允許個體在研究的過程中退出。II型右刪失:從同一起點開始觀察到有一定數(shù)量的個體發(fā)生給定的事件,即在研究的過程中,一直隨訪觀察到有足夠數(shù)量的終點事件發(fā)生為止,此時研究停止,未發(fā)生終點事件的研究對象的生存時間未知,這種刪失類型即為II型刪失,又稱為定數(shù)刪失。II型刪失可以理解為刪失比例是事先已經(jīng)設(shè)定的。III型右刪失:在實際的研究過程中,往往研究期是固定的,并且研究對象在此研究期的不同時間進(jìn)入研究,即觀察起始時間不同。同時,在研究結(jié)束前,有些研究對象已經(jīng)發(fā)生終點事件,可以記錄其準(zhǔn)確的生存時間,但也有些研究對象中途退出研究,或者在研究結(jié)束時仍未發(fā)生終點事件,他們的生存時間無法確定。這種觀察起始時間和刪失時間均不相同的類型,稱為III型右刪失,也是臨床研究中最為常見的類型。由于刪失數(shù)據(jù)往往是隨機(jī)發(fā)生的,因此,III型右刪失也稱為隨機(jī)刪失。上述三種刪失都是右刪失,即其精確值未知,只知其大于或等于刪失時間。
按觀察次數(shù)分類,區(qū)間刪失數(shù)據(jù)可分為I和II型。I型區(qū)間刪失又稱現(xiàn)況數(shù)據(jù),指觀察次數(shù)為1次,僅知道準(zhǔn)確時間小于或大于觀察時間,常發(fā)生在橫斷面研究和非致死性腫瘤致瘤性試驗中[6]。II型區(qū)間刪失,指觀察次數(shù)為2次,所得觀測數(shù)據(jù)中至少包括一個區(qū)間,觀察時間點為相互獨立的確定時間,主要發(fā)生在需要定期隨訪觀察的研究中。
1.2.1.2 生存資料的特點
生存資料具有以下特點:①同時具有生存結(jié)局和生存時間;②生存時間可能含有刪失數(shù)據(jù)或截尾數(shù)據(jù);③生存時間的分布通常不服從正態(tài)分布,生存時間常呈指數(shù)分布、Weibull分布、對數(shù)正態(tài)分布等;④影響生存時間的因素較復(fù)雜且不易控制。
1.2.2 死亡概率
死亡概率(probability of death)用q表示,指某時段開始時存活的個體在該時段內(nèi)死亡的可能性。如一年死亡概率表示年初尚存活的人口在今后一年內(nèi)死亡的可能性,公式見式(1):
1.2.3 生存概率和生存率
生存概率(survival probability)用p表示,指某單位時段開始時存活的個體到該時段結(jié)束時仍存活的可能性。如一年生存概率表示該年年初尚存活的人口存活滿一年的可能性,p=1-q,公式見式(2):
生存率(survival rate)又稱生存函數(shù)(survival function),表示觀察對象的生存時間T大于某時刻t的概率,以S(t)表示。生存率通常隨時間逐漸下降,即0≤S(t)≤1。
若無截尾數(shù)據(jù),生存率計算公式見式(3):
若有截尾數(shù)據(jù),需要分段計算生存概率,假定觀察對象在各個時段的生存事件獨立,根據(jù)概率乘法運算法則計算生存率,公式見式(4)。為各時段的生存概率。
1.2.4 生存曲線與中位生存期
生存曲線(survival curve)是以觀察(隨訪)時間為橫軸,以生存率為縱軸,將各個時間點所對應(yīng)的生存率連接在一起的曲線圖。生存曲線是一條下降的曲線,生存曲線平緩,表示生存率高或生存時間較長;生存曲線陡峭,表示生存率低或生存時間較短。
中位生存期(median survival time)又稱半數(shù)生存期,即恰好有50%的個體尚存活的時間。生存曲線縱軸生存率為50%時所對應(yīng)的橫軸生存時間即為中位生存期,反映生存時間的平均水平。中位生存期越長,表示疾病的預(yù)后越好;中位生存期越短,表示疾病的預(yù)后越差。
1.2.5 風(fēng)險函數(shù)
風(fēng)險函數(shù)(hazard function)又稱危險率函數(shù),表示生存時間已達(dá)t的觀察對象在t到t+Δt時間區(qū)間內(nèi)死亡概率的極限,即生存時間已達(dá)t的個體在t時刻的瞬時死亡率,公式見式(5):
1.2.6 概率密度函數(shù)
概率密度函數(shù)(probability density function)表示一個體死于(t,t+ Δt)小區(qū)間的概率極限,即t時刻的瞬時死亡率,公式見式(6):
根據(jù)生存資料和統(tǒng)計模型的特點進(jìn)行分類,常用的生存分析方法主要包括描述法、參數(shù)法、半?yún)?shù)法和非參數(shù)法;根據(jù)生存資料統(tǒng)計分析的主要內(nèi)容進(jìn)行分類,常用的生存分析方法主要包括生存資料的統(tǒng)計描述、生存曲線的比較和生存資料的回歸分析。
2.1.1 描述法
根據(jù)樣本觀測值提供的信息,直接用公式計算出每一個時間點或時間區(qū)間上的生存函數(shù)、死亡函數(shù)、風(fēng)險函數(shù)等,并采用列表或繪圖的方式顯示生存時間的分布規(guī)律。描述法的優(yōu)點:方法簡單且對數(shù)據(jù)分布無要求;缺點:不能對兩組或多組生存時間資料所對應(yīng)的分布函數(shù)進(jìn)行假設(shè)檢驗,不能分析影響因素,不能建立生存時間與影響因素之間依賴關(guān)系的回歸模型。
2.1.2 參數(shù)法
根據(jù)樣本觀測值來估計假定的分布模型中的參數(shù),獲得生存時間的概率分布模型、生存函數(shù)和/或危險率函數(shù)的估計值。生存時間經(jīng)常服從的分布有指數(shù)分布、Weibull分布、對數(shù)正態(tài)分布、對數(shù)Logistic分布、Gamma分布等。參數(shù)法的優(yōu)點:可以估計生存函數(shù)和/或危險率函數(shù),可以對兩個或多個生存分布函數(shù)進(jìn)行假設(shè)檢驗,可以分析各因素對生存時間的影響,可以建立生存時間與影響因素之間依賴關(guān)系的回歸模型;缺點:需要事先知道生存時間的分布類型。
2.1.3 半?yún)?shù)法
不需要對生存時間的分布做出假定,卻可以通過一個回歸模型來顯示生存時間的變化規(guī)律以及各因素對生存時間的影響,常用的模型包括Cox比例風(fēng)險回歸模型等。相較而言,半?yún)?shù)方法比參數(shù)方法靈活,比非參數(shù)方法更易于解釋分析結(jié)果。半?yún)?shù)法的優(yōu)點:可以估計生存函數(shù)和/或風(fēng)險函數(shù),可以對兩個或多個生存分布函數(shù)進(jìn)行假設(shè)檢驗,可以分析影響因素對生存時間的影響,可以建立生存時間與影響因素之間依賴關(guān)系的回歸模型,不需要事先知道生存時間的分布;缺點:不便于對高維、強(qiáng)相關(guān)數(shù)據(jù)進(jìn)行有效的處理。
2.1.4 非參數(shù)法
隨訪資料生存曲線的估計方法有參數(shù)法和非參數(shù)法,對于服從特定概率分布的生存資料,參數(shù)法更準(zhǔn)確;但大多數(shù)生存資料的分布不規(guī)則、不確定或未知,故常需選用非參數(shù)法。常用的方法包括Kaplan-Meier(卡普蘭-邁耶)估計法和Life table(壽命表)估計法,另外,還有Lynden-Bell(林登-貝爾)估計法和Turnbull(特恩布爾)估計法[7]。非參數(shù)法的優(yōu)點:可以估計生存函數(shù),可以比較兩個或多個生存分布函數(shù),可以分析單個影響因素對生存時間的影響,對生存時間的分布沒有要求;缺點:不能建立生存時間與影響因素之間依賴關(guān)系的回歸模型。
2.2.1 生存資料的統(tǒng)計描述
2.2.1.1 Kaplan-Meier估計法
Kaplan-Meier法又稱乘積極限法,基本思想是將所有觀察對象的生存時間(包括刪失數(shù)據(jù))由小到大依次排列,對每個時間點進(jìn)行死亡概率、生存概率和生存率的估計[1],能夠充分利用每條記錄的信息,估計不同生存時間點的生存率。該法利用概率乘法定理計算生存率,一般用于小樣本或大樣本未分組資料。Kaplan-Meier法繪制的生存曲線為階梯形曲線[2]。
2.2.1.2 壽命表估計法
當(dāng)遇到樣本含量較大的隨訪資料時,某些個體的刪失發(fā)生在兩次隨訪之間,不能獲得確切的生存時間,這時需要將原始資料按生存時間分組后再進(jìn)行分析,即壽命表法。它的應(yīng)用早于Kaplan-Meier法,是Kaplan-Meier法的近似方法(頻數(shù)表法)。該法不能夠充分利用每條記錄的信息,但其計算和結(jié)果的解釋都很簡單。一般用于觀察對象數(shù)目較多的分組資料,根據(jù)隨訪時間和隨訪結(jié)果編制成頻數(shù)分布表的形式。壽命表法繪制的生存曲線為折線形曲線[2]。
因篇幅所限,Lynden-Bell(林登-貝爾)估計法和Turnbull(特恩布爾)估計法從略,可參閱文獻(xiàn)[7]。
2.2.2 生存曲線或生存時間的比較
當(dāng)全部生存數(shù)據(jù)來自k個不同的處理組時,研究者往往需要比較k條生存曲線(或k個生存率)之間的差異是否有統(tǒng)計學(xué)意義,常用的假設(shè)檢驗方法包括對數(shù)秩檢驗(log-rank test)、威爾考克森檢驗(Wilcoxon test)、考克斯-曼特爾檢驗(Cox-Mantel test)和吉亨檢驗(Gehan test)[7]等。當(dāng)生存時間的分布為Weibull分布或?qū)儆诒壤L(fēng)險模型時,log-rank檢驗效率較高;當(dāng)生存時間的分布為對數(shù)正態(tài)分布時,Wilcoxon檢驗效率較高,兩種方法均是非參數(shù)檢驗方法。
2.2.2.1 對數(shù)秩檢驗(log-rank test)
Log-rank test也稱為Cox-Mantel檢驗,該方法的基本思想是假定擬進(jìn)行比較的不同總體生存函數(shù)之間差異無統(tǒng)計學(xué)意義,即H0成立時,根據(jù)ti時點的死亡率,可計算出各組的理論死亡數(shù),并與實際觀察到的死亡數(shù)進(jìn)行比較。衡量觀察數(shù)與理論數(shù)差別大小的統(tǒng)計量為χ2,服從自由度為(組數(shù)-1)的χ2分布,公式見式(7)。Log-rank檢驗給組間死亡的遠(yuǎn)期差別更大的權(quán)重,即對遠(yuǎn)期差異敏感。
2.2.2.2 Breslow檢驗
Breslow檢驗又稱廣義Wilcoxon檢驗或Gehan比分檢驗,其基本思想同log-rank檢驗,兩種方法在計算時的權(quán)重不同。公式同式(7),其中wi=ni。此檢驗給組間死亡的近期差別更大的權(quán)重,即對近期差異敏感。
Log-rank檢驗與Breslow檢驗兩種方法的應(yīng)用條件相同:即各組生存曲線呈比例風(fēng)險關(guān)系,生存曲線不能有交叉。生存曲線有交叉時,不適合做生存曲線的整體比較。
2.2.3 生存資料的回歸分析
以上兩種生存曲線比較的統(tǒng)計分析方法均屬于單因素分析方法,若研究者關(guān)心的影響生存時間的因素不只一個時,應(yīng)采用適當(dāng)?shù)亩嘁蛩胤治龇椒?,而普通的線性回歸模型和logistic回歸模型通常并不適用。如果僅考慮生存時間作為反應(yīng)變量進(jìn)行線性回歸分析,由于生存時間通常并不是正態(tài)分布,不滿足線性回歸模型的要求;如果僅考慮某一時點事件結(jié)局作為反應(yīng)變量進(jìn)行l(wèi)ogistic回歸分析,則生存時間長短的信息又未能充分利用。此外,生存時間資料中還有刪失數(shù)據(jù),線性回歸模型和logistic回歸模型均不能利用這種不完全數(shù)據(jù)提供的信息。鑒于生存數(shù)據(jù)的上述特點,發(fā)展出了適用于生存數(shù)據(jù)統(tǒng)計分析的多種回歸模型。
生存資料回歸模型可以用來篩選影響反應(yīng)變量的因素,并根據(jù)影響因素的不同取值對生存率(或危險率)進(jìn)行預(yù)測。
按生存時間的分布類型,生存資料回歸模型分析方法主要包括參數(shù)回歸模型、半?yún)?shù)回歸模型和非參數(shù)回歸模型。若通過圖解法或分布的擬合優(yōu)度檢驗,得到待分析的生存資料服從某特定分布的參數(shù)回歸模型時,如指數(shù)分布模型、Weibull分布模型等,則可應(yīng)用相應(yīng)的參數(shù)回歸模型,這類參數(shù)回歸模型常被稱為“加速失效時間模型”或“對數(shù)線性回歸模型”,此時可獲得比盲目采用其他方法更準(zhǔn)確的結(jié)果;若不服從某特定分布的參數(shù)模型,則可考慮應(yīng)用半?yún)?shù)回歸模型,常用的方法包括Cox比例風(fēng)險回歸模型。
按生存時間數(shù)據(jù)刪失類型的分類,主要包括左刪失、右刪失和區(qū)間刪失生存資料回歸模型。
按是否滿足比例風(fēng)險(proportional hazards)假定,主要包括Cox比例風(fēng)險回歸模型、依時或非比例Cox回歸模型,還有脆弱模型、參數(shù)加性危險率模型和非參數(shù)加性危險率模型等[8]。
按因變量的個數(shù)分類,可分為一元多重生存資料回歸模型(絕大多數(shù)生存資料回歸模型都屬于這一類)和多元多重生存資料回歸模型(如邊際模型)。
生存分析作為近三十年來發(fā)展起來的數(shù)理統(tǒng)計新分支,是根據(jù)醫(yī)學(xué)、生命科學(xué)、可靠性工程、保險等科學(xué)研究中的大量實際問題所提出的。對于縱向研究或追蹤隨訪數(shù)據(jù),生存分析是一類常用的統(tǒng)計分析方法,但其應(yīng)用對生存資料有一定的要求。比如,以Cox回歸模型為代表的生存分析方法在數(shù)據(jù)缺失結(jié)構(gòu)下能夠利用偏似然估計理論辨識出對預(yù)后有影響的伴隨變量,但當(dāng)刪失數(shù)據(jù)較多時,估計結(jié)果不夠理想[9]。因此,如何基于現(xiàn)有的生存數(shù)據(jù),得到更可靠的分析結(jié)果,已成為國內(nèi)外統(tǒng)計學(xué)界研究的熱點?,F(xiàn)在,越來越多的研究者和數(shù)理統(tǒng)計學(xué)家嘗試將生存分析與其他的理論相結(jié)合,形成了新的理論方法,并得到了較好的應(yīng)用,如貝葉斯理論下的生存分析方法[10]。即便如此,仍然會存在諸多問題,所以,必然需要對統(tǒng)計學(xué)的理論和方法進(jìn)行不斷完善和創(chuàng)新。
由于生存資料通常都帶有刪失數(shù)據(jù),而且,刪失機(jī)制不盡相同,故對生存資料的統(tǒng)計描述、差異性分析和回歸分析都較經(jīng)典統(tǒng)計分析方法復(fù)雜得多。正因如此,在選擇生存資料統(tǒng)計分析方法時,應(yīng)清楚待分析的生存資料的各種真實情況,在多種備選擇的同類分析方法中,選擇最合適的統(tǒng)計分析方法,以便準(zhǔn)確地揭示生存資料的內(nèi)在變化規(guī)律。