陳金寶 邱李斌 王北琪 曾 潔 陳慧林 侯雅文 陳 征△
長期生存率比較的統(tǒng)計檢驗法*
陳金寶1邱李斌1王北琪1曾 潔1陳慧林1侯雅文2陳 征1△
目的針對基于生存數(shù)據(jù)的長期療效分析的問題,特別是兩條生存曲線出現(xiàn)交叉或危險率不成比例的情況下,比較在特定時刻點后組間生存率的差異,本文主要介紹組合檢驗法ZOLS、ZSP,p和χ2三種檢驗的適用情況。方法在兩組危險率不滿足比例風(fēng)險假定的前提下,對生存曲線交叉和后期差異大的兩個例子,分別使用ZOLS、ZSP,p和χ2三種方法檢驗在不同時刻點之后組間生存率的差異。結(jié)果兩個例子中,ZOLS檢驗與χ2檢驗對不同時刻點之后的組間生存率差異進行檢驗,均能得出較為一致的結(jié)論,并且與實際情況符合。而ZSP,p檢驗的結(jié)果與前兩種相比有差異。結(jié)論結(jié)合實例分析,在比較長期療效或者生存曲線特定時間點后的生存率時,建議使用ZOLS檢驗與χ2檢驗。
生存分析 組間生存率比較 非參數(shù)檢驗 長期療效分析
在醫(yī)學(xué)臨床研究中,組間生存率差異的檢驗是常見的研究問題之一,經(jīng)典方法如統(tǒng)計軟件SPSS 22.0采用的log-rank、Breslow和Tarone-Ware檢驗,均是對組間生存曲線進行整體檢驗,當兩組危險率不滿足比例風(fēng)險假定時,這三種檢驗[1-4]均不適用。例如在一項評估兩種治療方法對腎透析患者療效的臨床研究中[1],兩條生存曲線存在交叉(圖1),并經(jīng) Grambsch-Therneau檢驗[2]得到兩組危險率不滿足比例風(fēng)險假定(χ2=8.70,P=0.003),因而 log-rank檢驗結(jié)果(χ2=2.53,P=0.112)不可靠,外科放置組與皮下放置組的平均感染時間分別為18.527月和23.649月,結(jié)合圖1發(fā)現(xiàn)10個月之后兩組間生存率可能有較大的差異。此時可以使用避免交叉點前后差異相互抵消的two-stage檢驗[3-4],從而得到整體上兩組間生存率有統(tǒng)計學(xué)差異(P=0.025)。但依舊很難給出哪種治療法生存率更高的結(jié)論,因為交叉點前、后的生存率高低是相反的。陳金寶等[5]建議使用固定點處組間生存率的比較法,但很多時候更關(guān)注的是哪種治療法在長期階段有著更高的生存率,如在實際的臨床研究中,研究者往往對特定時間點后的部分(或階段)生存率的差異更感興趣,在上述腎透析研究(圖1)中關(guān)注第5個月之后或第15個月之后兩組之間生存率是否有差異等。本文將介紹兩生存曲線在長期階段(特定時間點后)生存率比較的三種檢驗方法[6],Nelson-Aalen估計線性組合的ZOLS檢驗,Kaplan-Meier估計線性組合的ZSP,p檢驗以及二次型形式的χ2檢驗,并應(yīng)用于兩個實例來分析說明。
圖1 腎透析患者分別進行外科放置導(dǎo)管和皮下放置導(dǎo)管的生存曲線
本文只考慮兩條生存曲線長期(特定時間點后)生存率的比較。假設(shè)第k組有樣本量nk,其中k=0,1,tj表示第j個個體的事件發(fā)生時間,且t1≤t2≤……≤tm,dkj表示第k組在時間tj發(fā)生的事件數(shù),Ykj表示第k組在時間tj的風(fēng)險人數(shù)。Kaplan-Meier估計生存率率及其方差估計值分別是
比較長期(特定時間點后)生存率的差異,原假設(shè)H0∶{S1(t0)=S0(t0)}∩{λ1(t)=λ0(t),t>t0},其中λk(t)表示第 k組(k=0,1)在時間點 t的危險率。原假設(shè)包括 H01∶S1(t0)=S0(t0)和 H02∶λ1(t)=λ0(t),t>t0兩個子假設(shè),其中H01表示在t0時刻生存率相等,而H02表示時間點t0后的危險率無差異;備擇假設(shè)H1:兩個子假設(shè)中至少有一個子假設(shè)不成立。
針對于特定時刻后生存率比較,本文介紹組合檢驗法中三種檢驗統(tǒng)計量[6]:
(1)子假設(shè)H01的檢驗統(tǒng)計量為 ZNA(t0):利用 Nelson-Aalen法估計累計危險率,設(shè)
(2)子假設(shè) H02的檢驗統(tǒng)計量 ZLR(t0),基于 logrank檢驗法。從時刻點 t0開始可設(shè)得 XLR(t0)=差一致性估計值為dj)/(Yj-1)}dj,其中的 dj和 Yj分別是已發(fā)生事件總?cè)藬?shù)和正處于風(fēng)險總?cè)藬?shù),則檢驗統(tǒng)計量為:
并且檢驗統(tǒng)計量ZLR(t0)服從標準正態(tài)分布。
為了檢驗組合原假設(shè)H0,利用上述檢驗統(tǒng)計量ZNA(t0)和 ZLR(t0),本文主要闡述組合檢驗的兩種檢驗法,包含三個檢驗統(tǒng)計量,方法如下:
(1)線性組合檢驗
①ZOLS檢驗統(tǒng)計量
假設(shè)在H0成立的條件下,基于Nelson-Aalen估計法,對 ZNA(t0)和 ZLR(t0)兩個檢驗統(tǒng)計量進行線性組合,則檢驗統(tǒng)計量為:
其中,可以根據(jù)實際情況合理調(diào)整權(quán)重a和b大小,Logan等[6]通過模擬實驗發(fā)現(xiàn),當對權(quán)重a和b分別賦值a
不錯,并且此時統(tǒng)計量Z(t0)化簡后表達式為:
檢驗統(tǒng)計量ZOLS類似于檢驗多終點事件的普通最小二乘法(ordinary least squares,OLS),并且服從標準正態(tài)分布。
②ZSP,p檢驗統(tǒng)計量
對于子假設(shè)H01的檢驗,基于Kaplan-Meier估計法來計算t0時刻不同組別的生存率的差值及組合樣本的生存率和方差,在估計生存率差值的方差時用到組合樣本。類似于部分分組log-rank檢驗法,構(gòu)造一種特殊的線性組合檢驗(SP,p)統(tǒng)計量:
并且檢驗統(tǒng)計量ZSP,P(t0)服從標準正態(tài)分布,其中^Sp(t0)表示在t0時刻組合樣本n0+n1的生存率估計值。
(2)二次型 χ2檢驗法
通過對組合檢驗基本統(tǒng)計量ZNA和ZLR的構(gòu)造分析,可得(ZNA(t0),ZLR(t0))服從均值為(0,0),方差和協(xié)方差矩陣可由估計得到的二元正態(tài)分布,二次型檢驗法對二元正態(tài)分布整體進行假設(shè)檢驗,這時檢驗統(tǒng)計量逼近卡方分布,構(gòu)造得到檢驗統(tǒng)計量為:
在原假設(shè)H0成立的前提下,檢驗統(tǒng)計量χ2(t0)服從自由度為1的卡方分布。
本文給出兩個例子來說明上述方法的應(yīng)用,一個兩條生存曲線交叉,另一個是生存率后期差異大。
在一項評腎透析患者療效的研究中[1],共有119名患者,其中43人進行外科放置導(dǎo)管,76人進行皮下放置導(dǎo)管(刪失率分別為65.1%和85.5%)。終點事件為腎功能不全患者初次發(fā)生通道口感染,右刪失為導(dǎo)尿管失效和試驗結(jié)束時終點事件尚未發(fā)生,圖1顯示兩條生存曲線大概在第8個月左右相交,不滿足比例風(fēng)險假定。由表1可見,ZOLS檢驗結(jié)果顯示在第10、15和20個月后,兩組間生存率差異均有統(tǒng)計學(xué)意義,結(jié)合圖1發(fā)現(xiàn)對應(yīng)時間段皮下放置導(dǎo)管的生存率均較外科放置導(dǎo)管的高,而在第5個月后兩組間生存率差異沒有統(tǒng)計學(xué)意義。ZSP,p檢驗結(jié)果與ZOLS檢驗結(jié)果完全相反。χ2檢驗結(jié)果顯示在第5、10、15和20個月后,兩組間生存率差異均有統(tǒng)計學(xué)意義。Logan等[6]通過模擬研究發(fā)現(xiàn),ZOLS檢驗與χ2檢驗不論I類錯誤還是檢驗效能都有較好且一致的表現(xiàn),建議綜合ZOLS檢驗和χ2檢驗結(jié)果來得出結(jié)論。
表1 不同檢驗方法在例1上的應(yīng)用結(jié)果
一項關(guān)于萬絡(luò)預(yù)防腺性息肉瘤的研究[7]共收集了262例曾患結(jié)腸直腸的患者,其中132例服用昔布類藥物:萬絡(luò),130例服用安慰劑,中位生存時間分別為9.71個月和10.04個月,右刪失率為22.0%和37.7%,由于原文數(shù)據(jù)無法獲得,因此參照Royston和Mahesh[8]的方法模擬產(chǎn)生了本例的數(shù)據(jù)。終點事件是發(fā)生心血管事件(心臟病中風(fēng)),到研究截止時間尚未發(fā)生終點事件為右刪失,圖2顯示服用萬絡(luò)患者比服用安慰劑的患者在18個月后出現(xiàn)心血管事件的幾率相對增加,但在18個月之前兩組患者出現(xiàn)心血管事故的生存率基本一致。由表2可見,log-rank檢驗結(jié)果顯示兩組間整體無統(tǒng)計學(xué)差異,而且Grambsch-Therneau檢驗[2]顯示兩組不滿足風(fēng)險比例假設(shè)(χ2=4.45,P=0.035),two-stage檢驗結(jié)果顯示兩組整體上有統(tǒng)計學(xué)差異。長期檢驗的ZOLS檢驗顯示在第6和12個月后兩條生存曲線生存率均無統(tǒng)計學(xué)差異,而在第18和24個月后差異均有統(tǒng)計學(xué)意義。ZSP,p檢驗顯示在四個時間點后的生存率差異均無統(tǒng)計學(xué)意義。χ2檢驗顯示在第6個月后的生存率差異無統(tǒng)計學(xué)意義,而在第12、18和20個月后生存率差異有統(tǒng)計學(xué)意義。結(jié)合圖2和 Logan等[6]的模擬研究,ZSP,p檢驗結(jié)果可能與實際不符,ZOLS檢驗與χ2檢驗?zāi)芙o出較為合理的結(jié)果,即患者在使用萬絡(luò)一段時間之后能夠增加心血管事件發(fā)生的概率。
圖2 結(jié)腸直腸腺瘤患者分別服用昔布類藥物和安慰劑的生存曲線
表2 不同檢驗方法在例2上的應(yīng)用結(jié)果
兩條生存曲線比較是醫(yī)學(xué)臨床研究中重要的統(tǒng)計分析方法。當兩組危險率滿足比例風(fēng)險假定,可采用常規(guī)的log-rank檢驗或Breslow檢驗等方法,但當兩組危險率不滿足比例風(fēng)險假定,采用two-stage檢驗可以克服常規(guī)方法的不足。以上都是檢驗組間整體的生存率差異,然而在實際臨床研究中,特別是不滿足比例風(fēng)險時,整體檢驗法還是無法確定生存率誰高誰低,這時可以采用某固定時刻點組間生存率的比較檢驗法[5],但這種檢驗法只關(guān)注某固定時刻點上生存率的差異,還是不能做整段的生存率比較,這時若是對長期效果感興趣則可以采用本文介紹的某特定時刻后生存率長期比較檢驗法,其可以關(guān)注某特定時刻后組間生存率的差異。Logan等[6]對長期檢驗的三種檢驗統(tǒng)計量,在不同刪失率下進行模擬研究,發(fā)現(xiàn)ZOLS檢驗在不同刪失率下均表現(xiàn)出較高的穩(wěn)健性和適用性;χ2檢驗在刪失率較低(20%以下)的情況下對組間差異更加敏感;ZSP,p檢驗法不論刪失率的高低,均易得出與實際情況不相符合的結(jié)果。結(jié)合本文兩個例子分析結(jié)果,筆者建議在分析之前先繪制生存曲線圖和進行成比例假設(shè)檢驗,也建議采用線性組合檢驗法的ZOLS檢驗,它相對ZSP,p檢驗和χ2檢驗具有較好的適用性和穩(wěn)健性。
[1]Klein JP,Moeschberger ML.Survival Analysis:Techniques for Censored and Truncated Data.Second Edition.New York:Springer,2003.
[2]Grambsch P,Therneau T.Proportional hazards tests and diagnostics based on weighted residuals.Biometrics,1994,81(3):515-526.
[3]Li H,Han D,Hou Y,et al.Statistical Inference Methods for Two Crossing Survival Curves:A Comparison of Methods.PLoS ONE,2015,10(1):e0116774.
[4]李慧敏,韓棟,陳征,等.生存曲線交叉時統(tǒng)計推斷的比較和選擇.中國衛(wèi)生統(tǒng)計,2013,30(5):668-672.
[5]陳金寶,邱李斌,王北琪,等.固定點處組間生存率比較的統(tǒng)計檢驗法.中華流行病學(xué)雜志,2015,36(2):186-188.
[6]Logan BR,Klein JP,Zhang M.Comparing Treatments in the Presence of Crossing Survival Curves:An Application to Bone Marrow Transplantation.Biometrics,2008,64(3):733-740.
[7]Bresalier RS,Sandler RS,Quan H,et al.Cardiovascular Events Associated with Rofecoxib in a Colorectal Adenoma Chemoprevention Trial.N Engl JMed,2005,352(11):1092-1102.
[8]Royston P,Mahesh KBP.The use of restricted mean survival time to estimate the treatment effect in random ized clinical trials when the proportional hazards assumption is in doubt.Statistics in Medicine,2011,30(19):2409-2421.
國家自然科學(xué)基金(81202288)、廣州市科技計劃(2012J5100023)、廣東省大學(xué)生創(chuàng)業(yè)創(chuàng)新訓(xùn)練計劃(1212113039)、南方醫(yī)科大學(xué)科研啟蒙計劃(B1012444)
1.南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院(廣東省熱帶病研究重點實驗室)生物統(tǒng)計學(xué)系(510515)
2.暨南大學(xué)經(jīng)濟學(xué)院統(tǒng)計學(xué)系
△通信作者:陳征,E-mail:zchen@smu.edu.cn
(責(zé)任編輯:郭海強)