王素珍 孟維靜 王小禮 呂軍城 石福艷
手術(shù)切除術(shù)一直是原發(fā)性肝癌治療的主要有效手段,但隨著科技的發(fā)展,射頻消融術(shù)成為肝癌治療的另一種重要治療手段〔1〕。隨機(jī)化的臨床試驗(yàn)可以準(zhǔn)確判斷哪種治療方式更有效,但在實(shí)際應(yīng)用中,受倫理學(xué)等因素的限制,隨機(jī)化往往不能夠?qū)崿F(xiàn)〔2-5〕。當(dāng)隨機(jī)化不能夠?qū)崿F(xiàn)或者是遭到破壞時(shí),治療效果的判斷就會(huì)變得復(fù)雜起來,因?yàn)槲覀儫o法判定組間的差異是由于治療引起的還是由于組間的分配不平衡而造成的。傾向指數(shù)法是解決此問題的一種實(shí)用方法。故本文將傾向指數(shù)法應(yīng)用于手術(shù)切除術(shù)和射頻消融術(shù)的兩組肝癌病人,并進(jìn)行生存分析,對(duì)兩種治療方式的效果做出判斷。
傾向指數(shù)方法是由Rosenbaum和Rubin在1983年首次提出〔6〕,其主要目的是通過均衡組間各個(gè)混雜因素變量的可比性來降低偏倚,其實(shí)質(zhì)是將多個(gè)協(xié)變量的影響因素用一個(gè)傾向指數(shù)來表示,根據(jù)傾向指數(shù)進(jìn)行不同治療組間的匹配,對(duì)觀測性數(shù)據(jù)的非研究混雜因素進(jìn)行類似隨機(jī)化的均衡處理〔7-9〕。
傾向指數(shù)的具體定義是:按照給定的一組特征變量(xm)將任意一個(gè)研究對(duì)象i(i=1,2,…,N)劃分到治療組(Zi=1)的條件概率,第i個(gè)研究對(duì)象被分配到治療組的概率可以表達(dá)為:
假定分組變量Zi和特征變量xi相互獨(dú)立,則對(duì)任意一個(gè)觀測變量xi,
e(xi),即P,被稱為傾向指數(shù)。
假設(shè)從治療組選出研究對(duì)象i,則e(X)=pri(Z=1|X=xi),再從對(duì)照組選出一個(gè)研究對(duì)象j,那么e(X)=prj(Z=0|X=xj);如果 Pri=Prj,則必然有xi=xj。經(jīng)過傾向指數(shù)調(diào)整的組間個(gè)體,除了處理因素和結(jié)果變量分布不同外,其他協(xié)變量變得均衡可比,相當(dāng)于“事后隨機(jī)化”,使觀察性數(shù)據(jù)達(dá)到“接近隨機(jī)分配數(shù)據(jù)”的效果〔10-12〕。
傾向指數(shù)匹配法是在通過模型估計(jì)傾向指數(shù)后,從對(duì)照組中選出與暴露組傾向指數(shù)相同或相近的個(gè)體進(jìn)行配對(duì),達(dá)到均衡組間協(xié)變量的目的〔13〕。將暴露組與對(duì)照組個(gè)體傾向指數(shù)差值設(shè)定在某個(gè)范圍內(nèi)進(jìn)行的匹配,就叫卡鉗匹配。
具體研究步驟〔14〕:(1)以處理因素為應(yīng)變量,混雜因素為自變量建立logistic回歸模型。(2)根據(jù)擬合的模型計(jì)算每個(gè)對(duì)象的傾向指數(shù)。(3)以傾向指數(shù)為依據(jù),通過匹配法來均衡組間協(xié)變量的分布。(4)用假設(shè)檢驗(yàn)或標(biāo)準(zhǔn)差異法等評(píng)價(jià)傾向指數(shù)方法應(yīng)用前后組間協(xié)變量的均衡性。(5)選擇合適的統(tǒng)計(jì)方法估計(jì)處理效應(yīng)。
現(xiàn)有一項(xiàng)旨在評(píng)價(jià)兩種治療方式對(duì)肝癌病人生存時(shí)間的影響的研究,所有病例取自2004~2008年山東省腫瘤醫(yī)院收治的肝癌患者,收集的指標(biāo)有性別(1=男,2=女)、年齡(歲)、職業(yè)(1=工人,2=農(nóng)民,3=干部,4=醫(yī)生,5=教師,6=其他)、治療方式(1=射頻消融術(shù)(RFA),2=外科切除術(shù)(SR))、child分級(jí)(1=A級(jí),2=B級(jí))、家族史(1=無,2=有)、是否有乙肝(1=無,2=有)、甲胎蛋白(μg/l)、谷氨酰轉(zhuǎn)肽酶(μ/l)等。排除協(xié)變量缺失的病例82例,可以使用的病例共計(jì)701例,按照治療方式分為兩組,其中RFA治療患者348例,SR治療患者353例。在腫瘤醫(yī)院信訪科協(xié)助下,對(duì)所有的患者進(jìn)行電話和書信隨訪至2011年5月,訪問成功率為93.6%。
由于肝癌患者接受何種治療并不是隨機(jī)分組的,所以在兩組間的協(xié)變量分布并不均衡,為了減少協(xié)變量的分布不平衡對(duì)生存分析結(jié)果的影響,本文采用傾向指數(shù)匹配法來均衡協(xié)變量的不平衡,達(dá)到近似隨機(jī)化的目的。研究步驟為:(1)以分組變量為因變量,以協(xié)變量為自變量,建立logistic回歸模型。(2)計(jì)算每個(gè)肝癌病人的傾向指數(shù)。(3)以傾向指數(shù)為依據(jù),進(jìn)行兩組間的卡鉗匹配。本文卡鉗值為0.02〔13〕。(4)對(duì)兩組間的匹配效果進(jìn)行評(píng)價(jià),即協(xié)變量的均衡性比較,對(duì)于定量資料,采用t檢驗(yàn),對(duì)于定性資料采用χ2檢驗(yàn)。(5)匹配后的生存分析:生存率的估計(jì)采用KaplanMeier法,生存曲線的比較采用LogRank檢驗(yàn)。檢驗(yàn)水準(zhǔn)均為0.05。傾向指數(shù)的匹配以及所有的統(tǒng)計(jì)分析均采用SAS9.2編程完成〔15-16〕。
(1)匹配前的協(xié)變量分析結(jié)果
在所搜集的性別、年齡、職業(yè)、child分級(jí)、家族史、是否有乙肝、甲胎蛋白、谷氨酰轉(zhuǎn)肽酶等多個(gè)協(xié)變量中,在傾向指數(shù)匹配之前,年齡、child分級(jí)、家族史、是否有乙肝等協(xié)變量在兩組間分布是不平衡的,結(jié)果見表1。
(2)匹配前Cox回歸分析結(jié)果
對(duì)匹配前的資料做Cox回歸分析,為了便于結(jié)果的解釋,經(jīng)咨詢有關(guān)臨床專家,將年齡、AFP、GT等定量變量轉(zhuǎn)化為二分類或多分類變量,具體為年齡(1:≥60,0:<60);AFP(1:≤20,2:20 ~400,3:>400);GT(1:≤75,2:75~150,3:>150)。然后將所有的變量納入Cox回歸模型中進(jìn)行分析,借助SAS9.2,得到如表2所示的結(jié)果。其中HR為風(fēng)險(xiǎn)比(hazard ratio)。由該表可知,風(fēng)險(xiǎn)率間有統(tǒng)計(jì)學(xué)意義的指標(biāo)為Child分級(jí)、家族史、HbsAg、AFP和GT。而不同治療方式的死亡風(fēng)險(xiǎn)之間卻無統(tǒng)計(jì)學(xué)意義,這正是協(xié)變量在兩個(gè)治療組之間的不均衡引起的。
(3)匹配后的協(xié)變量分析結(jié)果
采用傾向指數(shù)卡鉗法進(jìn)行匹配,共有270對(duì)匹配成功。兩組肝癌病人協(xié)變量的均衡性比較顯示,年齡、child分級(jí)、家族史、是否有乙肝等原來在兩組間不均衡的變量已經(jīng)達(dá)到了平衡,結(jié)果見表3。
(4)匹配前后的生存分析結(jié)果
用匹配之后的286對(duì)新樣本進(jìn)行生存分析,Logrank檢驗(yàn)的結(jié)果見表4。其中MT為中位生存時(shí)間。
表1 傾向指數(shù)匹配前肝癌病人的協(xié)變量分布
表2 Cox回歸分析結(jié)果
表3 傾向指數(shù)匹配后肝癌病人的協(xié)變量分布
表4 匹配之后兩組肝癌病人的生存率比較
排除了協(xié)變量的影響后,RFA治療組和SR治療組的1年生存率分別為33.24%、44.37%,兩年生存率分別為12.75%、16.70%,中位生存時(shí)間分別為0.66年和0.84年,置信區(qū)間分別為0.53~0.77年和0.66~1.03年。Logrank檢驗(yàn)結(jié)果表明兩組間有統(tǒng)計(jì)學(xué)差異。兩組肝癌病人的生存曲線見圖1。
圖1 匹配之后兩組肝癌病人的生存曲線
可見,混雜因素影響了治療效果的評(píng)價(jià)。排除了混雜因素的影響后,SR治療組的生存率高于RFA組。
在隨機(jī)化無法實(shí)現(xiàn)的試驗(yàn)研究以及觀察性研究中,用傾向指數(shù)平衡組間協(xié)變量的不均衡不失為一種好的方法〔17〕。傾向指數(shù)匹配法能得到處理效應(yīng)的無偏估計(jì),最大程度的減少了偏倚,并且能夠直接比較協(xié)變量在處理組和對(duì)照組之間的均衡性以及處理效應(yīng),因此越來越多地受到人們的關(guān)注。
近年來,有很多的專家對(duì)射頻消融術(shù)和外科切除術(shù)治療肝癌的效果進(jìn)行了對(duì)比研究〔18-19〕,但他們大多根據(jù)收集到的資料對(duì)兩種治療直接進(jìn)行比較,并沒有考慮到兩組間的協(xié)變量是否平衡。因此,得出的結(jié)論也許會(huì)存在偏倚。而本文應(yīng)用傾向指數(shù)方法均衡了射頻消融術(shù)和外科切除術(shù)兩組早期肝癌病人組間的協(xié)變量后,再評(píng)價(jià)兩種治療方式的效果,最大程度地減少了偏倚。
傾向指數(shù)匹配法是一種很好的處理非隨機(jī)化數(shù)據(jù)的方法,為以后非隨機(jī)化臨床試驗(yàn)數(shù)據(jù)的處理提供了理論基礎(chǔ)。本次研究結(jié)果表明,采用傾向指數(shù)匹配法平衡混雜因素之后,采用外科切除術(shù)的肝癌患者1年生存率、2年生存率、中位生存時(shí)間均高于采用射頻消融術(shù)的患者。因此,外科切除術(shù)的治療效果優(yōu)于射頻消融術(shù)的治療效果。
1.王振,錢葉本.小肝癌射頻消融術(shù)與手術(shù)切除術(shù)療效的Meta分析.肝膽外科雜志,2011,19(1):23-27.
2.Wisnivesky JP,Halm EA,Bonomi M,et al.Postoperative radiotherapy for elderly patients with stage III lung cancer.Cancer,2012,2(13):317-325.
3.Oh KH,Hwang YH,Cho JH,et al.Outcome of early initiation of peritoneal dialysis in patients with end-stage renal failure.J Korean Med Sci,2012,27(2):170-176.
4.Hong S,Youn YN,Yi G,et al.Long Term Results of ST-Segment Elevation Myocardial Infarction versus Non-ST-Segment Elevation Myocardial Infarction after Off-Pump Coronary Artery Bypass Grafting:Propensity Score Matching Analysis.J Korean Med Sci,2012,27(2):153-159.
5.Choi AH,Barnholtz-Sloan JS,Kim JA.Effect of radiation therapy on survival in surgically resected retroperitoneal sarcoma:a propensity score-adjusted SEER analysis.Ann Oncol,2012,23(9):2449-2457.
6.Rosenbaum PR,Rubin DB.The central role of the propensity score in observational studies for causal effects.Biometrika,1983,70:41-55.
7.Linden A,Adams JL.Combining the regression discontinuity design and propensity score-based weighting to improve causal inference in program evaluation.J Eval Clin Pract,2012,18(2):317-325.
8.Austin PC,Mamdani MM.A comparison of propensity score methods:a case-study estimating the effectiveness of post-AM statin use.Stat Med,2006,25(30):2084-2106.
9.Hullsiek KH,Louis TA.Propensity score modeling strategies for the causal analysis of observational data.Biostatistics,2002,3(2):179-193.
10.Scrutinio D,Passantino A,Catnzaro R,et al.Inpatient cardiac rehabilitation soon after hospitalization for acute decompensated heart failure:A PROPENSITY SCORE STUDY.J Cardiopulm Rehabil Prev,2012,32(2):71-77.
11.Foody,JoAnne Micale,Cole,C.R.,et al.A Propensity Analysis of Cigarette Smoking and Mortality with Consideration of the Effects of Alcohol,American Journal of Cardiology,2001,87,706-711.
12.Yaginuma K,Kasai T,Miyauchi K,et al.Propensity score analysis of 10-year long-term outcome after bypass surgery or plain old balloon angioplasty in patients with metabolic syndrome.Int Heart J,2011,52(6):372-376.
13.王永吉,蔡宏偉,夏結(jié)來,等.第二講 傾向指數(shù)常用研究方法.中華流行病學(xué)雜志,2010,31(5):104-105.
14.王永吉,蔡宏偉,夏結(jié)來,等.第一講 傾向指數(shù)的基本概念和研究步驟.中華流行病學(xué)雜志,2010,31(3):99-100.
15.SAS 9.2 Macro Language Reference,SAS Institute Inc.2008.
16.Art Carpenter.Carpenter's Complete Guide to the SAS Macro Language(2nd Edition)SAS Publishing,2004.
17.Walsh P,Shanholtzer L,Loewen M,et al.A matched Casecontrol study with propensity score balancing examining the protective effect of paracetamol against parentally reported apnoea in infants.Resuscitation,2011.
18.張隆群,王濟(jì)明.射頻消融與手術(shù)切除治療肝癌并發(fā)癥及生存率的臨床對(duì)照研究.第三軍醫(yī)大學(xué)學(xué)報(bào),2007,5:457-459.
19.彭振維,徐立,陳敏山等.原位射頻消融與手術(shù)治療小肝癌對(duì)比研究.中國實(shí)用外科雜志,2008,8:633-636.