葉曉勤,楊 偉,謝雁鳴△,王永炎
(1.中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,北京 100700;2.中國人民大學(xué)統(tǒng)計(jì)學(xué)院,北京 100872)
基于傾向性評分的中醫(yī)復(fù)雜干預(yù)臨床療效評價(jià)*
葉曉勤1,楊 偉2,謝雁鳴1△,王永炎1
(1.中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所,北京 100700;2.中國人民大學(xué)統(tǒng)計(jì)學(xué)院,北京 100872)
臨床研究的成功與否,與是否有效控制偏倚有關(guān)。在非隨機(jī)化的觀察性研究中,傾向性評分能減少對比組間的差異,縮小偏倚。與試驗(yàn)設(shè)計(jì)階段進(jìn)行配比控制偏倚相比,傾向性分析法不受試驗(yàn)設(shè)計(jì)(隨機(jī)對照試驗(yàn)設(shè)計(jì))方法的限制,無須在試驗(yàn)設(shè)計(jì)階段進(jìn)行隨機(jī),其結(jié)果更接近“真實(shí)世界”的實(shí)際干預(yù)效果而非臨床試驗(yàn)的效果。因此,傾向性分析應(yīng)用于中醫(yī)個(gè)性化治療的復(fù)雜干預(yù)療效評價(jià)是適合的,具有重要的研究前景和使用價(jià)值。
傾向性分析;混雜因素;中醫(yī)復(fù)雜干預(yù);療效評價(jià)
傾向評分法(propensity score method)是由Rosenbaum 和 Rubin 于 20 世紀(jì) 80 年代提出[1,2],是一個(gè)可在缺乏隨機(jī)化處理分配的情況下增加治療組可比性的創(chuàng)新性統(tǒng)計(jì)方法。2000年之后,這一方法日益受到人們的關(guān)注。國際上越來越多的研究者將傾向評分法應(yīng)用到流行病學(xué)、健康服務(wù)研究、經(jīng)濟(jì)學(xué)以及社會(huì)科學(xué)等諸多領(lǐng)域[3~7]。
臨床研究的成功與否,與其是否有效控制偏倚有關(guān)。只有從設(shè)計(jì)、實(shí)施到統(tǒng)計(jì)處理等各個(gè)環(huán)節(jié)嚴(yán)格把關(guān),減少和消除偏倚的影響,才能得出真實(shí)的結(jié)果,臨床研究才具有價(jià)值。隨機(jī)對照試驗(yàn)通過隨機(jī)分組而避免混雜因素的影響。然而,隨機(jī)對照試驗(yàn)不可能代替其他的研究策略,各種觀察性研究均不可避免地存在著混雜因素。
當(dāng)在兩種因素混在一起或相互影響時(shí),可能錯(cuò)誤地將其中之一當(dāng)成某一結(jié)果的原因[8],這種引起和產(chǎn)生混雜的因素稱為混雜因素(confounder)。此種偏倚的影響是在評價(jià)因果關(guān)系、治療效果、預(yù)后因素時(shí),由于受到可以引起相同結(jié)果而同時(shí)存在的其他某些因素(混雜因素)的干擾,導(dǎo)致夸大或縮小了最后結(jié)果的錯(cuò)誤結(jié)論?;祀s偏倚僅靠嚴(yán)密設(shè)計(jì)和準(zhǔn)確操作還不能完全避免,它還要求科研人員有嚴(yán)密的科學(xué)思維和適當(dāng)?shù)恼{(diào)整混雜因素的統(tǒng)計(jì)學(xué)知識(shí)[9]?;祀s偏倚的控制,根據(jù)研究階段不同可采用不同的方法[1]。在研究設(shè)計(jì)階段,可以采取諸如嚴(yán)格限制研究對象、配對、分層抽樣、直接隨機(jī)抽樣等方法。在混雜偏倚不可避免地產(chǎn)生后,控制混雜偏倚的方法主要有分層分析法、校正分析法、配對法及Logistic回歸等。
辨證論治的個(gè)體化綜合干預(yù)治療是中醫(yī)藥防病治病的特色與優(yōu)勢,特別是一些病因復(fù)雜、病情較重、預(yù)后較差的疾病,如惡性腫瘤、血液病、免疫性疾病、腦血管意外以及一些嚴(yán)重的感染性疾病,往往累及多個(gè)系統(tǒng)。對于這些疾病,單一的防治手段難以獲得滿意療效,需要給予復(fù)雜或綜合性的防治方案,復(fù)雜或綜合干預(yù)體現(xiàn)了這種治療理念。
復(fù)雜干預(yù)貫穿于中醫(yī)診療過程的始終,中醫(yī)復(fù)雜或綜合干預(yù)反映了中醫(yī)臨床實(shí)踐過程中的實(shí)際情況,而復(fù)雜干預(yù)是由多個(gè)要素或干預(yù)措施組成的。要準(zhǔn)確界定一個(gè)復(fù)雜干預(yù)中“起作用的積極因素”不是一件容易的事情。復(fù)雜干預(yù)比單純對某種藥物的研究具有更多的變數(shù),這使得辨識(shí)、驗(yàn)證和重復(fù)某個(gè)復(fù)雜干預(yù)的臨床療效變得極為艱難。如何評價(jià)臨床實(shí)際過程中“起作用的積極因素”或不同組合中醫(yī)干預(yù)措施的療效,需要尋找合適的評價(jià)方法對其進(jìn)行嚴(yán)格評價(jià)。傾向性評分是一個(gè)可在缺乏隨機(jī)化處理分配的情況下增加治療組可比性的一種統(tǒng)計(jì)方法。該方法盡量將所有可能的混雜因素綜合為一個(gè)變量即傾向評分(Propensity Score,PS),從而使組間具有可比性,因此該方法應(yīng)用于中醫(yī)實(shí)際情況下的復(fù)雜干預(yù)療效評價(jià)是恰當(dāng)和適合的。
與隨機(jī)對照研究相比,觀察性研究給出了干預(yù)效果的實(shí)際情形而非臨床試驗(yàn)的效果,所以觀察性研究對于健康結(jié)果產(chǎn)出研究十分重要。研究者們依賴于非干預(yù)的觀察,描述不同個(gè)體接受不同照料的各種類型(水平)治療方式的效果[10]。如何利用非隨機(jī)化的研究資料探索不同干預(yù)措施或水平治療方式的效果,一直是臨床研究中需要探討的問題??刂苹祀s偏倚的方法包括在研究設(shè)計(jì)階段進(jìn)行配比,或在數(shù)據(jù)分析階段按照混雜因素分層,或采用多因素?cái)?shù)學(xué)模型進(jìn)行調(diào)整等。但這些方法的局限性是同時(shí)調(diào)整的變量數(shù)不能太多。傾向評分法能夠?qū)⒍鄠€(gè)混雜變量綜合為一個(gè)變量即傾向評分(Propensity Score,PS),通過平衡兩對比組的傾向評分而有效地均衡混雜變量(也稱協(xié)變量)的分布,從而達(dá)到控制混雜偏倚的目的。
傾向性評分的分析方法是對控制混雜偏倚的一種有效的方法,當(dāng)結(jié)局極其罕見以致于難以或不能實(shí)施RCTs時(shí),也可為臨床試驗(yàn)建立假設(shè)或提供足夠證據(jù)。
醫(yī)生在臨床實(shí)踐過程中,會(huì)根據(jù)疾病的不同發(fā)展階段隨著復(fù)雜病情和證候的動(dòng)態(tài)變化而采用不同的治療方法,復(fù)雜的疾病使用單一的治療方法難以奏效,往往采用綜合方案的復(fù)雜干預(yù)方法。
缺血性中風(fēng)是一種復(fù)雜的疾病,臨床上往往采用綜合方案進(jìn)行干預(yù)。中國中醫(yī)科學(xué)院中醫(yī)臨床基礎(chǔ)醫(yī)學(xué)研究所在“十一五”期間承擔(dān)了國家高新技術(shù)研究發(fā)展(863)計(jì)劃生物醫(yī)藥專題下“缺血性中風(fēng)早期康復(fù)和避免復(fù)發(fā)中醫(yī)方案研究”課題,該方案由中藥辨證湯劑、中藥注射劑、針刺、推拿綜合干預(yù)措施組成。經(jīng)專家反復(fù)論證的干預(yù)方案總框架確定下,醫(yī)生會(huì)根據(jù)患者病情的輕重、個(gè)體的差異等不同的情況,選用不同的干預(yù)介入時(shí)間和持續(xù)時(shí)間、治療頻次和強(qiáng)度。
中醫(yī)通過整體與個(gè)體化相結(jié)合的復(fù)雜干預(yù)手段,對患者進(jìn)行符合臨床實(shí)際的干預(yù)被認(rèn)為是產(chǎn)生療效的依據(jù)所在。然而這樣的診療模式既是中醫(yī)取得較好臨床療效的優(yōu)勢和特色,同時(shí)也給臨床療效的評價(jià)造成了困難。針對中醫(yī)復(fù)雜干預(yù)診療模式,如何進(jìn)行療效評價(jià)是廣大中醫(yī)藥臨床科研工作者必須面對的問題。
中醫(yī)復(fù)雜干預(yù)模式更接近于臨床“真實(shí)世界”的干預(yù)模式。近年來,真實(shí)世界研究(real-world study,RWS)越來越受到廣大醫(yī)學(xué)科研工作者的重視,認(rèn)為其研究結(jié)果更接近臨床實(shí)際。但這也給我們帶來一個(gè)問題,在回答中醫(yī)綜合方案整體療效的同時(shí),我們能否回答中醫(yī)綜合方案中不同干預(yù)措施哪種組合效果更好?是否每種干預(yù)措施都是有效的?哪種干預(yù)措施對整體療效貢獻(xiàn)度更大?要回答這些問題,僅僅比較中西醫(yī)2組的總體療效是不夠的,如果根據(jù)臨床實(shí)際情況如醫(yī)囑或針刺、推拿記錄單的記錄將中醫(yī)組所用具體方法根據(jù)實(shí)際使用情況進(jìn)行評價(jià),就會(huì)出現(xiàn)依據(jù)不用的介入時(shí)間、不同的中醫(yī)康復(fù)使用頻次、不同的使用持續(xù)時(shí)間,乃至根據(jù)病情在方案總框架下所使用的中醫(yī)康復(fù)措施的取舍等所形成的若干亞組,并造成樣本量的分散,在評價(jià)上很難達(dá)到預(yù)期的目的。
傾向評分法適合于所有非隨機(jī)化研究的資料,或者說存在混雜偏倚研究資料的處理。利用傾向評分降低混雜偏倚的方法主要有傾向評分配比、傾向評分分層、傾向評分回歸調(diào)整和傾向評分加權(quán)。各種方法對于傾向評分的計(jì)算是相同的,只是在如何使用傾向評分進(jìn)行偏倚調(diào)整方面有所不同[11]。本研究所采用的統(tǒng)計(jì)分析方法是Generalized Boosted Models(GBM)加權(quán)傾向評分法,它是一種用于估計(jì)傾向評分的多元非參數(shù)回歸技術(shù),其優(yōu)勢在于可以估計(jì)關(guān)注變量和大量的協(xié)變量之間的非線性關(guān)系[12]。
本研究是以國家863計(jì)劃“缺血性中風(fēng)早期康復(fù)和避免復(fù)發(fā)中醫(yī)方案研究”為依托。前期研究表明,中醫(yī)綜合康復(fù)方案相對于現(xiàn)代康復(fù)在整體上是有效的,能顯著降低患者病死率、復(fù)發(fā)率、致殘率,提高患者生存質(zhì)量,改善患者早期(21d)神經(jīng)功能缺損(NIHSS)評分及肢體運(yùn)動(dòng)功能(FMI)評分。但是中醫(yī)綜合康復(fù)方案中“起作用的積極因素”到底是什么?是否整體方案拆分后繼續(xù)有效?這是大家都很關(guān)心的問題,也為下一步繼續(xù)研究及中醫(yī)綜合康復(fù)方案的優(yōu)化提供依據(jù)。
本研究中醫(yī)綜合康復(fù)措施主要由針刺(A)、推拿(B)、中藥注射劑(C)及中藥湯劑(D)組成。研究采取實(shí)用性隨機(jī)對照試驗(yàn)設(shè)計(jì),在方案執(zhí)行過程中,研究者可以根據(jù)患者的實(shí)際情況如患者病情的輕重給予不同的干預(yù)措施或頻次。為了研究中醫(yī)綜合康復(fù)方案拆分后不同干預(yù)措施組合是否對缺血性中風(fēng)早期康復(fù)繼續(xù)有效,本研究根據(jù)專家經(jīng)驗(yàn)將各干預(yù)措施≥7次作為符合方案,按此方案共得到拆分后干預(yù)措施組合針刺(A)+推拿(B)+中藥注射劑(C)290例。以神經(jīng)功能缺損(NIHSS)評分和肢體運(yùn)動(dòng)功能(FMI)評分是否改善為療效評價(jià)指標(biāo),根據(jù)專業(yè)知識(shí)確定需要平衡的混雜因素有性別、年齡、病程、主要合并病、主要并發(fā)病、基線 NIHSS評分、基線mRS評分、基線 FMI評分(FMI1)、基線 BI評分、中醫(yī)證候和基線中醫(yī)癥狀評分。
針對中醫(yī)復(fù)雜干預(yù)的診療過程,傾向性分析可用于臨床不同治療方案的綜合評價(jià)分析,用于干預(yù)措施(治療方案)的優(yōu)化。傾向性分析能夠評價(jià)并比較“真實(shí)世界”條件下中醫(yī)復(fù)雜干預(yù)不同治療方案的相對效率,挑選最佳治療方案,使分析結(jié)果更加真實(shí)、可靠,有利于臨床醫(yī)生和衛(wèi)生決策者客觀地選擇醫(yī)療方案,達(dá)到合理化、規(guī)范化治療的目的。
但是,傾向性分析自身亦存在較多的問題,有嚴(yán)格的假設(shè)條件,即前提是盡可能地納入所有的混雜因素,然而由于未在方案設(shè)計(jì)階段實(shí)施隨機(jī)化,因此無法消除未知混雜因素的影響。傾向性分析作為中醫(yī)復(fù)雜干預(yù)臨床療效評價(jià)的一種新嘗試,還需要在今后大量的臨床試驗(yàn)工作去驗(yàn)證、探索并加以完善。
[1]Rosenbaum,PR.a(chǎn)nd Rubin,DB.The central role of the p ropensity score in observational studies for causal effects [J].Biometrika,1983,70:41-55.
[2]Rosenbaum PR,and Rubin DB.Constructing a control group using multivariate matched sampling methods that incorporate the propensity score[J].American Statistician,1985,39:33-38.
[3]D'Agostino RB.Propensity score methods for bias reduction in the comparison of a treatment to a nonrandomized control group[J].Statistics in Medicine,1998,17(19):2265-2281.
[4]Austin PC.A critical appraisal of propensity score matching in the medical literature between 1996 and 2003[J].Statistics in Medicine,2008,27(12):2037-2049.
[5]Rubin DB,Thomas N.Matching using estimated propensity scores:Relating theory to practice[J].Biometrics,1996,52:249-264.
[6]李智文,劉建蒙,張 樂,等.傾向評分配比在流行病學(xué)設(shè)計(jì)中的應(yīng)用[J].中華流行病學(xué)雜志,2009,30(5):514-517.
[7]BaserO. Too much ado aboutpropensity score models?Comparing methods of propensity score matching[J].Value Health,2006,9(6):377-385.
[8]王家良.臨床流行病學(xué)-臨床科研設(shè)計(jì)、衡量與評價(jià)[M].上海:上??茖W(xué)技術(shù)出版社,2001.
[9]姚才良,徐耀初.偏倚及其控制[J].中國公共衛(wèi)生,1990,6(6):279-282.
[10]Alex Z Fu,唐 艷,陳 剛.傾向得分法綜述[J].中國藥物經(jīng)濟(jì)學(xué),2008,(2):27-34.
[11]李智文,任愛國.傾向評分法概述[J].中國生育健康雜志,2010,21(1):62-64.
[12]McCaffrey DF, Ridgeway G, MorralAR. PropensityScore Estimation with Boosted Regression for Evaluating Causal Effects in Observational Studies[J].Psychol Medthods,2004,9(4):403-425.
Propensity score-based clinical efficacy evaluation of TCM complex interventions
YE Xiao-qin1,YANG Wei2,XIE Yan-ming1△,WANG Yong-yan1
(1.Institute of basic research in clinical trial,China Academy of Chinese Medical Sciences,Beijing100700,China;2.School of Statistics,Renmin University of China,Beijing100872,China)
The success of clinical research,depends on the ability to control the bias.In the non-randomized observational study,propensity score can reduce the contrast differences between groups and narrow bias.Compared with design stage through matching control bias,propehsity analysis frees from experimental design(randomized controlled trial design)approach limits,with no need for rahdomization in the design stage.The result is closer to“real world”aitual effectiveness rather than the clinical trial results.Therefore,propehsity analysis applying to personalized medicine treatment efficacy evaluation of complex interventions is appropriate,has an important prospects and use value.
propensity score analysis;Confounding factors;TCM complex intervention;clinical efficacy evaluation
R969.4
A
1006-3250(2012)02-0218-03
國家高新技術(shù)研究發(fā)展計(jì)劃(863計(jì)劃)“缺血性中風(fēng)早期康復(fù)和避免復(fù)發(fā)中醫(yī)方案研究”(2007AA02Z4B2);中國中醫(yī)科學(xué)院自主選題研究項(xiàng)目“基于傾向性分析的缺血性中風(fēng)早期康復(fù)中醫(yī)復(fù)雜干預(yù)療效評價(jià)研究”(Z02108)
葉曉勤(1972-),男,主治醫(yī)師,博士后,從事中醫(yī)臨床療效評價(jià)方法學(xué)研究。
△通訊作者:謝雁鳴(1959-),女,研究員,博士研究生導(dǎo)師,從事中醫(yī)臨床評價(jià)方法學(xué)研究,E-mail:zhinanb2010@yahoo.com.cn。
2011-07-17