第二軍醫(yī)大學(xué)衛(wèi)生統(tǒng)計(jì)學(xué)教研室(200433)
張 筱 葉小飛 張新佶 郭曉晶 吳美京 張?zhí)煲?李 慧 賀 佳△
近年來(lái),由于隨機(jī)對(duì)照試驗(yàn)(randomized controlled trials,RCT)通常存在所選人群有限、樣本量較少、隨訪時(shí)間較短、價(jià)格昂貴等局限性,它的大規(guī)模應(yīng)用受到一定的限制。而觀察性研究(observational study,OBS)通常不對(duì)研究人群進(jìn)行嚴(yán)格的限制、樣本量較大、觀察時(shí)間較長(zhǎng)、研究成本較低、可以收集到足夠的信息觀察到特殊人群(如孕婦、兒童、有合并其他疾病的患者)的暴露情況,也可以對(duì)罕見(jiàn)事件的發(fā)生做出評(píng)價(jià)[1],因而近年來(lái)國(guó)內(nèi)外越來(lái)越多的研究者采用觀察性研究方法在醫(yī)學(xué)領(lǐng)域進(jìn)行大規(guī)模人群研究。但觀察性研究不能像RCT那樣采用隨機(jī)化設(shè)計(jì)對(duì)研究對(duì)象隨機(jī)分配,可能出現(xiàn)混雜因素在組間分布不均衡現(xiàn)象,產(chǎn)生混雜偏倚。傳統(tǒng)的控制混雜因素的方法如分層法(當(dāng)分層數(shù)目較多時(shí)會(huì)產(chǎn)生過(guò)度分層的問(wèn)題)及l(fā)ogistic回歸法(受模型線性假設(shè)條件的限制)存在一定的局限性[2],因此,迫切需要更加有效的方法來(lái)均衡不同特征數(shù)據(jù)之間的差異,更為準(zhǔn)確地控制混雜因素的影響,使不同特征的數(shù)據(jù)間具有可比性,從而更好地挖掘出數(shù)據(jù)中隱藏的信息,獲得更準(zhǔn)確的信號(hào)檢測(cè)結(jié)果。目前,傾向評(píng)分法及貝葉斯傾向評(píng)分法是解決這一問(wèn)題的較有力工具。
1.傾向評(píng)分法
傾向評(píng)分法(propensity score analysis,PSA)作為均衡組間混雜因素的新方法由Rosenbaum和Rubin在1983年首次提出[3],其基本原理是將多個(gè)協(xié)變量的影響用一個(gè)傾向評(píng)分值來(lái)表示(相當(dāng)于降低了協(xié)變量的維度),然后根據(jù)傾向評(píng)分值進(jìn)行不同對(duì)比組間的分層、匹配或加權(quán),即均衡對(duì)比組間協(xié)變量的分布,最后在協(xié)變量分布均衡的層內(nèi)或者匹配組中估計(jì)處理效應(yīng)。在大樣本的情況下,經(jīng)過(guò)傾向評(píng)分值調(diào)整的組間個(gè)體,除了處理因素和結(jié)局變量分布不同外,其他協(xié)變量應(yīng)該均衡可比,相當(dāng)于進(jìn)行了“事后隨機(jī)化”,使觀察性數(shù)據(jù)達(dá)到“接近隨機(jī)分配數(shù)據(jù)”的效果[4-5]。
估計(jì)傾向性評(píng)分值是傾向評(píng)分法的第一步,也是核心步驟。其估計(jì)的準(zhǔn)確與否,直接關(guān)系到組間均衡的效果,進(jìn)而影響到對(duì)處理效應(yīng)的正確推斷。目前,常用的估計(jì)傾向評(píng)分值的模型有l(wèi)ogistic回歸、probit回歸、判別分析以及數(shù)據(jù)挖掘中的神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)、分類與回歸樹(shù)、Boosting算法等機(jī)器學(xué)習(xí)方法[6]。判別分析要求協(xié)變量服從多元正態(tài)分布,而流行病學(xué)資料中存在著較多的分類變量,因此該方法在流行病學(xué)中較少使用[7];probit回歸函數(shù)表示累積標(biāo)準(zhǔn)正態(tài)分布函數(shù)的逆函數(shù)或反函數(shù),其結(jié)果不易解釋,限制了該方法的廣泛使用;數(shù)據(jù)挖掘的方法因其穩(wěn)定性差、難以理解、結(jié)構(gòu)復(fù)雜等缺陷,較少有研究將其應(yīng)用于實(shí)際數(shù)據(jù)中[8]。
傳統(tǒng)的傾向評(píng)分法即借助logistic回歸模型估計(jì)傾向評(píng)分值,其應(yīng)用最為廣泛[9]。采用傳統(tǒng)的logistic回歸模型估計(jì)傾向評(píng)分值具有模型簡(jiǎn)單、容易實(shí)現(xiàn)、穩(wěn)健性好、結(jié)果易于解釋等優(yōu)勢(shì)。然而,其在應(yīng)用中存在的問(wèn)題也不容忽視:(1)通過(guò)logistic回歸模型估計(jì)的傾向評(píng)分分值與其真實(shí)值的偏倚較大,而研究者未考慮到傾向評(píng)分值的不準(zhǔn)確性對(duì)混雜因素組間均衡性的影響,進(jìn)而影響到處理效應(yīng)估計(jì)的準(zhǔn)確性,特別是在傾向評(píng)分調(diào)整法和匹配法中,這個(gè)問(wèn)題更為突出[10];(2)傳統(tǒng)的logistic回歸模型估計(jì)傾向評(píng)分值時(shí),連續(xù)型協(xié)變量與logit(y)需要滿足線性關(guān)系的限制條件,當(dāng)此條件不被滿足時(shí),結(jié)果的準(zhǔn)確性將受到影響,而在實(shí)際應(yīng)用中,研究者往往忽略了對(duì)此假設(shè)條件進(jìn)行檢驗(yàn)[11];(3) 當(dāng)事件發(fā)生數(shù)與協(xié)變量數(shù)之比小于10時(shí),傳統(tǒng)的logistic回歸估計(jì)得到的傾向評(píng)分值也存在較大的偏倚[12];(4)估計(jì)處理效應(yīng)時(shí)無(wú)法利用先驗(yàn)信息。如果可以利用已有的信息,可有效提高處理效應(yīng)估計(jì)值的精確性和可靠性;(5) 無(wú)法很好地處理缺失數(shù)據(jù)、高維數(shù)據(jù)等問(wèn)題。
因此,國(guó)外越來(lái)越多的研究者開(kāi)始將貝葉斯統(tǒng)計(jì)的思想引入到傾向評(píng)分法中,構(gòu)建貝葉斯傾向評(píng)分模型,估計(jì)傾向評(píng)分值及處理效應(yīng),以彌補(bǔ)傳統(tǒng)的傾向評(píng)分法無(wú)法解決的問(wèn)題。
2.貝葉斯傾向評(píng)分法(Bayesian propensity score analysis,BPSA)
貝葉斯統(tǒng)計(jì)是將關(guān)于未知參數(shù)的先驗(yàn)信息與樣本信息綜合,并不斷通過(guò)樣本數(shù)據(jù)更新先前認(rèn)知的統(tǒng)計(jì)方法。它采用馬爾可夫鏈蒙特卡羅算法(MCMC)對(duì)估計(jì)參數(shù)的后驗(yàn)分布進(jìn)行抽樣,并結(jié)合所構(gòu)建的似然函數(shù)對(duì)所估計(jì)的先前認(rèn)知(即MCMC法上一次迭代的先驗(yàn)信息與樣本信息的綜合)不斷地進(jìn)行修正,最終得到估計(jì)參數(shù)的一個(gè)穩(wěn)定的后驗(yàn)分布,根據(jù)后驗(yàn)信息去推斷總體參數(shù)。貝葉斯統(tǒng)計(jì)是基于總體信息、樣本信息及先驗(yàn)信息進(jìn)行的統(tǒng)計(jì)推斷。1985年,Rubin等人論證了傾向評(píng)分法與貝葉斯思想結(jié)合的合理性,首次在專著中提出將貝葉斯統(tǒng)計(jì)的思想引入到傾向性評(píng)分法中,但并未構(gòu)建相應(yīng)的模型[13]。目前,國(guó)外學(xué)者普遍認(rèn)為傾向評(píng)分模型中的參數(shù)是未知的,具有不確定性及隨機(jī)性,因此可以構(gòu)建貝葉斯傾向評(píng)分模型,且貝葉斯傾向評(píng)分模型可以與貝葉斯因果推斷模型或傳統(tǒng)的概率統(tǒng)計(jì)因果推斷模型相結(jié)合。圍繞此種觀點(diǎn),現(xiàn)已提出了多種貝葉斯傾向評(píng)分的模型。
Hoshino在2008年提出一種半?yún)?shù)貝葉斯傾向評(píng)分模型,并與復(fù)雜模型相結(jié)合(如結(jié)構(gòu)方程模型),用于處理潛在變量的影響或解決多組間比較的問(wèn)題[14],但因其復(fù)雜的數(shù)理推理過(guò)程限制了模型的廣泛應(yīng)用。2009年,McCandless、Gustafson、Austin等人構(gòu)建了另一種貝葉斯傾向評(píng)分模型[10],可以同時(shí)估計(jì)傾向分值和處理效應(yīng)。目前,此模型的應(yīng)用較多。如公式(1)、公式(2)所示,其中公式(1)為結(jié)局變量的估計(jì),X代表處理因素,β為處理因素的回歸系數(shù)(即處理效應(yīng)的估計(jì)),Z(C,γ)代表公式(1)中所估計(jì)的傾向分值。公式(2)為傾向分值的估計(jì),C代表混雜因素。
logit[Pr(Y=1/X,C)]=βX+ζTg(z(C,γ))
(1)
logit[Pr(Y=1/X,C)]=γTC
(2)
(3)
(4)
(5)
McCandless先應(yīng)用貝葉斯logistic回歸模型納入候選協(xié)變量,利用先驗(yàn)信息,根據(jù)貝葉斯統(tǒng)計(jì)的思想,得出每個(gè)個(gè)體的傾向性評(píng)分值,將PS值分為五段,作為潛變量引入貝葉斯回歸模型,并構(gòu)建混雜因素條件下結(jié)局變量與處理因素聯(lián)合分布的似然函數(shù)。他提出的BPSE算法有以下三個(gè)特點(diǎn):(1)采用無(wú)信息先驗(yàn)分布,假定先驗(yàn)信息β、γ、ξ方差很大且服從正態(tài)分布,見(jiàn)公式(3)、(4)、(5);(2)對(duì)傾向分值進(jìn)行分層(分層節(jié)點(diǎn)的選擇可直接選用五分位值或采用立方樣條法擬合節(jié)點(diǎn)),然后將傾向分值作為潛變量納入處理效應(yīng)估計(jì)的模型中;(3)借助MCMC法,利用所構(gòu)建聯(lián)合分布的似然函數(shù),同時(shí)估計(jì)出處理效應(yīng)的回歸系數(shù)(β)、協(xié)變量的回歸系數(shù)(γ)以及傾向分值的回歸系數(shù)(ξ)。
如上文所述,McCandless等人構(gòu)建的貝葉斯傾向評(píng)分模型將傾向分值進(jìn)行分層后再作為協(xié)變量納入結(jié)局變量的似然函數(shù),并同時(shí)估計(jì)出傾向分值及處理效應(yīng)。在其結(jié)果解釋時(shí),他將傾向分值的回歸系數(shù)(ξ)當(dāng)作冗余參數(shù)。而事實(shí)上傾向分值的回歸系數(shù)(ξ)可以反映結(jié)局變量的估計(jì)對(duì)傾向評(píng)分估計(jì)的影響,而上述研究中忽略了此種影響關(guān)系。因此,2010年,McCandless等人又探討了兩步進(jìn)行的貝葉斯回歸調(diào)整法,以控制結(jié)局變量的估計(jì)對(duì)傾向分值估計(jì)的影響,更加精確地估計(jì)傾向評(píng)分值[15]。并將其應(yīng)用于時(shí)依性結(jié)局變量的數(shù)據(jù)分析中(如生存分析資料)混雜因素的控制。如公式(6)表示為同時(shí)估計(jì)模型的概率密度函數(shù),公式(7)表示分兩步進(jìn)行時(shí)傾向分值的概率密度函數(shù)。
(6)
(7)
(8)
2012年,David Kaplan、Jianshen Chen等學(xué)者認(rèn)為先前McCandless、An等學(xué)者所構(gòu)建的貝葉斯聯(lián)合分布忽略了結(jié)局變量對(duì)傾向評(píng)分分布的影響,進(jìn)一步假設(shè)聯(lián)合分布中若不存在結(jié)局變量,那么會(huì)產(chǎn)生不同的傾向分值的分布,于是提出了分兩步完成的貝葉斯傾向評(píng)分法[17]。簡(jiǎn)單地說(shuō),在David Kaplan的研究中,兩步的BPSA就是兩個(gè)獨(dú)立的過(guò)程,即估計(jì)傾向評(píng)分值時(shí)采用貝葉斯logistic模型(與McCandless、An的估計(jì)傾向分值的似然函數(shù)相同),而用最小二乘法(如公式(9)所示,X代表處理因素,β為處理因素的回歸系數(shù)即所要估計(jì)的處理效應(yīng))或貝葉斯回歸估計(jì)處理效應(yīng)。David Kaplan還將他提出的兩步BPSA法與McCandless等人的一步BPSA法進(jìn)行了比較,研究發(fā)現(xiàn)兩步完成的貝葉斯傾向評(píng)分分層法所估計(jì)的處理效應(yīng)的方差小于一步完成的貝葉斯傾向評(píng)分的分層法,但最優(yōu)匹配法的結(jié)果較接近。此外,貝葉斯傾向評(píng)分法與傳統(tǒng)的方法相比較,發(fā)現(xiàn)貝葉斯傾向評(píng)分法估計(jì)的處理效應(yīng)的方差較大,與McCandless等人的研究結(jié)果一致。他認(rèn)為傳統(tǒng)的傾向評(píng)分法估計(jì)的處理效應(yīng)的方差較小,而B(niǎo)PSA提供的處理效應(yīng)的方差雖然略有增大然而更加準(zhǔn)確。
Y=a+βX+ε
(9)
貝葉斯傾向評(píng)分法與傳統(tǒng)的logistic傾向評(píng)分法對(duì)處理效應(yīng)的估計(jì)哪個(gè)更加精確呢?這個(gè)問(wèn)題目前尚未有統(tǒng)一的結(jié)論。不同方法特點(diǎn)不同:(1) 處理效應(yīng)的估計(jì)受不同傾向評(píng)分值的利用方式的影響。如直接選用五分位值將傾向分值分為五層[10]或采用立方樣條法擬合節(jié)點(diǎn)分為四層[18],選用最鄰近匹配法(nearest neighborhood matching)[16]或最優(yōu)匹配法(optimal full matching)[17],對(duì)結(jié)果都有影響。(2)不同貝葉斯傾向評(píng)分法選擇的估計(jì)結(jié)局變量的似然函數(shù)不同[10,16,18]。如McCandless 的研究中處理效應(yīng)的似然函數(shù)采用貝葉斯logistic回歸,而An的研究中處理效應(yīng)的似然函數(shù)采用一般線性模型。(3)先驗(yàn)信息分布的選擇(如有研究選擇有信息先驗(yàn)分布,也有研究選擇無(wú)信息)以及超參數(shù)的設(shè)定不同。David Kaplan等人通過(guò)模擬研究證明先驗(yàn)信息設(shè)定的越準(zhǔn)確,處理效應(yīng)的估計(jì)越接近真值。因此,需要基于自己研究的數(shù)據(jù)特征,對(duì)不同學(xué)者提出的貝葉斯傾向評(píng)分法進(jìn)行橫向比較研究,篩選最優(yōu)的貝葉斯傾向評(píng)分法。
3.貝葉斯傾向評(píng)分模型的實(shí)際應(yīng)用
4.貝葉斯傾向評(píng)分法與logistic傾向評(píng)分法的比較
現(xiàn)從以下九個(gè)方面對(duì)傳統(tǒng)的傾向評(píng)分法及貝葉斯傾向評(píng)分法進(jìn)行簡(jiǎn)要的比較(如表1所示):(1)PS值估計(jì)的準(zhǔn)確性 可通過(guò)協(xié)變量的回歸系數(shù)(γ)來(lái)反映,貝葉斯傾向評(píng)分法可以更加精確地估計(jì)γ的可信區(qū)間[10,15-16,18]。(2)模型假設(shè) 傳統(tǒng)的logistic回歸模型需要滿足對(duì)數(shù)線性假設(shè)的條件,結(jié)果才更可靠,而貝葉斯傾向評(píng)分模型對(duì)此假設(shè)條件并不敏感[10]。(3)均衡性 根據(jù)國(guó)外多項(xiàng)研究結(jié)果,與結(jié)局相關(guān)的變量均為重要的混雜因素,需要對(duì)其進(jìn)行組間均衡性檢驗(yàn)。而與處理因素強(qiáng)相關(guān)、與結(jié)局變量弱相關(guān)的混雜,對(duì)結(jié)果的影響不大,可以忽略。傳統(tǒng)的logistic回歸模型主要均衡與處理因素相關(guān)的混雜,可能會(huì)遺漏掉某些與結(jié)局相關(guān)的重要的混雜;而貝葉斯傾向評(píng)分主要均衡與結(jié)局變量相關(guān)的混雜[18]。(4)缺失數(shù)據(jù) 若某個(gè)或某幾個(gè)協(xié)變量存在缺失,logistic回歸等傳統(tǒng)統(tǒng)計(jì)方法便無(wú)法得到傾向評(píng)分值。而貝葉斯傾向評(píng)分法允許缺失數(shù)據(jù)的存在。(5)高維數(shù)據(jù) 對(duì)于高維數(shù)據(jù),變量之間可能存在各種各樣的線性及非線性關(guān)系或交互作用,貝葉斯傾向評(píng)分法在處理這些問(wèn)題方面有著明顯的優(yōu)勢(shì)。(6)潛變量(latent variable) 也稱為不可測(cè)量的變量(unmeasured variable)。貝葉斯傾向評(píng)分法可以與復(fù)雜模型相結(jié)合(如結(jié)構(gòu)方程模型等),處理潛在變量的問(wèn)題[14,20]。(7)樣本大小或事件發(fā)生數(shù)目 當(dāng)樣本數(shù)較小或事件發(fā)生數(shù)較小時(shí),使用logistic傾向評(píng)分法,結(jié)果不夠穩(wěn)定,而貝葉斯傾向評(píng)分法在此種情況下有著明顯的優(yōu)勢(shì)[16-17]。(8)軟件應(yīng)用 傳統(tǒng)logistic回歸模型可在SAS、R、Stata等多種軟件中實(shí)現(xiàn),貝葉斯傾向評(píng)分則只能通過(guò)R軟件計(jì)算。(9)難易程度 logistic回歸模型具有簡(jiǎn)單、容易實(shí)現(xiàn)等特點(diǎn)。貝葉斯傾向評(píng)分法的實(shí)現(xiàn)比較復(fù)雜,需要預(yù)先確定先驗(yàn)分布(無(wú)信息先驗(yàn)分布、有信息先驗(yàn)分布)、設(shè)定參數(shù)的初始值、選取恰當(dāng)?shù)某闃臃绞?Metropolis或Gibbs抽樣),還需要借助MCMC法才能得以實(shí)現(xiàn)。
表1 貝葉斯傾向評(píng)分法及傳統(tǒng)的傾向評(píng)分法的比較
5.展望
隨著信息化技術(shù)的推進(jìn),在日常業(yè)務(wù)中可以通過(guò)信息系統(tǒng)收集大量的觀察性數(shù)據(jù),如不良反應(yīng)自發(fā)呈報(bào)系統(tǒng)(spontaneous reporting system,SRS)[21]、醫(yī)院信息系統(tǒng)(HIS)、電子病歷(EMR)等。如何將這些數(shù)據(jù)有效利用,提供有價(jià)值的關(guān)于干預(yù)因素與結(jié)局之間因果關(guān)系的“證據(jù)”或“線索”,為醫(yī)學(xué)與政策問(wèn)題的研究及解決提供巨大的數(shù)據(jù)支持及循證支持,已成為統(tǒng)計(jì)方法學(xué)研究中面臨的巨大挑戰(zhàn)。貝葉斯傾向評(píng)分法是近年來(lái)新提出的一種處理觀察性研究中混雜偏倚的有力工具,它可以有效地利用先前研究或系統(tǒng)累積數(shù)據(jù)中的大量信息、充分考慮傾向分值的隨機(jī)性而更加精確地估計(jì)傾向評(píng)分值、與復(fù)雜模型相結(jié)合處理復(fù)雜結(jié)構(gòu)的數(shù)據(jù)以及借助MCMC法快速的估計(jì)出各項(xiàng)參數(shù)的后驗(yàn)分布等,因而較傳統(tǒng)的傾向評(píng)分法具有廣泛的應(yīng)用前景。目前,貝葉斯傾向評(píng)分法在應(yīng)用過(guò)程中還存在著較多的問(wèn)題:不同學(xué)者提出的聯(lián)合分布及似然函數(shù)也不盡相同;不同研究中先驗(yàn)信息的設(shè)定方式不同;傾向分值的利用方式也不盡相同。以上因素都會(huì)影響到處理效應(yīng)的估計(jì)結(jié)果。因此,在對(duì)觀察性數(shù)據(jù)進(jìn)行研究時(shí),需要充分考慮數(shù)據(jù)特征及研究目的,選擇最佳的模型進(jìn)行分析。此外,目前的貝葉斯傾向評(píng)分法僅限于兩分類的處理因素及結(jié)局變量,對(duì)于多分類的處理因素、隨時(shí)間變化的處理因素、連續(xù)型結(jié)局變量等觀察性數(shù)據(jù)中常見(jiàn)的問(wèn)題,還需要進(jìn)一步的研究。
參 考 文 獻(xiàn)
1.Perkins SM,Tu W,Underhill MG,et al.The use of propensity scores in pharmacoepidemiologic research.Pharmacoepidemiol Drug Saf,2000,9(2):93-101.
2.王超,吳騁,許金芳,等.傾向性評(píng)分匹配法在不良反應(yīng)信號(hào)檢測(cè)中的應(yīng)用.中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(6):855-858.
3.Rosenbaum PR,Rubin DB.The central role of the propensity score in observational studies for causal effects.Biometrika,1983,70:41-55.
4.張亮,李嬋娟,夏結(jié)來(lái),等.傾向得分區(qū)間匹配法用于非隨機(jī)對(duì)照試驗(yàn)的探索與研究.中國(guó)衛(wèi)生統(tǒng)計(jì),2012,29(1):53-57.
5.李智文,李宏田,張樂(lè).用SPSS宏程序?qū)崿F(xiàn)觀察對(duì)象的傾向評(píng)分配比.中國(guó)衛(wèi)生統(tǒng)計(jì),2011,28(1):89-92.
6.Westreich D,Lessler J,Funk MJ.Propensity score estimation:neural networks,support vector machines,decision trees (CART),and meta-classifiers as alternatives to logistic regression.J Clin Epidemiol,2010,63(8):826-33.
7.D′Agostino RB Jr.Propensity score methods for bias reduction in the comparison of a treatment to a non-randomized control group.Stat Med,1998,17(19):2265-81.
8.Setoguchi S,Schneeweiss S,Brookhart MA,et al.Evaluating uses of data mining techniques in propensity score estimation:a simulation study.Pharmacoepidemiol Drug Saf,2008,17(6):546-55.
9.Felix J.A Systematic Review of Propensity Score Methods in the Social Sciences.Multivariate Behavioral Research,2011,46:1,90-118.
10.McCandless LC,Gustafson P,Austin PC.Bayesian propensity score analysis for observational data.Stat Med,2009,28(1):94-112.
11.Bagley SC,White H,Golomb BA.Logistic regression in the medical literature:standards for use and reporting,with particular attention to one medical domain.J Clin Epidemiol,2001,54(10):979-85.
12.Cepeda MS,Boston R,Farrar JT,et al.Comparison of logistic regression versus propensity score when the number of events is low and there are multiple confounders.Am J Epidemiol,2003,158(3):280-7.
13.Rubin DB.The use of propensity scores in applied Bayesian inference.In Bayesian Statistics 2,Bernardo JM,De Groot MH,Lindley DV,Smith AFM (eds).Valencia University Press,North-Holland:Amsterdam,1985,63-72.
14.Hoshino T.A Bayesian propensity score adjustment for latent variable modeling and MCMC algorithm.Computational Statistics & Data Analysis,2008,52,1413-1429.
15.McCandless LC,Douglas IJ,Evans SJ,et al.Cutting feedback in Bayesian regression adjustment for the propensity score.Int J Biostat,2012,6(2):Article.
16.An W.Bayesian propensity score estimators:incorporating uncertainties in propensity scores into causal inference.Sociological Methodology,2010,40,151-189.
17.David K,Jianshen C.A two-step Bayesian approach for propensity score analysis:simulations and case study.Psychometrika,2012,77(3):581-609.
18.McCandless LC,Gustafson P,Austin PC,et al.Covariate balance in a Bayesian propensity score analysis of beta blocker therapy in heart failure patients.Epidemiol Perspect Innov,2009,6(5).
19.McCandless LC,Gustafson P,Austin PC.Code for fitting Bayesian propensity analysis to a toy synthetic dataset [CP/OL].http://www.biomedcentral.com/content/supplementary/1742-5573-6-5-S1.R.
20.McCandless LC,Richardsonand S,Nicky GB.Propensity Score Adjustment for Unmeasured Confounding in Observational Studies.ESRC National Center for Research Methods NCRM Working Paper Series,2,2008.
21.錢(qián)維,王超,吳騁,等.運(yùn)用隨機(jī)森林分析藥品不良反應(yīng)發(fā)生的影響因素.中國(guó)衛(wèi)生統(tǒng)計(jì),2013,30(2):209-213.