南方醫(yī)科大學(xué)公共衛(wèi)生學(xué)院生物統(tǒng)計(jì)學(xué)系(510515) 楊梓瀅 余雯薏 張 玉 周基元
【提 要】 目的 提出一種基于MOVER法中介效應(yīng)置信區(qū)間的構(gòu)造方法,并與Sobel法、百分位數(shù)bootstrap法、偏差校正的百分位數(shù)bootstrap法、乘積分布法和Monte Carlo法進(jìn)行比較。方法 借鑒MOVER法的思想,提出一種新的構(gòu)造中介效應(yīng)置信區(qū)間的MMA方法。在不同參數(shù)設(shè)置下,通過(guò)計(jì)算機(jī)模擬,比較MMA法與現(xiàn)有方法的第一類錯(cuò)誤率、檢驗(yàn)效能、覆蓋率及區(qū)間寬度。同時(shí),將MMA法與現(xiàn)有方法應(yīng)用于多發(fā)性硬化患者數(shù)據(jù),對(duì)這些方法做進(jìn)一步的比較。結(jié)果 MMA法在樣本量大于25時(shí)均能控制第一類錯(cuò)誤率,偏差校正的百分位數(shù)bootstrap法的第一類錯(cuò)誤率可能會(huì)膨脹;除了偏差校正的百分位數(shù)bootstrap法,MMA法的檢驗(yàn)效能明顯高于其余方法;隨著樣本量的增大,MMA法的覆蓋率逐漸趨近0.95;在部分模擬背景下,MMA法的區(qū)間寬度最窄。結(jié)論 MMA法是一種穩(wěn)健且檢驗(yàn)效能有明顯提高的中介效應(yīng)置信區(qū)間構(gòu)造方法。
中介分析廣泛應(yīng)用于心理學(xué)[1-2]、流行病學(xué)[3-5]等研究領(lǐng)域,其目的不僅要研究自變量和因變量之間的直接關(guān)系,還要探索它們之間是否存在中介效應(yīng)。目前,一般是通過(guò)估計(jì)中介效應(yīng)的置信區(qū)間進(jìn)行檢驗(yàn)[6],常用的估計(jì)方法有Sobel法[7]、百分位數(shù)bootstrap法[8]、偏差校正的百分位數(shù)bootstrap法[8]、乘積分布法[9]和Monte Carlo法[10]。其中,偏差校正的百分位數(shù)bootstrap法的檢驗(yàn)效能最高,然而其第一類錯(cuò)誤率可能會(huì)膨脹;Sobel法的區(qū)間寬度最窄,但其在小樣本下的第一類錯(cuò)誤率偏保守。因此,有必要提出一種新的中介效應(yīng)置信區(qū)間的構(gòu)造方法,以提高其檢驗(yàn)效能,并縮短其區(qū)間寬度[11]。另一方面,Zou等人[12]提出了基于MOVER法(method of variance estimates recovery)構(gòu)造比值置信區(qū)間的方法,該方法是Fieller法[13]的拓展,其基本思想是利用比值中分子、分母的置信區(qū)間來(lái)構(gòu)造比值的置信區(qū)間。當(dāng)分子、分母服從偏態(tài)分布時(shí),該方法的覆蓋率要優(yōu)于Fieller法,并且估計(jì)的區(qū)間寬度更窄;當(dāng)分子、分母都服從正態(tài)分布時(shí)則與Fieller法等價(jià)。因此,本文提出一種基于MOVER法中介效應(yīng)置信區(qū)間的構(gòu)造方法(MOVER-based mediation analysis,MMA),并與上述五種方法進(jìn)行模擬比較,同時(shí)將這些方法應(yīng)用到多發(fā)性硬化患者數(shù)據(jù)[14],對(duì)這些方法做進(jìn)一步的比較。
考慮如下模型:
Y=β0+cX+e0
(1)
M=β1+aX+e1
(2)
Y=β2+c′X+bM+e2
(3)
其中X、Y與M分別是自變量、因變量與中介變量;β0、β1、β2是截距項(xiàng);c是X對(duì)Y的總效應(yīng);ab是X對(duì)Y的間接效應(yīng);c′是扣除M的影響后X對(duì)Y的直接效應(yīng);e0、e1、e2是殘差。檢驗(yàn)中介效應(yīng)有兩種方式[11],一是檢驗(yàn)公式(1)、(3)中回歸系數(shù)的差c-c′是否為0;二是檢驗(yàn)公式(2)、(3)中回歸系數(shù)的乘積ab是否為0。由于檢驗(yàn)前者的第一類錯(cuò)誤率通常會(huì)膨脹[7,11],因此在中介分析中一般直接對(duì)ab進(jìn)行檢驗(yàn)。
圖1 四種情況下比值R的置信區(qū)間上、下限取值
(4)
將上述構(gòu)造中介效應(yīng)置信區(qū)間的方法記為MMA法。
用R語(yǔ)言對(duì)新提出的MMA法與現(xiàn)有的Sobel法(Sobel)、百分位數(shù)bootstrap法(percentile)、偏差校正的百分位數(shù)bootstrap法(BC)、乘積分布法(dop)和Monte Carlo法(MC)在不同樣本量(N)、不同中介效應(yīng)強(qiáng)度(ab)下的第一類錯(cuò)誤率、檢驗(yàn)效能(power)、覆蓋率和區(qū)間寬度(width)進(jìn)行模擬比較。首先從標(biāo)準(zhǔn)正態(tài)分布隨機(jī)抽樣分別產(chǎn)生樣本量為N的變量X、e1、e2,然后根據(jù)公式(2)、(3)計(jì)算得到中介變量M和因變量Y。取N=25,50,100,200,500,1000。參照方杰等人的模擬研究[6],設(shè)置三種中介效應(yīng)為0的參數(shù)組合:a=0,b=0;a=0.39,b=0;a=0,b=0.59;設(shè)置三種中介效應(yīng)不為0的參數(shù)組合:a=0.14,b=0.14;a=0.39,b=0.39;a=0.59,b=0.59,分別對(duì)應(yīng)中介效應(yīng)強(qiáng)度為小、中、大的情形。由于MacKinnon等人的模擬研究[7]表明中介分析的模擬結(jié)果不受直接效應(yīng)變化的影響,因此設(shè)c′=0。為簡(jiǎn)化模型,β1、β2也設(shè)為0。模擬次數(shù)設(shè)為1000次,顯著性水平設(shè)為α=0.05;bootstrap法和Monte Carlo法的重抽樣次數(shù)分別設(shè)為5000次和1000次。
六種方法第一類錯(cuò)誤率的模擬結(jié)果見表1。由表1知,當(dāng)a=b=0時(shí),MMA法和其余五種方法的第一類錯(cuò)誤率都遠(yuǎn)低于0.05,且均低于a=0,b≠0與a≠0,b=0情況下的第一類錯(cuò)誤率;當(dāng)a、b中至少有一個(gè)不為0時(shí),Sobel法偏保守,偏差校正的百分位數(shù)bootstrap法和乘積分布法的第一類錯(cuò)誤率可能會(huì)膨脹,這與文獻(xiàn)[6-7]的研究結(jié)果一致。MMA法、百分位數(shù)bootstrap法和Monte Carlo法在N>25時(shí)能很好地控制第一類錯(cuò)誤率。六種方法覆蓋率的模擬結(jié)果見表2。由表2知,隨著樣本量和中介效應(yīng)強(qiáng)度的增大,六種方法的覆蓋率逐漸趨于0.95。六種方法檢驗(yàn)效能和區(qū)間寬度的模擬結(jié)果見圖2。由圖2知,隨著樣本量和中介效應(yīng)強(qiáng)度的增大,六種方法的檢驗(yàn)效能均逐漸增大。其中偏差校正的百分位數(shù)bootstrap法的檢驗(yàn)效能最高,MMA法次之。針對(duì)區(qū)間寬度方面的表現(xiàn),當(dāng)N=25時(shí),Sobel法最優(yōu);當(dāng)50≤N≤200時(shí),總的來(lái)講,MMA法最優(yōu);N≥500時(shí),Monte Carlo法最優(yōu)。此外,我們還模擬了a、b至少有一個(gè)為負(fù)情況下的結(jié)果,與上述結(jié)果類似,此處不再贅述。
圖2 六種方法檢驗(yàn)效能和區(qū)間寬度的模擬比較
表1 六種方法第一類錯(cuò)誤率的模擬比較
表2 六種方法覆蓋率(%)的模擬比較
表3 六種方法在實(shí)例分析中的中介效應(yīng)置信區(qū)間及區(qū)間寬度
本文提出了一種基于MOVER法中介效應(yīng)置信區(qū)間的MMA構(gòu)造方法。模擬結(jié)果顯示:現(xiàn)有偏差校正的百分位數(shù)bootstrap法的檢驗(yàn)效能最高,MMA法次之。然而,注意到偏差校正的百分位數(shù)bootstrap法的第一類錯(cuò)誤率可能會(huì)膨脹,其檢驗(yàn)效能的結(jié)果不一定可靠。另一方面,實(shí)例分析結(jié)果提示:MMA法的中介效應(yīng)置信區(qū)間的寬度最窄。因此,MMA法是一種穩(wěn)健、檢驗(yàn)效能較高的中介效應(yīng)置信區(qū)間構(gòu)造方法。此外,本研究仍然存在一些不足。由于新提出的MMA法將中介效應(yīng)ab轉(zhuǎn)換為比值的形式進(jìn)行估計(jì),所以當(dāng)a、b的置信區(qū)間都以0為端點(diǎn)、不能取倒數(shù)時(shí),無(wú)法求解分母的置信區(qū)間,因此MMA法不再適用。然而,當(dāng)a、b的置信區(qū)間中至少有一個(gè)區(qū)間不以0為端點(diǎn)時(shí),即使a、b的置信區(qū)間均以0為內(nèi)點(diǎn),MMA法仍然適用。另一方面,該方法只考慮了單個(gè)中介變量以及因變量?jī)H為計(jì)量資料的情況,提示該方法需要向多個(gè)中介變量或因變量為計(jì)數(shù)資料等方向進(jìn)行拓展,我們將在今后的研究中予以改進(jìn)。