湖州師范學(xué)院醫(yī)學(xué)院(313000)
王麗娜△ 李莎莎
結(jié)構(gòu)方程模型在修正和中介作用分析中的誤區(qū)和對(duì)策*
湖州師范學(xué)院醫(yī)學(xué)院(313000)
王麗娜△李莎莎
結(jié)構(gòu)方程模型(structural equation modeling,SEM)作為多變量資料統(tǒng)計(jì)分析技術(shù)之一,其在營(yíng)銷(xiāo)學(xué)、心理學(xué)、管理學(xué)、社會(huì)及行為科學(xué)等領(lǐng)域的量化研究上已成為主流分析技術(shù)。近5年,在生物-心理-社會(huì)醫(yī)學(xué)模式的指導(dǎo)下,SEM在醫(yī)學(xué)相關(guān)領(lǐng)域的科研工作中應(yīng)用活躍,包括醫(yī)療糾紛、職業(yè)倦怠感、心理健康狀況、自我管理行為等變量的成因分析或中介機(jī)制的探索,以及量表結(jié)構(gòu)效度評(píng)定的驗(yàn)證性因素分析。本文在廣泛參閱國(guó)內(nèi)外SEM相關(guān)著作及文獻(xiàn)的基礎(chǔ)上,對(duì)SEM在科研工作中的應(yīng)用誤區(qū)進(jìn)行剖析,以減少SEM的分析判斷失誤,提高其統(tǒng)計(jì)分析質(zhì)量,使各學(xué)科研究過(guò)程更為科學(xué)、規(guī)范。
1975年瑞典統(tǒng)計(jì)學(xué)家J?reskog[1]首次開(kāi)發(fā)了用于分析多指標(biāo)變量之間復(fù)雜關(guān)系結(jié)構(gòu)的多元統(tǒng)計(jì)分析方法SEM。該技術(shù)是結(jié)合證實(shí)性因素分析與回歸分析或路徑分析而形成。根據(jù)不同的統(tǒng)計(jì)分析目的,SEM的功能可劃分為:(1)陳述、估計(jì)以及檢驗(yàn)變量之間線性關(guān)系與非線性關(guān)系的假設(shè)[2];(2)檢驗(yàn)觀察變量與潛變量之間關(guān)系的假設(shè)[3];(3)同步檢驗(yàn)一組觀察變量或潛在變量之間的直接效果及間接效果的假設(shè)[4]。SEM統(tǒng)計(jì)分析的目的與回歸分析相似,但由于其在使用上同時(shí)考慮了模型的交互作用、非線性關(guān)系、自變量相關(guān)、測(cè)量誤差、測(cè)量誤差相關(guān)、多指標(biāo)的外生潛在變量及多指標(biāo)的內(nèi)生潛在變量,因此SEM的統(tǒng)計(jì)分析過(guò)程更為嚴(yán)謹(jǐn),結(jié)果更具有說(shuō)服力,尤其適用于科學(xué)研究中以問(wèn)卷或量表測(cè)量為手段的研究變量間關(guān)系的分析。
SEM作為第二代統(tǒng)計(jì)技術(shù),其與SPSS/SAS等第一代統(tǒng)計(jì)技術(shù)相比,具有2個(gè)顯著的優(yōu)勢(shì)。
1.SEM較SPSS/SAS更為嚴(yán)謹(jǐn)
SPSS/SAS只能分析觀察變量,對(duì)于潛在變量的分析,將通過(guò)各維度題目加總后再代入多元回歸方程[5]。各維度分?jǐn)?shù)加總即承認(rèn)了每個(gè)題目的信度均為100%的假設(shè),鑒于隨機(jī)誤差及系統(tǒng)誤差的存在,這種假設(shè)是不切實(shí)際的,特別是通過(guò)問(wèn)卷量表、測(cè)評(píng)獲取的資料。同時(shí),SPSS/SAS只能分析變量之間的直接效果,無(wú)法分析間接效果。在可能存在間接效果的模型中,需要執(zhí)行兩次回歸才能完整分析出所有變量之間的關(guān)系。同一模型進(jìn)行兩次統(tǒng)計(jì)推斷,將導(dǎo)致I型錯(cuò)誤的增加。SEM考慮了觀察變量的估計(jì)殘差,能夠反應(yīng)樣本資料的真實(shí)情況,因此估計(jì)的偏差較小,結(jié)果更為嚴(yán)謹(jǐn)。
2.SEM圖形輸出簡(jiǎn)潔,易于理解
SEM可以根據(jù)模型圖上的執(zhí)行結(jié)果迅速判讀變量(觀察變量或潛在變量)之間的相關(guān)程度及影響方向,并可以直觀地顯示中介效果或干擾效果。SPSS將多個(gè)變量納入回歸方程,統(tǒng)計(jì)結(jié)果缺少圖形呈現(xiàn)功能,此時(shí),多數(shù)學(xué)者的做法是通過(guò)繪制路徑分析圖加以呈現(xiàn)各變量間的影響方向,但路徑分析圖忽略了自變量間的共線性。Raykov[6]認(rèn)為,當(dāng)多個(gè)自變量同時(shí)估計(jì)因變量時(shí),自變量之間不可能完全獨(dú)立。因此,Raykov團(tuán)隊(duì)在制定SEM模型估計(jì)準(zhǔn)則時(shí)強(qiáng)調(diào):自變量間的共變是結(jié)構(gòu)方程模型估計(jì)的參數(shù),如果自變量間的共變性被忽略,將造成估計(jì)上的偏差。
“結(jié)構(gòu)方程模型”、“影響因素”、“中介效應(yīng)/機(jī)制”、“探索性因素分析”及“驗(yàn)證性因素分析”檢索近5年科研文獻(xiàn),通過(guò)專(zhuān)家咨詢(xún)及文獻(xiàn)佐證,本研究共總結(jié)3點(diǎn)SEM的使用誤區(qū)。
1.模型修正過(guò)程中對(duì)修正指數(shù)的指導(dǎo)作用尚不明確
通過(guò)樣本數(shù)據(jù)構(gòu)建的結(jié)構(gòu)方程模型不一定均符合研究的預(yù)期或理論假設(shè)。此時(shí),研究者需進(jìn)行模型修正。模型修正可依據(jù)既往研究的理論基礎(chǔ),增加或刪減變量,以實(shí)現(xiàn)模型和數(shù)據(jù)的擬合;或通過(guò)SEM軟件產(chǎn)生的參考指標(biāo)對(duì)配適度不良的模型加以修正。修正指數(shù)(modification indices,MI)是模型修正的常用參考指標(biāo),一般SEM軟件均可提供。MI利用資料驅(qū)動(dòng)的方式,改變指標(biāo)之間的關(guān)系以達(dá)到改善配適度的目的。MI主要提供兩個(gè)修正檢驗(yàn)值:變量之間的相關(guān)及殘差獨(dú)立的相關(guān)。因此,MI值將建議增加相關(guān)以達(dá)到改善模型的目的。既往科研文獻(xiàn)呈現(xiàn)的結(jié)構(gòu)模型圖常存在同一潛變量下觀察變量間殘差獨(dú)立相關(guān),或不同潛變量的觀察變量間殘差獨(dú)立相關(guān)。
這種做法有2點(diǎn)質(zhì)疑之處:如果修正的模型中潛變量下的觀察變量間殘差獨(dú)立相關(guān),即承認(rèn)了觀察變量間的相關(guān)性,那么,研究者為何在理論假設(shè)模型構(gòu)建之初沒(méi)有考慮到這種相關(guān)性;(2)按照MI增加相關(guān)的建議,模型依據(jù)某一特定的樣本進(jìn)行修正后,修訂后的模型是否穩(wěn)定,即是否同樣適合于研究總體中抽取的其他隨機(jī)樣本?這便引發(fā)模型是否是隨機(jī)產(chǎn)生的問(wèn)題。因此,模型修正不能僅靠模型估計(jì)復(fù)雜化的手段以改善模型配適度[7]。正如Diamantopoulos[8]在其評(píng)論中強(qiáng)調(diào),除非存在清晰而具體的理論基礎(chǔ)提供支持,否則,無(wú)論MI提供增加相關(guān)的建議多誘人,都應(yīng)加以嚴(yán)格拒絕。在此背景下,Hu[9]提議,進(jìn)行量表結(jié)構(gòu)效度檢驗(yàn)時(shí),參照MI建議的增設(shè)相關(guān),可以認(rèn)定同一構(gòu)面(即一個(gè)維度或因子所包含的條目形成一個(gè)構(gòu)面,或一個(gè)潛變量所包含的數(shù)個(gè)觀察變量形成一個(gè)構(gòu)面)的兩個(gè)題目較為相似,建議刪除其中一個(gè)題目。這一提議,為模型修正提供了一條科學(xué)的路徑,并在后期多項(xiàng)研究中得到了廣泛運(yùn)用[10-11]。
2.研究變量間中介作用/效果的顯著性缺乏科學(xué)的統(tǒng)計(jì)推斷
中介變量是社會(huì)科學(xué)領(lǐng)域中研究變量間關(guān)系時(shí)重點(diǎn)關(guān)注的一個(gè)因素。其意義在于:(1)中介變量意味著自變量對(duì)因變量影響的一種內(nèi)在機(jī)制,能夠解釋兩個(gè)變量之間“如何”及“為何”發(fā)生關(guān)系的過(guò)程;(2)如中介效果顯著,便可通過(guò)中介變量尋找更多影響中介變量的自變量,這將有助于對(duì)因變量進(jìn)行更為全面而深入的研究;(3)以實(shí)務(wù)統(tǒng)計(jì)角度分析,對(duì)中介變量的調(diào)整及操控,可以對(duì)因變量發(fā)揮預(yù)測(cè)及控制作用。
自變量X對(duì)因變量Y的作用包括直接效果(c′)、間接效果(a×b)和總效果(c),其中直接效果及間接效果的識(shí)別是中介效果檢驗(yàn)的主要工作。自SEM方法引入科學(xué)研究以來(lái),中介效果的統(tǒng)計(jì)推斷技術(shù)大體經(jīng)歷了3種方法的變革。
(1)因果法(B-K method)
Baron和Kenny[12]最早提出了中介作用的因果檢驗(yàn)法。該方法通過(guò)建立三個(gè)回歸方程式,憑借回歸系數(shù)對(duì)中介作用的顯著性進(jìn)行判定。Me中介作用檢驗(yàn)的具體操作過(guò)程:
(1)Me=aX+ε……1→a≠0 且顯著;
(2)Y=cX+ε……2→c≠0 且顯著(總效果);
(3)Y=bMe+c′X+ε…3→b≠0 且顯著,
如c′≠0 為部分中介效果,c′=0 為完全中介效果
a、b均顯著,表明中介效果存在,c′如顯著,則中介變量發(fā)揮部分中介作用,如不顯著,則發(fā)揮完全中介作用。在某些學(xué)科的科研中,一些研究者多憑借路徑分析技術(shù),在因果法原理的指導(dǎo)下檢驗(yàn)中介效果的顯著性。伴隨著SEM應(yīng)用技術(shù)的日趨成熟,因果法的局限性逐漸暴露,包括:(1)因果法檢驗(yàn)中介效果的必要前提為c顯著,但在一些實(shí)際情況中,由于抑制效應(yīng)的存在[13],盡管c不顯著,仍然存在實(shí)際意義上的中介效果;(2)X對(duì)Me的作用(a)顯著,Me對(duì)Y的作用(b)顯著,但卻無(wú)法保證X通過(guò)Me對(duì)Y的作用(a×b)顯著。實(shí)際上,因果法并沒(méi)有對(duì)中介效應(yīng)(a×b)的顯著性進(jìn)行檢驗(yàn)。
(2)系數(shù)乘積法(sobel test)
基于因果法無(wú)法實(shí)現(xiàn)a×b顯著性檢驗(yàn)的功能,針對(duì)a×b顯著性檢驗(yàn)的系數(shù)乘積法[14]應(yīng)用而生,即系數(shù)乘積法。具體操作過(guò)程為:Sobel 檢驗(yàn)統(tǒng)計(jì)量為z值,計(jì)算公式z=ab/SEab,
其中,a與b均為非標(biāo)準(zhǔn)化系數(shù),SEa及SEb分別為a與b的標(biāo)準(zhǔn)誤,在α=0.05的檢驗(yàn)水準(zhǔn)下,z值>±1.96即為中介效果顯著。然而,系數(shù)乘積法最大的缺陷在于其在使用條件上要求樣本服從正態(tài)分布。在多數(shù)情況下,即使a和b均服從正態(tài)分布,a×b通常多不符合正態(tài)分布的要求[15-16]。同時(shí),|z|值>1.96在實(shí)務(wù)上并不代表一定顯著,中介效果在0.05的置信區(qū)間上是否顯著,仍有待于檢驗(yàn)[17]。經(jīng)回顧,既往多數(shù)科研文獻(xiàn)中尚未發(fā)現(xiàn)系數(shù)乘積法技術(shù)的應(yīng)用。
(3)置信區(qū)間法(bootstrapping method)
為解決因a×b非正態(tài)分布導(dǎo)致的中介效果顯著性檢驗(yàn)失效的問(wèn)題,Hayes[18]提出了bootstrapping技術(shù)。該技術(shù)的運(yùn)用原理是以研究樣本作為抽樣總體,經(jīng)多次重復(fù)抽樣(通常為2000次),重新建立起足以代表總體分布特征的新樣本(自舉樣本)。對(duì)于一個(gè)研究樣本,只能計(jì)算某個(gè)統(tǒng)計(jì)量(例如均值)的一個(gè)取值,無(wú)法獲知均值統(tǒng)計(jì)量的分布情況。但通過(guò)bootstrapping技術(shù)可以模擬出均值統(tǒng)計(jì)量的近似分布。有了這種數(shù)據(jù)分布便可計(jì)算相應(yīng)的統(tǒng)計(jì)量(Z值),用以推測(cè)實(shí)際總體的情況。同時(shí),bootstrapping技術(shù)亦可呈現(xiàn)Z值的置信區(qū)間,可進(jìn)一步用于假設(shè)檢驗(yàn)(a×b的置信區(qū)間如不包含0,表明間接效果成立)。
bootstrapping技術(shù)比上述2種中介效果檢驗(yàn)法具備更強(qiáng)的統(tǒng)計(jì)功效。隨著Amos軟件功能的不斷拓展,bootstrapping抽樣法對(duì)中介效果的檢驗(yàn)得到了廣泛應(yīng)用。然而,近5年的醫(yī)學(xué)相關(guān)學(xué)科,甚至是某些人文社會(huì)學(xué)科的科研文獻(xiàn)中,鮮見(jiàn)bootstrapping技術(shù)的運(yùn)用與報(bào)道。鑒于bootstrapping技術(shù)精準(zhǔn)的統(tǒng)計(jì)分析質(zhì)量,有必要在某些學(xué)科的科研中,特別是中介效應(yīng)探索的研究中進(jìn)行推廣。
3.忽略多因子無(wú)因果中介模型的中介效果檢驗(yàn)過(guò)程
bootstrapping技術(shù)僅用于驗(yàn)證單因子中介效果,對(duì)于多因子無(wú)因果中介模型的中介效果檢驗(yàn)?zāi)壳皯?yīng)用最為廣泛的技術(shù),即Preacher等[19]提出的SPSS Syntax語(yǔ)法編輯技術(shù),分別評(píng)估不同中介變量遠(yuǎn)程特定的間接效果。既往醫(yī)學(xué)相關(guān)學(xué)科的科研文獻(xiàn)中(亦包括某些人文社會(huì)科學(xué)文獻(xiàn)),雖有雙因子無(wú)因果中介模型的構(gòu)建,但尚未采用任何技術(shù)對(duì)各項(xiàng)中介因子的間接效果進(jìn)行單獨(dú)剖析,從而無(wú)法純化單一中介因子對(duì)因變量變異的貢獻(xiàn)程度。
SEM技術(shù)在各學(xué)科科研中的應(yīng)用日趨廣泛,其在潛變量與觀察變量間的結(jié)構(gòu)分析中以及潛變量間的關(guān)系分析中顯示了強(qiáng)大而精準(zhǔn)的統(tǒng)計(jì)優(yōu)勢(shì)。在SEM的應(yīng)用過(guò)程中,應(yīng)妥善處理MI的建議,并按照相應(yīng)的統(tǒng)計(jì)程序?qū)χ薪樽饔眠M(jìn)行顯著性檢驗(yàn),從而強(qiáng)化SEM技術(shù)的規(guī)范化使用,以提高其在科研中的統(tǒng)計(jì)判斷效能。
[1]J?reskog KG,Goldberger AS.Estimation of a model with multiple indicators and multiple causes of a single latent variable.Journal of the American Statistical Association,1975,70(351):631-639.
[2]Rigdon EE.Structural equation modeling:In modern methods for business research quantitative methodology.New Jersey:Lawrence Erlbaum Associates,1998:251-294.
[3]Hoyle RH,Panter AT.Writing about structural equation models,in structural equation modeling:concepts,issues,and applications.California:Sage publications,1995:158-176.
[4]MacCallum RC,Austin JT.Applications of structural equation modeling in psychological research.Annual Review of Psychology,2000,51:201-226.
[5]Hair JF,Anderson RE,Tatham RL,et al.Multivariate data analysis 5nd ed.New Jersey:Prentice Hall,1998:224-238.
[6]Raykov T,Marcoulides GA.A first course in structural equation modeling.New Jersey:Lawrence Erlbaum Associates,2006,210-224.
[7]MacCallum RC,Roznowski M,Nwcowitz LB.Model modifications in covariance structure analysis:The problem of capitalization on change.Psychological Bulletin,1992,111:490-504.
[8]Diamantopoulos A,Siguaw JA.Introducing LISREL:a guide for the uninitiated.California:Sage publications,2000:148-157.
[9]Hu L,Bentler PM.Cutoff criteria for fit indices in covariance structure analysis:Conventional criteria versus new alternatives.Structural Equation Modeling,1999,6(1):51-55.
[10]Jennifer CE,Kate BC,Lori AF.Development of a decisional balance scale for young adult marijuana use.Psychology Addict Behavior,2011,25(1):90-100
[11]Watt T,Groenvold M,Deng N,et al.Confirmatory factor analysis of the thyroid-related quality of life questionnaire ThyPRO.Health Quality Life Outcomes,2014,12:126.
[12]Baron RM,Kenny DA.The moderator-mediator variable distinction in social psychological research:Conceptual,strategic,and statistical considerations.Journal of Personality and Social Psychology,1986,51(6),1173-1182.
[13]Mackinnon DP,Kbull JL,Lockwood CM.Equivalence of the mediation,confounding and suppression effect.Prevention Science,2000,1(4):173-181.
[14]Sobel ME.Asymptotic intervals for indirect effects in structural equations models.San Francisco:Jossey-Bass,1982:290-312.
[15]Bollen KA,Stine R.Direct and indirects:Classical and bootstrap estimates of variability.Sociological Methodology,1990,20(1):150-140.
[16]Stone CA,Sobel ME.The robustness of total indirect effects in covariance structure models estimated with maximum likelihood.Psychometrika,1990,55(2):337-352.
[17]Mackinnon DP,Lockwood CM,Williams J.Confidence limits for the indirect effect:Distribution of the product and resampling methods.Multivariate Behavioral Research,2004,39(1):99-128.
[18]Hayes AF.Beyond Baron and Kenny:Statistical mediation analysis in the new millennium.Journal of Communication Monographs,2009,76(4):408-420.
[19]Preacher KJ,Hayes AF.Asymptotic and resampling strategies for assessing and comparing indirect effects in multiple mediator models.Behavior Research Models,2008,40(3):879-891.
(責(zé)任編輯:劉 壯)
* 本文獲國(guó)家社會(huì)科學(xué)基金項(xiàng)目資助(項(xiàng)目編號(hào):13CRK009)
△ 通信作者:王麗娜,E-mail:aring2000@163.com
中國(guó)衛(wèi)生統(tǒng)計(jì)2017年2期