王 凱 陳方堯 譚 銘 陳平雁△
【提 要】 目的 建立一種新的用于評(píng)價(jià)結(jié)構(gòu)方程模型(SEM)擬合效果的方法—校正擬合指數(shù)(CGFI)。方法 在已有擬合指數(shù)(GFI)方法的基礎(chǔ)上,通過(guò)增加1/(N-1)項(xiàng)校正樣本量導(dǎo)致的低估效應(yīng),通過(guò)自由度與變量個(gè)數(shù)的比值項(xiàng)對(duì)模型的復(fù)雜程度進(jìn)行懲罰,構(gòu)建了CGFI,表達(dá)為:CGFI=1-[dftest/k(k+1)][1-GFI-1/(N-1)]?;陬A(yù)設(shè)的SEM,采用Monte Carlo技術(shù)模擬產(chǎn)生數(shù)據(jù),考慮樣本量、參數(shù)估計(jì)方法、模型誤設(shè)類型及誤設(shè)程度四種因素,將所提出的CGFI與其他3種擬合指數(shù)(GFI,AGFI,PGFI)進(jìn)行比較。評(píng)價(jià)標(biāo)準(zhǔn)基于穩(wěn)健性和對(duì)模型誤設(shè)的敏感性。結(jié)果 CGFI較GFI有一定改善效果,受樣本量的影響更小,對(duì)模型誤設(shè)更為敏感;GFI和AGFI受樣本量的影響較大,在樣本量較小時(shí)存在一定低估。PGFI對(duì)模型誤設(shè)不敏感,且存在較為嚴(yán)重低估。GLS參數(shù)估計(jì)方法在模型嚴(yán)重誤設(shè)時(shí)容易得到反常的結(jié)果。結(jié)論 CGFI較GFI有較好的表現(xiàn),臨界值為0.95,可用于模型擬合效果的評(píng)價(jià)。
結(jié)構(gòu)方程模型(structural equation modeling,SEM)擬合效果的評(píng)價(jià)有大量研究[1-5]。一般認(rèn)為,一個(gè)良好的評(píng)價(jià)指數(shù)應(yīng)該具備以下特性:①對(duì)各類型模型誤設(shè)(指模型參數(shù)的錯(cuò)誤設(shè)定,如當(dāng)總體參數(shù)非零時(shí)將其設(shè)定為零等)敏感;②不受樣本量、數(shù)據(jù)分布形態(tài)和參數(shù)估計(jì)方法的影響;③對(duì)參數(shù)過(guò)多的模型進(jìn)行懲罰[6-7]。
Joreskog和Sorbom[8]提出了擬合指數(shù)(goodness-of-fit index,GFI)方法,其思想是度量樣本協(xié)方差陣和理論模型協(xié)方差陣之間接近的程度;GFI值越大擬合效果越好。GFI雖然是最常用的指標(biāo),但對(duì)其卻褒貶不一。Bollen和Stine[9]發(fā)現(xiàn),當(dāng)模型嚴(yán)重誤設(shè)時(shí)會(huì)出現(xiàn)GFI值較大的矛盾結(jié)論;Gerbing[10]和Marsh[11]指出,GFI和樣本量之間存在較大的正向相關(guān)關(guān)系,并在樣本量有限時(shí)存在一定的低估。而Tanaka[12]和Sugawara[13]認(rèn)為GFI不受樣本量和參數(shù)估計(jì)方法的影響。針對(duì)GFI可能存在的問(wèn)題,Joreskog[8]和Mulaik[14]先后提出對(duì)自由度和待估參數(shù)進(jìn)行懲罰的調(diào)整GFI(adjusted-goodness-of-fit index,AGFI)和無(wú)偏GFI(parsimony unbiased goodness-of-fit index,PGFI),理論認(rèn)為這兩種指數(shù)較GFI有更好的性能,但尚缺乏研究證據(jù)的支持。
鑒于GFI一類指數(shù)的不足,本研究將在GFI方法的基礎(chǔ)上提出一種新的校正GFI(corrected goodness-of-fit index,CGFI)方法,以期較目前的GFI一類指數(shù)有更好的統(tǒng)計(jì)性能。
GFI一類指數(shù)包括GFI,AGFI和PGFI,其定義和特性見(jiàn)表1。
表1 三種擬合指數(shù)的定義和特性
*:S-樣本的協(xié)方差陣,Σ-估計(jì)的理論模型協(xié)方差陣,I-單位矩陣,dftest-理論模型的自由度,P-觀測(cè)變量的個(gè)數(shù)。
(1)
采用Monte Carlo技術(shù),對(duì)研究提出的CGFI方法與其他GFI一類方法進(jìn)行模擬比較。構(gòu)建的理論模型見(jiàn)圖1,包含4個(gè)潛變量,每個(gè)潛變量包括5個(gè)觀測(cè)變量。
圖1 理論模型圖
本研究考慮兩種模型誤設(shè)類型:測(cè)量模型誤設(shè)和結(jié)構(gòu)模型誤設(shè)(見(jiàn)表2)。
①測(cè)量模型的輕度誤設(shè)為,將觀測(cè)變量X5誤設(shè)為潛變量FB的條目;重度誤設(shè)為,將觀測(cè)變量X5誤設(shè)為潛變量FB的條目,觀測(cè)變量X7誤設(shè)為潛變量FA的條目。
②結(jié)構(gòu)模型的輕度誤設(shè)為,將FA和FB之間的協(xié)方差誤設(shè)為0,F(xiàn)A和FC之間的回歸系數(shù)誤設(shè)為0;重度誤設(shè)為,將FA和FB之間的協(xié)方差和所有的回歸系數(shù)誤設(shè)為0。
表2 模型設(shè)定情況
樣本量設(shè)定為150,200,300,400,500,600,800,1000,1500,2000,5000共11種;參數(shù)估計(jì)方法為最大似然估計(jì)(ML)和廣義最小二乘(GLS)2種。觀測(cè)值服從正態(tài)分布。模擬次數(shù)設(shè)定為1000次。
模擬研究通過(guò)SAS(v.9.4;SAS Institute Inc,Cary,NC)實(shí)現(xiàn)。模擬數(shù)據(jù)通過(guò)SAS PROC IML產(chǎn)生,結(jié)構(gòu)方程建模由SAS MACRO和SAS PROC CALIS完成[16],所得結(jié)果進(jìn)行基本描述分析和析因設(shè)計(jì)的方差分析,統(tǒng)計(jì)檢驗(yàn)水準(zhǔn)α為0.05(雙側(cè))。
模擬研究中,迭代次數(shù)設(shè)置為1,000,000次,以避免迭代不收斂。本研究的后續(xù)分析是基于全數(shù)據(jù)集下的結(jié)果。負(fù)方差的情況見(jiàn)表3。結(jié)果顯示,負(fù)方差的情況只在GLS方法下出現(xiàn),測(cè)量模型誤設(shè)更容易導(dǎo)致負(fù)方差的結(jié)果;同時(shí)模型誤設(shè)程度越大,出現(xiàn)負(fù)方差的比例也越大。
表3 負(fù)方差的基本情況(GLS方法)
*:N var-負(fù)方差,P var-正方差,ML方法下沒(méi)有出現(xiàn)負(fù)方差的情況,因此不在表中給出。
對(duì)模擬數(shù)據(jù)進(jìn)行析因設(shè)計(jì)的方差分析,考慮的因素為樣本量、參數(shù)估計(jì)方法、模型誤設(shè)類型及誤設(shè)程度,通過(guò)分析每個(gè)因素的方差占總方差的比例,即方差貢獻(xiàn)率[2,16-19],來(lái)量化評(píng)價(jià)各因素對(duì)擬合指數(shù)的影響大小。兩種模型誤設(shè)類型下各因素對(duì)擬合指數(shù)的方差貢獻(xiàn)率結(jié)果見(jiàn)表4。
(2)
*:Misspecification(M)-模型誤設(shè)程度,Sample Size(SS)-樣本量,Estimation Method(EM)-參數(shù)估計(jì)方法。
如表4所示,測(cè)量模型誤設(shè)下,GFI、AGFI、PGFI三種指數(shù)有一致的結(jié)果,受樣本量的影響為0.520,對(duì)模型誤設(shè)的敏感性為0.272;CGFI與其他三種指數(shù)比較,受樣本量的影響有一定的降低(0.484),對(duì)模型誤設(shè)的敏感性也有部分提高(0.293)。結(jié)構(gòu)模型誤設(shè)下,不管是從樣本量(0.221 vs 0.257)還是模型誤設(shè)敏感性(0.471 vs 0.445)角度,CGFI都較GFI有一定的改善;AGFI和GFI有相似的結(jié)果,而PGFI較GFI來(lái)說(shuō),受樣本量的影響更大(0.331 vs 0.257),對(duì)模型誤設(shè)較不敏感(0.273 vs 0.445),表現(xiàn)出較差的效果。
(1)真模型下擬合指數(shù)的變化趨勢(shì)
圖2顯示,在真模型情況下四種指數(shù)分別采用ML和GLS方法時(shí)隨樣本量變化的趨勢(shì)。采用ML方法,GFI和AGFI在樣本量小于300時(shí)存在明顯低估,并較大程度上受樣本量的影響;當(dāng)樣本量逐漸增大時(shí),這一現(xiàn)象逐漸消失,并趨近于理論真值。PGFI在所有樣本量情況下都存在較嚴(yán)重的低估。相對(duì)而言,CGFI在樣本量小于300時(shí)僅存在輕微低估,受樣本量的影響也較小,說(shuō)明CGFI優(yōu)于GFI。
采用GLS方法的結(jié)果基本與ML方法一致。對(duì)比兩種參數(shù)估計(jì)方法下的結(jié)果來(lái)看,真模型下四種擬合指數(shù)基本不受參數(shù)估計(jì)方法的影響,表現(xiàn)出較為穩(wěn)健的結(jié)果。
圖2 真模型下四種擬合指數(shù)在不同參數(shù)估計(jì)方法下隨樣本量變化的趨勢(shì)
(2)測(cè)量模型誤設(shè)下擬合指數(shù)的變化趨勢(shì)
圖3顯示,在測(cè)量模型輕度誤設(shè)情況下四種指數(shù)分別采用ML和GLS方法時(shí)隨樣本量變化的趨勢(shì)。采用ML方法時(shí),GFI和AGFI受樣本量的影響較為明顯,且在樣本量小于300時(shí)存在一定低估,PGFI則存在明顯低估。相比而言,CGFI受樣本量的影響較小,在樣本量小于300時(shí)有輕微低估。GLS方法的結(jié)果也基本一致。綜合兩種參數(shù)估計(jì)方法的結(jié)果看,CGFI的臨界值應(yīng)高于常規(guī)臨界值0.90,初步確定為0.95。
圖3 測(cè)量模型輕度誤設(shè)下四種擬合指數(shù)在不同參數(shù)估計(jì)方法下隨樣本量變化的趨勢(shì)
圖4顯示,測(cè)量模型重度誤設(shè)情況下四種指數(shù)分別采用ML和GLS方法時(shí)隨樣本量變化的趨勢(shì)。采用ML方法,結(jié)論基本和測(cè)量模型輕度誤設(shè)下一致,CGFI基本在假定的臨界值0.95下方,說(shuō)明這一假定尚且合理。當(dāng)采用GLS方法時(shí),GFI、AGFI和CGFI的結(jié)果都高于臨界值,得出矛盾結(jié)論,說(shuō)明在測(cè)量模型重度誤設(shè)情況下,GLS方法得到的四種擬合指數(shù)值不能合理的反映模型擬合效果。
圖4 測(cè)量模型重度誤設(shè)下四種擬合指數(shù)在不同參數(shù)估計(jì)方法下隨樣本量變化的趨勢(shì)
(3)結(jié)構(gòu)模型誤設(shè)下擬合指數(shù)的變化趨勢(shì)
圖5顯示,結(jié)構(gòu)模型輕度誤設(shè)下四種指數(shù)采用ML和GLS方法時(shí)隨樣本量變化的趨勢(shì)。兩種參數(shù)估計(jì)方法的結(jié)果和測(cè)量模型輕度誤設(shè)下的情況基本一致,CGFI受樣本量的影響較小,且均在假定的臨界值0.95之上。
圖6顯示,結(jié)構(gòu)模型重度誤設(shè)情況下四種指數(shù)分別采用ML和GLS方法時(shí)隨樣本量變化的趨勢(shì)。兩種參數(shù)估計(jì)方法的結(jié)果和測(cè)量模型重度誤設(shè)下的情況基本一致,CGFI均在假定的臨界值0.95之下,GLS方法的結(jié)果同樣出現(xiàn)反常情況,不能合理反映模型擬合效果。
圖5 結(jié)構(gòu)模型輕度誤設(shè)下四種擬合指數(shù)在不同參數(shù)估計(jì)方法下隨樣本量變化的趨勢(shì)
圖6 結(jié)構(gòu)模型重度誤設(shè)下四種擬合指數(shù)在不同參數(shù)估計(jì)方法下隨樣本量變化的趨勢(shì)
本研究在GFI方法基礎(chǔ)上構(gòu)建了CGFI,基于的思想是通過(guò)校正樣本量糾正低估效應(yīng),通過(guò)調(diào)整自由度及待估參數(shù)對(duì)復(fù)雜模型進(jìn)行懲罰。
復(fù)雜程度會(huì)影響到研究結(jié)果的穩(wěn)健性[15,20],研究指出,當(dāng)SEM包含2~6個(gè)潛變量,每個(gè)潛變量包含2~6個(gè)觀測(cè)變量時(shí),所得結(jié)果相對(duì)穩(wěn)健[9,20]。因此,我們?cè)谀M研究中構(gòu)建的理論模型包含4個(gè)潛變量,每個(gè)潛變量包括5個(gè)觀測(cè)變量,此設(shè)定與實(shí)際情況較為接近,模擬所得結(jié)論更具一般性。
在模型誤設(shè)方面,雖然有學(xué)者提出檢驗(yàn)效能可以較為精確地量化模型誤設(shè)的程度,但該方法受樣本量的影響較大,將其作為量化指標(biāo)并不科學(xué)[1,17]。因此,本研究從定性角度考慮兩種誤設(shè)程度,即輕度誤設(shè)和重度誤設(shè)[17-20],并盡量保持兩種測(cè)量模型和結(jié)構(gòu)模型的誤設(shè)程度相當(dāng),確保研究結(jié)論的可靠[18-19]。
有研究指出,數(shù)據(jù)的正態(tài)性對(duì)擬合指數(shù)的影響較小[3,18],故本研究的模擬數(shù)據(jù)基于正態(tài)分布條件下產(chǎn)生,未考慮其他分布類型。
由于負(fù)方差問(wèn)題(亦稱Heywood問(wèn)題[21-22])不可避免,我們比較了包含和不包含負(fù)方差的分析結(jié)果,發(fā)現(xiàn)兩者差異不大,可以忽略。出現(xiàn)負(fù)方差的主要原因之一是模型誤設(shè),負(fù)方差率越大,說(shuō)明模型誤設(shè)越嚴(yán)重。此外,測(cè)量模型更容易發(fā)生負(fù)方差問(wèn)題,模擬結(jié)果與已有研究結(jié)果一致[16,21]。
GFI和AGFI受樣本量的影響較大,尤其是在樣本量小于300時(shí),還存在一定低估,這一結(jié)論與Gerbing[10]和Marsh[11]的結(jié)果一致。由于GFI和AGFI利用到樣本的協(xié)方差陣信息,而協(xié)方差陣在樣本量較小時(shí)不夠穩(wěn)定,但隨著樣本量的增大會(huì)漸趨穩(wěn)定。CGFI是在GFI的基礎(chǔ)上對(duì)樣本量和模型復(fù)雜程度進(jìn)行了校正,與其他三種指數(shù)比較,CGFI受樣本量的影響有所降低,對(duì)模型誤設(shè)的敏感性也有所提高。
根據(jù)模擬結(jié)果,CGFI的臨界值確定為0.95,因?yàn)樵撆R界值在不同樣本量、不同參數(shù)估計(jì)方法、不同模型誤設(shè)類型及誤設(shè)程度時(shí)所表現(xiàn)的穩(wěn)定性。PGFI雖然也是在GFI的基礎(chǔ)上對(duì)模型復(fù)雜程度進(jìn)行了校正,但從結(jié)果看,該指數(shù)受樣本量的影響較為嚴(yán)重,且在不同模型情況下,均存在較嚴(yán)重的低估。因此,使用該指數(shù)應(yīng)謹(jǐn)慎。在模型誤設(shè)嚴(yán)重的情況下,GLS方法容易導(dǎo)致四種擬合指數(shù)值出現(xiàn)矛盾現(xiàn)象,這和Bollen和 Stine[9]的研究相吻合。
本研究雖然發(fā)現(xiàn)CGFI優(yōu)于其他三種指數(shù),但是并未將CGFI和RMSEA等其他常用指數(shù)進(jìn)行比較研究;同時(shí),結(jié)構(gòu)方程模型復(fù)雜多樣,本研究尚未考慮每個(gè)潛變量下觀測(cè)變量數(shù)目及因子載荷大小的影響,因此本研究結(jié)論具有一定的局限性。
GFI和AGFI在樣本量較小時(shí)存在低估,PGFI對(duì)模型誤設(shè)不敏感,且存在較為嚴(yán)重的低估。我們提出的CGFI方法比現(xiàn)有方法GFI、AGFI和PGFI均有較好的性能,可用于結(jié)構(gòu)方程模型擬合效果的評(píng)價(jià),應(yīng)用時(shí)推薦臨界值為0.95。