周映雪 歐春泉△ 趙智濤 彭成華 陸夢(mèng)潔
基于多項(xiàng)相關(guān)系數(shù)的結(jié)構(gòu)方程模型在大學(xué)生自我學(xué)習(xí)期望影響因素研究中的應(yīng)用*
周映雪1歐春泉1△趙智濤2彭成華2陸夢(mèng)潔1
目的 構(gòu)建基于多項(xiàng)相關(guān)系數(shù)的結(jié)構(gòu)方程模型,探討大學(xué)生自我學(xué)習(xí)期望的影響機(jī)制,為有序分類數(shù)據(jù)的結(jié)構(gòu)方程模型分析提供參考依據(jù)。方法 本研究借助AMOS和R語(yǔ)言,對(duì)廣州某重點(diǎn)醫(yī)科大學(xué)新生入學(xué)調(diào)查數(shù)據(jù)進(jìn)行基于多項(xiàng)相關(guān)系數(shù)的結(jié)構(gòu)方程模型分析。結(jié)果 在驗(yàn)證性因子分析中,基于Pearson相關(guān)的因子載荷均明顯低于基于多項(xiàng)相關(guān)的因子載荷;學(xué)術(shù)自我效能、學(xué)術(shù)目標(biāo)、社會(huì)目標(biāo)對(duì)自我學(xué)習(xí)期望均有正向影響(P<0.05);學(xué)術(shù)自我效能、學(xué)術(shù)目標(biāo)、社會(huì)目標(biāo)、經(jīng)濟(jì)目標(biāo)兩兩間正相關(guān)(P<0.05)。結(jié)論 分析有序分類數(shù)據(jù),基于多項(xiàng)相關(guān)系數(shù)的結(jié)構(gòu)方程模型能獲得更準(zhǔn)確的模型。大學(xué)生提高學(xué)術(shù)自我效能、學(xué)術(shù)目標(biāo)、社會(huì)目標(biāo)有助于提高自我學(xué)習(xí)期望,而經(jīng)濟(jì)目標(biāo)可能通過(guò)學(xué)術(shù)目標(biāo)、社會(huì)目標(biāo)間接影響自我學(xué)習(xí)期望。
多項(xiàng)相關(guān)系數(shù) 結(jié)構(gòu)方程模型 自我學(xué)習(xí)期望
*:廣東省大學(xué)生創(chuàng)新實(shí)驗(yàn)計(jì)劃項(xiàng)目(1212111029)
1.南方醫(yī)科大學(xué)公共衛(wèi)生與熱帶醫(yī)學(xué)學(xué)院生物統(tǒng)計(jì)學(xué)系(510515)
2.南方醫(yī)科大學(xué)教務(wù)處
△通信作者:歐春泉,E-mail:ouchunquan@hotmail.com
近年來(lái)結(jié)構(gòu)方程模型(structure equation model,SEM)已經(jīng)廣泛應(yīng)用于教育、心理、醫(yī)學(xué)等領(lǐng)域中的數(shù)據(jù)分析〔1〕,依此可揭示出多個(gè)潛在變量、觀察變量以及測(cè)量誤差之間的內(nèi)在關(guān)系。傳統(tǒng)的SEM是以Pearson線性相關(guān)系數(shù)為基礎(chǔ)來(lái)估計(jì)參數(shù),理論上要求資料服從正態(tài)分布。然而,在應(yīng)用量表的調(diào)查中,調(diào)查的條目大多為有序分類數(shù)據(jù)。近年統(tǒng)計(jì)研究表明,當(dāng)有序分類數(shù)據(jù)不服從正態(tài)分布時(shí),以Pearson相關(guān)為基礎(chǔ)的估計(jì)法在模型參數(shù)的估計(jì)值、標(biāo)準(zhǔn)誤和因子間相關(guān)系數(shù)三項(xiàng)指標(biāo)上都存在較大的偏差,而應(yīng)用多項(xiàng)相關(guān)系數(shù)為基礎(chǔ)對(duì)SEM中的參數(shù)進(jìn)行估計(jì)則偏差很小,可獲得更準(zhǔn)確的模型〔2-3〕。然而國(guó)內(nèi)缺乏該法的實(shí)證研究,有待進(jìn)一步與傳統(tǒng)的基于Pearson相關(guān)的方法進(jìn)行比較〔4-5〕。本研究利用廣州某重點(diǎn)醫(yī)科大學(xué)新生入學(xué)調(diào)查數(shù)據(jù),借助AMOS和R語(yǔ)言構(gòu)建基于多項(xiàng)相關(guān)系數(shù)的SEM,探討大學(xué)生自我學(xué)習(xí)期望的影響機(jī)制,為有序分類數(shù)據(jù)的SEM分析提供參考。
對(duì)廣州市某重點(diǎn)醫(yī)科大學(xué)的全部新生進(jìn)行學(xué)前調(diào)查,調(diào)查對(duì)象共計(jì)2497人,其中男生933人(37.4%),女生 1484 人(59.4%),80 人(3.2%)的性別信息缺失,平均年齡(18.74±0.93)歲。入讀臨床醫(yī)學(xué)類專業(yè)的有 622人(24.9%),中醫(yī)學(xué)類專業(yè) 283人(11.3%),預(yù)防醫(yī)學(xué)類專業(yè)150人(6%),護(hù)理專業(yè)126 人(5%),其他專業(yè)1316 人(52.7%)。
本研究采用調(diào)查表是在美國(guó)高等教育研究機(jī)構(gòu)編制的大學(xué)新生調(diào)查表基礎(chǔ)上改編而成〔6〕。我們將該調(diào)查表與錄取通知書(shū)一并郵寄給新生,學(xué)生入學(xué)報(bào)到時(shí)交回問(wèn)卷。調(diào)查表包括學(xué)生的基本情況以及行為習(xí)慣、認(rèn)知等多個(gè)方面,其中與本研究自我學(xué)習(xí)期望有關(guān)的一個(gè)條目為“大學(xué)成績(jī)良好以上”;分析可能對(duì)自我學(xué)習(xí)期望產(chǎn)生影響的四個(gè)方面內(nèi)容:學(xué)術(shù)自我效能、經(jīng)濟(jì)目標(biāo)、社會(huì)目標(biāo)、學(xué)術(shù)目標(biāo)等,共由15個(gè)條目來(lái)反映。各條目采用4~7級(jí)記分方式。
結(jié)合多項(xiàng)相關(guān)與結(jié)構(gòu)方程模型進(jìn)行數(shù)據(jù)分析。結(jié)構(gòu)方程模型的基本原理是使包含各估計(jì)參數(shù)的模型協(xié)方差矩陣與樣本協(xié)方差矩陣或樣本相關(guān)矩陣的距離最小,關(guān)鍵問(wèn)題是如何構(gòu)建相關(guān)矩陣。本研究資料為有序分類數(shù)據(jù),以樣本的多項(xiàng)相關(guān)矩陣為基礎(chǔ)來(lái)估計(jì)結(jié)構(gòu)方程模型的參數(shù)。
(1)多項(xiàng)相關(guān)矩陣的構(gòu)建原理
假設(shè)X,Y為兩個(gè)有序分類觀察變量,如兩條目的選擇情況,分別具有r、s個(gè)分類。X,Y的真實(shí)值定義為兩個(gè)潛變量ξ和η。X和ξ的關(guān)系可表達(dá)為:當(dāng)x=1,則a0<ξ<a1;當(dāng)x=2,則a1≤ξ<a2;…;當(dāng)x=r,則ar-1≤ξ<ar。Y和 η 的關(guān)系同理,其中b0,b1,…,bs作為η的邊界值,且a0=b0=-∞,ar=bs=+∞。我們期望得到的是兩個(gè)潛變量間的相關(guān)系數(shù)ρξη,稱為多項(xiàng)相關(guān)系數(shù)。假設(shè)ξ和η服從標(biāo)準(zhǔn)二元正態(tài)分布,其概率密度函數(shù) φ(ξ,η;ρ)為:
那么,觀察值x=xi,y=yj的可能性就為
若x=xi,y=yj的樣本例數(shù)為nij,則樣本的對(duì)數(shù)似然函數(shù)為
最后,根據(jù)對(duì)數(shù)似然函數(shù),求ρ的最大似然估計(jì)值,即為分類變量X與Y的多項(xiàng)相關(guān)系數(shù)。
多項(xiàng)相關(guān)系數(shù)的估計(jì)方法主要有兩種:聯(lián)合最大似然估計(jì)法和兩步法。兩步法指用邊界點(diǎn)的邊界累積比率來(lái)取代其估計(jì)值,然后只對(duì)相關(guān)系數(shù)進(jìn)行最大似然估計(jì)。然而聯(lián)合最大似然估計(jì)法需要同時(shí)對(duì)相關(guān)系數(shù)和邊界點(diǎn)進(jìn)行估計(jì),當(dāng)變量分類較多時(shí),計(jì)算量大,而兩步法是聯(lián)合最大似然估計(jì)法的簡(jiǎn)便算法,二者估計(jì)結(jié)果非常接近〔7〕。因此,兩步法是估計(jì)多項(xiàng)相關(guān)系數(shù)的常用方法。
(2)測(cè)量模型的信效度評(píng)價(jià)
以基于多項(xiàng)相關(guān)矩陣的驗(yàn)證性因子分析的因子載荷為基礎(chǔ),計(jì)算信效度指標(biāo)。Cronbach α系數(shù)、組合信度(composite reliability,CR)是評(píng)價(jià)潛變量的觀察變量間內(nèi)部一致性程度的指標(biāo),有研究指出組合信度比Cronbach α 系數(shù)更穩(wěn)健〔8〕,達(dá) 0.7 或以上表明組合信度佳,故本研究以CR為主要判斷標(biāo)準(zhǔn),次要標(biāo)準(zhǔn)為Cronbach α系數(shù)(α≥0.6)。測(cè)量模型的構(gòu)建效度包括聚合效度和區(qū)別效度兩方面,評(píng)價(jià)指標(biāo)采用平均方差抽取量(average variance extracted,AVE),即潛變量所能解釋觀察變量變異量的程度。潛變量的AVE>0.5則表明聚合效度佳,若潛變量的AVE都大于該潛變量與其他潛變量相關(guān)系數(shù)的平方,則表明區(qū)別效度佳〔8〕。
(3)結(jié)構(gòu)模型建立和評(píng)價(jià)
通過(guò)驗(yàn)證性因子分析剔除信度較低的條目后,確定最終的測(cè)量模型,然后結(jié)合專業(yè)知識(shí)確定各變量之間的因果關(guān)系,建立基于多項(xiàng)相關(guān)系數(shù)的結(jié)構(gòu)模型,采用多種指標(biāo)綜合評(píng)價(jià)模型的擬合效果。常規(guī)推薦使用的穩(wěn)健評(píng)價(jià)指標(biāo)及可接受標(biāo)準(zhǔn)如下〔9〕:比較擬合指數(shù)(CFI)≥0.95,增值擬合指數(shù)(IFI)≥0.95,規(guī)范擬合指數(shù)(NFI)≥0.95,非規(guī)范擬合指數(shù)(NNFI)≥0.95,近似誤差均方根(RMSEA)≤0.06。
(4)統(tǒng)計(jì)軟件
用Epidata3.1軟件建立數(shù)據(jù)庫(kù),雙人雙邊錄入核對(duì)。先采用R 2.11.0提供的Polycor軟件包用兩步法估計(jì)多項(xiàng)相關(guān)矩陣,在此基礎(chǔ)上,應(yīng)用AMOS 7.0軟件建構(gòu)自我學(xué)習(xí)期望影響因素的測(cè)量模型和結(jié)構(gòu)模型,模型的參數(shù)估計(jì)采用最大似然法。
采用基于多項(xiàng)相關(guān)矩陣的驗(yàn)證性因子分析驗(yàn)證潛變量為學(xué)術(shù)自我效能、學(xué)術(shù)目標(biāo)、經(jīng)濟(jì)目標(biāo)、社會(huì)目標(biāo)的測(cè)量模型。為使條目更好地反映潛變量,我們剔除因子載荷低于0.5的一個(gè)條目(寫作能力),最終確定各潛變量的測(cè)量模型(如表1)。模型擬合指數(shù)均達(dá)可接受標(biāo)準(zhǔn):CFI=0.992,IFI=0.992,NFI=0.988,NNFI=0.982,RMSEA=0.031。各因子的載荷在 0.64~0.82之間,說(shuō)明條目信度較好。該資料如果采用基于Pearson相關(guān)矩陣的方法建立模型,各個(gè)因子的載荷均明顯降低,詳見(jiàn)表1。
表1 潛變量與條目間的因子載荷
表2顯示:除了經(jīng)濟(jì)目標(biāo)的組合信度稍低于0.7(CR=0.6),聚合效度稍低于 0.5(AVE=0.43),各潛變量的Cronbach α系數(shù)、組合信度、聚合效度和區(qū)別效度等總體來(lái)說(shuō)均達(dá)到可接受標(biāo)準(zhǔn),說(shuō)明潛變量具有良好的信度和構(gòu)建效度,各條目較好地反映潛變量。
表2 測(cè)量模型的信效度指標(biāo)
為探討自我學(xué)習(xí)期望的影響因素,以自我學(xué)習(xí)期望為因變量,學(xué)術(shù)自我效能、學(xué)術(shù)目標(biāo)、社會(huì)目標(biāo)和經(jīng)濟(jì)目標(biāo)為自變量,允許各自變量間存在兩兩相關(guān),建構(gòu)結(jié)構(gòu)模型如圖1。模型擬合效果為:CFI=0.984,IFI=0.984,NFI=0.980,NNFI=0.971,RMSEA=0.038,均達(dá)可接受標(biāo)準(zhǔn),說(shuō)明所建構(gòu)的模型與觀察數(shù)據(jù)適配。對(duì)圖中路徑系數(shù)(標(biāo)準(zhǔn)化回歸系數(shù))的顯著性檢驗(yàn)可知,學(xué)術(shù)自我效能、學(xué)術(shù)目標(biāo)、社會(huì)目標(biāo)對(duì)自我學(xué)習(xí)期望均有顯著性的正向直接影響,標(biāo)準(zhǔn)化回歸系數(shù)為0.11 ~0.43(P<0.001),而經(jīng)濟(jì)目標(biāo)的直接影響不顯著(P=0.729),各潛變量?jī)蓛砷g顯著相關(guān)(P<0.001)。
圖1 自我學(xué)習(xí)期望的結(jié)構(gòu)模型
對(duì)于有序分類數(shù)據(jù)的結(jié)構(gòu)方程模型分析,本研究比較了在驗(yàn)證性因子分析中基于Pearson相關(guān)矩陣的因子載荷與基于多項(xiàng)相關(guān)矩陣的因子載荷間的差別,結(jié)果發(fā)現(xiàn)基于Pearson相關(guān)矩陣的因子載荷均明顯低于基于多項(xiàng)相關(guān)矩陣的因子載荷。Olsson研究發(fā)現(xiàn):對(duì)有序分類數(shù)據(jù)進(jìn)行基于Pearson相關(guān)方法的驗(yàn)證性因子分析時(shí),若存在數(shù)據(jù)呈偏態(tài)分布、分類數(shù)目較少、真實(shí)的因子載荷較高等問(wèn)題,都將導(dǎo)致普通的因子分析結(jié)果產(chǎn)生偏差,尤其是數(shù)據(jù)嚴(yán)重偏度時(shí)即使分類數(shù)較多仍然存在較大偏差〔10〕。Distefano的模擬研究也指出:有序分類數(shù)據(jù)不服從正態(tài)分布時(shí),以Pearson相關(guān)為基礎(chǔ)的估計(jì)法在參數(shù)估計(jì)值、標(biāo)準(zhǔn)誤和因子間相關(guān)系數(shù)三項(xiàng)指標(biāo)上都存在較大的偏差,而以多項(xiàng)相關(guān)為基礎(chǔ)的估計(jì)值則偏差很小〔11〕。因此,分析有序分類數(shù)據(jù)時(shí),通常情況下推薦使用基于多項(xiàng)相關(guān)的結(jié)構(gòu)方程模型,可獲得更準(zhǔn)確的模型估計(jì)。
軟件應(yīng)用方面,LISREL、Mplus和EQS均能直接使用基于多項(xiàng)相關(guān)的方法進(jìn)行分析,而應(yīng)用人員普遍使用的AMOS軟件尚缺乏該功能,只能通過(guò)從外部導(dǎo)入多項(xiàng)相關(guān)矩陣進(jìn)行分析。SPSS等簡(jiǎn)便的統(tǒng)計(jì)軟件不能直接估計(jì)多項(xiàng)相關(guān)系數(shù)。本研究嘗試應(yīng)用R軟件提供的Polycor軟件包來(lái)計(jì)算多項(xiàng)相關(guān)矩陣,并在AMOS中構(gòu)建基于多項(xiàng)相關(guān)系數(shù)的結(jié)構(gòu)方程模型,可為應(yīng)用AMOS軟件分析有序分類數(shù)據(jù)提供參考。
本研究通過(guò)探討學(xué)生的自我效能和目標(biāo)對(duì)自我學(xué)習(xí)期望的影響,可為高校教育管理者指導(dǎo)學(xué)生提高學(xué)習(xí)動(dòng)機(jī)提供參考依據(jù)。我們發(fā)現(xiàn)學(xué)生的自我學(xué)習(xí)期望與學(xué)術(shù)自我效能、學(xué)術(shù)目標(biāo)、社會(huì)目標(biāo)有關(guān),而經(jīng)濟(jì)目標(biāo)可能通過(guò)學(xué)術(shù)目標(biāo)、社會(huì)目標(biāo)間接影響自我學(xué)習(xí)期望。所以,教育管理者可鼓勵(lì)學(xué)生增強(qiáng)學(xué)習(xí)能力方面的自信,適當(dāng)建立符合自身實(shí)際情況的學(xué)術(shù)目標(biāo),培養(yǎng)較高的社會(huì)責(zé)任心,以此增加學(xué)習(xí)動(dòng)力,從而激勵(lì)自我學(xué)習(xí)期望,來(lái)獲得更高的學(xué)業(yè)成就。
1.陳炳為,陳啟光,許碧云.潛在變量模型及其在中醫(yī)證候中的應(yīng)用概述.中國(guó)衛(wèi)生統(tǒng)計(jì),2009,26(5):535-538.
2.Babakus E,F(xiàn)erguson CE,J?reskog KG.The sensitivity of confirmatory maximum likelihood factor analysis to violations of measurement scale and distributional assumptions.Journal of Marketing Research,1987,24(2):222-228.
3.Rigdon EE,F(xiàn)erguson CE.The performance of the polychoric correlation coefficient and selected fitting functions in confirmatory factor analysis with ordinal data.Journal of Marketing Research,1991,28(4):491-497.
4.陳冠民,倪宗瓚,張菊英,等.Ⅱ型糖尿病危險(xiǎn)因素的線性結(jié)構(gòu)關(guān)系模型分析.中國(guó)衛(wèi)生統(tǒng)計(jì),1998,15(2):12-16.
5.吳瑞林,張彥通,王建中,等.教學(xué)評(píng)價(jià)中“寬容偏向”導(dǎo)致的誤差及校正.北京航空航天大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版),2010,23(3):113-116.
6.Cooperative Institutional Research Project.Annual Freshmen Survey.Los Angeles,CA:American Council on Education and UCLA Graduate School of Education,2011.
7.Drasgow F.Polychoric and Polyserial Correlations.Encyclopedia of Statistical Sciences,2006.
8.Fornell C,Larcker DF.Evaluating structural equation models with unobservable variables and measurement error.Journal of Marketing Research,1981,18(1):39-50.
9.Hu LT,Bentler PM.Cut off criteria for fit indexes in covariance structure analysis:Conventional criteria versus new alternatives.Structural Equations Modeling,1999,6(1):1-55.
10.Olsson U.On the robustness of factor analysis against crude classification of the observations.Multivariate Behavioral Research,1979,14(4):485-500.
11.DiStefano C.The impact of categorization with confirmatory factor analysis.Structural Equation Modeling,2002,9(3):327-347.
A Structure Equation Model Based on The Polychoric Correlation Coefficient:An Application to Associated Factors of The College Studnts'f-Lari Expcc
Zhou Yingxue,Ou Chunquan,Zhao Zhitao,et al.Department of Biostatistics,School of Public Health and Subtropical Medicine,Office of Educational Administration,Southern Medical University(510515),Guangzhou
ObjectiveTo establish a structure equation model(SEM)based on the polychoric correlation coefficient for exploring the influence mechanism of the college students'self-learning expectancies.The study would provide reference for analyzing ordinal categorical data.MethodsWe used AMOS and R language to build SEM based on the polychoric correlation for analyzing survey data of precollege freshmen in a medical university in Guangzhou.ResultsConfirmatory factor sanalysis shows that factor loading based on Pearson correlation is significantly lower than that based on polychoric correlation.Academic self-efficacy,academic goals and social goals have positive impacts on self-learning expectancies.There is significant positive correlation among these factors.ConclusionOur study indicates that a SEM based on the polychoric correlation offers more accurate results when analyzing ordinal categorical data.For college students,raising academic self-efficacy,academic goals,and social goals could improve self-learning expectancies,and economic goals may influence self-learning expectancies indirectly through academic goals or social goals.
Polychoric correlation coefficient;Structure equation model;Self-learning expectancies
(責(zé)任編輯:劉 壯)
中國(guó)衛(wèi)生統(tǒng)計(jì)2013年4期