喻 平
(南京師范大學(xué)課程與教學(xué)研究所 210097)
在回歸模型中,可以包括多個自變量,但只能包括一個因變量.而許多因果效應(yīng)問題,因變量往往不止一個.回歸分析還有一個局限就是只能分析直接效應(yīng),不能分析間接效應(yīng).事實上,許多變量之間可能有直接關(guān)系,也可能受到中介變量的影響而產(chǎn)生間接效應(yīng).路徑分析就是解決這類問題的方法.
路徑分析的主要目的是檢驗一個假想的因果模型的準(zhǔn)確和可靠程度,測量變量間因果關(guān)系的強弱,回答下述問題:①模型中兩變量X與Y間是否存在相關(guān)關(guān)系;②若存在相關(guān)關(guān)系,則進一步研究兩者間是否有因果關(guān)系;③若X影響Y,那么X是直接影響Y,還是通過中介變量W間接影響,或者既有直接影響也有間接影響;④直接影響與間接影響兩者大小如何.
(1)路徑圖
用矩形框表示可觀測的變量(圖1),直線箭頭表示假定變量之間有因果關(guān)系,箭頭由自變量(原因變量)指向因變量(結(jié)果變量).雙向箭頭表示兩個變量之間的相關(guān)關(guān)系,不是因果關(guān)系.如果變量之間沒有連線,表示假定變量之間沒有直接關(guān)系.
圖1 四個變量的路徑圖
(2)外生變量
只能是原因的變量,有箭頭指向別的變量但沒有箭頭指向它.圖1中X1,X2是兩個外生變量.兩個外生變量間可能有相關(guān),以雙向箭頭表示,如X1與X2.兩個外生變量間也可能獨立無關(guān),此時沒有箭頭表示.
(3)內(nèi)生變量
為結(jié)果的變量,有箭頭指向它.圖1中的X3,Y都是結(jié)果變量.內(nèi)生變量包括:中介變量:既是果又為因(X3);因變量:只為果的變量(Y).
(4)殘差變量
(5)路徑系數(shù)
路徑系數(shù)是指某一自變量對其因變量的直接效果,亦即標(biāo)準(zhǔn)回歸系數(shù).回歸系數(shù)標(biāo)于各路徑上.由Xj到Xi的路徑系數(shù),它表示Xj與Xi間因果關(guān)系的強弱,即當(dāng)其他變量均保持不變時,變量Xj對變量Xi的直接作用力的大小.
路徑分析是多元回歸分析的延伸,與后者不同的是:①路徑分析中的因果關(guān)系是多層次的,因果變量之間加入了中介變量,使路徑分析模型較一般回歸模型對于現(xiàn)實因果關(guān)系的描述更豐富有力.②路徑分析不是運用一個而是一組回歸方程,在分析時更應(yīng)注意保證各方程式所含意義的一致性.
路徑分析要以下列假定為前提:①變量間的因果關(guān)系是單向的,不具有反饋性,又稱遞歸模型;②變量間具有線性可加關(guān)系;③變量具有等距以上測量尺度;④所有誤差均為隨機的,外生變量無測量誤差;⑤所有內(nèi)生變量的誤差變量間及與內(nèi)生變量有因果關(guān)系的所有自變量間無相關(guān).當(dāng)某些假定,如遞歸性或變量的測量尺度不滿足時,要做適當(dāng)?shù)奶幚聿拍軕?yīng)用路徑分析.
討論多于兩個變量之間的關(guān)系,可以進一步思考它們之間是否有因果關(guān)系,此時可以考慮研究它們之間的回歸分析和路徑分析.例如,有三個變量X1,X2,X3,發(fā)現(xiàn)它們之間有比較高的相關(guān),于是進一步思考它們之間的因果關(guān)系,可能會出現(xiàn)圖2的一些情形:
圖2 三個變量之間可能的關(guān)系
圖2(1)中,X1是因,X2,X3是果;圖2(2)中,X1和X2是因,X3是果;圖2(3)中,X1是X2的因,X2是X1的果,同時X2是X3的因,X3是X2的果,此時,X2成為X1到X3的中介變量;圖2(4)中,X1是X2和X3的因,同時X2是中介變量.
例如,要研究三種數(shù)學(xué)核心素養(yǎng):數(shù)學(xué)建模、邏輯推理、數(shù)學(xué)運算之間的關(guān)系,作相關(guān)研究方法發(fā)現(xiàn)它們之間有顯著的相關(guān)關(guān)系,于是可以考慮以邏輯推理和數(shù)學(xué)運算為因,數(shù)學(xué)建模為果建立一個路徑分析模型.這種考慮主要是因為相對于數(shù)學(xué)建模來說,邏輯推理和數(shù)學(xué)運算是更為基本的數(shù)學(xué)能力,因而它們可能會對數(shù)學(xué)建模產(chǎn)生影響.即數(shù)學(xué)建模能力會受到個體邏輯推理能力和數(shù)學(xué)運算能力的影響.
一般說來,要研究三個或三個以上變量之間關(guān)系的問題,在發(fā)現(xiàn)它們之間存在相關(guān)關(guān)系的基礎(chǔ)上,都可以考慮用路徑分析方法對其研究.例如,數(shù)學(xué)學(xué)習(xí)的各種心理因素:知識表征、認(rèn)知結(jié)構(gòu)、模式識別、自我監(jiān)控、學(xué)習(xí)焦慮、成就動機、學(xué)習(xí)歸因、學(xué)習(xí)興趣、意志品格、自我效能、自我概念等等;數(shù)學(xué)學(xué)習(xí)的各種行為:學(xué)習(xí)的主動性、學(xué)習(xí)策略、學(xué)習(xí)習(xí)慣、學(xué)習(xí)風(fēng)格、學(xué)習(xí)倦怠等等.這些因素之間可能就有相關(guān)關(guān)系,于是可以設(shè)計路徑分析作進一步研究.
要確定采用路徑分析方法研究的課題,首先,要確定研究這些變量的可能性和必要性,不能把任意幾個變量組合起來作為研究對象,要思考它們之間是否可能相關(guān),它們中誰可能是原因,誰可能是結(jié)果,誰可能是中介變量.這個分析過程或者依據(jù)某種理論,或者在別人已有的研究工作基礎(chǔ)之上的拓展與推廣,或者源于教學(xué)實踐的經(jīng)驗.第二,對于決定要研究的變量,還要考慮是否有測量這些變量的公認(rèn)比較好的量表.如果沒有現(xiàn)成的量表,那么你是否能夠編制所需量表,工具是關(guān)鍵.
(1)提出初始理論模型
研究者根據(jù)相關(guān)理論、文獻(xiàn)數(shù)據(jù)或個人經(jīng)驗建構(gòu)一個可以檢測的初始模型,并繪制一個沒有路徑系數(shù)的路徑圖.這一步是整個研究的起點,要求建構(gòu)的模型有一定理論依據(jù),并根據(jù)經(jīng)驗分析外生變量的確可能會對內(nèi)生變量產(chǎn)生作用.
(2)編制量表進行測驗
在構(gòu)建的模型中,涉及幾個變量,就要編制幾個量表.例如,圖1中涉及的變量有X1,X2,X3,Y,于是要編制測量這四個變量的量表,然后選擇一組被試進行測試,將數(shù)據(jù)收集整理.
(3)計算路徑系數(shù)
路徑系數(shù)是自變量(外生變量)對因變量(內(nèi)生變量)的回歸系數(shù),直接作用關(guān)系是一元線性回歸,間接關(guān)系是多元線性回歸.因此,計算路徑系數(shù)就是求回歸方程的過程.路徑系數(shù)的計算:第一步,將路徑模式分解為數(shù)個回歸方程式;第二步,求各回歸方程式中各個預(yù)測變量的β值,各預(yù)測變量的β值即為所對應(yīng)之路徑系數(shù).
(4)理論評估與修正
評估理論模型時可以刪除不顯著的路徑系數(shù),然后重新計算新模型的路徑系數(shù).在刪除部分影響的路徑后,會成為一種限制模型,由于預(yù)測變量數(shù)的改變,路徑系數(shù)也會發(fā)生變化,因而要重新作回歸分析.
案例1學(xué)生親社會和反社會課堂行為對他們學(xué)業(yè)成績的影響.[1]
研究者溫茲爾提出研究問題:當(dāng)考慮到學(xué)業(yè)行為、教師偏好和各種背景變量時,親社會和反社會課堂行為獨立于學(xué)業(yè)成績的預(yù)測變量之外.然后,探索社會行為與學(xué)業(yè)行為或教師偏好顯著相關(guān),與學(xué)業(yè)成績間接相關(guān).
400多名六年級和七年級學(xué)生,11名教師參加研究.該研究涉及5個變量的測量,親社會行為、反社會行為、學(xué)業(yè)行為、教師對學(xué)生的偏愛、學(xué)業(yè)成績.其中親社會行為有兩個特征:合作、共享;反社會行為有兩個特征:動手打架、違反紀(jì)律.這兩種行為的測量采用由學(xué)生對其他同學(xué)的評價的方法,在各個特征被同學(xué)提名的百分率基礎(chǔ)上,每個學(xué)生得到一個親社會行為綜合分?jǐn)?shù)和一個反社會行為綜合分?jǐn)?shù).學(xué)業(yè)成績用年級學(xué)年考試成績和斯坦?;炯寄軠y驗的分?jǐn)?shù).學(xué)業(yè)行為由教師在一個5點量表上對下述行為給每個學(xué)生打分:①對學(xué)校作業(yè)的興趣;②有獨立工作能力;③關(guān)心評價.然后計算出每一個學(xué)生的學(xué)業(yè)行為得分.教師對學(xué)生的偏愛,采用教師評定方法,要求教師在一個5點量表上評價他們在多大程度上愿意讓某位學(xué)生下半年仍留在他的班上.
在收集數(shù)據(jù)的基礎(chǔ)上,通過計算相關(guān)系數(shù),學(xué)業(yè)成績與親社會行為、學(xué)業(yè)行為、教師對學(xué)生的偏愛有顯著正相關(guān),與反社會行為有顯著負(fù)相關(guān).然后通過回歸分析,求出路徑系數(shù),得到圖3的模型(路徑系數(shù)略):
圖3 五個變量之間關(guān)系的路徑分析
假定我們要研究學(xué)生的成就歸因、學(xué)習(xí)焦慮、學(xué)習(xí)倦怠、學(xué)業(yè)成績四個因素之間的關(guān)系,依據(jù)學(xué)習(xí)理論的教學(xué)經(jīng)驗,構(gòu)建一個如圖4的路徑分析模型.在這個模型中,成就歸因是外生變量,學(xué)習(xí)焦慮、學(xué)習(xí)倦怠是內(nèi)生變量,且為中介變量,學(xué)業(yè)成績是因變量.
圖4 學(xué)習(xí)中四個因素的路徑圖
用分別測量成就歸因、學(xué)習(xí)焦慮、學(xué)習(xí)倦怠的三個量表對選定的被試進行測試,同時收集這組被試平時數(shù)次數(shù)學(xué)測驗的分?jǐn)?shù),求平均分作為學(xué)生的學(xué)業(yè)成績分?jǐn)?shù).
以上面的例子(原始數(shù)據(jù)略),用SPSS軟件計算分為四步:求相關(guān)系數(shù),方程1回歸分析,方程2回歸分析,方程3回歸分析.
第一步,計算變量之間的相關(guān).
(1)點擊變量視圖,定義四個變量:Y,X2,X1,X3.
(2)點擊數(shù)據(jù)視圖,輸入數(shù)據(jù).
(3)依次點擊[分析]、[相關(guān)]、[雙變量],得到<二元變量相關(guān)分析>主對話框.
(4)將對話框左邊變量Y,X1,X2,X3調(diào)入右邊下的<變量>矩形框內(nèi).
(5)選擇Pearson,點擊[確定].
結(jié)果見表1:
表1 變量之間的相關(guān)
續(xù)表
第二步,方程1的回歸分析.方程1:Y=β1YX1+β2YX2+β3YX3.
(1)點擊[變量視圖],將因變量“學(xué)習(xí)成績”定義為Y.將三個自變量“成就歸因”、“學(xué)習(xí)焦慮”、“學(xué)習(xí)倦怠”依次定義為X1、X2、X3.
(2)點擊[數(shù)據(jù)視圖],輸入數(shù)據(jù).
(3)依次單擊[分析]、[回歸]、[線性],彈出對話框.將左邊源變量Y送入 <因變量>小框中,將X1、X2、X3送入<自變量>小框中.
(4)單擊[確定].
(5)選擇重要因素,重新建立回歸模型.點擊[方法],選擇<逐步回歸>,點擊[確定].
結(jié)果見表2:
表2 方程1系數(shù)a
第三步,方程2回歸分析.方程2:X3=β13X1+β23X2.
(1)點擊[變量視圖],將因變量“學(xué)習(xí)倦怠”定義為X3.將自變量“成就歸因”、“學(xué)習(xí)焦慮”定義為X1、X2.
(2)點擊[數(shù)據(jù)視圖],輸入數(shù)據(jù).
(3)依次單擊[分析]、[回歸]、[線性],彈出對話框.將左邊源變量X3送入 <因變量>小框中,將X1、X2送入<自變量>小框中.
(4)單擊[確定].
(5)選擇重要因素,重新建立回歸模型.點擊[方法],選擇<逐步回歸>,點擊[確定].
結(jié)果見表3:
表3 方程2系數(shù)a
第四步,方程3回歸分析.方程3:X2=β12X1.
(1)點擊[變量視圖],將因變量“學(xué)習(xí)焦慮”定義為X2.將自變量“成就歸因”定義為X1.
(2)點擊[數(shù)據(jù)視圖],輸入數(shù)據(jù).
(3)依次單擊[分析]、[回歸]、[線性],彈出對話框.將左邊源變量X2送入 <因變量>小框中,將X1送入<自變量>小框中.
(4)單擊[確定].
結(jié)果見表4:
表4 方程3系數(shù)a
根據(jù)表2、表3、表4,標(biāo)準(zhǔn)化系數(shù)即為路徑系數(shù),可以得到路徑分析的結(jié)果,見圖5.
圖5 路徑分析結(jié)果
(1)直接效果
直接效果是指直接從自變量到因變量間的效果,其路徑系數(shù)即為直接效果的值.圖3中,成就歸因?qū)W(xué)習(xí)成績的直接效果是-0.106,學(xué)習(xí)焦慮對學(xué)習(xí)成績的直接效果為-0.173.
(2)間接效果
自變量到因變量間,所有通過中間變量的效果,其效果的值為路徑系數(shù)的乘積.間接效果為所有效果之和.
成就歸因?qū)W(xué)習(xí)成績的間接效果有三種:
成就歸因→學(xué)習(xí)倦怠→學(xué)習(xí)成績:0.642×(-0.527)= -0.338;
成就歸因→學(xué)習(xí)焦慮→學(xué)習(xí)倦怠→學(xué)習(xí)成績:0.263×0.079×(-0.527)= -0.01;
成就歸因→學(xué)習(xí)焦慮→學(xué)習(xí)成績:0.263×(-0.173)= -0.045.
因此,間接效果=( -0.338)+ (-0.01)+ (-0.045)= -0.393.
(3)可能效果
自變量到因變量間的效果,如果兩者均受另一共同變量的影響,其效果的值為路徑系數(shù)的乘積.
學(xué)習(xí)倦怠至學(xué)習(xí)成績的可能效果,其值為:0.079×(-0.173)= -0.01.
(4)變量間的相關(guān)系數(shù)的分解
自變量到因變量間的總效果即為兩變量間的相關(guān).總效果=總因果效果+所有可能效果;
總因果效果=直接效果 +所有間接效果.