王碧瑤 張敏強 張潔婷 胡 俊
(華南師范大學心理學院/心理應用研究中心,廣州 510631)
縱向研究可以分析個體心理與行為發(fā)展變化的一般趨勢和個體差異,在發(fā)展、社會、教育、臨床等心理研究領域有廣泛應用[1,2]。以往研究者往往關心總體中某一行為或特質隨時間發(fā)展的趨勢,采用的統(tǒng)計方法主要有重復測量方差分析 (repeated measures analysis of variance,RM ANOVA),多層線性模型(hierarchical linear model,HLM)和潛變量增長曲線模型(latent growth curve model,LGM)等。近年來,隨著理論研究和統(tǒng)計方法的快速發(fā)展,總體中的個體異質性(heterogeneity)引起了研究者的廣泛關注,縱向研究的問題也逐漸由以往的注重總體平均趨勢的發(fā)展過渡到綜合考慮總體平均趨勢和個體發(fā)展差異的系統(tǒng)分析的問題[3]。
因此,一些個體定向(person-oriented)的縱向數(shù)據(jù)分析方法應運而生,如潛類別增長曲線模型(latent class growth model,LCGM)、潛變量混合增長模型(growth mixture model,GMM)和潛在轉變模型(latent transition analysis,LTA)。這三種方法都能夠研究類別型潛變量,其中,潛變量混合增長模型根據(jù)個體的發(fā)展軌跡(斜率和截距)的特征將其分為不同潛在類別,潛類別增長曲線模型是其控制組內(nèi)方差為零的一種特殊形式,這兩種方法適合于分析具有程度高低、概念化(conceptualized)的行為,如對兒童同伴關系相對地位,可以將其作答轉換成標準分數(shù)[4]。而潛在轉變模型根據(jù)作答模式將個體分為不同的潛在類別,并允許個體所屬類別隨時間的發(fā)展發(fā)生變化(圖1),適合于分析難以描述程度高低、多層面(multifaceted)的行為,如青少年不良行為,可以分為說謊、偷竊、打架等方面[5]。
潛在轉變模型是潛在類別分析 (latent class analysis)基礎上進行縱向拓展的一種潛馬爾科夫模型(latent markov model),適用于分析外顯變量和潛在變量都屬于類別型的數(shù)據(jù)。該方法最早由Collins與Wugalter[6]提出,已被應用于許多心理學和社會科學領域的研究,如兒童情緒和認知的成長過程[7,8],青少年不良行為和心理問題隨時間的發(fā)展[9,10],藥物濫用和成癮行為的干預效果[11,12],臨床和心理疾病的追蹤治療[13,14]等諸多方面。
圖1 具有三個外顯變量、兩個時間點的潛在轉變模型
潛在轉變模型通過轉變矩陣,從轉變概率的角度來刻畫發(fā)展,為研究個體的階段性發(fā)展(stage process)提供了一種全新的視角,即以個體所屬類別不變的概率來表示該類別的穩(wěn)定性,以個體轉變到其它組的概率來表示其發(fā)展趨勢。本文對潛在轉變模型做了簡要介紹,并通過一組青少年沖動行為數(shù)據(jù)的分析過程為例,說明其具體應用方法及步驟,并討論了潛在轉變模型與其它縱向研究方法相比的優(yōu)點。
潛在轉變模型中估計三種參數(shù):(1)條件概率ρ,即個體對于外顯變量的作答概率,類似于IRT中的項目反應概率。由于不同潛在狀態(tài)對外顯變量具有不同的作答特征,因此條件概率反映了潛在狀態(tài)之間的差異性,也是對其進行解釋和命名的依據(jù);(2)轉變概率τ,即表示個體在t時間點上屬于潛在狀態(tài)St,在t+1時間點上屬于潛在狀態(tài)St+1的概率,反映了潛在狀態(tài)隨時間的發(fā)展。如果有S個潛在狀態(tài)和T個測量時間點,則共有S(T-1)個轉變概率;(3)潛在狀態(tài)概率δ,表示個體在某個時間點屬于某潛在狀態(tài)的概率,反映了潛在狀態(tài)占總體的比例。在潛在轉變模型中,只需估計T1時間點的潛在狀態(tài)概率,其它時間的潛在狀態(tài)概率可以由轉變概率計算得出。
任意兩個連續(xù)時間點間的轉變概率都可以用一個S×S矩陣來表示,該矩陣如下公式(1)所示。矩陣的對角線表示的是被試在兩個時間點屬于同一潛在狀態(tài)的概率,即沒有發(fā)生轉變的概率。轉變概率矩陣每行之和為1,即在時間點t到時間點t+1,個體從某潛在狀態(tài)向各潛在狀態(tài)轉變的概率之和為1。對于T次測量,共有T-1個轉變概率矩陣。
假設有t=1,……,T個時間點,外顯變量有j=1,……,J 個,分別有 rj,t=1,……,Rj,t個作答水平,y=(r1,1,……rJ,T)是某被試的作答向量。 在任意時間點上潛在狀態(tài)L有S種,St=1,……,St表示在時間點t上的潛在狀態(tài)。最基本的潛在轉變模型為:
I(yj,t=rj,t)是 一 個 指 示 函 數(shù) ,用 于 選 擇 合 適 的 ρ進入公式(2)。在時間點t,如果被試在外顯變量上的作答為 rj,t,I=1,否則 I=0。
潛在轉變模型中還可以納入?yún)f(xié)變量和分組變量(如,性別),探究影響潛在狀態(tài)及其轉變的因素和組間差異,含有協(xié)變量X和分組變量G的潛在轉變模型如公式(3)所示:
加入?yún)f(xié)變量后,需要估計一個新的參數(shù)Logistic回歸系數(shù)β,而不再估計轉變概率和潛在狀態(tài),轉變概率τ和潛在狀態(tài)δ都可以表達為β的函數(shù),如公式(4)和(5)。同時,上述所有參數(shù)都同時受到分組變量 G 的影響(δ,τ,ρ,β)。
潛在轉變分析的基本過程與潛在類別分析類似,但是要注意以下幾點:
(1)在選擇最佳模型時,不僅要綜合考慮AIC、BIC等模型擬合指標和模型的簡潔性,還要通過潛在類別分析檢查單個時間點的最佳模型和潛在狀態(tài),防止最終的潛在結構及其轉變模式可能忽略掉單個時間點的重要信息[5]。
(2)研究者通常限定同一潛在狀態(tài)在不同時間點的條件概率 ρ1,ρ2,…,ρt保持不變(只有一個條件概率ρ),使?jié)撛谵D變模型更加簡潔和易于解釋。這一做法的前提是限定模型通過了一致性檢驗(measurement invariance),即條件概率參數(shù)限定的模型與條件概率自由估計的模型在數(shù)據(jù)擬合性上不存在顯著差異。
(3)潛在轉變分析中的協(xié)變量分為兩種:預測某一時間點潛在狀態(tài)概率和預測任意兩個連續(xù)時間點轉變概率,這兩種協(xié)變量對潛在轉變模型的影響都可以通過多項Logistic回歸來計算目標組與參照組的發(fā)生比(odds ratio)。當潛在狀態(tài)超過3個(包含3個)時,計算協(xié)變量對轉變概率的影響還可以采用二項Logistic回歸來計算,此時的發(fā)生比是潛在狀態(tài)發(fā)生轉變與保持不變之比。
目前可以進行潛在轉變分析的軟件有SAS、WinLTA和Mplus,本文采用SAS軟件中的PROC LTA程序進行,該程序可以進行包括分組變量和協(xié)變量的潛在轉變分析,并可以在http://methodology.psu.edu.免費下載[15]。
下面例子采用一批關于青少年沖動行為的縱向數(shù)據(jù)[16]。 采用青少年沖動行為量表(IBCL-A)[17]對中國香港地區(qū)的3600名中學生(M=14.63,SD=1.25)的8種沖動行為進行為期一年半的追蹤,共進行三次測量,每次時間間隔為六個月,所有作答轉變?yōu)槎肿兞俊坝小被颉盁o”,各種行為的發(fā)生率見表1。
比較潛在狀態(tài)數(shù)為2到6的模型發(fā)現(xiàn),在潛在狀態(tài)達到4以后,模型擬合度隨其復雜度的提升不再明顯,進一步檢驗到T1到T3的最佳模型都為四類別模型,一致性檢驗支持了所有時間點的條件概率相同的假設,本例最終選擇了條件限制的四類別潛在轉變模型(表2)。
表1 沖動行為的發(fā)生率 (N=3600,其中女性占57%)
根據(jù)條件概率(圖2),潛在轉變模型識別出了四個異質性的子群體:克制組、享受型沖動組、攻擊型沖動組和嚴重沖動組。除了所有組都出現(xiàn)了“因盛怒而向別人大喊”這種程度較輕的沖動行為外,克制組的被試在所有項目上的發(fā)生率都很低,享受型沖動組可能出現(xiàn)“不能自制地進食”和“不能自制地消費”,攻擊型沖動組在“攻擊他人或涉入打架”上具有較高的發(fā)生率,而嚴重沖動組則可能出現(xiàn)多種沖動行為,包括性質較為嚴重的“發(fā)生自我傷害”。
圖2 四類別潛在轉變模型的條件概率
在三個時間點,克制組占總體的比例都最高,享受型沖動組的比例隨時間上升而攻擊型沖動組的比例隨時間下降,嚴重沖動組的比例最低且基本穩(wěn)定(表2)。由潛在轉變模型的分類結果可以看出,雖然多數(shù)沖動行為的發(fā)生率并不高 (一半行為的發(fā)生率低于0.20),青少年中屬于沖動組(享受型沖動組、攻擊型沖動組和嚴重沖動組)的比例卻高達2/3。將性別作為分組變量納入潛在轉變模型后發(fā)現(xiàn) (未在表格中列出),女性比男性更可能屬于享受型沖動組且該比例隨時間上升的速度更快 (女性從0.31到0.40,男性從 0.12 到 0.17),而男性比女性更可能屬于攻擊型沖動組且該比例隨時間下降得更慢 (女性從 0.21 到 0.12,男性從 0.40 到 0.28)。
潛在轉變分析最大的特點之一就是通過轉變矩陣解釋不同潛在狀態(tài)的發(fā)展,從轉變概率的角度描述其穩(wěn)定性和發(fā)展方向。由表2可以看出,在第一次轉變中(T1到T2,學生升入高一年級),克制組的被試幾乎都保持原組,而享受型沖動組、攻擊型沖動組和嚴重沖動組的部分被試則可能轉變到了沖動行為更少的組,即沖動行為減少;在第二次轉變中(T2到T3,學生從某學年上學期至下學期),享受型沖動組和嚴重沖動組的穩(wěn)定性更強,而克制組和攻擊型沖動組的部分被試則可能轉變到了沖動行為更多的組,即沖動行為增加。潛在轉變分析捕捉到的這一特點為研究沖動行為的發(fā)展提供了新思路,在檢驗了該發(fā)展趨勢對所有年齡學生都適用后,得出猜想:沖動行為受到學業(yè)所處階段影響。
基于前人研究焦慮與沖動性的高度相關[18],采用焦慮量表(DASS-A)[19]測量被試 T1 的焦慮狀態(tài)并作為協(xié)變量引入潛在轉變模型,通過多項Logistic回歸分析其對沖動行為潛在狀態(tài)概率和轉變概率的影響,結果見表3。
焦慮對潛在轉變模型具有顯著的影響 (G22-G21=461.68,df=3,p<0.0001)。 在潛在狀態(tài)概率上,享受型沖動組、攻擊型沖動組和嚴重沖動組的發(fā)生比均大于1,表明在焦慮的影響下,被試屬于沖動組的概率升高,尤其是高焦慮被試屬于嚴重沖動組的概率將是低焦慮被試的近10倍。在轉變概率上,焦慮也有相似的影響,高焦慮的被試轉變到高沖動組的概率普遍上升,而轉變到低沖動組的概率普遍降低。納入潛在狀態(tài)和轉變概率的協(xié)變量可以幫助研究者找到對于沖動行為具有預測作用的因素,可以為預防和干預措施提供有針對性的指導。
表2 四類別潛在轉變模型的條件概率和潛在狀態(tài)概率
表3 焦慮對T1潛在狀態(tài)概率和T轉變概率影響的發(fā)生比*
潛在轉變模型兼具了潛在類別模型能夠分析類別型潛變量和縱向分析能夠解釋發(fā)展趨勢的優(yōu)點,為縱向研究提供了行之有效的方法。與目前常用的一些縱向數(shù)據(jù)研究方法相比,潛在轉變模型具有很強的適用性。
(1)對于重復測量數(shù)據(jù)的要求較低。由于許多研究在實際過程中面臨的一些問題,有相當部分只測量2次[2]。一般的縱向數(shù)據(jù)研究方法對數(shù)據(jù)的重復測量次數(shù)要求較高,即使是簡單線性增長模型也需要3個時間點以上測量才能進行數(shù)據(jù)擬合,而潛在轉變模型可以對較少的測量時間點(如,2個)進行分析,使研究者有了更大的便利和靈活性。
(2)可以分析類別型數(shù)據(jù)。潛在轉變模型的理論基礎是潛在類別模型,能有效挖掘類別變量數(shù)據(jù)信息,彌補基于因子分析等方法發(fā)展出的縱向數(shù)據(jù)研究方法(如,潛變量增長曲線模型)無法處理類別變量的不足,對心理學質化研究提供科學的依據(jù),與其它研究方法互為補充,可更為全面揭示心理研究的內(nèi)在本質[20]。
(3)可以分析類別型的潛在變量。潛在轉變模型基于在觀測數(shù)據(jù)的基礎上產(chǎn)生潛在變量進行分析,不易受到觀測變量測量量尺和極端數(shù)據(jù)的影響。此外,潛在轉變模型可以分析類別型的潛在變量,揭示個體所屬類別的發(fā)展變化,即非連續(xù)的階段—序列發(fā)展(stage-sequential development),對于個體心理與行為的研究,特別是預測和控制具有重要的意義。
(4)能夠識別個體的不同發(fā)展模式。許多理論和實證研究都表明心理與行為的發(fā)展存在個體異質性(heterogeneity)。 變量定向(variable-oriented)的縱向數(shù)據(jù)研究方法往往假設抽取樣本所代表的總體具有同質性,揭示從個體身上抽取出來的平均的心理過程或發(fā)展模式[4],而潛在轉變模型是一種個體定向的方法,能夠鑒別出心理與行為的不同發(fā)展模式,揭示發(fā)展的個體差異[21,22]。
(5)能夠同時分析多個外顯變量。許多縱向數(shù)據(jù)研究方法,如潛變量增長曲線模型、潛類別增長曲線分析和潛增長混合模型都通過增長曲線來描述個體的發(fā)展軌跡,外顯變量只能有一個,而潛在轉變模型在每個時間點都將個體在多個外顯變量上的作答分類,通過轉變矩陣估計個體所屬類別的轉變,可以同時對多個外顯變量進行分析。
上述特點可以總結為表4。
表4 潛在轉變模型與其他縱向數(shù)據(jù)研究方法的適用性對比
盡管潛在轉變模型在縱向研究中應用靈活,限制較少,但是在實際應用中仍需要注意以下問題:①缺失數(shù)據(jù)的處理。外顯變量中如果存在缺失數(shù)據(jù),可以采用多重插補[23]進行處理,但是如果在分組變量和協(xié)變量上存在缺失數(shù)據(jù),目前軟件無法進行處理,需要將該被試的所有作答刪除;②進行參數(shù)限制。在潛在轉變分析中,由于對外顯變量在不同時間點進行重復測量,獲得的列聯(lián)表通常很大,會導致數(shù)據(jù)缺?。颖玖颗c列聯(lián)表單元格數(shù)量之比過小),使模型選擇、參數(shù)估計和Logistic回歸出現(xiàn)困難(因某些作答模式的被試數(shù)量為0而不能完成),此問題可以通過程序中的BETA PROR語句來設置的先驗分布來解決[24];③排除標簽轉換(label switching)。 潛在狀態(tài)排列的順序是由初始值決定的,不同的初始值可能產(chǎn)生相同的潛在狀態(tài),但是排列的順序不同,在判定兩次分析的結果不同時,應對不同潛在狀態(tài)的條件概率進行人工檢查,排除標簽轉換導致的潛在狀態(tài)順序問題[25]。
綜觀上述,對于研究發(fā)展趨勢不同質的類別型縱向數(shù)據(jù),潛在轉變模型不僅能夠發(fā)現(xiàn)研究對象的不可直接觀測的異質子群體,利用潛在狀態(tài)解釋個體之間的差異,還能夠通過轉變矩陣來動態(tài)地估計個體在不同時間點所屬類別的變化,從轉變概率的角度來描述個體的發(fā)展,為縱向研究提供了新的視角。
1 劉紅云,張雷.追蹤數(shù)據(jù)分析方法及其應用.北京:教育科學出版社,2005.
2 唐文清,方杰,蔣香梅,張敏強.追蹤研究方法在國內(nèi)心理研究中的應用述評.心理發(fā)展與教育,2014,30:216-224.
3 劉紅云,孟慶茂.縱向數(shù)據(jù)分析方法.心理科學進展,2003,11:586-592.
4 劉紅云.如何描述發(fā)展趨勢的差異:潛變量混合增長模型.心理科學進展,2007,15:539-544.
5 Collins L M & Lanza S T.Latent class and latent transition analysis:With applications in the social,behavioral,and health sciences.New Jersey:John Wiley & Sons,2010.
6 Collins L M & Wugalter S E.Latent class models for stage-sequential dynamic latent variables.Multivariate Behavioral Research,1992,27:131-157.
7 Connell A,Bullock B M,Dishion T J,et al.Family intervention effects on co-occurring early childhood behavioral and emotional problems:A latent transition analysis approach.Journal of Abnormal Child Psychology,2008,36:1211-1225.
8 Goldweber A,Bradshaw C P,Goodman K,et al.Examining factors associated with (In) Stability in social information processing among urban school children:a latent transition analytic approach.Journal of Clinical Child & Adolescent Psychology,2011,40:715-729.
9 Dembo R,Wareham J,Poythress N,et al.Psychosocial Functioning Problems Over Time Among High-Risk Youths A Latent Class Transition Analysis.Crime & Delinquency,2008,54:644-670.
10 Reboussin B A,Reboussin D M,Liang K Y,et al.Latent transition modeling of progression of health-risk behavior.Multivariate Behavioral Research,1998,33:457-478.
11 Chung H,Park Y & Lanza S T.Latent transition analysis with covariates:pubertal timing and substance use behaviours in adolescent females.Statistics in Medicine,2005,24:2895-2910.
12 Jackson K M,O'Neill S E & Sher K J.Characterizing alcohol dependence:T ransitions during young and middle adulthood. Experimental and Clinical Psychopharmacology,2006,14:228-244.
13 Castellini G,F(xiàn)ioravanti G,Lo Sauro C,et al.Latent profile and latent transition analyses of eating disorder phenotypes in a clinical sample:A 6-year follow-up study.Psychiatry Research,2013,207:92-99.
14 La Flair L N,Reboussin B A,Storr C L,et al.Childhood abuse and neglect and transitions in stages of alcohol involvement among women:A latent transition analysis approach.Drug and Alcohol Dependence,2013,132:491-498.
15 Lanza S T,Dziak J J,Huang L,et al.PROC LCA& PROC LTA User’s Guide (Version 1.3.1).Methodology Center,Penn State University,University Park,PA,2014.
16 Leung S & Leung F.Construct validity and prevalence rate of borderline personality disorder among Chinese adolescents.Journal of Personality Disorders,2009,23:494-531.
17 You J,Leung F,Lai C M,et al.An Item Response Theory Analysis of the Impulsive Behaviors Checklist for Adolescents.Assessment,2001,18:464-475.
18 Taylor C T,Hirshfeld-Becker D R,Ostacher M J,et al.Anxiety is associated with impulsivity in bipolar disorder.Journal of Anxiety Disorders,2008,22:868-876.
19 Taouk M,Lovibond P & Laube R.Psychometric Properties of a Chinese Version of the 21-item Depression Anxiety Stress Scales (DASS21).Sydney:Cumberland Hospital,2001.
20 張潔婷,焦璨,張敏強.潛在類別分析技術在心理學研究中的應用.心理科學進展,2010,18:1991-1998.
21 紀林芹,張文新.發(fā)展心理學研究中個體定向的理論與方法.心理科學進展,2011,19:1563-1571.
22 Muthén B & Muthén L K.Integrating person-centered and variable -centered analyses:Growth mixture modeling with latent trajectory classes.Alcoholism:Clinical and Experimental Research,2000,24:882-891.
23 Schafer J L.Analysis of Incomplete Multivariate Data.Florida:CRC press,1997.
24 Clogg C C,Rubin D B,Schenker N,et al.Multiple imputation of industry and occupation codes in census public-use samples using Bayesian logistic regression.Journal of the American Statistical Association,1991,86:68-78.
25 Chung H,Loken E & Schafer J L.Difficulties in drawing inferences with finite -mixture models.The American Statistician,2004,58:152-158.