付志慧,李 斌
(沈陽師范大學(xué) 數(shù)學(xué)與系統(tǒng)科學(xué)學(xué)院,沈陽 110034)
項(xiàng)目反應(yīng)理論在心理與教育測(cè)量領(lǐng)域中具有廣闊的應(yīng)用前景[1-2]。它以潛在特質(zhì)理論為基礎(chǔ),核心內(nèi)容是研究潛在心理特質(zhì)和反應(yīng)行為之間的關(guān)系,在此基礎(chǔ)上,可以分析出被試潛在心理特質(zhì)(即能力)與項(xiàng)目特性(難度、區(qū)分度等)之間的相互影響。項(xiàng)目反應(yīng)模型按照能力維度可分為單維和多維。單維項(xiàng)目反應(yīng)模型假定測(cè)驗(yàn)的所有題目只考查同一種潛在特質(zhì)。但是實(shí)際心理過程是非常復(fù)雜的,且考試(教育測(cè)驗(yàn))通??疾槎鄠€(gè)能力。本文主要研究多維二參數(shù)Logistic(2PLM)的Gibbs抽樣方法。
項(xiàng)目反應(yīng)理論參數(shù)估計(jì)方法有4種[4],條件極大似然估計(jì)(CMLE:condition maximum likelihood estimation),邊際極大似然估計(jì)與EM 算法[4-5](MMLE/EM:marginal maximum likelihood estimation and an EM algorithm),聯(lián)合極大似然估計(jì)(JMLE:joint maximum likelihood estimation),Bayes估計(jì)。CMLE以一種參數(shù)已知為條件,即項(xiàng)目參數(shù)已知求能力值或能力參數(shù)已知求項(xiàng)目值。能力的條件估計(jì)適用于抽取題庫項(xiàng)目來估計(jì)被試能力,若在題庫未建立前,項(xiàng)目參數(shù)和能力參數(shù)皆是未知,CMLE不再適用。Birnbaum提出了聯(lián)合極大似然估計(jì)。JMLE可在一定假設(shè)下,轉(zhuǎn)化為項(xiàng)目參數(shù)的估計(jì)和能力參數(shù)的估計(jì)。兩種估計(jì)是一個(gè)不斷互相校正的過程,反復(fù)迭代求取穩(wěn)定值,可以看成是兩步估計(jì)的過程。但聯(lián)合極大似然估計(jì)有其固有的缺陷:給定長(zhǎng)度測(cè)試中(即項(xiàng)目個(gè)數(shù)是固定的),隨著被試人數(shù)的增加,能力參數(shù)的個(gè)數(shù)也相應(yīng)增加,稱之伴隨參數(shù);不隨被試人數(shù)增加而增加的項(xiàng)目參數(shù),稱之為結(jié)構(gòu)參數(shù);當(dāng)同時(shí)估計(jì)能力參數(shù)和項(xiàng)目參數(shù)時(shí),伴隨參數(shù)可能不存在充分統(tǒng)計(jì)量,因此得出估計(jì)不一定滿足相合性。消除JLME固有的缺陷只有消除伴隨參數(shù)的影響。MMLE/EM算法將能力參數(shù)邊際化,給定能力的先驗(yàn)分布,對(duì)能力參數(shù)進(jìn)行積分,從而來消除能力參數(shù),在一般條件下該算法可以收斂,計(jì)算比較簡(jiǎn)單,但它對(duì)能力需要進(jìn)行數(shù)值積分近似計(jì)算,在能力維數(shù)較高時(shí),會(huì)給計(jì)算帶來很大困難[6]。為了提高估計(jì)的質(zhì)量,除了當(dāng)前樣本數(shù)據(jù),還可以利用客觀信息和經(jīng)驗(yàn)積累的信息,先驗(yàn)信息的加入,參數(shù)估計(jì)更加穩(wěn)定,也更合理和符合實(shí)際。Albert(1992)給出了二參數(shù)正態(tài)卵形的一種Gibbs抽樣方法[7]。Sahu(2002)將其推廣到三參數(shù)正態(tài)卵形模型[8]。Van der Linden(2007)針對(duì)結(jié)合反應(yīng)時(shí)間和反應(yīng)速度的測(cè)驗(yàn),用對(duì)數(shù)正態(tài)模型來擬合被試的反應(yīng)時(shí)間,用三參數(shù)正態(tài)卵形IRT模型擬合反應(yīng)得分,將二者結(jié)合后給出了Gibbs抽樣方法[9]。本文考慮更為一般的多維2PLM,給出了一種基于增加數(shù)據(jù)的Gibbs抽樣方法,易于求出每個(gè)參數(shù)的后驗(yàn)分布,從而直接給出參數(shù)的Bayes后驗(yàn)估計(jì)。
假定有N個(gè)被試,n個(gè)項(xiàng)目,yij表示第j個(gè)被試對(duì)第i個(gè)項(xiàng)目的反應(yīng),答對(duì)取值為1,答錯(cuò)取值為0。令pij表示第j個(gè)被試對(duì)第i個(gè)項(xiàng)目正確反應(yīng)的概率,我們采用多變量Logistic反應(yīng)函數(shù),形式為:
其中,i=1,2,…,n,j=1,2,…,N,θj=(θj1,…,θjk,…,θjm)為被試j的能力,各維度能力取值范圍均為-∞<θjk<∞,j=1,2,…,N,k=1,2,…,m;ai=(ai1,…,aik,…,aim),aik>0,i=1,2,…,n,k=1,2,…,m是由項(xiàng)目i在各維度能力上的載荷aik生成的向量,稱為區(qū)分度參數(shù);bi=(bi1,…,bik,…,bim).-∞<bik<∞,i=1,2,…,n,k=1,2,…,m,為項(xiàng)目i的難度參數(shù)向量;特別地,當(dāng)m=1時(shí),模型(1)退化為單維2PLM。
令ζ=(θ,a,b,σ),其中a=(aik)n×m,b=(bik)n×m,且(·)n×m表示n×m矩陣。多維2PLM 下,參數(shù)ζ的后驗(yàn)分布為:其中D為比例常數(shù)。
對(duì)應(yīng)于反應(yīng)數(shù)據(jù)yij,引入2個(gè)相互獨(dú)立的隨機(jī)變量uij。其中uij服從均勻分布,uij~Uniform(0,1)。由模型(1)易知,潛變量μij要受到y(tǒng)ij取值的約束,令
令u=(uij)n×N,y=(yij)n×N,隨著潛變量u的引入,(ζ,u)的聯(lián)合后驗(yàn)密度為:
進(jìn)而,由式(3),有
首先,在給定反應(yīng)數(shù)據(jù)和其他參數(shù)的情形下,抽取uij。在算法的每一步都要滿足式(2)。1)uij的滿條件分布為
2)給定a,b,σ2的滿條件分布為
由式(3),對(duì)于任意i,k,令
3)則給定其他所有參數(shù)和u,r,y,,i=1,2,…,n,k=1,2,…,m的滿條件分布為
4)同理,θjk,j=1,2,…,N,k=1,2,…,.m的滿條件分布為
其中,θj(k)是向量θj將第k個(gè)元素θjk刪除后得到的余向量,即
N(vk,)是θjk在給定θj(k)下的條件分布,條件均值和條件方差分別為
(關(guān)于vk和的詳細(xì)計(jì)算過程見附錄),且
5)給定其他所有參數(shù)和u,r,y,aik,i=1,2,…,n,k=1,2,…,m的滿條件分布為
其中
以下給出了具體的Gibbs抽樣步驟(具體程序由Matlab軟件編寫)。
第1步 從式(5)中抽取u;
第2步 從式(6)中抽取σ2;
第3步 從式(7)中抽取b;
第4步 從式(8)中抽取θ;
第5步 從式(11)中抽取a。
以上討論了多維二參數(shù)LOGISTIC模型的Gibbs抽樣問題,采用本文討論的方法,可簡(jiǎn)單解決該模型的參數(shù)估計(jì)問題,這一結(jié)果對(duì)IRT的發(fā)展,對(duì)多維項(xiàng)目在測(cè)驗(yàn)中的應(yīng)用是很有意義的,在此基礎(chǔ)上,還可以進(jìn)一步討論多維項(xiàng)目反應(yīng)模型的其他問題,如縱向測(cè)驗(yàn)[10-11]、多層IRT測(cè)驗(yàn)[12]、參數(shù)估計(jì)優(yōu)化問題[13-15]等。
附錄
條件均值及方差的詳細(xì)計(jì)算過程
若要計(jì)算θjk的條件均值vk和條件方差(公式(10)),首先對(duì)θj進(jìn)行置換。令
Pk1=(pst)m×m為置換陣,第(s,t)個(gè)元素為
由θj~Nm(μ,Σθ)有(k)~Nm(μ*(k),(k)),其中
為了求θjk的條件分布,將向量(k)分成兩塊,因此得:
(μj(k)為θj(k)的數(shù)學(xué)期望,即μj(k)=E(θj(k))。且
因此在給定時(shí)的條件分布為:
[1]BEAUJEAN A A,STEVEN J O.Using item response theory to assess the flynn effect in the national Longitudinal study of youth 79children and young[J].Adults Ddata Intell,2008,36(3):455-463.
[2]CHANG C H,REEVE B B.Item response theory and its applications to patient-reported outcomes measurement[J].Eval Health Prof,2005,28(3):264-282.
[3]BAKER F B,KIM S H.Item response theory:parameter Estimation Techniques[M].2nd Ed.New York:Marcel Dekker,2004.
[4]BOCK R D,AITKIN M.Marginal maximum likelihood estimation of item parameters:An application of an EM-algorithm[J].Psychometrika,1981,46(3):443-459.
[5]DAVIER M V,SINHARAY S.An importance sampling EM algorithm for latent regression models[J].J Educ Behav Stat,2007,32(3):233-251.
[6]FIEUWS S.High dimensional multivariate mixed models for binary questionnaire data[J].Appl Stat,2006,55(4):449-460.
[7]ALBERT J H.Bayesian estimation of normal ogive item response curves using Gibbs Sampling[J].J Educ Stat,1992,17(3):251-269.
[8]SAHU S K.Bayesian estimation and model choice in item response models[J].J Stat Comput and Simul,2002,72(3):217-232.
[9]LINDEN V D.A hierarchical framework for modeling speed and accuracy on test items[J].Psychometrika,2007,72(3):287-308.
[10]JANNEKE M.Application of multidimensional item response theory models to longitudinal data[J].Educ Psycho Meas,2006,66(1):5-34.
[11]FU Zhihui,TAO Jian,SHI Ningzhong.Analyzing longitudinal item response data via the pairwise fitting method[J].Multivariate Behav Res,2011,46(4):669-690.
[12]FOX J P,GLAS C A W.Bayesian estimation of a multilevel IRT model using Gibbs sampling[J].Psychometrika,2001,66(2):271-288.
[13]甘源媛,余嘉元.改進(jìn)3PL模型參數(shù)估計(jì)的 MCMC算法[J].心理科學(xué),2010,33(5):1212-1215.
[14]涂冬波,漆書青,蔡艷,等.IRT參數(shù)模型估計(jì)的新方法——MCMC算法[J].心理科學(xué),2008,31(1):177-180.
[15]PATZ R J,JUNKER B W.Applications and extensions of MCMC in IRT:multiple item types,missing data,and rated responses[J].J Educ Behav Stat,1999,24(2):146-178.