• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    改進(jìn)的認(rèn)知診斷模型項(xiàng)目功能差異檢驗(yàn)方法
    ——基于觀察信息矩陣的Wald統(tǒng)計(jì)量*

    2016-01-09 23:03:32劉彥樓李令青劉笑笑
    心理學(xué)報(bào) 2016年5期
    關(guān)鍵詞:受測者診斷模型錯(cuò)誤率

    劉彥樓 辛 濤, 李令青 田 偉 劉笑笑

    (1北京師范大學(xué)發(fā)展心理研究所,北京 100875) (2中國基礎(chǔ)教育質(zhì)量監(jiān)測協(xié)同創(chuàng)新中心,北京 100875)(3泰山學(xué)院教師教育學(xué)院,山東泰安 271000)

    1 引言

    認(rèn)知診斷模型可以提供關(guān)于受測者知識(shí)或技能掌握程度的細(xì)粒度的、多維診斷性反饋信息,因此,引起了學(xué)生、教師、心理測量學(xué)家以及認(rèn)知心理學(xué)家等的關(guān)注(Greeno,1980;Leighton &Gierl,2007),是當(dāng)前心理測量領(lǐng)域研究的熱點(diǎn)之一。迄今為止,研究者提出了許多認(rèn)知診斷模型,這些模型可以被分為一般性的認(rèn)知診斷模型框架以及特殊的認(rèn)知診斷模型。一般性的認(rèn)知診斷模型框架,主要包括von Davier (2005)的一般診斷模型(

    General Diagnostic Model,

    GDM)、Henson,Templin 和 Willse (2009)提出的對數(shù)線性認(rèn)知診斷模型(

    Log-Linear Cognitive Diagnosis Model,

    LCDM)以及 de la Torre (2011)的G-DINA模型,常見的特殊的認(rèn)知診斷模型有決定性輸入,噪音與門模型(

    Deterministic Input,Noisy And Gate,

    DINA) (de la Torre &Douglas,2004;Haertel,1989;Junker &Sijtsma,2001),補(bǔ)償?shù)闹貐?shù)化統(tǒng)一模型(

    Compensatory Reparameterized Unified Model,

    C-RUM) (e.g.,Hartz,2002)等。

    從統(tǒng)計(jì)上來講,以上這些一般性的認(rèn)知診斷模型與特殊的認(rèn)知診斷模型都屬于有約束的潛在類別模型(von Davier,2009)。這些“約束”主要是通過Q矩陣來實(shí)現(xiàn)的。Q矩陣是一個(gè)設(shè)計(jì)矩陣,其中的元素一般是“0”與“1”,雖然有研究(Chen &de la Torre,2013)已經(jīng)將 Q矩陣擴(kuò)展為多級(jí)的,但在絕大多數(shù)的實(shí)際應(yīng)用中仍假定其是二分的,因此本研究仍假定Q矩陣是二分的。在認(rèn)知診斷模型中一般將受測者的知識(shí)或技能統(tǒng)稱為潛在屬性,簡稱屬性。Q矩陣的功能在于設(shè)定認(rèn)知診斷測驗(yàn)中項(xiàng)目與屬性之間的對應(yīng)關(guān)系,Q矩陣中元素取值為1代表正確作答某一項(xiàng)目需要某一對應(yīng)的屬性,取值為0則代表不需要。將認(rèn)知診斷模型與Q矩陣在項(xiàng)目水平上進(jìn)行組合,可以反映出研究者對于受測者在作答項(xiàng)目時(shí)的潛在認(rèn)知過程或操作的假定。

    在使用認(rèn)知診斷測驗(yàn)對于受測者的屬性掌握狀況進(jìn)行診斷的時(shí)候,研究者面臨的一個(gè)重要的理論及現(xiàn)實(shí)問題是如何進(jìn)行項(xiàng)目功能差異(

    Differential Item Functioning,

    DIF)檢驗(yàn)。因?yàn)楫?dāng)測驗(yàn)中含有功能差異的項(xiàng)目時(shí),不僅會(huì)產(chǎn)生測驗(yàn)公平性的問題,而且也會(huì)影響到受測者屬性掌握模式的判別(王卓然,邊玉芳,郭磊,2015)。在認(rèn)知診斷模型中一個(gè)被廣泛接受的 DIF定義是不同組中具有相同屬性掌握模式的受測者正確作答某一項(xiàng)目的概率不同(Hou et al.,2014;Li,2008)。當(dāng)前研究者們提出了一些不同的方法用于檢驗(yàn)認(rèn)知診斷模型中的DIF (Hou et al.,2014;Li,2008;王卓然,郭磊,邊玉芳,2014;Li &Wang,2015;Zhang,2006)。Zhang (2006)提出使用 MH法(Holland &Thayer,1988;Mantel &Haenszel,1959)以及SIBTEST法(Shealy &Stout,1993),用受測者的測驗(yàn)總分以及屬性掌握模式作為匹配變量去檢驗(yàn) DINA模型中的 DIF。Zhang (2006)所提出的方法中的不足之處在于:目標(biāo)組以及對照組的項(xiàng)目參數(shù)以及屬性掌握模式參數(shù)是作為一個(gè)整體被同時(shí)估計(jì)出來的,因此會(huì)導(dǎo)致其估計(jì)值不準(zhǔn)確;另外,MH法以及SIBTEST法只能檢驗(yàn)一致性DIF。Hou(2013)的研究中指出邏輯斯蒂克回歸法(

    Logistic Regression,

    LR) (Swaminathan &Rogers,1990),MH法以及 SIBTEST法的統(tǒng)計(jì)檢驗(yàn)力都受到測驗(yàn)中DIF項(xiàng)目比例的影響。Li (2008)使用改進(jìn)的高階DINA模型(de la Torre &Douglas,2004)去檢驗(yàn)DIF,然而,Li研究的不足之處在于:在某些模擬條件下,經(jīng)驗(yàn)一類錯(cuò)誤率(指的是在實(shí)際模擬中所觀察到的一類錯(cuò)誤)過高或者過低;另外這一方法只適用于高階模型而非一般性的模型。Hou等人(2014)提出使用 Wald統(tǒng)計(jì)量檢驗(yàn)項(xiàng)目功能差異,并且認(rèn)為Wald統(tǒng)計(jì)量的檢驗(yàn)方法的效果接近或者是優(yōu)于MH以及SIBTEST方法,然而,Hou等人所提出的Wald統(tǒng)計(jì)量存在以下不足:首先是一類錯(cuò)誤率過高,不符合預(yù)先設(shè)置的顯著性水平;其次,統(tǒng)計(jì)功效研究中,正確拒絕率是使用的每個(gè)模擬條件下的10,000次重復(fù)所獲得統(tǒng)計(jì)量的經(jīng)驗(yàn)分布來計(jì)算的,這使得其研究結(jié)果無法推廣到一般性的模型以及實(shí)際應(yīng)用中。另外,需要指出,Hou等人(2014)在計(jì)算Wald統(tǒng)計(jì)量時(shí)使用的是de la Torre (2009,2011)所提出認(rèn)知診斷模型信息矩陣的計(jì)算方法。王卓然等人(2014)的研究發(fā)現(xiàn)盡管 Wald方法的檢驗(yàn)力要高于LR法與MH法,但是也存在一類錯(cuò)誤率膨脹的問題。Li和Wang (2015)比較了使用馬爾可夫鏈蒙特卡羅(

    Markov chain Monte Carlo,

    MCMC)法計(jì)算項(xiàng)目參數(shù)時(shí),LCDM-DIF方法以及Wald方法在評價(jià)項(xiàng)目功能差異時(shí)的表現(xiàn)。Li和Wang發(fā)現(xiàn),他們所使用的LCDM-DIF方法以及Wald統(tǒng)計(jì)量具有較好的一類錯(cuò)誤控制率(僅有稍許的膨脹),并且當(dāng)被比較的組數(shù)為 3時(shí),Wald統(tǒng)計(jì)量的統(tǒng)計(jì)功效要優(yōu)于LCDM-DIF。

    通過以上文獻(xiàn)綜述我們可以發(fā)現(xiàn),盡管研究者們一致地認(rèn)為Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)有著高的統(tǒng)計(jì)檢驗(yàn)力,但是不同的研究對于 Wald統(tǒng)計(jì)量的一類錯(cuò)誤控制率的表現(xiàn)卻有著不同的結(jié)果。澄清不同的方法構(gòu)建的Wald統(tǒng)計(jì)量為什么在一類錯(cuò)誤控制率的表現(xiàn)不同這個(gè)問題,不僅在理論上具有重要意義,而且對于測驗(yàn)實(shí)踐也有重要意義。Hou等人(2014)以及王卓然等人(2014)所使用Wald統(tǒng)計(jì)量,均是基于de la Torre (2009,2011)所提出的項(xiàng)目參數(shù)的經(jīng)驗(yàn)交叉相乘信息矩陣而構(gòu)建的,而非基于全部的模型參數(shù)(即模型中所有自由估計(jì)的參數(shù))。然而,相關(guān)研究指出(Tian,Cai,Thissen,&Xin,2013;Paek&Cai,2013)通過對信息矩陣求逆計(jì)算誤差—協(xié)方差矩陣時(shí),信息矩陣應(yīng)該包括全部的模型參數(shù),而非僅僅是項(xiàng)目參數(shù);并且研究發(fā)現(xiàn)當(dāng)模型的參數(shù)是通過EM (Expectation-Maximization)方法(de la Torre,2009,2011)所估計(jì)獲得時(shí),應(yīng)該通過對觀察信息矩陣(基于樣本觀測數(shù)據(jù)所計(jì)算的信息矩陣,有些研究中也將其簡稱為觀察矩陣)求逆的方法計(jì)算誤差—協(xié)方差矩陣(Kenward &Molenberghs,1998;Louis,1982)。已有研究發(fā)現(xiàn)在項(xiàng)目反應(yīng)理論中觀察信息矩陣的逆可以很好的漸近誤差—協(xié)方差矩陣(Paek &Cai,2013)。

    針對以往研究中Wald統(tǒng)計(jì)量構(gòu)建方法的局限,解決在認(rèn)知診斷模型中更加準(zhǔn)確地估計(jì)Wald統(tǒng)計(jì)量這一重大理論問題,促進(jìn)認(rèn)知診斷測驗(yàn)在實(shí)踐中的運(yùn)用,本研究擬將觀察信息矩陣的計(jì)算方法引入到認(rèn)知診斷模型中,期望獲得一個(gè)好的誤差—協(xié)方差矩陣的估計(jì)方法,從而改進(jìn) Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的表現(xiàn)。研究包括主要包括以下3個(gè)部分:首先,介紹用于檢驗(yàn)認(rèn)知診斷模型中 DIF的 Wald統(tǒng)計(jì)量的構(gòu)建,重點(diǎn)強(qiáng)調(diào)誤差—協(xié)方差矩陣在構(gòu)建中所起的重要作用;其次,介紹認(rèn)知診斷模型中經(jīng)驗(yàn)交叉相乘信息矩陣以及觀察信息矩陣的計(jì)算方法;第三,采用模擬的方法,探索本研究所提出的改進(jìn)后的Wald統(tǒng)計(jì)量在計(jì)算DIF時(shí)的一類錯(cuò)誤控制率以及統(tǒng)計(jì)檢驗(yàn)力的表現(xiàn),并且與通過經(jīng)驗(yàn)交叉相乘信息矩陣而構(gòu)建的Wald統(tǒng)計(jì)量所獲得的結(jié)果進(jìn)行比較;為了更好的說明本研究中的研究結(jié)果,我們也將本研究的結(jié)果與其他采用相同實(shí)驗(yàn)設(shè)計(jì)的研究的結(jié)果(如,Hou et al.,2014;Li &Wang,2015)進(jìn)行了直接的比較。

    2 改進(jìn)的Wald統(tǒng)計(jì)量的計(jì)算方法

    在本研究中,我們將使用LCDM作為例子,說明在認(rèn)知診斷模型中如何應(yīng)用改進(jìn)后的Wald統(tǒng)計(jì)量進(jìn)行DIF檢驗(yàn)。LCDM是一個(gè)廣義的認(rèn)知診斷模型,對于其中的參數(shù)進(jìn)行約束,便可以獲得一些特殊的模型,如DINA以及C-RUM等(Henson et al.,2009)。

    LCDM 假定在給定屬性掌握模式α的條件下,受測者

    i

    在各個(gè)項(xiàng)目上的作答是獨(dú)立的,其反應(yīng)向量X的似然函數(shù),可以表示如下,

    反應(yīng)向量X的邊際概率,可以表示為:

    在公式(5)中,

    p

    (α)是屬性掌握模式 α的概率,在LCDM中,所有屬性掌握模式的概率之和為1。為滿足這一約束,本研究參考 Rupp,Templin和 Henson(2010)所使用的概念,設(shè)η=(η,…,η)′為模型的結(jié)構(gòu)參數(shù)(

    structural parameters

    ),用以描述任一受測者來自特定屬性掌握模式的概率,使用以下表達(dá)式,

    并且對結(jié)構(gòu)參數(shù)η施加約束,固定其中任一參數(shù)為0,一般而言,可以選擇固定最后一個(gè)模型參數(shù)η為0。

    再進(jìn)一步假定,受測者之間的作答都是獨(dú)立的,因此所有受測者作答X的似然函數(shù)為可以用如下公式來表示,

    從公式(8)可以發(fā)現(xiàn)方差—協(xié)方差矩陣估計(jì)的準(zhǔn)確性,對于 Wald統(tǒng)計(jì)量會(huì)產(chǎn)生重大的影響,這也就是說LCDM中信息矩陣的估計(jì)會(huì)對Wald統(tǒng)計(jì)量的計(jì)算產(chǎn)生重大影響。

    EM算法(Dempster,Laird,&Rubin,1977)對于心理測量學(xué)產(chǎn)生了非常大的影響,它將復(fù)雜的計(jì)算非完整數(shù)據(jù)似然函數(shù)最大值問題轉(zhuǎn)換為較為簡單的一系列偽完整數(shù)據(jù)問題,在認(rèn)知診斷模型分析軟件中得到了廣泛的應(yīng)用。然而,在通過EM算法計(jì)算參數(shù)時(shí),信息矩陣(或者是其逆方差—協(xié)方差矩陣)并不是伴隨產(chǎn)生的,因此,需要去進(jìn)行專門的計(jì)算。研究發(fā)現(xiàn),當(dāng)使用期望—最大化算法去計(jì)算模型的極大似然估計(jì)值時(shí),使用觀察信息矩陣能夠很好的去漸近模型的方差—協(xié)方差矩陣(Louis,1982),感興趣的研究者可以參考 Kenward和 Molenberghs(1998)的研究。對于 LCDM 而言,包含所有自由估計(jì)參數(shù)的經(jīng)驗(yàn)交叉相乘信息矩陣的公式可以表達(dá)如下:

    3 方法

    3.1 研究設(shè)計(jì)

    采用 Monte Carlo的方法進(jìn)行研究,受測者的作答反應(yīng)、模型的參數(shù)估計(jì)以及Wald統(tǒng)計(jì)量的計(jì)算均采用

    R

    語言(R Core Team,2015)編程實(shí)現(xiàn)。每種實(shí)驗(yàn)條件均重復(fù)1000次,以獲得穩(wěn)定的結(jié)果。為了便于與以往研究結(jié)果進(jìn)行直接的比較,本研究所采用Hou等人(2014)所設(shè)計(jì)的實(shí)驗(yàn)條件,這些實(shí)驗(yàn)條件也被Li和Wang (2015)所采用。與Hou等人(2014)研究不同的是,本研究中 Wald統(tǒng)計(jì)量的計(jì)算是通過包含全部模型參數(shù)的觀察信息矩陣或者是經(jīng)驗(yàn)交叉相乘信息矩陣所計(jì)算獲得的。

    本研究中所采用Q矩陣中包含30個(gè)測驗(yàn)項(xiàng)目,5個(gè)屬性,并且限制每個(gè)項(xiàng)目所包含的屬性數(shù)量最多為3。Q矩陣采用平衡設(shè)計(jì),每個(gè)屬性被項(xiàng)目所測量的次數(shù)相等,同樣使包含 1、2、3個(gè)屬性的項(xiàng)目數(shù)量也相等即包含1、2、3個(gè)屬性的項(xiàng)目分別有10個(gè)。具體的Q矩陣設(shè)計(jì)見表1。

    為方便與以往研究結(jié)果進(jìn)行直接對比,本研究設(shè)計(jì)中的數(shù)據(jù)生成模型也同樣采用DINA模型,對照組中的猜測以及滑動(dòng)參數(shù)設(shè)置為相等,且有三個(gè)水平:0.1,0.2以及0.3,猜測以及滑動(dòng)參數(shù)值設(shè)置的越小,說明項(xiàng)目越能夠區(qū)分出受測者是否掌握了所測的屬性(Templin &Henson,2006)。DIF類型有兩個(gè)水平:一致性DIF以及非一致性 DIF。一致性 DIF指的是對于某一個(gè)組而言,正確作答某個(gè)項(xiàng)目的概率在所有可能的屬性掌握模式下均一致性地高或者是低;非一致性DIF指的是正確作答某個(gè)項(xiàng)目的概率在一些屬性掌握模式下高,在另外一些屬性掌握模式下低,或者是相反,即正確作答的概率具有非一致性。DIF大小有兩個(gè)水平:0.05與0.1,當(dāng)項(xiàng)目參數(shù)值為0.1時(shí)僅考慮了0.05這一水平的DIF大小,以防項(xiàng)目參數(shù)值等于 0。樣本大小有兩個(gè)水平:500與1000。在認(rèn)知診斷模型中樣本的大小會(huì)對模型參數(shù)估計(jì)值的精確性產(chǎn)生影響,進(jìn)而也會(huì)影響到Wald統(tǒng)計(jì)量的計(jì)算,因此,樣本大小也是一個(gè)需要考慮的重要因素。

    表1 Q矩陣

    3.2 評價(jià)指標(biāo)

    本研究中所采用的評價(jià)指標(biāo)為經(jīng)驗(yàn)一類錯(cuò)誤率以及統(tǒng)計(jì)檢驗(yàn)力。經(jīng)驗(yàn)一類錯(cuò)誤率是通過 1000次模擬中,錯(cuò)誤地檢驗(yàn)出每個(gè)項(xiàng)目出現(xiàn)DIF的百分比,然后參照以往研究結(jié)果的呈現(xiàn)方式(Hou et al.,2014),分別對包含一個(gè)、兩個(gè)以及三個(gè)屬性的項(xiàng)目求平均。統(tǒng)計(jì)檢驗(yàn)力指的是在這1000次循環(huán)中正確拒絕原假設(shè)的比例。當(dāng)認(rèn)知診斷測驗(yàn)中不存在 DIF時(shí),如果我們所構(gòu)建 Wald統(tǒng)計(jì)量是漸近卡方分布的,那么它觀察到的一類錯(cuò)誤率應(yīng)該符合預(yù)先設(shè)置的理論上的一類錯(cuò)誤控制率,如0.05;如果在認(rèn)知診斷測驗(yàn)中存在 DIF,那么 Wald統(tǒng)計(jì)量正確拒絕的比例越高,說明它能夠檢驗(yàn)出DIF項(xiàng)目的能力越強(qiáng)。

    4 研究結(jié)果

    4.1 經(jīng)驗(yàn)一類錯(cuò)誤率

    表2呈現(xiàn)了各個(gè)實(shí)驗(yàn)條件下的使用觀察信息矩陣估計(jì)方法的Wald統(tǒng)計(jì)量獲得的平均經(jīng)驗(yàn)一類錯(cuò)誤率。計(jì)算一類錯(cuò)誤控制率所使用的參照分布為自由度為2的卡方分布。通過表2可以發(fā)現(xiàn)當(dāng)項(xiàng)目的猜測以及滑動(dòng)參數(shù)都比較小的時(shí)候,即項(xiàng)目能夠較為有效的區(qū)分受測者是否掌握所測屬性的時(shí),一類錯(cuò)誤控制率能夠很好的接近預(yù)先設(shè)置的顯著性水平。隨著樣本量的增大,一類錯(cuò)誤控制率的表現(xiàn)也越好。另外,不論是包含一個(gè)、兩個(gè)還是三個(gè)屬性的項(xiàng)目,其觀察一類錯(cuò)誤率均能較好的接近0.05這一顯著性水平。另外需要指出的是,盡管在當(dāng)樣本量較小(

    N

    =500)且項(xiàng)目的猜測參數(shù)以及滑動(dòng)參數(shù)較大的情況下(

    g

    =

    s

    =0.3),平均的經(jīng)驗(yàn)一類錯(cuò)誤率表現(xiàn)較差,但根據(jù) Bradley (1978)的健壯寬松準(zhǔn)則(當(dāng)顯著性水平為 0.05時(shí)經(jīng)驗(yàn)一類錯(cuò)誤控制率在0.025與 0.075之間),仍然可以認(rèn)為是得到了較好的控制??梢园l(fā)現(xiàn),本研究中所提出的改進(jìn)的Wald統(tǒng)計(jì)量計(jì)算方法所獲得的結(jié)果并不存在過度膨脹的現(xiàn)象,這與 Hou等人(2014)以及王卓然等人(2015)的結(jié)果恰好相反,說明本研究中所提出的Wald統(tǒng)計(jì)量的計(jì)算方法明顯優(yōu)于以上兩個(gè)研究所使用的 Wald統(tǒng)計(jì)量的計(jì)算方法。通過比較表2與表3中的一類錯(cuò)誤控制率可以發(fā)現(xiàn)基于觀察信息矩陣計(jì)算的Wald統(tǒng)計(jì)量的表現(xiàn)要優(yōu)于基于經(jīng)驗(yàn)交叉相乘信息矩陣而計(jì)算的Wald統(tǒng)計(jì)量?;诮?jīng)驗(yàn)交叉相乘矩陣而獲得的Wald統(tǒng)計(jì)量的一類錯(cuò)誤控制率較為保守,但是表3的結(jié)果同樣顯示包含一個(gè)、兩個(gè)以及三個(gè)屬性的項(xiàng)目的一類錯(cuò)誤控制率仍大致相等。Li和 Wang (2015)在 MCMC框架下采用LCDM-DIF以及Wald統(tǒng)計(jì)量對于DIF檢驗(yàn)方法進(jìn)行了研究,在其研究一中同樣采用了 Hou等人(2014)的研究設(shè)計(jì),因此本研究的研究結(jié)果同樣也是可以直接與 Li等人的結(jié)果進(jìn)行比較。通過對比研究結(jié)果可以發(fā)現(xiàn),本研究中所提出基于觀察信息矩陣計(jì)算的Wald統(tǒng)計(jì)量與Li等人的研究中所使用的LCDM-DIF以及Wald統(tǒng)計(jì)量均具有較好的一類錯(cuò)誤控制率。一個(gè)非常有意思的現(xiàn)象是在本研究中的一些實(shí)驗(yàn)條件下(見表2)Wald統(tǒng)計(jì)量一類錯(cuò)誤率有細(xì)微的保守而Li等人研究結(jié)果中的LCDM-DIF以及 Wald統(tǒng)計(jì)量在某些實(shí)驗(yàn)條件中一類錯(cuò)誤率卻有稍許膨脹。從公式(8)中可以發(fā)現(xiàn)Wald統(tǒng)計(jì)量的準(zhǔn)確性,依賴于模型參數(shù)估計(jì)值的準(zhǔn)確性。當(dāng)受測者數(shù)量較少(如

    N

    =500時(shí))或者是模型中的“噪音”過大時(shí)(如項(xiàng)目的猜測與滑動(dòng)參數(shù)均為 0.3時(shí)),模型參數(shù)估計(jì)值的準(zhǔn)確性會(huì)受到相對較大的影響,因此,在本研究的

    N

    =500以及

    g

    =

    s

    =0.3這兩種條件下Wald統(tǒng)計(jì)量一類錯(cuò)誤率有細(xì)微的保守。

    表2 基于觀察信息矩陣的平均的經(jīng)驗(yàn)一類錯(cuò)誤率(α=0.05)

    表3 基于經(jīng)驗(yàn)交叉相乘信息矩陣的平均的經(jīng)驗(yàn)一類錯(cuò)誤率(α=0.05)

    4.2 統(tǒng)計(jì)檢驗(yàn)力

    表4中呈現(xiàn)的是當(dāng)認(rèn)知診斷測驗(yàn)中存在一致性DIF時(shí)的考察一個(gè)、兩個(gè)以及三個(gè)屬性項(xiàng)目在1000次循環(huán)中的基于觀察信息矩陣計(jì)算的 Wald統(tǒng)計(jì)量的平均經(jīng)驗(yàn)拒絕比例,所使用的參照分布同樣為自由度為2的卡方分布。從表4中可以看出,隨著DIF的增大,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力也會(huì)隨之增大,并且當(dāng)項(xiàng)目的猜測以及滑動(dòng)參數(shù)都為 0.2的時(shí)候,總平均的拒絕率要大于同為0.3時(shí)的項(xiàng)目參數(shù)值的條件。這是由于同項(xiàng)目參數(shù)值0.3相比,DIF大小為0.1時(shí),這一值對于項(xiàng)目參數(shù)值0.2而言相對更大。隨著樣本量的增加,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力也在變大,即樣本量的大小對用于檢驗(yàn)DIF的Wald統(tǒng)計(jì)量而言也是一個(gè)重要因素。因?yàn)殡S著樣本量的增加,模型參數(shù)估計(jì)值的準(zhǔn)確性也會(huì)增加,進(jìn)而會(huì)使得參數(shù)估計(jì)值的標(biāo)準(zhǔn)誤變小,因此,在對照組與目標(biāo)組項(xiàng)目參數(shù)差異相等的情況下,更傾向于獲得一個(gè)大的Wald統(tǒng)計(jì)量的值。另外,通過觀察平均值可以發(fā)現(xiàn),當(dāng)目標(biāo)組具有負(fù)向的 DIF時(shí),同正向 DIF相比,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力更大。比較表4與表5,可以發(fā)現(xiàn)基于觀察信息矩陣的Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力均要明顯優(yōu)于基于經(jīng)驗(yàn)交叉相乘信息矩陣的Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力。這也說明基于經(jīng)驗(yàn)交叉相乘信息矩陣的Wald統(tǒng)計(jì)量存在保守的問題。

    表4 基于觀察信息矩陣的一致性DIF的平均經(jīng)驗(yàn)統(tǒng)計(jì)檢驗(yàn)力(α=0.05)

    表6中呈現(xiàn)的是非一致性DIF條件下采用觀察信息矩陣的Wald統(tǒng)計(jì)量的1000次模擬結(jié)果,計(jì)算統(tǒng)計(jì)檢驗(yàn)力所使用的參照分布同樣為自由度為2的卡方分布。從表6中同樣可以發(fā)現(xiàn)隨著DIF的增大,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力也在增大。隨著樣本量的增加,Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力同樣是在增大的。而且在DIF大小相同條件下,當(dāng)項(xiàng)目的猜測以及滑動(dòng)參數(shù)相對較小時(shí),Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力會(huì)相對較大。比較表6與表7同樣可以發(fā)現(xiàn),在非一致性DIF條件下,采用觀察信息矩陣計(jì)算的Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力均高于采用經(jīng)驗(yàn)交叉相乘信息矩陣而計(jì)算獲得的Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力。

    表5 基于經(jīng)驗(yàn)交叉相乘信息矩陣的一致性DIF的平均經(jīng)驗(yàn)統(tǒng)計(jì)檢驗(yàn)力(α=0.05)

    表6 基于觀察信息矩陣的非一致性DIF的平均經(jīng)驗(yàn)統(tǒng)計(jì)檢驗(yàn)力(α=0.05)

    表7 基于經(jīng)驗(yàn)交叉相乘信息矩陣的非一致性DIF的平均經(jīng)驗(yàn)統(tǒng)計(jì)檢驗(yàn)力(α=0.05)

    5 討論

    認(rèn)知診斷模型能夠提夠關(guān)于受測者屬性掌握模式的較為詳盡的診斷性信息,它不僅能為老師的教以及學(xué)生的學(xué)提供有針對性的建議,而且也有助于教育者深入理解受測者的認(rèn)知心理。在使用這一模型來解釋受測者的作答之前,研究者需要確定認(rèn)知診斷測驗(yàn)項(xiàng)目的參數(shù)對于所有受測者都是不變的,否則會(huì)對受測者的屬性掌握模式的估計(jì)帶來不良的影響(王卓然等,2015),進(jìn)而導(dǎo)致錯(cuò)誤的診斷性信息。DIF檢驗(yàn)可以用以確認(rèn)不同組的受測者在同一個(gè)項(xiàng)目的作答上是否存在差異,即除了屬性掌握模式外,受測者所在的組會(huì)影響到他們對于項(xiàng)目的反應(yīng)。為保證測驗(yàn)的效度,在使用認(rèn)知診斷模型來擬合受測者的作答數(shù)據(jù)前,需要進(jìn)行DIF檢驗(yàn)。先前研究者發(fā)現(xiàn)Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí),有著許多其他統(tǒng)計(jì)量所不具備的優(yōu)點(diǎn),然而前人研究中對于Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的一類錯(cuò)誤率的表現(xiàn),存在明顯的結(jié)論沖突。如,Hou等人(2014)以及王卓然等人(2014)的模擬研究發(fā)現(xiàn) Wald統(tǒng)計(jì)量會(huì)存在一類錯(cuò)誤控制率膨脹的問題,Li和Wang (2015)的模擬研究卻發(fā)現(xiàn),其研究中所用的 LCDM-DIF以及Wald統(tǒng)計(jì)量在使用MCMC計(jì)算時(shí)有著良好的一類錯(cuò)誤控制率。本研究采用Hou等人以及Li等人研究中所使用的同等條件通過模擬發(fā)現(xiàn),這些差異主要是由于 Wald統(tǒng)計(jì)量計(jì)算方法的差異引起的。因此,我們認(rèn)為本研究提出的改進(jìn)的 Wald統(tǒng)計(jì)量的計(jì)算方法解決了 DIF研究中一直困擾研究者的Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的一類錯(cuò)誤率的表現(xiàn)不同這一重要問題,具有重大的理論意義。

    5.1 Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的一類錯(cuò)誤控制率

    在模型正確設(shè)定的前提下,如果統(tǒng)計(jì)量能夠很好的服從漸近分布,那么,它的一類錯(cuò)誤控制率應(yīng)該能夠較好的接近預(yù)先設(shè)定好的顯著性水平。本研究中所提出改進(jìn)的 Wald統(tǒng)計(jì)量的計(jì)算方法具有這一特征,從結(jié)果中可以發(fā)現(xiàn),本研究的一類錯(cuò)誤控制率均較好地接近預(yù)先設(shè)定的 0.05這一顯著性水平。因此,我們認(rèn)為在Hou等人(2014)以及王卓然等人(2014)研究中所產(chǎn)生的 Wald統(tǒng)計(jì)量一類錯(cuò)誤膨脹的問題,是由于不恰當(dāng)?shù)男畔⒕仃嚬烙?jì)方法而引起的。本研究的這一結(jié)果明確地解釋了為什么 Wald統(tǒng)計(jì)量在不同研究中有不同表現(xiàn)的問題,對于認(rèn)知診斷模型的理論發(fā)展有一定的推動(dòng)作用。另外,相對于MCMC參數(shù)估計(jì)方法,MMLE/EM具有運(yùn)算量小、耗時(shí)短等優(yōu)點(diǎn),本研究所提出的改進(jìn)的 Wald統(tǒng)計(jì)量正是基于 MMLE/EM,因此,本研究不僅具有重大的理論意義,而且對于認(rèn)知診斷實(shí)踐也具有重要的現(xiàn)實(shí)意義。

    5.2 Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的統(tǒng)計(jì)檢驗(yàn)力

    當(dāng)確認(rèn)統(tǒng)計(jì)量的一類錯(cuò)誤控制率能夠較好的接近預(yù)先設(shè)定的顯著性水平后,接下來所要考慮的另外一個(gè)重要問題是當(dāng)認(rèn)知診斷測驗(yàn)中的項(xiàng)目中存在 DIF時(shí),這一統(tǒng)計(jì)量能否有效地拒絕不存在DIF的原假設(shè)而選擇備擇假設(shè)。通過表4與表6中的結(jié)果,可以發(fā)現(xiàn)在樣本量較大時(shí)(

    N

    =1000),改進(jìn)后的Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)的統(tǒng)計(jì)檢驗(yàn)力均明顯的高于樣本量比較小時(shí)(

    N

    =500)的統(tǒng)計(jì)檢驗(yàn)力。因此,本研究建議在應(yīng)用Wald統(tǒng)計(jì)量進(jìn)行DIF檢驗(yàn)的時(shí)候,如果想要達(dá)到較高的統(tǒng)計(jì)檢驗(yàn)力,應(yīng)保證較大的樣本量。因?yàn)镠ou等人(2014)發(fā)現(xiàn),其研究中所采用的 Wald統(tǒng)計(jì)量計(jì)算方式,會(huì)導(dǎo)致一類錯(cuò)誤率膨脹,因此,在計(jì)算統(tǒng)計(jì)檢驗(yàn)力的時(shí)候,她們采用了兩種方式進(jìn)行。第一種方式是直接用 Wald統(tǒng)計(jì)量的理論分布即自由度為2的卡方分布的理論值來計(jì)算,由于其開發(fā)的 Wald統(tǒng)計(jì)量的計(jì)算方式的一類錯(cuò)誤率膨脹會(huì)使得原本不存在 DIF的項(xiàng)目被誤判為存在 DIF,因此計(jì)算結(jié)果不夠可靠;她們所采用的第二種方式是計(jì)算當(dāng)不存在 DIF項(xiàng)目時(shí)Wald統(tǒng)計(jì)量在每種實(shí)驗(yàn)條件組合下10,000次模擬的經(jīng)驗(yàn)分布,然后通過獲得的顯著性水平的臨界值,來計(jì)算Wald統(tǒng)計(jì)量的統(tǒng)計(jì)檢驗(yàn)力,這種計(jì)算方式雖然保證了模擬實(shí)驗(yàn)結(jié)果具有較高的可靠性,但是不具備現(xiàn)實(shí)的可操作性,因此,對于其研究目的而言只能算是一種不完整解決的方案。因?yàn)镠ou等人(2014)的第二種計(jì)算方式具有較高的理論上的結(jié)果可靠性,因此可以作為研究結(jié)果的一個(gè)參考。通過研究結(jié)果對照我們發(fā)現(xiàn),本研究所采用的自由度為2的卡方分布理論值所計(jì)算獲得的研究結(jié)果與 Hou等人(2014)的第二種計(jì)算方式所獲結(jié)果具有很高的一致性,這也能夠間接的表明,本研究所使用的改進(jìn)后的Wald統(tǒng)計(jì)量計(jì)算方式具有準(zhǔn)確性及可靠性的特點(diǎn)。

    5.3 以后的研究方向

    由于本研究關(guān)注的重點(diǎn)在于,在EM算法框架下提出一個(gè)恰當(dāng)?shù)?Wald統(tǒng)計(jì)量的計(jì)算方式,用以準(zhǔn)確有效地來檢驗(yàn)認(rèn)知診斷測驗(yàn)中可能存在的DIF項(xiàng)目,澄清以往研究中所用de la Torre (2009,2011)所提出的信息矩陣方法計(jì)算Wald統(tǒng)計(jì)量時(shí)所產(chǎn)生的令人困惑的結(jié)果。因此,本研究僅采用了Hou等人(2014)的研究設(shè)計(jì),通過結(jié)果對比的方式來證明本研究所提出的改進(jìn)的Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí)具有準(zhǔn)確性可靠性等特點(diǎn)。具體而言,研究者可以就以下幾方面進(jìn)行后續(xù)研究:首先,樣本大小對于 Wald統(tǒng)計(jì)量有重要影響,因此,后續(xù)研究中可以使用本研究中所用Wald統(tǒng)計(jì)量考察這一因素對于DIF的影響;其次,目前的研究中普遍采用 DINA或者是高階DINA作為例證模型,本研究出于結(jié)果比較的因素考慮,也是以DINA模型為例,在其他認(rèn)知診斷模型中Wald統(tǒng)計(jì)量用以檢驗(yàn)DIF時(shí)的表現(xiàn),也是一個(gè)非常有意思的研究方向。由于本研究所采用的是對于LCDM模型進(jìn)行約束而獲得的DINA模型,因此,可以很方便的進(jìn)行擴(kuò)展;第三,本研究所采用的項(xiàng)目數(shù)量為 30,且受測者組的數(shù)量為 2,在不同項(xiàng)目數(shù)量下以及不同的受測者組數(shù)量數(shù)下,Wald統(tǒng)計(jì)量的表現(xiàn)也值得研究者關(guān)注;第四,在認(rèn)知診斷模型中,除了Wald統(tǒng)計(jì)量可以進(jìn)行DIF檢驗(yàn)之外,還有一些其他的統(tǒng)計(jì)量也可以進(jìn)行 DIF檢驗(yàn)(Li,2008;Sünbül &Sünbül,2015,July),雖然目前研究表明,Wald統(tǒng)計(jì)量在檢驗(yàn)DIF時(shí),具有一些其他統(tǒng)計(jì)量所不具有的優(yōu)點(diǎn),但是,在另外的應(yīng)用情景中,這些DIF檢驗(yàn)方法的優(yōu)缺點(diǎn),仍然值得研究者的關(guān)注。

    6 結(jié)論

    本研究中所提出的改進(jìn)的 Wald統(tǒng)計(jì)量的計(jì)算方法,在認(rèn)知診斷測驗(yàn)中不存在DIF項(xiàng)目時(shí),有著良好的一類錯(cuò)誤控制率,能夠較為準(zhǔn)確地接近預(yù)先設(shè)定的顯著性水平,即當(dāng)認(rèn)知診斷模型為DINA時(shí),改進(jìn)的Wald統(tǒng)計(jì)量服從自由度為2的卡方分布;在認(rèn)知診斷測驗(yàn)中存在DIF時(shí),改進(jìn)的Wald統(tǒng)計(jì)量能夠準(zhǔn)確有效的鑒別出存在DIF的項(xiàng)目。本研究同樣發(fā)現(xiàn)樣本量對于 Wald統(tǒng)計(jì)量的一類錯(cuò)誤控制率及統(tǒng)計(jì)檢驗(yàn)力存在重要影響。另外,我們建議認(rèn)知診斷模型的研究者與使用者,當(dāng)采用EM算法進(jìn)行參數(shù)估計(jì)時(shí),在確認(rèn)認(rèn)知診斷模型正確設(shè)定后,使用本研究中所使用觀察信息矩陣的方法計(jì)算項(xiàng)目參數(shù)的標(biāo)準(zhǔn)誤。

    Bradley J.V.(1978).Robustness?.

    British Journal of Mathematical and Statistical Psychology,31

    ,144-152.Chen,J.S.,&de la Torre,J.(2013).A general cognitive diagnosis model for expert-defined polytomous attributes.

    Applied Psychological Measurement,37

    ,419-437.de la Torre,J.(2009).DINA model and parameter estimation:A didactic.

    Journal of Educational and Behavioral Statistics,34

    ,115-130.de la Torre,J.(2011).The generalized DINA model framework.

    Psychometrika,76

    ,179-199.de la Torre,J.,&Douglas,J.A.(2004).Higher-order latent trait models for cognitive diagnosis.

    Psychometrika,69

    ,333-353.Dempster,A.P.,Laird,N.M.,&Rubin,D.B.(1977).Maximum likelihood estimation from incomplete data via the EM algorithm.

    Journal of the Royal Statistical Society,Series B,39

    ,1-38.Greeno,J.G.(1980).Trends in the theory of knowledge for problem solving.In D.T.Tuma &F.Reif (Eds.),

    Problem solving and education: Issues in teaching and research

    (pp.9-23).Hillsdale,NJ:Erlbaum.Haertel,E.H.(1989).Using restricted latent class models to map the skill structure of achievement items.

    Journal of Educational Measurement,26

    ,301-321.Hartz,S.M.(2002).

    A Bayesian framework for the unified model for assessing cognitive abilities: Blending theory with practicality

    (Unpublished doctorial dissertation).Department of Statistics,University of Illinois at Urbana-Champaign.Henson,R.A.,Templin,J.L.,&Willse,J.T.(2009).Defining a family of cognitive diagnosis models using log-linear models with latent variables.

    Psychometrika,74

    ,191-210.Holland,P.W.,&Thayer,D.T.(1988).Differential item functioning and the Mantel-Haenszel procedure.In H.Wainer &H.I.Braun (Eds.),

    Test validity

    (pp.129-145).Hillsdale,NJ:Lawrence Erlbaum.Hou,L.K.,de la Torre,J.,&Nandakumar,R.(2014).Differential item functioning assessment in cognitive diagnosis modeling:Applying Wald test to investigate DIF for DINA model.

    Journal of Educational Measurement,51

    ,98-125.Junker,B.W.,&Sijtsma,K.(2001).Cognitive assessment models with few assumptions,and connections with nonparametric item response theory.

    Applied Psychological Measurement,25

    ,258-272.Kenward,M.G.&Molenberghs,G.(1998).Likelihood based frequentist inference when data are missing at random.

    Statistical Science,13

    ,236-247.Leighton,J.,&Gierl,M.(2007).

    Cognitive diagnostic assessment for education: Theory and applications

    .Cambridge:Cambridge University Press.Li,F.M.(2008).

    A modified higher-order DINA model for detecting differential item functioning and differential attribute functioning

    (Unpublished doctorial dissertation).University of Georgia.Li,X.M.,&Wang,W.C.(2015).Assessment of differential item functioning under cognitive diagnosis models:The DINA model example.

    Journal of Educational Measurement,52

    ,28-54.Louis,T.A.(1982).Finding the observed information matrix when using the EM algorithm.

    Journal of the Royal Statistical Society,Series B,44

    ,226-233.Mantel,N.,&Haenszel,W.(1959).Statistical aspects of the analysis of data from retrospective studies of disease.

    Journal of the National Cancer Institute,22

    ,719-748.Paek,I.,&Cai,L.(2013).A comparison of item parameter standard error estimation procedures for unidimensional and multidimensional item response theory modeling.

    Educational and Psychological Measurement,74

    ,58-76.R Core Team (2015).

    R: A language and environment for statistical computing.

    R foundation for statistical computing,Vienna,Austria.Retrieved July 2,2015,from http://www.R-project.orgRupp,A.A.,Templin,J.,&Henson,R.A.(2010).

    Diagnostic measurement: Theory,methods,and applications

    .New York,NY:Guilford.Shealy,R.,&Stout,W.(1993).A model-based standardization approach that separates true bias/DIF from group ability differences and detects test bias/DTF as well as item bias/DIF.

    Psychometrika,58

    ,159-194.Sünbül,?.,&Sünbül,S.?.(2015,July).

    Evaluating performance of differential item functioning detection methods for DIF data in DINA model

    .Paper presented at the meeting of the annual meeting of the International Meeting of the Psychometric Society,Beijing,China.Swaminathan,H.,&Rogers,H.J.(1990).Detecting differential item functioning using logistic regression procedures.

    Journal of Educational Measurement,27

    (4),361-370.Templin,J.L.,&Henson,R.A.(2006).Measurement of psychological disorders using cognitive diagnosis models.

    Psychological Methods,11

    ,287-305.Tian,W.,Cai,L.,Thissen,D.,&Xin,T.(2013).Numerical differentiation methods for computing error covariance matrices in item response theory modeling:An evaluation and a new proposal.

    Educational and Psychological Measurement,73

    ,412-439.von Davier,M.(2005).

    A general diagnostic model applied to language testing data (ETS Research Report RR-05-16).

    Princeton:Educational Testing Service.von Davier,M.(2009).Some notes on the reinvention of latent structure models as diagnostic classification models.

    Measurement:Interdisciplinary Research and Perspectives, 7

    ,67-74.Wang,Z.R.,Bian,Y.F.,&Guo,L.(2015).The impact of DIF on estimating accuracy of cognitive diagnostic test.

    Psychological Exploration,35

    ,272-278.[王卓然,邊玉芳,郭磊.(2015).項(xiàng)目功能差異對于認(rèn)知診斷測驗(yàn)估計(jì)準(zhǔn)確性的影響.

    心理學(xué)探新,35

    ,272-278.]Wang,Z.R.,Guo,L.,&Bian,Y.F.(2014).Comparison of DIF detecting methods in cognitive diagnostic test.

    Acta Psychologica Sinica,46

    ,1923-1932.[王卓然,郭磊,邊玉芳.(2014).認(rèn)知診斷測驗(yàn)中的項(xiàng)目功能差異檢測方法比較.

    心理學(xué)報(bào),46

    ,1923-1932.]Zhang,W.(2006).

    Detecting differential item functioning using the DINA model

    (Unpublished doctorial dissertation).University of North Carolina at Greensboro.

    猜你喜歡
    受測者診斷模型錯(cuò)誤率
    多源領(lǐng)域自適應(yīng)的往復(fù)壓縮機(jī)在線診斷方法
    限制性隨機(jī)試驗(yàn)中選擇偏倚導(dǎo)致的一類錯(cuò)誤率膨脹*
    怒氣沖沖 或因睡不好
    CD4細(xì)胞計(jì)數(shù)聯(lián)合IGRA預(yù)測AIDS/Ⅲ型TB影像診斷模型分析
    甘肅科技(2020年20期)2020-04-13 00:30:56
    新媒體科研環(huán)境下自發(fā)式科研協(xié)同行為機(jī)制研究
    一種電網(wǎng)通信網(wǎng)絡(luò)的故障檢測方法及系統(tǒng)
    正視錯(cuò)誤,尋求策略
    教師·中(2017年3期)2017-04-20 21:49:49
    解析小學(xué)高段學(xué)生英語單詞抄寫作業(yè)錯(cuò)誤原因
    降低學(xué)生計(jì)算錯(cuò)誤率的有效策略
    淘寶排行榜
    国产女主播在线喷水免费视频网站 | 高清日韩中文字幕在线| 在线观看免费高清a一片| 国产成人aa在线观看| 99久国产av精品| 中国美白少妇内射xxxbb| 日本免费在线观看一区| 国产精品一区二区三区四区久久| 在现免费观看毛片| 18禁动态无遮挡网站| 80岁老熟妇乱子伦牲交| 国内少妇人妻偷人精品xxx网站| 在线免费观看的www视频| 久久97久久精品| 久久精品国产亚洲网站| 亚洲丝袜综合中文字幕| 亚洲欧美一区二区三区黑人 | 国产伦精品一区二区三区四那| 欧美xxⅹ黑人| 2018国产大陆天天弄谢| 亚洲成人久久爱视频| 亚洲在线观看片| 一级毛片黄色毛片免费观看视频| 免费av毛片视频| 日韩av在线大香蕉| 高清毛片免费看| 久久亚洲国产成人精品v| 国产一级毛片七仙女欲春2| 国产精品久久久久久精品电影| 国产av国产精品国产| 免费看av在线观看网站| 欧美+日韩+精品| freevideosex欧美| 一级毛片久久久久久久久女| 免费在线观看成人毛片| 欧美+日韩+精品| 亚洲自拍偷在线| 一边亲一边摸免费视频| 午夜福利视频1000在线观看| videossex国产| 国产精品一区www在线观看| 成人美女网站在线观看视频| 午夜福利高清视频| 舔av片在线| 亚洲精品成人av观看孕妇| 亚洲丝袜综合中文字幕| 亚洲精品,欧美精品| a级毛片免费高清观看在线播放| 国产精品久久久久久精品电影小说 | 一区二区三区免费毛片| av线在线观看网站| 欧美三级亚洲精品| 麻豆国产97在线/欧美| 亚洲国产精品成人久久小说| 日韩欧美精品免费久久| 亚洲精品一区蜜桃| 国产一级毛片七仙女欲春2| 亚洲自偷自拍三级| 国产麻豆成人av免费视频| 欧美潮喷喷水| 亚洲真实伦在线观看| 乱人视频在线观看| 如何舔出高潮| 国产高清不卡午夜福利| 一级片'在线观看视频| 午夜精品在线福利| 亚洲国产成人一精品久久久| 免费看日本二区| 国产在视频线在精品| 国产亚洲精品av在线| 美女被艹到高潮喷水动态| kizo精华| 亚洲第一区二区三区不卡| 日韩精品青青久久久久久| 亚洲av日韩在线播放| 免费观看av网站的网址| 国产免费一级a男人的天堂| 免费观看a级毛片全部| 亚洲国产欧美在线一区| 女人十人毛片免费观看3o分钟| 一本一本综合久久| 国产精品一二三区在线看| 日本一本二区三区精品| 欧美人与善性xxx| 欧美xxⅹ黑人| 日韩精品有码人妻一区| 性插视频无遮挡在线免费观看| 亚洲不卡免费看| 人人妻人人澡人人爽人人夜夜 | 成年免费大片在线观看| 亚洲在久久综合| av国产免费在线观看| 91精品伊人久久大香线蕉| 内地一区二区视频在线| 国内精品美女久久久久久| 亚洲熟妇中文字幕五十中出| 成人性生交大片免费视频hd| 精品久久久久久久人妻蜜臀av| 2022亚洲国产成人精品| 色播亚洲综合网| 日本三级黄在线观看| 欧美最新免费一区二区三区| 天堂√8在线中文| 乱系列少妇在线播放| 波多野结衣巨乳人妻| 日产精品乱码卡一卡2卡三| 亚洲av电影在线观看一区二区三区 | 免费看日本二区| 国产精品一区二区三区四区免费观看| 国产男人的电影天堂91| 久99久视频精品免费| 亚洲美女搞黄在线观看| 美女被艹到高潮喷水动态| ponron亚洲| 国产成人精品婷婷| 国产精品久久视频播放| 亚洲欧美一区二区三区国产| 久久久久久久久久久丰满| 亚洲不卡免费看| 国产伦一二天堂av在线观看| 中文资源天堂在线| 久久久精品免费免费高清| 18+在线观看网站| 国产亚洲精品av在线| 成人毛片60女人毛片免费| 免费播放大片免费观看视频在线观看| 噜噜噜噜噜久久久久久91| 国产亚洲精品久久久com| 如何舔出高潮| 亚洲欧美成人精品一区二区| 精品熟女少妇av免费看| 精品久久久久久久久亚洲| 久久精品综合一区二区三区| av国产久精品久网站免费入址| 丝袜喷水一区| 只有这里有精品99| 精品久久久精品久久久| 在线播放无遮挡| 看非洲黑人一级黄片| 久久午夜福利片| 欧美97在线视频| 人人妻人人澡欧美一区二区| 国模一区二区三区四区视频| 国产成人午夜福利电影在线观看| 亚洲国产av新网站| 三级国产精品片| 免费大片黄手机在线观看| 99热网站在线观看| 免费在线观看成人毛片| 欧美日韩一区二区视频在线观看视频在线 | 日本午夜av视频| 性色avwww在线观看| 日韩一区二区视频免费看| 国产精品无大码| 欧美xxxx黑人xx丫x性爽| 久久精品熟女亚洲av麻豆精品 | 男人爽女人下面视频在线观看| 日韩成人伦理影院| 免费电影在线观看免费观看| 久久精品久久久久久久性| 网址你懂的国产日韩在线| 亚洲熟妇中文字幕五十中出| 中文字幕免费在线视频6| 99视频精品全部免费 在线| 男女边吃奶边做爰视频| 欧美 日韩 精品 国产| 在线天堂最新版资源| 91久久精品国产一区二区三区| 亚洲精品中文字幕在线视频 | 丝袜美腿在线中文| av专区在线播放| 美女大奶头视频| 97热精品久久久久久| 精品国内亚洲2022精品成人| 久久精品国产自在天天线| 一本一本综合久久| h日本视频在线播放| 国产精品一区二区三区四区久久| 中文字幕免费在线视频6| 大话2 男鬼变身卡| 一区二区三区四区激情视频| 国产欧美日韩精品一区二区| 一级毛片aaaaaa免费看小| 欧美日韩一区二区视频在线观看视频在线 | 精品久久久久久电影网| 少妇熟女欧美另类| 在线天堂最新版资源| 搡老乐熟女国产| 亚洲美女搞黄在线观看| 久久99精品国语久久久| 大香蕉97超碰在线| 国内精品一区二区在线观看| 国产一区二区亚洲精品在线观看| 国产在线一区二区三区精| 中文天堂在线官网| 亚洲婷婷狠狠爱综合网| 亚洲精华国产精华液的使用体验| 亚洲精品色激情综合| 麻豆乱淫一区二区| 亚洲国产高清在线一区二区三| 久久久精品欧美日韩精品| av线在线观看网站| 深夜a级毛片| 亚洲av免费高清在线观看| 尾随美女入室| 又粗又硬又长又爽又黄的视频| 美女高潮的动态| 精品不卡国产一区二区三区| 久久综合国产亚洲精品| 日韩视频在线欧美| 国产精品av视频在线免费观看| 亚洲欧美中文字幕日韩二区| 国产精品一区二区在线观看99 | 亚洲av在线观看美女高潮| 免费无遮挡裸体视频| 91aial.com中文字幕在线观看| 综合色丁香网| 99热这里只有精品一区| 亚洲国产日韩欧美精品在线观看| 日本黄大片高清| 搡女人真爽免费视频火全软件| 深爱激情五月婷婷| 国产精品蜜桃在线观看| 国产激情偷乱视频一区二区| 日本熟妇午夜| 日韩一本色道免费dvd| 777米奇影视久久| 麻豆成人午夜福利视频| 免费黄频网站在线观看国产| 国产成人一区二区在线| 国产免费福利视频在线观看| 日韩av免费高清视频| 天堂俺去俺来也www色官网 | 男人舔奶头视频| 亚洲内射少妇av| 六月丁香七月| 国产精品蜜桃在线观看| 伦精品一区二区三区| 神马国产精品三级电影在线观看| 亚洲精品国产成人久久av| 亚洲成人久久爱视频| 国产午夜精品一二区理论片| 边亲边吃奶的免费视频| 亚洲熟妇中文字幕五十中出| 中文乱码字字幕精品一区二区三区 | 99视频精品全部免费 在线| 国产 亚洲一区二区三区 | 成人漫画全彩无遮挡| 精品久久久精品久久久| 国产高清三级在线| 亚洲经典国产精华液单| 日韩不卡一区二区三区视频在线| 午夜福利视频精品| 成年av动漫网址| 人人妻人人看人人澡| 美女脱内裤让男人舔精品视频| eeuss影院久久| 精品一区在线观看国产| 亚洲人与动物交配视频| 午夜免费男女啪啪视频观看| 久久久亚洲精品成人影院| 一级毛片电影观看| 亚洲精品中文字幕在线视频 | 亚洲精品国产av蜜桃| 久久精品熟女亚洲av麻豆精品 | 亚洲av国产av综合av卡| 一级毛片久久久久久久久女| 干丝袜人妻中文字幕| 久久久久久久久久成人| 日本午夜av视频| 欧美zozozo另类| 久久精品国产亚洲av天美| h日本视频在线播放| 亚洲精品乱久久久久久| 好男人在线观看高清免费视频| 欧美成人午夜免费资源| 国产探花极品一区二区| 欧美日韩精品成人综合77777| 免费观看无遮挡的男女| 亚洲精品一区蜜桃| 免费观看av网站的网址| 精品久久久久久久久av| 成年人午夜在线观看视频 | 久久久午夜欧美精品| 免费大片18禁| 久久草成人影院| 白带黄色成豆腐渣| 一本—道久久a久久精品蜜桃钙片 精品乱码久久久久久99久播 | 一级片'在线观看视频| 国产乱来视频区| kizo精华| 日韩制服骚丝袜av| 高清欧美精品videossex| 久久久久久久亚洲中文字幕| 夜夜看夜夜爽夜夜摸| 国产精品av视频在线免费观看| 欧美激情在线99| 久久精品国产鲁丝片午夜精品| 免费大片黄手机在线观看| 2021天堂中文幕一二区在线观| 国产精品爽爽va在线观看网站| 精品久久久久久成人av| 成年版毛片免费区| 热99在线观看视频| 国产精品熟女久久久久浪| 欧美高清性xxxxhd video| 国产熟女欧美一区二区| 少妇的逼好多水| 亚洲av免费高清在线观看| 中国美白少妇内射xxxbb| 日韩精品有码人妻一区| 看免费成人av毛片| 菩萨蛮人人尽说江南好唐韦庄| 久久国内精品自在自线图片| 欧美97在线视频| 国产极品天堂在线| 国产欧美另类精品又又久久亚洲欧美| 插阴视频在线观看视频| 欧美最新免费一区二区三区| 一区二区三区免费毛片| 成年版毛片免费区| 大片免费播放器 马上看| 国产又色又爽无遮挡免| 日本午夜av视频| 国产成人aa在线观看| 伦理电影大哥的女人| 国国产精品蜜臀av免费| 亚洲av在线观看美女高潮| av在线观看视频网站免费| 精品久久久久久久末码| 亚洲无线观看免费| 亚洲av成人av| 特大巨黑吊av在线直播| 寂寞人妻少妇视频99o| 两个人视频免费观看高清| 国产激情偷乱视频一区二区| 日韩欧美三级三区| 中文字幕亚洲精品专区| 人人妻人人澡欧美一区二区| 亚洲欧美中文字幕日韩二区| 精品国产露脸久久av麻豆 | 亚洲图色成人| 精华霜和精华液先用哪个| 日韩一区二区三区影片| 精品一区二区三区人妻视频| 天天躁日日操中文字幕| 日日摸夜夜添夜夜添av毛片| 精品午夜福利在线看| 极品少妇高潮喷水抽搐| 欧美bdsm另类| 干丝袜人妻中文字幕| 日韩av在线免费看完整版不卡| 大香蕉97超碰在线| 免费无遮挡裸体视频| 国产精品日韩av在线免费观看| 亚洲不卡免费看| 2021天堂中文幕一二区在线观| 美女cb高潮喷水在线观看| 国产白丝娇喘喷水9色精品| 夫妻午夜视频| 尤物成人国产欧美一区二区三区| 亚洲经典国产精华液单| 日韩大片免费观看网站| 亚洲国产色片| 亚洲国产日韩欧美精品在线观看| 亚洲真实伦在线观看| 亚洲av电影在线观看一区二区三区 | 国产不卡一卡二| 91久久精品国产一区二区成人| 极品少妇高潮喷水抽搐| 一个人看的www免费观看视频| 久久精品国产自在天天线| 丰满少妇做爰视频| 日韩欧美一区视频在线观看 | 汤姆久久久久久久影院中文字幕 | 亚洲国产精品国产精品| 午夜日本视频在线| 成人无遮挡网站| 国产亚洲精品av在线| 菩萨蛮人人尽说江南好唐韦庄| 亚洲欧美一区二区三区国产| 岛国毛片在线播放| av又黄又爽大尺度在线免费看| 成人鲁丝片一二三区免费| 一个人看的www免费观看视频| 少妇的逼好多水| 精品久久久久久成人av| 边亲边吃奶的免费视频| 久久6这里有精品| 真实男女啪啪啪动态图| 国产精品无大码| 国产老妇伦熟女老妇高清| 久久久欧美国产精品| 美女国产视频在线观看| 一级黄片播放器| 国产高清不卡午夜福利| 青春草亚洲视频在线观看| av在线老鸭窝| 精品国产三级普通话版| 久久人人爽人人片av| 国产老妇女一区| 成人午夜高清在线视频| 亚洲经典国产精华液单| 99久国产av精品国产电影| 永久免费av网站大全| 精品人妻熟女av久视频| 国产午夜精品久久久久久一区二区三区| 啦啦啦啦在线视频资源| 搡女人真爽免费视频火全软件| 久久精品国产鲁丝片午夜精品| 美女黄网站色视频| 日韩一区二区视频免费看| 淫秽高清视频在线观看| 亚洲最大成人中文| 久久精品久久精品一区二区三区| 国产男女超爽视频在线观看| 国产精品熟女久久久久浪| 成人毛片a级毛片在线播放| 熟女人妻精品中文字幕| 欧美日韩在线观看h| 欧美极品一区二区三区四区| 免费电影在线观看免费观看| 久久这里有精品视频免费| 舔av片在线| 国产一区二区三区综合在线观看 | 最近视频中文字幕2019在线8| 欧美日本视频| 久久韩国三级中文字幕| 欧美xxⅹ黑人| 国产乱来视频区| 亚洲成人中文字幕在线播放| 高清在线视频一区二区三区| 日韩av免费高清视频| 免费av观看视频| 国产精品女同一区二区软件| h日本视频在线播放| 美女cb高潮喷水在线观看| 男的添女的下面高潮视频| a级毛色黄片| 精品久久久久久久久亚洲| 日日啪夜夜爽| 亚洲欧洲日产国产| 十八禁网站网址无遮挡 | 中文字幕av在线有码专区| 一级毛片电影观看| 伊人久久精品亚洲午夜| 亚洲综合精品二区| 久久久久久九九精品二区国产| 国产精品一二三区在线看| 少妇丰满av| 国产综合懂色| 男女国产视频网站| 岛国毛片在线播放| 男人和女人高潮做爰伦理| 久久热精品热| 欧美日韩亚洲高清精品| 日韩制服骚丝袜av| 成人欧美大片| 夫妻午夜视频| 秋霞伦理黄片| 精品久久国产蜜桃| 精品亚洲乱码少妇综合久久| 男女下面进入的视频免费午夜| 午夜精品国产一区二区电影 | 99视频精品全部免费 在线| 在线 av 中文字幕| 亚洲性久久影院| 2018国产大陆天天弄谢| 欧美 日韩 精品 国产| 国产永久视频网站| 亚洲欧美清纯卡通| 少妇熟女aⅴ在线视频| 有码 亚洲区| 国产 一区 欧美 日韩| 3wmmmm亚洲av在线观看| 韩国av在线不卡| 一级毛片黄色毛片免费观看视频| 亚洲aⅴ乱码一区二区在线播放| 国产又色又爽无遮挡免| 中文精品一卡2卡3卡4更新| 91精品国产九色| 日产精品乱码卡一卡2卡三| 乱系列少妇在线播放| 午夜福利在线观看免费完整高清在| 亚洲欧美日韩卡通动漫| 国产成人一区二区在线| 2018国产大陆天天弄谢| 久久久久久久亚洲中文字幕| 亚洲国产精品专区欧美| 蜜桃久久精品国产亚洲av| 人人妻人人澡欧美一区二区| 麻豆精品久久久久久蜜桃| 亚洲精品日韩在线中文字幕| 内地一区二区视频在线| 精品久久国产蜜桃| 岛国毛片在线播放| 麻豆成人午夜福利视频| 精华霜和精华液先用哪个| 日本一本二区三区精品| 综合色av麻豆| 国产精品一区二区在线观看99 | 欧美日韩综合久久久久久| 亚洲成人久久爱视频| 3wmmmm亚洲av在线观看| 青春草视频在线免费观看| 在线 av 中文字幕| 只有这里有精品99| 亚洲天堂国产精品一区在线| 亚洲最大成人av| 波野结衣二区三区在线| 国产精品美女特级片免费视频播放器| 欧美bdsm另类| 欧美潮喷喷水| 91久久精品国产一区二区成人| 成人毛片60女人毛片免费| 免费看日本二区| 国产欧美另类精品又又久久亚洲欧美| 亚洲,欧美,日韩| 丰满少妇做爰视频| 国产亚洲5aaaaa淫片| 日本三级黄在线观看| 夫妻午夜视频| 成人亚洲精品一区在线观看 | 色哟哟·www| 黄色配什么色好看| 毛片女人毛片| 中文欧美无线码| 丝袜喷水一区| 天美传媒精品一区二区| 国内精品美女久久久久久| 免费看日本二区| 亚洲熟妇中文字幕五十中出| 人妻制服诱惑在线中文字幕| 男人和女人高潮做爰伦理| 日本色播在线视频| 大又大粗又爽又黄少妇毛片口| 欧美日韩视频高清一区二区三区二| 欧美日韩一区二区视频在线观看视频在线 | 亚洲va在线va天堂va国产| 亚洲精品亚洲一区二区| av黄色大香蕉| 成人漫画全彩无遮挡| 成人亚洲精品一区在线观看 | 亚洲国产欧美在线一区| 亚洲国产精品国产精品| 国产精品av视频在线免费观看| av黄色大香蕉| 777米奇影视久久| av专区在线播放| 亚洲18禁久久av| 联通29元200g的流量卡| a级毛片免费高清观看在线播放| 中国美白少妇内射xxxbb| 日本爱情动作片www.在线观看| 国产黄片美女视频| 在线 av 中文字幕| 2022亚洲国产成人精品| 亚洲一区高清亚洲精品| 精品久久久久久久久亚洲| 亚洲av在线观看美女高潮| 日韩三级伦理在线观看| 亚洲不卡免费看| 精品一区二区免费观看| 国产一级毛片在线| 亚洲美女视频黄频| 国产精品麻豆人妻色哟哟久久 | 国产精品麻豆人妻色哟哟久久 | 中文字幕av在线有码专区| 18禁在线播放成人免费| 久久久久久久久久久免费av| 成年人午夜在线观看视频 | 日韩av在线大香蕉| 亚洲色图av天堂| 一区二区三区四区激情视频| 午夜视频国产福利| 中国国产av一级| 欧美+日韩+精品| 日本免费a在线| 色综合色国产| 久久久久九九精品影院| 寂寞人妻少妇视频99o| 午夜激情欧美在线| 婷婷色综合大香蕉| 国产亚洲av片在线观看秒播厂 | 一级黄片播放器| 少妇被粗大猛烈的视频| 精品人妻一区二区三区麻豆| 夫妻午夜视频| 岛国毛片在线播放| 亚洲最大成人手机在线| 久久热精品热| 极品教师在线视频| 国产精品人妻久久久影院| 久久久久免费精品人妻一区二区| 久久精品久久精品一区二区三区| 亚洲成人av在线免费| 国产黄色小视频在线观看| 少妇高潮的动态图| 美女cb高潮喷水在线观看| 亚洲av国产av综合av卡| 成人二区视频| 久久精品久久久久久噜噜老黄| 中文在线观看免费www的网站| 亚洲av福利一区| 99久久精品一区二区三区| 偷拍熟女少妇极品色| 色5月婷婷丁香| 久久精品久久精品一区二区三区| 国产精品1区2区在线观看.| 日韩亚洲欧美综合| 亚洲精品日韩在线中文字幕| 中文字幕亚洲精品专区| 国产一区亚洲一区在线观看| 亚洲av中文字字幕乱码综合| 久久97久久精品|