漢語閱讀理解測驗的認知診斷研究
——以中國政府獎學(xué)金本科來華留學(xué)生預(yù)科教育漢語綜合統(tǒng)一考試為例

2016-06-05 14:59:45陳璐欣王佶旻

中國考試 2016年2期

陳璐欣王佶旻

陳璐欣王佶旻

中國政府獎學(xué)金本科來華留學(xué)生預(yù)科教育漢語綜合統(tǒng)一考試是北京語言大學(xué)漢語考試與教育測量研究所研制的新型漢語考試。該考試用以衡量預(yù)科生結(jié)業(yè)的語言水平，它的特點是集基礎(chǔ)漢語和專業(yè)漢語為一體，對預(yù)科的語言能力進行全面測評。為更好地了解預(yù)科生閱讀能力的認知模式，為考生和學(xué)校提供診斷性評價，我們采用融合模型（Fusion Model，F(xiàn)M）對2014年5月參加該考試的532名理工類被試在閱讀理解部分的作答情況進行診斷性研究。研究發(fā)現(xiàn)：①該批被試對信息查找能力掌握得較好，對信息轉(zhuǎn)譯能力掌握得不理想；②不同高校在漢語教學(xué)上存在一定偏向；③該部分試題中第93題對于被試來說較難，第89題、91題、93題和94題在屬性完備性上不夠理想，建議進行調(diào)整和修改。

融合模型；預(yù)科教育；閱讀理解；認知診斷

1 引言

2014年北京語言大學(xué)漢語考試與教育測量研究所受國家留學(xué)基金管理委員會的委托，研發(fā)了用于來華留學(xué)生預(yù)科教育結(jié)業(yè)考核的漢語綜合統(tǒng)一考試。該考試是集基礎(chǔ)漢語和專業(yè)漢語為一體的新型漢語考試，根據(jù)學(xué)生所學(xué)專業(yè)的不同分為理工、經(jīng)貿(mào)、醫(yī)學(xué)和文科四個版本。

為了使學(xué)校和教師更加詳細地了解學(xué)生漢語知識（技能）的掌握情況，我們擬在考試的分數(shù)報告中提供診斷性評價。為此，我們需要在該考試的認知診斷研究方面開展一系列的探索性工作。

2 研究背景及文獻綜述

2.1 閱讀理解微技能研究情況

目前，學(xué)者們對測試領(lǐng)域中的閱讀理解能力進行了多方面的探索，但仍沒有統(tǒng)一的定論。Lenon（1970）認為閱讀理解能力可以分為一般言語因素、對語義明確的文字內(nèi)容的理解能力、對隱含意義的理解能力和鑒賞能力。Jeremy Harmer（1983）則把閱讀理解技能和聽力理解技能一并定義為接收性技能。Freedle&Kostin（1991）從SAT測驗考查文章主旨能力的題目中發(fā)現(xiàn)8個變量。Buck&Tatsuoka（1995，1996）運用規(guī)則空間模型分析第二語言測驗中的閱讀理解多項選擇題目，確定了12種主要技能與8種交互技能。

張志公（1979）認為閱讀能力包括理解、記憶和速度。武永明（1990）則認為閱讀能力結(jié)構(gòu)包括認讀能力、理解能力、評價鑒賞能力和創(chuàng)造運用能力。韓雪屏、張春林（1983）認為閱讀能力是一個多因素、多層次交叉的組合。劉守立（1989）從感受的角度提出閱讀能力包括語感、文感、情感。莫雷（1990，1992）從教育心理學(xué)的角度長期而系統(tǒng)地研究了小學(xué)六年級、初中三年級和高中三年級學(xué)生的閱讀理解能力。

2.2 融合模型理論

融合模型（Fusion Model，F(xiàn)M）是為了克服統(tǒng)一模型下一些參數(shù)不能估計的問題而產(chǎn)生的新模型。它不要求屬性間具有層級關(guān)系，而語言能力的微技能間很多都不具備層級關(guān)系，因此這個模型比較適合語言測驗的認知診斷研究。

融合模型自被提出以來，已有不少學(xué)者對其進行了相關(guān)的研究。Montero etc.（2003）將FM應(yīng)用于高等學(xué)校幾何課程考試中。Bolt&Fu（2004）將融合模型拓展到多級評分模型。Jang E.E（2005）的研究結(jié)果顯示屬性的數(shù)量不能過多，否則統(tǒng)計上會無法識別。Henson&Douglas（2005）的模擬研究表明FM的正確診斷率受測驗屬性個數(shù)及屬性間相關(guān)程度的影響。車芳芳（2010）應(yīng)用融合模型對初中生的代數(shù)學(xué)習(xí)進行了認知診斷研究。趙明晨（2014）應(yīng)用融合模型對被試的漢字字形意識進行了診斷性研究。

3 實證研究

3.1 研究內(nèi)容

我們嘗試采用不考慮屬性間層級關(guān)系的融合模型來對漢語綜合統(tǒng)一考試（理工類）模擬卷中閱讀理解測驗部分進行認知診斷研究。具體內(nèi)容包括：

（1）分析被試總體在閱讀理解微技能上的掌握情況，了解其閱讀理解能力水平；

（2）對比不同學(xué)校的被試在閱讀理解微技能掌握上的差異，具體為各學(xué)校提供一些教學(xué)反饋；

（3）對被試個體在閱讀理解微技能上的掌握情況進行分析并給出診斷報告；

（4）對比兩名得分相同的被試在閱讀理解微技能掌握上的差別，依據(jù)被試的具體情況給出診斷意見。

3.2 被試的構(gòu)成

被試為2014年5月參加漢語綜合統(tǒng)一考試（理工類）模擬考試的532名被試。

3.3 研究材料

本研究所采用的材料為2014年漢語綜合統(tǒng)一考試（理工類）模擬卷中理解短文部分，共21道單項選擇題。

3.4 研究方法、過程及結(jié)果

3.4.1 測試數(shù)據(jù)分析

短文理解部分的每一題采用0/1記分，我們以學(xué)生在每一題上的作答分數(shù)為分析數(shù)據(jù)，對題目變量進行因素分析，結(jié)果顯示有7個因素的特征值大于1，方差解釋累計比例達53.21%，其余各變量上也有少量的方差解釋比例，因此，我們依據(jù)旋轉(zhuǎn)成分矩陣中項目負荷值大于0.4來選取題目提煉閱讀理解微技能，且以負荷值大于0.2來建立Q矩陣。

根據(jù)對試題的分析，我們提煉并定義了7種閱讀理解微技能：

依據(jù)Q矩陣，我們使用融合模型專用軟件Ar-peggio對數(shù)據(jù)進行分析（見表1、表2）。

表1 閱讀理解微技能的定義

表2 閱讀理解微技能Q矩陣

第一步，參數(shù)估計

（1）MCMC收斂檢驗

本研究使用R軟件繪制馬爾科夫鏈圖來判定MCMC是否收斂。通過觀察，我們發(fā)現(xiàn)在鏈長30000，預(yù)燒期15000時各參數(shù)顯示收斂，以第94題的鏈圖和后驗分布為例（見圖1）。

（2）參數(shù)估計結(jié)果

表5中的Pk值能較好地表示出被試在哪些技能上掌握得較好（Pk值大者），在哪些技能上掌握得不好（Pk值小者）。因此，技能由易到難依次排列為：S3（信息抽取能力）、S4（信息查找能力）、S5（概括推理能力）、S2（信息定位理解能力）、S6（句間關(guān)系理解能力）、S7（相關(guān)信息歸納能力）、S1（信息轉(zhuǎn)譯能力）。

第三步，模型擬合檢驗

我們使用MAD指標來檢驗?zāi)Ｐ偷臄M合度。

表6中，MAD=0.7546-0.7241=0.0305，差別很?。籶diff值為0.5003，表示掌握者和未掌握者存在較大的差別，區(qū)分較為明顯。因此，我們認為數(shù)據(jù)與模型擬合較好，所得結(jié)果可靠。

第四步，內(nèi)部效度檢驗

圖1 第94題技能1的鏈圖和后驗分布圖

表3 Q矩陣的參數(shù)估計結(jié)果數(shù)據(jù)表（、、）

Item pi* r*1 r*2 r*3 r*4 r*5 r*6 r*7 c 86 0.99253 0 0.75369 0 0.65900 0.84369 0 0 2.63065 87 0.95702 0 0 0 0 0.73004 0 0 2.35302 88 0.90235 0 0 0 0 0.56555 0 0 2.34854 89 0.91755 0.84579 0 0.59253 0 0.76846 0 0 0.87538 90 0.92957 0 0.59101 0 0 0 0 0 1.66098 91 0.94427 0.68918 0 0.80800 0 0 0 0 1.14350 92 0.98414 0.67906 0.70453 0 0 0.45720 0.32396 0 1.66733 93 0.47972 0.15151 0 0 0 0 0 0 0.67903 94 0.95156 0.37463 0 0 0 0 0 0 0.19695 95 0.82240 0 0.83867 0 0 0.73741 0 0 2.30126 96 0.81357 0 0 0 0 0 0.40025 0 2.46162 97 0.92028 0 0.87957 0 0 0 0 0.74503 2.45745 98 0.99358 0 0 0 0.75665 0 0 0 2.66585 99 0.99240 0.96581 0 0 0.80730 0 0 0.96030 2.50380 100 0.86077 0 0.64349 0 0 0 0.55562 0 2.11462 101 0.99170 0 0 0.79413 0.92486 0 0 0 2.63708 102 0.97897 0 0 0.72165 0 0 0 0 1.75231 103 0.99085 0 0 0.72049 0 0 0 0 2.54902 104 0.99210 0 0.87797 0.47514 0 0 0 0 2.43208 105 0.90813 0.33142 0.69887 0.33986 0 0 0 0 2.64795 106 0.92945 0.46934 0.16192 0 0 0 0 0 1.61853

表4 三次降元后的Q矩陣的參數(shù)估計結(jié)果數(shù)據(jù)表（、、）

Item pi* r*1 r*2 r*3 r*4 r*5 r*6 r*7 c 86 0.9927 0 0.8064 0 0.7110 0.8559 0 0 2.5028 87 0.9597 0 0 0 0 0.7443 0 0 2.3854 88 0.9096 0 0 0 0 0.5687 0 0 2.4268 89 0.9005 0.8182 0 0.5280 0 0.7300 0 0 1.1557 90 0.9331 0 0.6472 0 0 0 0 0 1.6193 91 0.9451 0.6701 0 0.8379 0 0 0 0 1.2251 92 0.9851 0.6237 0.7785 0 0 0.5651 0.4143 0 1.6850 93 0.4480 0.1626 0 0 0 0 0 0 1.1592 94 0.9421 0.4276 0 0 0 0 0 0 0.2529 95 0.8246 0 0.8811 0 0 0.7365 0 0 2.2638 96 0.8251 0 0 0 0 0 0.4252 0 2.4956 97 0.9369 0 0.8715 0 0 0 0 0.6921 2.5817 98 0.9935 0 0 0 0.8425 0 0 0 2.4774 99 0.9919 0 0 0 0.8474 0 0 0 2.2772 100 0.8644 0 0.6808 0 0 0 0.5616 0 2.2719 101 0.9911 0 0 0.8103 0 0 0 0 2.4406 102 0.9792 0 0 0.7832 0 0 0 0 1.6615 103 0.9897 0 0 0.7115 0 0 0 0 2.6161 104 0.9934 0 0.8349 0.4936 0 0 0 0 2.5723 105 0.9085 0.5018 0.5959 0.4409 0 0 0 0 2.6221 106 0.9386 0.5859 0.1758 0 0 0 0 0 1.5456

表5 三次降元后的Q矩陣的參數(shù)估計結(jié)果數(shù)據(jù)表（Pk）

表6 被試在各題上的觀察值和預(yù)測值

我們以項目掌握統(tǒng)計量（IMstats）和被試掌握統(tǒng)計量（EMstats）來看模型的內(nèi)部效度，即看試題是否有效地劃分了不同能力水平的被試。

IMstats將每一個試題根據(jù)被試技能掌握情況的估計值來劃分，具體分為掌握者（masters）和未掌握者（non-masters）。

依據(jù)表7繪制題目所涉技能掌握者與未掌握者正確作答比例情況分布圖，見圖2。

圖2中橫軸1～21代表第86～106題，縱軸代表全體被試的平均分。從圖2我們可以看出在每一個項目上掌握者的整體分數(shù)都要高于未掌握者的，這表明，該模型在本套數(shù)據(jù)上具有較高的內(nèi)部效度。

另外，EMstats是將被試掌握項目的值與一個標準值比較，當(dāng)被試掌握項目的值明顯低于或高于標準值時，被試的作答情況將被作為異常值標記出來。

表8中顯示有10名項目掌握者但作答分數(shù)低于估計標準值的被試的作答反應(yīng)與Arpeggio估計的屬性掌握情況不一致，其余被試掌握項目的情況與估計一致。

綜上表明該測驗中對技能的認知診斷的內(nèi)部效度較高。

3.4.2 技能掌握情況歸類

我們根據(jù)融合模型所提供的被試在每一題目所含每種屬性上的后驗掌握概率（PPM值）來看被試對各閱讀理解微技能的掌握情況。當(dāng)PPM≥0.5時，認為被試掌握了該微技能；當(dāng)PPM<0.5時，認為被試未掌握該微技能。由于被試數(shù)量較多，在此僅提供前10名被試的PPM值。

以被試8為例，我們可以看到該被試有5個PPM值大于0.5，分別是技能3、4、5、6、7，即被試掌握了信息抽取能力、信息查找能力、概括推理能力、句間關(guān)系理解能力和相關(guān)信息歸納能力；PPM<0.5的技能是技能1和2，即被試未掌握信息轉(zhuǎn)譯能力和信息定位理解能力（見表9）。

另外，我們還統(tǒng)計出全體被試在各屬性上的掌握情況報告（表10）以及全體被試的知識結(jié)構(gòu)情況報告（表11）。

由表10我們可以看出，被試對于技能1、2的掌握情況偏低，這說明預(yù)科學(xué)生不能很好地結(jié)合上下文內(nèi)容來理解詞語所要表達的潛層含義，難以進行信息的含義轉(zhuǎn)換，且對文段中的相關(guān)目標信息不能準確定位和理解。

表7 項目所涉技能掌握者與未掌握者情況

圖2 題目所涉技能掌握者與未掌握者正確作答比例情況分布

表8 被試被標記的情況

表9 前10名被試的PPM值

表10 全體被試在各屬性上的掌握情況報告

表11為77種被試的技能掌握模式。表中“0”表示被試未掌握該技能，“1”表示掌握該技能，如0011001就表示被試只掌握了技能3、4、7。

從表11中我們可以看出，被試的屬性掌握模式劃分較細，分布較分散。其中，掌握全部技能的人數(shù)最多，占42.3%；其次是除技能6未掌握而其余技能都掌握的模式（1111101），占6.02%；然后是除技能2未掌握，其余技能都掌握的模式（1011111），占4.14%。

4 診斷報告及其分析

4.1 全體被試的認知診斷報告

經(jīng)過統(tǒng)計分析，我們得到了漢語綜合統(tǒng)一考試（模擬卷）的532名理工類被試在傳統(tǒng)閱讀理解部分的參數(shù)報告，現(xiàn)為全體被試提供以下診斷報告：

1）從總體看，近75%的學(xué)生的閱讀理解技能掌握良好。

2）該批學(xué)生能夠查找或抽取與題干相關(guān)的重要信息。

3）一部分學(xué)生可能對于隱含的句間關(guān)系掌握不夠理想。

4）學(xué)生在信息定位理解能力上的表現(xiàn)稍差，其原因可能是學(xué)生雖然理解題干及選項的含義，但不能很好地對應(yīng)到文段中，從而無法正確作答。

5）學(xué)生在信息轉(zhuǎn)譯能力上的掌握率最低，其原因可能是學(xué)生難以將詞語放在文段中進行整體信息加工，從而不能充分了解詞語在文段中所要表達的真正含義。

綜上，我們針對該批被試的認知診斷情況，提出以下診斷性建議：

1）對一些常用詞語應(yīng)多用例句來拓展學(xué)生對詞語的理解和使用，讓學(xué)生深入理解和掌握詞語的含義。

2）鼓勵學(xué)生在學(xué)習(xí)中嘗試用不同的方式來表達相同意思，幫助學(xué)生提高語言表達和應(yīng)用能力。

3）教師可以引導(dǎo)學(xué)生用自己的強項能力去提升弱項技能，如通過對長句或復(fù)雜文段進行信息查找、抽取、歸納來強化學(xué)生對句子整體內(nèi)容的理解能力。

表11 全體被試的知識結(jié)構(gòu)情況報告

4.2 基于學(xué)校的認知診斷報告

在對被試總體進行認知診斷的基礎(chǔ)上，我們以被試人數(shù)相差不大的天津大學(xué)（代碼311，被試131名）和東北師范大學(xué)（代碼811，被試133名）來了解不同高校被試群體在閱讀理解微技能掌握上的差異，如表12、表13所示。

圖3中，橫軸“m”代表“masters”（掌握者比例），“nm”代表“non-masters”（未掌握者比例）。通過上述統(tǒng)計，可以看出，東北師范大學(xué)的被試對各屬性的掌握情況整體優(yōu)于天津大學(xué)。兩所大學(xué)的被試都在技能4上表現(xiàn)最好，在技能1上的表現(xiàn)相對較差。此外，天津大學(xué)的被試難掌握技能3和技能7，而東北師范大學(xué)的被試則難掌握技能2和技能6。

（1）天津大學(xué)被試對技能掌握情況的認知診斷

根據(jù)表12，我們對天津大學(xué)被試的認知診斷報告如下：

1）學(xué)生對信息查找能力、概括推理能力掌握得比較好，屬于強項技能。句間關(guān)系理解能力和信息定位理解能力的掌握情況次之，屬于需強化的技能。

2）被試閱讀理解能力發(fā)展不夠均衡。學(xué)生在信息抽取能力上掌握不足，使之不能夠準確把握并提取文段的關(guān)鍵內(nèi)容而導(dǎo)致被試對相關(guān)信息歸納困難。

表12 天津大學(xué)被試在各屬性上的掌握情況報告

表13 東北師范大學(xué)被試在各屬性上的掌握情況報告

圖3 天津大學(xué)和東北師范大學(xué)被試各屬性掌握情況對比

3）被試在信息轉(zhuǎn)譯能力上掌握情況最不理想，屬于弱項閱讀理解技能。

（2）東北師范大學(xué)被試對技能掌握情況的認知診斷

根據(jù)表13，我們對東北師范大學(xué)被試的認知診斷如下：

1）該批被試的閱讀理解能力較強，在信息查找能力和相關(guān)信息歸納能力上掌握得較好。80%以上的被試在信息抽取能力、概括推理能力和句間關(guān)系理解能力上掌握較好，為強項技能。

2）被試在信息定位理解能力和信息轉(zhuǎn)譯能力上掌握情況表現(xiàn)稍差，屬于學(xué)生的弱項閱讀理解技能。

4.3 單個被試的認知診斷報告

我們以46號被試為例，診斷其閱讀理解微技能掌握情況，并給出相應(yīng)的診斷意見（見表14）。

依據(jù)上述統(tǒng)計，我們對第46號被試出示如下診斷報告：

1）考生在短文閱讀理解部分的得分為11分。

2）考生能讀懂詞匯和語法都較簡單的文章，能通過關(guān)鍵詞準確地抽取答題信息，并對相關(guān)信息內(nèi)容進行歸納和簡單的邏輯推理。

3）考生能在一定程度上能將文段中的關(guān)鍵信息進行意義轉(zhuǎn)換，但理解句子間關(guān)系的能力上掌握得并不扎實。

4）由于信息定位理解能力和信息查找能力間的相互影響，導(dǎo)致該生在這兩項技能的掌握上都不理想（見圖4）。

因此，我們給出以下診斷意見：

1）該生閱讀能力弱，需通過多方面共同提高自身的閱讀水平。

2）多閱讀簡單的小短文，閱讀中可對一些關(guān)鍵信息進行標示，以此來提高對關(guān)鍵信息的查找能力、信息定位理解能力。

3）加強和鞏固基礎(chǔ)詞語的基本含義及用法，嘗試用不同的詞語或話語來表達相同含義。

4）補充基本的語法知識，充分了解一些表示句子間關(guān)系的基本語法。

5）多練習(xí)句子、段落信息內(nèi)容的提取、歸納和推理，有意識地提高自己的概括推理能力、相關(guān)信息歸納能力。

4.4 得分相同的被試的認知診斷比較分析

因為認知診斷還可以從微觀上區(qū)分兩名得分相同的被試所擁有的不同認知結(jié)構(gòu)，因此，我們以被試5和被試7為例來了解他們在閱讀理解微技能掌握上的差異。

從表15和圖5中，我們可以看出兩被試雖然得分都為11分，但在技能掌握上卻不同。雖然被試5和被試7都掌握技能1、6，但被試5對技能6的掌握優(yōu)于被試7，而被試7在技能1、3的掌握上優(yōu)于被試5。兩被試都未掌握技能4、7，且PPM值均低于0.35，都為“低水平且未掌握者”，但被試5在技能7上的情況略好于被試7。再次，被試5掌握了技能2、5，而被試7則未掌握；被試7掌握了技能3，而被試5未掌握。

綜上，我們需要用不同的方式對兩被試進行補救教學(xué)。如對被試5，其較弱的閱讀理解微技能是信息抽取能力、信息查找能力和相關(guān)信息歸納能力，那么，在教學(xué)中考慮讓學(xué)生先嘗試去把握句子的關(guān)鍵信息，再嘗試對句子進行整體理解，最后慢慢過渡到對文段整體的理解，逐步提升被試尋找和提取文段關(guān)鍵信息的能力，最終提高其對文段內(nèi)容的歸納能力。

表14 第46號被試的屬性掌握情況

圖4 第46號被試的技能掌握分布

表15 被試5和被試7的屬性掌握情況

圖5 被試5和被試7的屬性掌握情況對比

[1]Bolt,D.&Fu,J.B.A polytomous extension of the fusion model and its Bayesian parameterestimation[C].Paper presented at NCME,San Diego,USA，2004.

[2]Buck,G.,&Tatsuoka,K.Investigation of the linguistic,cognitive and method attributes underlying test task performance:a pilot analysis using Rule Space Methodology[M].Language Testing Research Cloogquium,Long Beach,CA，1995.

[3]Buck,G.,Tatsuoka,K.&Kostin,I.Rule space analysis of a multiplechoice reading comprehension test.In Analysis of language test per-formance using a cognitivediagnosticapproach[C].Symposium con-ducted at the National Council on Measurement in Education Annu-al Conference，1996.

[4]Freedle，R.&Kostin，I.The prediction of SAT reading comprehen-sion item difficulty for expository prose passages（ETS Research Re-port RR 91-29）[D].1991.

[5]Henson,R.&Douglas,J.Test construction for cognitive diagnosis[J]. Applied Psychological Measurement,2005，29/4:262-277.

[6]Jang,E.E.A validity narrative：Effects of reading skill diagnosis on teaching and learning in the context of NG TOEFL[M].Unpublished doctoral dissertation,University of Illinois,Champaign.2005.

[7]Jeremy Harmer.The Practice of English Language Teaching[M]. New York:Longman Group Limited，1983:144-145.

[8]Lenon，舒運祥，譯.外語測試理論與方法[M].北京：世界圖書出版社，1999.

[9]Montero,D.&Monfils,L.&Wng,J.&Yen,W.&Julian,M.&Moody,M. Investigation of the application of cognitivediagnostic testing to a high school end of course examination[M].Presented paper at the Annual meeting of the National Council on Measrement in Educa-tion,Chicago,Illinois，2003.

[10]韓雪屏，張春林.閱讀學(xué)與閱讀教學(xué)[J].教育研究，1983（9）.

[11]劉守立.閱讀教學(xué)論[M].合肥：安徽教育出版社，1989.

[12]莫雷.小學(xué)六年級學(xué)生語文閱讀能力結(jié)構(gòu)的因素分析研究[J].心理科學(xué)通訊，1990（1）.

[13]莫雷.初中三年級學(xué)生語文閱讀能力結(jié)構(gòu)的因素分析研究[J].心理學(xué)報，1990（1）.

[14]莫雷.高中三年級學(xué)生語言閱讀能力結(jié)構(gòu)的因素分析研究[J].應(yīng)用心理學(xué)，1990（1）.

[15]莫雷.中小學(xué)生語文閱讀能力結(jié)構(gòu)的發(fā)展特點[J].心理學(xué)報，1992（4）.

[16]武永明.閱讀能力結(jié)構(gòu)初探[J].語文教學(xué)通訊，1990（9）.

[17]張志公.談?wù)Z文教學(xué)中的閱讀問題[J].中學(xué)語文，1979（4）.

[18]車芳芳.融合模型在初中代數(shù)認知診斷中的應(yīng)用[D].華東師范大學(xué)碩士論文，2010.

[19]趙明晨.漢語作為第二語言的學(xué)習(xí)者漢字字形意識的診斷性研究[D].北京語言大學(xué)碩士論文，2014.

A Study of Cognitive Diagnostic Assessment Based on Fusion Model For Reading Comprehensive Test：A Case Study of CPT（Science and Engineering）

CHEN Luxin&WANG Jimin

Chinese Proficiency Test（CPT）is the new exam which is researched and developed by Chinese Examination and Education Survey Institute in Beijing Language and Culture University,and is used to understand language skill situation of preparatory student.It is the basic Chinese and the specialized Chinese as one to assessment the language ability of student.So,we adopt Fusion Model（FM）to do cognitive diagnostic studies to 532 sciences&engineering subjects’response on reading comprehension section of CPT in May,2014 in order to understand cognitive mode of preparatory student in reading comprehension skill and provide diagnostic evaluation for student&teacher.The study found that:Firstly,these subjects master“searching ability”,but non-master“translation ability”.Secondly,the subjects in different school have some different knowledge structure in reading comprehension.Thirdly,we suggest adjust and amend some items,for example,the item 93 is too difficult to the subjects,and the item 89,item91,item 94 are lacking some attributes in Q matrix.

Fusion Model;Preparatory Education;Reading Comprehension;Cognitive Diagnostic

G405

1005-8427（2016）02-0023-12

本研究得到國家社科基金青年項目（12CYY028）和教育部新世紀優(yōu)秀人才支持計劃（NCET-13-0690）的支持。

陳璐欣，女，北京語言大學(xué)漢語考試與教育測量研究所，碩士研究生（北京 100083）

王佶旻，女，北京語言大學(xué)漢語考試與教育測量研究所，所長，教授，博士生導(dǎo)師（北京 100083）

漢語閱讀理解測驗的認知診斷研究——以中國政府獎學(xué)金本科來華留學(xué)生預(yù)科教育漢語綜合統(tǒng)一考試為例

1 引言

2 研究背景及文獻綜述

3 實證研究

4 診斷報告及其分析

漢語閱讀理解測驗的認知診斷研究
——以中國政府獎學(xué)金本科來華留學(xué)生預(yù)科教育漢語綜合統(tǒng)一考試為例