計(jì)算機(jī)自適應(yīng)測(cè)試模型研究

2016-05-26 07:31:35張皓博向洪波尹衍林李曉艷包貴鑫黑龍江工業(yè)學(xué)院黑龍江雞西158100

山東工業(yè)技術(shù) 2016年2期

劉鋒,張皓博,向洪波,尹衍林,李曉艷,包貴鑫（黑龍江工業(yè)學(xué)院,黑龍江雞西 158100）

劉鋒,張皓博,向洪波,尹衍林,李曉艷,包貴鑫
（黑龍江工業(yè)學(xué)院,黑龍江雞西 158100）

摘要：文章針對(duì)傳統(tǒng)測(cè)試過(guò)程中存在的問(wèn)題，在項(xiàng)目反應(yīng)理論研究基礎(chǔ)上，主要對(duì)二參數(shù)和三參數(shù)Logistic模型進(jìn)行對(duì)比研究，通過(guò)研究提出了一種改進(jìn)的計(jì)算機(jī)自適應(yīng)測(cè)試模型，從而實(shí)現(xiàn)了因人施測(cè)，并通過(guò)測(cè)試結(jié)構(gòu)有效的對(duì)被測(cè)試者的能力水平進(jìn)行估計(jì)。

關(guān)鍵詞：項(xiàng)目反應(yīng)理論；計(jì)算機(jī)自適應(yīng)測(cè)試；Logistic模型

1 引言

隨著計(jì)算機(jī)技術(shù)的迅速發(fā)展，考試形式也從傳統(tǒng)的筆試考試逐漸向計(jì)算機(jī)輔助化進(jìn)行轉(zhuǎn)變，計(jì)算機(jī)自適應(yīng)測(cè)試(Computer Adaptive Testing，簡(jiǎn)稱(chēng)CAT)是在傳統(tǒng)考試固定試卷基礎(chǔ)上提出的一種新型的考試模式，考核過(guò)程中并不是提供固定的試卷，而是針對(duì)測(cè)試者的具體情況在試題的難度和試題的數(shù)量上自動(dòng)適應(yīng)考生，即在測(cè)試的過(guò)程中不斷地從已經(jīng)建立的試題數(shù)據(jù)庫(kù)中選取與測(cè)試者實(shí)際水平和實(shí)際能力相當(dāng)?shù)念}目進(jìn)行測(cè)試，并對(duì)被測(cè)試者的能力水平進(jìn)行實(shí)施實(shí)時(shí)評(píng)估，根據(jù)測(cè)試精度從而判斷被測(cè)試者的真實(shí)能力水平。

2 計(jì)算機(jī)自適應(yīng)測(cè)試概述

經(jīng)典的測(cè)試中所有被測(cè)試者不論能力水平的高低都使用了相同的測(cè)試項(xiàng)目進(jìn)行測(cè)試。這種測(cè)試方法有兩種基本類(lèi)型：所有試題（項(xiàng)目）難度相同，即所謂“尖峰”型測(cè)試。這種情況下，當(dāng)被試水平與題目難度接近時(shí)，具有較高的測(cè)試精度，兩者偏離越大，測(cè)試精度越低；第二種類(lèi)型為所謂“平矩”型測(cè)試，試題中有較難、難度中等、較易等不同難度的題目，因此在多數(shù)水平上能提供相對(duì)均等的測(cè)試精度，但整體精度卻相對(duì)較低。從上述分析不難看出，經(jīng)典的測(cè)試難以很好兼顧到測(cè)試的精度和精度的跨度問(wèn)題。

因此，計(jì)算機(jī)自適應(yīng)測(cè)試與傳統(tǒng)的測(cè)試方式相比具有明顯的優(yōu)勢(shì)。第一，測(cè)試試題是變化不固定的，試題選取的范圍是在被測(cè)試者的能力范圍附近上下浮動(dòng)，所以自適應(yīng)測(cè)試更容易測(cè)出考生真實(shí)能力值，從而可以縮短測(cè)試時(shí)間；第二，通過(guò)測(cè)試結(jié)果能夠更加準(zhǔn)確的反映被測(cè)試者的實(shí)際水平，從而可以提高測(cè)量精度；第三，測(cè)試的方式靈活，不必選取集中的時(shí)間和相同的地點(diǎn)進(jìn)行測(cè)試，采用計(jì)算機(jī)進(jìn)行評(píng)分，避免人為因素，使測(cè)試結(jié)果更加真實(shí)可靠。

3 模型建立

被測(cè)試者的能力水平是一個(gè)連續(xù)變化的數(shù)值，這里用θ來(lái)表示，該值與能力水平成正比關(guān)系，也就是值越大能力水平也就越高；被測(cè)試者能否準(zhǔn)確在回答測(cè)試問(wèn)題存在一定的隨機(jī)性與偶然性，所以，這里引入了P()θ函數(shù)，用于表示被測(cè)試者準(zhǔn)確回答測(cè)試問(wèn)題的概率，函數(shù)的值越大被測(cè)試者準(zhǔn)確回答問(wèn)題的可能性就越高；用a和b來(lái)表示難度參數(shù)與區(qū)分度參數(shù)。項(xiàng)目反應(yīng)理論的模型有多種，我們分別用二參數(shù)和三參數(shù)Logistic模型來(lái)進(jìn)行說(shuō)明。

三參數(shù)Logistic模型中增加了一個(gè)猜測(cè)參數(shù)c，因?yàn)樵跍y(cè)試者回答問(wèn)題的過(guò)程中，由于能力水平比較低，不能夠準(zhǔn)確的回答測(cè)試的問(wèn)題，被測(cè)試者通過(guò)經(jīng)驗(yàn)進(jìn)行猜測(cè)問(wèn)題的答案，該參數(shù)則反映了被測(cè)試者正確猜測(cè)回答的概率，引入?yún)?shù)c的模型為：

如果分別利用P2和P3來(lái)表示二參數(shù)模型和三參數(shù)模型，通過(guò)計(jì)算可以得到P2與P之間存在特定的關(guān)系：3在P3的表達(dá)式中P2表示二參數(shù)模型中被測(cè)試者準(zhǔn)確回答的概率，c(1?P2)可以理解為被測(cè)試者對(duì)項(xiàng)目不太清晰而通過(guò)猜測(cè)得到的準(zhǔn)確回答的概率。

4 項(xiàng)目測(cè)試信息函數(shù)

當(dāng)被測(cè)試者回答一個(gè)問(wèn)題后，回答的結(jié)果能給我們帶來(lái)什么信息，被測(cè)試者能力水平的精準(zhǔn)度判別有多高，計(jì)算機(jī)自適應(yīng)測(cè)試系統(tǒng)根據(jù)該信息如何給被測(cè)試者列舉下一個(gè)測(cè)試問(wèn)題。為了解決這一系列問(wèn)題，在項(xiàng)目反應(yīng)理論引入了一個(gè)項(xiàng)目測(cè)試信息函數(shù)，通過(guò)計(jì)算可以獲得項(xiàng)目測(cè)試信息函數(shù)：

根據(jù)得到的項(xiàng)目測(cè)試信息函數(shù)，當(dāng)θ一定時(shí)，信息量由項(xiàng)目參數(shù)所決定。為了驗(yàn)證將一些數(shù)值代入到公式中進(jìn)行分析。測(cè)試數(shù)據(jù)1(θ= 1,b=0.921,c=0.25)表明項(xiàng)目測(cè)試信息函數(shù)值與項(xiàng)目區(qū)分度參數(shù)a成正比；測(cè)試數(shù)據(jù)2(θ= 1,b=0.815,a=1.8)表明猜測(cè)參數(shù)c越大，項(xiàng)目信息函數(shù)就越?。粶y(cè)試數(shù)據(jù)3（a=1.8,b=0.815,c=0.25）表明同一個(gè)測(cè)試項(xiàng)目針對(duì)被測(cè)試者層次不同時(shí)，所反映出來(lái)的信息量是有區(qū)別的，如果能力水平與項(xiàng)目難度參數(shù)非常接近時(shí)，信息函數(shù)的值最大。通過(guò)上面的分析，可以計(jì)算出信息函數(shù)最大時(shí)的能力參數(shù)為：

5 結(jié)束語(yǔ)

計(jì)算機(jī)自適應(yīng)測(cè)試技術(shù)已經(jīng)在國(guó)外得到了廣泛的應(yīng)用，與常規(guī)測(cè)試相比，自適應(yīng)測(cè)試具有明顯的優(yōu)點(diǎn),它能兼顧測(cè)試的測(cè)量跨度和精度，提高了測(cè)試的效率與準(zhǔn)確性，同時(shí)對(duì)能力水平高、低的應(yīng)試者也能對(duì)其能力水平進(jìn)行精確的估計(jì)，具有較高的信度和效度。

參考文獻(xiàn)：

[1]劉鋒.基于項(xiàng)目反應(yīng)理論的計(jì)算機(jī)自適應(yīng)測(cè)試算法的研究與實(shí)現(xiàn)[J].軟件,2014(07).

[2]郭維威.基于技能空間理論的計(jì)算機(jī)自適應(yīng)測(cè)試組卷策略研究[J].曲阜師范大學(xué)學(xué)報(bào),2015(01).

[3]劉艷花.基于擴(kuò)展知識(shí)空間理論的技能自適應(yīng)測(cè)試過(guò)程[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2010(07).

[4]劉鋒.試題組卷算法的研究與應(yīng)用[J].雞西大學(xué)學(xué)報(bào),2008(06).

項(xiàng)目：本文系2014年黑龍江省教育廳科學(xué)技術(shù)研究項(xiàng)目“基于擴(kuò)展知識(shí)空間的計(jì)算機(jī)自適應(yīng)測(cè)試方法的研究”的階段成果，項(xiàng)目編號(hào)：12543049；2014年黑龍江省大學(xué)生創(chuàng)新創(chuàng)業(yè)訓(xùn)練計(jì)劃項(xiàng)目201411445009階段成果。

DOI:10.16640/j.cnki.37-1222/t.2016.02.120

山東工業(yè)技術(shù)2016年2期

山東工業(yè)技術(shù)的其它文章: 空調(diào)異常報(bào)警系統(tǒng)的研發(fā); 未來(lái)教學(xué)中全息影像技術(shù)的應(yīng)用; 一種自動(dòng)扶梯梯級(jí)缺失監(jiān)測(cè)裝置的設(shè)計(jì); 數(shù)字全息3D圖像再現(xiàn)的方法論述; 干熄焦生產(chǎn)中存在的主要問(wèn)題及解決的措施; 淺談增程式電動(dòng)汽車(chē)的原理與發(fā)展前景