• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于項目反應(yīng)理論的組卷算法研究

      2018-01-29 17:07:42單美靜,劉琴
      軟件工程 2017年12期

      單美靜,劉琴

      摘 要:傳統(tǒng)的網(wǎng)絡(luò)考試組卷算法由于僅僅考慮考試范圍,以及試卷整體難度系數(shù),而從不考慮應(yīng)試者的能力水平,從而造成生成的部分試卷無法有效地達到測試應(yīng)試者能力水平的效果。項目反應(yīng)理論作為一種現(xiàn)代心理測試理論,在評估應(yīng)試者能力水平方面具有廣泛的應(yīng)用。本文基于項目反應(yīng)理論設(shè)計了一種能充分考慮應(yīng)試者能力水平的組卷算法,從而使得組成的試卷能夠達到命題老師的預(yù)期效果。實際應(yīng)用結(jié)果也表明,該算法是非常有效的。

      關(guān)鍵詞:項目反應(yīng)理論;組卷算法;試題庫建設(shè)

      中圖分類號:TP391 文獻標識碼:A

      Research on the Test Paper Generating Algorithm Based on the Item Response Theory

      SHAN Meijing,LIU Qin

      (Institute of Information Science and Technology,East China University of Political Science and Law,Shanghai 201620,China)

      Abstract:With the traditional network test paper generating algorithm,the scope and the overall difficulty coefficient of the test paper are the major considerations,but the ability of the examinee is neglected.Consequently,some generated test papers fail in assessing the examinee's ability.The item response theory,as a modern psychological testing theory,has been widely applied in assessing the ability of examinees.Based on the item response theory,the paper designs a test paper generating algorithm with a full consideration to the ability of examinees,so that teachers can achieve the expected effect with the generated papers.The practical application results show that the algorithm is very effective.

      Keywords:item response theory;test paper generating algorithm;item bank construction

      1 引言(Introduction)

      試題庫建設(shè)作為高校課程建設(shè)的一個必選項,具有非常重要的意義。首先,它是實現(xiàn)教改分離的重要前提,能夠客觀、公正地評價教師教學(xué)效果;其次,教師可以快捷地對試題進行管理和維護更新,更全面地考察學(xué)生學(xué)習(xí)的效果;最后,試題庫建設(shè)還能夠減輕教師的負擔。然而,在很多高校,普遍存在著試題庫“重建設(shè)輕維護”“重建設(shè)輕使用”的問題。究其原因,主要有以下幾點:(1)很多高校老師認為試題庫的組卷策略很難覆蓋到教學(xué)所需要考核的知識點,在進行自動組卷后還需要進行大量的人工干預(yù);(2)試題庫一旦建設(shè)好,其題目的難度基本保持不變,但是在授課過程中可能會出現(xiàn)面對不同專業(yè)的學(xué)生的學(xué)習(xí)狀態(tài)的情況,從而造成使用同一試題庫可能出現(xiàn)較高不及格率的風(fēng)險。這些問題的根本原因在于試題庫在建設(shè)過程中,組卷時未考慮到應(yīng)試者的能力水平,沒有進行有效的私人定制。

      項目反應(yīng)理論(Item Response Theory:IRT)[1]作為一種現(xiàn)代心理測試理論,能夠指導(dǎo)我們測試出應(yīng)試者的“潛在特質(zhì)”,即能力,從而能夠指導(dǎo)我們進行測試試卷編制。項目反應(yīng)理論包含有兩個特性,一個是項目參數(shù)估計不變性,另一個是能力參數(shù)估計不變性。這兩個特性保證了利用項目反應(yīng)理論進行測試的結(jié)果,不受所選的測試樣本影響,同時還能保證應(yīng)試者的能力估計與被測試的項目無關(guān)[2,3]。另外項目反應(yīng)理論還能幫助命題者在試題庫建設(shè)過程中,幫助命題者選擇與應(yīng)試者能力相匹配的題目組成試卷[4-6]。

      2 項目反應(yīng)理論簡介(Introduction of item response

      theory)

      項目反應(yīng)理論,有時也稱作潛在特質(zhì)理論或潛在特質(zhì)模型,在現(xiàn)代心理測試領(lǐng)域運用非常廣泛,同時也廣泛應(yīng)用于教育測試領(lǐng)域。項目反應(yīng)理論的基本思想[7]是應(yīng)試者的某種潛在特質(zhì)與他們對項目的反應(yīng)(正確作答的概率)之間存在著一定的關(guān)系,并且這種關(guān)系可以通過數(shù)學(xué)模型表示出來,從而可以通過構(gòu)建數(shù)學(xué)模型表示應(yīng)試者能力、項目參數(shù)以及正確作答的概率之間的關(guān)系。項目反應(yīng)理論在計算機自適應(yīng)測試中具有廣泛的應(yīng)用。項目反應(yīng)理論是建立在“能力單維性假設(shè)”“局部獨立性假設(shè)”和“項目特征曲線假設(shè)”三個基本假設(shè)基礎(chǔ)上。項目反應(yīng)理論可以根據(jù)應(yīng)試者回答問題的情況,通過對測試項目特征曲線的運算來推測應(yīng)試者的能力水平。項目反應(yīng)理論中所建立的測試項目一般包含三個參數(shù):區(qū)分度(Discriminative index)—a、難度(Difficulty index)—b和猜測系數(shù)(Guessing index)—c。根據(jù)構(gòu)建的數(shù)學(xué)模型所包含的參數(shù)不同,特征函數(shù)可分為僅包含難度參數(shù)的單參數(shù)模型、包含難度、區(qū)分度的雙參數(shù)模型,以及包含難度、區(qū)分度和猜測系數(shù)的三參數(shù)模型。endprint

      Logistic模型作為項目反應(yīng)理論中最常用的模型,是伯恩鮑姆于1957年提出的一種二級評分IRT模型,它能夠很好地匹配被測試者的測試結(jié)果。與特征函數(shù)的分類類似,它也包含單參數(shù)、雙參數(shù)和三參數(shù)三種模型,其表達式分別為:

      (1)

      (2)

      (3)

      其中,為能力為的被測試者正確作答測試項目的概率;

      D=1.702;

      為應(yīng)試者能力估計值;

      為測試項目的區(qū)分度,其值越大,則表明被選測試項目對被測試者的區(qū)分度越強;

      表示測試項目的難度(難易程度);

      為測試項目的猜測系數(shù),其值越大,說明不論應(yīng)試者能力高低,都容易猜對。

      由于單參數(shù)、雙參數(shù)Logistic模型都是三參數(shù)Logistic模型的特例,所以我們下面以三參數(shù)Logistic模型的項目特征曲線(如圖1)為例,介紹計算機組卷過程中的項目特征曲線。

      curve with different parameters

      從圖1的曲線可以看出,當應(yīng)試者的能力值時,應(yīng)試者正確作答的概率為。若不考慮猜測系數(shù),則正確作答和錯誤作答的概率皆為1/2。即對于能力值為的應(yīng)試者來說,所測試項目的難度適中。當應(yīng)試者的能力值時,將大于0.5,并且的值隨著應(yīng)試者的能力值的增大而趨近于1,即正確作答的概率越大;反之,應(yīng)試者的能力值越小,越接近于0,即正確作答的概率越小。項目特征曲線的陡峭程度會隨著的值而變化,的值越大則曲線越陡峭,隨應(yīng)試者能力值的變化就越敏感,即該項目更能區(qū)分應(yīng)試者的能力水平;當增大時,項目特征曲線右移,則說明對于同一能力值的應(yīng)試者,難度越高的項目越難正確作答。

      教育測量學(xué)研究表明,隨機選擇的大規(guī)模應(yīng)試者群體的基本心理素質(zhì)的分布服從正態(tài)分布,所以理論上講應(yīng)試者的能力取值范圍為(-∞,+∞),但在實際應(yīng)用中,為了計算方便,一般取值為(-3,3)。

      3 組卷算法分析(Analysis on the test paper

      generating algorithm)

      有了三參數(shù)Logistic模型的理論基礎(chǔ),一方面我們就可以利用階段性考試測試出所有應(yīng)試者的能力水平,另一方面可以結(jié)合試題庫項目的難度、知識點分布、應(yīng)試者能力水平進行組卷,從而使得考試結(jié)果滿足預(yù)期的正態(tài)分布以及預(yù)期目標。綜上可知,基于項目反應(yīng)理論的組卷算法主要包括兩個部分:第一部分為應(yīng)試者能力水平的測試,第二部分為基于應(yīng)試者能力水平、知識點分布、預(yù)期結(jié)果的組卷算法。

      算法3.1 應(yīng)試者能力水平評估算法

      輸入:某試題庫及應(yīng)試者初始能力水平。

      輸出:某應(yīng)試者的能力水平。

      Step1:根據(jù)某種策略選擇一個項目開始測試;

      Step2:由應(yīng)試者的作答情況評估應(yīng)試者的能力水平;

      Step3:根據(jù)新的能力水平選擇一個合適的測試項目供應(yīng)試者作答;

      Step4:根據(jù)作答情況重新估計能力水平。如果能力水平趨于穩(wěn)定(新的能力水平—舊能力水平<0.05),則結(jié)束;否則跳轉(zhuǎn)到Step3。

      算法3.2 基于項目反應(yīng)理論的組卷算法

      輸入:試卷知識點分布、預(yù)期成績分布。

      輸出:試卷測試項目。

      Step1:將所有應(yīng)試者按照能力水平由低到高排序;

      Step2:根據(jù)考試成績將滿足正態(tài)分布的特點,按照Logistic模型選擇預(yù)計80%應(yīng)試者正確作答概率在0.8以上的測試項目;

      Step3:根據(jù)Logistic模型選擇對于10%較高能力應(yīng)試者作答概率在0.8以上的測試項目。

      為了實現(xiàn)上述的應(yīng)試者能力水平測試以及組卷過程,有如下幾個問題需要解決好。(1)測試項目參數(shù)的確定;(2)初始測試項目的選擇;(3)測試過程中應(yīng)試者能力水平的重新評估。

      3.1 測試項目參數(shù)的確定

      確定測試項目的三個參數(shù)是應(yīng)用項目反應(yīng)理論進行組卷的前提。在實現(xiàn)過程中,我們采用的是應(yīng)用EM算法的邊緣極大似然估計法進行參數(shù)估計,以保證得出的測試項目參數(shù)具有參數(shù)不變性的特點。

      3.2 初始測試項目的選擇

      初始測試項目的選擇一般有如下幾種方法:

      (1)假定應(yīng)試者具有中等水平的能力值,從而選擇難度中等的測試項目。

      (2)若系統(tǒng)中保存有應(yīng)試者的能力水平,則根據(jù)此能力水平選擇合適的測試項目。

      (3)由應(yīng)試者自己填寫初始能力值,系統(tǒng)再根據(jù)此值選取合適的測試項目。

      3.3 應(yīng)試者能力水平的重新評估

      在測試過程中,需要根據(jù)應(yīng)試者作答情況對其能力水平進行評估。本文采取極大似然估計方法估計應(yīng)試者能力水平。其基本過程如下:

      假定某應(yīng)試者對n個給定的客觀題的作答模式為:

      其中取值1或0。若應(yīng)試者正確作答了第道客觀題,則取1,否則取0。以表示能力值為的應(yīng)試者正確作答第道客觀題的概率,即Logistic模型中的,由局部獨立性假設(shè)可計算其聯(lián)合概率為:

      (4)

      上式也稱為似然函數(shù),使(4)式達到最大值的即為的極大似然估計值。為了計算,我們對式(4)兩邊取自然對數(shù),得到對數(shù)型的似然函數(shù):

      (5)

      為了計算(5)式達到最大值時的,只要求解方程

      (6)

      從式(6)可以看出其是非線性的,不能直接求解。此時,我們采用Newton-Raphson法進行求解。

      4 結(jié)論(Conclusion)

      項目反應(yīng)理論在計算機自適應(yīng)測試中得到了廣泛應(yīng)用,但是在組卷算法方面的研究還不多。本文結(jié)合項目反應(yīng)理論在評估應(yīng)試者能力水平方面的優(yōu)勢,結(jié)合考試范圍以及考試成績預(yù)期期望,設(shè)計了一種基于項目反應(yīng)理論的自動組卷算法,該算法的采用能夠有效地達到因材施教的目的,通過在《線性代數(shù)》《數(shù)據(jù)結(jié)構(gòu)》等試題庫組卷中的應(yīng)用,較好地達到了預(yù)期目的。但此項工作的缺陷是測試項目只能是客觀題,如何在主觀題考核方面加以應(yīng)用還有待進一步的研究。

      參考文獻(References)

      [1] Baker F.B.The basics of item response theory.Port smouth[M].NH: Heinemann,1985:1-74.

      [2] Choi,Y.J.,Alexeev,N.,Cohen,A.S.Different item functioning analysis using a mixture 3-parameter logistic model with a covariate on the TIMSS 2007 mathematics test[J].International Journal of Testing,2015,15(3):239-253.

      [3] Frick,H,Strobl,C.,Zeileis,A.Rash mixture models for DIF detection: A comparison of old and new score specifications[J].Educational and Psychological Measurement,2015,75(2):208-234.

      [4] 劉鋒,郭維威,等.基于項目反應(yīng)理論的計算機自適應(yīng)測試算法的研究與實現(xiàn)[J].軟件,2014(7):28-32.

      [5] 羅永蓮,賈玉芳.項目反應(yīng)理論在題庫建設(shè)中的應(yīng)用研究[J].計算機應(yīng)用與軟件,2015(1):86-88.

      [6] 于海霞,劉競杰,王家騏.基于項目反應(yīng)理論自適應(yīng)考試系統(tǒng)的設(shè)計與應(yīng)用[J].合肥學(xué)院學(xué)報(自然科學(xué)版),2010(3):44-48.

      [7] 丘威,鐘治初,黃建妮,等.在線自適應(yīng)測試系統(tǒng)的設(shè)計與實現(xiàn)[J].計算機應(yīng)用研究,2008,25(1):184-186.

      作者簡介:

      單美靜(1979-),女,博士,副教授.研究領(lǐng)域:新型網(wǎng)絡(luò)犯罪和計算機取證.

      劉 琴(1975-),女,副教授.研究領(lǐng)域:數(shù)據(jù)挖掘.endprint

      南漳县| 澎湖县| 靖西县| 即墨市| 民权县| 龙井市| 甘南县| 南岸区| 璧山县| 阿坝县| 昂仁县| 体育| 凤庆县| 云龙县| 芒康县| 中宁县| 兰州市| 普洱| 于田县| 淳化县| 平果县| 班戈县| 抚州市| 余姚市| 高尔夫| 申扎县| 钦州市| 象州县| 浑源县| 友谊县| 马山县| 焉耆| 天津市| 阳曲县| 黄浦区| 神农架林区| 深州市| 和田市| 舒城县| 长海县| 临海市|