楊峰 袁天然
摘要:試題庫系統(tǒng)的推行已成為高校教學(xué)的一個重要環(huán)節(jié),結(jié)合試題庫建設(shè)現(xiàn)狀及教學(xué)成績的統(tǒng)計(jì)、測量原則,展開教育測量理論、試題、試卷三者關(guān)系的初步探討,總結(jié)提高試題庫建設(shè)效率的有效途徑和方法。實(shí)踐證明,該理論探討能有效推動教考分離。
關(guān)鍵詞:試題庫;教育測量理論;試題;試卷
中圖分類號:G642.0 文獻(xiàn)標(biāo)志碼:A 文章編號:1674-9324(2015)30-0196-02
隨著信息技術(shù)的快速發(fā)展和廣泛應(yīng)用,試題庫系統(tǒng)逐漸成為高校計(jì)算機(jī)輔助教學(xué)的一種有效方式。受考試制度及傳統(tǒng)題庫建設(shè)經(jīng)驗(yàn)的限制,現(xiàn)有試題庫系統(tǒng)往往不能深度挖掘試卷、試題,也不能發(fā)揮試卷和試題的診斷及評價(jià)功效[1]。怎樣在現(xiàn)代試題庫系統(tǒng)建設(shè)中引入先進(jìn)的教育測量理論,兼有二者的優(yōu)勢[2],用先進(jìn)理論引導(dǎo)先進(jìn)技術(shù),保證試題庫建設(shè)充分適應(yīng)現(xiàn)代教學(xué)理念的發(fā)展趨勢,切實(shí)促進(jìn)教學(xué),已成為現(xiàn)代試題庫建設(shè)發(fā)展過程中必須重視的問題。
一、教育統(tǒng)計(jì)與教育測量理論
有效地進(jìn)行教育測量是我們建設(shè)試題庫的目的所在[3]。教育測量要遵循教育規(guī)律,它的理論基礎(chǔ)就是教育統(tǒng)計(jì)與教育測量理論[4]。教育測量的最主要的任務(wù)準(zhǔn)確測量測試者的水平,盡量降低測量誤差。為保證考試更加科學(xué)化,就要利用教育測量,而教育測量的研究對象正是命題、閱卷、分析、評價(jià)等考試工作的全過程。
考試是目前測量教育水平的最直接方式,期間涉及到教育統(tǒng)計(jì)的概念及理論。教育統(tǒng)計(jì)的目的主要用來檢測教育的科學(xué)性,從而探索教學(xué)現(xiàn)象的各種規(guī)律及特征,其主要通過統(tǒng)計(jì)學(xué)的方法和理論研究教育現(xiàn)象及本質(zhì)[5]。
試卷是目前考試執(zhí)行的主要形式,其測量結(jié)果決定考試的質(zhì)量[6]。試卷設(shè)計(jì)的科學(xué)與否,成為教學(xué)工作中不可忽視的重要一步,其最能客觀反映教師的教學(xué)水平及學(xué)生的學(xué)習(xí)效果,也正是本文所要研究的重中之重。
二、教育測量理論在試卷質(zhì)量評價(jià)中的應(yīng)用
組卷,即在設(shè)定的組卷策略下,借助已經(jīng)存在的試題庫隨機(jī)或人為選取合適的測試題形成一份或多份(有的學(xué)校要求A/B卷)符合測試要求的試卷。從教育理論角度考慮,衡量試卷質(zhì)量的基本要素主要包括以下兩個方面,即信度和效度。
1.信度。信度指的是測量結(jié)果是不是滿足穩(wěn)定性要求。隨著測量類型的不同,不論是物理測量還是教育測量,即使面對同樣的測量對象,其所得的測量結(jié)果幾乎不會全部相同[7]。因?yàn)槊看蔚臏y量結(jié)果總會受兩大因素的影響,即被測對象的實(shí)際發(fā)揮水平及測量過程中難以避免的誤差。
通過以上定義,不難發(fā)現(xiàn)信度包含實(shí)際考試過程中隨機(jī)誤差對其影響作用,兩者成反比關(guān)系。影響信度的主要因素包括四個方面:(1)接受測試者個體難免有不同程度的差異,這是導(dǎo)致信度真分?jǐn)?shù)參差不齊的主要原因所在。(2)試卷本身題目的多少,試卷的長短,會導(dǎo)致考試得分受試題抽樣偶然性影響,相對地,適當(dāng)提高試卷的中題目的數(shù)量對信度有正比例的影響。(3)試卷內(nèi)容性質(zhì)的相同與否,對信度成正比例影響關(guān)系,即內(nèi)容性質(zhì)不同或相差較遠(yuǎn)的試卷信度一般偏低,反之則信度較高。(4)試卷的難度,在考試的難度過高或過低時(shí),分?jǐn)?shù)分布呈偏態(tài)分布。
2.效度。效度,即測量是否有效及其有效程度,也就是此次考試實(shí)際測出的與其要測量的特性的接近程度[8]。如果所要測的特性被準(zhǔn)確地測量,就認(rèn)定此次測量的效度是高的。主要從以下幾個重要因素分析對效度有重要的影響:(1)類似于信度,考試內(nèi)容性質(zhì)的共同與否,對效度成反比例影響規(guī)律,即試題間的內(nèi)容一致性越高,效度就會越低。(2)應(yīng)考者之間的差異性,期間的差異性會導(dǎo)致真分?jǐn)?shù)差異性的對應(yīng)變大。(3)試卷的長度,同樣類似于對信度的影響,即適當(dāng)提高試卷的中題目的數(shù)量對效度有正比例的影響。
三、教育測量理論在試題質(zhì)量評價(jià)中的應(yīng)用
試題是組成試卷的基本元素,試題的質(zhì)量對試卷質(zhì)量的影響較大。如何根據(jù)教育測量理論探索影響試題質(zhì)量的主要因素是本部分的主要研究內(nèi)容。
1.難度。難度一詞的含義眾所周知,具體到本文就是指應(yīng)考者解答題目或完成要求時(shí)的困難程度,主要分為相對值及絕對值。相對難度也稱為統(tǒng)計(jì)難度,是統(tǒng)計(jì)應(yīng)考者測試后的試卷通過統(tǒng)計(jì)分析方法計(jì)算出的難度。絕對難度也叫認(rèn)知難度,與被測試者的實(shí)際水平?jīng)]有關(guān)系。
難度共有三個特點(diǎn),即相對性、計(jì)量性和區(qū)間性。相對性是建立在不同的考試及不同應(yīng)試對象的基礎(chǔ)上統(tǒng)計(jì)的[9,10]。具體來說,若應(yīng)試者的水平不同,即使相同的試卷,測試統(tǒng)計(jì)后的難度值也不會相同。計(jì)量性是指難度是一個可以具體量化的指標(biāo)。在分析、計(jì)算考試的難度時(shí),往往只是基于感性的、模糊的、沒有準(zhǔn)確理論依據(jù)的判斷,但在經(jīng)典測量理論中,難度被定義為具體的指標(biāo),具體數(shù)值的計(jì)算是通過數(shù)學(xué)統(tǒng)計(jì)方法計(jì)算而得的。區(qū)間性即難度永遠(yuǎn)介于0至1之間的閉區(qū)間內(nèi),其是連續(xù)變化的,在難度值為0時(shí),說明試題越容易;反之亦然。
在統(tǒng)計(jì)考試結(jié)果中,往往同數(shù)學(xué)統(tǒng)計(jì)圖來表示。若統(tǒng)計(jì)圖顯示考試結(jié)果呈正態(tài)分布,則說明試卷的難度趨于中間。當(dāng)統(tǒng)計(jì)結(jié)果顯示為負(fù)偏態(tài)分布規(guī)律時(shí),說明試卷偏難,且測試分?jǐn)?shù)偏低。當(dāng)統(tǒng)計(jì)結(jié)果顯示為正偏態(tài)分布規(guī)律時(shí),說明試卷偏簡單,且測試分?jǐn)?shù)偏高[11]。
2.區(qū)分度。試題的區(qū)分度主要為了鑒別應(yīng)試者的實(shí)際學(xué)習(xí)能力,主要為了區(qū)別被測試者。為了有效區(qū)分不同學(xué)習(xí)水平的學(xué)生的學(xué)習(xí)能力,往往要求區(qū)分度越高越好。測量專家把區(qū)分度這一指標(biāo)作為考試是否有效的重要量度,并作為評價(jià)項(xiàng)目質(zhì)量、篩選項(xiàng)目的主要指標(biāo)與依據(jù)[12]。試題的區(qū)分度越好,說明試題對應(yīng)考者有較強(qiáng)的考察及測試能力。
區(qū)分度計(jì)算往往采用分組法,主要分為以下三步完成:
Step1:分組。將所有被試分為三組,分組順序參考總分順序排列。從最高分開始的前25%定義為第一組;相對地,從最低分開始后25%定義為第二組;余下的50%為第三組。
Step2:統(tǒng)計(jì)。采用數(shù)學(xué)統(tǒng)計(jì)方法計(jì)算每個試題的具體得分率,其中第一組、第二組得分率用符號PH、PL表示。
Step3:計(jì)算。計(jì)算公式為:D=PH-PL。
例如,表1為計(jì)算上海電力學(xué)院2013—2014學(xué)年第一學(xué)期《工程力學(xué)》期末試卷中的試題區(qū)分度計(jì)算。
從表1的統(tǒng)計(jì)結(jié)果不難看出,第2題和第4題的區(qū)分性能較好,第1題和第3題分別偏向極值。由計(jì)算公式可知:從理論上說區(qū)分度同難度一樣,也是介于0到1之間的一個數(shù),難度越低或難度越高的試題區(qū)分度都低。
四、小結(jié)
本文通過對教育測量基本原理和方法的運(yùn)用,將影響試卷的因素加以分析研究,分別從信度、效度探討了影響試卷的影響因素,試題作為試卷的基本組成元素,主要從難度和區(qū)分度兩個重要影響因素進(jìn)行闡述,探討了兩者對試卷的影響作用,為試題庫結(jié)構(gòu)設(shè)計(jì)和算法的實(shí)現(xiàn)提供理論依據(jù)和重要支持。
參考文獻(xiàn):
[1]馮雪花,王慧玲.教考分離管理模式的思考[J].中國教育技術(shù)裝備,2014,(2):96-98.
[2]辛濤.新課程背景下的學(xué)業(yè)評價(jià):測量理論的價(jià)值[J].北京師范大學(xué)學(xué)報(bào):社會科學(xué)版,2006,(1):56-59.
[3]吳承禎,何麗華,林立群,等.試卷質(zhì)量分析方法及其應(yīng)用[J].中國林業(yè)教育,2008,(3):26-30.
[4]李·斯·舒爾曼,黃甫全,王娜智者.教學(xué)活動中的知識生長[J].教師教育學(xué)報(bào),2014,(4):44-58.
[5]范明虎,孫斌.通用試題庫管理系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與設(shè)計(jì),2007,(9):2185-2188.
[6]趙德成.減負(fù)背景下的評價(jià)與考試改革[J].北京師范大學(xué)學(xué)報(bào):社會科學(xué)版,2014,(4):23-29.
[7]李業(yè)剛,高成琳,李紅玲,等.高校試卷質(zhì)量分析系統(tǒng)的研究[J].山東理工大學(xué)學(xué)報(bào):自然科學(xué)版,2008,(04):57-60.
[8]袁東華.高校試題庫、試卷庫建設(shè)問題的思考[J].黑龍江教育(高教研究與評估),2013,(4):77-78.
[9]楊永,梁金鈐.基于B/S模式的通用試題庫系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)[J].計(jì)算機(jī)工程與科學(xué),2009,(04):143-146.
[10]曾一,冉忠,郭永林.試題庫中自動組卷的算法及試卷測評策略[J].計(jì)算機(jī)工程與設(shè)計(jì),2006,(16):3024-3028.
[11]楊峰.基于遺傳算法的試題庫管理及自動組卷系統(tǒng)的研究[D].山東農(nóng)業(yè)大學(xué),2008.
[12]周文舉.基于遺傳算法的自動組卷系統(tǒng)研究與實(shí)現(xiàn)[D].山東師范大學(xué),2006.