郭幸菲 任杰
題庫(kù)是基于教育測(cè)量學(xué)相關(guān)理論,經(jīng)過(guò)分類、編碼的大量試題的集合。隨著計(jì)算機(jī)技術(shù)的發(fā)展,題庫(kù)不僅僅用來(lái)存放編制好的試題,還是一個(gè)集命題、審題、組卷、分析等為一體的動(dòng)態(tài)管理系統(tǒng)。本文從浙江高考英語(yǔ)事件入手,分析在當(dāng)前教育改革背景下建設(shè)題庫(kù)的必要性及諸多優(yōu)勢(shì),并簡(jiǎn)要介紹題庫(kù)建設(shè)所需的條件,提出應(yīng)吸取此次浙江高考英語(yǔ)事件的教訓(xùn),重視考試題庫(kù)的建設(shè),充分利用題庫(kù)資源的優(yōu)勢(shì),更好地保障考試質(zhì)量與考試公平。
一、前言
2018年11月24日,浙江省高考英語(yǔ)成績(jī)公布后,許多學(xué)生反映查到的英語(yǔ)成績(jī)與自己的能力不相符合,有的學(xué)生甚至出現(xiàn)了“倒加分”的情況。隨后,浙江省教育考試院表示,為保證英語(yǔ)一年兩考的試題難度大體相當(dāng),“面向所有考生,對(duì)難度系數(shù)較大的第二部分(閱讀理解)、第三部分(語(yǔ)言運(yùn)用)的部分試題進(jìn)行難度系數(shù)調(diào)整,實(shí)施加權(quán)賦分”。后來(lái)浙江省政府經(jīng)調(diào)查認(rèn)定,這是一起因決策嚴(yán)重錯(cuò)誤造成的重大責(zé)任事故,決定取消這次考試的加權(quán)賦分,恢復(fù)原始得分。
浙江省高考推行英語(yǔ)“一年兩考”,是對(duì)打破“一考定終身”這一現(xiàn)狀的勇敢嘗試,其初衷值得肯定。但如果想把這項(xiàng)政策真正落到實(shí)處,關(guān)鍵在于要使考生在不同時(shí)間的考試分?jǐn)?shù)具有可比性,這就需要測(cè)驗(yàn)等值技術(shù)和大型題庫(kù)作為支持。舉個(gè)簡(jiǎn)單的例子,假設(shè)有兩位同學(xué)分別參加了兩次英語(yǔ)考試,第一位同學(xué)參加第一次考試的成績(jī)是80分,而另一位同學(xué)參加了第二次考試,成績(jī)?yōu)?5分,那我們是否可以認(rèn)為80分就一定好過(guò)75分?答案顯然是否定的,因?yàn)檫@兩次考試的難度不一,因而無(wú)法直接進(jìn)行分?jǐn)?shù)的比較。而等值的目的就是平衡試卷難度,使兩次測(cè)驗(yàn)的分?jǐn)?shù)可以相互轉(zhuǎn)換,從而形成穩(wěn)定的評(píng)價(jià)標(biāo)準(zhǔn)。那么題庫(kù)又是什么呢?會(huì)有哪些作用?建設(shè)題庫(kù)需要哪些條件呢?
二、題庫(kù)及其作用
Brennan 主編的《教育測(cè)量》(第四版)一書(shū)提出:題庫(kù)是測(cè)試項(xiàng)目的集合,這些項(xiàng)目可以被不同的測(cè)驗(yàn)開(kāi)發(fā)者所使用,并且能以不同的形式向被試者施測(cè)。題庫(kù)不僅可以組織和存貯項(xiàng)目,而且還能在測(cè)驗(yàn)存在多種形式、需要不斷生成試卷和互換試題時(shí)有效地管理項(xiàng)目。也有學(xué)者指出,“題庫(kù)是以一定的教育測(cè)量理論為基礎(chǔ),編制、收集的具有一定質(zhì)量要求,并附有代表試題特性的參數(shù),經(jīng)過(guò)分類編碼便于檢索的大量試題的集合” 。不難發(fā)現(xiàn),題庫(kù)的概念就好比一個(gè)超市,其中的每個(gè)商品都有自己對(duì)應(yīng)的標(biāo)簽、條碼及銷售區(qū),而題庫(kù)中的試題也是按照一定的規(guī)則進(jìn)行了分類與儲(chǔ)存,以方便隨時(shí)調(diào)取與使用。
在近些年教育改革的背景下,盡管“題庫(kù)”越來(lái)越多地受到各方關(guān)注,但許多人對(duì)“題庫(kù)”一詞依然有著很深的誤解。有人認(rèn)為,題量大的練習(xí)冊(cè)就是題庫(kù),也有人認(rèn)為存放試題的系統(tǒng)就是題庫(kù)。針對(duì)這一誤區(qū),測(cè)量領(lǐng)域?qū)<抑x小慶老師提出:“題庫(kù)不是習(xí)題集?!彪S著計(jì)算機(jī)技術(shù)的發(fā)展,題庫(kù)不僅僅被用來(lái)存放編制好的試題,還是一個(gè)集遠(yuǎn)程命題、在線審題、在線組卷等為一體的動(dòng)態(tài)管理系統(tǒng)。因此,如今市面上很多題量很大、被稱為“題庫(kù)”的教輔資料,頂多是個(gè)“題集”。
較傳統(tǒng)的命題與考試方式而言,題庫(kù)建設(shè)的作用主要表現(xiàn)在以下幾方面:
第一,建設(shè)題庫(kù)有助于把控命題、組卷的質(zhì)量。進(jìn)入題庫(kù)中的試題都會(huì)被標(biāo)注參數(shù),不僅包括試題的內(nèi)容、考查的能力層次、題型、字?jǐn)?shù)等描述性參數(shù),還包括已經(jīng)等值過(guò)的試題難度和區(qū)分度、題目使用次數(shù)等統(tǒng)計(jì)參數(shù),這些參數(shù)的標(biāo)定將為試卷的組建提供科學(xué)的參考,從而有效提高命題及試卷的質(zhì)量。
第二,建設(shè)題庫(kù)將改變傳統(tǒng)的命題入闈的方式,有效提高命題的效率。所謂命題入闈,是指將經(jīng)選拔的命題人集中到封閉的命題環(huán)境,在一定的期限內(nèi)命制一定量的題目。那么題庫(kù)的建設(shè),可以將考前沉重的命題任務(wù)分散到平時(shí),在保障安全的前提下利用系統(tǒng)進(jìn)行試題的命制、提交、復(fù)審,可以提高命題效率。
第三,題庫(kù)中包含著大量試題,可以根據(jù)考試需要提前組建多套平行試卷。對(duì)于同一次考試而言,可以更好地應(yīng)對(duì)泄題、漏題等突發(fā)狀況;對(duì)于多次考試而言,可以較好地平衡不同試卷間試題的難度、區(qū)分度等,從而實(shí)現(xiàn)不同試卷間分?jǐn)?shù)的比較。
第四,建設(shè)題庫(kù)也是為未來(lái)將計(jì)算機(jī)化自適應(yīng)測(cè)試及計(jì)算機(jī)化多階段自適應(yīng)測(cè)試應(yīng)用到大規(guī)模考試中提供堅(jiān)實(shí)的基礎(chǔ)。近年來(lái),自適應(yīng)考試憑借其因人施測(cè)的優(yōu)勢(shì)受到各方關(guān)注,它的原理是根據(jù)考生在一定題目上的作答,自動(dòng)地從題庫(kù)中抽取既符合考生能力又符合考試要求的題目,并讓考生作答,最后根據(jù)考生在所有題目上的作答表現(xiàn)精確地估計(jì)出考生的能力。那么,題庫(kù)的建設(shè)正是為計(jì)算機(jī)化自適應(yīng)測(cè)試搭建了平臺(tái),不僅可以儲(chǔ)存大量試題,而且可根據(jù)考試需要進(jìn)行試題的導(dǎo)入與分配。
三、題庫(kù)的建設(shè)
在高考英語(yǔ)“一年兩考”的背景下,如何保證高考的科學(xué)性和公平性是個(gè)非常重要的議題。要實(shí)現(xiàn)一年多考,就必須實(shí)現(xiàn)測(cè)驗(yàn)的等值。但就目前的情況來(lái)看,測(cè)驗(yàn)等值技術(shù)在我國(guó)高考中還有很長(zhǎng)的路要走,一方面要考慮等值技術(shù)的科學(xué)性和合理性,另一方面還要考慮相關(guān)配套政策及社會(huì)影響??忌谀炒坞y度較小的考試中得到的原始分?jǐn)?shù)經(jīng)等值很可能會(huì)降低,這樣的分?jǐn)?shù)調(diào)整在廣大學(xué)生和家長(zhǎng)群體中很難被接受。那么,在“一年兩考”成績(jī)報(bào)告采用原始分的情況下,建設(shè)一個(gè)真正意義上的題庫(kù)就為把握試卷難度提供了依據(jù)。一般來(lái)說(shuō),題庫(kù)的建設(shè)需要以下條件:
(一)試題的命制與審核
題庫(kù)建設(shè)的核心在于命題,只有命題質(zhì)量高、符合考試要求的試題才能發(fā)揮題庫(kù)的作用。因此,首先命題人員需要根據(jù)課程標(biāo)準(zhǔn)或考試大綱,嚴(yán)格按照其規(guī)定的考核內(nèi)容要求、能力要求、試題編制技巧等進(jìn)行命題。其次,審題專家對(duì)于征集上來(lái)的試題需進(jìn)行嚴(yán)格審核,從政治性、科學(xué)性、規(guī)范性等多方面判斷試題能否被采用。
(二)試測(cè)與等值
通常,試題的參數(shù)要經(jīng)過(guò)試測(cè)和等值才可獲得。試測(cè)時(shí)需根據(jù)一定的等值設(shè)計(jì),找一批代表性較好的考生樣本作答待等值試卷,然后采用基于經(jīng)典測(cè)驗(yàn)理論或項(xiàng)目反應(yīng)理論的等值方法進(jìn)行等值,從而獲得相應(yīng)的試題的統(tǒng)計(jì)參數(shù)。只有經(jīng)過(guò)等值技術(shù)處理,來(lái)自于不同試卷的題目之間的難度參數(shù)才是可以比較的。
(三)參數(shù)標(biāo)定與試題入庫(kù)
試題參數(shù)是對(duì)試題的各種特性及相互關(guān)系的記錄,對(duì)試題參數(shù)的標(biāo)定有利于試題的管理與儲(chǔ)存,對(duì)建立題庫(kù)而言意義重大。標(biāo)定的參數(shù)主要包括兩大方面:一是試題的題型、分值、題目?jī)?nèi)容、能力范圍、命題時(shí)間等描述性參數(shù)。隨著科學(xué)技術(shù)的發(fā)展,利用人工智能技術(shù)可實(shí)現(xiàn)對(duì)試題的內(nèi)容進(jìn)行分析,從而實(shí)現(xiàn)參數(shù)的自動(dòng)標(biāo)定。二是試題的難度、區(qū)分度等統(tǒng)計(jì)參數(shù)。高考這種高利害的考試對(duì)試題的安全性要求更高,因此對(duì)其難度的把控要更加謹(jǐn)慎。那么經(jīng)過(guò)參數(shù)的標(biāo)定以后,符合考試要求的試題就可以錄入題庫(kù)中。至于題庫(kù)中試題的數(shù)量,一般要為實(shí)際試卷題量的十倍以上。而高考這樣的國(guó)家級(jí)考試題庫(kù),試題的數(shù)量應(yīng)該更多。
(四)題庫(kù)系統(tǒng)的開(kāi)發(fā)與維護(hù)
當(dāng)前題庫(kù)的試題管理、組卷、考試等功能,都需要計(jì)算機(jī)技術(shù)作為支撐,建構(gòu)一個(gè)運(yùn)行良好的題庫(kù)系統(tǒng)離不開(kāi)與計(jì)算機(jī)專業(yè)人員的合作。題庫(kù)系統(tǒng)的開(kāi)發(fā)應(yīng)包括以下幾個(gè)核心系統(tǒng):試題征集系統(tǒng)、試題審核系統(tǒng)、組卷系統(tǒng)、印刷系統(tǒng)、統(tǒng)計(jì)分析系統(tǒng)等。由于題庫(kù)中的試題需要根據(jù)實(shí)際需求進(jìn)行刪減或增添,因此做好題庫(kù)的維護(hù)也非常重要。
通過(guò)以上分析不難發(fā)現(xiàn),題庫(kù)的建設(shè)與運(yùn)行需要學(xué)科專家、命題專家、審題專家、教育測(cè)量學(xué)專家與計(jì)算機(jī)專家的相互配合,缺一不可。同時(shí),無(wú)論是命題審題、參數(shù)標(biāo)定,或者是試題入庫(kù)及題庫(kù)系統(tǒng)的開(kāi)發(fā)與維護(hù),保障題庫(kù)的安全都是重中之重,基于這樣的題庫(kù)組出的試卷難度才容易保持一致。因此,在題庫(kù)建設(shè)的過(guò)程中,應(yīng)提高保密意識(shí),做好保密工作,嚴(yán)格管理相關(guān)人員進(jìn)入題庫(kù)的權(quán)限。