盛夏
【摘要】將現(xiàn)代先進的計算機技術(shù)運用于英語語言測試是當(dāng)今語言測試研究的趨勢,計算機輔助英語測試中的信度和效度是評判測試質(zhì)量的兩個重要標(biāo)準。本文通過對比國內(nèi)外計算機技術(shù)在測試中的應(yīng)用,尤其是適應(yīng)性英語語言測試的應(yīng)用及發(fā)展,介紹了計算機輔助英語測試的優(yōu)勢,最后提出了目前語言測試中計算機技術(shù)所面臨的問題及啟示。
【關(guān)鍵詞】計算機技術(shù);適應(yīng)性測試;英語語言測試
一、計算機自適應(yīng)性英語測試在中外的發(fā)展歷程
計算機適應(yīng)性測試是機輔語言測試的理想測試方式,其理論基礎(chǔ)是項目反應(yīng)理論。計算機輔助教學(xué)的應(yīng)用日益深入,進而影響了語言測試。語言教學(xué)與語言測試是密不可分的,科學(xué)的語言測試也可以更好的檢驗語言教學(xué),得到積極的教學(xué)反饋。由此可見,語言測試的作用不可小覷。適應(yīng)性測試(Computer Adaptive Testing, 簡稱CAT)是基于計算機的考試。適應(yīng)性測試是指測試軟件會自動適應(yīng)被測試者的具體情況,在測試的過程中會根據(jù)被測試者的作答情況來估算出其可能達到的水準,并針對其當(dāng)前水平迅速做出決策反應(yīng),從題庫中調(diào)取難度恰當(dāng)?shù)念}目繼續(xù)施策,直到測試的題目達到一定的數(shù)量,測試信息量達到一定精讀為止。
1.自適應(yīng)英語測試在美國的發(fā)展。自20世紀六七十年代美國國防部便認為適應(yīng)性測試具有巨大的優(yōu)勢,便開始嘗試采用,直到八十年代隨著計算機功能的迅速發(fā)展才真正意義地推動了美國適應(yīng)性測試的發(fā)展。在這一時期,美國實施了第一個適應(yīng)性語言測試后,GRE, TOEFEL, GEMAT等考試也先后采用了適應(yīng)性測試的形式。
每個適應(yīng)性測試要至少包括五個基本步驟:題庫建立、初始項目、項目選擇、能力計算和終點準則。首先,題庫的建立就顯得至關(guān)重要。適應(yīng)性測試的成敗在很大程度上取決于試題題庫的質(zhì)量。然而,題庫的發(fā)明和建立卻存在著極大的問題。一個題庫的建立,絕不是一日兩日可完成的易事,是一項需要在人力物力上做出很大的投資,并至少要數(shù)年才能投入使用的長期問題。于是,就算題庫建設(shè)工程效率很高,三年開始使用,耗資巨大至少要用上五年,那就是八年。
2.自適應(yīng)測試在中國的發(fā)展。然而,計算機適應(yīng)性測試在中國還未被采用,比如當(dāng)前大學(xué)生英語四六級考試仍然采用的是傳統(tǒng)的紙筆作答形式,其過程耗費了大量的時間和人力,測試的精確度也不盡人意。當(dāng)前,也有眾多學(xué)者做了許多實驗研究:張武保進行了電腦適應(yīng)性測試和自適應(yīng)測試對比實驗,結(jié)果表明這兩種電腦化測試在能力測試方面不存在明顯的差異,但是自適應(yīng)測試可降低學(xué)生對考試的憂慮;韓少杰等設(shè)計了自適應(yīng)測試與常規(guī)測試的對照實驗,結(jié)果表明自適應(yīng)測試的測試信度、預(yù)測效度均優(yōu)于基于經(jīng)典測試理論的常規(guī)測試;另有學(xué)者研究了機助自適應(yīng)大學(xué)英語四、六級考試如何測量“英語交際語言能力”問題。
二、計算機輔助英語語言測試的優(yōu)勢
能及時反饋信息,降低日常測試成本。在傳統(tǒng)的紙筆考試形式下,所有學(xué)生都要在統(tǒng)一的時間到指定的教室參加考試,這種考試的實施需要大量的人力參與各個環(huán)節(jié),并且這種“千人一卷”的做法往往不能十分準確的反應(yīng)水平較高或較差學(xué)生的實際能力。而計算機輔助考試便可以節(jié)省紙質(zhì)資源和人力的開支,考試可以在機房進行,只用少數(shù)的管理者即可,考試后成績也便于自動生成。
可以提高測試的信度與效度,降低替考、作弊等考試風(fēng)險。計算機輔助英語測試,由于隨機分配題目可降低傳統(tǒng)考試作弊的現(xiàn)象。正如計算機輔助英語測試的最理想化測試適應(yīng)性測試,可根據(jù)被測試者的水平而自動調(diào)試,既縮短了時間,測試的結(jié)果也更加準確。
可以促進語言教學(xué)。隨著越來越多的統(tǒng)計手段被運用于語言測試研究,大家對于把握考試診斷的正確性和有效性也有了更加客觀的了解,而測試研究人員,特別是教師們掌握先進語言學(xué)習(xí)理論并正確使用外語教學(xué)以及測試中的統(tǒng)計軟件,有助于提高試題質(zhì)量的認識以及考試的信度和效度水平,并最終促進語言教學(xué)。
三、計算機輔助英語語言測試所面臨的問題及啟示
現(xiàn)代信息和網(wǎng)絡(luò)技術(shù)為語言測試帶來了諸多方便和希望,同時也會面臨一些需要解決的問題以及對我們的啟示。
問題:
1.考試是一種教育測量,所謂測量,首先要有一種標(biāo)準化的測量;
2.要有統(tǒng)一的閱卷標(biāo)準。比如當(dāng)前的口語考試,閱卷員必須要有嚴格統(tǒng)一的評判標(biāo)準;
3.如何將傳統(tǒng)的英語考試快速地過渡到計算機語言考試,真正地實現(xiàn)語言測試的科學(xué)化與人性化。
啟示:
1.多關(guān)注語言測試對教學(xué)的主體,如學(xué)生和教師以及家長的影響,關(guān)注其對考試研究和實踐的看法;
2.要借助先進的教育測量理論及計算機輔助語言測試的開發(fā)和研究,保證試題的科學(xué)性和研究的客觀性;
3.繼續(xù)關(guān)注語言測試的信度和效度所涉及的各種因素做深入系統(tǒng)的研究。比如為確保計算機輔助英語測試的信度和效度,需要對考官進行考前培訓(xùn)和對閱卷質(zhì)量進行科學(xué)監(jiān)控。
隨著國內(nèi)外計算機輔助英語語言測試的趨勢,要設(shè)計好計算機輔助英語測試系統(tǒng),提高語言測試的信度及效度,需要設(shè)計人員了解和把握好語言測試的指導(dǎo)思想及理論基礎(chǔ),嚴格把控閱卷質(zhì)量。只有保證了語言測試的信度和效度,才能真實反映出考生的真實英語水平,真正地推動英語教學(xué)的發(fā)展。
參考文獻:
[1]李筱菊.語言測試科學(xué)與藝術(shù)[M].湖南教育出版社,2001.