陳雯雯
摘 ?要:隨著計(jì)算機(jī)的普及和快速發(fā)展,信息技術(shù)對(duì)語(yǔ)言測(cè)試形式產(chǎn)生了重要的影響。很顯然,計(jì)算機(jī)適應(yīng)性語(yǔ)言測(cè)試已經(jīng)成為這一領(lǐng)域最重要的發(fā)展方向。本文主要介紹了計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試(Computerized Adaptive Language Test以下稱CALT)的定義。并且分析了CALT的優(yōu)勢(shì)及其面臨的問題與挑戰(zhàn)。并指出,計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試因?yàn)樗贤庹Z(yǔ)教學(xué)改革發(fā)展的實(shí)際需求,將成為引領(lǐng)外語(yǔ)測(cè)試的新方向。
With the popular of computer and its rapid development,information technology has a significant impact on language testing. Obviously,Computerized Adaptive Language Test(CALT)has become the most important development direction in this field. This article mainly introduces the definition of CALT. At the same time,it not only analyzes the advantages of CALT but also analyzes the questions and challenges it faced. It also point out that because CALT can meet the actual demand of foreign language teaching reform,it will become the new leading direction of foreign language testing.
計(jì)算機(jī)技術(shù)的發(fā)展不但影響著外語(yǔ)教與學(xué)的整個(gè)過程,同時(shí)也使得語(yǔ)言測(cè)試的技術(shù)手段和方式發(fā)生了重大的改變。語(yǔ)言測(cè)試技術(shù)已經(jīng)成為眾多研究者關(guān)注的新課題。2001年在美國(guó)舉行的第23屆國(guó)際語(yǔ)言測(cè)試研討會(huì)的主題就是“語(yǔ)言測(cè)試與技術(shù)”,基于計(jì)算機(jī)技術(shù)所構(gòu)建的測(cè)試新方法——計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試成了本次會(huì)議的重要議題。計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試由于其因材施測(cè)、能精確估計(jì)考生能力及節(jié)省施測(cè)時(shí)間等顯著的優(yōu)點(diǎn),正逐步滲透到各類外語(yǔ)測(cè)試中去,將引領(lǐng)外語(yǔ)測(cè)試發(fā)展的新方向。
一、計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試的定義
計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試源于計(jì)算機(jī)化調(diào)適性測(cè)試(Computerized Adaptive Test)(下稱CAT),是一種技術(shù)上受計(jì)算機(jī)終端和PC管理的先進(jìn)的測(cè)試語(yǔ)言能力的方法。它是現(xiàn)代語(yǔ)言測(cè)試?yán)碚撆c當(dāng)代多媒體技術(shù)相結(jié)合的產(chǎn)物,采用項(xiàng)目反應(yīng)理論為數(shù)學(xué)模型建立題庫(kù),并以此根據(jù)題目的各方面信息和受測(cè)者的答題情況,從題庫(kù)中選取符合受測(cè)者語(yǔ)言水平的題目進(jìn)行測(cè)試,在最短的時(shí)間內(nèi)迅速準(zhǔn)確地估計(jì)受測(cè)者的語(yǔ)言能力,直到達(dá)到預(yù)定的測(cè)試精度要求。
二、計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試的優(yōu)勢(shì)
計(jì)算機(jī)技術(shù)的發(fā)展和測(cè)量學(xué)“項(xiàng)目反應(yīng)理論”的成熟催生了新一代計(jì)算機(jī)化語(yǔ)言測(cè)試——計(jì)算機(jī)適應(yīng)性語(yǔ)言測(cè)試。這種被稱為“量體裁衣”式的測(cè)試具有傳統(tǒng)的紙筆測(cè)試無(wú)法比擬的優(yōu)勢(shì),如具有良好的反饋?zhàn)饔?,測(cè)試的個(gè)性化、人性化加強(qiáng),安全性提高。為每位受試提供適合其語(yǔ)言能力的題目或任務(wù),能夠提高他們的興趣,促使他們發(fā)揮最佳水平,從而實(shí)現(xiàn)對(duì)受試語(yǔ)言能力更準(zhǔn)確的測(cè)量。例如,基于網(wǎng)絡(luò)的DI-ALANG融自我評(píng)估和診斷性測(cè)試為一體,為受試提供個(gè)性化的語(yǔ)言能力評(píng)估信息。一些新題型得以開發(fā)使用,如文章復(fù)原法可以用來(lái)考察受試在句子和語(yǔ)篇層面的語(yǔ)言理解能力。
比較傳統(tǒng)的紙筆考試而言,CALT具有以下的四點(diǎn)優(yōu)勢(shì):
(一)具有人性化和個(gè)體性
在傳統(tǒng)的考試中,不管考生實(shí)際語(yǔ)言能力如何,都必須做大量的固定的試題進(jìn)行語(yǔ)言考查,需要較多的時(shí)間;而在CALT中,后面試題的呈現(xiàn)是以前面答題的反應(yīng)情況來(lái)決定的,或難或易,循序漸進(jìn)的進(jìn)行。同時(shí),CALT還可以根據(jù)不同的測(cè)試對(duì)象確定不同的常模,考試的內(nèi)容、題量因人而異,有針對(duì)性的施加測(cè)試題目,具有無(wú)可比擬的個(gè)體性,具有人性化特征,符合外語(yǔ)教學(xué)改革的要求。
(二)具有科學(xué)性和準(zhǔn)確性
效度與信度是語(yǔ)言測(cè)試中最重要的兩個(gè)原則,測(cè)試的科學(xué)與準(zhǔn)確性取決于該測(cè)試是否具有高效度和高信度。在傳統(tǒng)的測(cè)試中,由于不同考生接受同一批題目的測(cè)驗(yàn),語(yǔ)言水平低的考生無(wú)法作答難度大的題目,那些難度小的題目對(duì)語(yǔ)言水平高的考生又測(cè)不出真實(shí)水平,測(cè)試的效度時(shí)而高、時(shí)而低,難以把握。CALT則不同,它不但定義了信息函數(shù)這一綜合質(zhì)量指標(biāo)作為科學(xué)挑選題目的標(biāo)準(zhǔn),而且題目函數(shù)估計(jì)準(zhǔn)確,電腦能根據(jù)題目相對(duì)難度、題型和考生對(duì)初始題目應(yīng)答的整體表現(xiàn),適度調(diào)整出與考生水平相適應(yīng)的題目。因此,由于測(cè)驗(yàn)的信息量最大,也就能最大限度地測(cè)算出代表考生實(shí)際語(yǔ)言能力的成績(jī),測(cè)試的效度也就最好,實(shí)得分?jǐn)?shù)分布與目標(biāo)分?jǐn)?shù)的分布的擬合度也最好。同時(shí),就信度而言,傳統(tǒng)的測(cè)試評(píng)分往往由人工評(píng)判,雖然有統(tǒng)一的參考評(píng)判尺度,也難免會(huì)因人而異而產(chǎn)生誤差。CALT則通常具有良好的穩(wěn)定性、等值性與客觀性,且考生每答對(duì)一個(gè)試題就會(huì)重新估計(jì)一次考生的能力估計(jì)值,測(cè)試之后能馬上打印測(cè)試結(jié)果,各項(xiàng)工作由電腦自行進(jìn)行,排除了人為的因素,測(cè)試成績(jī)公開、公正、公平、真實(shí)可靠、準(zhǔn)確性高。
(三)具有保密性和安全性
與傳統(tǒng)的測(cè)試不同,CALT由于對(duì)不同的考生施測(cè)不同內(nèi)容,大大地降低了猜題、舞弊的發(fā)生,對(duì)題庫(kù)中題目曝光頻率的控制與測(cè)試數(shù)據(jù)的層級(jí)保密很大程度上都提高了語(yǔ)言測(cè)試的安全性。
(四)具有經(jīng)濟(jì)性與實(shí)效性
比較傳統(tǒng)的測(cè)試,CALT的題量較少,考試時(shí)間短,節(jié)省了大量的人力物力,降低了成本。測(cè)試之后能立即計(jì)分并報(bào)告成績(jī)和給出反饋,快捷又實(shí)效。除此之外,CALT由于可以調(diào)整學(xué)生的作答速度與題目難度,測(cè)試環(huán)境自然、寬松,降低了考生的考試焦慮與挫折感,尤其在口語(yǔ)、聽力考試中更益于考生正常發(fā)揮自己的真實(shí)水平。
這種被稱為“量體裁衣”式的測(cè)試具有傳統(tǒng)的紙筆測(cè)試無(wú)法比擬的優(yōu)勢(shì),如具有良好的反饋?zhàn)饔?,測(cè)試的個(gè)性化、人性化加強(qiáng),安全性提高。與其他的考試相比,CALT考試更注重考試過程及其測(cè)試精確度的提升。CALT能為每位受試提供適合其語(yǔ)言能力的題目或任務(wù),由此可提高他們的興趣,促使他們發(fā)揮最佳水平,從而實(shí)現(xiàn)對(duì)受試語(yǔ)言能力更準(zhǔn)確的測(cè)量。
總之,CALT的優(yōu)勢(shì)在于具有明顯的漸進(jìn)性和個(gè)體性,即受試者即將面對(duì)的試題是以其前面答題情況而定,其題目或難或易,因人而易,循序漸進(jìn),具有很強(qiáng)的科學(xué)性和準(zhǔn)確性。CALT不但以信息函數(shù)這一綜合質(zhì)量指標(biāo)為科學(xué)的選題標(biāo)準(zhǔn),而且題目函數(shù)估計(jì)準(zhǔn)確,能最大限度地測(cè)算受試者的實(shí)際語(yǔ)言水平,并且具有穩(wěn)定性、等值性與客觀性的特點(diǎn)。CALT安全指數(shù)高保密性好,幾乎不可能猜題、壓題、舞弊。CALT由于題量靈活,時(shí)間可長(zhǎng)可短,測(cè)試后能即時(shí)記分并報(bào)告成績(jī),所以說其具有經(jīng)濟(jì)性和實(shí)效性。
三、計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試面臨的問題與挑戰(zhàn)
現(xiàn)代信息和網(wǎng)絡(luò)技術(shù)為語(yǔ)言測(cè)試帶來(lái)了許多快捷和希望,同時(shí)也帶來(lái)了一些問題和隱患。雖然互聯(lián)網(wǎng)和電腦技術(shù)的普及速度非???,但目前網(wǎng)絡(luò)帶寬和網(wǎng)絡(luò)安全還是一個(gè)急需解決的問題。在我國(guó)有些地區(qū)計(jì)算機(jī)還不夠普及,這就給計(jì)算機(jī)化語(yǔ)言測(cè)試的推廣帶來(lái)一定的困難?!督逃筷P(guān)于 2013 年深化教育領(lǐng)域綜合改革的意見》提出要實(shí)施高考英語(yǔ)科目一年多次考試。隨著“一年多考制度”的推廣,必然會(huì)遇到同時(shí)使用多套試題的情況,隨著而來(lái)的是試題庫(kù)建設(shè),現(xiàn)代網(wǎng)絡(luò)和計(jì)算機(jī)技術(shù)的發(fā)展為試題庫(kù)建設(shè)帶來(lái)諸多方便,但試題庫(kù)建設(shè)和使用涉及多方面的工作。試題參數(shù)的確定需要做大量前期工作。試題庫(kù)的試題需重復(fù)使用,在試題使用之后主要問題之一是試題的安全性,如何不讓使用過的試題泄露出去,這些需要更多研究和實(shí)踐。同時(shí)為了保證考試的公平,多套同時(shí)使用的試卷之間的等值顯得尤為重要,如何科學(xué)地利用現(xiàn)代技術(shù)等值試卷還需進(jìn)一步進(jìn)行研究。基于計(jì)算機(jī)的考試改變傳統(tǒng)紙筆考試的一些題型和做法,這些改變對(duì)學(xué)生有影響,會(huì)在一定程度上影響試卷的效度。
而由于CALT研究起步較晚,所依據(jù)的理論基礎(chǔ)與技術(shù)手段有待進(jìn)一步完善,加之語(yǔ)言測(cè)試的特殊性及其與傳統(tǒng)測(cè)試的差異性等原因,均不可避免地決定了CALT仍存在著諸多的問題:
(一)CALT的評(píng)分問題
傳統(tǒng)測(cè)試中,如果學(xué)生不能回答某些問題,可以跳題或者省略,然而在CALT中允許跳題,若選題項(xiàng)沒有被計(jì)分,學(xué)生可跳過題項(xiàng)答題時(shí)可能會(huì)對(duì)題目的安全性有影響。而如果不允許跳題,則是剝奪了學(xué)生資助決定做題順序的自由。
(二)CALT的題項(xiàng)設(shè)計(jì)問題
在題項(xiàng)的采集上,傳統(tǒng)測(cè)試在設(shè)計(jì)上常常根據(jù)明確的考試要求來(lái)收集某個(gè)特定領(lǐng)域不同的知識(shí)或者技能題項(xiàng)。而CALT的一般時(shí)間上會(huì)比傳統(tǒng)測(cè)試短,很難像傳統(tǒng)測(cè)試一樣根據(jù)具體要求來(lái)收集題項(xiàng)。它一般是從所有可能的集體要求中隨機(jī)抽選出。
(三)CALT測(cè)試題目中的交際能力問題
外語(yǔ)教學(xué)的目的是培養(yǎng)學(xué)生的交際能力,測(cè)試考生交際能力的高低則通過對(duì)語(yǔ)言行為的衡量來(lái)判斷,即需在交際、環(huán)境、話題和目的等語(yǔ)言使用環(huán)境中測(cè)試考生的語(yǔ)言組織能力與語(yǔ)用能力;但是由于語(yǔ)用背景是具體的,千變?nèi)f化的,沒有固定的模式可尋,難以數(shù)字化和信息化,測(cè)試結(jié)果也只能被看成在考試所設(shè)計(jì)的背景下的特定的運(yùn)用外語(yǔ)行為,而非考生在真實(shí)外語(yǔ)生活環(huán)境下的交際能力。因此,如何鎖定測(cè)試目標(biāo)設(shè)計(jì)出充分體現(xiàn)交際能力的真實(shí)測(cè)試項(xiàng)目是CALT須解決的棘手問題。
(四)CALT題型與語(yǔ)言測(cè)試目標(biāo)能力關(guān)聯(lián)性問題
不同起始題目與題型的選擇對(duì)不同目標(biāo)能力初步估計(jì)值的效度也不同,直接影響到目標(biāo)測(cè)試能力的準(zhǔn)確定位,起始題目、題型的選擇對(duì)整個(gè)測(cè)試過程起著關(guān)鍵的導(dǎo)航作用??忌鷾y(cè)試速度與語(yǔ)言能力的關(guān)系、CALT對(duì)教學(xué)的反撥作用、計(jì)算機(jī)操作熟練程度與測(cè)試成績(jī)之間的關(guān)系以及如何避免商業(yè)化等問題都有待我們外語(yǔ)工作者與軟件工程師進(jìn)一步研究與實(shí)踐。
曾用強(qiáng)教授在2009年全國(guó)英語(yǔ)專業(yè)四、八級(jí)測(cè)試暨計(jì)算機(jī)技術(shù)應(yīng)用專題研討會(huì)中,作了“計(jì)算機(jī)化考試的幾點(diǎn)思考”為題的發(fā)言。他認(rèn)為目前人們對(duì)計(jì)算機(jī)化考試存在一些誤解,主要體現(xiàn)在:計(jì)算機(jī)化考試就是紙筆考試的計(jì)算機(jī)化或網(wǎng)絡(luò)化;計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)決定了機(jī)考的發(fā)展;實(shí)現(xiàn)多次考試;簡(jiǎn)化考務(wù)工作。計(jì)算機(jī)化考試一般要經(jīng)過內(nèi)容設(shè)計(jì)、技術(shù)開發(fā)和實(shí)施三個(gè)階段,計(jì)算機(jī)化考試有它獨(dú)特的特點(diǎn)和規(guī)律,我們必須遵循這些特點(diǎn)和規(guī)律才能開發(fā)出符合考試發(fā)展和需要的計(jì)算機(jī)化考試。
四、總結(jié)
綜上所述,CALT是現(xiàn)代化教育技術(shù)改變測(cè)試手段的新方向,世界上許多很有影響的國(guó)際性英語(yǔ)考試也正在全面推行CALT。作為一個(gè)新興的事物,CALT仍有許多問題和挑戰(zhàn),需要不斷地改進(jìn)與完善。隨著語(yǔ)言教學(xué)的改革與進(jìn)步,計(jì)算機(jī)技術(shù)的優(yōu)勢(shì)將扮演越來(lái)越重要的角色。目前,在我國(guó)這方面的研究涉足并不多,相信計(jì)算化調(diào)試性語(yǔ)言測(cè)試將會(huì)越來(lái)越普及,研究成果也將日益豐碩。
參考文獻(xiàn)
[1] ?陳冰冰. 引領(lǐng)外語(yǔ)測(cè)試新方向——計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試[J]. 外語(yǔ)電化教學(xué),2005 (102)
[2] ?陳慧麟. 基于紙筆的語(yǔ)言測(cè)試和基于計(jì)算機(jī)的語(yǔ)言測(cè)試之間效度對(duì)等性驗(yàn)證模式初探[J]. 外語(yǔ)界,2009(3)
[3] ?蔡基剛. 大學(xué)英語(yǔ)四、六級(jí)計(jì)算機(jī)口語(yǔ)測(cè)試效度、信度和可操作性研究[J]. 外語(yǔ)界,2005(4)
[4] ?高國(guó)安. 淺談?dòng)?jì)算機(jī)在外語(yǔ)教學(xué)中的應(yīng)用[J]. 高校社科信息,2001(3)
[5] ?何蓮珍. 認(rèn)知計(jì)算機(jī)適應(yīng)性考試模型的設(shè)計(jì)[J]. 現(xiàn)代外語(yǔ),1999(2)
[6] ?洪云. 計(jì)算機(jī)化語(yǔ)言測(cè)試的發(fā)展及其面臨的問題[J]. 中國(guó)成人教育2010(15)
[7] ?金艷. 計(jì)算機(jī)化語(yǔ)言測(cè)試的效度研究——淺析計(jì)算機(jī)能力與測(cè)試構(gòu)念的關(guān)系[J]. 外語(yǔ)電化教學(xué),2012(1)
[8] ?金艷,張曉藝. 技能綜合對(duì)語(yǔ)言測(cè)試構(gòu)念效度的影響——培生考試與大學(xué)英語(yǔ)六級(jí)網(wǎng)考的對(duì)比研究[J]. 外語(yǔ)電化教學(xué),2013(154)
[9] ?孔文,李清華. 大規(guī)模語(yǔ)言測(cè)試的方向:計(jì)算機(jī)適應(yīng)性語(yǔ)言測(cè)試[J]. 外語(yǔ)界,2002(2)
[10] ?劉建達(dá). 現(xiàn)代技術(shù)與語(yǔ)言測(cè)試應(yīng)用、影響及發(fā)展方向[J]. 外語(yǔ)電化教學(xué),2013(152)
[11] ?李清華,孔文. 基于計(jì)算機(jī)的語(yǔ)言測(cè)試及其效度驗(yàn)證[J]. 外語(yǔ)界,2009(3)
[12] ?李清華. 基于紙筆的語(yǔ)言測(cè)試與基于計(jì)算機(jī)的語(yǔ)言測(cè)試的等效研究綜述[J]. 外語(yǔ)界,2006(04)
[13] ?田文燕. 國(guó)外計(jì)算機(jī)化語(yǔ)言測(cè)試(IBT)現(xiàn)狀綜述[J]. 外語(yǔ)界,2006(5)
[14] ?田文燕. 從紙筆測(cè)試到計(jì)算機(jī)化語(yǔ)言測(cè)試的發(fā)展[J]. 湖北廣播電視大學(xué)學(xué)報(bào),2007(2)
[15] ?田文燕,張震宇. 計(jì)算機(jī)化語(yǔ)言測(cè)試的應(yīng)用問題與展望[J]. 外語(yǔ)電化教學(xué),2007(4)
[16] ?吳會(huì)芹. 用現(xiàn)代化手段輔助語(yǔ)言測(cè)試[J]. 外語(yǔ)電化教學(xué),2006(109)
[17] ?王勇旗. 計(jì)算機(jī)化語(yǔ)言——新測(cè)試形式帶來(lái)的思考[J]. 學(xué)科改革,2008(05)
[18] ?楊安良,田少華. 我國(guó)計(jì)算機(jī)化調(diào)適性語(yǔ)言測(cè)試(CALT)研究現(xiàn)狀[J]. 外語(yǔ)界,2008(2)
[19] ?應(yīng)真箭,葉新東. 計(jì)算機(jī)適應(yīng)性語(yǔ)言測(cè)試的幾個(gè)問題[J]. 教學(xué)與管理,2005(6)
[20] ?楊滿珍. 20世紀(jì)90年代國(guó)外語(yǔ)言測(cè)試的發(fā)展[J]. 外語(yǔ)教學(xué),2002(05)
[21] ?楊琪. 計(jì)算機(jī)輔助大規(guī)模英語(yǔ)口語(yǔ)測(cè)試的實(shí)踐與反思[J]. 外語(yǔ)電化教學(xué),2012
[22] ?朱音爾,張肖瑩. 基于網(wǎng)絡(luò)的大學(xué)英語(yǔ)機(jī)考探索與實(shí)踐[J]. 外語(yǔ)電化教學(xué),2009(126)
[23] ?鄭佩蕓,史光孝,潘鳴武. 信息技術(shù)在語(yǔ)言測(cè)試中的應(yīng)用現(xiàn)狀及展望——計(jì)算機(jī)信息技術(shù)應(yīng)用專題研討會(huì)述評(píng)[J]. 外語(yǔ)電化教學(xué),2010(131)