鄭曉英,朱海燕
2018年,教育部高等學校大學外語教學指導委員會在“新時代英語能力測評體系建設與大學英語教育內(nèi)涵式發(fā)展高端研討會”上提出,中國高等教育發(fā)展和英語能力測評體系建設走入新時代,大學英語教學改革走入內(nèi)涵式發(fā)展的關(guān)鍵時期。同年,教育部印發(fā)《教育信息化2.0行動計劃》(教技〔2018〕6號),信息技術(shù)和教育實踐深度融合為大學英語測評體系的信息化建設提供了變革的內(nèi)生要素。《大學英語教學指南》(以下簡稱《指南》)(2020版)中也提出,“推動線上線下混合式教學等新教學模式下的課程評價,利用信息技術(shù)建立大學英語教學基本狀態(tài)數(shù)據(jù)常態(tài)監(jiān)測和反饋機制,促進自我改進和提高”[1]27。由此可見,信息技術(shù)不應僅停留在學習環(huán)境,而應嵌入整個教學系統(tǒng)中。
進行信息化測試改革是推動“大學英語”課程建設與發(fā)展的重要手段?!按髮W英語”是非英語專業(yè)本科教育中必修的公共基礎課程,評價與測試是檢驗教學質(zhì)量、推動大學英語課程改革與發(fā)展、實現(xiàn)大學英語教學質(zhì)量和大學生英語應用能力不斷提高的重要手段。傳統(tǒng)的大學英語測試采用紙筆或面試的形式,不僅耗費大量的人力、物力與時間,在考試效度和全面評價學生語言能力方面未能給教師與教學提供很好的反饋作用。為了更加有效地推進大學英語教學工作,信息化技術(shù)被廣泛應用到大學英語評測工作中。以計算機和網(wǎng)絡為基礎的信息化測試對“大學英語”測評產(chǎn)生了巨大的影響,特別是在測試管理、試題編寫、任務呈現(xiàn)、評分、成績分析與報道等方面,信息技術(shù)在大規(guī)模語言測試中的應用極大地提高了測試效率。信息化技術(shù)的高速發(fā)展為測試模式的變革帶來內(nèi)生動力,越來越多的學校開始注重信息化教學與測試設備的建設,信息化測試手段正在被廣泛引入校本考試中。不久的將來,信息化測試必將取代傳統(tǒng)考試形式,在大學英語測試體系的建設中發(fā)揮積極作用;信息化測試將增強測試科學性,提高測試效率,提升教學質(zhì)量。
大學英語信息化測試是指在大學英語測試中融入先進的計算機技術(shù)和網(wǎng)絡系統(tǒng),使大學英語測試工作更加高效、便捷。信息化測試意味著考試由傳統(tǒng)的紙質(zhì)媒介轉(zhuǎn)變?yōu)槭褂秒娔X答題,作答使用的筆由鍵盤和鼠標取而代之,考試期間學生通過電腦顯示器閱讀題目,利用鼠標、鍵盤完成測試系統(tǒng)的聽力、閱讀、翻譯、作文等環(huán)節(jié)的客觀題與主觀題考試。此外,大學英語測試中的口語考試也實現(xiàn)了信息化測試,通過計算機與考生進行人機對話。考生利用賬號登錄系統(tǒng),進入對應的考試;戴上耳機,對著話筒完成英文朗讀與口頭作文。計算機從考生答題錄音中根據(jù)“整體表現(xiàn)、任務表現(xiàn)、自主學習表現(xiàn)”等特征自動提取數(shù)據(jù),并在這些特征的基礎上,經(jīng)過綜合決策給出最終的口語評分結(jié)果。
信息化測試的有效實施需要具備軟件條件和硬件條件。硬件方面,學校建設大學生自主學習中心、語音實驗室、多媒體教室、“智慧教室”、考試機房等供學生學習、考試的硬件設備與區(qū)域;其次,建設安全流暢的校園局域網(wǎng)與供電設施,為信息化測試提供有效保障。軟件方面,實施信息化測試需要具備完善的考試系統(tǒng)。成熟的測試系統(tǒng)能夠一次性完成全部與考試相關(guān)的工作,包括考務管理、組卷、考試運行、閱卷、成績管理、成績分析、試卷管理等,測試系統(tǒng)在大學英語考試的實施過程中展現(xiàn)了科學、便捷、智慧的優(yōu)勢。建設有效的線上+線下教學與測試平臺,能夠在日常的教學與測試中發(fā)揮作用。例如清華學堂在線的“雨課堂”,能夠保障在線教學與線下課堂的實質(zhì)等效,同時也能夠在日常測試中發(fā)揮作用?!按髮W英語”慕課也是大學英語信息化測試的來源方式。除此之外,還有很多其他信息化軟件可以用來進行大學英語的測試。
信息化測試的實施過程主要包括測試管理、試題設計編寫、測試任務呈現(xiàn)、評閱、成績分析與報道。大學英語信息化測試管理主要體現(xiàn)在對測試平臺的試卷管理,學校有專門的管理員負責日常登錄測試平臺,查看學校是否有新的VPN、測試平臺能否正常使用、系統(tǒng)試卷是否保密等情況,以確保正式考試時可正常使用。此外,管理員負責與平臺公司聯(lián)絡,出現(xiàn)問題隨時溝通,并為公司提供方便,如提供遠程聯(lián)絡,方便技術(shù)人員維護平臺。管理員還負責創(chuàng)建教學班,并為所有學生和教師創(chuàng)建賬號,將任課教師與學生關(guān)聯(lián)后方便使用平臺,以及隨時為老師和學生修改登錄密碼等工作。
試題任務編寫是信息化測試的一個重要環(huán)節(jié),也就是在信息化測試之前將試題編寫出來并進行測試系統(tǒng)錄入。試題編寫以校本測試為基礎,內(nèi)容不僅要符合考試大綱,還要能夠測試出學生的英語能力。任課教師按照試題的類型、知識占比、章節(jié)、知識點、難易度等要求編寫考試題目;為保證考試效度,試題編寫完成后對所編寫題目進行審核與校對。接下來是將編寫的試題錄入測試系統(tǒng),根據(jù)系統(tǒng)設置按要求完成試卷上傳。有些測試系統(tǒng)也可實現(xiàn)批量上傳,例如,“訊飛AI題庫”可以批量導入題目,復制粘貼即可輕松識別題型與題干、選項要素等,實現(xiàn)校本題庫資源快速積累。試題任務編寫與上傳之后就基本完成了測試前的準備工作,下一步是測試任務的呈現(xiàn)。
測試任務呈現(xiàn)環(huán)節(jié)通過管理員對測試任務進行考試日期、考試時間、考試對象、考試場次、考試規(guī)則進行提前設置,在特定時間、特定場次呈現(xiàn)給學生進行試題作答。考試期間可通過電腦監(jiān)控當場考試并處理突發(fā)情況,如發(fā)布備用試卷、處理異常登錄情況、延長考試、提前結(jié)束考試等。對于參考人數(shù)多的“大學英語”課程,信息化考試不僅效率高,而且同場考試有多套試題,題目和選項可以自動異序,并可開啟防作弊設置,很好地避免了學生作弊,有利于端正考風和學風。
測試結(jié)束后是閱卷、成績分析與成績報道環(huán)節(jié)。智能測試平臺支持客觀題型和主觀題型的機器批閱,也可在機器評閱后進行人工復評。人工評閱可實現(xiàn)按卷按題評閱、匿名評閱、任意跳轉(zhuǎn)回評、實時查看已閱漏閱等功能。試卷評閱工作完成后,教師可下載提供成績總分和專項分的成績單,也可得到一份詳盡的成績報告,包含學院、班級之間的橫向?qū)Ρ群蛯m椉寄艿梅智闆r的詳細分析。此外,還有全面的試卷分析,提供多維度試卷、試題的分析報告,為教學反饋提供了很好的數(shù)據(jù)結(jié)果報告。
信息化測試的實施內(nèi)容包括形成性測試和終結(jié)性測試。通過信息技術(shù)進行的形成性測試體現(xiàn)了信息化測試的多樣性,涵蓋了對學生語言能力的技能測試,實現(xiàn)了教師對學生學習過程的有效監(jiān)管。例如,形成性測試采用課后“大學英語”慕課線上學習,慕課章節(jié)由任課教師通過“雨課堂”“智慧樹”等平臺定期發(fā)布,學生完成慕課中的章測試與總測試來取得成績。對于口語技能的訓練,可以通過諸如外延訊飛的“FIF口語訓練系統(tǒng)”進行測試。教師利用手機APP每周在口語訓練系統(tǒng)中布置訓練任務,系統(tǒng)會根據(jù)學生任務完成情況給出各項成績,從而實現(xiàn)對學生學習過程的實時監(jiān)督。除了口語技能的訓練,教師可采用其他信息化平臺完成對學生閱讀、聽力、寫作等技能的形成性測試與監(jiān)管。形成性測試的信息化模式幫助學生提高了自主學習能力,也極大地減輕了教師的工作壓力,同時建立了學生學習基本狀態(tài)數(shù)據(jù)常態(tài)監(jiān)測和反饋機制,促進了教與學的改進和提高。
利用信息技術(shù)進行的終結(jié)性測試是信息化測試的重要內(nèi)容。終結(jié)性測試是在每個學期末進行的大規(guī)模統(tǒng)一考試,傳統(tǒng)的終結(jié)性測試常常耗費大量的人力、物力、財力,信息化模式下的終結(jié)性測試不僅提高了考試效率,還節(jié)省了人員、時間,減少了資源消耗。信息化測試為大規(guī)模語言測試等終結(jié)性測試提供了便捷與高效。
評價與測試是“大學英語”課程體系的重要組成部分。通過運用現(xiàn)代信息技術(shù),教師可以精確量化掌握學生的學習效果,實現(xiàn)多角度、多維度的成績核算,及時反撥教學?!吨改稀罚?020版)提出,各高校應“建立科學的評價和測試體系,系統(tǒng)采集有關(guān)大學英語課程和大學生英語能力的信息,通過多維度綜合分析,判斷大學英語課程和大學生英語能力是否達到了規(guī)定的目標,并為大學英語課程的實施和管理提供有效反饋,實現(xiàn)大學英語教學質(zhì)量和大學生英語能力不斷提高的總體目標”[1]25?!按髮W英語”課程評價應開展學校內(nèi)部的自我評價,制定出符合本校評價標準的大學英語測評標準體系。不斷提高大學生英語應用能力是“大學英語”課程的教學目標,而英語應用能力測試的目標是構(gòu)建“形成性測試與終結(jié)性測試相結(jié)合”的綜合評價體系,采用多樣化測試方式,準確評價大學生英語能力水平,發(fā)揮測試對教學的正面導向作用,使之更好地為教學提供診斷和反饋信息?!稓W洲語言共同參考框架:學習、教學、評估》中把評估分為十三種不同的類型[2]178,校本大學英語測試常采用其中的知識評估與能力評估、平時測試與定期評估、形成性評估與終結(jié)性評估等評估方式相結(jié)合的綜合評價方式。信息化測試模式的應用能夠幫助教師細化考核方案,結(jié)合多種評估方式,實現(xiàn)成績的梯度考核,量化掌握學生的英語知識水平與應用能力。
知識評估“用于檢查特定的教學目標是否實現(xiàn),也就是對所教授的內(nèi)容進行效果測評。一般以周或月為單位,評估點包括教材、教學計劃等內(nèi)容”[2]178。知識評估主要圍繞所授課程內(nèi)容進行,教師常采用平時測試的形式進行,也是對學習過程的評價,包括所學的詞匯知識、語法知識、篇章知識、主題知識、綜合知識應用等。教師可利用信息化手段對所學知識點進行測試,信息化測試使對知識點的評估變得簡單易行。知識評估能隨時為教學提供反饋信息,使教師了解學生英語知識掌握的程度。
能力評估是對語言應用能力的評估?!芭c知識評估完全不同的是,能力評估主要測試學習者將其所知所能應用到實際生活的能力”[2]178。大學英語教學的目標是不斷提高大學生的英語應用能力,把課堂教授的知識應用到實踐中去。設計與知識內(nèi)容和主題思想相關(guān)的課堂小組報告,通過合作的形式在課堂上展示,并以此進行語言能力評估。例如上海外語教育出版社《新世紀大學英語綜合教程》第二冊,可根據(jù)各個單元的主題思想設計“我的夢,中國夢”“如何增強文化自信”“創(chuàng)新精神”等與主題相關(guān)的課堂小組報告,在匯報展示的同時,借助《中國英語能力等級量表》從語法知識運用能力、語音知識運用能力、詞匯知識運用能力、句法知識運用能力、銜接知識運用能力等方面劃分出不同等級,采用學生互評與教師評價相結(jié)合的方式評估小組成員的語言應用能力。
平時測試是“由教師,也可能是由學生進行的一種評估,內(nèi)容包括課堂上學生習得的語言能力、完成作業(yè)情況和教學計劃的進展等”[2]180,如布置作業(yè)、隨堂測試等,學生的最終成績能反映課程、學年和學期的整體教學效果。作業(yè)布置應根據(jù)課程標準與教學情況保證作業(yè)的層次、時效、多元與適度;隨堂測試針對聽、說、讀、寫、譯五個方面對學生課堂上習得的語言能力進行形式多樣的平時測試。聽力測試可通過聽錄音答題、聽廣播撰寫心得感悟,也可錄制視聽慕課并在慕課中設置相應的章測試、總測試,并按照慕課的教學計劃,使學生在線上自主學習的同時進行聽力測試等多種方式??陬^表達能力的平時測試可利用手機APP發(fā)布口語訓練任務,如“FIF口語訓練”有作業(yè)模式、測驗模式、考試模式、練習模式,教師根據(jù)需求從題庫中選取考試類、生活類、職業(yè)類、基礎技能類、新聞類、演講類、課程思政類試題創(chuàng)建并發(fā)布任務,通過信息技術(shù)輔助的口語訓練,幫助學生有效提高語言交際能力。閱讀能力與寫作能力的平時測試或作業(yè)完成也可以通過信息化手段進行。成熟的閱讀測試平臺可以從讀物難度和讀者閱讀能力兩個方面進行衡量,使用同一個度量標尺,讀者可以根據(jù)自己的閱讀能力,選擇適合自己的讀物。教師根據(jù)學生的閱讀能力與讀物難度定期布置閱讀任務,由此獲得學生的平時測試成績。寫作的信息化測評技術(shù)發(fā)展也日臻完善,大量的數(shù)據(jù)庫積累使信息化寫作廣泛用于各種類別與級別的競賽、測試,學生的日常寫作成績完全可以通過寫作類平臺進行。寫作平臺的智能批閱功能可以幫助老師安排更多、更有針對性的寫作任務,并通過系統(tǒng)了解班級學生的總體寫作水平,進行有針對性地講解與指導。同時,向?qū)W生提供及時、全面的批閱結(jié)果與診斷反饋,使學生全面了解自己英語寫作中的問題,及時改正錯誤。借助聽、說、讀、寫的信息化測試平臺,教師可以及時掌握學生各個方面的學習進度、學習能力和學習效果并適時得到學生的平時測試成績。
定期評估“通常在課程結(jié)束或在下階段課程開始時的某個特定日期進行”[2]180,教師可以通過定期評估掌握學生當下的學習狀況。定期評估在大學英語教學中以期中考試或期末考試的形式進行,教師通常在期中教學檢查期間進行一次期中測試,形式不限;在學期結(jié)束時進行全校統(tǒng)一安排的期末測試。定期評估可以保證教師按計劃完成課程大綱中規(guī)定的教學任務,但定期評估的內(nèi)容具有一定的難度和廣度,結(jié)果不理想容易使學生的自信心受到打擊。
形成性評價是對學生日常學習過程中的表現(xiàn)、所取得的成績以及所反映出的情感、態(tài)度、策略等,經(jīng)過持續(xù)觀察、記錄、反思而做出的發(fā)展性評價。形成性評估“是一個連續(xù)過程,有助于了解學習者的優(yōu)勢和不足之處”[2]181。2020版《指南》提出,各高校應加強教學過程中的形成性測試。形成性評價重視對學生學習過程的評估和評判,它通過多種渠道、多種方法收集、綜合和分析學生日常學習的信息,了解學生的知識、能力、興趣和需求,著眼于學生潛力的發(fā)展。教師可以通過形成性評價掌握學生的學習情況,并以此為依據(jù)調(diào)整課程教學;同時可以把評價結(jié)果反饋給學生,幫助學生形成個人發(fā)展預期和規(guī)劃,所以形成性評價“以改善學習為目標”,但學習者只有對形成性評價的反饋信息進行加工整理,才能產(chǎn)生正向效果。對反饋信息進行加工整理包括信息接收者積極主動地考慮信息、重視信息,并了解信息的形式;接收者不會淹沒于海量信息中,而是有辦法記錄、組織并掌握信息;同時能夠解讀信息,也就是說,接收者具備足夠的知識和意識,準確理解信息的具體含義,因而不會采取無效行為;最后接收者有時間、有目的地運用相關(guān)資源對信息進行思索、領(lǐng)會和記憶[2]181。
終結(jié)性評價是指在學期末、學年末或某一階段學習結(jié)束時為判斷教學效果對習得的知識進行的評價,目的是對學生階段性學習的質(zhì)量做出結(jié)論性評價,給學生下結(jié)論或打分排名。例如,單元考核、模塊考核、學期考核等都是對最終結(jié)果進行的終結(jié)性評價,是檢測學生綜合運用語言能力發(fā)展程度的重要途徑。以終結(jié)性評價為目的的學生能力測試主要采用標準化考試,包括升學或分級考試、學業(yè)測試(或稱為成績測試)、水平考試等[3]14-21。“不同目的的測試需要達到的測量精度不同,所采用的測量手段和方式也有所不同”。升學考試、學業(yè)測試、水平考試等終結(jié)性測試因?qū)y量內(nèi)容、信度、精度有不同要求,而產(chǎn)生測量的題型、匹配度、難度、考核維度等方面的相應變化[4]5。
校本“大學英語”課程的終結(jié)性評價或成績測試是在學期結(jié)束時進行的學期考核,主要考查學生對“大學英語”課程部分單元內(nèi)容知識和技能的掌握,因此測量內(nèi)容與教學要求的銜接和匹配較高。大學英語的終結(jié)性測試是大學英語能力綜合測試體系中重要的組成部分,關(guān)乎學生獎學金、學分績點、研究生推免等相關(guān)利益,因此備受學生重視。決定學生升學、畢業(yè)、就業(yè)等重大決策的終結(jié)性評價,都備受教育管理者、教師、學生及家長等利益相關(guān)者的關(guān)注。此類高風險考試對教學往往會產(chǎn)生強烈的反撥作用,評價標準甚至會成為事實上的教學要求。因此,終結(jié)性評價需要特別重視其對教學產(chǎn)生的反撥作用[4]6。
“大學英語”課程信息化測試模式確實具有一定的優(yōu)勢,但在實際應用中也存在著一些問題,這些問題在一定程度上影響了信息化測試特定作用的發(fā)揮??偟膩砜?,問題主要表現(xiàn)在三方面:
信息化測試主要依靠計算機與網(wǎng)絡完成,所有與考試相關(guān)的環(huán)節(jié)都離不開計算機,考試缺乏人與人之間的交流。如果在考試過程中出現(xiàn)了命題錯誤,教師無法及時通過網(wǎng)絡在計算機上修改問題,這樣就會影響學生正常答題。考試結(jié)束后的閱卷工作也主要通過軟件系統(tǒng)自動完成,教師在試卷命題時不得不考慮機閱的機械性和客觀性特點,造成試題答案的唯一性,對學生實際成績的有效獲得產(chǎn)生了一定的負面影響。此外,一旦考試中出現(xiàn)斷電、斷網(wǎng)、死機、中病毒、服務器故障、設置失誤等問題,考試將不得不中斷,可能造成考試延誤、試題泄露、試卷缺失、數(shù)據(jù)丟失等問題,極大地影響考試信度與效度。計算機考試運行中人為性的努力被限制在考試之外,考試因缺乏人性化而產(chǎn)生高風險性。
針對上述問題,教師應在命題環(huán)節(jié)做到保證試題的準確性,并通過試卷審核、紙質(zhì)校對、上機校對等多次校對過程及準備備份試卷的方式排除考試當中可能遇到的卷面問題;其次,可加大形成性評價的比例,采用多種形式、多個層面,全方位考核學生英語綜合應用能力,避免在終結(jié)性評價的計算機考試中造成學生成績的“一錘子買賣”;第三,在信息化測試平臺的使用過程中,通過使用方向產(chǎn)品方反饋使用過程中產(chǎn)生的問題與建議,產(chǎn)品方及時更新升級,完善測試系統(tǒng)等方法來改善信息化測試的不足之處。
目前,終結(jié)性考試仍然是大學英語測試中一個非常重要的環(huán)節(jié),測試題型中客觀多項選擇題占70%左右,這一題型雖然具有覆蓋面廣、評分客觀等優(yōu)勢,但存在很多弊端。Hughes(1989)給多項選擇題列出六大弊端:(1)只考對知識的識別能力,所以不能準確測量應試者的水平;(2)分數(shù)中的猜想成分可以很大而且不好確定;(3)嚴重限制了什么能考、什么不輕易考;(4)設計出好的題目極為困難;(5)反撥作用往往不好——這種考試不是提高言語水平的最佳途徑;(6)考試容易作弊[5]59-62。此外,對于ESP課程,如“中國文化英語、國際英語交流聽說、學術(shù)英語寫作”等課程在該“教什么”“怎么教”方面存在不足,不知道要培養(yǎng)學生什么樣的能力,也不知道要把他們的能力培養(yǎng)到什么程度。
解決測試目的定位偏差問題需要提升大學英語教師的測試素養(yǎng)。目前不少教師及考試管理人員的測試素養(yǎng)較低,對測試相關(guān)理論認識貧乏,對一些關(guān)鍵問題不清楚解決方法,例如:如何確定不同測試的不同命題要求、理解測試背后的教育理念、測試編制的步驟、題目編寫的基本原則和難度控制、測試質(zhì)量指標意義的理解和改進方法等。針對專門用途英語或?qū)W術(shù)類英語,在教學目標上還需根據(jù)《指南》確立此類課程的基礎目標、提高目標和發(fā)展目標,并參照《中國英語能力等級量表》對相關(guān)級別的能力描述,確立三個級別的能力總體描述和單項技能描述,根據(jù)三個級別的教學目標,結(jié)合學校、院系和學生的實際情況,確定具有本校特色的能力測試。
隨著網(wǎng)絡和科技的發(fā)展,微課、慕課、網(wǎng)絡學習盛行,但這些課程的難度和所適合的學生英語水平并不明確,學生自學動力不足,考核評價有難度。教師利用APP或?qū)W習平臺進行的一些測試在信度上要求不高,學生態(tài)度有差異,考核效度難衡量。此外,還存在考查內(nèi)容不全面、考試對教學的積極導向不足、沒有發(fā)揮出預期的教學效果等問題。
應加強師資隊伍的建設,立足校本創(chuàng)建有特色的品牌課程,合理增加課程難度,拓展課程深度,把“水課”轉(zhuǎn)變成有深度、有難度、有挑戰(zhàn)度的“金課”,讓學生不僅在課堂上學,還要在課下自己自主學。此外,還應增強測試的創(chuàng)新性和多樣化,提高測試質(zhì)量,充分發(fā)揮出測試的積極作用。
“大學英語”測評是大學英語教學中的重要環(huán)節(jié),信息化測試模式改革是信息技術(shù)高速發(fā)展的必然結(jié)果。以校本測試為基礎的信息化綜合測評模式對于提高廣大學生的學習積極性有著十分重要的作用。然而,“大學英語”測評的信息化構(gòu)建不是一蹴而就的,需要師生明確目的定位,解決好信息化測試的信度、效度和可行度等多方面的問題。