,
(大連外國語學(xué)院 英語學(xué)院,遼寧 大連 116044)
語言測試是語言學(xué)習(xí)成果的一種檢驗方式,是學(xué)習(xí)者的語言能力需要借助測試來檢驗。在我國,各種形式的英語考試表明英語測試在英語教育領(lǐng)域占據(jù)了相當大的市場。測試者與被測試者均投入了大量的時間和精力,但效果卻不盡如人意。這些現(xiàn)象引起了國內(nèi)英語教學(xué)工作者和測試研究方向的專家學(xué)者的關(guān)注,他們從各個不同的視角對測試進行了廣泛而深入的研究和探討(馬麗雅,2007)。
考察我國高校現(xiàn)行的學(xué)業(yè)評估方式可以發(fā)現(xiàn),大多數(shù)外語專業(yè)都把每學(xué)期的期中、期末考試作為主要的學(xué)業(yè)評估方式,而且都是以單一科目考試的形式出現(xiàn)的。這種傳統(tǒng)的學(xué)業(yè)評價方式能夠從一定程度上考查學(xué)生課程學(xué)習(xí)的效果,對授課教師教學(xué)也具有一定的反撥作用。但是,在多年的評估和測試實踐中,我們逐漸發(fā)現(xiàn)了傳統(tǒng)學(xué)業(yè)評價方式存在的一些弊端:
首先,傳統(tǒng)的評估模式,不能有效監(jiān)控學(xué)生平時的學(xué)習(xí)狀況,缺少對學(xué)生平時學(xué)習(xí)情況的反饋。傳統(tǒng)的英語專業(yè)評估,主要是采用期中、期末考試的形式,沒有把學(xué)生平時的課堂表現(xiàn)、平時的進步情況納入學(xué)生學(xué)業(yè)評價體系之中。期望通過期中和期末兩次大規(guī)??荚噥砣婵疾閷W(xué)生的學(xué)業(yè)水平是不現(xiàn)實的,也沒能對學(xué)生平時的學(xué)習(xí)起到督促和檢查的作用。集中進行期中期末考試,也使得學(xué)生產(chǎn)生了“平時不學(xué)習(xí),考前大突擊”的應(yīng)試模式,不能有效地指導(dǎo)學(xué)生在平時反思自己的學(xué)習(xí),沒能起到促進學(xué)生自主學(xué)習(xí)的作用。
其次,傳統(tǒng)的評估模式,不能客觀全面地反映學(xué)生的整體學(xué)業(yè)水平。每個學(xué)期通過組織兩次大規(guī)??荚?,完成對學(xué)生學(xué)習(xí)狀況的評估與評價是有失公允的。一方面,平時積極努力的學(xué)生很可能因一時的疏忽、精神面貌欠佳、睡眠不足等客觀原因,造成考試成績不佳的后果。另一方面,也會有部分學(xué)生平時很少學(xué)習(xí),考前突擊,最終獲得了較高的考試成績。
最后,期中和期末考試過于集中,科目過多,給教務(wù)部門、教學(xué)部門、教師評卷等造成諸多不便。
基于傳統(tǒng)評估模式的幾點不足,本研究通過對某外語院校英語專業(yè)兩個年級實施“平時多次考核+期末多科綜合水平測試”測試改革實踐,探討新的評估模式的可行性、學(xué)生認可度以及該評估模式對學(xué)生學(xué)習(xí)產(chǎn)生的主要影響和存在的主要問題。
形成性評價是旨在通過對日常表現(xiàn)的反饋,最終實現(xiàn)提高或加速學(xué)習(xí)作用的一種評估模式(Sadler,1998)。形成性評價是對學(xué)生日常學(xué)習(xí)過程中的表現(xiàn)、所取得的成績以及所反映出的情感、態(tài)度、策略等方面的發(fā)展作出的評價。也就是說,形成性評價關(guān)注的是學(xué)生知識、技能與態(tài)度的“形成”過程,它是基于對學(xué)生學(xué)習(xí)的全過程持續(xù)觀察、記錄、反思而作出的發(fā)展性評價。英國中等教育委員會(SEC)在20世紀80年代采用了“基于學(xué)校日常教學(xué)的評估”(school-based assessment),美、日、法等世界教育強國也已把形成性評價作為提高教學(xué)質(zhì)量的強有力手段(蘇鴻,2001),認為這種評價可以測量出“某些不能輕易或充分地從(終結(jié)性)試卷所獲得的學(xué)生的學(xué)業(yè)成績”(轉(zhuǎn)引自曹榮平,2004)。《大學(xué)英語課程教學(xué)要求》(2007)也明確指出:“形成性評價特別有利于對學(xué)生自主學(xué)習(xí)的過程進行有效監(jiān)控,在實施基于計算機和課堂的教學(xué)模式中尤為重要?!?/p>
從現(xiàn)有的文獻來看,英語專業(yè)的形成性評價模式的研究還處于探索和總結(jié)的階段。本研究也是基于形成性評價理論,嘗試性地對英語專業(yè)學(xué)生學(xué)業(yè)測試和評估進行改革,以期充實英語專業(yè)形成性評價模式的理論和實踐經(jīng)驗。本研究中的形成性評價模式實際上是吸取了以上多種評價模式的優(yōu)勢,通過整合而形成的一種可能適合英語專業(yè)學(xué)生特點的學(xué)業(yè)測試和形成性評價模式。
本項研究主要采用了測試、問卷調(diào)查和訪談等方法。測試的具體形式根據(jù)課型的不同有些許變化和調(diào)整,但都不脫離“平時多次考核+期末多科綜合水平測試”考核方式的總體設(shè)計。問卷調(diào)查主要在測試完成后,收集參與此次學(xué)業(yè)評估改革學(xué)生的反饋信息,為下一步改革的開展提供真實的數(shù)據(jù)。問卷主要由兩部分組成:第一部分主要涉及學(xué)生對評估模式改革的態(tài)度、改革產(chǎn)生的積極影響和消極影響;第二部分主要涉及新的評估模式的主要優(yōu)勢和不足。訪談獲得的數(shù)據(jù)是對問卷調(diào)查數(shù)據(jù)的補充,訪談的問題與問卷相似,研究者希望通過訪談獲得數(shù)據(jù)進一步佐證問卷調(diào)查的統(tǒng)計數(shù)據(jù)。
本項研究針對某外國語學(xué)院英語專業(yè)2008級(共264人)和2009級(共297人)兩個年級的全部學(xué)生共計561人采用了“平時多次考核+期末多科綜合水平測試”的考核方式。全部學(xué)生都參與了調(diào)查問卷的數(shù)據(jù)采集。
1)英語專業(yè)實施平時測評與語言水平測試相結(jié)合測評模式的可行性及學(xué)生認可程度;
2)英語專業(yè)實施平時測評與語言水平測試相結(jié)合測評對學(xué)生產(chǎn)生的主要影響;
3)英語專業(yè)實施平時測評與語言水平測試相結(jié)合測評過程中的主要問題與應(yīng)對策略。
表1 “平時多次考核+期末多科綜合水平測試”學(xué)業(yè)測評模式的構(gòu)成情況
本項研究在語言測試相關(guān)理論的基礎(chǔ)上,開創(chuàng)性地將高校英語專業(yè)現(xiàn)行的分科目的期末學(xué)業(yè)考試形式進行了改革。本研究主要是改變了原有的學(xué)業(yè)評估模式,即每學(xué)期的期中、期末考試作為主要學(xué)業(yè)評估方式,而且相關(guān)考試都是以單一科目考試的形式出現(xiàn)的。改革所采用的學(xué)業(yè)評估和測評模式是:平時測評與語言水平測試相結(jié)合的考核方式。其中,平時的多次考核為階段性的成就型測試(achievement test),主要考查和監(jiān)控學(xué)生的日常學(xué)習(xí)情況,期末多科綜合水平測試為能力測試(proficiency test),題型以英語專業(yè)四八級考試題型為主,主要考查學(xué)生的整體語言能力水平。相關(guān)科目采集綜合水平測試的相關(guān)部分成績作為該科目期末總評成績的一部分。例如,綜合英語為5次平時測驗占總評50%和一次期末英語水平測試的部分項目折合為總評成績的50%。而英語泛讀課程的評價模式是由一次課堂展示、一次課堂測試、一篇小論文和期末測試組成,各占總評成績的10%、20%、20%和50%,也就是說學(xué)生要作一次占總分10%的課堂展示,課堂測驗占20%,在日常學(xué)習(xí)中,寫1篇論文,占總分20%,而期末考試只占總評成績的50%。英語聽力課則通過4次平時的學(xué)業(yè)測驗積累總評的50%和一次期末英語水平測試的部分項目折合為總評成績的50%。
調(diào)查問卷中題目1為“這種平時多次考核+期末多科綜合水平測試的考核方式你是否喜歡?”學(xué)生通過選擇“非常喜歡、喜歡、無所謂和不喜歡”四個選項中的一項表明個人對現(xiàn)行評估模式的認可程度。通過對2009級和2008級學(xué)生的調(diào)查,獲得的統(tǒng)計數(shù)據(jù)如下(見表2):
表2 現(xiàn)行評估模式的學(xué)生認可度調(diào)查統(tǒng)計(1)
從以上數(shù)據(jù)可以看出,2009級的194名同學(xué)“非常喜歡”或“喜歡”現(xiàn)行的評估體系,占2009級被調(diào)查總數(shù)的65.3%。這說明一半以上的被調(diào)查者贊同現(xiàn)行的學(xué)業(yè)評估模式。僅有27名學(xué)生選擇了“不喜歡”,占調(diào)查總數(shù)的9%。
2008級的調(diào)查結(jié)果與2009級數(shù)據(jù)大體相當:選擇“非常喜歡”或“喜歡”選項的學(xué)生共計172人,占2008級被調(diào)查總數(shù)的65.2%。而選擇了“不喜歡”的選項的被調(diào)查者,占2008級被調(diào)查總數(shù)的11.4%。
總體看來,兩個年級的參與測試改革的學(xué)生都對現(xiàn)行的測試評估體系持支持態(tài)度。通過訪談我們發(fā)現(xiàn),不喜歡現(xiàn)行評估體系的被調(diào)查者主要提到了如下原因:首先,平時考試過于頻繁,會出現(xiàn)某一周有多科考試的情況;其次,平時測驗的公平度難于控制,考場秩序難于控制;最后,平時考試占用過多復(fù)習(xí)時間,只為了應(yīng)付平時考試而學(xué)習(xí),忽略了素質(zhì)的全面提高。
問卷調(diào)查的題目6也能從一個側(cè)面反映學(xué)生對現(xiàn)行評估模式的認可程度。題目是“你認為‘平時多次考核+期末多科綜合水平測試’的考核方式以后應(yīng)該堅持、堅持但需要改進、取消還是無所謂?”相關(guān)統(tǒng)計數(shù)據(jù)如下(見表3):
表3 現(xiàn)行評估模式的學(xué)生認可度調(diào)查統(tǒng)計(2)
從表3的統(tǒng)計數(shù)據(jù)可以看出,絕大多數(shù)學(xué)生都希望繼續(xù)沿用現(xiàn)行的評估體系。2009級的支持者達到97.6%,2008級的支持者達到93.2%,可以肯定地說,此項學(xué)業(yè)評估與測試改革得到了絕大多數(shù)被調(diào)查學(xué)生的支持。
但是不可否認的是單純選擇堅持現(xiàn)行評估模式的學(xué)生也不容忽視。為了更好地了解改進現(xiàn)有評估體系的具體方法,我們對部分參與此項改革的學(xué)生和教師進行了訪談。對改進現(xiàn)有評估體系的具體方法,將另辟章節(jié)詳細論述。
3.2.1 現(xiàn)行評估模式對學(xué)生學(xué)習(xí)產(chǎn)生的積極影響
為了了解現(xiàn)行的評估體系對學(xué)生產(chǎn)生了哪些積極影響,我們設(shè)計了開放性問題(問題2):這種“平時多次考核+期末多科綜合水平測試”的考核方式對你產(chǎn)生了哪些積極影響?希望通過被調(diào)查學(xué)生的回答,了解學(xué)生對測試改革效果的看法。
表4 現(xiàn)行評估模式的學(xué)生認可度調(diào)查統(tǒng)計(3)
表4即是被調(diào)查學(xué)生看法的匯總,主要得到了三個方面的積極影響,即督促平時學(xué)習(xí)、減輕期末壓力、保持學(xué)習(xí)熱情三個方面。數(shù)據(jù)顯示,現(xiàn)行的評估體系在監(jiān)督和督促學(xué)生平時復(fù)習(xí)和學(xué)習(xí)方面,的確達到了預(yù)期的效果。在訪談中,就有學(xué)生說:“為了能在綜合英語進行的小測驗中取得好成績,每兩三課就要全面復(fù)習(xí)一次。如果沒有平時的這些小測驗,可能就要等期末一起突擊復(fù)習(xí)了?!?/p>
另外,2009級和2008級分別有28.28%和26.52%的被調(diào)查學(xué)生認為現(xiàn)行評估體系能夠幫助學(xué)生有效“減輕期末壓力”。的確,這種“平時多次考核+期末多科綜合水平測試”的考核方式,正是將原來期末考試終結(jié)性評價的劣勢,最有效地轉(zhuǎn)化為平時多次考核的優(yōu)勢。平時的多次評估與測試,更能反映學(xué)生的日常學(xué)習(xí)情況,也有助于客觀公正地對學(xué)生學(xué)業(yè)水平作出評價和判斷。
3.2.2 現(xiàn)行評估模式對學(xué)生學(xué)習(xí)產(chǎn)生的消極影響
全新的測試與評估體系,在一定程度上不可避免地對學(xué)生產(chǎn)生了消極影響。通過對調(diào)查問卷中獲得數(shù)據(jù)的匯總統(tǒng)計,我們發(fā)現(xiàn),現(xiàn)行評估模式對學(xué)生學(xué)習(xí)產(chǎn)生的消極影響主要集中在以下四個方面(詳見表5):
表5 現(xiàn)行評估模式的學(xué)生認可度調(diào)查統(tǒng)計(4)
這里值得注意的是,2009級和2008級分別有139人和126人都將“過多測試產(chǎn)生焦慮與壓力”列為最主要的消極影響,比例接近全部被調(diào)查者的一半(兩個年級共計265人,占總數(shù)的47.2%)。評估和測試改革對學(xué)生造成的情感焦慮和壓力,是研究中在改革之初未曾預(yù)測到的。有的被調(diào)查者就提及:“在為測試做準備時感到很痛苦。此外,學(xué)生很少有時間聚在一起,并非所有學(xué)生都投入相等的精力準備課堂展示和課題項目。過于復(fù)雜會使內(nèi)向和害羞的同學(xué)落后,從而失去學(xué)習(xí)興趣。”如何有效地化解這些情感焦慮和壓力,成為我們進一步研究的主要對象。
另外,通過表5我們可以看出,2009級和2008級學(xué)生中,僅有46人(占兩個年級總?cè)藬?shù)的8.2%)認為現(xiàn)行的評估體系對學(xué)生的學(xué)習(xí)沒有產(chǎn)生任何消極影響。這說明,現(xiàn)行評估體系仍然會產(chǎn)生較多的消極影響,還有很多方面需要進一步完善,力求將消極影響降到最低,同時最大化的發(fā)揮這種形成性評估體系的優(yōu)勢。
由于此項研究的最終目的是探討適合英語專業(yè)學(xué)生、并能夠全面反映學(xué)生學(xué)業(yè)水平、有效監(jiān)控學(xué)生平時學(xué)習(xí)的學(xué)業(yè)評價模式,因此,考查現(xiàn)行評估與測試體系的優(yōu)缺點是很有必要的。
3.3.1 現(xiàn)行評估模式的優(yōu)點
表6呈現(xiàn)的便是現(xiàn)行評估模式的主要優(yōu)勢。其中,2009級和2008級分別有99人和74人認為現(xiàn)行的評估模式摒棄了傳統(tǒng)期末考試終結(jié)性評價的“一考定成績”的弊端,分別占兩個年級被調(diào)查者總數(shù)的33.33%和28.03%。另外,不少學(xué)生認為現(xiàn)行模式有“平時考查全面,便于客觀評價”、“督促平時學(xué)習(xí)”、“減輕期末復(fù)習(xí)壓力”和“夯實基礎(chǔ)”等主要優(yōu)勢。這恰恰證明了研究者在實驗開始前設(shè)想的,希望通過這種“平時多次考核+期末多科綜合水平測試”的模式實現(xiàn)“全面考查學(xué)生學(xué)業(yè)水平、監(jiān)督學(xué)生平時學(xué)習(xí)狀況、減輕期末復(fù)習(xí)壓力”的目的。通過問卷調(diào)查的數(shù)據(jù)(詳見表6)可以看出,研究者的這些初衷不同程度地得到了學(xué)生的認同。
表6 現(xiàn)行評估模式主要優(yōu)勢調(diào)查統(tǒng)計
根據(jù)對部分教師和學(xué)生的訪談,我們又得到了有關(guān)現(xiàn)行學(xué)業(yè)評估體系優(yōu)勢的其他信息。
1)將課堂展示納入評估體系,具有多方面優(yōu)勢。本次評估測試體系改革的課程中,都不同程度地將課堂展示作為評估體系的一個部分。在師生看來,學(xué)生在準備做課堂展示的時候,為了更好地理解內(nèi)容,學(xué)生通常需要準備足夠多的額外知識。這就督促學(xué)生查閱資料,并吸收、歸納和總結(jié)相關(guān)信息。這無形中訓(xùn)練和培養(yǎng)了學(xué)生收集資料并加工的能力,為他們提供了大量閱讀的機會。由于課堂展示通常以小組的形式進行,將課堂展示作為評估體系,也使得學(xué)生學(xué)會了合作學(xué)習(xí),增強了團隊的合作意識,提高學(xué)生交流與合作的能力。同時,對于課堂上的“聽眾”而言,他們能夠輕松地從課堂展示中學(xué)習(xí)相關(guān)知識,課堂展示使原本枯燥乏味的課堂變得生動有趣。
2)將寫作納入評估體系,有助于學(xué)生對知識的整體把握。通過訪談,研究者發(fā)現(xiàn),將寫作(即小論文)納入評估體系的作用十分明顯。因為寫作要求精心安排和邏輯思維能力,是顯示學(xué)生綜合能力的重要方面。學(xué)生從深入了解內(nèi)容的過程中受益良多,小論文的寫作為學(xué)生提供了發(fā)揮潛能的機會。有的學(xué)生表示“只要我能寫出一些內(nèi)容來,就可能會記住很長一段時間。通過查找相關(guān)資料,我也可能學(xué)到其他相關(guān)的很多知識。我也學(xué)會了如何把這些知識和信息進行整合?!?/p>
3)平時的持續(xù)監(jiān)測,有助于全面考查學(xué)生學(xué)業(yè)水平。很多被調(diào)查者都提到,由于平時的測試與期末考試同樣重要,他們都會非常認真地對待平時的測試和評估。這就有助于學(xué)生培養(yǎng)一種好的學(xué)習(xí)習(xí)慣?!罢n堂展示+平時測驗+小論文+口試”多種組合的評估模式,可以從說、讀、寫、譯多個方面對學(xué)生學(xué)業(yè)進行評估與評價。小測試可以幫助學(xué)生記住有用的詞匯和表達方式,是對課堂內(nèi)容的有效檢驗。課堂展示既培養(yǎng)了學(xué)生的團隊協(xié)作能力,又能有效監(jiān)控學(xué)生的口語能力發(fā)展狀況。
表7 現(xiàn)行評估模式的缺點調(diào)查統(tǒng)計
3.3.2 現(xiàn)行評估模式的缺點
針對現(xiàn)行評估模式的缺點和不足,被調(diào)查者提到了諸多需要改進的方面(詳見表7)。通過統(tǒng)計可以發(fā)現(xiàn),被調(diào)查學(xué)生認為現(xiàn)行評估模式的缺點主要為(以兩個年級的總數(shù)計):各科目平時測試過于集中(95人,16.9%);只注重書本知識,應(yīng)試為主,忽略綜合能力(112人,19.9%);考試紀律難以保證,難以實現(xiàn)考試公平(48人,8.6%);考試過于頻繁,影響新內(nèi)容預(yù)習(xí)(92人,16.4%);期末試題過難,題量過大(23人,4.1%);填寫其他缺點的為132人,占被調(diào)查總數(shù)的23.5%。
調(diào)查問卷顯示,“各科目平時測試過于集中”、“考試紀律難以保證”、“考試過于頻繁”等問題比較突出。如何將平時各科目的測試與評估合理分布?如何保證平時測試的考試紀律?如何在保證形成性評價效果的基礎(chǔ)上,合理設(shè)置考試數(shù)量?這些問題有待研究者深入研究。
針對調(diào)查問卷所反映的主要問題,我們對部分教師和學(xué)生進行了訪談。希望對現(xiàn)行學(xué)業(yè)評估模式中的主要問題作進一步研究。
1)平時考試過于頻繁,學(xué)生產(chǎn)生焦慮情緒,影響學(xué)生自學(xué)計劃的問題。
在訪談中,我們發(fā)現(xiàn)很多同學(xué)都提到平時的很多時間都是忙于準備平時的測試和考試,很少有機會按照自己的需要安排時間,也很難按照自己的需要學(xué)習(xí)想學(xué)的內(nèi)容。多數(shù)情況是,哪門課程要考試,就多關(guān)注哪門課程;老師要考什么,就學(xué)習(xí)什么。有個別訪談?wù)咛岬剑何颐刻旌孟窬褪菫榱丝荚嚩鴮W(xué)習(xí),生怕平時測驗的成績不理想,影響最后的總成績,所以心理壓力比較大。
針對這一問題,接受訪談的教師表示應(yīng)該更加合理地分配和安排平時測試的時間。例如,在學(xué)期初由教研室統(tǒng)一安排和調(diào)整全部課程的測驗時間,避免在某一周出現(xiàn)多科考試的情況。教師希望能夠?qū)⑺锌颇康钠綍r測試分散到各個教學(xué)周,這樣既有利于學(xué)生合理安排學(xué)習(xí)時間,也避免了某一周全部科目都考試情況的出現(xiàn)。
2)平時考試的考場紀律難于監(jiān)控,部分評估項目客觀性難于保證的問題。
在訪談中我們發(fā)現(xiàn),平時測驗的主要形式是隨堂筆試。但是,隨堂的筆試很難像大規(guī)??荚囈粯樱龅紸卷B卷座位混排。普遍的情況是按照大家上課的座位進行隨堂測試。這就造成部分學(xué)生相互抄襲情況的出現(xiàn)。另一方面,由于任課教師不同,同一次測試的測試時間很難安排在同一時間進行。這就給部分學(xué)生創(chuàng)造了可乘之機,他們可以提前向其他班級同學(xué)了解測試內(nèi)容,甚至提前獲得測試題答案。這使得我們很難保證平時測試的公正性。
另外,有的教師認為課堂展示的評價標準比較模糊,很多教師都是憑借個人的判斷給出總體印象分,因為沒有比較細化而且科學(xué)的評價標準。
針對以上問題,研究者認為除了應(yīng)該從思想上糾正學(xué)生的錯誤觀念之外,還應(yīng)該在平時隨堂測試的組織形式上有所改進。例如,同一門課程如果在不同時間進行測試,應(yīng)該將測試題目替換為同等難度的不同試題,而不應(yīng)當使用完全相同的測試題目。對于主觀性較強的課堂展示和小論文,需要統(tǒng)一各門課程的評估標注。例如,課堂展示的評分標準可以細化為內(nèi)容、邏輯性、語言、合作意識等幾個方面,爭取對學(xué)生作出客觀評價。
3)教師課堂授課時間有限及教師負擔過重的問題。
新的評價和評估模式也給授課教師帶來了一定的困擾。最突出的問題表現(xiàn)在課程內(nèi)容上。這些課程內(nèi)容的課時安排比較有限,每周僅有2學(xué)課授課時間。教師不得不加快進度來完成教學(xué)任務(wù),沒有更多的時間讓學(xué)生做課堂展示。接受訪談的教師就指出:“我必須在一堂課之內(nèi)講完一個章節(jié),而每一個章節(jié)中有太多的重要內(nèi)容和語法現(xiàn)象需要解釋。因此,如果我為學(xué)生提供討論和課堂展示的機會,我就不可能完成教學(xué)任務(wù)了。只能把展示這一環(huán)節(jié)留到學(xué)期末來完成,由幾個同學(xué)代表整個班級進行課堂展示。所以,我沒有辦法了解到每位同學(xué)在小組準備中的真實表現(xiàn),更別說他們的能力了。”其他的教師也提及“每個小組只有15分鐘的時間來表達想法時間未免太短了”。
另一個問題是新的學(xué)業(yè)評估模式給授課教師帶來了很大的作業(yè)批改壓力。例如,每位教師負責(zé)4—7個班級不等的授課任務(wù)。除了完成教學(xué)任務(wù)外,還要經(jīng)常性地給每個學(xué)生批改測驗題或是小論文,他們的工作量可想而知。接受訪談的一位老師就說到:“由于時間有限,我不可能仔細閱讀每個學(xué)生的作文,并且在讀完之后給予有效的反饋。有時我真的想從中挑取一些角度新穎、說服力強的文章作范文,有助于其他同學(xué)能力的提高??墒牵矣刑嗟囊?,所以也逐漸地對他們失去熱情。”其他的三位老師也同樣認為:在一個學(xué)期中,批改數(shù)目浩大的作文是很重的負擔。
對于教師提到的負擔過重問題,我們認為教師完全可以發(fā)動學(xué)生的力量。隨堂測試等包含客觀性試題的部分,并不需要教師親力親為,完全可以將測試題在班級內(nèi)部組間交換批改。但對小論文等需要評判的部分,則需要教師認真對待,細化標準,作出客觀公正的評判。
本項研究將英語專業(yè)學(xué)生的學(xué)業(yè)測試與評估手段作為主要的研究對象,經(jīng)過科學(xué)的實驗設(shè)計和數(shù)據(jù)統(tǒng)計分析,最終得出了如下結(jié)論:
1)本研究發(fā)現(xiàn)教師及學(xué)生對現(xiàn)行的學(xué)業(yè)評估模式總體上持支持態(tài)度。
研究數(shù)據(jù)表明:2009級的297名被調(diào)查者中,194名同學(xué)“非常喜歡”或“喜歡”現(xiàn)行的評估體系,占2009級被調(diào)查總數(shù)的65.3%。這說明一半以上的學(xué)生贊同現(xiàn)行的學(xué)業(yè)評估模式。2008級的調(diào)查結(jié)果與2009級數(shù)據(jù)大體相當:選擇“非常喜歡”或“喜歡”選項的被調(diào)查者共計172人,占2008級被調(diào)查總數(shù)的65.2%。這說明學(xué)生對現(xiàn)行的評估體系大體持支持的態(tài)度。同時,調(diào)查數(shù)據(jù)也顯示:大多數(shù)學(xué)生希望繼續(xù)沿用現(xiàn)行的評估體系。2009級的支持者達到97.6%,2008級的支持者達到93.2%,可以說,此項學(xué)業(yè)評估與測試改革得到了絕大多數(shù)被調(diào)查者的支持。
2)本研究總結(jié)了現(xiàn)有評價模式的三方面積極影響和四方面的消極影響。
通過調(diào)查問卷和訪談,我們總結(jié)了現(xiàn)行評估模式的三方面主要積極影響,即督促平時學(xué)習(xí)、減輕期末壓力、保持學(xué)習(xí)熱情三個方面。其中,2009級接受調(diào)查的297人中,有229人提及了現(xiàn)行評估體系有助于“督促平時學(xué)習(xí)”這一點,占到了被調(diào)查總數(shù)的77.1%;2008級的264人中,有77.65%的被調(diào)查者也提到了這一點。這說明,現(xiàn)行的評估體系在監(jiān)督和督促學(xué)生平時復(fù)習(xí)和學(xué)習(xí)方面,的確達到了預(yù)期的效果。
研究也發(fā)現(xiàn),現(xiàn)行評估模式對學(xué)生學(xué)習(xí)產(chǎn)生的消極影響主要集中在以下幾個方面:平時過多測試給學(xué)生帶來了情感焦慮與壓力、平時過多考試影響課余活動與自學(xué)計劃、部分同學(xué)主要是為了應(yīng)付考試而學(xué)習(xí)、期末考試沒有方向,缺少對課本整體把握四個方面。
3)本研究總結(jié)了現(xiàn)行評估模式的五點優(yōu)勢和五點不足。
接受調(diào)查的學(xué)生中,2009級和2008級分別有99人和74人認為現(xiàn)行的評估模式摒棄了傳統(tǒng)期末考試終結(jié)性評價的“一考定成績”的劣勢,分別占兩個年級被調(diào)查者總數(shù)的33.33%和28.03%。另外,被調(diào)查者分別提及了“平時考查全面,便于客觀評價”、“督促平時學(xué)習(xí)”、“減輕期末復(fù)習(xí)壓力”和“夯實基礎(chǔ)”等主要優(yōu)勢。
通過統(tǒng)計可以發(fā)現(xiàn),被調(diào)查者發(fā)現(xiàn)的現(xiàn)行評估模式的缺點主要為(以兩個年級的總數(shù)計):各科目平時測試過于集中(95人,16.9%);只注重書本知識,應(yīng)試為主,忽略綜合能力(112人,19.9%);考試紀律難以保證,難以實現(xiàn)考試公平(48人,8.6%);考試過于頻繁,影響新內(nèi)容預(yù)習(xí)(92人,16.4%);期末試題過難,題量過大(23人,4.1%);填寫其他缺點的為132人,占被調(diào)查總數(shù)的23.5%。
4)本研究提出現(xiàn)行評估模式的主要問題和解決方法。
針對問卷調(diào)查數(shù)據(jù)所反映的主要問題,我們對部分教師和學(xué)生進行了訪談,希望對現(xiàn)行學(xué)業(yè)評估模式中的主要問題進行進一步研究。(1)平時考試過于頻繁,學(xué)生產(chǎn)生焦慮情緒,影響學(xué)生自學(xué)計劃的問題;(2)平時考試的考場紀律難于監(jiān)控,部分評估項目客觀性難于保證的問題;(3)教師課堂授課時間有限及教師負擔過重的問題。研究者也針對這些問題,提出了相應(yīng)的嘗試性的解決方案。
[1]Knowles,M.How do you get people to be self-directed learners[J].Training &Development Journal,1980a(34):96-99.
[2]Knowles,M.Malcolm Knowles on The magic of contract learning[J].Training &Development Journal,1980b(34):76-77.
[3]Nicol,D.and Macfarlane-Dick D.Formative assessment and self-regulated learning: a model and seven principles of good feedback practice[J].Studies in Higher Education.2006,31(2):199-218.
[4]Sadler,D.R.Formative assessment:revisiting the territory[J].Assessment in Education,1998,5(1):77-84.
[5]曹榮平,張文霞,周燕.形成性評估在中國大學(xué)非英語專業(yè)英語寫作中的運用[J].外語教學(xué),2004(5):67-73.
[6]教育部高等教育司.大學(xué)英語課程教學(xué)要求[M].北京:外語教學(xué)與研究出版社,2007.
[7]韓寶成.語言測試的新進展:基于任務(wù)的語言測試[J].外語教學(xué)與研究,2003(5):352-358.
[8]劉津開.英語水平考試與教學(xué)評估[J].外語研究,2002(5):70-73.
[9]蘇鴻.國內(nèi)外索質(zhì)教育的基本理論與經(jīng)驗[M].北京:中國少年兒童出版社,2001.