劉銘
【摘 要】學習外語的目的主要是為了更好地交流,寫作測試作為一種綜合性測試,不僅可以從詞匯、語法、用法等語言基本要素上測試學生,還能測試出學生的邏輯推理能力、語言表達能力、信息分析能力,以及對文體的掌握能力等等。然而,盡管寫作測試具有如此多的優(yōu)點,卻因為寫作測試的評分不客觀,造成信度較低,且不經(jīng)濟,所以寫作測試仍被許多人提出異議。因此,提高寫作測試的信度顯得十分必要,本文從題目設(shè)計與評分閱卷兩個角度出發(fā),對提高寫作測試的信度提供了可供借鑒的方法。
【關(guān)鍵詞】寫作測試;效度;信度;題目設(shè)計;評分閱卷
一、效度與信度
效度(validity),即有效性,是指測量工具或手段能夠準確測出所需測量的事物的程度。也就是說,效度是用來評價測量結(jié)果與測試者想考查的內(nèi)容相吻合的程度,二者成正比,測量結(jié)果與要考查的內(nèi)容越吻合,效度越大;反之,則效度越低。寫作測試的主要測試方法是讓被測試者寫一篇文章,它最大的優(yōu)點是效度高。因為寫作測試作為一種綜合性測試,不僅考查被測試者的輸出性技能(productive skill),即產(chǎn)出性技巧,學生利用自己所掌握的知識所生產(chǎn)出來的產(chǎn)品,還能考查他們的接收性技能(receptive skills),即學生已經(jīng)掌握的知識內(nèi)容以及能掌握的知識范圍;再者,寫作測試能同時測試語言的各個層次和范疇,不僅能測試被測試者的語法、用法和語法等外語語言學習者必須掌握的要素,還能測試出他們的語言表達能力、邏輯推理能力、語體掌握能力以及分析組織能力。一場考試只有測試出了測試者打算測試的內(nèi)容,才是一場有效的考試。在許多入學考試,諸如研究生入學考試中,一篇作文就足以看出被測試者的語言運用能力,其效度要比多項選擇題高得多。
信度(reliability),即可信度,是指測驗結(jié)果的穩(wěn)定性、可靠性和一致性,也就是說在測量信度時,要保持變量的唯一性,以檢測出這一測試的可靠程度。受主觀因素及外界因素影響越大,信度越低;反之,信度越高。作文測試作為一種主觀測試,不論從題目設(shè)計還是閱卷評分的層面,都無法客觀化,加之被測試者可以回避自己的弱勢,這也就造成了寫作測試信度較低的局面,以至許多測試將寫作測試排除在外。比如,對同一篇作文的評分,十個閱卷老師因各自評分標準的差異,就有可能造成他們十個截然不同的分數(shù)。再者,評閱老師在評分過程中也經(jīng)常受外界因素的影響,如,在一些大型考試中,閱卷老師被要求一天至少要評閱上百份試卷,此時,閱卷老師打出的分數(shù)更加沒有信度可言。通常說來,有效度一定有信度,而有信度不一定有效度。而在寫作測試中,因其是主管測試,故存在著較大爭議。為了解決這一問題,測試者需要從題目設(shè)計與閱卷評分等方面來思考。
二、題目設(shè)計
寫作測試分多種測試方式,如:單句寫作、組句成章、有指導的寫作以及文體測試。單句寫作屬于外語學習的第一階段,在一定程度上測試語法、句型和詞匯。單句測試可以最大程度提高寫作測試的信度,因為它能測出讓被測試者寫一篇文章無法測試出來的問題,即被測試者無法回避自己沒掌握的語法、詞匯及句法等,單句測試還屬于客觀性測試,方便閱卷的客觀性和方便性。為了提高可信度,在一些測試中測試者可以采用如例1中A句排列句子順序,主要考查語法結(jié)構(gòu);B句用括號內(nèi)詞語的正確形式填空,主要考查詞匯;C句改寫成否定式,主要考查句法,D句填寫劃線句子,考查邏輯思維能力:
例一:
A. for, solve, to, you, is, it, impossible, the, question
B. ______, he passed the exam. (luck)
C. He must have been there.
D. He was late for school, because __________________.
單句寫作只是外語學習的初級階段,學習者還需要組句成章,即將信息的次序進行排列,使文章行文自然,符合邏輯。為了提高信度,降低閱卷難度和經(jīng)濟消耗,測試者在設(shè)計題目時,可以給出選項,如例二可以直接讓被測試者寫出答案EDCAFB,也可以提供選項A.EDCFBA B.CAFBDE C.FECBAD D.EDCAFB:
例二:
A. For its sake, we are willing to sacrifice everything, clean air, pure water, good food, our health and the future of our children.
B. But as our technological achievements have grown in the last twenty, so pollution has become a serious problem.
C. We make “increasing industrialization” our chief aim.
D. The fact is that pollution is caused by man---by his desire for a modern way of life.
E. What can explain and solve this problem?
F. There is a constant flow of people from the country into the city, eager for the benefits of modern society.
組句成章還可以采用例三的測試方法,選擇三道四篇內(nèi)容相同,難度相當?shù)奈恼拢衙科牡谝痪浞旁诘谝唤M,第二句放在第二組,一次類推,讓考生從每一組中選出一個句子,組成一篇文章,這樣有利于考查考生的邏輯思維能力。
三、評分閱卷
寫作測試的評定方法有機械法、印象法和分析法,每一種方法的采用都要根據(jù)題目設(shè)計的實際來選擇。機械法,也叫計算錯誤發(fā),是指數(shù)出文章中的錯誤,按數(shù)目扣分,該方法的評分標準容易被掌握,但是卻忽視了寫作自身的優(yōu)勢,只注意到文章本身的語法、詞匯及句法等錯誤點,卻忽視了文章的邏輯與作者的思想表達。印象法是指評卷人根據(jù)自己對文章的總體印象給文章打一個總分,因為結(jié)果容易受到各種個人因素的影響,那么評分人能否一致的理解和掌握評分標準,是提高評分信度的關(guān)鍵。分析法是指閱卷人將作文分解成若干部分,按照一定標準,對每一部分進行評分,最后給出總分,為了提高信度,這就要求每一個評分員在評分前就有統(tǒng)一的標準。
參考文獻:
[1]蔡基剛,汪中平,英語網(wǎng)考的寫作效度和信度研究[J],外語界(3期),2009.
[2]馮瑞龍,朱宇,從寫作測驗信度研究看開放式測評的發(fā)展趨勢——概化理論的視角[J],海外華文教育(2期),2014.2.