張 安
(山東大學(xué) 外國語學(xué)院,山東 濟(jì)南 250100)
?
國內(nèi)主要英語測試的效度研究綜述
張安
(山東大學(xué) 外國語學(xué)院,山東 濟(jì)南250100)
摘要:效度可以說是測試最重要的標(biāo)準(zhǔn),也是語言測試的基本出發(fā)點。通過回顧國內(nèi)外語類、教育類核心期刊近十五年刊載的關(guān)于國內(nèi)英語測試效度的文章,分析后發(fā)現(xiàn):(1) 高考英語的效度研究是一個相對的熱點;(2) 對四六級考試效度研究的數(shù)量少于高考;(3) 與專四考試題型的效度分析相比,專八考試的效度分析不夠全面。最后還就教師的教學(xué)與學(xué)生的學(xué)習(xí)等方面提出了建議。
關(guān)鍵詞:效度;英語測試;國內(nèi);綜述
一般而言,測試的各要素都有其適當(dāng)性,而測試效率把該適當(dāng)性稱之為一種衡量,旨在檢測事物的標(biāo)尺。[1]效度可以說是測試最重要的標(biāo)準(zhǔn),也是語言測試的基本出發(fā)點。[2]根據(jù)不同的分類標(biāo)準(zhǔn),效度可分為翻譯效度、效標(biāo)效度以及構(gòu)念效度。其中,翻譯效度又有表面效度與內(nèi)容效度之分。效度有其具體細(xì)分種類。近年來,許多學(xué)者對效度的研究頗感興趣,研究成果層出不窮。目前國外對語言測試效度的研究較為成熟,相比而言,國內(nèi)對此的研究正在不斷發(fā)展的過程中,由于英語學(xué)習(xí)在國內(nèi)越來越受到重視,所以,國內(nèi)英語測試的重要性也得以凸顯。因此,有必要回顧關(guān)于國內(nèi)英語測試效度的研究,以分析優(yōu)勢和不足,啟發(fā)教學(xué)。
一文獻(xiàn)的選擇
作者在中國知網(wǎng)鍵入關(guān)鍵詞“英語測試效度”“效度分析與測試”,有效篩選出相關(guān)文章,它們均刊登在國內(nèi)外語類和教育類核心期刊。上述刊物在國內(nèi)較權(quán)威,且具有代表性,它們在英語測試效度方面的研究成果,可以很好地體現(xiàn)此方面研究的趨勢。
二國內(nèi)主要英語測試的效度研究回顧
本文對國內(nèi)主要的英語測試效度研究進(jìn)行了回顧,涉及到的主要英語測試有:高考英語、四六級、專四專八考試。
1.高考英語效度研究。
下表體現(xiàn)的是1998-2015年期間,每年發(fā)表的文獻(xiàn)數(shù)量??砂l(fā)現(xiàn):從2007年以后,文獻(xiàn)數(shù)量變多,對此方面的研究逐步發(fā)展。
表1 高考英語效度研究數(shù)量(1998-2015年)
從細(xì)節(jié)來看,對此方面較早的研究始于1998年,內(nèi)容是對當(dāng)年高考英語試題的完形填空部分進(jìn)行考點效度的分析。[3]2005年的一篇文獻(xiàn)也分析了高考英語完形填空的考點效度, 但與1998年的研究不同之處在于,2005年的研究對1998-2004年期間的高考題目做了統(tǒng)計分析,探討了影響考點效度的因素。[4]因此,2005年的研究比1998年更注重實用性。2009年的研究與之前不同,其比較了高考英語和雅思考試在閱讀部分的效度,分析得出:雅思考試的內(nèi)容效度優(yōu)于高考。[5]2013年研究更為具體,通過運用讀者變量和語篇變量,文章發(fā)現(xiàn):上海英語高考試題的內(nèi)容效度正逐年變好。[6]2015年的研究較之前更加創(chuàng)新,韓寶成和張允提出了“任務(wù)—能力”設(shè)計框架并分析內(nèi)容效度,[7]而張春青則運用Rasch模型和Winsteps軟件分析了廣東高考英語語法填空題的構(gòu)念效度。[8]
下表是對上述研究的總結(jié),它表明:2005年之前,研究重點是效度的某方面,而從2007-2010年,重點開始轉(zhuǎn)向整體效度的研究,但對內(nèi)容效度的研究一直熱度不減,而對結(jié)構(gòu)效度的研究正在逐步發(fā)展。
表2 不同年份效度研究的不同內(nèi)容(1998-2015年)
下圖顯示的是上述文獻(xiàn)對不同題型的效度分析,可以發(fā)現(xiàn):對高考英語全部題型的效度分析占最大比例,其次較多的是閱讀部分。未來的研究可注重聽力、寫作等部分的效度分析。
圖1 對高考英語各題型效度分析的餅圖
2.大學(xué)英語四六級效度研究。
下表顯示了這些文章分布的不同年份。它們大致分布比較平均,每年約1-2篇,最近的研究是在2011年,其研究熱度不如對高考效度的研究。
表3 大學(xué)英語四六級效度研究數(shù)量
在這方面,較早的研究是在1998年,其運用了內(nèi)省法分析大學(xué)英語四六級考試中閱讀理解的效度,并得出結(jié)論:該部分能有效確保語言測試的效度。[9]該研究為后來的研究奠定了基礎(chǔ)。隨后,2005年,一篇文章選取了較為新穎的視角,分析了基于計算機(jī)的口語水平測試和面對面口語測試的效度,發(fā)現(xiàn)前者效度要好于后者。[10]2009年的研究類型與之前有所不同,它回顧了之前對四六級的研究,提出需要把四六級的效度和信度結(jié)合起來考慮。[11]而此方面最新的研究是關(guān)于四級考試完形填空部分的內(nèi)容效度,運用語料庫提高干擾選項的效度,可提升此部分的效度。[12]
對大學(xué)英語四六級考試效度的分析,多是基于整體效度層面,而對不同效度分類的分析較少,下面的餅圖體現(xiàn)了對不同效度分類的分析比例。所以,今后在此方面的研究可側(cè)重對試題的各類效度的分析,如構(gòu)念效度、效標(biāo)效度等。
圖2 對大學(xué)英語四六級考試各類效度分析的餅圖
3.專四、專八考試效度分析。
下表統(tǒng)計了文章發(fā)表的數(shù)量和對應(yīng)的年份。可以發(fā)現(xiàn),在此方面的研究時間和數(shù)量均不及上述兩方面。因此,專四、專八考試的效度研究有待發(fā)展。
表4 專四、專八考試效度研究數(shù)量
對專四考試的效度分析,題型主要涉及口試和閱讀理解。較早的研究基于專四考試的理念、標(biāo)準(zhǔn),分析了口試的表面效度和內(nèi)容效度,得出這兩方面效度均不錯。[13]對專四口試的效度分析,從某一效度發(fā)展到整體效度,研究視角日益綜合。在閱讀方面,楊衛(wèi)健運用了調(diào)查問卷,發(fā)現(xiàn)大部分閱讀題整體效度好,但個別題目效度不佳。[14]
對專八考試的研究數(shù)量比專四少,僅有兩篇文章。其中一篇文章探討了專八考試獨有的人文知識題目的內(nèi)容效度,其區(qū)分度和內(nèi)容效度均不好,建議改變題型。[15]另一篇文章則是分析了專八寫作題的理論效度,建議提高其理論效度。[16]
通過比較對專四和專八考試的研究,發(fā)現(xiàn)有如下不同點:1. 對專八考試題型的效度分析數(shù)量較少,不夠全面;2. 對專八效度的研究熱度不及專四;3.對專八效度的研究均具體到各個題型,較專四的視角更具體。因此,之后效度的研究可多關(guān)注專八,分析專八整體命題的效度。同時,研究專四、專八可選取其他效度類型的視角,以實現(xiàn)研究更加全面。
三結(jié)語
本文回顧并探討分析了關(guān)于國內(nèi)主要英語測試效度研究的文章,以下是主要的結(jié)論。
1. 高考英語的效度研究是一個相對的熱點,研究數(shù)量最多,研究范圍較廣,研究的發(fā)展較成熟。今后的研究也會保持研究熱度,最新的研究視角是關(guān)于構(gòu)念效度的研究。
2. 對四六級的效度研究熱度不及高考,近年來呈減退趨勢,且很少關(guān)注具體題型的某一效度。今后可加強(qiáng)在此方面的研究。
3. 對專四、專八考試效度的研究晚于上述兩方面,研究數(shù)量較少。其中,對專八的研究不及專四,數(shù)量較少、范圍較窄。所以,今后的研究可側(cè)重于對專八各類題型的各種效度的分析。此外,可多關(guān)注另外的英語測試,如:高中英語入學(xué)考試、社會上的其他英語考試等。
基于上述結(jié)論,本文提出對今后教師教學(xué)與學(xué)生學(xué)習(xí)的啟示。首先,教師要系統(tǒng)學(xué)習(xí)關(guān)于語言測試的基本理論,理論聯(lián)系實際,真正運用到實際教學(xué)之中。其次,教師應(yīng)重視學(xué)生實際運用語言的能力,引導(dǎo)學(xué)生關(guān)注實際語境。然后,學(xué)生在課后練習(xí)時,應(yīng)選擇樣題或真題,確保較高的測試效度,可查缺補(bǔ)漏,不斷完善自己。
參考文獻(xiàn)
[1]Henning, G.AGuidetoLanguageTesting[M]. Cambridge, Mass.: Newbury House, 1987.
[2]劉美華. 高考英語閱讀理解題型分析與解題方略[J]. 現(xiàn)代中小學(xué)教育,2007(2): 39-40.
[3]周長銀.98年高考英語完形填空題的考點效度分析[J]. 外語與外語教學(xué), 1999(4): 32-34.
[4]聶建中, 趙秀紅. 高考英語完形填空的考點效度分析[J].教育理論與實踐, 2005(6): 54-56.
[5]李鑫, 修旭東.雅思和我國高考英語閱讀測試題型的對比[J].解放軍外國語學(xué)院學(xué)報, 2009(5): 60-64.
[6]徐良, 鄒申. 高考英語(上海卷)語法評價模式的對比分析與思考[J]. 外語電化教學(xué), 2013(6): 11-16.
[7]韓寶成, 張允. 高考英語測試目標(biāo)和內(nèi)容設(shè)置框架探討[J].外語教學(xué)與研究, 2015,47(3): 426-436.
[8]張春青. 高考英語語法填空題構(gòu)念效度的 Rasch 模型分析[J].現(xiàn)代外語,2015,38(2): 258.
[9]金艷, 吳江. 以 “內(nèi)省” 法檢驗 CET 閱讀理解測試的效度[J].外語界, 1998, 2(3): 23-25.
[10]蔡基剛. 大學(xué)英語四, 六級計算機(jī)口語測試效度, 信度和可操作性研究[J].外語界,2005(4): 66-75.
[11]蔡基剛, 汪中平. 英語網(wǎng)考的寫作效度和信度研究[J]. 外語界, 2009(3): 52-58.
[12]穆惠峰. 基于語料庫的大學(xué)英語四級完型填空測試內(nèi)容效度驗證研究[J].外語電化教學(xué), 2011(4): 66-70.
[13]黃永紅. 英語專業(yè)四級口語測試的信度和效度[J].外語研究, 2006(3): 36-38.
[14]楊衛(wèi)健. 英語專業(yè)四級考試閱讀理解測試的答題效度驗證[J].外語教學(xué), 2011(6): 53-56.
[15]汪順玉,劉世英.英語專業(yè)八級考試人文知識部分測驗效度分析[J].外語教學(xué),2007, 28(5): 35-39.
[16]修旭東. 我國高校英語專業(yè)八級測試寫作項目的理論效度檢驗研究[J].外語教學(xué)與研究: 外國語文雙月刊,2008, 40(6): 447-453.
Class No.:H310.42Document Mark:A
(責(zé)任編輯:鄭英玲)
Review of Research on Validity of English Language Tests in China
Zhang An
(School of Foreign Languages and Literature,Shandong University,Ji’nan,Shandong 250100,China)
Abstract:Validity is arguably the most important criterion of a test and a basic starting point of a language test. It collects and reviews articles from major linguistic journals on the aspect of validity of major English language tests in China. Conclusions can be drawn: 1) Research on NMET (National Matriculation English Test) is a relatively hot spot among the above four aspects. 2) Studies on validity of CET (College English Test) are not so hot. 3) The analysis of validity of TEM8 (Test for English Majors) is less comprehensive than that of TEM4. Besides, implications for both teachers and students are also provided.
Key words:validity; English language tests; China; review
作者簡介:張安,在讀碩士,山東大學(xué)。
文章編號:1672-6758(2016)07-0094-3
中圖分類號:H310.42
文獻(xiàn)標(biāo)識碼:A