【摘要】語言測試是檢驗應(yīng)試者語言水平的重要手段。效度的高低是衡量語言測試最重要的指標(biāo)。構(gòu)念效度研究又處于效度研究的核心地位,也是測驗代表語言學(xué)習(xí)基本理論程度的指標(biāo)。本文主要從語言測試的角度闡述構(gòu)念效度的概念以及影響構(gòu)念效度的因素。
【關(guān)鍵詞】效度 構(gòu)念效度 語言測試
【基金項目】2015年黑龍江大學(xué)研究生創(chuàng)新科研項目,“基于社會建構(gòu)主義理論的本科翻譯專業(yè)教學(xué)模式研究” 項目編號:YJSCX2016-012HLJU,本項目由“黑龍江省外語教育學(xué)術(shù)交流研究基地”資助。
【中圖分類號】G64 【文獻(xiàn)標(biāo)識碼】A 【文章編號】2095-3089(2016)08-0025-02
1.引言
語言測試是檢驗應(yīng)試者語言水平的重要手段。效度指測試是否考查了設(shè)計者想要考查的內(nèi)容,或者說在多大程度上考查了想要考查的內(nèi)容,效度的高低是衡量語言測試最重要的指標(biāo),它是語言測試的基本出發(fā)點。什么是構(gòu)念效度?影響構(gòu)念效度最常見的因素有哪些?
2.構(gòu)念效度及影響因素
2.1構(gòu)念效度
在教育測量領(lǐng)域,內(nèi)容效度、準(zhǔn)則關(guān)聯(lián)效度和構(gòu)念效度這三種類型效度都是作為整體構(gòu)念效度的不同方面。語言測試者認(rèn)為這種把構(gòu)念效度作為整體觀點是一種新的發(fā)展。理論界對構(gòu)念(construct)的定義有不同的看法,因此,通過識別他們是如何解釋應(yīng)答一致性來定義構(gòu)念(Messick 1981) 。Loevinger(1957:636)最早提出要把構(gòu)念效度作為整體效度來看待。在80 年代, 這一觀點逐漸得到人們的認(rèn)同: 構(gòu)念效度不再作為效度的一種證據(jù),而應(yīng)包括內(nèi)容和標(biāo)準(zhǔn)證據(jù)、信度及其它與理論驗證有關(guān)的方法 (Messick 1989; Anastasi 1986)。一些測量學(xué)家主張把構(gòu)念效度作為惟一的效度概念(Cronbach1988; Anastasi 1988; Messick 1988, 1989)。
2.2 影響因素
根據(jù)Brown (1996:188-192)指出影響信度的五種類別問題是由于測試環(huán)境、管理程序、考生、評分過程和測試結(jié)構(gòu)造成的。造成效度問題的因素是可能是由于缺乏項目數(shù)量、項目編寫、對測試的引導(dǎo)、項目分析過程、可靠性研究以及效度分析等造成。
影響構(gòu)念效度的因素有很多,主要分為“構(gòu)念代表不足”(construct under-representation)和“構(gòu)念無關(guān)方差”(construct irrelevant variance)兩類。在教育領(lǐng)域中進(jìn)行評估的時候,我們總是會考慮到真實性(authenticity)和直接性(directness),因為它們對教與學(xué)產(chǎn)生積極的效果(Resnick and Resnick,1991)。同樣,真實性和直接性也構(gòu)成了效度的兩個標(biāo)準(zhǔn)(Messick,1996:243)。在對真實性進(jìn)行測量的時候最重要的是一定要考慮到構(gòu)念的評估(Messick,1994),這是最小構(gòu)念代表不足的效度標(biāo)準(zhǔn)。然而,盡管真實性暗示了最小構(gòu)念代表不足,但是確是不可觀測的。直接性評估涉及的往往是開放式任務(wù),這樣做的目的也是使應(yīng)試者行為不受限制,這個就與構(gòu)念無關(guān)方差相關(guān)。因此,再考慮到直接性的測量問題時就是不要加上任何不相關(guān)因素或是污染了構(gòu)念評估(Messick,1994)。構(gòu)念代表不足體現(xiàn)在是否對測試真實性構(gòu)成威脅,而構(gòu)念無關(guān)方差體現(xiàn)在對測試直接性的威脅。
構(gòu)念代表不足指測量指操作或測量方式未能涵蓋該構(gòu)念的全部層面,即不能代表構(gòu)念所包含的某些種類的內(nèi)容、所負(fù)載的某些心理過程,或者是排除了應(yīng)有的某些方式的反應(yīng)(Messick,1989、1995),因而會對測試分?jǐn)?shù)的解釋會產(chǎn)生不良影響。某一測試如果構(gòu)念體現(xiàn)不足,那么該測試就沒有涵蓋相關(guān)構(gòu)念的若干重要方面,也可以說構(gòu)念體現(xiàn)的范圍太窄了。構(gòu)念無關(guān)方差指測試包含與擬測構(gòu)念無關(guān)的、額外并且相對穩(wěn)定的因素。此時,測試的構(gòu)念比擬測的構(gòu)念更寬泛,因為測試己經(jīng)包括了其他構(gòu)念或者測量方法因素的影響,測試分?jǐn)?shù)可能受到這些因素的影響而在某種程度上系統(tǒng)地波動。與擬測構(gòu)念無關(guān)的因素會導(dǎo)致測試構(gòu)念無效,成為測量偏差的主要來源。這會影響到對考試分?jǐn)?shù)的解釋,會對測試的構(gòu)念效度產(chǎn)生負(fù)面影響。這兩方面在所有的評估中都是存在的。然而,在測試的效度中,最重要的問題就是要搜集足夠多的有說服力的證據(jù)來反駁對效度構(gòu)成威脅的兩個因素。
3.結(jié)語
構(gòu)念效度驗證研究測試所測量的能力,為測試提供理論基礎(chǔ)。效度檢驗的過程是一個假設(shè)檢驗的過程。它同時也是一個持續(xù)不斷的研究過程。因此我們要更好地了解影響構(gòu)念效度的主要因素。
參考文獻(xiàn):
[1]APA. 1966. Standards for Educational and Psychological Tests and Manuals [M]. Washington, DC: Author.
[2]Messick, S. 1996. Validity and washback in language testing [J]. Language Testing 13( 3): 241-56.
作者簡介:
王天予(1989-),女,黑龍江伊春人,博士在讀,研究方向:語言測試,翻譯教學(xué)。