王翠蓮
摘 要:成就測驗用以測量經(jīng)過一段時間學習和訓練后取得的成就。教師自編測驗是成就測驗的一個分支,在我國的基礎教育中扮演著重要的角色。其測驗結果——考試成績?yōu)樵u價學生的學習效果和學校教育質(zhì)量提供了一個客觀的指標。但對考試成績的片面認識和過分追求會給學生的發(fā)展帶來很多消極影響?;诖耍ㄟ^剖析成就測驗的理論知識,幫助教師、家長和學生形成正確的成績觀很有必要。同時,在剖析的基礎上對看待考試成績及根據(jù)它提高教育質(zhì)量、培養(yǎng)學生能力提出了個人的見解。
關鍵詞:成就測驗;效度;標準參照測驗;常模參照測驗
中圖分類號:G424.74 文獻標志碼:A 文章編號:1001-7836(2014)03-0068-02
在基礎教育中,教師和家長往往以考試成績的高低評價學生的好壞。由于他們?nèi)狈y量方面的專業(yè)知識,導致他們過分地看重成績而忽視其他方面。這種把成績作為評價學生的唯一標準的做法給學生的成長帶來了極大的危害,也對我國人才的培養(yǎng)造成了一定的損失。因此,本文旨在通過詳細地介紹測量方面的知識,幫助老師、家長和學生形成正確的成績觀。
一、成就及成就測驗的含義
成就是個人通過學習和訓練獲得的知識、學識和技能[1]。測驗個體通過學習和訓練取得的成就的方法就是成就測驗[2]。在學校教育中,教師通過各種方法不斷向?qū)W生傳授知識和技能。但是怎樣才能評估教與學的過程中取得的效果呢?為了解決該問題,客觀地評價教育取得的效果,在學校教育過程中逐步形成了教師自編測驗,即為了測驗一段時期的教學效果,科任教師編制一份試卷,學校通過組織考試來考察學生的學習效果,最后把考試成績當作教與學過程中取得的效果的主要指標的方法。這種通過考試手段來衡量學習效果的方法其實質(zhì)就是成就測驗,旨在測驗學生在一段時間的學習和訓練后取得的成就。這種方法在我國有著久遠的歷史,比如我國古代的科舉考試就是其中之一。
二、成就測驗的分類
成就測量的分類標準不一,它的類別也多種多樣。根據(jù)分數(shù)解釋的參照標準不同,可以把它分為標準參照測驗和常模參照測驗。常模參照測驗關心的不是一個人的能力或知識的絕對水平,而是個體在群體的能力或知識連續(xù)體上的相對位置[2]。它關注的是被試之間測驗分數(shù)的差異,以最大限度地鑒別出被試間的差異為目的。測驗中個體分數(shù)高低是相對的,只有與他人比較后才能決定個體的優(yōu)劣。這種測驗在學校教育中最典型的表現(xiàn)就是對學生的考試成績進行排名。通過排名來確定學生在其所在群體中的位置。標準參照測驗只能判斷分數(shù)是否達到了某一規(guī)定的標準,而與他人的分數(shù)高低無關。其目的是測量被試對具體目標的掌握情況。這種測驗在學校教育中最典型的變現(xiàn)形式就是對考試成績劃分等級(比如優(yōu)秀、良好和及格等),確定學生對學習目標的掌握程度。
三、成就測驗的效度及其影響因素
成就測驗的目的就是測量個體對所學知識或技能的掌握情況。那么,能不能有效地測量出個體掌握的真實情況,這就涉及測量的效度問題。所謂效度就是指實際測量分數(shù)與個體真實水平的一致性程度。換句話說,就是測驗能夠測量它所欲測的特質(zhì)的程度[3]。在學校教育中,教師通常通過考試來衡量學生對知識的掌握情況,進而推斷學生的知識水平和能力。憑借考生成績來衡量學生知識水平和能力的準確程度就是效度。準確程度越高,效度越高,反之則越低。測驗效度受到很多因素的影響。
(一)測驗信度會影響到測量的效度
信度就是指多次測量同一特質(zhì)所得到的結果的一致性程度。它是測量效度的充分而不必要條件[4]。一個有高效度的測量必須以高信度為前提。但一個測量僅僅具備高信度無法保證測量結果的效度。除信度以外,測量效度還受其他因素的影響。
(二)測驗量表本身的質(zhì)量對測驗效度的影響
測量量表是用來測驗欲測量目標的工具。就學校組織的教師自編測驗而言,量表就相當于考試試卷。要有效地測量出所欲測量的目標,首先應該保證測量量表本身的質(zhì)量。第一,要選取合適的測驗項目。量表由很多項目組成,所選項目是否與欲測量的目標有關對測量效度有直接的影響。如果試題提供了額外的信息,選擇題的答案具有規(guī)律性這類的現(xiàn)象發(fā)生,都會降低測驗的效度。第二,測驗項目的難度控制。所選項目與欲測量的目標符合不能確保所選項目的絕對可靠性。因為測量項目的難度對測量效度也有影響。一般要求不同測量項目的難度呈正態(tài)分布(必要時可以根據(jù)測量目的加以調(diào)整)。如果難度過大會導致受測者作答困難,所有人分數(shù)都很低,從而出現(xiàn)“地板效應”。相反,如果測量項目過于簡單,會導致所有受測者都分數(shù)很高,出現(xiàn)“天花板效應”,這些都會影響測量的結果??傊?,只有適當?shù)乜刂茰y量項目的難度及其分布,才能提高測量的效度。
(三)施測過程及其他因素對測量效度的影響
測量過程對效度的影響也很重要。就教師自編測量而言,如果學生在測驗中作弊或不認真作答就會影響測量結果的真實性。此外,評分過程中不客觀因素或錯誤記分,測試的環(huán)境以及受測者個人的身心狀態(tài)都對測驗效度有一定的影響。在測量過程中,要盡量控制這些因素,盡量做到施測過程和評分等過程的標準化,才能更準確地測量出欲測量的目標。由于測驗效度受諸多因素的影響,而且受到技術等條件的限制,這些因素往往很難有效控制。所以,一個測驗往往不可能100%地測量出被試的真實水平。
四、成就測驗對評析考試成績的啟示
(一)不能片面地追求分數(shù),要關注學生的全面發(fā)展
在學校教育中,為了測驗學生在學習中取得的成就,往往采用教師自己編織的試卷來測量學生的學習情況。這種方式在統(tǒng)計學上叫做教師自編測驗,是成就測量的一種形式。由于受到技術水平和一些人為因素的限制,測驗試卷的編制、施測、分數(shù)分析方面很難做到標準化。加之測試對象與教育目標的復雜性、動態(tài)性以及各種測驗誤差因素的影響,測驗無論是在項目內(nèi)容、評判標準等方面,還是在測量的技術分析及測量理論等方面仍然存在著一些有待改進的地方。尤其在教師自編的測驗中,編制老師缺乏測驗編制方面的知識,加之自身水平限制,編制出的試卷往往信度和效度不高。由于受這些因素的影響,考試成績和個體取得的成就不是一一對應的。也就是說,僅用一兩次考試成績來確定學生的知識水平是不完全準確的。當然更不能因此而評價學生能力的高低,因為一個人的知識水平和能力也不是一一對應的,能力涉及到知識的應用及其更廣泛的維度。在這種情形下我們評析學生的考試成績時一定要慎重。作為教師、家長和學生本人都不能片面地追求高分,忽視其他方面的信息。還有,我們的教育目的是培養(yǎng)全面發(fā)展的社會主義建設者和接班人。在追求高分數(shù)的同時要注重學生在德、智、體、美、勞等各方面的全面發(fā)展。千萬不能因考試成績特別是文化課成績的高低肯定一些學生或否定一些學生。endprint
(二)結合“標準”和“常?!币约皩W生所處環(huán)境,更合理地評價學生
考試成績公布之后,很多學校會根據(jù)分數(shù)高低對學生進行排名。這種做法為客觀的評價學生提供了一個可行的標準。而且排名的方式定位學生在學校教育中可以營造出競爭的環(huán)境氛圍,進而激發(fā)學生的學習積極性,促進學生的學習主動性,達到提高教學效率的目標。但也會挫傷有些人的積極性。甚至會因為測驗過程中存在的一些額外因素造成測量效度的差異,出現(xiàn)排名不公平,對學生做出錯誤定位的現(xiàn)象。比如,學生A學習很好,考試過程中也很誠實。而學生B平時學習馬虎,但考試時作弊,導致排在A的前面。這種情況下會出現(xiàn)排名不公平,用排名衡量學生是不合理的。所以在分析考試成績時,我們一方面要參照常模,比較排名情況;另一方面也要參照標準,了解對知識掌握的絕對水平。這樣更能全面地了解學生對知識的掌握情況。此外,我們還要和學生過去的情況做縱向比較,了解學生的進步情況。一個排名靠后,成績并不優(yōu)秀的學生,如果在縱向比較中發(fā)現(xiàn)他一直進步,這也是一個值得表揚的學生。
(三)客觀地分析試題、測試環(huán)節(jié)和評分程序,科學地看待考試成績
成就測量量表本身編制難度很大,加之教師沒有學過專業(yè)的測量量表編制技術。教師自編的考試試卷中難免選擇不合適的題目。比如有些題目太簡單,絕大多數(shù)同學能夠完成,導致“天花板效應”。這種情況下,如果題目的形式是選擇題,那么猜測的可能性就很大,對考試成績的可靠性影響甚大;有些題目難度過大,很少同學能夠完成,這就導致地板效應。有時候編制的項目甚至不是教師想要測量的內(nèi)容。比如教師打算考察學生的數(shù)學應用能力,在編制題目時語言應用不太恰當引起題意理解困難,學生在答題的過程中讀不懂題目的要求,最后無法作答該題。很顯然,這種情況下學生不能順利解答該題是由閱讀理解能力差造成的,就無法考察學生的數(shù)學應用能力。還有很多因素影響著學生的最后考試成績。教師、家長和學生要在看到成績的同時認真地分析試題。結合考察的知識點和學生的成績,科學分析考試結果,從中總結教學過程中成功的經(jīng)驗,吸取教學過程中失敗的教訓。教師、家長和學生應該從考試成績中反省自己,適當改變教與學的方法。這樣才能從長遠的角度不斷提高教學質(zhì)量以及學生的知識水平和能力。
參考文獻:
[1]朱志賢.心理學大詞典:教育心理學部分[K].北京:北京師范大學出版社,1989:64-68
[2]馬惠霞,龔耀先.成就測驗及其應用[J].中國心理衛(wèi)生雜志,2003,17(1):60-62
[3]鄭日昌,吳九君.心理與教育測量[M].北京:人民教育出版社,2010:164-165
[4]杜林致.心理測量學[M].天津:南開大學出版社,2011:66-69.endprint