屠煜
【摘要】漢語成績測試的編制既要反映它的診斷目的,也要遵循語言測試的一般原則,這就是重視試卷的信度和效度,它們是漢語成績測試質(zhì)量評估和檢驗(yàn)的指標(biāo)。文本通過闡述漢語成績測試的信度、效度以及二者之間的關(guān)系,說明如何提高漢語成績測試的質(zhì)量。
【關(guān)鍵詞】漢語成績測試信度效度
【中圖分類號】G642【文獻(xiàn)標(biāo)識碼】A 【文章編號】2095-3089(2014)2-0042-02
一、信度
信度即測試結(jié)果的可信程度,又稱為可靠性和穩(wěn)定性(劉潤清、韓寶成,2000)。亦即測量結(jié)果是否真實(shí)、客觀的反映實(shí)際水平,如果用某套試題對同一應(yīng)試者先后進(jìn)行兩次測試,結(jié)果第一次得85分,第二次得45分,結(jié)果的可靠性即信度就值得懷疑了。對成績測試來說,試卷的穩(wěn)定性除了可以保證達(dá)到同一分?jǐn)?shù)線的測試對象具有基本相同的水平以外,還可以反映教學(xué)的變化情況,如果這一屆學(xué)生的成績比上一屆普遍提高了,就說明教學(xué)質(zhì)量提高了;如果這-屆學(xué)生的成績比上一屆普遍降低了,就說明教學(xué)質(zhì)量降低了。
那么怎么知道一個(gè)漢語成績測試的信度情況呢?
(一)檢驗(yàn)信度的方法
1.再測法:這種方法是用同一套漢語成績測試試卷給同一批漢語學(xué)習(xí)者考兩次,比較兩次的漢語成績測試結(jié)果,求出相關(guān)系數(shù)。
2.復(fù)本法:根據(jù)復(fù)本考試結(jié)果的得分情況來計(jì)算二者之間的相關(guān)系數(shù),就可以判斷漢語成績測試的復(fù)本信度。
(二)提高信度的方法
1.適當(dāng)增加測試題目的數(shù)量:數(shù)量多則代表性就大,學(xué)生就不會說出這樣的話"老師,我會的你都沒出",既能提高信度,又可提高效度。但數(shù)量太多又操作困難,引起漢語考生的疲勞和反感,所以反而降低測試的可靠性。所以命題者應(yīng)該尋找一個(gè)合適的量,確定合適的題量。
2.測試的難度要適中:難度適中,則信度大,區(qū)分度也大。
3.測試的程序應(yīng)統(tǒng)一:測驗(yàn)的過程直接關(guān)系到信度的高低,信度需要規(guī)范公平的測驗(yàn)過程去保證。
4.測試的時(shí)間要充分:測驗(yàn)的時(shí)間如果不足,不能客觀反映學(xué)生的實(shí)際水平,也影響信度。
5.評分要盡量客觀、準(zhǔn)確:評分不準(zhǔn)確,必然降低信度。
二、效度
效度是指測量結(jié)果的準(zhǔn)確性和有效性的程度,亦即測量是否達(dá)到了預(yù)期的目的。換句話說,也就是測量是否精確地測量了想要測的東西,即測試結(jié)果與測試目標(biāo)的符合程度。
例如,如果要全面測量閱讀理解能力,就必須設(shè)計(jì)含有有關(guān)的漢字、詞匯、語法、文化、語用等方面的知識的綜合性閱讀試題,而不應(yīng)當(dāng)設(shè)計(jì)只含有某一兩個(gè)方面的知識的分立式試題。閱讀理解必須有-定的速度,因此卷面的長度必須與測試的時(shí)間相一致,如果卷面太短,就測不出閱讀速度。又如,測量閱讀理解能力只能設(shè)計(jì)測量閱讀能力的單項(xiàng)卷面,如果試卷上既有閱讀方面的試題,又有寫作方面的試題,就不能精確地測量出閱讀理解能力。閱讀理解既需要一定的語言知識,又需要一定的文化知識,如果文化知識太專,超過了多數(shù)測試對象的知識范圍,也達(dá)不到測試目的,因?yàn)殡y以判斷是語言能力方面的問題,還是文化能力方面的問題。
可以從以下三個(gè)方面理解效度:
1.一般而言,判斷效度的高低,就是判斷測驗(yàn)達(dá)到目的的程度。
2.測量結(jié)果真實(shí)、正確的反映被測對象的水平,則為效度較高或有效。
3.效度只是高與低的問題。
(一)效度的類型
在語言測試領(lǐng)域,根據(jù)漢語教師的客觀情況和實(shí)際需要,主要討論三種效度:內(nèi)容效度、表面效度、結(jié)構(gòu)效度。
1.內(nèi)容效度:是指漢語測試樣本體現(xiàn)整體的程度,也就是測量內(nèi)容的代表性程度。
2.表面效度:是指審題者個(gè)人,依據(jù)自己的漢語教學(xué)經(jīng)驗(yàn)和漢語理論修養(yǎng)以及對漢語成績測試的理解,對該漢語成績測試的有效程度的評估。
3.結(jié)構(gòu)效度:是指成績測試在多大程度上與語言學(xué)、第二語言學(xué)習(xí)和第二語言教學(xué)等理論相一致。
(二)提高效度的方法
1.精心編制題目和試卷:題目難易度、區(qū)分度要恰當(dāng),數(shù)量要適中。
2.嚴(yán)密組織和安排漢語測試:盡量減少無關(guān)因素對測試的干擾,為學(xué)生創(chuàng)造規(guī)范的應(yīng)試環(huán)境。
3.擴(kuò)充樣本的內(nèi)容和代表性:緊密圍繞教學(xué)大綱和教學(xué)目標(biāo)命題,考核內(nèi)容應(yīng)全面,并能有效代表學(xué)生應(yīng)掌握的知識領(lǐng)域。
三、信度與效度的關(guān)系
對漢語成績測試來說,測試的可靠與有效都很重要。信度和效度的基本關(guān)系是復(fù)雜的,他們既相互依存,又相互排斥。認(rèn)識二者之間的這種矛盾本質(zhì),有利于我們在編制漢語成績測試時(shí)更好地平衡和兼顧它們。
(一)相互依存
信度和效度二者之間是相互依存的。雖然具有一定的信度,并不一定有效,但沒有信度當(dāng)然就不可能有效度;而沒有效度,信度就毫無意義。要想效度高,信度就必須高。有高效度就一定有高信度,高信度不一定就有高效度。
(二)相互排斥
成績測試的信度和效度二者之間既是相互依存的,又是相互排斥的。因?yàn)?從信息的量與質(zhì)的矛盾來說,對量的測量容易保證信息的高信度,對質(zhì)的測量容易保證信息的高效度。但是量的測量要求被測的對象必須是可數(shù)的,以便用數(shù)字加數(shù)量單位來表示"(李筱菊,1997)。我們的漢語成績測試是測學(xué)生的漢語使用能力,這種能力表現(xiàn)為學(xué)生的漢語行為是無限的、不可數(shù)的,本質(zhì)上是不能用數(shù)字加數(shù)量單位來表示的。漢語成績測試要滿足信度,只有把測試設(shè)計(jì)為全部是定量型的,但這會影響效度;漢語成績測試要滿足效度,只有把測試設(shè)計(jì)為全部是定性型的,但這又會影響信度。由此可見,漢語成績測試的信度和效度也是一種矛盾的關(guān)系。
綜上所述,因?yàn)闇y試信度與效度之間存在的矛盾關(guān)系,需要我們在設(shè)計(jì)漢語成績測試時(shí)綜合平衡考慮效度、信度、可行性。在進(jìn)行具體的設(shè)計(jì)操作時(shí),可以采取直接測試與間接測試相結(jié)合的方法,用直接測試(如口試、作文)來提高漢語成績測試的效度,用間接測試(如多項(xiàng)選擇題)來提高漢語成績測試的信度,這樣才能逐步提高漢語成績測試的質(zhì)量。
參考文獻(xiàn):
[1]楊翼.對外漢語教學(xué)的成績測試[M].北京:北京大學(xué)出版社,2010
[2]楊翼.漢語教學(xué)評價(jià)[M].北京:北京大學(xué)出版社,2010