高云
[摘 要]試卷分析不僅是檢驗教學成果、幫助提高教學質量的有效方法,而且是檢驗試卷本身科學性、合理性的必要步驟之一。對江西省龍南中學2017年高一下學期期末英語考試試卷進行的效度、信度、難度等方面的質量分析研究結果如下:該試卷測試了學生的能力水平,包括聽力、詞匯、語法、閱讀和寫作能力,信度和效度值相對較高;該試卷在選擇題的設計上存在問題,區(qū)分度不高;該試卷難易度比例恰當。
[關鍵詞]高中英語;期末試卷;質量分析
[中圖分類號] G633.41 [文獻標識碼] A [文章編號] 1674-6058(2018)22-0042-02
試卷分析不僅是檢驗教學成果、幫助提高教學質量的有效方法,而且是檢驗試卷本身科學性、合理性的必要步驟之一。本研究以智學網所提供的學生考試成績?yōu)閰⒖紨?shù)據(jù),對江西省龍南中學2017年高一下學期期末英語試卷進行效度分析。智學網為用戶提供更簡單易用的操作系統(tǒng)和全面完善的資源服務,通過大數(shù)據(jù)分析充分挖掘校園考試價值,通過基于云服務的PC及移動終端綜合方案為每一名教師和學生提供針對性教和個性化學的信息化環(huán)境與服務,進而有效保障了數(shù)據(jù)的精確性。研究數(shù)據(jù)是從參加考試的所有班級中隨機抽取的兩個班級學生的成績,研究對象為高一即將升入高二的學生,分析報告不僅為撰寫試卷分析提供參考,同時還為教師針對學生的實際能力水平做出相應調整提供了必要依據(jù),為接下來新學期學生對學過知識的查漏補缺以及新知識的學習做好準備。
一、研究設計
1.測試對象
本研究的受試是高一即將升入高二參加期末考試的學生,從高一年級所有班級中隨機抽取了兩個班級,共114名學生,所有學生都完成整套試卷的作答,因此本研究有效的試卷為114份 。
2.試卷構成及其評分
本次期末試卷結構見表1,本試卷卷面總分為150分,考試時間為120分鐘,總題量有81道,其中單項選擇題有60道,每題給出一定選項,要求選出與題意相符合的選項。答案要求涂在答題卡上,由機器統(tǒng)一閱卷。非選擇題有21道,其中客觀題有20道,主觀題有1道,一套試卷由一名教師批改打分。
二、試卷質量分析
1.效度分析
效度是指“一個測驗能測出預定要測量的事物的程度”,即試卷與測試目標一致的程度。(余冬梅,2010)該試卷采取一題一考點的方式檢查學生詞匯知識和理解能力,針對性強。教師可以及時準確地了解學生的掌握情況和教學效果。而且題目的選項上既有三個選擇項,也有四個選擇項和多個選擇項,這些單項選擇題完全體現(xiàn)了語言能力測試多維性的特征。同時,試卷是按照現(xiàn)代統(tǒng)計學正態(tài)分布原理按級隨機提取試題合成。以上這些都使該試卷具有較高的測試效度。
2.信度分析
考試信度是指考試結果反映考生實際水平的可信程度。計算考試信度的方法有很多種,多數(shù)方法對課程考試來說實施起來難以操作。因此,課程考試的信度測量方法一般采用克倫巴赫(Cronbach)的α系數(shù)法。α系數(shù)反映了試題間的一致性程度,具體做法是把測驗分成幾個部分,然后求各部分的一致性程度。計算公式為:α=n/(n -1)(1 -∑Si2/Sx2)。(馮忠良,伍新春,姚梅林,2000)式中α為信度系數(shù),Si為一組受考在一份試卷的項目i上的標準差,Sx為這組受考在該試卷總分上的標準差,n 為試卷項目的個數(shù)。(鄒申,2005)整套試卷的信度(Cronbach alpha)為 0.91,整套試題信度接近1。信度用來檢驗測試分數(shù)的一致性,表征著真分數(shù)和觀察分數(shù)變異性的比率。信度的范圍介于0到1之間,信度越接近1,表明試卷信度越好。(余冬梅,2010)另外,題量的多少是決定信度的一個重要因素,這份試卷由81道題構成,題量相對較多,很大程度上決定了測試結果的可靠性。從評分過程來看,固定答案的題目占題目總數(shù)的99%,并采用機器閱卷,因此,評分信度高。另一方面,Alderson認為有證據(jù)表明,參加多項選擇考試的學生能夠學習一些應試技巧使自己的分數(shù)“人工地”提高許多。(Alderson et al,2000)此外,Hughes給多項選擇列了六大弊端:第一,只考識別能力,所以不能準確測量應試者的水平;第二,分數(shù)中的猜測成分很大而且不好確定;第三,嚴重限制了什么能考、什么不易考;第四,設計出好的項目極為困難;第五,反撥作用往往不好——準備這種考試不是提高語言水平的最佳途徑;第六,考生作弊容易。(Hughes,2000)而選詞題、改錯題相對更高明,原因很簡單,如果我們不提供選擇項,識別考試就可變成提取考試。(Gleitman,1981)但是總的來說,這套期末英語測試卷的信度比較高。
3.難度分析
難度分析是試卷分析的重要組成部分。難度指數(shù)也許是準確地反映一道題目難易程度的唯一重要特征。對受試來說,太難或太易的題目都會顯示較低的信度。 題目難度是由答對的比例所決定的。難度公式是:P =∑Cr -N,P 是難度,即答對的比例,∑Cr 是答對的總數(shù),N是受試人數(shù)。難度越高,答對的比例就越少,答錯的比例就越高。因此,難易度與題目的實際難度成反比。也就是說,數(shù)值越小,難度越大。研究證明:難度范圍靠近0.5是最恰當?shù)?。研究證實,比較理想的做法是把題目的難易度控制在0.3~0.7之間,0.3以下表明試題偏難,0.7以上表明試題偏易。(余冬梅,2010)通過統(tǒng)計發(fā)現(xiàn),在60道選擇題中,難度指數(shù)在0.3~0.7之間的有44道題,占73.3%,難度適中。16道題的難度指數(shù)超過0.7,占26.7%,屬于偏易的題。數(shù)據(jù)表明:該份試題難易度多數(shù)控制在0.3~0.7之間,試卷難易度比例恰當。
本次試卷質量分析表明:第一,該試卷測試了考生多方面的能力水平,包括聽力、詞匯、語法、閱讀和寫作能力,其信度和效度值相對較高;第二,該試卷的客觀題設計有較大問題,主要是在答案項和干擾項的設計方面;第三,該試卷70%的題區(qū)分度不高,不能有效把高分組學生和低分組學生區(qū)分開;第四,該試卷中選擇題73.3 %難易度控制在0.3~0.7之間,難度適中,26.7 %的題目屬于偏易的題,整體而言試卷難易度比例恰當。
[ 參 考 文 獻 ]
[1] ALDERSON J C, CLAPHAM C, WALL D. Language Test Construction and Evaluation[M]. Cambridge: Cambridge University Press,1995.
[2] 余冬梅.一份英語詞匯試卷的效度分析[J].牡丹江教育學院學報,2010(5).
(責任編輯 周侯辰)