田許匣
摘 要: 科學(xué)正確的試卷分析能夠?yàn)榻虒W(xué)及學(xué)習(xí)提供有意義的反饋,并能在很大程度上提高教學(xué)質(zhì)量。本文綜合介紹了外語試卷信度、效度、難度、區(qū)分度四個維度的分析過程及學(xué)生考試成績的分析方法,以期對英語教師的教學(xué)及測試工作起到指導(dǎo)作用。
關(guān)鍵詞: 外語試卷 四維度分析過程 成績分析方法
引言
語言教學(xué)是第一性的,測試為教學(xué)服務(wù),在我國,語言教學(xué)已引起足夠的重視,但對于語言測試分析,一些教師并沒有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學(xué)。本文主要從語言測試?yán)碚摰陌l(fā)展,外語測試四維度分析過程及方法,以及學(xué)生成績分析方法等方面,具體闡述了外語測試全方位分析方法。
1.語言測試?yán)碚摪l(fā)展
著名語言學(xué)家戴維斯(1968)曾說“好的測試就如同一個忠實(shí)的仆人”,這個比喻形象地說明了測試是為教學(xué)服務(wù)的,所以不同歷史時期,會產(chǎn)生不同的語言觀語言理論,相應(yīng)的也會產(chǎn)生不同的語言測試。世界語言測試經(jīng)歷了四個階段(薛榮,2008):(1)前科學(xué)語言測試,教學(xué)法是語法翻譯法,語言是包括語法知識、詞法知識、語音知識的知識體系。結(jié)果主要由教師主觀判斷,主觀性極強(qiáng),信度不高。題型:短文寫作、翻譯、語法分析。(2)心理測量-結(jié)構(gòu)主義語言測試,語言是一套形式結(jié)構(gòu),可分成不同元素,語言學(xué)習(xí)就是刺激反應(yīng)式,養(yǎng)成習(xí)慣,其教學(xué)法是聽說法,主要采用分離式測試,每題只考一個語言點(diǎn),主要題型有詞匯填空、改錯、判斷。重標(biāo)準(zhǔn)化、客觀性和結(jié)果,有一定信度,考查結(jié)構(gòu)。(3)心理語言學(xué)-社會語言學(xué)語言測試,Chomsky區(qū)分語言能力和語言行為,Hymes提出交際能力的概念,認(rèn)為使用語言不但要按照語法規(guī)則產(chǎn)出形式合格的句子,而且要具有在不同的語境中合理使用這些句子的能力,即語言使用涉及社會文化因素。Canale和Swain提出“四能力”說:語言能力、社會語言能力、交際策略能力、語篇能力。這一階段測試主要是綜合式測試,主要題型是完形和聽寫,要求被試綜合掌握各種知識。(4)交際語言測試時期,對應(yīng)現(xiàn)階段英語教學(xué)方法——任務(wù)教學(xué)法,強(qiáng)調(diào)聽說,加強(qiáng)口語測試,主要測試被試交際能力、解決問題能力。
2.外語測試四維度分析
隨著語言測試?yán)碚摰陌l(fā)展,評判語言測試的標(biāo)準(zhǔn)在不斷完善。對于語言測試的分析,主要看測試本身和結(jié)果,通常從信度、效度、難度和區(qū)分度分析。
(1)信度
信度是指測試結(jié)果的穩(wěn)定性或一致性,包括測試信度和評分人信度。信度通常用一對相關(guān)系數(shù)表示,相關(guān)系數(shù)越大,信度越高,通常對標(biāo)準(zhǔn)化測試的信度系數(shù)要求為0.9,課堂測試一般在0.7-0.8,當(dāng)系數(shù)為1.00時,信度最高,0.00時信度最低,但這兩個極端一般都不會達(dá)到,只在中間,我們通常用的計(jì)算公式是庫德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數(shù) p=某一題作對人的比例 q=1-p s■=整體試卷方差
μ=測試平均分 si■=每一題得分方差
影響信度的因素:
A.與測試本身相關(guān)的因素:
題目數(shù),測試內(nèi)容,題目特點(diǎn),分?jǐn)?shù)多樣性。
B.與被試相關(guān)的因素:
異質(zhì)性,考生應(yīng)試能力,考生動機(jī)。
C.與施考相關(guān)的因素:
時間限制,作弊機(jī)會。
(2)效度
效度是指測試測量了它聲稱測量東西的適應(yīng)性,也就是說,是否考查了該考的東西,包括內(nèi)容效度,準(zhǔn)則相關(guān)性效度,結(jié)構(gòu)效度,高考英語所測試的內(nèi)容是否覆蓋考試大綱或規(guī)定的所有內(nèi)容?效度越高,就越能準(zhǔn)確測量要測的內(nèi)容。計(jì)算公式仍體現(xiàn)為相關(guān)系數(shù),受信度影響rxy≤√rx√ry,rx為x的測試信度,ry為y的測試信度。
效度與信度關(guān)系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質(zhì)量的一個重要指標(biāo),難度用D表示,D越大,題越簡單,公式為:D=答對該題人數(shù)/總?cè)藬?shù),試題難度指數(shù)一般在0.3-0.7最合適。
(4)區(qū)分度
區(qū)分度指不同的題把不同水平的考生真正地區(qū)分開來,區(qū)分度越高,不同水平的考生區(qū)別越大,試卷價值就越高,用區(qū)分度指數(shù)表示DI,區(qū)分度指數(shù)最高位1,最低位-1,DI>0.40區(qū)分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區(qū)分度不好,不能采用該試題,計(jì)算公式為點(diǎn)雙列相關(guān):
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對題目的平均分,μx=整組平均分,σx=整組標(biāo)準(zhǔn)差,p=題目難度q=1-p,題目難度過高或過低都不能很好地區(qū)分學(xué)生水平,難度適中區(qū)分度最好。
3.學(xué)生成績分析
英語教師只有對學(xué)生成績進(jìn)行正確科學(xué)的分析,才能對學(xué)生水平作出更好的評價,才能為日后教學(xué)提供依據(jù),從而進(jìn)一步提升教學(xué)水平。學(xué)生成績分析包括成績描述和參數(shù)檢驗(yàn)。
(1)成績描述
成績描述主要涉及的項(xiàng)目有:集中趨勢(眾數(shù),中數(shù),平均數(shù)),離散趨勢(全距,方差,標(biāo)準(zhǔn)差),數(shù)據(jù)分布狀態(tài)。
集中趨勢是反映數(shù)據(jù)分布中數(shù)據(jù)趨向中心位置的統(tǒng)計(jì)量。眾數(shù)指出現(xiàn)頻率最多的數(shù)。中數(shù)指處于中間位置的數(shù)。離散趨勢與集中趨勢相反,指數(shù)據(jù)的離散變異情況。全距指一組數(shù)據(jù)中最大數(shù)與最小數(shù)之差。標(biāo)準(zhǔn)差、方差對數(shù)據(jù)離散程度描述更客觀科學(xué)。
數(shù)據(jù)分布狀態(tài):在語言測試中,學(xué)生外語成績是否呈正態(tài)分布,需要一個檢驗(yàn)過程,正態(tài)分布呈鐘形,兩邊對稱在正態(tài)分布中眾數(shù)、中數(shù)、平均數(shù)重合于一點(diǎn),其圖形為:
(2)參數(shù)檢驗(yàn)
在我國英語教學(xué)中,一位英語老師經(jīng)常會帶幾個平行班,這幾個班學(xué)生學(xué)習(xí)成績到底怎么樣,只靠成績描述數(shù)據(jù)是不夠的,還需要考慮多方面因素,這就需要參數(shù)檢查,主要有獨(dú)立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態(tài)分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態(tài)分布中,這兩種檢驗(yàn)可以用來檢驗(yàn)兩個班級成績是否具有統(tǒng)計(jì)意義上的明顯區(qū)別,方差分析可以用于三個或三個以上班級比較,也可以用于多因素分析中,SPSS計(jì)算軟件可以幫助我們在較短的時間內(nèi)完成大量的計(jì)算任務(wù)。
結(jié)語
作為出色的英語教師,備課上課不是我們唯一的任務(wù),還應(yīng)該特別注意學(xué)生的考試成績及試卷分析,在這方面,教師往往會忽視或輕視,認(rèn)為試卷分析就是純粹地看看學(xué)生成績高低,強(qiáng)調(diào)學(xué)生易犯錯誤的地方就行,即使作了分析,也是分析指標(biāo)單一,分析過程粗糙,這樣就不能深入了解學(xué)生學(xué)情。希望通過本文能夠引起教師及測試員對試卷分析的重視,注意試卷的科學(xué)性、理據(jù)性,提高成績測試質(zhì)量,更好地體現(xiàn)公平公正原則,從而更好地促進(jìn)外語教學(xué)及習(xí)得。
參考文獻(xiàn):
[1]劉潤清,韓寶成.語言測試和它的方法.北京:外語教學(xué)與研究出版社,2004.
[2]李筱菊.語言測試科學(xué)與藝術(shù).長沙:湖南教育出版社,1997.
[3]薛榮.當(dāng)代語言測試:理論發(fā)展與未來趨勢,外語與外語教學(xué),2008(10):44-47.endprint
摘 要: 科學(xué)正確的試卷分析能夠?yàn)榻虒W(xué)及學(xué)習(xí)提供有意義的反饋,并能在很大程度上提高教學(xué)質(zhì)量。本文綜合介紹了外語試卷信度、效度、難度、區(qū)分度四個維度的分析過程及學(xué)生考試成績的分析方法,以期對英語教師的教學(xué)及測試工作起到指導(dǎo)作用。
關(guān)鍵詞: 外語試卷 四維度分析過程 成績分析方法
引言
語言教學(xué)是第一性的,測試為教學(xué)服務(wù),在我國,語言教學(xué)已引起足夠的重視,但對于語言測試分析,一些教師并沒有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學(xué)。本文主要從語言測試?yán)碚摰陌l(fā)展,外語測試四維度分析過程及方法,以及學(xué)生成績分析方法等方面,具體闡述了外語測試全方位分析方法。
1.語言測試?yán)碚摪l(fā)展
著名語言學(xué)家戴維斯(1968)曾說“好的測試就如同一個忠實(shí)的仆人”,這個比喻形象地說明了測試是為教學(xué)服務(wù)的,所以不同歷史時期,會產(chǎn)生不同的語言觀語言理論,相應(yīng)的也會產(chǎn)生不同的語言測試。世界語言測試經(jīng)歷了四個階段(薛榮,2008):(1)前科學(xué)語言測試,教學(xué)法是語法翻譯法,語言是包括語法知識、詞法知識、語音知識的知識體系。結(jié)果主要由教師主觀判斷,主觀性極強(qiáng),信度不高。題型:短文寫作、翻譯、語法分析。(2)心理測量-結(jié)構(gòu)主義語言測試,語言是一套形式結(jié)構(gòu),可分成不同元素,語言學(xué)習(xí)就是刺激反應(yīng)式,養(yǎng)成習(xí)慣,其教學(xué)法是聽說法,主要采用分離式測試,每題只考一個語言點(diǎn),主要題型有詞匯填空、改錯、判斷。重標(biāo)準(zhǔn)化、客觀性和結(jié)果,有一定信度,考查結(jié)構(gòu)。(3)心理語言學(xué)-社會語言學(xué)語言測試,Chomsky區(qū)分語言能力和語言行為,Hymes提出交際能力的概念,認(rèn)為使用語言不但要按照語法規(guī)則產(chǎn)出形式合格的句子,而且要具有在不同的語境中合理使用這些句子的能力,即語言使用涉及社會文化因素。Canale和Swain提出“四能力”說:語言能力、社會語言能力、交際策略能力、語篇能力。這一階段測試主要是綜合式測試,主要題型是完形和聽寫,要求被試綜合掌握各種知識。(4)交際語言測試時期,對應(yīng)現(xiàn)階段英語教學(xué)方法——任務(wù)教學(xué)法,強(qiáng)調(diào)聽說,加強(qiáng)口語測試,主要測試被試交際能力、解決問題能力。
2.外語測試四維度分析
隨著語言測試?yán)碚摰陌l(fā)展,評判語言測試的標(biāo)準(zhǔn)在不斷完善。對于語言測試的分析,主要看測試本身和結(jié)果,通常從信度、效度、難度和區(qū)分度分析。
(1)信度
信度是指測試結(jié)果的穩(wěn)定性或一致性,包括測試信度和評分人信度。信度通常用一對相關(guān)系數(shù)表示,相關(guān)系數(shù)越大,信度越高,通常對標(biāo)準(zhǔn)化測試的信度系數(shù)要求為0.9,課堂測試一般在0.7-0.8,當(dāng)系數(shù)為1.00時,信度最高,0.00時信度最低,但這兩個極端一般都不會達(dá)到,只在中間,我們通常用的計(jì)算公式是庫德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數(shù) p=某一題作對人的比例 q=1-p s■=整體試卷方差
μ=測試平均分 si■=每一題得分方差
影響信度的因素:
A.與測試本身相關(guān)的因素:
題目數(shù),測試內(nèi)容,題目特點(diǎn),分?jǐn)?shù)多樣性。
B.與被試相關(guān)的因素:
異質(zhì)性,考生應(yīng)試能力,考生動機(jī)。
C.與施考相關(guān)的因素:
時間限制,作弊機(jī)會。
(2)效度
效度是指測試測量了它聲稱測量東西的適應(yīng)性,也就是說,是否考查了該考的東西,包括內(nèi)容效度,準(zhǔn)則相關(guān)性效度,結(jié)構(gòu)效度,高考英語所測試的內(nèi)容是否覆蓋考試大綱或規(guī)定的所有內(nèi)容?效度越高,就越能準(zhǔn)確測量要測的內(nèi)容。計(jì)算公式仍體現(xiàn)為相關(guān)系數(shù),受信度影響rxy≤√rx√ry,rx為x的測試信度,ry為y的測試信度。
效度與信度關(guān)系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質(zhì)量的一個重要指標(biāo),難度用D表示,D越大,題越簡單,公式為:D=答對該題人數(shù)/總?cè)藬?shù),試題難度指數(shù)一般在0.3-0.7最合適。
(4)區(qū)分度
區(qū)分度指不同的題把不同水平的考生真正地區(qū)分開來,區(qū)分度越高,不同水平的考生區(qū)別越大,試卷價值就越高,用區(qū)分度指數(shù)表示DI,區(qū)分度指數(shù)最高位1,最低位-1,DI>0.40區(qū)分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區(qū)分度不好,不能采用該試題,計(jì)算公式為點(diǎn)雙列相關(guān):
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對題目的平均分,μx=整組平均分,σx=整組標(biāo)準(zhǔn)差,p=題目難度q=1-p,題目難度過高或過低都不能很好地區(qū)分學(xué)生水平,難度適中區(qū)分度最好。
3.學(xué)生成績分析
英語教師只有對學(xué)生成績進(jìn)行正確科學(xué)的分析,才能對學(xué)生水平作出更好的評價,才能為日后教學(xué)提供依據(jù),從而進(jìn)一步提升教學(xué)水平。學(xué)生成績分析包括成績描述和參數(shù)檢驗(yàn)。
(1)成績描述
成績描述主要涉及的項(xiàng)目有:集中趨勢(眾數(shù),中數(shù),平均數(shù)),離散趨勢(全距,方差,標(biāo)準(zhǔn)差),數(shù)據(jù)分布狀態(tài)。
集中趨勢是反映數(shù)據(jù)分布中數(shù)據(jù)趨向中心位置的統(tǒng)計(jì)量。眾數(shù)指出現(xiàn)頻率最多的數(shù)。中數(shù)指處于中間位置的數(shù)。離散趨勢與集中趨勢相反,指數(shù)據(jù)的離散變異情況。全距指一組數(shù)據(jù)中最大數(shù)與最小數(shù)之差。標(biāo)準(zhǔn)差、方差對數(shù)據(jù)離散程度描述更客觀科學(xué)。
數(shù)據(jù)分布狀態(tài):在語言測試中,學(xué)生外語成績是否呈正態(tài)分布,需要一個檢驗(yàn)過程,正態(tài)分布呈鐘形,兩邊對稱在正態(tài)分布中眾數(shù)、中數(shù)、平均數(shù)重合于一點(diǎn),其圖形為:
(2)參數(shù)檢驗(yàn)
在我國英語教學(xué)中,一位英語老師經(jīng)常會帶幾個平行班,這幾個班學(xué)生學(xué)習(xí)成績到底怎么樣,只靠成績描述數(shù)據(jù)是不夠的,還需要考慮多方面因素,這就需要參數(shù)檢查,主要有獨(dú)立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態(tài)分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態(tài)分布中,這兩種檢驗(yàn)可以用來檢驗(yàn)兩個班級成績是否具有統(tǒng)計(jì)意義上的明顯區(qū)別,方差分析可以用于三個或三個以上班級比較,也可以用于多因素分析中,SPSS計(jì)算軟件可以幫助我們在較短的時間內(nèi)完成大量的計(jì)算任務(wù)。
結(jié)語
作為出色的英語教師,備課上課不是我們唯一的任務(wù),還應(yīng)該特別注意學(xué)生的考試成績及試卷分析,在這方面,教師往往會忽視或輕視,認(rèn)為試卷分析就是純粹地看看學(xué)生成績高低,強(qiáng)調(diào)學(xué)生易犯錯誤的地方就行,即使作了分析,也是分析指標(biāo)單一,分析過程粗糙,這樣就不能深入了解學(xué)生學(xué)情。希望通過本文能夠引起教師及測試員對試卷分析的重視,注意試卷的科學(xué)性、理據(jù)性,提高成績測試質(zhì)量,更好地體現(xiàn)公平公正原則,從而更好地促進(jìn)外語教學(xué)及習(xí)得。
參考文獻(xiàn):
[1]劉潤清,韓寶成.語言測試和它的方法.北京:外語教學(xué)與研究出版社,2004.
[2]李筱菊.語言測試科學(xué)與藝術(shù).長沙:湖南教育出版社,1997.
[3]薛榮.當(dāng)代語言測試:理論發(fā)展與未來趨勢,外語與外語教學(xué),2008(10):44-47.endprint
摘 要: 科學(xué)正確的試卷分析能夠?yàn)榻虒W(xué)及學(xué)習(xí)提供有意義的反饋,并能在很大程度上提高教學(xué)質(zhì)量。本文綜合介紹了外語試卷信度、效度、難度、區(qū)分度四個維度的分析過程及學(xué)生考試成績的分析方法,以期對英語教師的教學(xué)及測試工作起到指導(dǎo)作用。
關(guān)鍵詞: 外語試卷 四維度分析過程 成績分析方法
引言
語言教學(xué)是第一性的,測試為教學(xué)服務(wù),在我國,語言教學(xué)已引起足夠的重視,但對于語言測試分析,一些教師并沒有給予足夠的重視,試卷分析僅停留在表層、單一層面,不深刻不科學(xué)。本文主要從語言測試?yán)碚摰陌l(fā)展,外語測試四維度分析過程及方法,以及學(xué)生成績分析方法等方面,具體闡述了外語測試全方位分析方法。
1.語言測試?yán)碚摪l(fā)展
著名語言學(xué)家戴維斯(1968)曾說“好的測試就如同一個忠實(shí)的仆人”,這個比喻形象地說明了測試是為教學(xué)服務(wù)的,所以不同歷史時期,會產(chǎn)生不同的語言觀語言理論,相應(yīng)的也會產(chǎn)生不同的語言測試。世界語言測試經(jīng)歷了四個階段(薛榮,2008):(1)前科學(xué)語言測試,教學(xué)法是語法翻譯法,語言是包括語法知識、詞法知識、語音知識的知識體系。結(jié)果主要由教師主觀判斷,主觀性極強(qiáng),信度不高。題型:短文寫作、翻譯、語法分析。(2)心理測量-結(jié)構(gòu)主義語言測試,語言是一套形式結(jié)構(gòu),可分成不同元素,語言學(xué)習(xí)就是刺激反應(yīng)式,養(yǎng)成習(xí)慣,其教學(xué)法是聽說法,主要采用分離式測試,每題只考一個語言點(diǎn),主要題型有詞匯填空、改錯、判斷。重標(biāo)準(zhǔn)化、客觀性和結(jié)果,有一定信度,考查結(jié)構(gòu)。(3)心理語言學(xué)-社會語言學(xué)語言測試,Chomsky區(qū)分語言能力和語言行為,Hymes提出交際能力的概念,認(rèn)為使用語言不但要按照語法規(guī)則產(chǎn)出形式合格的句子,而且要具有在不同的語境中合理使用這些句子的能力,即語言使用涉及社會文化因素。Canale和Swain提出“四能力”說:語言能力、社會語言能力、交際策略能力、語篇能力。這一階段測試主要是綜合式測試,主要題型是完形和聽寫,要求被試綜合掌握各種知識。(4)交際語言測試時期,對應(yīng)現(xiàn)階段英語教學(xué)方法——任務(wù)教學(xué)法,強(qiáng)調(diào)聽說,加強(qiáng)口語測試,主要測試被試交際能力、解決問題能力。
2.外語測試四維度分析
隨著語言測試?yán)碚摰陌l(fā)展,評判語言測試的標(biāo)準(zhǔn)在不斷完善。對于語言測試的分析,主要看測試本身和結(jié)果,通常從信度、效度、難度和區(qū)分度分析。
(1)信度
信度是指測試結(jié)果的穩(wěn)定性或一致性,包括測試信度和評分人信度。信度通常用一對相關(guān)系數(shù)表示,相關(guān)系數(shù)越大,信度越高,通常對標(biāo)準(zhǔn)化測試的信度系數(shù)要求為0.9,課堂測試一般在0.7-0.8,當(dāng)系數(shù)為1.00時,信度最高,0.00時信度最低,但這兩個極端一般都不會達(dá)到,只在中間,我們通常用的計(jì)算公式是庫德-查理遜21公式:
KR 21= r =k /(k=1)X {1 -[μ(k - μ)/k(s ■)]}
Coefficient alpha=α=k/(k-1)X[1-(∑si■/s■)]
K=題目數(shù) p=某一題作對人的比例 q=1-p s■=整體試卷方差
μ=測試平均分 si■=每一題得分方差
影響信度的因素:
A.與測試本身相關(guān)的因素:
題目數(shù),測試內(nèi)容,題目特點(diǎn),分?jǐn)?shù)多樣性。
B.與被試相關(guān)的因素:
異質(zhì)性,考生應(yīng)試能力,考生動機(jī)。
C.與施考相關(guān)的因素:
時間限制,作弊機(jī)會。
(2)效度
效度是指測試測量了它聲稱測量東西的適應(yīng)性,也就是說,是否考查了該考的東西,包括內(nèi)容效度,準(zhǔn)則相關(guān)性效度,結(jié)構(gòu)效度,高考英語所測試的內(nèi)容是否覆蓋考試大綱或規(guī)定的所有內(nèi)容?效度越高,就越能準(zhǔn)確測量要測的內(nèi)容。計(jì)算公式仍體現(xiàn)為相關(guān)系數(shù),受信度影響rxy≤√rx√ry,rx為x的測試信度,ry為y的測試信度。
效度與信度關(guān)系為充分不必要條件,有高效度一定有高信度,但有高信度不一定有高效度。
(3)難度
難度是衡量試卷質(zhì)量的一個重要指標(biāo),難度用D表示,D越大,題越簡單,公式為:D=答對該題人數(shù)/總?cè)藬?shù),試題難度指數(shù)一般在0.3-0.7最合適。
(4)區(qū)分度
區(qū)分度指不同的題把不同水平的考生真正地區(qū)分開來,區(qū)分度越高,不同水平的考生區(qū)別越大,試卷價值就越高,用區(qū)分度指數(shù)表示DI,區(qū)分度指數(shù)最高位1,最低位-1,DI>0.40區(qū)分度最好,在0.30-0.39之間此題較好,在0.20-0.29之間,試題需要修改DI<0.19,區(qū)分度不好,不能采用該試題,計(jì)算公式為點(diǎn)雙列相關(guān):
r(point biserial)=[(μ+-μx)/δx]√p/q
μ+=答對題目的平均分,μx=整組平均分,σx=整組標(biāo)準(zhǔn)差,p=題目難度q=1-p,題目難度過高或過低都不能很好地區(qū)分學(xué)生水平,難度適中區(qū)分度最好。
3.學(xué)生成績分析
英語教師只有對學(xué)生成績進(jìn)行正確科學(xué)的分析,才能對學(xué)生水平作出更好的評價,才能為日后教學(xué)提供依據(jù),從而進(jìn)一步提升教學(xué)水平。學(xué)生成績分析包括成績描述和參數(shù)檢驗(yàn)。
(1)成績描述
成績描述主要涉及的項(xiàng)目有:集中趨勢(眾數(shù),中數(shù),平均數(shù)),離散趨勢(全距,方差,標(biāo)準(zhǔn)差),數(shù)據(jù)分布狀態(tài)。
集中趨勢是反映數(shù)據(jù)分布中數(shù)據(jù)趨向中心位置的統(tǒng)計(jì)量。眾數(shù)指出現(xiàn)頻率最多的數(shù)。中數(shù)指處于中間位置的數(shù)。離散趨勢與集中趨勢相反,指數(shù)據(jù)的離散變異情況。全距指一組數(shù)據(jù)中最大數(shù)與最小數(shù)之差。標(biāo)準(zhǔn)差、方差對數(shù)據(jù)離散程度描述更客觀科學(xué)。
數(shù)據(jù)分布狀態(tài):在語言測試中,學(xué)生外語成績是否呈正態(tài)分布,需要一個檢驗(yàn)過程,正態(tài)分布呈鐘形,兩邊對稱在正態(tài)分布中眾數(shù)、中數(shù)、平均數(shù)重合于一點(diǎn),其圖形為:
(2)參數(shù)檢驗(yàn)
在我國英語教學(xué)中,一位英語老師經(jīng)常會帶幾個平行班,這幾個班學(xué)生學(xué)習(xí)成績到底怎么樣,只靠成績描述數(shù)據(jù)是不夠的,還需要考慮多方面因素,這就需要參數(shù)檢查,主要有獨(dú)立樣本z檢查、t檢查和方差分析。
Z檢查主要用于樣本容量大于30的正態(tài)分布,可以比較樣本平均分和總體平均分,或比較樣本平均分。T檢查的樣本容量通常小于30的正態(tài)分布中,這兩種檢驗(yàn)可以用來檢驗(yàn)兩個班級成績是否具有統(tǒng)計(jì)意義上的明顯區(qū)別,方差分析可以用于三個或三個以上班級比較,也可以用于多因素分析中,SPSS計(jì)算軟件可以幫助我們在較短的時間內(nèi)完成大量的計(jì)算任務(wù)。
結(jié)語
作為出色的英語教師,備課上課不是我們唯一的任務(wù),還應(yīng)該特別注意學(xué)生的考試成績及試卷分析,在這方面,教師往往會忽視或輕視,認(rèn)為試卷分析就是純粹地看看學(xué)生成績高低,強(qiáng)調(diào)學(xué)生易犯錯誤的地方就行,即使作了分析,也是分析指標(biāo)單一,分析過程粗糙,這樣就不能深入了解學(xué)生學(xué)情。希望通過本文能夠引起教師及測試員對試卷分析的重視,注意試卷的科學(xué)性、理據(jù)性,提高成績測試質(zhì)量,更好地體現(xiàn)公平公正原則,從而更好地促進(jìn)外語教學(xué)及習(xí)得。
參考文獻(xiàn):
[1]劉潤清,韓寶成.語言測試和它的方法.北京:外語教學(xué)與研究出版社,2004.
[2]李筱菊.語言測試科學(xué)與藝術(shù).長沙:湖南教育出版社,1997.
[3]薛榮.當(dāng)代語言測試:理論發(fā)展與未來趨勢,外語與外語教學(xué),2008(10):44-47.endprint