【摘要】本文從語(yǔ)言測(cè)試的相關(guān)理論出發(fā),選取安徽省黃山市黃山區(qū)第一中學(xué)高三(十)班參加的一次高考英語(yǔ)模擬考試作為研究對(duì)象。運(yùn)用SPSS軟件處理收集來(lái)的數(shù)據(jù),利用定量研究方法客觀分析本份試卷的質(zhì)量和學(xué)生的表現(xiàn),希望對(duì)本份試卷的設(shè)計(jì)和英語(yǔ)教學(xué)都提供一定的幫助。
【關(guān)鍵詞】SPSS軟件 試卷信度 試卷效度 項(xiàng)目分析 試卷質(zhì)量
一、引言
測(cè)試對(duì)每個(gè)人來(lái)說(shuō)并陌生,對(duì)于擁有學(xué)習(xí)經(jīng)歷的人來(lái)說(shuō),學(xué)習(xí)期間需要參加各種各樣的考試,不同的測(cè)試用于不同的目的。語(yǔ)言測(cè)試(LT)是“一種手段,用于評(píng)價(jià)對(duì)一門(mén)外語(yǔ)課程或一門(mén)課程中部分內(nèi)容的掌握程度,其目的在于檢測(cè)運(yùn)用一門(mén)語(yǔ)言的能力” 。語(yǔ)言測(cè)試(LT)作為一種測(cè)試手段,涉及語(yǔ)言的各各方面,其中包括:聽(tīng),說(shuō),讀,寫(xiě),詞匯,語(yǔ)法等等。近年來(lái),伴隨語(yǔ)言測(cè)試的興盛,語(yǔ)言測(cè)試研究也得到了蓬勃發(fā)展。
二、文獻(xiàn)回顧
1.語(yǔ)言測(cè)試類(lèi)型。根據(jù)不同視角,語(yǔ)言測(cè)試可以進(jìn)行多重分類(lèi),一般來(lái)說(shuō)根據(jù)測(cè)試目的分為四種:水平測(cè)試、診斷測(cè)試、等級(jí)測(cè)試、成就測(cè)試。
水平測(cè)試旨在測(cè)量“一個(gè)人學(xué)習(xí)語(yǔ)言的能力,不管這門(mén)語(yǔ)言學(xué)習(xí)者之前是否受到過(guò)訓(xùn)練”。診斷測(cè)試旨在檢測(cè)“語(yǔ)言學(xué)習(xí)者的優(yōu)勢(shì)和劣勢(shì)”。等級(jí)測(cè)試用于“判斷語(yǔ)言學(xué)習(xí)者所處的階段,以便安排最適合其學(xué)習(xí)的語(yǔ)言學(xué)習(xí)項(xiàng)目”。成就測(cè)試與所學(xué)的語(yǔ)言課程相關(guān)旨在檢測(cè)“語(yǔ)言學(xué)習(xí)者對(duì)語(yǔ)言課程目標(biāo)的掌握程度”。
2.信度和效度。對(duì)于任何形式的測(cè)試研究,信度和效度都是不可或缺的重要指標(biāo),測(cè)試必須保證信度和效度的有效性。測(cè)試信度(指的是“相似內(nèi)容在不同的環(huán)境中能否達(dá)到相同的測(cè)試分?jǐn)?shù)”。四種主要方法用于檢測(cè)試卷的信度,再測(cè)信度:用相同的測(cè)試對(duì)測(cè)試者進(jìn)行兩次測(cè)試,比較前后兩次的分?jǐn)?shù)。評(píng)估信度:用兩份類(lèi)似的測(cè)試對(duì)測(cè)試者進(jìn)行測(cè)試,并對(duì)這兩份相關(guān)測(cè)試的分?jǐn)?shù)進(jìn)行比較。對(duì)半測(cè)試:一份試卷拆成兩部分對(duì)測(cè)試者進(jìn)行測(cè)試。哥倫巴赫系數(shù):利用方差計(jì)算試卷的信度。
測(cè)試效度指的是“測(cè)試是否達(dá)到了測(cè)試所要求的目的”。傳統(tǒng)測(cè)量效度的方法可以分為五種,卷面效度:試卷結(jié)構(gòu)直觀看起來(lái)是一份質(zhì)量高的測(cè)試。大綱效度:測(cè)試精準(zhǔn)的反映了大綱的要求。預(yù)測(cè)效度:測(cè)試精確反映受試者在之后一些學(xué)習(xí)情景中的表現(xiàn)。共生效度:測(cè)試給出了先前測(cè)試效度的相似結(jié)果。結(jié)構(gòu)效度:測(cè)試精準(zhǔn)的反映了外語(yǔ)學(xué)習(xí)理論及原則。
3.項(xiàng)目分析。“用數(shù)據(jù)統(tǒng)計(jì)的方式對(duì)每個(gè)測(cè)試者所測(cè)試項(xiàng)目的有效性進(jìn)行統(tǒng)計(jì),通過(guò)這種數(shù)據(jù)的統(tǒng)計(jì)方式能夠幫助測(cè)試制定者在未來(lái)測(cè)試中編制出更為有效的測(cè)試項(xiàng)目,對(duì)現(xiàn)行的測(cè)試進(jìn)行規(guī)范”。
三、實(shí)驗(yàn)材料和研究問(wèn)題
1.數(shù)據(jù)來(lái)源。本研究選取安徽省黃山市黃山區(qū)黃山一中高三(十)班在2016年5月參加的全市高考英語(yǔ)模擬考試為研究對(duì)象,本次模擬考試完全按照高考規(guī)定的時(shí)間和要求完成答題,試卷完成后評(píng)卷老師都是按高考要求完成評(píng)卷,最后由筆者完成所有測(cè)試者分?jǐn)?shù)收集。
2.數(shù)據(jù)分析。用SPSS軟件錄入和處理收集來(lái)的數(shù)據(jù),運(yùn)用語(yǔ)言測(cè)試相關(guān)理論結(jié)合定量分析的基本準(zhǔn)則客觀評(píng)價(jià)本份試卷的質(zhì)量。為了統(tǒng)計(jì)方便筆者將本次150分的高考模擬試卷折算成100分,折算后的各個(gè)題型為:聽(tīng)力(20%),閱讀(20%),完型填空(20%),無(wú)選項(xiàng)填空(10%),改錯(cuò)(10%)和寫(xiě)作(20%)。
3.研究問(wèn)題。
(1)本次測(cè)試的信度和效度如何?
(2)作為高考的模擬試卷本份試卷是否達(dá)到了高考卷的標(biāo)準(zhǔn)?
四、分析與討論
1.測(cè)試信度?!耙环莞哔|(zhì)量的測(cè)試信度是能夠讓測(cè)試者在不同的環(huán)境下進(jìn)行相同的測(cè)試,依舊能夠取得相近的測(cè)試結(jié)果”。因此,科學(xué)做法需要相同的測(cè)試者在不同條件下進(jìn)行相同測(cè)試,獲取測(cè)試結(jié)果,進(jìn)而分析測(cè)試的信度。現(xiàn)實(shí)情況下這種方法實(shí)行起來(lái)困難重重。多數(shù)情況下會(huì)采用哥倫巴赫系數(shù)分析信度,原因在于哥倫巴赫系數(shù)適用于主觀和客觀題的信度檢測(cè),本次信度檢測(cè)將采用此法。
中我們可以看出,哥倫巴赫系數(shù)值是0.777。標(biāo)準(zhǔn)化后的哥倫巴赫系數(shù)值是0.802。通常情況下,如果哥倫巴赫系數(shù)值在0.5~0.6之間說(shuō)明測(cè)試的內(nèi)部信度較差,0.6~0.7之間表明內(nèi)部信度存在一定的問(wèn)題,0.7~0.8之間內(nèi)部信度可以接受,0.8~0.9之間說(shuō)明內(nèi)部測(cè)試信度較好,當(dāng)數(shù)值等于或大于0.9表明測(cè)試具有非常高的內(nèi)部信度。鑒于此,本份試卷的信度是可以接受的,然而作為一次高考模擬試卷信度略微偏低。近年來(lái),在高考信度研究報(bào)告中多數(shù)學(xué)者將高考作為一種高信度測(cè)試,數(shù)值一般在0.8~0.9之間。
2.測(cè)試效度。高考作為選拔性考試,屬于考試類(lèi)型中的成就測(cè)試。對(duì)于評(píng)判成就測(cè)試效度的一個(gè)最為重要因素就是大綱效度。保證成就測(cè)試效度的最好方式是“按照大綱的要求保證足夠數(shù)量,適合的項(xiàng)目”。但實(shí)際情況下很難做到這一點(diǎn),因此,對(duì)于大綱效度,“選擇符合大綱的測(cè)試內(nèi)容,控制項(xiàng)目難度成為評(píng)判效度的一種通行做法”。
(1)測(cè)試內(nèi)容:作為一份高考模擬試卷,其測(cè)試內(nèi)容要嚴(yán)格的依照高考大綱規(guī)定的要求來(lái)設(shè)置內(nèi)容。由于2016年安徽省英語(yǔ)高考試卷將采用全國(guó)卷,因此我們將依據(jù)高考英語(yǔ)全國(guó)卷大綱來(lái)評(píng)判本份高考模擬試卷的項(xiàng)目?jī)?nèi)容。2016年高考英語(yǔ)全國(guó)卷的大綱將英語(yǔ)測(cè)試分為了兩個(gè)大的部分,第一部分是語(yǔ)言基本知識(shí)(要求高中生熟練掌握3500個(gè)英語(yǔ)詞匯和英語(yǔ)的語(yǔ)法知識(shí));第二部分是語(yǔ)言應(yīng)用(要求高中生具備一定的英語(yǔ)聽(tīng),說(shuō),讀,寫(xiě)能力)。我們可以看到本份試卷的Part4和Part5符合了語(yǔ)言基本知識(shí)考察的要求,Part1;Part2;Part3和Part6符合了語(yǔ)言應(yīng)用考察的要求,因此從測(cè)試內(nèi)容角度來(lái)說(shuō)本份模擬試卷基本符合了高考大綱要求。
(2)項(xiàng)目難度:“項(xiàng)目難度如果低于0.3表明該項(xiàng)目難度偏大,項(xiàng)目難度如果高于0.7表明該項(xiàng)目難度偏易”。根據(jù)全國(guó)高考大綱規(guī)定,試卷難度以適中為宜,單個(gè)試卷的難度以0.3~0.7之間為好,整卷以0.5~0.6之間為最佳。可以看出,大部分項(xiàng)目落在了0.3~0.7之間,然而整卷難度為0.48略微偏難,這也說(shuō)明部分題目需要改進(jìn),從上表中我們可以看到“無(wú)選項(xiàng)完型填空”難度為0.26,此題偏難無(wú)法很好區(qū)分等級(jí),因此需要做相應(yīng)的改進(jìn)。
綜上所述,本份試卷的效度尚可,如果從高考模擬試卷的角度來(lái)說(shuō),本份試卷部分題目需要改進(jìn)來(lái)達(dá)到較為理想的效度。
3.基本數(shù)據(jù)分析。
中可以看到平均分為48.32,標(biāo)準(zhǔn)差為10.573,說(shuō)明試卷難度偏大,兩級(jí)分化比較嚴(yán)重。這也從側(cè)面說(shuō)明本份試卷在某些項(xiàng)目知識(shí)點(diǎn)的設(shè)置上存在一定的問(wèn)題。學(xué)生對(duì)知識(shí)結(jié)構(gòu)的掌握不是很好,在某些知識(shí)點(diǎn)的設(shè)置上有很大的改進(jìn)空間。
4.項(xiàng)目分析。從表2可以看到試卷當(dāng)中項(xiàng)目難度最大的是“無(wú)選項(xiàng)填空”這道題型,此處將對(duì)這一題型進(jìn)行項(xiàng)目分析,來(lái)觀察其內(nèi)部有無(wú)不符合測(cè)試的項(xiàng)目。項(xiàng)目分析有兩個(gè)非常重要的指標(biāo):難度(P)和區(qū)分度(D)。
其余的題目都極大的低于0.3,大部分項(xiàng)目難度都偏大?!叭绻玫膶W(xué)生在相同題目上比差的學(xué)生發(fā)揮穩(wěn)定說(shuō)明該題具有較好的區(qū)分度,一般認(rèn)為如果區(qū)分度指標(biāo)大于0.3說(shuō)明該項(xiàng)目有較好的區(qū)分度,如果低于0.2則要考慮移除或修改該項(xiàng)目”。依據(jù)上述的標(biāo)準(zhǔn),我們可以看到1,4,7和10沒(méi)有很好的區(qū)分度,而剩下的題目能夠很好拉開(kāi)距離。因此結(jié)合兩個(gè)方面來(lái)看,這道題型當(dāng)中1,4,7和10需要修改或者刪除,翻開(kāi)試卷發(fā)現(xiàn)這四個(gè)題中有三個(gè)是沒(méi)有給任何提示,需要學(xué)生依據(jù)語(yǔ)境和文章填寫(xiě)適合的詞項(xiàng),這無(wú)疑增加了難度。如果要修改可以考慮對(duì)這些題添加一些提示信息讓難度降低,從而提高區(qū)分度。
五、結(jié)語(yǔ)
通過(guò)數(shù)據(jù)分析可以客觀描述本項(xiàng)研究所探討的兩個(gè)問(wèn)題,作為一次測(cè)試本份試卷的信度和效度尚可。然而作為一份高考模擬試卷本份試卷難度略微偏大,試卷部分題型需要改進(jìn)。從探究的原因看,學(xué)生的英語(yǔ)層次也有一定的差距。因此在高考畢業(yè)班的英語(yǔ)教學(xué)中,教師也需考慮有針對(duì)性的教學(xué)方案,以期提高不同層次學(xué)生的英語(yǔ)能力。
參考文獻(xiàn):
[1]徐鴻昌.對(duì)英語(yǔ)試卷講評(píng)課的建議[J].學(xué)苑教育,2016(20):69.
[2]常健.教會(huì)學(xué)生如何做英語(yǔ)試卷分析[J].語(yǔ)數(shù)外學(xué)習(xí)(英語(yǔ)教育),2013(12):62.
作者簡(jiǎn)介:汪啟凱(1989-),男,漢族,安徽黃山人,碩士,研究方向:外國(guó)語(yǔ)言學(xué)及應(yīng)用語(yǔ)言學(xué)。