“教考分離”教學(xué)成果評價(jià)體系建設(shè)之試題及試卷評價(jià)體系的建設(shè)

2015-10-29 08:31:38馬平延安大學(xué)西安創(chuàng)新學(xué)院陜西延安716000

文藝生活·中旬刊 2015年10期

馬平（延安大學(xué)西安創(chuàng)新學(xué)院，陜西延安716000）

馬平
（延安大學(xué)西安創(chuàng)新學(xué)院，陜西延安716000）

本文通過對“教考分離”考試模式的探索性改革的研究，重點(diǎn)分析分析“教考分離”教學(xué)成果中的試題及試卷評價(jià)體系的建設(shè)方法，試圖通過難度、區(qū)分度、信度及效度四個(gè)技術(shù)指標(biāo)來進(jìn)行評價(jià)分析，進(jìn)而可以以點(diǎn)帶線、以線擴(kuò)面，更加科學(xué)、合理的評估“教考分離”的教學(xué)效果，完善“教考分離”的實(shí)際作用。

教考分離；難度；區(qū)分度；信度；效度

成果評價(jià)體系建設(shè)是教考分離改革內(nèi)容的核心領(lǐng)域。試題庫建設(shè)是教考分離改革的重點(diǎn)，整個(gè)考試過程中的試題出卷、監(jiān)考、流水批卷是保證筆試的重要環(huán)節(jié)。試題出卷是由試題庫隨機(jī)抽取而得；監(jiān)考紀(jì)律取決于監(jiān)考監(jiān)管力度；規(guī)范化的評分標(biāo)準(zhǔn)是試卷批改給分的重要保證，流水批卷則有效規(guī)避了教師等人為因素帶來的不公平性。期中，試題庫中的試卷質(zhì)量是考試過程中最重要、技術(shù)性要求最高的環(huán)節(jié)，必須通過各項(xiàng)試題及試卷的量化處理而得到。

為了使試卷量化評價(jià)科學(xué)有效并有代表性，我們引進(jìn)了統(tǒng)計(jì)學(xué)的量化指標(biāo)，即：難度、區(qū)分度、信度及效度。

一、難度（P）

簡單的說就是試題的難易程度。而試題根據(jù)其類型我們又分為主觀試題和客觀試題，那么對這些試題的難度評價(jià)指標(biāo)可具體為：（1）客觀試題難度：P(客)=該題答對人數(shù)／參加考試總?cè)藬?shù)；（2）主觀試題難度：P(主)=該題平均分／該題滿分；（3）試卷整體難度：P(主)=試卷平均分／試卷滿分。其中，P為難度，當(dāng)P≥0.7時(shí)，說明試卷（題）為簡單；0.4≤P≤0.69，說明試卷（題）難易適中；P≤0.39，說明試卷（題）難度高。由此可見P值越大，試卷（題）難度越低；P值越小，試卷（題）難度越高。

一般考試最好能把P值控制在0.5左右比較合適，因?yàn)殡y度過大或過小都會對考察對象失去考察的意義，即試題的信度就會降低。當(dāng)然，在有特殊考察目的的考試中，如：選拔性考試，則可以適當(dāng)加大考試難度進(jìn)行考試。同時(shí)，學(xué)生某科考試成績的平均分（A）及標(biāo)準(zhǔn)差（S）這兩個(gè)技術(shù)指標(biāo)（我們可以將這兩個(gè)指標(biāo)其視為輔助參照指標(biāo)），也可以從一定程度上宏觀地反映出試卷的難易程度，當(dāng)我們將P、A、S這三個(gè)指標(biāo)進(jìn)行對照比較時(shí)可以較為可觀的評價(jià)試卷的難易程度。

二、區(qū)分度（D）

目的在于將考生的考試水平區(qū)分開來，成績上有較為明顯的差距，從而避免某一區(qū)段分?jǐn)?shù)的學(xué)生過于集中。區(qū)分度較高的試卷可以將優(yōu)秀、良好、合格及不合格成績的學(xué)生按照科學(xué)比例進(jìn)行分配，具有較好的考核信度及效度。

通常來說區(qū)分與難度具有相關(guān)性。區(qū)分度較好的試卷就會具有一定的難度，同時(shí)，區(qū)分度也會被動的受到考生水平的影響，當(dāng)考生考試水平等于或略高于試題難度時(shí)，試卷的區(qū)分度才會有所凸顯。區(qū)分度指標(biāo)計(jì)算方法如下：

1.單個(gè)選擇題的區(qū)分度：D（單）=M-N（M為高分組的通過率，N為低分組的通過率；期中:通過率M=高分組答對該題人數(shù)/高分組人數(shù)；通過率N=低分組答對該題人數(shù)/低分組人數(shù)。

2.整個(gè)試卷（試題）的區(qū)分度：D（試）=2(XH-XL)/W；期中：XH為高分組的試卷（題）平均分，XL為低分組的試卷（題）平均分，W為試卷（題）總分值。當(dāng)D=0時(shí)，表示無區(qū)分；D＞0時(shí)，D值越大，表示試卷的區(qū)分度就越好；當(dāng)D＜0.18時(shí)，說明該試卷（題）區(qū)分度極差，可以廢棄；當(dāng)0.18＜D＜0.3時(shí)，表明試卷（題）區(qū)分度不太好，需要修改，無優(yōu)勝略汰的能力；當(dāng)0.3＜D＜0.4時(shí)，表明試卷（題）具有較好的區(qū)分度，可以作為大部分的考試試題來用；當(dāng)D＞0.4時(shí)，說明試卷（題）區(qū)分度很好。

三、信度（α）

主要是衡量同一試卷或平行試卷對考生反復(fù)考察時(shí)，所得考試分?jǐn)?shù)的可靠性、穩(wěn)定性及一致性。其可以很好地檢驗(yàn)學(xué)生考試成績的穩(wěn)定性及真實(shí)性，并有效地反映試卷考察內(nèi)容與教學(xué)內(nèi)容的相關(guān)程度。具體指標(biāo)計(jì)算如下：

α=（K/K-1）×(1-∑Si 2/St 2）

其中：K為試題的數(shù)量，Si 2為某一題試題的得分方差值，St 2為考試卷面總分的方差值。信度α的值越大，信度就越好，試卷的測評可靠性就越佳，當(dāng)信度α≤0.7時(shí)，信度不佳，0.7≤α≤0.89時(shí)，信度較好，α＞0.9時(shí)，信度最佳。

四、效度（V）

衡量考試有效性的指標(biāo)，針對性的來說就是試題內(nèi)容構(gòu)成及其所占比例是否符合教學(xué)大綱所要求的考察內(nèi)容及比例，即我們考察的是內(nèi)容效度，若兩者高度符合，則說明該試題效度很高，達(dá)到考試大綱考核要求。我們通常用學(xué)時(shí)構(gòu)成比與分?jǐn)?shù)構(gòu)成比來做比對，從而評價(jià)試卷的效度問題。具體計(jì)算方法如下：

相關(guān)章節(jié)學(xué)時(shí)比=各章節(jié)學(xué)時(shí)/該課程總學(xué)時(shí)×100%；

相關(guān)章節(jié)試題分?jǐn)?shù)比=各章節(jié)所占試卷分?jǐn)?shù)/試卷總分× 100%；

當(dāng)學(xué)時(shí)比與分?jǐn)?shù)比符合度較高或一致時(shí)，說明試卷考核內(nèi)容達(dá)到大綱要求，試卷考核效度高。

總體來說難度、區(qū)分度、信度及效度四個(gè)評價(jià)指標(biāo)主要是用來評價(jià)試題庫內(nèi)試卷的重要指標(biāo)，從而幫助我們分類、分析試題庫內(nèi)試卷質(zhì)量，從而優(yōu)化試題庫的建設(shè)，提高對學(xué)生考察的力度及有效性。

[1]張杰,郝文武.淺談高等學(xué)校教考分離的利弊及改進(jìn)[J].延安大學(xué)學(xué)報(bào)(社會科學(xué)版)2000(01).

Q178-4

1005-5312（2015）29-0231-01

“教考分離”教學(xué)成果評價(jià)體系建設(shè)之試題及試卷評價(jià)體系的建設(shè)

一、難度（P）

二、區(qū)分度（D）

三、信度（α）

四、效度（V）

一、難度（P）

二、區(qū)分度（D）

三、信度（α）