馬平(延安大學(xué)西安創(chuàng)新學(xué)院,陜西延安716000)
“教考分離”教學(xué)成果評價(jià)體系建設(shè)之試題及試卷評價(jià)體系的建設(shè)
馬平
(延安大學(xué)西安創(chuàng)新學(xué)院,陜西延安716000)
本文通過對“教考分離”考試模式的探索性改革的研究,重點(diǎn)分析分析“教考分離”教學(xué)成果中的試題及試卷評價(jià)體系的建設(shè)方法,試圖通過難度、區(qū)分度、信度及效度四個(gè)技術(shù)指標(biāo)來進(jìn)行評價(jià)分析,進(jìn)而可以以點(diǎn)帶線、以線擴(kuò)面,更加科學(xué)、合理的評估“教考分離”的教學(xué)效果,完善“教考分離”的實(shí)際作用。
教考分離;難度;區(qū)分度;信度;效度
成果評價(jià)體系建設(shè)是教考分離改革內(nèi)容的核心領(lǐng)域。試題庫建設(shè)是教考分離改革的重點(diǎn),整個(gè)考試過程中的試題出卷、監(jiān)考、流水批卷是保證筆試的重要環(huán)節(jié)。試題出卷是由試題庫隨機(jī)抽取而得;監(jiān)考紀(jì)律取決于監(jiān)考監(jiān)管力度;規(guī)范化的評分標(biāo)準(zhǔn)是試卷批改給分的重要保證,流水批卷則有效規(guī)避了教師等人為因素帶來的不公平性。期中,試題庫中的試卷質(zhì)量是考試過程中最重要、技術(shù)性要求最高的環(huán)節(jié),必須通過各項(xiàng)試題及試卷的量化處理而得到。
為了使試卷量化評價(jià)科學(xué)有效并有代表性,我們引進(jìn)了統(tǒng)計(jì)學(xué)的量化指標(biāo),即:難度、區(qū)分度、信度及效度。
簡單的說就是試題的難易程度。而試題根據(jù)其類型我們又分為主觀試題和客觀試題,那么對這些試題的難度評價(jià)指標(biāo)可具體為:(1)客觀試題難度:P(客)=該題答對人數(shù)/參加考試總?cè)藬?shù);(2)主觀試題難度:P(主)=該題平均分/該題滿分;(3)試卷整體難度:P(主)=試卷平均分/試卷滿分。其中,P為難度,當(dāng)P≥0.7時(shí),說明試卷(題)為簡單;0.4≤P≤0.69,說明試卷(題)難易適中;P≤0.39,說明試卷(題)難度高。由此可見P值越大,試卷(題)難度越低;P值越小,試卷(題)難度越高。
一般考試最好能把P值控制在0.5左右比較合適,因?yàn)殡y度過大或過小都會對考察對象失去考察的意義,即試題的信度就會降低。當(dāng)然,在有特殊考察目的的考試中,如:選拔性考試,則可以適當(dāng)加大考試難度進(jìn)行考試。同時(shí),學(xué)生某科考試成績的平均分(A)及標(biāo)準(zhǔn)差(S)這兩個(gè)技術(shù)指標(biāo)(我們可以將這兩個(gè)指標(biāo)其視為輔助參照指標(biāo)),也可以從一定程度上宏觀地反映出試卷的難易程度,當(dāng)我們將P、A、S這三個(gè)指標(biāo)進(jìn)行對照比較時(shí)可以較為可觀的評價(jià)試卷的難易程度。
目的在于將考生的考試水平區(qū)分開來,成績上有較為明顯的差距,從而避免某一區(qū)段分?jǐn)?shù)的學(xué)生過于集中。區(qū)分度較高的試卷可以將優(yōu)秀、良好、合格及不合格成績的學(xué)生按照科學(xué)比例進(jìn)行分配,具有較好的考核信度及效度。
通常來說區(qū)分與難度具有相關(guān)性。區(qū)分度較好的試卷就會具有一定的難度,同時(shí),區(qū)分度也會被動的受到考生水平的影響,當(dāng)考生考試水平等于或略高于試題難度時(shí),試卷的區(qū)分度才會有所凸顯。區(qū)分度指標(biāo)計(jì)算方法如下:
1.單個(gè)選擇題的區(qū)分度:D(單)=M-N(M為高分組的通過率,N為低分組的通過率;期中:通過率M=高分組答對該題人數(shù)/高分組人數(shù);通過率N=低分組答對該題人數(shù)/低分組人數(shù)。
2.整個(gè)試卷(試題)的區(qū)分度:D(試)=2(XH-XL)/W;期中:XH為高分組的試卷(題)平均分,XL為低分組的試卷(題)平均分,W為試卷(題)總分值。當(dāng)D=0時(shí),表示無區(qū)分;D>0時(shí),D值越大,表示試卷的區(qū)分度就越好;當(dāng)D<0.18時(shí),說明該試卷(題)區(qū)分度極差,可以廢棄;當(dāng)0.18<D<0.3時(shí),表明試卷(題)區(qū)分度不太好,需要修改,無優(yōu)勝略汰的能力;當(dāng)0.3<D<0.4時(shí),表明試卷(題)具有較好的區(qū)分度,可以作為大部分的考試試題來用;當(dāng)D>0.4時(shí),說明試卷(題)區(qū)分度很好。
主要是衡量同一試卷或平行試卷對考生反復(fù)考察時(shí),所得考試分?jǐn)?shù)的可靠性、穩(wěn)定性及一致性。其可以很好地檢驗(yàn)學(xué)生考試成績的穩(wěn)定性及真實(shí)性,并有效地反映試卷考察內(nèi)容與教學(xué)內(nèi)容的相關(guān)程度。具體指標(biāo)計(jì)算如下:
α=(K/K-1)×(1-∑Si 2/St 2)
其中:K為試題的數(shù)量,Si 2為某一題試題的得分方差值,St 2為考試卷面總分的方差值。信度α的值越大,信度就越好,試卷的測評可靠性就越佳,當(dāng)信度α≤0.7時(shí),信度不佳,0.7≤α≤0.89時(shí),信度較好,α>0.9時(shí),信度最佳。
衡量考試有效性的指標(biāo),針對性的來說就是試題內(nèi)容構(gòu)成及其所占比例是否符合教學(xué)大綱所要求的考察內(nèi)容及比例,即我們考察的是內(nèi)容效度,若兩者高度符合,則說明該試題效度很高,達(dá)到考試大綱考核要求。我們通常用學(xué)時(shí)構(gòu)成比與分?jǐn)?shù)構(gòu)成比來做比對,從而評價(jià)試卷的效度問題。具體計(jì)算方法如下:
相關(guān)章節(jié)學(xué)時(shí)比=各章節(jié)學(xué)時(shí)/該課程總學(xué)時(shí)×100%;
相關(guān)章節(jié)試題分?jǐn)?shù)比=各章節(jié)所占試卷分?jǐn)?shù)/試卷總分× 100%;
當(dāng)學(xué)時(shí)比與分?jǐn)?shù)比符合度較高或一致時(shí),說明試卷考核內(nèi)容達(dá)到大綱要求,試卷考核效度高。
總體來說難度、區(qū)分度、信度及效度四個(gè)評價(jià)指標(biāo)主要是用來評價(jià)試題庫內(nèi)試卷的重要指標(biāo),從而幫助我們分類、分析試題庫內(nèi)試卷質(zhì)量,從而優(yōu)化試題庫的建設(shè),提高對學(xué)生考察的力度及有效性。
[1]張杰,郝文武.淺談高等學(xué)校教考分離的利弊及改進(jìn)[J].延安大學(xué)學(xué)報(bào)(社會科學(xué)版)2000(01).
Q178-4
A
1005-5312(2015)29-0231-01