周 媛
(福建中醫(yī)藥大學(xué)教務(wù)處,福建 福州 350122)
課程考試試卷作為對(duì)高校學(xué)生所學(xué)知識(shí)和技能的一種考核方式,是學(xué)生理解掌握所學(xué)知識(shí)的原始記錄,階段性和總結(jié)性地反映了學(xué)生的學(xué)習(xí)效果。試卷和成績(jī)是在各類教學(xué)質(zhì)量檢查和評(píng)估中不可或缺的重要材料,通過試卷檢查可以發(fā)現(xiàn)教學(xué)過程中教與學(xué)兩方面的問題反映,試卷質(zhì)量真實(shí)反映了高校的教學(xué)質(zhì)量水平和質(zhì)量評(píng)價(jià)結(jié)果,決定了考試質(zhì)量、成績(jī)的公平和有效性。所以試卷質(zhì)量評(píng)價(jià)日漸成為教學(xué)質(zhì)量反饋和評(píng)估的核心和重要指標(biāo),試卷質(zhì)量管理也變成高校教學(xué)管理的重要組成部分,如何有效地監(jiān)控和提高試卷質(zhì)量,可建立考試質(zhì)量評(píng)價(jià)系統(tǒng)推動(dòng)考試質(zhì)量不斷提高[1]。長(zhǎng)期以來為了促進(jìn)試卷命題、評(píng)卷和歸檔的規(guī)范化建設(shè),我校多次組織校院兩級(jí)教學(xué)督導(dǎo)組專家,從試卷歸檔、試卷評(píng)閱、試題質(zhì)量三個(gè)方面對(duì)全校多個(gè)學(xué)年學(xué)期所有課程進(jìn)行全覆蓋式的抽調(diào)性隨機(jī)檢查,檢查結(jié)果試卷質(zhì)量方面凸顯問題主要集中在試卷格式要求上,說明這種檢查方式只能進(jìn)一步規(guī)范試卷形式,卻無法對(duì)試卷命題質(zhì)量和內(nèi)容進(jìn)行把關(guān)和審查。在2016年的審核性評(píng)估中共調(diào)閱74門課程5737份試卷 ,針對(duì)試卷質(zhì)量問題,各位專家提出了很多寶貴意見和建議,希望進(jìn)一步提高試卷質(zhì)量管理工作,采取更有效的措施對(duì)考試成績(jī)、試卷、試題進(jìn)行科學(xué)分析,及時(shí)發(fā)現(xiàn)教學(xué)內(nèi)容和試卷試題中存在的問題,形成長(zhǎng)效反饋機(jī)制,使教師可以充分了解學(xué)生學(xué)習(xí)情況,自查教學(xué)效果和質(zhì)量,促使其不斷總結(jié)教學(xué)經(jīng)驗(yàn)、改進(jìn)出題方法和技巧從而提高試題和試卷質(zhì)量,確??荚嚶毮艿挠行Оl(fā)揮。學(xué)校教學(xué)管理部門也可以根據(jù)教學(xué)質(zhì)量評(píng)價(jià)獲取的反饋信息,對(duì)整個(gè)教學(xué)信息進(jìn)行全方面科學(xué)分析,對(duì)教學(xué)質(zhì)量和人才培養(yǎng)質(zhì)量做出價(jià)值判斷,從而有針對(duì)性地調(diào)整和改革教學(xué)。
試卷質(zhì)量可以檢驗(yàn)教學(xué)質(zhì)量好壞,考核學(xué)生學(xué)習(xí)水平高低,真實(shí)反映學(xué)生掌握知識(shí)和靈活運(yùn)用知識(shí)的能力,是教學(xué)質(zhì)量評(píng)價(jià)的核心內(nèi)容,所以進(jìn)行試卷質(zhì)量分析是非常重要的。根據(jù)分析結(jié)果對(duì)試題進(jìn)行篩選,去粗存精,保留高質(zhì)量題目,剔除低質(zhì)量題目,整體提高試卷質(zhì)量,達(dá)到試卷考核的最終目的,體現(xiàn)考試成績(jī)的真實(shí)有效和公平性。
試卷質(zhì)量評(píng)價(jià)方法一般分為定性和定量?jī)煞N。定性評(píng)價(jià)是指對(duì)試卷或試題的語言文字的描述是否合理進(jìn)行分析,如遣詞用語是否恰當(dāng)、題目敘述是否清晰易懂、知識(shí)點(diǎn)涵蓋是否得當(dāng)、卷面結(jié)構(gòu)是否合理等一系列語言文字組織的問題的分析;定量評(píng)價(jià)是指對(duì)試卷或試題進(jìn)行難度、區(qū)分度、信度、效度與標(biāo)準(zhǔn)差等定量指標(biāo)的結(jié)算與分析[2]。青海師范大學(xué)采取一種利用MATLAB數(shù)理統(tǒng)計(jì)方法為基礎(chǔ)算法的試卷質(zhì)量分析方法,MATLAB強(qiáng)大的數(shù)學(xué)運(yùn)算處理功能,可以大大降低教學(xué)管理人員在原先只是簡(jiǎn)單利用工作軟件進(jìn)行手工計(jì)算的工作強(qiáng)度,提高了工作效率和準(zhǔn)確性,提高命題質(zhì)量,為實(shí)現(xiàn)教學(xué)管理的科學(xué)化與規(guī)范化提供了一種方便的途徑[3]。廣東工業(yè)大學(xué)利用考試質(zhì)量分折專用軟件Examanls,能夠迅速、準(zhǔn)確地對(duì)每一道試題以及整份試卷的總體質(zhì)量作出科學(xué)的比較和評(píng)價(jià)[4]。東莞理工學(xué)院基于知識(shí)點(diǎn)的試卷質(zhì)量分析使評(píng)測(cè)粒度更加細(xì)膩,評(píng)價(jià)依據(jù)更加準(zhǔn)確有效,能夠真正反映出試卷的實(shí)際難度。最后根據(jù)評(píng)測(cè)標(biāo)準(zhǔn)的自身特點(diǎn),利用OLAP技術(shù)對(duì)其加以實(shí)現(xiàn),通過實(shí)踐證明評(píng)測(cè)標(biāo)準(zhǔn)的有效性[5]。
我校自2014年起引進(jìn)強(qiáng)智教務(wù)管理系統(tǒng),為了更適應(yīng)我校的管理模式,有效地提高各崗位工作效率,強(qiáng)智公司派駐技術(shù)員為我們進(jìn)行量身定制開發(fā)。試卷質(zhì)量管理及評(píng)價(jià)分析模塊的研制開發(fā)工作,需要崗位工作人員與技術(shù)開發(fā)人員進(jìn)行有效溝通,定制合理方案。
試卷質(zhì)量評(píng)價(jià)通常是利用教育測(cè)量學(xué)原理和多種統(tǒng)計(jì)分析方法,對(duì)成績(jī)分布、比較與試卷質(zhì)量進(jìn)行分析的結(jié)果。通過考核成績(jī)進(jìn)行試卷質(zhì)量評(píng)價(jià)時(shí),首先可采用檢驗(yàn)法去驗(yàn)證待測(cè)試卷樣本量是否滿足正態(tài)分布,如果隨機(jī)樣本數(shù)據(jù)不能嚴(yán)格符合正態(tài)分布要求,要適當(dāng)擴(kuò)大觀測(cè)樣本單位數(shù),使其盡量符合正態(tài)分布,在此基礎(chǔ)上再對(duì)試卷質(zhì)量進(jìn)行量化分析。試卷質(zhì)量量化評(píng)價(jià)最重要的是要確定試題難度、區(qū)分度、試卷信度和效度四項(xiàng)量化指標(biāo)的算法和要求。
難度是指試題的難易程度,是評(píng)價(jià)考試的一個(gè)非常重要的指標(biāo)。教師在命制試卷時(shí),務(wù)必使整卷試題具有適當(dāng)?shù)碾y易度,題目應(yīng)由易到難,逐步增加,不應(yīng)太過偏頗,題目太難或太容易,均不利于鑒別出學(xué)生的實(shí)際水平。一般最常用的難度指標(biāo)是得分率P,根據(jù)試題的客觀性和主觀性不同,難度指標(biāo)分別為Pi=ni/N和Pi=Pi=xi/Xmax??陀^性試題得分率Pi跟第i道題目通過人數(shù)有關(guān),n是該題選擇了正確答案的考生數(shù),N是考生總?cè)藬?shù);主觀性試題得分率Pi跟第i道題目得分平均分有關(guān),xi是第i道題目主觀性試題的得分平均分,Xmax是第i道題目的滿分得分。難度指標(biāo)的數(shù)值與試題的實(shí)標(biāo)困難程度相反,P值越小,題目越難。P<0.3為難題;P>0.8為易題;0.3≤P≤0.8為適中題.
區(qū)分度是試題對(duì)考生心理特征的區(qū)分能力,可以反映學(xué)生掌握知識(shí)水平高低和能力差異,是篩選試題及評(píng)價(jià)試題質(zhì)量的重要指標(biāo)。區(qū)分度高的試卷能將不同水平的考生區(qū)分開來,好、中、差三個(gè)層次的學(xué)生,試卷得分會(huì)處在相應(yīng)的分?jǐn)?shù)段中,學(xué)習(xí)好的學(xué)生得到高分,學(xué)習(xí)差的學(xué)生得到低分;試卷的編制應(yīng)該要求區(qū)分度明顯,即應(yīng)該真實(shí)切合學(xué)生的真實(shí)學(xué)習(xí)水平,不同層次學(xué)生的考試成績(jī)應(yīng)該處于不同分?jǐn)?shù)段中。區(qū)分度的算法一般主觀性試題采用極端分組法,客觀性試題采用相關(guān)法。
信度是指使用同一試卷對(duì)考生重復(fù)測(cè)驗(yàn)時(shí),或兩個(gè)平行試卷對(duì)考生測(cè)驗(yàn)時(shí),所得測(cè)驗(yàn)分?jǐn)?shù)的一致性和穩(wěn)定性程度。信度除了要說明成績(jī)的真實(shí)性之外,還要說明題目涉及的內(nèi)容與教學(xué)的相關(guān)程度。就試卷總體而言,信度高的試題較少受到偶然因素的影響,對(duì)任何學(xué)生的多次測(cè)定,都會(huì)產(chǎn)生比較穩(wěn)定一致的結(jié)果。Examanls通過計(jì)算內(nèi)部一致性信度系數(shù)間接地估計(jì)信度的太?。簩?duì)客觀性試題采用的是目前被認(rèn)為是最準(zhǔn)確的庫一理法(Kuder—Richar-sonmethod)的第2O號(hào)公式,而對(duì)主觀性試題采用的則是克龍巴(cr0nbach)的α系數(shù)[4]。
效度是指考試有效性或正確性的質(zhì)量指標(biāo),體現(xiàn)考試成績(jī)是否可以準(zhǔn)確反映考生掌握知識(shí)程度。效度表示題目的得分與試卷總分之間的內(nèi)在一致性,可以鑒別被試者水平高低,若測(cè)試的結(jié)果與學(xué)生平時(shí)學(xué)習(xí)成績(jī)基本一致,則說明這次考試有較高的效度。試題效度的計(jì)算是用該試題得分與總分之間的相關(guān)系數(shù)表示。
在進(jìn)行試卷質(zhì)量系統(tǒng)設(shè)計(jì)時(shí),要求可以對(duì)試卷質(zhì)量分析相關(guān)指標(biāo)、項(xiàng)目進(jìn)行加權(quán)設(shè)定,根據(jù)不同試卷要求有效調(diào)整信度、效度、區(qū)分度、難度在質(zhì)量分析中的權(quán)重比值,通過實(shí)際測(cè)量值驗(yàn)證評(píng)價(jià)指標(biāo)的合理性和科學(xué)性。
對(duì)試卷質(zhì)量量化指標(biāo)的分析,實(shí)際上是在考試結(jié)束后對(duì)試卷質(zhì)量的一種延后性反映,通過試卷成績(jī)高低來判斷試卷質(zhì)量的優(yōu)劣,就整體提高試卷質(zhì)量而言,這只是一個(gè)方面。根據(jù)我校實(shí)際情況分析,教師重視考試卻輕視試卷分析,試卷分析流于形式,甚至同一科目試卷每次分析結(jié)果大致相同,卻未真正意義上從試卷分析結(jié)果中發(fā)現(xiàn)問題,改進(jìn)試題,提高命題水平。因此,考前做好試卷質(zhì)量的檢驗(yàn),通過反饋信息,及時(shí)發(fā)現(xiàn)教和學(xué)雙方面的薄弱環(huán)節(jié)和不足之處,有效地改進(jìn)教學(xué)方式,提高教學(xué)水平,使教學(xué)相長(zhǎng),真正意義上起到檢驗(yàn)提高教學(xué)質(zhì)量才是試卷質(zhì)量分析的目的所在。
目前我校教師命題一般都是根據(jù)教學(xué)大綱和教材內(nèi)容,以考查學(xué)生基本知識(shí)和基本理論為主,會(huì)出現(xiàn)延用往年試卷,對(duì)語言文字等稍作改變,同一理論不同名詞單純反復(fù)考試基本概念,作為教師本身沒有深入挖掘知識(shí)內(nèi)涵,沒有從開發(fā)學(xué)生綜合分析和思維能力的角度去設(shè)計(jì)題目,知識(shí)點(diǎn)較為零散單一,試卷題目整體感覺較為隨意和敷衍。為了正確評(píng)價(jià)試題質(zhì)量,教師應(yīng)破除單純強(qiáng)調(diào)知識(shí)考核的片面質(zhì)量觀,樹立對(duì)學(xué)生的發(fā)展進(jìn)行全面考核的觀念;正確掌握考核依據(jù)和范圍,以相應(yīng)的課程大綱為依據(jù),以教材為基本范圍,理論聯(lián)系實(shí)際;課程教學(xué)內(nèi)容覆蓋要廣的前提下突出重點(diǎn),命題形式多樣化,主觀題、客觀題比例要適當(dāng);試卷題目盡量減少機(jī)械記憶和簡(jiǎn)單模仿,適量增加分析、綜合、歸納型的題目,以提高學(xué)生分析和解決問題的能力,適當(dāng)引入該門課程目前學(xué)科發(fā)展的前瞻性內(nèi)容,理論與實(shí)際相結(jié)合,以實(shí)現(xiàn)課程大綱規(guī)定的目標(biāo)??傊趯?duì)試卷質(zhì)量量化分析的基礎(chǔ)上,要切實(shí)重視分析結(jié)果,有分析、有解決、有貫徹、有提高。
成都中醫(yī)藥大學(xué)學(xué)報(bào)(教育科學(xué)版)2018年3期