梁建梭,陳奕娟,張誠一
(海南師范大學(xué)數(shù)學(xué)與統(tǒng)計(jì)學(xué)院,海南海口571158)
試卷是考查學(xué)生學(xué)習(xí)狀況的重要手段,更是促進(jìn)教育教學(xué)循序漸進(jìn)、不斷提高教學(xué)質(zhì)量的有效途徑之一.科學(xué)實(shí)效的試卷分析評價能成為提升教師教學(xué)水準(zhǔn)和指導(dǎo)學(xué)生的積極求知催化劑,因此,基于課程標(biāo)準(zhǔn)對試卷評價顯得尤其必要[1],特別是基于課程標(biāo)準(zhǔn)知識點(diǎn)的試卷契合度的評價.
之前有很多人對于試卷評價做了很多工作和研究,也取得一定的成果,例如河北大學(xué)耿彥如寫的《模糊綜合評判用于高考數(shù)學(xué)試卷評價的研究》[2],通過確定評價對象,建立指標(biāo)專家小組、目標(biāo)層次系統(tǒng)和初始指標(biāo)系統(tǒng),再逐步簡化建立新的評價指標(biāo)體系.再如浙江大學(xué)韓建民的《試卷質(zhì)量模糊綜合評價模型的研究和建立》[3],建立了試卷難度、區(qū)分度、信度,覆蓋率、試題合格率,以及峰度、偏度三級模糊綜合評判模型.但基于課程標(biāo)準(zhǔn)的試卷評價相對較少,對基于課程標(biāo)準(zhǔn)知識點(diǎn)的試卷契合度的評價那就更少.
基于課程標(biāo)準(zhǔn)知識點(diǎn)的試卷契合度是指:以課程標(biāo)準(zhǔn)中要求掌握的知識點(diǎn)、對知識點(diǎn)的掌握程度、重要度、難度[4]和能力的要求為基準(zhǔn),評價試卷中出題情況與課程標(biāo)準(zhǔn)中所規(guī)定的要求相匹配、貼近、一致程度的測量結(jié)果描述.這是一個模糊的概念,故利用模糊數(shù)學(xué)方法來進(jìn)行評價分析會更符合客觀實(shí)際.因此,本文首先基于課程標(biāo)準(zhǔn)建立知識分布體系,選取“掌握程度、重要度、難度和能力要求”作為四大指標(biāo),給出了各評價因素指標(biāo)的數(shù)據(jù)標(biāo)準(zhǔn)和采集方法,并應(yīng)用模糊集之間的貼近度,給出了試卷的契合度評價方法.通過對評價結(jié)果的分析,尋找其原因,針對上述的現(xiàn)象,提出相應(yīng)的政策、措施和建議.
度量兩個模糊集合的關(guān)系密切程度可以用兩者之間的距離來描述,即距離越大,關(guān)系越稀疏;而距離越小,則關(guān)系越密切.然而當(dāng)論域的元素較多時,用距離來描述,其工作量往往較大,為此,我國學(xué)者汪培莊等人提出了另一種表示兩個模糊集接近程度的“貼近度”概念,具體求兩個模糊集的貼近度步驟如下:
1)建立原始數(shù)據(jù)矩陣
設(shè)待分類的n個樣本為{x1,x2,…,xn},每個樣本都有m個特征,記為
xi={xi1,xi2,…,xim},i=1,2,…,n
于是得到原始數(shù)據(jù)矩陣:即
X=(xij)n×m,i=1,2,…,n;j=1,2,…,m.
從而可用一個描述特征的矩陣來描述整個樣本集,X中的每一列代表所有樣本的一種特征值,每一行代表一個樣本的所有特征值.
2)數(shù)據(jù)規(guī)格化處理
為了保證研究的科學(xué)性,本文使用數(shù)據(jù)均來自2012年普通高等學(xué)校招生全國統(tǒng)一考試?yán)砜茢?shù)學(xué)試卷(必修+選修II).由于特性指標(biāo)的量綱和數(shù)量級不相同,故在運(yùn)算過程中可能突出某數(shù)量級特別大的特性指標(biāo)對分類的作用,而降低甚至排除了某些數(shù)量級很小的特征指標(biāo)的作用,致使對各特征指標(biāo)的分類缺乏一個統(tǒng)一的尺度.為了消除這一影響,首先對數(shù)據(jù)進(jìn)行數(shù)據(jù)規(guī)格化的處理.相應(yīng)的變換公式為:
顯然通過對原始數(shù)據(jù)的處理,得到初始矩陣.
3)計(jì)算模糊集合的內(nèi)積與外積[5]
設(shè)U為論域,,則稱(A(u)∨B(u))為A與B的內(nèi)積;稱A?B=∧u∈u(A(u)∧B(u))為A與B的外積.
4)模糊集合之間的格貼近度[5]
課程標(biāo)準(zhǔn)知識體系是指根據(jù)課程標(biāo)準(zhǔn)建立的知識體系.見表1.
根據(jù)知識體系,將指標(biāo)集U分為四個層次:
第一級指標(biāo)集:U={S,I,D,A},其中S:課程標(biāo)準(zhǔn)中要求對知識點(diǎn)的掌握程度;I:課程標(biāo)準(zhǔn)中界定知識點(diǎn)的重要度;D:課程標(biāo)準(zhǔn)對知識點(diǎn)所確定的難度;A:課程標(biāo)準(zhǔn)對知識點(diǎn)要求所要體現(xiàn)的能力.第二級因素集如下:
表1 課程標(biāo)準(zhǔn)知識體系Tab.1 Knowledge system of curriculum standards
1)對知識點(diǎn)掌握要求指標(biāo)S={sij},其中sij表示知識點(diǎn)nij對應(yīng)的掌握要求,可以根據(jù)課程標(biāo)準(zhǔn)中使用的一些行為動詞,進(jìn)行分類賦權(quán)值.以下是課程標(biāo)準(zhǔn)[4]中使用了一些行為動詞,以界定相關(guān)內(nèi)容知識點(diǎn)的掌握要求(見表2).
表2 課程標(biāo)準(zhǔn)要求對知識點(diǎn)掌握程度的分層表Tab.2 Hierarchical table about knowledge mastery of curriculum standards
2)重要度I={iij},其中iij表示知識點(diǎn)nij對應(yīng)的重要度,用其所占課時表示;
3)難度D={dij},其中dij表示知識點(diǎn)nij對應(yīng)的難度,同時引入史寧中教授等[8]的靜態(tài)定量難度模型來計(jì)算(其中0≤α≤1),其中該模型中d表示課程難度,S表示課程深度,也用掌握知識要求深度表示,G表示課程廣度,在這里指考試要求的知識點(diǎn)個數(shù),T表示該課程所需要的時間,在這里也用重要度來表示,表示為可比廣度,表示為可比深度,用α表示加權(quán)系數(shù),它反映了課程對于可比廣度與可比深度的側(cè)重程度,課程難度在此實(shí)際上就是可比深度與可比廣度的加權(quán)平均值.取α=0.5,因?yàn)樵谶@里認(rèn)為這兩者(可比深度與可比廣度)的側(cè)重程度是相同的.
4)能力要求指標(biāo):A=(aij),其中aij表示知識點(diǎn)nij對應(yīng)的能力要求,具體見表3.
表3 課程標(biāo)準(zhǔn)要求體現(xiàn)知識點(diǎn)的能力分層表Tab.3 Hierarchical table about reflecting the knowledge ability of curriculum standards
1)試卷體現(xiàn)對知識的掌握等級以及等級對應(yīng)的權(quán)值,見表4;
表4 試卷要求掌握程度分等級表Tab.4 Grading table of test requiring mastery of test paper
2)試卷中知識點(diǎn)的重要度用其所占的分?jǐn)?shù)值來衡量;
3)試卷中知識點(diǎn)的難度分容易、中等、較難和難三個等級,其中容易賦值1,中等賦值2,較難賦值3,難賦值4;難度越深,分?jǐn)?shù)越高.
4)試卷體系中的能力要求分等級和賦值見表5.
對試卷中知識點(diǎn)掌握程度、難度和能力要求的確定,我們利用一線教師、考試研究人員和專家綜合分析后[9]的賦值來確定.
因此,由以上的具體指標(biāo),可以建立如下試卷的知識分布體系(見表6).
首先根據(jù)課程標(biāo)準(zhǔn)對知識點(diǎn)的分布,建立課程標(biāo)準(zhǔn)知識體系表,其次以2012年普通高等學(xué)校招生全國統(tǒng)一考試?yán)砜茢?shù)學(xué)試卷(必修+選修II)為例,建立試卷知識分布表.最后,進(jìn)行歸一化處理,分別得
表5 試卷能力要求等級表Tab.5 Grading table of capacity requirements of test paper
表6 試卷知識分布體系表Tab.6 Knowledge distribution system table of the test paper
到課程體系矩陣K和試卷體系矩陣F:
根據(jù)本文的需要,將選取Hamming 貼近度,即Ham?ming 貼近度其中.利用這種方法結(jié)果算得兩體系四個指標(biāo)的貼近度分別為0.7876,0.8256,0.6217,0.5532.
通過分析評價結(jié)果以及相關(guān)的數(shù)據(jù),可以進(jìn)行如下分析:以函數(shù)中的對數(shù)函數(shù)知識點(diǎn)做例子來檢驗(yàn)貼近度結(jié)果,課程和試卷體系中的對知識點(diǎn)掌握程度要求、重要度、難度和能力要求這四個指標(biāo)的最初數(shù)據(jù)分別為(8/3,32/6,0.343,2)和(3,5,2,3).其中掌握程度權(quán)值分別為8/3 和3,這兩個數(shù)據(jù)還是比較契合的,具體分析如下:課程體系中對數(shù)函數(shù)要求能理解①對數(shù)的概念、②掌握對數(shù)的運(yùn)算性質(zhì)、③掌握對數(shù)函數(shù)的概念、性質(zhì)和圖像,課程體系中按理解賦值2,掌握賦值3,再對對數(shù)函數(shù)這三分點(diǎn)加權(quán)1/3,最終對數(shù)函數(shù)掌握程度要求應(yīng)該為(2+3+3)/3=8/3,掌握程度介于理解層次到掌握層次之間,而且更接近掌握層次;試卷體系中有關(guān)對數(shù)函數(shù)的題目是選擇題第(9)小題,經(jīng)過綜合分析,我們定其要求掌握程度為掌握層次,即權(quán)值是3.重要度32/6 和5 也是相匹配的,具體分析如下:32/6表示課程體系中對數(shù)函數(shù)這個知識點(diǎn)所占的課時數(shù),它占課程所有內(nèi)容總課時數(shù)241的比例是2.2%,而5是表示試卷體系中對數(shù)函數(shù)知識點(diǎn)所占的分?jǐn)?shù),它占試卷總分?jǐn)?shù)150分的比例是3.3%,兩個數(shù)據(jù)還是相對接近的.知識點(diǎn)的難度,界定于0 到1 之間,因此0.343(34.3%)表示課程體系中對數(shù)函數(shù)這個知識點(diǎn)是比較容易,而2則表示試卷體系中對數(shù)函數(shù)題目(選擇題9小題)的綜合分析,確認(rèn)其難度是中等的.能力要求數(shù)據(jù)中的2表示,在根據(jù)課程標(biāo)準(zhǔn)中對數(shù)函數(shù)的能力要求為能識別的情況下可以進(jìn)一步會使用,因?yàn)闄?quán)值為2;而3 表示試卷體系中對數(shù)函數(shù)考查的能力是會求會運(yùn)算的層次,因此權(quán)值為3,對數(shù)函數(shù)這個知識點(diǎn)在能力要求上相差了一個等級.
總體上講,四組數(shù)據(jù)還是相對貼近的,可以認(rèn)為契合度比較好,其中重要度最貼近,依次到掌握程度、難度和能力要求.然而還是有一些不足,重要度分析中數(shù)據(jù)用到了所占比例來分析,而真正在計(jì)算契合度的時候并沒有把比例算進(jìn)去;能力要求的確定都需要人為很深入地綜合分析才準(zhǔn)確,人為的思考總會有些主觀性,因此這也是不足.
計(jì)算結(jié)果表明,2012 年普通高等學(xué)校招生全國統(tǒng)一考試?yán)砜茢?shù)學(xué)(必修+選修II)試卷的契合度是較好的.為增加契合度,本文建議:
1)單純增加未考核到的內(nèi)容,加大題目數(shù)量.同時為保證學(xué)生做題的質(zhì)量,應(yīng)增加相應(yīng)的時間或者分段內(nèi)容模式讓學(xué)生進(jìn)行考核,避免題目過多,學(xué)生產(chǎn)生厭煩的情緒.
2)刪除重復(fù)知識點(diǎn)的題目,從而在保持題量的情況下,可以增加未包含又需要考核的知識點(diǎn)內(nèi)容.
3)選擇的題目增強(qiáng)綜合性,知識點(diǎn)交叉,一題有多點(diǎn),并且題目相對知識點(diǎn)的難度、重要度等要求需要參考課程標(biāo)準(zhǔn)中的要求來確定.
其中1)和2)點(diǎn)主要是提高了試卷的覆蓋度[10],從而提高試卷的契合度,3)點(diǎn)則既能夠提高試卷的覆蓋度,又能使試卷對知識點(diǎn)掌握要求、重要度、難度和能力要求等方面更接近課程標(biāo)準(zhǔn),從而多方面多角度改善試卷的契合度.
本文從課程標(biāo)準(zhǔn)的要求出發(fā),對高考試卷的掌握程度、重要度、難度和能力要求進(jìn)行分析,相應(yīng)地建立了課程知識體系和試卷知識體系,進(jìn)而利用模糊集之間的貼近度來計(jì)算兩個體系的契合度,最后根據(jù)契合度來分析和評價試卷與課程標(biāo)準(zhǔn)的契合程度.盡管這個模型中的基本指標(biāo)的構(gòu)成將因不同的評價要求而改變和調(diào)整,但是模型的基本框架或形式是不變的,具有較強(qiáng)的普適性,也為試卷評價工作提供了一個工具參考,使得高考試卷評價更具有操作性、客觀性,能在相當(dāng)程度上對高考試卷能力評價起到促進(jìn)作用,從而促進(jìn)中學(xué)數(shù)學(xué)教育教學(xué)的發(fā)展.
[1]鄧萬友.綜合試卷評價體系的構(gòu)建與實(shí)現(xiàn)[J].內(nèi)蒙古師范大學(xué)學(xué)報(bào):教育科學(xué)版,2006,19(1):41-44.
[2]耿彥如.模糊綜合評判用于高考數(shù)學(xué)試卷評價的研究[D].保定:河北大學(xué),2005.
[3]韓建民,王麗俠,張玲波,等.試卷質(zhì)量模糊綜合評價模型的研究與建立[C].2005 年中國模糊邏輯與計(jì)算智能聯(lián)合學(xué)術(shù)會論文集,2005:489-494.
[4]孫維桐.淺談試卷分析在教學(xué)與教學(xué)管理中的作用[J].衛(wèi)生職業(yè)教育,2002,20(2):87-88.
[5]謝季堅(jiān).模糊數(shù)學(xué)方法及其應(yīng)用[M].武漢:華中科技大學(xué)出版社,2000.
[6]葉堯城.高中數(shù)學(xué)課程標(biāo)準(zhǔn)教師讀本[M].武漢:華中師范大學(xué)出版社,2003.
[7]金曉紅.基于課程標(biāo)準(zhǔn)的浙江省高考數(shù)學(xué)試卷一致性分析[D].長春:東北師范大學(xué),2012.
[8]王輝.不同版本初中數(shù)學(xué)教科書與課程標(biāo)準(zhǔn)的一致性分析[D].長春:東北師范大學(xué),2007.
[9]李為.一種實(shí)用于教師自評的試卷分析格式設(shè)計(jì)[J].南京曉莊學(xué)院學(xué)報(bào),2006(1):83-87;75.
[10]朱永香,肖贊英,肖丹秦,等.試卷分析指標(biāo)的選擇及其應(yīng)用[J].醫(yī)學(xué)教育探索,2008,7(3):265-266.