薛亮+馬敏娜+付來強(qiáng)+陸聞雪
摘要:結(jié)合化學(xué)高考試題特征及已有研究對(duì)鮑建生試題難度模型進(jìn)行修改,制定高考化學(xué)試題難度量化工具的基本結(jié)構(gòu)和評(píng)定過程,并運(yùn)用該量化工具對(duì)2016年全國(guó)新課標(biāo)卷Ⅰ、Ⅱ進(jìn)行難度分析。結(jié)果顯示:該量化工具不僅能衡量試題難度,而且能具體指出試題難度差異的主要表現(xiàn),這為試題事前難度分析和試題修正提供了新思路。
關(guān)鍵詞:試題難度;量化工具;試題分析;高考試題
文章編號(hào):1005–6629(2017)2–0032–05 中圖分類號(hào):G633.8 文獻(xiàn)標(biāo)識(shí)碼:B
教師普遍感覺全國(guó)新課標(biāo)卷Ⅰ難度水平高于新課標(biāo)卷Ⅱ。但難度到底相差多大?難度特征如何?難度主要表現(xiàn)在哪些方面?這就需要一個(gè)量化標(biāo)準(zhǔn)。文獻(xiàn)分析表明,目前主要借助事后難度值即通過率或得分率來衡量試題難度。為了保證試題整體性、全面性、覆蓋率、知識(shí)考查比例的科學(xué)性和合理性,避免考試結(jié)果出現(xiàn)明顯差錯(cuò),就需要對(duì)試題難度進(jìn)行事前分析。
1 研究工具設(shè)計(jì)
Nohara(2001)在一份提交給美國(guó)國(guó)家教育統(tǒng)計(jì)中心的報(bào)告中,首次提出了總體難度(Overall Difficuity)的概念,其中涉及四個(gè)難度因素:(1)包含“擴(kuò)展性問題”的百分比;所謂擴(kuò)展性問題是指要求學(xué)生自己得出結(jié)論,并且對(duì)解題過程做出解釋的問題;(2)含有“實(shí)際背景”的題目的百分比;(3)包含“運(yùn)算”的題目的百分比,其中不包括屬于“數(shù)量”部分的題目;(4)包含“多步推理”的題目的百分比。
鮑建生認(rèn)為該模型對(duì)四個(gè)難度因素簡(jiǎn)單地從有無劃分顯得較為粗糙。此外,“擴(kuò)展性問題”只是對(duì)題型的簡(jiǎn)單劃分,與學(xué)科知識(shí)內(nèi)容無關(guān),將此模型應(yīng)用于數(shù)學(xué)課程難度分析缺乏一定的相關(guān)性。針對(duì)以上不足,鮑建生將其參數(shù)修改為“探究水平”、“背景水平”、“推理水平”、“運(yùn)算水平”和“知識(shí)綜合水平”,構(gòu)建了試題難度模型,并應(yīng)用該模型對(duì)數(shù)學(xué)高考試題整體難度進(jìn)行分析。
從化學(xué)視角來看,化學(xué)試題難度影響因素主要包括:試題考察能力的層次;試題考察內(nèi)容的深度,通常認(rèn)為特殊符號(hào)、原理和有關(guān)具體事實(shí)的定義及其直接描述等,屬于知識(shí)深度的第一層次,進(jìn)一步的推論及有關(guān)性質(zhì)的理論等屬于第二層次,知識(shí)的深部?jī)?nèi)涵和外延及其與相關(guān)知識(shí)的內(nèi)部聯(lián)系、特殊情境下的性質(zhì)與特征等屬于第三層次;試題考察深度,指試題所考查的知識(shí)點(diǎn)多少、知識(shí)點(diǎn)跨度和知識(shí)點(diǎn)聯(lián)系的復(fù)雜程度;試題情境、試題條件的隱蔽性或干擾性、試題解答的簡(jiǎn)繁度(解答試題運(yùn)算或者推理步驟數(shù))、試題開放程度、試題難度的安排順序等[1]。深入研究鮑建生試題難度模型發(fā)現(xiàn),其對(duì)試題難度的預(yù)估均涵蓋上述影響化學(xué)試題難度的因素,同時(shí)紀(jì)靜等在高考數(shù)學(xué)試題難度評(píng)定工具中提出鮑建生數(shù)學(xué)試題難度模型對(duì)有相似影響試題難度因素的高考試題在一定范圍內(nèi)也適用[2]。以此來看,借助鮑建生試題難度模型對(duì)化學(xué)試題進(jìn)行事前預(yù)估在一定程度上是可行的。
鮑建生試題難度模型主要從五個(gè)方面對(duì)試題難度進(jìn)行分析,應(yīng)用該方法對(duì)我國(guó)高考化學(xué)試題難度分析時(shí)仍存在一定的不足:一方面原始難度模型以有無探究這一單一指標(biāo)來衡量試題開放程度顯然不夠,張靜在化學(xué)高考試題難度影響因素研究中指出題目條件和結(jié)論是否確定更能表征試題開放程度[3];另一方面原始難度模型中無階梯水平這一指標(biāo),無法衡量因題目安排次序而造成的試題難度,同時(shí)陳燕、王祖浩在高考客觀試題量化工具研究中指出階梯水平從試題的編排次序來表征試題難度[4]?;诖?,為了更準(zhǔn)確地量化高考化學(xué)試題難度,本研究根據(jù)化學(xué)試題特征結(jié)合已有研究,增添了內(nèi)容水平、開放水平和階梯水平難度指標(biāo),并對(duì)各指標(biāo)的子指標(biāo)也進(jìn)行了細(xì)化和修改,形成了鮑建生試題難度量化工具。在此工具中包含8個(gè)難度指標(biāo)和23個(gè)子指標(biāo),具體如下表:
2 研究過程
2.1 試題與專家選擇
截止2016年10個(gè)省份采用全國(guó)卷Ⅰ,12個(gè)省份采用全國(guó)卷Ⅱ,9個(gè)省份采用自主命題?;谝陨显虮狙芯窟x取全國(guó)卷Ⅰ、Ⅱ?yàn)檠芯繉?duì)象。選取五位化學(xué)專家型教師和五位化學(xué)專業(yè)研究生作為分析專家。
2.2 專家分析
專家從“背景水平、內(nèi)容水平、推理水平、探究水平、開放水平、運(yùn)算水平、知識(shí)綜合水平、階梯水平”8個(gè)指標(biāo)的子指標(biāo),分別對(duì)每道試題進(jìn)行分析,并根據(jù)賦值標(biāo)準(zhǔn)賦值。
例1 選擇題案例分析
(全國(guó)新課標(biāo)Ⅰ)12.298K時(shí),在20.0mL 0.10 mol/L氨水中滴入0.10 mol/L的鹽酸,溶液的pH與所加鹽酸的體積關(guān)系如下圖所示。已知0.10 mol/L氨水的電離度為1.32%,下列敘述正確的是( )。
(2)圖(a)為丙烯腈產(chǎn)率與反應(yīng)溫度的關(guān)系曲線,最高產(chǎn)率對(duì)應(yīng)溫度為460℃,低于460℃時(shí),丙烯腈的產(chǎn)率 (填“是”或者“不是”)對(duì)應(yīng)溫度下的平衡產(chǎn)率,判斷理由是 ;高于460℃時(shí),丙烯腈產(chǎn)率可能降低的原因是 (雙選)
A.催化劑活性降低 B.平衡常數(shù)增大
C.副反應(yīng)增大 D.反應(yīng)活化能增大
(3)丙烯腈與丙烯醛產(chǎn)率與氨氣/丙烯關(guān)系圖如(b)所示,由圖可知,氨氣與丙烯的物質(zhì)的量之比約為 ,理由是 。進(jìn)料氨氣、空氣、丙烯的理論體積之比為 。
試題解析:①因?yàn)閮蓚€(gè)反應(yīng)均為放熱量大的反應(yīng),所以熱力學(xué)趨勢(shì)大。該部分屬于內(nèi)容水平中的理解層次,賦值為2;推理水平中的簡(jiǎn)單推理層次,賦值為2;運(yùn)算水平無運(yùn)算層次,賦值為1;開放水平為條件和結(jié)論都確定層次,賦值為1;知識(shí)綜合水平中的一個(gè)知識(shí)點(diǎn)層次,賦值為1。②該反應(yīng)為氣體體積增大的放熱反應(yīng),降低溫度、降低壓強(qiáng)有利于丙烯腈的平衡產(chǎn)率。該部分屬于內(nèi)容水平中的理解層次,賦值為2;推理水平的簡(jiǎn)單推理層次,賦值為2;開放水平中條件確定而結(jié)論不確定層次,賦值為2;運(yùn)算水平中的無運(yùn)算層次,賦值為1;知識(shí)綜合水平中的兩個(gè)知識(shí)點(diǎn)層次,賦值為2。③由圖a可知,提高丙烯腈平衡產(chǎn)率的關(guān)鍵因素是催化劑。該反應(yīng)為放熱反應(yīng),平衡產(chǎn)率隨著溫度的升高而降低,反應(yīng)剛開始時(shí),尚未達(dá)到平衡狀態(tài),460℃以前是建立化學(xué)平衡的過程,所以低于該溫度時(shí)不是對(duì)應(yīng)溫度下的平衡產(chǎn)率,高于該溫度時(shí)產(chǎn)率降低。該部分屬于推理水平的復(fù)雜推理,賦值為3;內(nèi)容水平的理解水平,賦值為2;知識(shí)綜合水平的兩個(gè)知識(shí)點(diǎn)和多個(gè)知識(shí)點(diǎn)層次,各1次,賦值為2和3。A催化劑在一定范圍內(nèi)催化活性較高,溫度過高,催化活性降低;B平衡常數(shù)的大小不會(huì)影響平衡產(chǎn)率;C副產(chǎn)物較多時(shí)平衡產(chǎn)率降低;D反應(yīng)活化能的大小不能影響平衡移動(dòng)。該部分屬于內(nèi)容水平的識(shí)記層次,共1次,賦值為1,內(nèi)容水平的理解層次,共3次,賦值為2×3=6;推理水平中的復(fù)雜推理層次,賦值為3;開放水平的條件與結(jié)論不確定層次,賦值為4;運(yùn)算水平的無運(yùn)算層次,共3次,賦值為1×3=3;知識(shí)綜合水平的一個(gè)知識(shí)點(diǎn)層次,共4次,賦值為1×4=4;知識(shí)綜合水平的多知識(shí)點(diǎn)層次1次,賦值為3。④由圖b可知,氨與丙烯物質(zhì)的量之比為1時(shí),丙烯腈的產(chǎn)率最高,而且副產(chǎn)物量最低,有反應(yīng)方程式可知氨氣、氧氣、丙烯體積比按1:1.5:1時(shí)為最佳狀態(tài),空氣中氧氣含20%,因此比為1:7.5:1。該部分屬于內(nèi)容水平的理解層次,賦值為2;推理水平的復(fù)雜推理層次,賦值為3;運(yùn)算水平的簡(jiǎn)單運(yùn)算和復(fù)雜運(yùn)算層次,各1次,賦值為2和3;知識(shí)綜合水平的多知識(shí)點(diǎn)層次,賦值為3。而整個(gè)題屬于背景水平的生活和生產(chǎn)背景,賦值2;探究水平的非實(shí)驗(yàn)探究,賦值為2;開放水平的結(jié)論與條件確定層次,賦值為1;各問題階梯排布層次,賦值為1。賦值結(jié)果整理如表3所示。
2.3 信度分析
本研究在鮑建生試題難度模型基礎(chǔ)上對(duì)其參數(shù)進(jìn)行修改之后建立了鮑建生試題難度量化工具。以10位評(píng)定者評(píng)定結(jié)果一致性為指標(biāo)檢驗(yàn)鮑建生試題難度量化工具的信度。借助SPSS13.0進(jìn)行一致性分析,得到肯德爾和諧函數(shù)為0.878,顯著性水平小于0.05,說明研究信度良好。
2.4 數(shù)據(jù)統(tǒng)計(jì)
應(yīng)用鮑建生試題難度量化工具對(duì)2016年全國(guó)高考理綜(化學(xué)部分)卷Ⅰ每道化學(xué)試題分別賦值,并統(tǒng)計(jì)結(jié)果。
2.5 試題難度分析
2.5.1 各難度指標(biāo)值計(jì)算
將上述統(tǒng)計(jì)數(shù)據(jù)代入難度計(jì)算公式dJ=∑di/n,計(jì)算每一指標(biāo)難度值。其中n表示整個(gè)試卷中各子指標(biāo)出現(xiàn)總次數(shù),2016年全國(guó)Ⅰ、Ⅱ各子指標(biāo)出現(xiàn)總次數(shù)分別為126次和132次,dJ是每一指標(biāo)的子指標(biāo)賦值總和,2016全國(guó)卷Ⅰ各指標(biāo)難度值計(jì)算結(jié)果如下:
背景水平d=∑dJ/n=(2+1+1+1+2+3+2+3+1+1+2+3+3+2+2+3+3+2)/126=0.29
內(nèi)容水平d=∑dJ/n=(4+2+4+1+6+1+8+8+8+2+ 4+2+12+1+14+3+12+4)/126=4/126=0.79
推理水平d=∑dJ/n=(4+4+4+3+3+3+4+1+4+6+4+6+2+9+4+9+1+4+3+1+4+12+1)/126=0.77
探究水平d=∑dJ/n=(1+1+1+1+1+1+3+3+2+2)/126=0.06
開放水平d=∑dJ/n=(4+4+4+4+4+4+4+6+3+ 4+6+2)/126=49/126=0.39
運(yùn)算水平d=∑dJ/n=(4+4+3+4+4+3+2+3+4+7+5+2+3+4+2+3+1+7)/126=72/126=0.57
知識(shí)綜合水平d=∑dJ/n=(2+4+4+6+4+3+2+1+ 1+4+2+3+4+6+5+4+6+4+4+3+9)/126=81/126=0.64
階梯水平d=∑dJ/n=(2+1+2+2+1+1+2+1+2+1+ 2+1+1+2)/126=21/126=0.17
2.5.2 總體難度值計(jì)算
總體難度值是對(duì)每一試題難度指標(biāo)值求平均值,計(jì)算公式為D=∑d/n其中d是每一指標(biāo)難度值,n是試題難度指標(biāo)總個(gè)數(shù)為8,2016全國(guó)卷Ⅰ總體難度值計(jì)算結(jié)果如下:
試題總體難度值D=∑dJ/n=(0.29+0.79+0.77+0.06+0.39+0.57+0.64+0.17)/8=0.46
3 結(jié)果與討論
用同樣的方法對(duì)2016年全國(guó)卷Ⅱ進(jìn)行統(tǒng)計(jì),計(jì)算各指標(biāo)難度值和總體難度值,全國(guó)卷Ⅱ難度值計(jì)算結(jié)果如表5所示。
從總體難度值來看,全國(guó)卷Ⅰ難度大于全國(guó)卷Ⅱ。從各指標(biāo)難度值來看全國(guó)兩卷在“推理水平”、“開放水平”、“運(yùn)算水平”和“階梯水平”差異較為明顯。全國(guó)卷Ⅰ在“推理水平”層次解題推理過程多為復(fù)雜推理,難度值較高,而全國(guó)卷Ⅱ以無推理和簡(jiǎn)單推理為主,這也是致使兩卷難度不同的一個(gè)重要因素。
相對(duì)來說,“開放水平”全國(guó)卷Ⅰ、Ⅱ的開放程度都不大,而且開放題題型范圍小,查閱近幾年高考題發(fā)現(xiàn)開放題主要集中出現(xiàn)在選做題“有機(jī)化學(xué)基礎(chǔ)”中,占分約3~4分,也就是說當(dāng)學(xué)生不選“有機(jī)化學(xué)基礎(chǔ)”時(shí),這份試卷的開放水平比原來更低,致使化學(xué)試題出現(xiàn)分布不均衡現(xiàn)象。在“階梯水平”中全國(guó)卷Ⅰ階梯性較明顯,良好的階梯性主要表現(xiàn)在各問題之間次序的安排和知識(shí)跨度,這也是造成全國(guó)卷Ⅰ、Ⅱ難度值明顯差異的主要原因?!斑\(yùn)算水平”全國(guó)卷Ⅱ難度值大于全國(guó)卷Ⅰ,深入研究發(fā)現(xiàn)產(chǎn)生這一現(xiàn)象主要是由于全國(guó)卷Ⅱ中涉及簡(jiǎn)單運(yùn)算內(nèi)容較多。
4 結(jié)論與啟示
通過對(duì)鮑建生試題難度量化工具的研究和具體應(yīng)用,可以得到以下啟示:
(1)鮑建生試題難度量化工具的信度和效度較好,在實(shí)際中具有較好的可操作性。
(2)與事前試題難度認(rèn)知任務(wù)分析相比,鮑建生試題難度量化工具有以下優(yōu)點(diǎn):不僅能從各指標(biāo)難度值和總體難度值來衡量試題難度,而且能更加具體地說明造成難度差異的主要指標(biāo)及其子指標(biāo)是什么,這不僅可以達(dá)到事前試題難度分析的結(jié)果,而且有助于命題者研究不合格試題的主要原因并對(duì)試題進(jìn)行修改,同時(shí)也為一線教師試題的編寫和修正提供了理論依據(jù)。
(3)鮑建生試題難度量化工具的總體難度能較好地反映試題難度。不足之處是鮑建生量化工具難度值的評(píng)估實(shí)際上是根據(jù)試題難度的構(gòu)成要素分析基礎(chǔ)上作出的“預(yù)估”,但由于試題難度的構(gòu)成要素復(fù)雜,需要將其與事后測(cè)驗(yàn)的難度值進(jìn)行一致性校正,并結(jié)合訪談修訂評(píng)定工作。
參考文獻(xiàn):
[1]李二夏,邵志芳.試題難度多項(xiàng)指標(biāo)的認(rèn)知任務(wù)分析[J].心理科學(xué),2009,(32)6:1342~1344.
[2]郭光明.簡(jiǎn)論高考試題難度控制[J].教學(xué)與管理,2011,(10):83~85.
[3]張靜.高考化學(xué)試題難度影響因素研究[J].全球教育展望,2014,(5).
[4]陳燕,王祖浩.高考實(shí)驗(yàn)試題“絕對(duì)難度”評(píng)價(jià)工具的研究[J].全球教育展望,2013,42(2):45~53.
[5]賈安功,安娜,黃翔.上海、重慶兩市中考數(shù)學(xué)試題綜合難度比較[J].數(shù)學(xué)教學(xué)通訊,2008,(5):39~41.
[6]鮑建生.中英兩國(guó)初中數(shù)學(xué)期望課程綜合難度的比較[J].全球教育展望,2002,31(9):48~52.
[7]史靜琤,莫顯昆,孫振球.量表編制中內(nèi)容效度指數(shù)的應(yīng)用[J].中南大學(xué)學(xué)報(bào)(醫(yī)學(xué)版),2012,37(4):152~155.