[摘要]命題工作是教育考試的核心環(huán)節(jié),命題工作需要教學經(jīng)歷、命題經(jīng)驗支持;命題工作更需要命題技術、教育測量理論的支撐。本文根據(jù)現(xiàn)代教育測量理論對命題工作開展研究,從正向和反向提出命題工作應堅持的相關原則。
[關鍵詞]教育測量理論;教育考試;命題
教育考試屬于教育評價的一種常用形式,教育評價有形成性評價、過程性評價、終結(jié)性評價等多種形態(tài)?,F(xiàn)代教育測量和評價理論的興起和發(fā)展對教育考試工作提供了直接的科學理論指導,有力地促進了教育考試工作的科學發(fā)展。
大規(guī)模的教育考試,一方面,希望命題遵循和符合課程標準要求;另一方面,還希望學生通過對問題的分析和解答真實反映他們所掌握的知識和所具備的能力。以上兩方面是教育考試的內(nèi)在需要,但它們往往受到很多現(xiàn)實問題和不確定因素的制約和影響。如課程標準規(guī)定的培養(yǎng)目標不一定都是可測的,即使是可測目標也受紙筆考試形式和考試時長的限制等。
近十年來,我們對項目反應理論等現(xiàn)代教育測量理論開展了系統(tǒng)的學習和深入的研究,并在武漢市初中畢業(yè)生學業(yè)水平考試等大規(guī)模教育考試命題及數(shù)據(jù)分析處理工作中嘗試有機地運用相關理論及其模型,并建立了相應的工作機制陽。本文結(jié)合實踐對大規(guī)模教育考試命題工作從理論和技術層面進行分析,從正向和反向提出命題應遵循的有關原則。
一、基于教育測量理論應遵循的幾個基本原則
根據(jù)教育測量相關理論,為了保證考試學科試題良好的信度和效度,也為了保證學科試題適宜的難度和一定的區(qū)分度,理論研究者和學科命題專家對試題設計的程序和方法開展了有益探索,形成既有理論上創(chuàng)新又能指導命題實踐的豐富成果。與此同時,理論研究者和學科命題專家也不斷歸納和提煉,形成了指導命題工作的關于試題設計的系列基本原則,如適綱性原則、科學性原則、導向性原則等。根據(jù)項目反應理論,結(jié)合大規(guī)模教育考試命題實踐,在此我特別提出以下幾個補充性原則。
1.能力立意原則
能力立意原則包括:依據(jù)課程標準構建對學科能力清晰、完整的認識,建立學科能力結(jié)構圖;學校教育依據(jù)課程標準和教材及學科能力結(jié)構,構建學科能力的行為特征目標系統(tǒng);教育考試以能力考核為主要目的,通過考查知識實現(xiàn)考查能力;教育考試命題以考查學科思維能力為核心,全面考查各種能力,強調(diào)能力考查過程的綜合性和應用性,強調(diào)考查過程和內(nèi)容的適度開放性。
自20世紀中葉心理學家開始進行能力測量研究以來,對能力形成及其構成和測量的研究一直沒有停止過。特別是伴隨腦科學研究的深入、信息化技術的廣泛應用對能力和要素的認識越來越深刻,測量理論越來越豐富,測量的技術和方法也日益完善和成熟。但因為關于能力的認識具有明顯的間接性和主觀性,所以對能力的認識也常常包含一定程度的分歧,即使對學科能力要素及其構成也存在認識上的分歧。雖然如此,但人們一致認同學校教育應該培養(yǎng)學生的學科思維能力、創(chuàng)新精神和實踐能力;認同大規(guī)模教育考試應該突出能力和素質(zhì)導向;認同知識與能力互相依存,能力在學習活動中逐步形成和發(fā)展,能力也在學習活動中通過認識與行動表現(xiàn)出來。
在大規(guī)模教育考試中如何有效測量能力是一個頗具挑戰(zhàn)性的問題。凱諾爾認為,“教育考試是一個通過設計的過程來誘導學生表現(xiàn)出某種行為,從而推測考生具備某些心理特征”,考試所獲得的行為樣本要與期望考查的能力之間具有匹配特征,并且兩者要可量化考核。
由于不同學科能力要素及其培養(yǎng)目標差異較大,所以對能力的研究、考查要充分結(jié)合學科特點和規(guī)律來進行。另外,由于學科能力因素的復雜性,能力立意原則的應用也要綜合考慮學科能力的構成因素、呈現(xiàn)形式、依存載體及其內(nèi)在聯(lián)系??傊?,能力立意要通過素材、知識、應用烘托反映出來,并且考試結(jié)果可量化分析。
2.內(nèi)容聚斂原則
內(nèi)容聚斂原則主要包括:學科考試內(nèi)容的抽樣向?qū)W科基礎性知識、關鍵性知識和主干內(nèi)容聚集;立足學科,在學科內(nèi)知識點的綜合呈現(xiàn)處設計試題,考查學生用綜合應用知識(點)來分析和解決問題的能力;創(chuàng)新情景在學科思維和方法交叉層面設計問題,通過此類具體問題考查宏觀、抽象層面的學科思維能力。
由于學科知識內(nèi)容豐富,有的學科知識點分布達數(shù)百之多,教育考試不可能覆蓋所有知識點。因此,教育考試對內(nèi)容的選擇必須通過抽樣來實現(xiàn),而內(nèi)容的抽樣應該盡可能提高覆蓋率。如何提高考試內(nèi)容的抽樣覆蓋率和典型代表性,向?qū)W科基礎性知識、關鍵性知識和主干內(nèi)容聚斂是有效的策略。因為學科核心的基礎性知識、關鍵性知識是必須要掌握的,也是必須要考查的,只不過是需要變換考試的題型和知識載體而已。學科主干內(nèi)容是形成和支撐學科知識體系的骨架,它決定學科知識系統(tǒng)和學科理論的整體性和完備性。同時,也決定了學科主干內(nèi)容的特殊地位和作用。
學科內(nèi)有些知識內(nèi)容通過素材、情景、問題或方法可建立一個整體予以考查;還有的可以通過分層次考查來逐次綜合,在知識綜合過程中自然滲透考查能力。對學科思維和方法相對具體的學科知識而言屬于比較抽象的知識內(nèi)容,對學科思維和方法類的較高層次的知識,無論其知識的領會與理解,還是其知識的鞏固和掌握,乃至其知識的內(nèi)化與應用對學習者要求都比較高。因此,對此類問題的考查能較好地測量和區(qū)分學科思維能力。
在命題時,首先可編擬包含知識能力等要素的雙向或多維細目表;然后根據(jù)學科知識與能力細目表研究如何在學科命題中依據(jù)內(nèi)容聚斂原則來設計試卷和試題。
3.創(chuàng)新性原則
創(chuàng)新性原則主要包括:對學科試題的內(nèi)容、形式、問題等創(chuàng)新設計,防止出現(xiàn)雷同試題;通過創(chuàng)新試題考查學生學習的潛能,考查其學科創(chuàng)新思維能力;通過創(chuàng)新問題考查學生的創(chuàng)新意識。
大規(guī)模教育考試是周期性進行,對學校起著教育的反撥和引導作用。所以,大規(guī)模教育考試要保持適當?shù)倪B續(xù)性和穩(wěn)定性。但是強調(diào)連續(xù)和穩(wěn)定又必須防止僵化和模式化,因此處理好穩(wěn)定和創(chuàng)新的關系既是現(xiàn)實需要,也是命題工作的技術要求。
教育考試命題對情景的創(chuàng)新、選材的創(chuàng)新、設問的創(chuàng)新是第一層次的創(chuàng)新;對試題結(jié)構的創(chuàng)新、試題立意的創(chuàng)新是第二層次的創(chuàng)新;考查創(chuàng)新意識或結(jié)合知識、能力來考查創(chuàng)新意識是最高層次的創(chuàng)新。在命題實踐中,我們嘗試命制開放性問題、測試學科高端認知技能,使用真實情景材料引導學生關注生活和聯(lián)系實際解決問題、預測學科學習潛能等,教育考試的實際結(jié)果分析證明其效果不錯。創(chuàng)新是必要的,但創(chuàng)新必須尊重和符合現(xiàn)實;創(chuàng)新要有度,要防止異化,比如繁難偏怪、拐彎抹角、牽強附會等;創(chuàng)新要有技術支撐,比如有意義的情景、可測可評的試題結(jié)構模型、創(chuàng)新思維的要素呈現(xiàn)形式等。
二、基于反向控制思想的反向控制原則
教育考試命題是一門學問,命題管理是一門藝術;將教育測量理論與學科教育理論有機結(jié)合是一門科學。命題過程中既要按教育測量規(guī)律遵循一定的程序和格式,比如編制學科多維細目表、預測試題難度等,也要防止將教育測量理論玄學化、虛化。如果教育測量理論與學科教學理論分離必然會形成兩張皮現(xiàn)象,兩者不有機結(jié)合其科學性就沒有保障,對試卷和學生學習水平及能力的評價就沒有根基。
命題過程中,既要遵守既定的命題工作規(guī)程,堅持按制度、按程序工作;又要確保命題專家獨立思考、獨立判斷,發(fā)揮命題專家的創(chuàng)造性和智慧。同時,命題過程中,既要合理分工,讓命題專家集中精力思考和創(chuàng)造,又要學科內(nèi)相互協(xié)作,確保充分交流、充分質(zhì)疑,服從大局、達成共識。大規(guī)模教育考試試題是命題專家創(chuàng)造性勞動和相互協(xié)作的結(jié)晶。命題工作是一個既堅持個人專業(yè)觀點又合理妥協(xié)達成共識的過程。
為了確保命題工作安全、公正、科學,特從實踐層面提出以下反向控制原則。
一是有宗教色彩和涉嫌各種歧視的材料堅決不用。歧視包括性別歧視、年齡歧視、地域歧視等。背景資料、試題素材不應選擇帶有歧視觀點的材料,防止有傳播不正確價值觀的嫌疑,也防止影響考試公正、公平。
二是超出課程標準范圍的知識原則上不涉及。學科命題涉及的知識應在課程標準和教材范圍之內(nèi),但對能力的考查可突破其限制。對課程標準和教材沒有要求的知識如果要涉及一定要有交代,要有所涉及知識及過程的介紹。如數(shù)學學科可以定義一個課標和教材上沒有的新運算來考查學生的理解和運用能力。
三是偏離社會發(fā)展主流價值取向、有悖常識和違背科學的素材堅決不使用。社會主義核心價值觀倡導堅持以社會為本位,堅持集體利益,而西方價值觀是個人為本位,以個人自由為出發(fā)點。命題素材要堅持弘揚社會主義核心價值觀,要堅持多選用正面素材、積極典型。對宣揚極端個人主義、享樂主義的材料不要選用;對放大社會不公正現(xiàn)象,甚至刻意描寫社會詬病的素材要批判性對待;對無從考證、有悖常識,甚至違背科學的材料理應增強判斷和辨析能力,不可違背規(guī)律、違反科學構設搞創(chuàng)新點。
四是學術界尚存爭議或雖達成共識尚未列人公共標準的觀點不引用。作為科學家開展研究產(chǎn)生爭議是社會發(fā)展和科技進步的正?,F(xiàn)象,但并非所有研究的內(nèi)容都可以引入大規(guī)模教育考試的。學界尚存爭議的觀點一旦人題必將引起來自社會各個層面人士出于各種目的的爭議,從而影響社會和諧,影響教育秩序的穩(wěn)定。
五是單純反映個人學術觀點的內(nèi)容不引用。由于人們的認識是螺旋上升、逐步完善的,即使普遍使用的學科教材中也難免會有認識不到位甚至錯誤之處。對認識不統(tǒng)一的內(nèi)容教學中可以引導、啟發(fā)、組織學生開展探究,教師個人也可以開展針對性深入研究,但是大規(guī)模教育考試命題時對個人學術觀點一定要慎重對待。因為,大規(guī)模教育考試不是傳播個人學術觀點的工具,不是學術爭鳴的平臺,不是檢測個人學術觀點認同的實驗。經(jīng)驗和實踐證明,凡是命題專家以個人極其擅長和單純個人學術觀點的內(nèi)容為載體命制的試題,實測效果極差,對學校教育極易產(chǎn)生不正確的誘導。
六是學科組內(nèi)存在分歧的素材和內(nèi)容不引用。如果學科組內(nèi)專家在認識上存在明顯分歧,那么一旦作為正式素材和內(nèi)容形成試題在社會上勢必存在陣營對壘式分歧,既妨礙試卷的科學性也有悖公平原則。至于對學科知識內(nèi)容考查的能力層次問題,由布盧姆教育目標分類理論結(jié)合不同學科可以形成不同的理解,所以不同學科對所要考查內(nèi)容的考試要求不盡相同。有的學科簡單分類為了解、理解、掌握三個層次;有的學科劃分為識記、理解、分析綜合、鑒賞評價等多個層次;有的學科劃分為識記、理解、簡單應用、問題解決等層次;還有的實驗性學科把知識性考試水平分為了解、理解和應用水平,技能性考試水平分為模仿水平、獨立操作水平和遷移水平,體驗性考試水平為體驗水平、反應和領悟水平。對不同層次的考查要求,特別是學科試題呈現(xiàn)的問題設計確屬仁者見仁智者見智,這不僅對參加考試的學生具有一定的不確定性,對參加命題的專家同樣具有挑戰(zhàn)性。正因如此,命題專家的思維空間才留有發(fā)揮余地,命題專家的創(chuàng)造性勞動才具備物理性根基。
七是市面教輔資料已經(jīng)出現(xiàn)過的素材及其試題堅決不用。如果素材對不同群體熟知程度不一樣勢必影響大規(guī)模教育考試的公平性。如果市面教輔資料已經(jīng)出現(xiàn)過的素材及其試題一旦引用不僅妨礙考試公平性,還沖擊考試的安全性。即使對工具書的引用也必須考慮全體考生共同使用的版本。不過,為了引導學校教育防止出現(xiàn)追求偏、難、怪的現(xiàn)象,為了引導學校教育回歸本真、回歸教材、回歸基礎,應提倡對學生共同使用的教科書中的素材進行創(chuàng)造性挖掘。實踐證明,此舉對扼制過重的學業(yè)負擔、扼制資料過多過濫效果顯著。
八是社會過于關注的熱點話題盡量回避。學校教育應與社會教育、家庭教育相結(jié)合,應引導學生關注生活、關注社會,引導學生應用所學知識分析和解決生活中的實際問題。但大規(guī)模教育考試是一種與考生利益高度相關的考試,它對學科考試內(nèi)容的選擇實則是一種有目的性的抽樣。大規(guī)模教育考試為了實現(xiàn)考試的公平公正,不得不考慮防止押(壓)題行為,而社會過于關注的熱點往往是市場和學校押(壓)題的重要方向。因此,講政治但不追逐熱點、講應用但不脫離實際、講綜合但不牽強附會,應成為命題工作的智慧選擇。
九是立足學科內(nèi)考查知識的綜合應用,慎對跨學科知識的綜合應用。雖然引導學生綜合性應用所學知識分析和解決問題是教學的追求,學校應通過校本課程和研究性學習等活動大力培養(yǎng)學生綜合性觀察問題、提出問題、分析問題和解決問題的能力;但是由于目前學校普遍分科設置并實施課程,學科教師單一知識背景情況普遍,特別是命題工作中不可能一個學科命題組由跨學科命題專家組成。諸多現(xiàn)實因素和技術條件的局限,使大規(guī)模教育考試考查跨學科知識的綜合時機不太理想,因此應大力推進立足學科內(nèi)來考查知識的綜合應用。學科內(nèi)知識的綜合無論從課程、教學、命題技術手段、專家資源等方面,還是從學生學習方法層面,甚至從考查學生進一步學習的潛能角度都具備可操作性?,F(xiàn)在各級大規(guī)模教育(包括全國高考)都倡導能力立意,即立足學科內(nèi)考查知識的綜合應用成為命題重要的指導思想和技術原則。
總體來說,大規(guī)模教育考試命題工作不僅是學科專業(yè)性很強的創(chuàng)造性勞動,而且跨學科涉及多門學科理論知識,同時還具有明顯的社會屬性。加強對教育考試命題工作的研究,不僅有利于提高命題工作的科學化水平,而且有利于引導學校教育教學工作沿著素質(zhì)教育方向發(fā)展。教育考試命題工作承載著學校、家庭、社會多方期望,其影響往往超出命題工作本身。從這個角度來講對教育考試命題工作要“減壓”,即盡可能減少社會因素的干擾,用現(xiàn)代教育測量與評價的理論指導命題工作,讓教育考試命題工作沿著專業(yè)化方向發(fā)展。
參考文獻
[1]洛林·W·安德森等.布盧姆教育目標分類學(修訂版)[M].北京:外語教學與研究出版社,2009(1).
[2]2014年普通高等學校招生全國統(tǒng)一考試大綱(課程標準實驗版)[S].北京:高等教育出版社2014(1):1.
[3]周遠方,王池富.高考數(shù)學命題理論與實踐[M].武漢:湖北人民出版社2011(5):1.
[4]陸璟.PISA測評的理論和實踐[M].上海:華東師范大學出版社2013(5):1.
[5]2014年武漢市初中畢業(yè)生學業(yè)水平考試說明[S].武漢:武漢出版社,2014(3):1.
(責任編輯 羅登廉)