李勇
基礎(chǔ)教育質(zhì)量監(jiān)測(cè)的特點(diǎn)及實(shí)施建議
李勇
從PISA和NAEP項(xiàng)目來看,基礎(chǔ)教育質(zhì)量監(jiān)測(cè)具有強(qiáng)調(diào)對(duì)學(xué)生個(gè)體的無利害性、對(duì)教育決策的導(dǎo)向作用、對(duì)教育教學(xué)的全面分析,以及強(qiáng)調(diào)監(jiān)測(cè)實(shí)施過程的周期性、監(jiān)測(cè)技術(shù)手段的專業(yè)性等核心特點(diǎn)。由于國情和教育發(fā)展水平與西方一些國家存在差異,我國開展教育質(zhì)量監(jiān)測(cè)時(shí)既要充分學(xué)習(xí)借鑒國外經(jīng)驗(yàn)和現(xiàn)有模式,如明確監(jiān)測(cè)功能、避免功能泛化,建立技術(shù)標(biāo)準(zhǔn)、提高檢測(cè)透明度,也要特別注意避免盲目照搬、水土不服,如改定期監(jiān)測(cè)為動(dòng)態(tài)監(jiān)測(cè),要淡化問責(zé)功能,同時(shí),不必拘于抽測(cè),也可考慮統(tǒng)測(cè)。
基礎(chǔ)教育;質(zhì)量監(jiān)測(cè);特點(diǎn);實(shí)施建議
目前,開展教育質(zhì)量監(jiān)測(cè)已成為世界教育發(fā)展的一大潮流。從世界范圍來看,歐美發(fā)達(dá)國家都是通過開展大規(guī)模教育質(zhì)量監(jiān)測(cè)項(xiàng)目,來跟蹤了解本國的基礎(chǔ)教育質(zhì)量。這方面典型的代表是美國的國家教育進(jìn)展評(píng)估(NAEP)。此外,還有英國的國家課程測(cè)驗(yàn)(SATS)、日本的全國學(xué)力考試,以及澳大利亞的國家評(píng)估計(jì)劃(NAP),等等。[1]另外,基礎(chǔ)教育質(zhì)量的國際監(jiān)測(cè)也成為近年來的熱點(diǎn)領(lǐng)域之一,出現(xiàn)了如“國際學(xué)生評(píng)估項(xiàng)目”(PISA)、“國際數(shù)學(xué)和科學(xué)學(xué)習(xí)趨勢(shì)”(TIMSS)和“國際閱讀能力發(fā)展研究”(PIRLS)等大型項(xiàng)目。
我國當(dāng)前教育正由重?cái)?shù)量和規(guī)模的粗放式發(fā)展模式轉(zhuǎn)向重公平、質(zhì)量、多樣化的內(nèi)涵式發(fā)展模式。尤其是積極推進(jìn)的義務(wù)教育均衡化戰(zhàn)略,其內(nèi)涵不僅體現(xiàn)在入口環(huán)節(jié),如生源錄取、資源分配等的均衡化,更本質(zhì)的要求是,在出口環(huán)節(jié)能最終體現(xiàn)出學(xué)生發(fā)展水平的均衡化。而實(shí)施教育質(zhì)量監(jiān)測(cè)正是及時(shí)掌握基礎(chǔ)教育質(zhì)量變化情況,推動(dòng)學(xué)校不斷提升教學(xué)成效,促進(jìn)不同地區(qū)、不同類型學(xué)生發(fā)展水平均衡化的重要手段。因此,各級(jí)教育部門開始高度關(guān)注基礎(chǔ)教育質(zhì)量監(jiān)測(cè)問題,進(jìn)行了一些積極的探索。例如,上海市于2009年引入PISA,對(duì)全市學(xué)生開展學(xué)習(xí)質(zhì)量監(jiān)測(cè)。PISA2010發(fā)布的監(jiān)測(cè)結(jié)果表明:上海學(xué)生的數(shù)學(xué)素養(yǎng)、閱讀素養(yǎng)、科學(xué)素養(yǎng)均名列世界前茅,其結(jié)果令全球震驚。目前,上海市教育部門已著手借鑒PISA,研制上海本土學(xué)習(xí)質(zhì)量指標(biāo)體系。再如,北京市為了推進(jìn)義務(wù)教育均衡發(fā)展,先后研究制定了教育的“三個(gè)標(biāo)準(zhǔn)”,即“辦學(xué)條件標(biāo)準(zhǔn)、教師基本功標(biāo)準(zhǔn)、學(xué)科學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)”。其“學(xué)科學(xué)業(yè)質(zhì)量標(biāo)準(zhǔn)”是從2006年開始探索制定的,目前在此學(xué)習(xí)質(zhì)量標(biāo)準(zhǔn)體系的指引下,已形成了在3、5、8年級(jí)實(shí)行年度抽樣監(jiān)測(cè),并每年形成質(zhì)量報(bào)告,向社會(huì)公開發(fā)布的機(jī)制。
由于國情和教育發(fā)展水平與西方一些國家存在差異,這注定了在我國開展教育質(zhì)量監(jiān)測(cè)時(shí)既要充分學(xué)習(xí)借鑒國外經(jīng)驗(yàn)和現(xiàn)有模式,也要特別注意避免盲目照搬,水土不服。在這一特定研究背景下,本文將嘗試以PISA和NAEP項(xiàng)目為例,歸納出基礎(chǔ)教育質(zhì)量監(jiān)測(cè)的核心特點(diǎn),并對(duì)在我國開展此類監(jiān)測(cè)項(xiàng)目提出一些建議。
(一)項(xiàng)目簡要介紹
1.PISA項(xiàng)目簡介
PISA是英文Program for International Student Assessment的簡稱,是由國際經(jīng)合組織策劃的一項(xiàng)國際性學(xué)生學(xué)習(xí)質(zhì)量監(jiān)測(cè)與比較研究項(xiàng)目,主要評(píng)估15歲學(xué)生(相當(dāng)于初中畢業(yè))應(yīng)用所學(xué)知識(shí)和技能完成他們?cè)诮窈笊钪行枰瓿傻娜蝿?wù)和在社會(huì)中行使職責(zé)以及持續(xù)學(xué)習(xí)的能力情況。
第一次PISA評(píng)估于2000年舉行,此后每三年舉行一次。PISA的測(cè)量內(nèi)容包括學(xué)生的閱讀素養(yǎng)、數(shù)學(xué)素養(yǎng)和科學(xué)素養(yǎng)。三者組成一個(gè)循環(huán)體,在每一次評(píng)估中,只對(duì)其中一個(gè)主要領(lǐng)域做深入評(píng)估。大體上,主要領(lǐng)域占三分之二的題量,另外兩個(gè)次要領(lǐng)域合占三分之一的題量。2000年,PISA的重點(diǎn)放在閱讀素養(yǎng)上,2003年重點(diǎn)轉(zhuǎn)向數(shù)學(xué),2006年轉(zhuǎn)向科學(xué),以此進(jìn)行循環(huán)。另外,PISA包含有針對(duì)可能影響學(xué)生能力發(fā)展的各種因素的問卷調(diào)查,包括學(xué)校教育的情況、家庭教育背景等,這樣一來,就能為公眾、政策制定者提供更全面的信息。
PISA測(cè)試強(qiáng)調(diào)在現(xiàn)實(shí)生活中的能力。過去許多關(guān)于學(xué)生學(xué)習(xí)成績的國際比較研究多集中于學(xué)校里傳授的知識(shí)和技能,而PISA主要評(píng)價(jià)學(xué)生充分地參與社會(huì)和經(jīng)濟(jì)活動(dòng)并成為終身學(xué)習(xí)者的潛力,因此,它特別強(qiáng)調(diào)那些與學(xué)生將來生活有關(guān)的基本知識(shí)和技能。
PISA通過分層抽樣的方法對(duì)各國的學(xué)校進(jìn)行抽樣,并用矩陣的方法將全部試題分成很多小的區(qū)塊。每個(gè)學(xué)生只需完成部分區(qū)塊的題目。PISA的目的不是指導(dǎo)教師如何進(jìn)行教學(xué),而是向公眾、政策制定者和教育者提供學(xué)生在各個(gè)學(xué)科方面能力的描述性信息,并對(duì)各參加國的教育質(zhì)量進(jìn)行橫向比較,以及探討影響各國教育質(zhì)量的因素。
2.NAEP項(xiàng)目簡介
NAEP是美國唯一的全國性的、持續(xù)性的教育質(zhì)量監(jiān)測(cè)項(xiàng)目,也是當(dāng)今國際上最為著名的國家級(jí)教育質(zhì)量監(jiān)測(cè)項(xiàng)目之一。它得到美國國會(huì)授權(quán),由國家評(píng)估管理委員會(huì)(獨(dú)立于美國教育部的機(jī)構(gòu))提供政策指導(dǎo),教育部所屬的全國教育統(tǒng)計(jì)資料中心負(fù)責(zé)組織。目前,其命題和實(shí)施工作由美國教育考試服務(wù)中心(ETS)承接。
NAEP自1969年開始實(shí)施,目前的監(jiān)測(cè)科目包括閱讀、數(shù)學(xué)、科學(xué)、寫作、美國歷史、公民、地理和藝術(shù)等。它以4年級(jí)、8年級(jí)和12年級(jí)學(xué)生為監(jiān)測(cè)對(duì)象,通過了解處于各學(xué)習(xí)階段轉(zhuǎn)折點(diǎn)的學(xué)生在不同的學(xué)科課程中“知道什么”和“能做什么”,來評(píng)估當(dāng)前國家的整體教育水平,以及隨著時(shí)間這種水平的提升情況。根據(jù)2001年出臺(tái)的《不讓一個(gè)孩子掉隊(duì)》(NoChildLeftBehind)法案,NAEP全國評(píng)估和州評(píng)估至少每隔兩年就對(duì)4年級(jí)、8年級(jí)學(xué)生的閱讀和數(shù)學(xué)進(jìn)行一次測(cè)試,NAEP全國評(píng)估必須、NAEP州評(píng)估可以定期測(cè)試12年級(jí)學(xué)生的閱讀和數(shù)學(xué)。在時(shí)間和資金允許的情況下,NAEP全國評(píng)估還要定期對(duì)寫作、科學(xué)、美國歷史等科目進(jìn)行測(cè)試。
NAEP的目的不是診斷學(xué)生學(xué)習(xí)和指導(dǎo)教師教學(xué),而是向公眾、政策制定者和教育者提供各個(gè)學(xué)科上學(xué)生能力的信息。也因此,在測(cè)試對(duì)象的選取上,NAEP通過分層抽樣的方法對(duì)全國的學(xué)校進(jìn)行抽樣,不是每所學(xué)校、每個(gè)班級(jí)或每個(gè)學(xué)生都要參加,即使學(xué)生被抽到,也是要求自愿參加;并且,它采用矩陣的方法將全部試題分成很多小的區(qū)塊,分別由不同社區(qū)、地區(qū)的學(xué)生來完成,每個(gè)學(xué)生都只要求完成部分區(qū)塊,一般只需40分鐘即可。所以,NAEP只能給出學(xué)區(qū)、州和國家層次的成績,并沒有每個(gè)考生的分?jǐn)?shù),被稱之為“國家的成績單”(theNation’sReportCard)。另外,NAEP也包含有針對(duì)可能影響學(xué)生能力發(fā)展的各種因素的問卷調(diào)查,包括學(xué)校教學(xué)情況、家庭教育背景等,為公眾、政策制定者提供更全面的信息。
NAEP的評(píng)估形式主要有國家評(píng)估、州評(píng)估、試驗(yàn)性城市評(píng)估 (Trial Urban District Assessment)和長期趨勢(shì)評(píng)估。四種評(píng)估形式在評(píng)估目的和技術(shù)要求等方面各有所側(cè)重。長期趨勢(shì)評(píng)估每四年進(jìn)行一次,要求測(cè)試手段不隨著課程和教育實(shí)踐的變化而變化,以保證資料的連續(xù)可比性。其他三種評(píng)估主要是樣本量和評(píng)估科目上的差別。
NAEP針對(duì)不同群體提交不同形式的分析報(bào)告,有針對(duì)國家和州政府政策制定者的NAEP全國報(bào)告、州級(jí)報(bào)告、趨勢(shì)報(bào)告和年鑒;有回答父母、學(xué)校和公眾問題的即時(shí)報(bào)告(Update Reports);有為教育工作者和學(xué)科專家設(shè)計(jì)的指導(dǎo)報(bào)告;有為研究者和各州考試指導(dǎo)者設(shè)計(jì)的跨州數(shù)據(jù)概要、針對(duì)教育深層問題的焦點(diǎn)報(bào)告(FocusedReports),以及項(xiàng)目開發(fā)與實(shí)施技術(shù)細(xì)節(jié)的技術(shù)報(bào)告,等等。另外,在報(bào)告公布后,組織者一般還會(huì)邀請(qǐng)外界人士、教育工作者和管理人員參加座談,了解公眾對(duì)結(jié)果的反應(yīng),作為教育決策的參考。
美國聯(lián)邦政府通過NAEP來評(píng)估各州教育水平,確定其是否符合或超越“適當(dāng)年度進(jìn)步”(AdequateYearlyProgress,簡稱AYP)目標(biāo)。如果州連續(xù)兩年未能實(shí)現(xiàn)AYP目標(biāo),聯(lián)邦教育部將提供技術(shù)支持。長期不能實(shí)現(xiàn)的,將被取消獲得多種聯(lián)邦教育資金的資格。
(二)基礎(chǔ)教育質(zhì)量監(jiān)測(cè)的特點(diǎn)
1.強(qiáng)調(diào)對(duì)學(xué)生個(gè)體的無利害性
學(xué)業(yè)質(zhì)量監(jiān)測(cè)的目的不是評(píng)價(jià)學(xué)生個(gè)體,而是通過抽取學(xué)生樣本,評(píng)估學(xué)校、地區(qū)甚至整個(gè)國家的教育質(zhì)量。PISA和NAEP都采用抽樣的方法,并且將全部試題分成區(qū)塊,每個(gè)學(xué)生只回答其中的部分試題。在結(jié)果報(bào)告時(shí),只公布總體成績,不公布學(xué)生個(gè)體的成績,因此對(duì)參加監(jiān)測(cè)的學(xué)生來說是毫無利害性的。甚至于對(duì)學(xué)生來說,參加監(jiān)測(cè)完全出于自愿,如果本人或監(jiān)護(hù)人有異議,都可以拒絕參加。這種對(duì)學(xué)生的無利害性可以避免學(xué)生應(yīng)考,從而加重不必要的學(xué)習(xí)負(fù)擔(dān),以及避免應(yīng)考帶來的學(xué)生數(shù)據(jù)失常問題。
2.強(qiáng)調(diào)對(duì)教育決策的導(dǎo)向作用
PISA和NAEP會(huì)同時(shí)采用常模參照和標(biāo)準(zhǔn)參照的方式公布結(jié)果。PISA的監(jiān)測(cè)結(jié)果中會(huì)公布參加監(jiān)測(cè)的不同國家或地區(qū)的成績排名,以及他們?cè)诟鲀?nèi)容領(lǐng)域上處于什么水平。同樣,NAEP的監(jiān)測(cè)結(jié)果也會(huì)公布各州的排名,及各州在不同內(nèi)容領(lǐng)域上的表現(xiàn)。這種橫向比較和水平比較會(huì)對(duì)教育決策形成一定的壓力和引導(dǎo)。例如,在2000年,德國學(xué)生的閱讀素養(yǎng)在32個(gè)國家中排在第21位,數(shù)學(xué)素養(yǎng)排在第20位,科學(xué)素養(yǎng)排在第20位,三項(xiàng)成績都在OECD國家平均分之下。針對(duì)PISA2000所反映出來的問題,德國出臺(tái)了“七個(gè)行動(dòng)領(lǐng)域”計(jì)劃,從學(xué)前教育、小學(xué)教育、教師專業(yè)化等方面對(duì)教育質(zhì)量進(jìn)行了提高。[2]再如,由于NAEP的報(bào)告顯示,近20年來美國學(xué)生的閱讀能力停滯不前,當(dāng)時(shí)的小布什政府于2005財(cái)政年度在學(xué)生閱讀能力上投入了12億美元的資金,比2001年增長了4倍。[3]PISA、NAEP采用的公布排名的方法,無疑給參加監(jiān)測(cè)的國家或地區(qū)造成了一定的政策壓力,促使他們向那些排名靠前國家或地區(qū)的教育體系尋求借鑒;同時(shí),報(bào)告各內(nèi)容領(lǐng)域的情況,促使政府部門重視對(duì)薄弱領(lǐng)域進(jìn)行指導(dǎo)和提升。
3.強(qiáng)調(diào)對(duì)教育教學(xué)的全面分析
教育質(zhì)量監(jiān)測(cè)不是國家或地區(qū)統(tǒng)考的代名詞,也不應(yīng)被狹隘地理解為對(duì)學(xué)生考試成績的監(jiān)測(cè)。PISA和NAEP的監(jiān)測(cè)內(nèi)容不只包括學(xué)業(yè),更重要的是對(duì)背景因素的調(diào)查和分析。通過將考試成績與背景因素(比如人、財(cái)、物投入水平)、施行的教育政策等結(jié)合起來進(jìn)行分析,評(píng)價(jià)者可以深入探究影響考試成績的原因。
4.強(qiáng)調(diào)監(jiān)測(cè)實(shí)施過程的周期性
PISA和NAEP的實(shí)施都有一定的周期性。這種周期性既可以保證持續(xù)性,也可以避免因頻率過高,對(duì)學(xué)校造成負(fù)擔(dān)。另外,由于監(jiān)測(cè)項(xiàng)目的復(fù)雜性,其監(jiān)測(cè)指標(biāo)、工具、報(bào)告內(nèi)容需要不斷進(jìn)行修訂,這種周期性實(shí)施的方式,還可以給監(jiān)測(cè)項(xiàng)目自身的完善留有充足的時(shí)間。
5.強(qiáng)調(diào)監(jiān)測(cè)技術(shù)手段的專業(yè)性
學(xué)業(yè)質(zhì)量監(jiān)測(cè)中使用的學(xué)業(yè)測(cè)驗(yàn)、背景問卷不等同于一般的經(jīng)驗(yàn)型教師自編測(cè)驗(yàn)或問卷,其開發(fā)與實(shí)施不但需要先進(jìn)的教育理念引導(dǎo),還需要心理與教育測(cè)量、教育統(tǒng)計(jì)等專業(yè)技術(shù)支撐,由專業(yè)人員依據(jù)標(biāo)準(zhǔn)化的流程開發(fā)、實(shí)施。對(duì)監(jiān)測(cè)數(shù)據(jù)的采集、分析也需要專業(yè)的技術(shù)手段,遵循嚴(yán)格的操作標(biāo)準(zhǔn)。
近幾年來,我國各類教育質(zhì)量監(jiān)測(cè)項(xiàng)目如雨后春筍般出現(xiàn)。這些項(xiàng)目大多尚處于起步探索階段,有著很好的發(fā)展前景,如何做到既符合教育規(guī)律,又適合中國國情,是實(shí)施者迫切需要考慮的問題。對(duì)此,我們提出如下一些建議。
1.明確監(jiān)測(cè)功能,避免功能泛化
教育質(zhì)量監(jiān)測(cè)項(xiàng)目的主要功能在于監(jiān)測(cè)。如果從參加群體的范圍角度進(jìn)行劃分,我們可以將評(píng)估分為系統(tǒng)評(píng)估、團(tuán)體評(píng)估和個(gè)體評(píng)估。系統(tǒng)評(píng)估屬于對(duì)某個(gè)區(qū)域內(nèi)的全體目標(biāo)人群的全局評(píng)估,目的是了解整體狀況,為教育決策和研究服務(wù)。團(tuán)體評(píng)估指對(duì)區(qū)域內(nèi)的部分教學(xué)單位或部分群體,如學(xué)校、班級(jí)、外地遷來學(xué)生,所進(jìn)行的評(píng)估,目的是了解特定單位或群體狀況,為制訂教學(xué)計(jì)劃和查找教學(xué)問題服務(wù)。個(gè)體評(píng)估是針對(duì)個(gè)人的評(píng)估,目的是診斷學(xué)習(xí)質(zhì)量,促進(jìn)學(xué)生發(fā)展。
從PISA和NAEP來看,它們都只強(qiáng)調(diào)發(fā)揮監(jiān)測(cè)功能,不強(qiáng)調(diào)發(fā)揮診斷功能。有的人認(rèn)為,教育質(zhì)量監(jiān)測(cè)項(xiàng)目最好能兼顧監(jiān)測(cè)和診斷兩個(gè)功能,這樣一來,不但可以為教育決策服務(wù),還能幫助教師發(fā)現(xiàn)學(xué)生在學(xué)習(xí)上的問題,改進(jìn)教學(xué)成效,可謂一舉兩得。實(shí)際上,兩者兼顧的結(jié)果往往就是顧此失彼。
從評(píng)估工具編制的角度出發(fā),發(fā)揮監(jiān)測(cè)功能,就要求試題取樣在學(xué)習(xí)領(lǐng)域上具有代表性,也就是知識(shí)點(diǎn)的覆蓋要盡可能地廣,由于試卷容量的限制,每個(gè)知識(shí)點(diǎn)上的題目就不會(huì)太多;發(fā)揮診斷功能則要求知識(shí)點(diǎn)的層次跨度要深,即同一個(gè)知識(shí)點(diǎn)要有多道體現(xiàn)不同能力水平的試題,只有這樣,才能診斷出學(xué)生的問題之所在。以小學(xué)加法運(yùn)算為例,作為監(jiān)測(cè)工具,有一兩道試題即可評(píng)定出學(xué)生是否掌握了加法運(yùn)算,但要診斷學(xué)生的錯(cuò)誤類型,則要有體現(xiàn)進(jìn)位、列式、計(jì)算、連加等不同能力的試題,無疑,試題量將極為龐大。
診斷性測(cè)試一般用于教學(xué)補(bǔ)救,主要針對(duì)個(gè)體評(píng)估而言。即使有時(shí)通過團(tuán)體施測(cè),對(duì)結(jié)果的解釋也必須是針對(duì)個(gè)體進(jìn)行個(gè)別化的詮釋。從評(píng)估結(jié)果解釋的角度出發(fā),系統(tǒng)或團(tuán)體評(píng)估結(jié)果是去個(gè)性存共性的,即使對(duì)于班級(jí)這樣的小團(tuán)體,如有很小部分人在某個(gè)知識(shí)點(diǎn)上有問題,在最后的班級(jí)總成績上也是很難體現(xiàn)出來的。如果是大部分人在這個(gè)知識(shí)點(diǎn)上都有問題,一般也無需診斷,教師的教學(xué)經(jīng)驗(yàn)就可以覺察出來。
2.不必拘于抽測(cè),也可考慮統(tǒng)測(cè)
目前,國外監(jiān)測(cè)項(xiàng)目普遍采用抽測(cè)方式進(jìn)行,但是考慮到我國國情,可以考慮統(tǒng)測(cè)方式。西方國家普遍實(shí)行教育分權(quán)制,這就導(dǎo)致監(jiān)測(cè)項(xiàng)目會(huì)遭到地方和學(xué)校的抵制。這些監(jiān)測(cè)項(xiàng)目實(shí)行抽樣的目的除了降低試卷印刷、閱卷等方面的成本,及降低組織的難度,更重要的是,降低公眾對(duì)政府控制學(xué)校辦學(xué)自主權(quán)、用監(jiān)測(cè)數(shù)據(jù)進(jìn)行學(xué)生排名等方面的擔(dān)憂。以NAEP項(xiàng)目為例,在19世紀(jì)60年代該項(xiàng)目開始推行時(shí),就曾遇到廣泛的反對(duì)。有學(xué)者認(rèn)為,全國性的監(jiān)測(cè)體系將導(dǎo)致建立全國統(tǒng)一課程,擴(kuò)張聯(lián)邦政府在州和地方教育上的權(quán)力,并擔(dān)心監(jiān)測(cè)結(jié)果會(huì)被用來做不正當(dāng)?shù)暮陀泻Φ谋容^,從而帶來教育機(jī)會(huì)的不均等,最終學(xué)校會(huì)被聯(lián)邦政府控制。[4]另外,由于過分強(qiáng)調(diào)對(duì)學(xué)生自主權(quán)的保護(hù),美國學(xué)校不能強(qiáng)制學(xué)生參加與個(gè)人發(fā)展無關(guān)的測(cè)試,這樣一來,即使是統(tǒng)測(cè)也根本不可能保證學(xué)生的參加率。而在我國,沒有西方國家面臨的這些難題,在保證學(xué)生個(gè)人數(shù)據(jù)不被外泄的情況下,為了確保監(jiān)測(cè)結(jié)果的準(zhǔn)確性,我們完全可以進(jìn)行統(tǒng)測(cè)。
進(jìn)行統(tǒng)測(cè)也有其客觀原因。一方面,凡是抽樣必有誤差,而且監(jiān)測(cè)項(xiàng)目為了獲取更深層次信息,一般都會(huì)采用分層抽樣的方式,隨著層次的增多,這種抽樣誤差會(huì)顯著增大。比如,會(huì)將監(jiān)測(cè)學(xué)生群體分為城市、縣鎮(zhèn)、農(nóng)村類別,每個(gè)類別下會(huì)再分成公辦校、民辦校,或者類似示范校、普通校等類別,這些類別下還可能區(qū)別出性別、民族、家庭經(jīng)濟(jì)狀況等子類別。如果學(xué)??偭坎粔虼?,類似這種多層的抽樣,很難保證每個(gè)區(qū)塊下有足夠的學(xué)校供選取。另一方面,抽樣的方式為學(xué)校替換學(xué)生提供了可能性。因?yàn)樵诮M織時(shí),雖然事前會(huì)將抽樣出來的學(xué)生名單提供給學(xué)校,但如果監(jiān)測(cè)結(jié)果對(duì)學(xué)校有利害性,學(xué)校就有動(dòng)機(jī)以學(xué)生生病、外出或其他特殊原因提出替換學(xué)生的請(qǐng)求,或者利用學(xué)習(xí)成績好的學(xué)生代替學(xué)習(xí)成績差的學(xué)生參加測(cè)試。
當(dāng)然,也有人認(rèn)為采用抽樣方式可以降低學(xué)校組織應(yīng)考的可能性。其實(shí),只要監(jiān)測(cè)結(jié)果對(duì)學(xué)校有利害性,即使是部分學(xué)生參加,學(xué)校也有可能組織全體學(xué)生進(jìn)行應(yīng)考準(zhǔn)備。在我國國情下,如果是國家級(jí)監(jiān)測(cè)項(xiàng)目,考慮到統(tǒng)測(cè)的組織難度極大,且學(xué)校數(shù)量足夠多,可以采用抽樣方式;但省市一級(jí)的監(jiān)測(cè)項(xiàng)目,則要根據(jù)學(xué)校數(shù)量而定,在經(jīng)費(fèi)足夠的情況下,可以考慮進(jìn)行統(tǒng)測(cè)。
3.開展動(dòng)態(tài)監(jiān)測(cè),避免組織應(yīng)考
PISA和NAEP都是定期舉行,有固定的監(jiān)測(cè)周期。這種周期性的好處是,監(jiān)測(cè)項(xiàng)目的運(yùn)作有清晰的路線圖和時(shí)間表,但弊端是,可能會(huì)有學(xué)校做針對(duì)性的應(yīng)考。這種應(yīng)考文化在西方社會(huì)比較淡薄,但在我國卻有其生存土壤。所以,我們不妨將各學(xué)科的監(jiān)測(cè)動(dòng)態(tài)化,采取不提前公布監(jiān)測(cè)學(xué)科、各學(xué)科的監(jiān)測(cè)周期無規(guī)律可循的做法,盡可能地讓學(xué)校無法組織針對(duì)性應(yīng)考。
4.建立技術(shù)標(biāo)準(zhǔn),提高透明程度
PISA和NAEP代表著當(dāng)今教育測(cè)量的最高水平。這一方面是由設(shè)計(jì)這兩項(xiàng)監(jiān)測(cè)的核心機(jī)構(gòu)——澳大利亞教育研究院(ACER)和美國教育考試服務(wù)中心(ETS)的專業(yè)性保證的,另一方面,也是監(jiān)測(cè)項(xiàng)目自身的復(fù)雜性和專業(yè)性所要求的。PISA和NAEP會(huì)定期向社會(huì)發(fā)布技術(shù)報(bào)告,詳細(xì)地描述所有技術(shù)環(huán)節(jié),甚至還會(huì)公布部分去掉學(xué)生背景信息后的數(shù)據(jù),供研究人員對(duì)照技術(shù)手冊(cè)進(jìn)行驗(yàn)證和拓展性研究。另外,NAEP在制定分?jǐn)?shù)線時(shí)除了邀請(qǐng)專家、一線教師,還會(huì)邀請(qǐng)一些學(xué)生家長參與其中,讓家長群體的意見也能被聽取和采納。在我國開展教育質(zhì)量監(jiān)測(cè)項(xiàng)目也要有高的質(zhì)量要求和技術(shù)標(biāo)準(zhǔn),并且要提高對(duì)外透明度,通過技術(shù)報(bào)告、專家解讀、家長參與等形式,讓學(xué)校、家長了解監(jiān)測(cè)項(xiàng)目的內(nèi)部運(yùn)作情況,提高對(duì)監(jiān)測(cè)的理解、認(rèn)同和配合度。
5.淡化問責(zé)功能,建立保障機(jī)制
西方國家的教育質(zhì)量監(jiān)測(cè)項(xiàng)目普遍強(qiáng)調(diào)結(jié)果的問責(zé)作用。1970年3月,美國尼克松總統(tǒng)在“教育改革咨文”中提出,教育問責(zé)制是教育改革的關(guān)鍵,并宣稱學(xué)校行政人員及教師必須為教育的結(jié)果負(fù)起責(zé)任,從此開創(chuàng)了美國教育問責(zé)制的新時(shí)代。[5]NAEP項(xiàng)目正是這種問責(zé)體制的典型體現(xiàn)。通過AYP目標(biāo)的設(shè)立,美國將監(jiān)測(cè)成績與財(cái)政撥款掛鉤,激勵(lì)學(xué)校不斷發(fā)展進(jìn)步。近年來,這種問責(zé)模式越來越受到一些質(zhì)疑。部分人認(rèn)為,NAEP在使具有濃厚分權(quán)傳統(tǒng)的美國基礎(chǔ)教育考試制度逐步向集權(quán)的方向發(fā)展。[6]在我國國情下,如果推行這種以年度進(jìn)步目標(biāo)為評(píng)價(jià)指標(biāo)的問責(zé)機(jī)制,對(duì)每一所學(xué)校都會(huì)造成壓力,有導(dǎo)致諸如“應(yīng)試”、造假的可能性。最好的解決方法是,建立一種保障機(jī)制,對(duì)達(dá)到了最低標(biāo)準(zhǔn)的學(xué)校不作任何獎(jiǎng)懲,而對(duì)那些未達(dá)標(biāo)的學(xué)校,提供資金、師資、政策方面的支持,保障其具備發(fā)展的動(dòng)力。
[1]陳晨.基礎(chǔ)教育質(zhì)量監(jiān)測(cè)中的公平性問題——美國NAEP的政策與實(shí)踐[J].外國中小學(xué)教育,2011(2):11 ~15.
[2]李剛,陳思穎.PISA的政策影響:類型、方式及其啟示[J].外國教育研究,2014(7):3~10.
[3]辛濤,李峰.基礎(chǔ)教育質(zhì)量監(jiān)測(cè)的國際視野[J].人民教育,2007(2):4~5.
[4]陳晨,潘蘇東.美國全國教育進(jìn)展評(píng)價(jià)體系的發(fā)展歷程:40年回顧[J].外國中小學(xué)教育,2009(12):14~18.
[5]辛濤.我國教育問責(zé)制建立的幾個(gè)關(guān)鍵問題[J].北京大學(xué)教育評(píng)論,2013(1):164~171.
[6]孫珂.教育問責(zé)背景下的美國國家教育進(jìn)展評(píng)估[J].教育探索,2011(7):147~149.
責(zé)任編輯/林 潔
G40-058.1
A
1674-1536(2014)11-0016-05
本文為天津市教育科學(xué)“十二五”規(guī)劃課題“制定天津市義務(wù)教育階段學(xué)習(xí)質(zhì)量監(jiān)測(cè)指標(biāo)體系的研究”(課題編號(hào):CE4025)的階段性研究成果之一。
李 勇/天津市教育招生考試院助理研究員。(天津 300387)
教育測(cè)量與評(píng)價(jià)2014年11期