● 鄭海紅 段作章
美國(guó)紐約州教育問(wèn)責(zé)制度下表現(xiàn)性評(píng)價(jià)的運(yùn)用和啟示
● 鄭海紅 段作章
表現(xiàn)性評(píng)價(jià)是針對(duì)傳統(tǒng)的標(biāo)準(zhǔn)測(cè)驗(yàn)的不足而出現(xiàn)的。美國(guó)紐約州的標(biāo)準(zhǔn)協(xié)會(huì)在問(wèn)責(zé)制的支持下,成功地運(yùn)用表現(xiàn)性評(píng)價(jià)方法檢測(cè)學(xué)生的學(xué)習(xí)成果。這對(duì)我國(guó)目前積極進(jìn)行的評(píng)價(jià)改革具有借鑒意義。
紐約州;教育問(wèn)責(zé)制;表現(xiàn)性評(píng)價(jià)
為了促使教師和行政管理人員對(duì)學(xué)生的學(xué)業(yè)成績(jī)負(fù)責(zé),美國(guó)實(shí)施了教育問(wèn)責(zé)制。在教育問(wèn)責(zé)統(tǒng)一標(biāo)準(zhǔn)的前提下,越來(lái)越多的學(xué)校依賴于標(biāo)準(zhǔn)化考試結(jié)果決定學(xué)生的畢業(yè)、校長(zhǎng)的獎(jiǎng)金、教師的薪水以及學(xué)校的評(píng)級(jí)。有學(xué)者描述績(jī)效問(wèn)責(zé)實(shí)施的現(xiàn)狀為:“標(biāo)準(zhǔn)。分?jǐn)?shù)。學(xué)校報(bào)告卡。國(guó)際比較。當(dāng)然,還有考試,無(wú)處不在的考試。我們的教育工作者、家長(zhǎng)、學(xué)生以及公眾時(shí)時(shí)被耳提面命著我們國(guó)家的學(xué)校成就,沒(méi)有一天不這樣。”[1]不難看出,大規(guī)模的標(biāo)準(zhǔn)化考試受到了學(xué)界的批評(píng)。針對(duì)基于標(biāo)準(zhǔn)的多項(xiàng)選擇測(cè)驗(yàn)的不足,美國(guó)許多州采用了表現(xiàn)性評(píng)價(jià)作為考試評(píng)價(jià)的一種形式。所謂表現(xiàn)性評(píng)價(jià),美國(guó)國(guó)會(huì)技術(shù)評(píng)價(jià)辦公室1992年提出了一個(gè)描述性的定義:要求學(xué)生模擬真實(shí)情景,創(chuàng)造出答案或產(chǎn)品以展示其知識(shí)或技能的測(cè)驗(yàn)。[2]大量的國(guó)際實(shí)驗(yàn)研究證明,表現(xiàn)性評(píng)價(jià)為評(píng)估系統(tǒng)服務(wù)于它們的最初目的提供了機(jī)會(huì)——支持學(xué)生的學(xué)習(xí)和教師傳授高階的知識(shí)技能。紐約州作為美國(guó)教育發(fā)達(dá)的一個(gè)州,成功地設(shè)立了性能標(biāo)準(zhǔn)協(xié)會(huì)(New York Performance Standards Consortium)來(lái)支持問(wèn)責(zé)制下表現(xiàn)性評(píng)價(jià)的實(shí)驗(yàn)研究,并且取得的成就超過(guò)了標(biāo)準(zhǔn)化測(cè)驗(yàn)。1995年紐約州前教育廳長(zhǎng)托馬斯.瑟伯爾(Toms Sobol)和性能標(biāo)準(zhǔn)協(xié)會(huì)學(xué)校的領(lǐng)導(dǎo)人一起努力獲得了從五門(mén)會(huì)考科目中放棄四門(mén)考試的權(quán)利,僅有英語(yǔ)語(yǔ)言藝術(shù)科目需要參加會(huì)考考試。所有參與該項(xiàng)計(jì)劃的28所學(xué)校必須在四門(mén)核心課程中,完成基于標(biāo)準(zhǔn)的表現(xiàn)性評(píng)價(jià)的任務(wù)方可畢業(yè),個(gè)別學(xué)校也可以在藝術(shù)、外語(yǔ)、實(shí)習(xí)等方面增加額外任務(wù)。他的繼任者比爾(Richard Mills)頒布了一項(xiàng)高利害考試政策,而且強(qiáng)制性地通過(guò)五門(mén)考試才能畢業(yè),但是協(xié)會(huì)學(xué)校仍然保留棄權(quán),允許學(xué)生遞交協(xié)會(huì)的評(píng)價(jià)結(jié)果給會(huì)考考試中心,這很大程度上是因?yàn)檫@些學(xué)校的成功。
公共問(wèn)責(zé)和透明度是紐約協(xié)會(huì)學(xué)校成功的關(guān)鍵。其成功地運(yùn)用表現(xiàn)性評(píng)價(jià),主要表現(xiàn)在設(shè)計(jì)、專(zhuān)業(yè)發(fā)展、技術(shù)質(zhì)量(信度和效度)三個(gè)方面。
(資料來(lái)源:http://performanceassessment.org/performance/pcomponents.html)
加涅將學(xué)生的學(xué)習(xí)結(jié)果(他稱之為后天習(xí)得的性能)分為五類(lèi),即言語(yǔ)信息、智慧技能、認(rèn)知策略、動(dòng)作技能和態(tài)度,所以人的能力是復(fù)雜的,單純的大規(guī)模標(biāo)準(zhǔn)化考試無(wú)法保證測(cè)得學(xué)生能力的多維性。為了保證基于問(wèn)責(zé)的表現(xiàn)性評(píng)價(jià)順利運(yùn)行,性能標(biāo)準(zhǔn)協(xié)會(huì)專(zhuān)門(mén)建立了一個(gè)評(píng)估系統(tǒng)以評(píng)估學(xué)生的能力。評(píng)估系統(tǒng)由七個(gè)組件組成:主動(dòng)學(xué)習(xí)、形成性和總結(jié)性文件、糾正行動(dòng)策略、學(xué)生多種方式來(lái)表達(dá)和展示學(xué)習(xí)、與學(xué)習(xí)標(biāo)準(zhǔn)相一致的畢業(yè)級(jí)別的表現(xiàn)任務(wù)、學(xué)生作品的外部評(píng)價(jià)者、聚焦于專(zhuān)業(yè)發(fā)展,具體如上表。
同時(shí)拿到高中畢業(yè)文憑需要完成四個(gè)普通的、延長(zhǎng)時(shí)間的表現(xiàn)任務(wù)和一個(gè)核心學(xué)術(shù)科目(英語(yǔ))。這些任務(wù)是基于技能和內(nèi)容兩方面設(shè)計(jì)的,呈交的作品既有書(shū)面形式的,也包括口頭報(bào)告。具體的四個(gè)任務(wù)分別是:文學(xué)分析、高級(jí)數(shù)學(xué)的應(yīng)用、科學(xué)工程或者獨(dú)創(chuàng)實(shí)驗(yàn)、社會(huì)研究領(lǐng)域內(nèi)的研究論文。書(shū)面寫(xiě)作和口頭描述任務(wù)的結(jié)果由學(xué)生、教師以及外部評(píng)估者(有些是他們領(lǐng)域的專(zhuān)家)來(lái)評(píng)估。在整個(gè)高中階段,鼓勵(lì)學(xué)生參與學(xué)校課程設(shè)計(jì)和教學(xué),以促進(jìn)學(xué)生在11和12年級(jí)完成畢業(yè)任務(wù)時(shí)取得優(yōu)異成績(jī)。美國(guó)協(xié)會(huì)學(xué)校根據(jù)具體的任務(wù),設(shè)計(jì)相應(yīng)評(píng)定量表,確定學(xué)生的等級(jí),詳實(shí)具體的量表由老師和問(wèn)責(zé)制下外部評(píng)估者設(shè)計(jì),評(píng)估任務(wù)組成了評(píng)價(jià)系統(tǒng)的重要部分。
除此之外,許多協(xié)會(huì)學(xué)校利用檔案袋收集學(xué)生知道的和可以做的信息。表現(xiàn)性評(píng)價(jià)審查委員會(huì)的主要成員為教育家和評(píng)估專(zhuān)家,每五年審查一次從而決定這些學(xué)校是否開(kāi)發(fā)了一套支持表現(xiàn)性評(píng)價(jià)以一種可持續(xù)發(fā)展道路運(yùn)行的框架。
紐約標(biāo)準(zhǔn)協(xié)會(huì)成立了專(zhuān)門(mén)的咨詢中心,開(kāi)展一系列針對(duì)教師和行政人員的促進(jìn)課程、教學(xué)、評(píng)價(jià)發(fā)展的研討會(huì),支持協(xié)會(huì)學(xué)校的評(píng)估工作。這些研討會(huì)都有具體的內(nèi)容和評(píng)估的重點(diǎn)。咨詢中心還經(jīng)常組織跨聯(lián)盟會(huì)議和參與教師的學(xué)?;ピL。
協(xié)會(huì)學(xué)校近幾年參與了一項(xiàng)適度研究(moderation studies)項(xiàng)目,該研究的目的是收集評(píng)分信度的證據(jù),通過(guò)三個(gè)階段來(lái)完成:(1)協(xié)會(huì)學(xué)校的教師每個(gè)人都參與學(xué)生作品的打分,然后作為一個(gè)組達(dá)成一致;(2)外部評(píng)審者再評(píng)估學(xué)生的作品并打分;(3)學(xué)校組織基于政府的適度研究的作品與本學(xué)校的作品對(duì)比。咨詢中心的成員收集每個(gè)學(xué)校為畢業(yè)而設(shè)計(jì)的作品然后建立學(xué)生作品包,到了秋季,協(xié)會(huì)學(xué)校的教師們各自依據(jù)評(píng)分規(guī)則,以小組的形式討論得分。如,2007 年羅伯特.E.斯德克(Dr.Robert E.Stake)做了一項(xiàng)調(diào)查,來(lái)自協(xié)會(huì)學(xué)校的150名教師收集學(xué)生的作品,每個(gè)教師評(píng)價(jià)三份卷子,然后與來(lái)自不同學(xué)校的十個(gè)教師交流,他們一塊討論了試卷的質(zhì)量以及他們個(gè)人的評(píng)價(jià),然后一起完成了一個(gè)“一致性量表”。最后將達(dá)成一致的試卷遞交到協(xié)會(huì)學(xué)校,運(yùn)用協(xié)會(huì)量規(guī)做基于學(xué)校的評(píng)估。適度研究結(jié)果被認(rèn)為是可靠的,收到了超過(guò)80%的達(dá)成一致性。[3]咨詢中心報(bào)告了跨評(píng)價(jià)者間的高信度評(píng)分,并且在每個(gè)表現(xiàn)層次上都創(chuàng)造并公共發(fā)布了收集的范例文件。
性能標(biāo)準(zhǔn)協(xié)會(huì)將預(yù)測(cè)效度看作是關(guān)于效度的最重要證據(jù)。一項(xiàng)2001年至2002年的研究表明,一組畢業(yè)于性能標(biāo)準(zhǔn)協(xié)會(huì)學(xué)校的高中畢業(yè)生,他們與其他公立學(xué)校學(xué)生相比,家庭收入較低而且具有不同的膚色,但這些學(xué)生在進(jìn)入的大學(xué)的比率、堅(jiān)持上大學(xué)二年級(jí)的比率、在申請(qǐng)大學(xué)GPA考試中分?jǐn)?shù)等方面超過(guò)了全國(guó)平均水平。[4]協(xié)會(huì)學(xué)校學(xué)生僅英語(yǔ)科目參加州標(biāo)準(zhǔn)測(cè)驗(yàn),所以無(wú)法將表現(xiàn)性評(píng)價(jià)結(jié)果與標(biāo)準(zhǔn)測(cè)驗(yàn)結(jié)果做一個(gè)效度比較,但是協(xié)會(huì)和咨詢中心認(rèn)為,將表現(xiàn)性評(píng)價(jià)的結(jié)果與其他測(cè)試的結(jié)果做同步效度比較,會(huì)偏向于高利害的標(biāo)準(zhǔn)化測(cè)驗(yàn),因此,沒(méi)有計(jì)劃執(zhí)行這項(xiàng)研究。
顯而易見(jiàn),協(xié)會(huì)學(xué)校沒(méi)有使用州標(biāo)準(zhǔn)考試作為一種問(wèn)責(zé)手段。關(guān)于實(shí)施表現(xiàn)性評(píng)價(jià)的成效,調(diào)查發(fā)現(xiàn),協(xié)會(huì)學(xué)校的學(xué)生每日出勤率、升大學(xué)率、學(xué)業(yè)成績(jī)等方面均有所提高,輟學(xué)率、發(fā)生事故率降低,教師滿意度提高,更多的家長(zhǎng)愿意參與互動(dòng),更好地支持了需要幫助的學(xué)生,而且增進(jìn)了整個(gè)學(xué)校的文化氛圍。2003年的一項(xiàng)調(diào)查顯示,協(xié)會(huì)學(xué)校與整個(gè)紐約的其他學(xué)校對(duì)比,協(xié)會(huì)學(xué)校的輟學(xué)率更低(10.6%VS 20.3%), 上大學(xué)的人數(shù)更多 (87.8%VS70.1%)。[5]在2002至2003年協(xié)會(huì)學(xué)校的每日出勤率更高(87.6%VS84.7%)。[6]為了驗(yàn)證協(xié)會(huì)學(xué)校是否為他們的學(xué)生升大學(xué)做好了準(zhǔn)備,協(xié)會(huì)學(xué)校參加了一項(xiàng)調(diào)查研究。2001年18所協(xié)會(huì)學(xué)校參加調(diào)查(要求應(yīng)屆畢業(yè)生簽署協(xié)議,協(xié)會(huì)的研究者允許獲得他們大學(xué)成績(jī)單),平均有74%的學(xué)生返回了協(xié)議。2002年的7月,又有15所學(xué)校參加調(diào)查,同樣返回率為74%。在整個(gè)紐約學(xué)校樣本的學(xué)生人口中,20.1%是白人,26.0%是黑人,44.0%是拉美裔,9.8%是亞洲人和其它種族的人,60.3%有權(quán)獲得免費(fèi)午餐。對(duì)比協(xié)會(huì)學(xué)校,19.4%是白人,27.6%是黑人,43.5%是拉美裔,9.6%是亞洲人和其它種族的人,60.7%可以獲得免費(fèi)午餐。[7]2002年的12月,第一批簽訂的協(xié)議送到了大學(xué),2004年2月第二批簽訂的協(xié)議又送去了大學(xué),最后返回了666份成績(jī)單。經(jīng)過(guò)統(tǒng)計(jì)分析,共有77%的協(xié)會(huì)學(xué)校學(xué)生上了4年制大學(xué),19%上了兩年制大學(xué),4%參加了暑期或技能培訓(xùn)。在上四年制大學(xué)的學(xué)生當(dāng)中,7%的學(xué)生在競(jìng)爭(zhēng)最激烈的大學(xué)就讀,14%在競(jìng)爭(zhēng)相當(dāng)激烈的學(xué)校就讀,30%在競(jìng)爭(zhēng)很激烈的大學(xué)就讀,32%在競(jìng)爭(zhēng)激烈的大學(xué)就讀,14%在競(jìng)爭(zhēng)欠激烈的大學(xué)就讀,2%在競(jìng)爭(zhēng)不激烈的大學(xué)就讀,1%在專(zhuān)門(mén)學(xué)校就讀。[8]升入大學(xué)的學(xué)生78%完成了第二學(xué)年的課程。四年制大學(xué)的學(xué)生84%完成了第二學(xué)年的課程,兩年制大學(xué)的學(xué)生59%完成了第二學(xué)年的課程。相比全國(guó)平均水平,只有73%的四年制大學(xué)學(xué)生和56%的兩年制學(xué)生繼續(xù)第二學(xué)年的課程。[9]
這些結(jié)果表明,協(xié)會(huì)學(xué)校是成功的,尤其是對(duì)于非裔美國(guó)學(xué)生、拉美裔學(xué)生以及經(jīng)濟(jì)處于弱勢(shì)的學(xué)生來(lái)說(shuō),有效的幫助他們?yōu)樯髮W(xué)做好了準(zhǔn)備。
紐約性能標(biāo)準(zhǔn)協(xié)會(huì)學(xué)校關(guān)于表現(xiàn)性評(píng)價(jià)從步驟、方法到結(jié)果的完整運(yùn)行和實(shí)施,對(duì)于我國(guó)中小學(xué)的教育評(píng)價(jià)改革具有重要的啟示。
首先,真正的問(wèn)責(zé)體系并不是使用統(tǒng)一的基于結(jié)果的標(biāo)準(zhǔn)化考試。問(wèn)責(zé)制是合理的,它反映了教育系統(tǒng)中各個(gè)參與主體的責(zé)任分擔(dān),明確了教育的義務(wù)和權(quán)利,引起了學(xué)生和教師對(duì)學(xué)術(shù)的重視,有利于國(guó)家的長(zhǎng)遠(yuǎn)發(fā)展。但是,標(biāo)準(zhǔn)化考試并不是評(píng)價(jià)的最有效方式,問(wèn)責(zé)制同“高考”一樣,是在促進(jìn)學(xué)生發(fā)展的基礎(chǔ)上,選拔更優(yōu)秀的人才,而選拔方式本身就需要綜合評(píng)價(jià)。紙筆測(cè)驗(yàn)僅僅反映學(xué)生的知識(shí)掌握程度,人是社會(huì)性的人,21世紀(jì)的人類(lèi)需要掌握21世紀(jì)社會(huì)發(fā)展必要的技能,包括復(fù)雜思維、分析技能、計(jì)算機(jī)技能、創(chuàng)造性、媒體素養(yǎng)和跨文化技能。所以可以看出美國(guó)目前的問(wèn)責(zé)制仍然不完善,而紐約標(biāo)準(zhǔn)協(xié)會(huì)作為一個(gè)試驗(yàn)區(qū),成功的運(yùn)用表現(xiàn)性評(píng)價(jià)方法于教學(xué)實(shí)踐中,結(jié)果令人滿意。可見(jiàn),我國(guó)在構(gòu)建問(wèn)責(zé)制評(píng)估系統(tǒng)時(shí),不能全部使用客觀試題來(lái)測(cè)驗(yàn),問(wèn)責(zé)權(quán)下放給地方政府和學(xué)校,鼓勵(lì)學(xué)校根據(jù)本校的特點(diǎn),堅(jiān)持在校本評(píng)價(jià)和終結(jié)性評(píng)價(jià)中使表現(xiàn)性任務(wù)占據(jù)一定的比例,可能更有利于激發(fā)各方面的積極性和創(chuàng)造性。
其次,面對(duì)新世紀(jì)的挑戰(zhàn),我國(guó)需要加快轉(zhuǎn)變?cè)u(píng)價(jià)范式。課程、教學(xué)、評(píng)價(jià)是一體的。新課程改革的重點(diǎn)是促進(jìn)學(xué)生發(fā)展,新世紀(jì)的學(xué)生是按照2001年《基礎(chǔ)教育課程改革綱要》的內(nèi)容學(xué)習(xí)的,但是學(xué)業(yè)水平考試、高考仍然按照標(biāo)準(zhǔn)的參照測(cè)驗(yàn)評(píng)價(jià)學(xué)生,這就使課程、教學(xué)、評(píng)價(jià)出現(xiàn)了不一致性。傳統(tǒng)的評(píng)價(jià)模式是按照泰勒(Ralph W.Tyler)的模式實(shí)施的,而斯塔弗比姆首創(chuàng)的CIPP評(píng)價(jià)模式由背景(context)評(píng)價(jià)、輸入(input)評(píng)價(jià)、過(guò)程(process)評(píng)價(jià)和成果(product)評(píng)價(jià)這四種評(píng)價(jià)組成的一種綜合評(píng)價(jià)模式,強(qiáng)調(diào)教育除了活動(dòng)要達(dá)到預(yù)期的目標(biāo)外,還會(huì)產(chǎn)生各種非預(yù)期的效應(yīng)、效果,這些結(jié)果同樣需要評(píng)價(jià),而且對(duì)學(xué)生的影響很大。由此可見(jiàn),評(píng)價(jià)范式面臨著沖突,如何將定量評(píng)價(jià)與定性評(píng)價(jià)統(tǒng)而合一,是目前亟需解決的問(wèn)題。
再次,我國(guó)應(yīng)建立專(zhuān)業(yè)化的評(píng)價(jià)系統(tǒng)。建立高質(zhì)量的評(píng)價(jià)任務(wù)和評(píng)價(jià)量規(guī),一直是實(shí)施表現(xiàn)性評(píng)價(jià)的難題。借鑒紐約協(xié)會(huì)學(xué)校的經(jīng)驗(yàn),我們應(yīng)該促進(jìn)評(píng)價(jià)的專(zhuān)業(yè)化。為了保證評(píng)價(jià)的有效性,協(xié)會(huì)學(xué)校成立了專(zhuān)門(mén)的評(píng)估委員會(huì),每隔五年審查一次評(píng)估系統(tǒng)。審視我國(guó)的教育現(xiàn)狀可以看出,反饋環(huán)節(jié)做得不到位。如在日常的教學(xué)過(guò)程中,我們也有意識(shí)的使用檔案袋收集學(xué)生的信息,但是很少花費(fèi)精力對(duì)收集到的信息進(jìn)行分析,而且教師對(duì)測(cè)量學(xué)知識(shí)懂的并不多,不能很好地把握住評(píng)價(jià)的“度”。這就啟示我們,要建立健全評(píng)價(jià)任務(wù)的內(nèi)容和量規(guī),每隔幾年對(duì)檔案袋信息進(jìn)行反饋,教師也需要學(xué)習(xí)測(cè)量學(xué)知識(shí),以保證評(píng)價(jià)的質(zhì)量。
[1]Macpherson,R.J.S.The Politics of Accountability:Educative and intemational perspectives[M].Thousand Oaks,CA:Corwin Press.1998:112.
[2]Hambleton,R.K.Advances:in Assessment models and Practices[M].In D.C.Berliner,R.C.Calfee(ed.).Handbook of educational Psychology.New York:Simon&Schunster MaCmillan.1996:902.
[3]The center for Inquiry in Teaching and Leaming.New York Performance Standards Consortium,Center for Inquiry in Teaching and Leaming Moderation study,2007-2008[EB /OL].
http://performanceassessment.org/performance/pcenter.html,2008.
[4]Foote,M.M.Keeping Accountability Systems Accountable[J].Phi Delta Kappan,88(5),359-363,2007,(01).
[5]The New York City Department of Education.New York City Consortium Schools’Statistics Compared to Citywide Statistics[EB/OL].www.nycenet.edu,2003.
[6][7]The New York City Department of Education’s 2002-2003“Annual School Report cards” and the New York State Department of Education's 2002-2003“New York State Report Card Comprehensive Information Reports.” The Consortium school’s data were compiled from each school's individual report card or information report.The overall New York City high schools’data are found on every New York City school report card for comparison purposes.
[8]Barron.Profiles of American Colleges[M].College Division of Barron’s Educational Series 25th Edition,2003.
[9]Mortenson,T.Freshman-to-Sophomore Persistence Rates by Institutional Control,Academic Selectivity and Degree Level,1983-1998[J].Oskaloosa,lA:Postsecondary Educational Opportunity(Number 74).1998,(8).
鄭海紅/徐州師范大學(xué)2009級(jí)碩士研究生 段作章/徐州師范大學(xué)教育科學(xué)學(xué)院院長(zhǎng)、教授
(責(zé)任編輯:劉丙元)