余彩芳
(北京市十一學(xué)校 北京 100039)
2020年6月,中央全面深化改革委員會審議通過的《深化新時代教育評價改革總體方案》中首次提出“堅(jiān)持科學(xué)有效,改進(jìn)結(jié)果評價,強(qiáng)化過程評價,探索增值評價,健全綜合評價,充分利用信息技術(shù),提高教育評價的科學(xué)性、專業(yè)性、客觀性”,為深化教育評價改革指明了方向。新高考選考背景下如何改進(jìn)結(jié)果評價,如何在一線教學(xué)中推廣增值評價,對幫助學(xué)生學(xué)習(xí)和提高教師教學(xué)具有重要價值。這些先進(jìn)的評價觀在教學(xué)實(shí)踐中落地,化為具體的評價行為,絕非易事。本文通過多年一線教學(xué)實(shí)踐經(jīng)驗(yàn)的積累,探索出一套既能滿足日常教學(xué)診斷需求,又便于理解和操作的可視化多元評價體系。
結(jié)果評價的優(yōu)點(diǎn)是有相對精確的量化指標(biāo)作為評價依據(jù),其結(jié)論往往有較強(qiáng)的說服力和可信度,更容易滿足教育公平的要求。相比結(jié)果評價,增值評價是全新的概念。與其他教育評價強(qiáng)調(diào)不同學(xué)生、教師共時性的橫向比較不同,增值評價著眼于師生自身歷時性的縱向評價,即將自己的發(fā)展進(jìn)步幅度作為評價指標(biāo)。但是結(jié)果評價和增值評價并不是孤立的,如果以結(jié)果評價為平臺,發(fā)掘其中的增值評價契機(jī),則可以把兩種評價方式有機(jī)結(jié)合,相輔相成、相互促進(jìn)。
利用學(xué)生的進(jìn)步程度開展增值評價,被公認(rèn)為是一種更加公平和精確的學(xué)校評價方法。[1]根據(jù)不同時間點(diǎn)測量學(xué)生的學(xué)業(yè)表現(xiàn),比較學(xué)生在學(xué)校、教師的培養(yǎng)下取得了多大程度的進(jìn)步,將原有的通過單次測驗(yàn)成績進(jìn)行終結(jié)性評價轉(zhuǎn)變?yōu)閷Πl(fā)展趨勢進(jìn)行綜合性評價,是近些年來教育評價的熱點(diǎn)話題。
目前國內(nèi)外都有很多關(guān)于增值評價模型的研究方法,主要包括概要分析法、線性回歸法和多層線性法等。[2]這些模型的共同特點(diǎn)是通常以學(xué)校、年級、班級等集體為整體評價對象,少有針對學(xué)生個人的增值評價;除此之外,模型計(jì)算較復(fù)雜,在實(shí)際應(yīng)用中被公眾了解的難度太大,很難廣泛普及到教育一線。所以本文將聚焦針對學(xué)生個人的增值評價模型研究,以在個人進(jìn)行增值評價上具有明顯優(yōu)勢的“學(xué)生成長百分等級模型”(Student Growth Percentile,SGP)為基礎(chǔ),展開增值評價的計(jì)算和可視化研究,力求通過簡單直觀的方式,讓每一位學(xué)生在學(xué)習(xí)過程中的成長變化都能被及時關(guān)注,進(jìn)而有針對性地促進(jìn)每一位學(xué)生的學(xué)習(xí)。
本文中采用的增值評價模型由學(xué)業(yè)成績、增值分析和評價報(bào)告三部分組成。
學(xué)業(yè)成績包括學(xué)生各學(xué)期的期中和期末成績。新高考選考制度帶來的變化,在成績的呈現(xiàn)方式上也有所不同。語數(shù)外學(xué)科以150分為滿分,選考科目則采取與北京新高考匹配的等級分計(jì)算方式,加和后得到綜合成績。考慮不同選考科目人數(shù)的差異性,名次計(jì)算用百分等級表示(5%為一檔)。如表1所示,診斷2的語文百分等級為45,表示該學(xué)生在診斷2測試中,語文成績水平位于參與該門學(xué)科測試者的40%~45%。
表1 某同學(xué)兩次診斷的學(xué)業(yè)成績數(shù)據(jù)示例
本文主要基于學(xué)生多次考試中的百分等級變化關(guān)系來研究學(xué)業(yè)成績的“增值”情況,通過增值幅度的大小來評價,為不同起點(diǎn)的學(xué)生提供較公平、合理的比較。本文通過多角度來分析學(xué)生學(xué)習(xí)的“增值”情況。
1.百分等級變化評價
通過學(xué)生兩次考試的百分等級變化衡量學(xué)習(xí)增值,是最為直觀和便于公眾理解的增值計(jì)算方式,如表2所示。通過該學(xué)生兩次診斷的百分等級變化值可以看到,該學(xué)生在第二次診斷中,除了數(shù)學(xué)外的五門學(xué)科都取得了明顯進(jìn)步,但由于數(shù)學(xué)退步較大,導(dǎo)致最后六科的百分等級呈退步趨勢。
表2 某同學(xué)兩次診斷的百分等級增值分析數(shù)據(jù)示例
百分等級變化評價方式的顯著缺點(diǎn)是欠缺一定的公平性,因?yàn)樘幱诓煌燃墝W(xué)生的成長難度是不一樣的,尤其對高起點(diǎn)的學(xué)生而言,增值空間有限,這樣的評價容易遭遇“天花板效應(yīng)”。[3]
2.簡化的學(xué)生成長百分等級模型評價
“學(xué)生成長百分等級模型”可以緩解優(yōu)秀學(xué)生上升空間不足的矛盾。學(xué)生成長百分等級模型是在分位數(shù)回歸基礎(chǔ)上發(fā)展起來的評價方法,該模型通過整合學(xué)生以往數(shù)據(jù),在以往學(xué)業(yè)水平一致的考生群體(同類學(xué)生)中進(jìn)行比較來確認(rèn)每個學(xué)生的進(jìn)步情況。[4]在眾多增值評價計(jì)算模型中,便于理解,尤其可用于學(xué)生個人的成長增值計(jì)算。但是計(jì)算需要的樣本量較大,一般要求在5000人以上,否則獲得的SGP等級就會不穩(wěn)定,增值計(jì)算會出現(xiàn)較大偏差。[5]同時,雖然模型原理容易理解,但在一線教學(xué)中計(jì)算起來仍然比較困難,很難在年級這樣的小樣本量范圍內(nèi)實(shí)施。所以,本文受SGP模型啟發(fā),在此基礎(chǔ)上簡化了計(jì)算方法(后稱為“等級模型”)。雖然降低了原模型精確程度,但在日常教學(xué)中便于實(shí)施,基本能滿足師生對日常學(xué)習(xí)的增值評價需求。
為便于分類計(jì)算,等級模型參考北京高考21等級賦分機(jī)制,把學(xué)生群體分為五個等級(也可根據(jù)需求劃分更多或者更少等級),如表3所示。
表3 等級模型中的等級劃分示例
引入等級模型后,學(xué)生的增值評價就多了一個維度,可以衡量學(xué)生在學(xué)習(xí)相似的群體中的進(jìn)步情況,如表4所示。
表4 某同學(xué)兩次診斷的增值分析數(shù)據(jù)示例
評價結(jié)果以學(xué)生的某一階段學(xué)習(xí)為時間線,對學(xué)生的成績變化和學(xué)習(xí)情況進(jìn)行跟蹤,充分利用可視化方式呈現(xiàn)出來,形成不同評價,簡單明了地說明學(xué)生學(xué)習(xí)過程的表現(xiàn)。
為有效落實(shí)增值評價,本文在評價報(bào)告中不僅關(guān)注學(xué)習(xí)上的“增量”,更關(guān)注學(xué)習(xí)上的“增質(zhì)”。評價報(bào)告中既有以百分位次為主體的定量、客觀的增值分析,也有結(jié)合教師觀察、走訪等途徑建立的定性、經(jīng)驗(yàn)性的增值分析,不再全部以學(xué)習(xí)結(jié)果論英雄,努力做到“因材施評”。這些信息都會整合在評價報(bào)告中,方便師生參考。
教學(xué)實(shí)踐中推廣增值評價,可以讓不同的被評價者都能“看到”進(jìn)步和發(fā)展的希望,進(jìn)而根據(jù)自身?xiàng)l件,選擇合理的努力方向,爭取應(yīng)有的發(fā)展與成就,實(shí)現(xiàn)評價的激勵作用,有助于促進(jìn)教育公平、提升教育質(zhì)量?,F(xiàn)在大多數(shù)中學(xué)一般都基于Excel進(jìn)行數(shù)據(jù)分析和展示,但普遍都停留在學(xué)生成績的查詢和排序上,對成績背后的信息則不夠關(guān)注。利用數(shù)據(jù)分析和可視化技術(shù)能夠高效提取各成績之間的關(guān)聯(lián),讓師生及時“看到”評價結(jié)果,具有重要的理論和實(shí)踐意義。[6]評價的未來需要“可視化”,如果不能選擇有效的方式引導(dǎo)師生合理關(guān)注評價結(jié)果,評價可能無法發(fā)揮應(yīng)有的作用,甚至可能成為負(fù)擔(dān)。本文在評價報(bào)告中引入了數(shù)據(jù)可視化理念,以常用數(shù)據(jù)分析工具Excel為平臺,通過對評價報(bào)告多維度、多角度的可視化分析,能夠更直觀展現(xiàn)數(shù)據(jù)結(jié)果,增強(qiáng)數(shù)據(jù)可讀性,便于觀察數(shù)據(jù)關(guān)聯(lián),如圖1所示。
圖1 基于Excel展示的某同學(xué)四次診斷可視化報(bào)告單
本文設(shè)計(jì)的可視化診斷報(bào)告單主要包括以下五個部分。
這一部分包含學(xué)生教學(xué)班、導(dǎo)師等基本信息,同時提供學(xué)生多次診斷平均百分等級,方便了解學(xué)生學(xué)習(xí)概況。
這一部分提供學(xué)生多次診斷數(shù)據(jù),并通過可視化方式將學(xué)習(xí)情況進(jìn)行分析提示,挖掘更多有價值的信息。通過變化,把傳統(tǒng)結(jié)果評價中大家較為關(guān)注的一致性問題進(jìn)行標(biāo)識,典型問題一目了然,力求“讓數(shù)字說話”。例如,個人得分低于年級平均水平時,系統(tǒng)會自動顯示為粉色(圖中為圓點(diǎn)),單科百分等級低于六科百分等級時,數(shù)據(jù)則以綠色(圖中為斜線)顯示。例如,圖1中展示的診斷報(bào)告單,通過數(shù)據(jù)部分可快速辨認(rèn)出該同學(xué)的語文是長期處于弱勢的學(xué)科,在四次診斷中都低于六科百分等級(四次診斷中語文的百分等級均為斜線);英語則是優(yōu)勢學(xué)科,四次診斷英語的百分等級均沒有被系統(tǒng)以綠色提醒。
除了比較單科與總分的關(guān)聯(lián),系統(tǒng)還設(shè)置了個人得分與年級平均水平的對比。圖1中診斷信息表反饋的結(jié)果表示,該學(xué)生各科學(xué)習(xí)水平基本高于年級平均水平,偶有某學(xué)科低于年級平均水平的情況。
增值等級變化則通過溫馨的文字留言來體現(xiàn),弱化對學(xué)生學(xué)習(xí)情況的分類。例如,圖1中,對照診斷信息表,該同學(xué)從診斷3到診斷4,語文和物理在百分等級上有明顯進(jìn)步,但增值等級仍然處于B,所以系統(tǒng)會以“積跬步至千里”對學(xué)生進(jìn)行鼓勵;地理是該同學(xué)進(jìn)步最大的學(xué)科,除了百分等級有較大飛躍外,增值等級區(qū)間也從之前的D上升到B,系統(tǒng)會以“鯤鵬展翅九萬里”展現(xiàn)。通過百分等級和增值等級的組合評價,并結(jié)合可視化的方式喚醒學(xué)生學(xué)習(xí)內(nèi)驅(qū)力。
只有連續(xù)性的數(shù)據(jù)才能更加客觀、準(zhǔn)確地反映出該學(xué)生學(xué)習(xí)過程的表現(xiàn),所以報(bào)告單中把學(xué)生的結(jié)果評價轉(zhuǎn)為形成性評價,通過折線圖的形式,反映歷次結(jié)果評價之間的關(guān)聯(lián),引導(dǎo)師生關(guān)注學(xué)習(xí)的連續(xù)性和可持續(xù)性。同時與柱狀圖組合,與各科平均水平進(jìn)行關(guān)聯(lián),讓學(xué)習(xí)過程可見。通過圖1的百分等級變化曲線圖可清晰看到,該學(xué)生英語灰色柱狀圖最低,是較穩(wěn)定的優(yōu)勢學(xué)科;語文和地理灰色柱狀圖相對較高,是弱勢學(xué)科。四次診斷的學(xué)習(xí)變化可通過折線圖觀察到,英語在四次診斷中發(fā)揮平穩(wěn),是較穩(wěn)定的優(yōu)勢學(xué)科。大部分學(xué)科的學(xué)習(xí)情況較診斷1略有退步,需要反思是否學(xué)習(xí)時間的分配出現(xiàn)了問題,還是隨著各科學(xué)習(xí)難度的加深,學(xué)習(xí)變得吃力……通過折線圖,讓學(xué)生的學(xué)習(xí)過程可見,有助于學(xué)生及時反思,調(diào)整學(xué)習(xí)策略。
這一部分方便師生對年級診斷基本情況有所了解,提供傳統(tǒng)的平均分和最高分等基礎(chǔ)信息,便于定位自我學(xué)習(xí)目標(biāo),制訂下一步學(xué)習(xí)計(jì)劃。
客觀的數(shù)字加上教師的評語,才會讓學(xué)生看到進(jìn)步和發(fā)展的希望,激勵學(xué)生從自身情況出發(fā),通過自身努力取得應(yīng)有的發(fā)展與成就,實(shí)現(xiàn)評價的激勵與促進(jìn)作用。所以,除了客觀的數(shù)字分析外,診斷報(bào)告單還會基于教師觀察、走訪等途徑建立起對每一位學(xué)生觀察性、經(jīng)驗(yàn)性的增值分析,為每一位學(xué)生提供學(xué)情分析和下一階段的學(xué)習(xí)建議,力求因材施評,讓評價更有溫度。
傳統(tǒng)的成績報(bào)告單通常信息單一,增值評價很少體現(xiàn),尤其針對學(xué)生個人的可視化診斷報(bào)告單。本文設(shè)計(jì)的可視化診斷報(bào)告單已經(jīng)通過多年教學(xué)實(shí)踐不斷改進(jìn),基于Excel平臺,多元評價向智能化和可視化轉(zhuǎn)變,具有較強(qiáng)的普適性??梢暬\斷報(bào)告單的主要亮點(diǎn)有:通過提供多次結(jié)果評價的關(guān)鍵信息,把連續(xù)性的結(jié)果評價轉(zhuǎn)化為過程性評價,引導(dǎo)師生把關(guān)注點(diǎn)從學(xué)習(xí)結(jié)果轉(zhuǎn)移到學(xué)習(xí)過程;以增值評價為主線,立足結(jié)果評價,突破結(jié)果評價的臨界點(diǎn),在結(jié)果評價基礎(chǔ)上充分挖掘增值評價信息,激發(fā)學(xué)習(xí)潛能,讓每個學(xué)生都在自身的起點(diǎn)上獲得進(jìn)步;通過可視化的方式,將各種評價方式融合,從多維度進(jìn)行數(shù)據(jù)相關(guān)性、學(xué)習(xí)情況等分析,既引導(dǎo)師生對評價中的重要問題進(jìn)行關(guān)注,幫助師生形成正確的評價觀,還能挖掘隱含卻極具價值的信息,發(fā)現(xiàn)更多學(xué)習(xí)背后的故事,讓診斷報(bào)告單作為激發(fā)學(xué)生學(xué)習(xí)的重要動力。