福建省廈門市思明區(qū)濱東小學 王 躒
《教育部關于積極推進中小學評價與考試制度改革的通知》《關于推進中小學教育質量綜合評價改革的意見》《國家中長期教育改革和發(fā)展規(guī)劃綱要(2010—2020 年)》等政策的出臺是隨著教育改革的不斷推進以及社會發(fā)展對于全面發(fā)展的人才培養(yǎng)的迫切需要,體現(xiàn)了國家對中小學生綜合素質評價的重視與推進,綜合素質評價已成為基礎教育研究的熱點與焦點。
多年來,基礎教育對小學生的評價還主要停留在結果評價,屬于典型的總結性評價,根本無法對學生的過程表現(xiàn)進行跟蹤和及時反饋,更談不上發(fā)現(xiàn)學生成長和學習過程中的問題。更重要的是,傳統(tǒng)的學生評價體系科學性不足,主要表現(xiàn)在評價過程數(shù)據(jù)來源標準不統(tǒng)一、采集方法不一致、評價數(shù)據(jù)統(tǒng)計欠科學,不同學科甚至同班級不同任課教師采用的評價標準與方法都不相同,最終影響評價的有效性。目前,在大數(shù)據(jù)技術迅猛發(fā)展的社會背景下,綜合素質評價的技術路徑已遠遠跟不上時代。
2019 年6 月中共中央、國務院印發(fā)《關于深化教育教學改革全面提高義務教育質量的意見》,2020 年10 月中共中央、國務院印發(fā)《深化新時代教育評價改革總體方案》,2021 年3 月教育部等六部門印發(fā)《義務教育質量評價指南》,文件明確提出要完善立德樹人體制機制,利用大數(shù)據(jù)、人工智能等現(xiàn)代信息技術革新評價工具,強調過程評價、優(yōu)化結果評價、探索增值評價、完善綜合評價,提升教育評價的客觀性、過程性、科學性。作為信息時代重要標志之一的大數(shù)據(jù)技術在中小學生綜合素質評價中應用越來越迫切,將成為整合評價數(shù)據(jù)、分析評價指標以及記錄評價軌跡的有力支撐。
相較傳統(tǒng)的教育評價,數(shù)據(jù)驅動的教育評價從經(jīng)驗轉向證據(jù)、從單一走向全面、從模糊變?yōu)榫珳?,成為?shù)據(jù)驅動背景下綜合素質評價的重要特征,在評價方法、評價功能、評價對象、評價內容、評價過程、評價結果等方面有了本質的轉變。
教育的價值在于發(fā)現(xiàn)個體潛能和興趣,并幫助其不斷發(fā)展,教育評價的最大價值應該體現(xiàn)在增值。目前,我國的教育評價目標主要指向選拔,評價內容大多仍停留在成績的評定上,這嚴重阻礙了教育價值取向的不斷提升和革新。增值評價近年來在教育領域得到非常廣泛的關注,并引發(fā)了教育領域內不同視角的探索與研究,基于人工智能、大數(shù)據(jù)等技術優(yōu)化了增值評價數(shù)據(jù)的收集、存儲、分析處理和評價結果的有效應用,提升了增值評價的科學性。解決了傳統(tǒng)評價在增值評價追蹤數(shù)據(jù)時的可靠與穩(wěn)定存儲、增值評價模型的構建、增值評價結果的呈現(xiàn)與理解等方面的諸多問題,使得增值評價的落地與推廣成為可能。數(shù)據(jù)驅動的教育評價關注教育個體在一定時間段內是否存在變化,以及具體的變化“量”,如通過計算學生當前數(shù)據(jù)與學生初始數(shù)據(jù)的增值,幫助評價者和被評價者快速發(fā)現(xiàn)學生進步(退步)情況,數(shù)據(jù)的差異也能反映不同干預措施的差異性和有效性。由此可以發(fā)現(xiàn)大量的而且可以細化的大數(shù)據(jù)實際“放大”了個體發(fā)展的細微變化,生動而完整地展示了教育“增值”的過程,使評價目標指向增值性成為現(xiàn)實。
美國學者派特(M.Q.Patton)在20 世紀70 年代就提出了“多元主體參與”的概念,認為使用評價信息的相關人員都應參與到評價過程中。可是一直受限于技術環(huán)境,難以實現(xiàn)全員參與評價。事實上,現(xiàn)階段“管、辦、評”三位一體的教育管理架構使得教育評價的主體一般是政府和教育行政部門,這種單一的評價主體導致長期以行政管理為主導的教育評價行政化嚴重。信息技術平臺的建設和數(shù)字技術的發(fā)展為不同參與評價的主體提供了足夠的空間和平臺參與評價,不但拓寬了評價的視角,而且增強了不同主體間的互動,為真正建立多元主體參與、同時達到相互影響的教育評價制度奠定基礎。
在傳統(tǒng)教育評價中,難以收集整理、匯總分析,基本上做不到公開,甚至是可用于教育評價的信息大多是“隱形”的。然而,大數(shù)據(jù)技術的出現(xiàn)使得教育信息變得可量化而且可視化。新一代數(shù)字技術的廣泛應用為教育提供了海量的數(shù)據(jù),使得教育評價的范圍可以逐漸擴大到“一切教育和教育的一切”。從評價個體來說,它的范圍是多維度、多層次的,可以涵蓋個體評價中的方方面面,綜合素質評價的范圍可謂覆蓋面廣泛而全面,如線上線下的學習表現(xiàn)、作業(yè)情況、師生互動情況、學習興趣、學習態(tài)度、學習動機等;從評價的對象來說,范圍不僅可以涵蓋課堂、教師、學生、家長、學校等層面,還可以擴大到區(qū)域教育發(fā)展水平、學科發(fā)展的國際比較、國家教育競爭力等相對宏觀的層面。任何教育發(fā)展和改革實踐中存在的新問題、新進展都將納入教育評價的范圍中。
一是“實時”,收集不斷變化的實時數(shù)據(jù),通過數(shù)據(jù)分析對學生進行不斷更新的全息畫像。不同于傳統(tǒng)評價對學生行為的點狀記錄,數(shù)據(jù)驅動的教育評價通過對學生行為數(shù)據(jù)的實時記錄,指向增值的數(shù)據(jù)分析,可以實現(xiàn)勾勒學生發(fā)展軌跡、準確預測學生發(fā)展趨向、對學生進行個性化幫助和指導的目標。二是“實地”,因“?!敝埔碎_展綜合素質評價,支持學校增加特色評價內容。同時也支持“動態(tài)量化”評價標準,一方面可以動態(tài)調整評價系統(tǒng)的指標,借助數(shù)字化手段,幫助評價主體因地制宜開展評價,切實指導教育教學有效開展;另一方面可以動態(tài)調整評價模塊或維度的權重,服務處在不同場景的學生個體或是學生群,對其行為和過程表現(xiàn)進行統(tǒng)計分析,用清晰易懂、多種形式的可視系統(tǒng)及時直觀呈現(xiàn)。
“因材施教”是我國古代精準教學的雛形,達到精準教學的目的主要靠教師的觀察、分析。即使到了現(xiàn)代,學生學習的興趣點、難點等基本上還是憑借教師經(jīng)驗得以確定,評價的內容和管理上,都存在隨意性和主觀性;評價標準上,沒有統(tǒng)一的遵循,也開發(fā)不了相對科學的、系統(tǒng)的評價工具。但利用大數(shù)據(jù)技術能相對全面地記錄學生學習的全過程,通過綜合運用人工智能、區(qū)塊鏈等方法分析海量的數(shù)據(jù),實現(xiàn)過程數(shù)據(jù)的智能化處理,全面掌握數(shù)據(jù)鏈所隱藏的關系和價值,評價結果精準有效地指導學生反思學習的過程,引導學生主動發(fā)現(xiàn)學習問題,并將評價結果中存在的問題準確反饋給師生,為促進學生的個性化學習和教師的精準教學提供精準的指導。
由于傳統(tǒng)教育評價的局限性,以往的教育評價實施過程可以說是一個“黑箱”,且專家或第三方評估機構也會因為種種關系影響評價行為,因此很難保證評價的公正性。“互聯(lián)網(wǎng)+”開啟了一個高度透明、更具公信力的時代。信息技術背景下的評價過程可以讓評價主體或評價利益相關體能看到教育評價過程中發(fā)生的一切,如采集了哪些數(shù)據(jù)、如何聚合信息、怎樣分析數(shù)據(jù)、做出什么決策等。數(shù)據(jù)驅動的教育評價過程的公開,保障了民眾與教育相關部門的信息(評價數(shù)據(jù))對等,民眾通過可信的信息和數(shù)據(jù)支持就可以有“據(jù)”可依。
相較傳統(tǒng)的教育評價,數(shù)據(jù)驅動的評價從經(jīng)驗轉向證據(jù)、從單一走向全面、從模糊變?yōu)榫珳剩蔀閿?shù)據(jù)驅動背景下綜合素質評價的重要特征,在評價方法、評價功能、評價對象、評價內容、評價過程、評價結果等方面有了本質的轉變?!皵?shù)據(jù)驅動評價”重在讓評價過程化、可視化、數(shù)據(jù)化、“云端”化,重視綜合素質的發(fā)展,將評價的方式變得靈活多樣。