安富海,管起燕
(杭州師范大學(xué) 教師發(fā)展研究中心,浙江 杭州 311121)
表現(xiàn)性評價(jià)(Performance Assessment,又稱為“表現(xiàn)性評定”,臺(tái)灣地區(qū)學(xué)者大多將其譯為“實(shí)作評量”)是在盡量合乎真實(shí)的情境中,運(yùn)用評分規(guī)則對學(xué)生完成復(fù)雜任務(wù)的過程表現(xiàn)與結(jié)果做出判斷的一種評價(jià)方式。[1]這種評價(jià)方式突破了以二元對錯(cuò)為標(biāo)準(zhǔn)的紙筆測驗(yàn)的弊端,更加關(guān)注學(xué)生學(xué)習(xí)過程中的多元化學(xué)習(xí)表現(xiàn)和差異化理解水平。在教學(xué)中正確運(yùn)用表現(xiàn)性評價(jià)能夠關(guān)注到學(xué)生思維的發(fā)展程度和內(nèi)在的情感傾向,推動(dòng)學(xué)生高階思維發(fā)展,提升學(xué)生學(xué)習(xí)的自信心和內(nèi)在動(dòng)力。
自20世紀(jì)80年代,美國學(xué)者斯蒂金斯(Stiggins,R.)和威金斯(Wiggins,G.)提出并致力于表現(xiàn)性評價(jià)的理論研究與實(shí)踐探索以來,其理論價(jià)值和實(shí)踐意義受到政策制定者的關(guān)注和理論研究者的重視,理論研究成果不斷豐富、實(shí)踐探索范圍不斷擴(kuò)大。20世紀(jì)90年代,我國學(xué)者開始介紹表現(xiàn)性評價(jià)的理念與方法。[2]隨著第八次課程改革的實(shí)施和推進(jìn),表現(xiàn)性評價(jià)在我國基礎(chǔ)教育理論研究者的倡導(dǎo)下,逐漸進(jìn)入我國基礎(chǔ)教育學(xué)生發(fā)展評價(jià)實(shí)踐場域,對改進(jìn)我國基礎(chǔ)教育學(xué)生發(fā)展評價(jià)產(chǎn)生了重要影響。近年來,表現(xiàn)性評價(jià)在評價(jià)目標(biāo)、評價(jià)內(nèi)容、評價(jià)方式等方面,尤其是與學(xué)科結(jié)合的過程中遭遇到很多困難。本研究擬運(yùn)用CiteSpace知識可視化軟件分析我國表現(xiàn)性評價(jià)的已有研究成果,明晰發(fā)展現(xiàn)狀,揭示研究內(nèi)容及存在問題,以期能為改進(jìn)表現(xiàn)性評價(jià)、促進(jìn)學(xué)生全面發(fā)展提供參考。
本研究以中國知網(wǎng)(CNKI)數(shù)據(jù)庫為數(shù)據(jù)來源,以“表現(xiàn)性評價(jià)”“表現(xiàn)性評定”“實(shí)作評量”為主題詞進(jìn)行檢索,檢索時(shí)間為2021年7月,收集到1998—2021年期間相關(guān)文獻(xiàn)(符合條件的最早文獻(xiàn)出現(xiàn)在1998年)。在剔除重復(fù)文獻(xiàn)、會(huì)議報(bào)告及與主題相關(guān)度不高文獻(xiàn)后,最終得到有效文獻(xiàn)1163篇,其中期刊947篇、碩博士學(xué)位論文216篇。
本研究采用CiteSpace軟件5.8.R1版本繪制我國表現(xiàn)性評價(jià)研究的知識圖譜。CiteSpace軟件是陳超美教授于2004年開發(fā)的一款信息可視化軟件工具,能夠繪制出某個(gè)知識領(lǐng)域在特定時(shí)期發(fā)展變化的知識圖譜。知識圖譜以知識域?yàn)閷ο?,能可視化地呈現(xiàn)某一知識領(lǐng)域的發(fā)展進(jìn)程與結(jié)構(gòu),并顯示出某一知識單元或知識群之間隱含的各種復(fù)雜關(guān)系。[3]本研究利用該軟件繪制表現(xiàn)性評價(jià)研究文獻(xiàn)的知識圖譜,通過動(dòng)態(tài)與靜態(tài)、質(zhì)性與量化的分析,科學(xué)揭示了表現(xiàn)性評價(jià)的研究內(nèi)容、存在問題及發(fā)展趨勢。
本研究將所篩選的1163篇有效文獻(xiàn)按照Refworks格式保存為文本文件,利用CiteSpace自帶的數(shù)據(jù)轉(zhuǎn)換器對該文本進(jìn)行數(shù)據(jù)轉(zhuǎn)換,最后導(dǎo)入到CiteSpace5.8.R1中生成知識圖譜。CiteSpace的參數(shù)設(shè)置為:時(shí)間段設(shè)置1998~2021,時(shí)間切片(Years Per Slice)設(shè)置1年,節(jié)點(diǎn)類型(Node Types)設(shè)置“關(guān)鍵詞”(Keyword),裁剪方法設(shè)置“Pruning Merged Netword”,其余條件默認(rèn),最終生成我國表現(xiàn)性評價(jià)研究的知識圖譜。
關(guān)鍵詞是論文核心詞。本研究利用CiteSpace對表現(xiàn)性評價(jià)研究進(jìn)行關(guān)鍵詞共現(xiàn)分析,通過對相似關(guān)鍵詞進(jìn)行合并、剔除,最終得到知識圖譜1,該圖譜由696個(gè)節(jié)點(diǎn)、865個(gè)連線組成。其中,節(jié)點(diǎn)表示具體關(guān)鍵詞,圓環(huán)表示關(guān)鍵詞出現(xiàn)頻次,圓環(huán)外側(cè)的紫紅色則表示該關(guān)鍵詞的中心性程度。如圖1所示,整個(gè)關(guān)鍵詞共現(xiàn)網(wǎng)絡(luò)連線較為密集且分支較多,但次級節(jié)點(diǎn)并不突出,在一定程度上可以說明我國關(guān)于表現(xiàn)性評價(jià)的研究還不夠聚焦,研究深度亟待加強(qiáng)。
圖1 表現(xiàn)性評價(jià)關(guān)鍵詞共現(xiàn)的知識圖譜
經(jīng)過CiteSpace處理分析發(fā)現(xiàn),關(guān)鍵詞節(jié)點(diǎn)大小與該關(guān)鍵詞出現(xiàn)的頻次成正相關(guān);關(guān)鍵詞字體大小與該關(guān)鍵詞的中心性成正相關(guān)。關(guān)鍵詞節(jié)點(diǎn)的中心性≥0.10,說明該關(guān)鍵詞較為重要。研究運(yùn)用CiteSpace軟件“Export”選項(xiàng)中的“Net WorkSummary Table”功能得出相關(guān)數(shù)據(jù),并統(tǒng)計(jì)出頻次高于5,中心性高于0.10的關(guān)鍵詞,在剔除主題關(guān)鍵詞后,得到高頻詞和高中心性關(guān)鍵詞列表(表1)。通過系統(tǒng)梳理圖1和表1中的關(guān)鍵詞、頻次和中心性,并結(jié)合二次文獻(xiàn)分析可知,“核心素養(yǎng)”“發(fā)展性評價(jià)”“形成性評價(jià)”“任務(wù)設(shè)計(jì)”“表現(xiàn)性評定”等關(guān)鍵詞體現(xiàn)了1998年以來我國表現(xiàn)性評價(jià)研究的熱點(diǎn)問題。
表1 高頻詞和高中心性關(guān)鍵詞列表(中心性≥0.10)
為深入了解我國表現(xiàn)性評價(jià)的研究熱點(diǎn)及知識分布,本研究采用對數(shù)似自然率算法(Likelihood Rate,簡稱LLR)對關(guān)鍵詞進(jìn)行聚類分析,得到模塊值Q=0.8562>0.3,平均輪廓值S=0.9878>0.7,說明該聚類劃分出的社團(tuán)結(jié)構(gòu)顯著,聚類結(jié)果令人信服。去除3個(gè)基本關(guān)鍵詞聚類,并選取該類中LLR算子取值最高的關(guān)鍵詞作為聚類標(biāo)簽,最終得到11個(gè)核心聚類(圖2)。按照對數(shù)似自然率算法對聚類信息進(jìn)行排序、整理,得到表現(xiàn)性評價(jià)關(guān)鍵詞聚類信息表(表2)。結(jié)合圖2、表2和二次文獻(xiàn)梳理,將11個(gè)核心聚類進(jìn)一步歸納為表現(xiàn)性評價(jià)的演進(jìn)歷程研究、表現(xiàn)性評價(jià)的概念研究、表現(xiàn)性評價(jià)的設(shè)計(jì)研究以及表現(xiàn)性評價(jià)在課堂教學(xué)中的應(yīng)用研究四個(gè)方面。具體分析如下:
圖2 表現(xiàn)性評價(jià)關(guān)鍵詞聚類標(biāo)簽視圖
表2 表現(xiàn)性評價(jià)關(guān)鍵詞聚類信息表
我國表現(xiàn)性評價(jià)研究主要是伴隨著第八次基礎(chǔ)教育課程改革的進(jìn)行和學(xué)生發(fā)展核心素養(yǎng)的提出而發(fā)展的。2001年教育部印發(fā)的《基礎(chǔ)教育課程改革綱要》明確提出要“改變課程評價(jià)過分強(qiáng)調(diào)甄別與選拔的功能,發(fā)揮評價(jià)促進(jìn)學(xué)生發(fā)展、教師提高和改進(jìn)教學(xué)實(shí)踐的功能”。表現(xiàn)性評價(jià)開始受到教育界的關(guān)注,許多理論研究者和實(shí)踐工作者也開始呼吁用表現(xiàn)性評價(jià)評估學(xué)生發(fā)展?fàn)顩r。#9紙筆測驗(yàn)聚類下提取出的紙筆測驗(yàn)、科學(xué)探究能力、師生互動(dòng)等特征詞是學(xué)者們基于課程改革的理念和基礎(chǔ)教育的實(shí)踐問題對傳統(tǒng)標(biāo)準(zhǔn)化測驗(yàn)方式的反思批判。有學(xué)者認(rèn)為表現(xiàn)性評價(jià)是在人們普遍對傳統(tǒng)的標(biāo)準(zhǔn)化測驗(yàn)不滿的背景下提出的。[4]與注重死記硬背和快速得出結(jié)果的傳統(tǒng)紙筆測驗(yàn)相比,表現(xiàn)性評價(jià)鼓勵(lì)學(xué)生自主探究,更加關(guān)注學(xué)生學(xué)習(xí)成長的過程以及內(nèi)在能力的提升。研究表明,在課堂教學(xué)中應(yīng)用表現(xiàn)性評價(jià),通過讓學(xué)生自主探究并學(xué)會(huì)清楚表述探究的過程與結(jié)果,能夠客觀評價(jià)并促進(jìn)學(xué)生的科學(xué)探究能力。[5]2014年教育部印發(fā)的《關(guān)于全面深化課程改革落實(shí)立德樹人根本任務(wù)的意見》中明確提出“將組織研究提出各學(xué)段學(xué)生發(fā)展核心素養(yǎng)體系,明確學(xué)生應(yīng)具備的適應(yīng)終身發(fā)展和社會(huì)發(fā)展需要的必備品格和關(guān)鍵能力”。#3核心素養(yǎng)聚類下提取出的核心素養(yǎng)、深度學(xué)習(xí)、項(xiàng)目式學(xué)習(xí)和#7學(xué)生核心素養(yǎng)聚類下提取出的學(xué)生核心素養(yǎng)、科學(xué)探究、實(shí)踐活動(dòng)等特征詞都體現(xiàn)了核心素養(yǎng)時(shí)代學(xué)者們對學(xué)生未來學(xué)習(xí)與生活所需的必備品格與關(guān)鍵能力的關(guān)注和探索。有學(xué)者在研究美國新罕布什爾州學(xué)生發(fā)展評價(jià)案例的基礎(chǔ)上,指出表現(xiàn)性評價(jià)更適合檢測高水平、復(fù)雜的思維能力,能很好地體現(xiàn)核心素養(yǎng)所描繪的學(xué)習(xí)結(jié)果,并能夠促進(jìn)這些能力的獲得。[6]有學(xué)者從核心素養(yǎng)的視角出發(fā),探究了表現(xiàn)性評價(jià)對培養(yǎng)學(xué)生學(xué)習(xí)力的價(jià)值。[7]有學(xué)者探討了表現(xiàn)性評價(jià)與深度學(xué)習(xí)、項(xiàng)目式學(xué)習(xí)等理念與實(shí)踐之間復(fù)雜關(guān)系,提出將表現(xiàn)性評價(jià)的目標(biāo)、表現(xiàn)任務(wù)和評分規(guī)則融入初中數(shù)學(xué)課堂的深度學(xué)習(xí)中,能夠促使學(xué)生深度學(xué)習(xí)的發(fā)生。[8]另外,有研究者證明,表現(xiàn)性評價(jià)的實(shí)施過程與結(jié)果體現(xiàn)著核心素養(yǎng)導(dǎo)向的質(zhì)量觀,并能在教學(xué)中引領(lǐng)學(xué)生核心素養(yǎng)的發(fā)展。[9]隨著中共中央和國務(wù)院關(guān)于《深化新時(shí)代教育評價(jià)改革總體方案》的發(fā)布,表現(xiàn)性評價(jià)的理論研究不斷走向深入,實(shí)踐探索的范圍也在不斷擴(kuò)大。
在基礎(chǔ)教育評價(jià)改革中,與表現(xiàn)性評價(jià)同時(shí)涌現(xiàn)的還有發(fā)展性評價(jià)、檔案袋評價(jià)、真實(shí)性評價(jià)等概念。雖然這些評價(jià)名稱不同,卻經(jīng)常被默認(rèn)有同樣的含義與用法。#2教學(xué)評價(jià)聚類下提取出的形成性評價(jià)、發(fā)展性評價(jià)以及#5檔案袋評價(jià)聚類下提取出的檔案袋評價(jià)、過程性評價(jià)、真實(shí)性評價(jià)等特征詞便體現(xiàn)出這一現(xiàn)象。通過進(jìn)一步閱讀這兩個(gè)聚類下的子文獻(xiàn)發(fā)現(xiàn),許多研究者在研究和運(yùn)用表現(xiàn)性評價(jià)問題時(shí)存在概念混淆的問題。人們對這些評價(jià)概念的混用,模糊了它們的本質(zhì)與內(nèi)涵,也無法準(zhǔn)確把握它們在實(shí)踐過程中的適用范圍。為此,有學(xué)者從幼兒教育的角度出發(fā),對表現(xiàn)性評價(jià)與其他相關(guān)評價(jià)概念進(jìn)行了辨析,指出表現(xiàn)性評價(jià)與發(fā)展性評價(jià)在終極目的、功能取向以及對學(xué)生學(xué)習(xí)過程與結(jié)果的重視度上基本一致,但發(fā)展性評價(jià)注重多種評價(jià)方法的綜合運(yùn)用,表現(xiàn)性評價(jià)則更重視學(xué)生真實(shí)的行為表現(xiàn)。[10] 有學(xué)者辨析“表現(xiàn)”的含義,梳理了表現(xiàn)性評價(jià)與真實(shí)性評價(jià)之間的關(guān)系。[11]有學(xué)者對表現(xiàn)性評價(jià)與發(fā)展性評價(jià)、真實(shí)性評價(jià)、形成性評價(jià)、檔案袋評價(jià)等相關(guān)概念的聯(lián)系與區(qū)別進(jìn)行了深入研究,揭示了表現(xiàn)性評價(jià)的具體可操作性、真實(shí)情境的可創(chuàng)設(shè)性、學(xué)習(xí)過程的價(jià)值性以及學(xué)生成長的記錄性等特征。[2]
評價(jià)目標(biāo)、表現(xiàn)性任務(wù)和評分規(guī)則是表現(xiàn)性評價(jià)的三個(gè)核心要素,其中表現(xiàn)性任務(wù)和評分規(guī)則的開發(fā)是表現(xiàn)性評價(jià)設(shè)計(jì)研究的主要內(nèi)容。首先,#6逆向設(shè)計(jì)聚類下提取出的逆向設(shè)計(jì)、評價(jià)目標(biāo)等特征詞是表現(xiàn)性評價(jià)整體設(shè)計(jì)研究的重要內(nèi)容。表現(xiàn)性評價(jià)遵循“目標(biāo)—評價(jià)—教學(xué)”的逆向設(shè)計(jì)思路,其最大特征就是在學(xué)生學(xué)習(xí)之前確定學(xué)習(xí)的內(nèi)容和評價(jià)的方法。這樣的過程能夠讓學(xué)生明白努力的方向、當(dāng)前所處的位置以及為達(dá)成目標(biāo)需要付出的努力等。其次,#13表現(xiàn)性任務(wù)聚類下提取出的表現(xiàn)性任務(wù)、小學(xué)數(shù)學(xué)、數(shù)學(xué)教學(xué)等特征詞是研究表現(xiàn)性任務(wù)設(shè)計(jì)研究的重要內(nèi)容。表現(xiàn)性任務(wù)的設(shè)計(jì)是實(shí)施表現(xiàn)性評價(jià)的關(guān)鍵,必須遵循價(jià)值取向、表述簡明和難度適當(dāng)?shù)脑瓌t。學(xué)科教學(xué)表現(xiàn)性任務(wù)的設(shè)計(jì)更要聚焦生活現(xiàn)實(shí)、注重思維交互性以及學(xué)生的個(gè)性發(fā)展。最后,#4評價(jià)標(biāo)準(zhǔn)聚類下的評價(jià)標(biāo)準(zhǔn)、評價(jià)量表等特征詞是表現(xiàn)性評價(jià)評分規(guī)則設(shè)計(jì)研究的重要內(nèi)容。提供給學(xué)生的表現(xiàn)性評價(jià)需要一個(gè)評價(jià)的標(biāo)準(zhǔn),且應(yīng)在評價(jià)開始之前制定出來。[12]這個(gè)用以判斷結(jié)果和表現(xiàn)的評價(jià)標(biāo)準(zhǔn)就是表現(xiàn)性評價(jià)中的評分規(guī)則,它清晰地界定了達(dá)到某個(gè)特定標(biāo)準(zhǔn)的學(xué)生處于何種水平。一份優(yōu)秀的評分規(guī)則應(yīng)該具備詳略得當(dāng)?shù)脑u價(jià)內(nèi)容、清晰明確的評價(jià)指標(biāo)、具體可操作的實(shí)用性以及較高的可信度。[13]雖然與表現(xiàn)性評價(jià)設(shè)計(jì)研究相關(guān)的文獻(xiàn)幾乎都強(qiáng)調(diào)了評價(jià)標(biāo)準(zhǔn)的完善和公正,但如何制定完善公正的評價(jià)標(biāo)準(zhǔn)、完善公正的評判依據(jù)從何而來、對評估者又有何特殊要求等重要內(nèi)容涉及不多,研究不深入。
表現(xiàn)性評價(jià)關(guān)注學(xué)生學(xué)習(xí)過程,其應(yīng)用研究主要涉及兩個(gè)方面:一是應(yīng)用于學(xué)科教學(xué)評價(jià)。#10寫作教學(xué)聚類下提取出的寫作教學(xué)、作文評價(jià)、寫作能力等指標(biāo)詞是表現(xiàn)性評價(jià)應(yīng)用于寫作教學(xué)的重要體現(xiàn)。英語寫作對中國學(xué)習(xí)者來說是一件較為困難的事,教師對英語寫作的批改也缺乏具體指導(dǎo)。研究證明學(xué)生參與課堂活動(dòng)的表現(xiàn)性評價(jià),如小組討論和同級評改能幫助學(xué)生解決寫作過程中遇到的困難和問題,并有效地消除教師疑惑。[14]#11課堂教學(xué)聚類下提取出小學(xué)語文、初中數(shù)學(xué)等指標(biāo)詞是應(yīng)用表現(xiàn)性評價(jià)培養(yǎng)學(xué)生口語交際能力,提升學(xué)生的學(xué)科素養(yǎng),改善教學(xué)中出現(xiàn)的問題,實(shí)現(xiàn)以評促教的例證。二是應(yīng)用于實(shí)驗(yàn)教學(xué)評價(jià)。實(shí)驗(yàn)教學(xué)強(qiáng)調(diào)學(xué)習(xí)方法、關(guān)注操作過程。#12實(shí)驗(yàn)教學(xué)聚類下提取出的實(shí)驗(yàn)教學(xué)、應(yīng)用策略、實(shí)驗(yàn)考核等特征詞是表現(xiàn)性評價(jià)應(yīng)用于實(shí)驗(yàn)教學(xué)的重要體現(xiàn)。實(shí)驗(yàn)作為表現(xiàn)性任務(wù)的一種重要形式,是讓學(xué)生獨(dú)立制定、實(shí)施計(jì)劃,并解釋實(shí)驗(yàn)調(diào)查結(jié)果的過程。在物理[15]、生物、化學(xué)、地理等涉及實(shí)驗(yàn)教學(xué)的學(xué)科中應(yīng)用表現(xiàn)性評價(jià)能夠較為全面、真實(shí)地考察學(xué)生的手腦協(xié)作能力,較為準(zhǔn)確地評判學(xué)生學(xué)習(xí)過程和學(xué)習(xí)結(jié)果。[16]
教育教學(xué)評價(jià)領(lǐng)域諸多問題的解決,需要加強(qiáng)理論研究者和一線教師的通力合作,這種團(tuán)隊(duì)不僅能改進(jìn)和解決教育教學(xué)評價(jià)中的實(shí)踐問題,而且能在改進(jìn)和問題解決的基礎(chǔ)上形成理論建構(gòu)。[17]合作是研究領(lǐng)域創(chuàng)新與發(fā)展的巨大動(dòng)力。本研究利用CiteSpace5.8.R1軟件對表現(xiàn)性評價(jià)領(lǐng)域的作者發(fā)文量和研究機(jī)構(gòu)進(jìn)行共現(xiàn)分析發(fā)現(xiàn),關(guān)于表現(xiàn)性評價(jià)的研究隊(duì)伍存在以下幾方面問題:一是該領(lǐng)域?qū)I(yè)研究團(tuán)隊(duì)較少,學(xué)者之間學(xué)術(shù)交流不足。雖然近年來關(guān)于變現(xiàn)性評價(jià)的研究成果逐年增加,但持續(xù)研究該問題的學(xué)者較少,關(guān)于該問題的討論、爭鳴也明顯不足,致使表現(xiàn)性評價(jià)的概念長期處在混用狀態(tài)。二是理論研究者與一線教師合作研究的成果比較匱乏。二次文獻(xiàn)閱讀發(fā)現(xiàn),大多數(shù)研究成果都是理論研究者自己設(shè)計(jì)并自己深入教學(xué)場域觀察后形成的研究成果,一線教師介入研究的數(shù)量相對較少。許多理論研究者研究的問題不是來源教育教學(xué)實(shí)踐的“真問題”,而是自己“想象的問題”。三是理論研究者關(guān)注的問題與一線教師的實(shí)踐困惑不匹配。現(xiàn)狀調(diào)查發(fā)現(xiàn),理論研究者關(guān)注的表現(xiàn)性評價(jià)的問題和一線教師在教育教學(xué)評價(jià)實(shí)踐中遭遇的表現(xiàn)性評價(jià)的問題不匹配。也就是說,一線教師關(guān)于表現(xiàn)性評價(jià)運(yùn)用中存在的困惑得不到理論研究者的科學(xué)指導(dǎo)。如表現(xiàn)性評價(jià)、形成性評價(jià)、發(fā)展性評價(jià)之間的區(qū)別與聯(lián)系是什么,每種評價(jià)方式在教育教學(xué)實(shí)踐中如何操作等問題至今仍然困擾著一線教師。鑒于此,關(guān)于表現(xiàn)性評價(jià)的研究,需要加強(qiáng)團(tuán)隊(duì)合作研究。一是要加強(qiáng)高等學(xué)校專業(yè)研究隊(duì)伍和地方教研隊(duì)伍的合作。高校專業(yè)研究者和地方教研員合作能夠更好地從理論上理清表現(xiàn)性評價(jià)的概念、主體、內(nèi)容、方式、原則、運(yùn)用范圍及限度等問題。二是要加強(qiáng)理論研究者和一線教師的合作研究。高校專業(yè)研究者和地方教研員在深入教育教學(xué)一線了解教師關(guān)于表現(xiàn)性評價(jià)運(yùn)用存在的困惑和問題的基礎(chǔ)上,和一線教師一道探索改進(jìn)和科學(xué)運(yùn)用表現(xiàn)性評價(jià)的方法。只有組建理論與實(shí)踐相融合的復(fù)合型研究團(tuán)隊(duì)才能在改進(jìn)和解決表現(xiàn)性評價(jià)的實(shí)踐問題的基礎(chǔ)上建構(gòu)適合本土學(xué)生發(fā)展實(shí)際的表現(xiàn)性評價(jià)理論。
表現(xiàn)性評價(jià)主要是通過觀察學(xué)生在真實(shí)情景或模擬真實(shí)情景中完成實(shí)際任務(wù)過程中所表現(xiàn)的態(tài)度、情緒、情感、意志、知識、能力等來評價(jià)學(xué)生的發(fā)展?fàn)顩r。實(shí)質(zhì)上是通過觀察“所做的”來評價(jià)和判斷“能做的”。[18](P.38)從已有的研究成果來看,學(xué)者們就表現(xiàn)性評價(jià)某一方面的研究較多,從整體建構(gòu)表現(xiàn)性評價(jià)體系的研究成果相對較少。缺乏系統(tǒng)的研究,表現(xiàn)性評價(jià)進(jìn)入學(xué)校教學(xué)實(shí)踐時(shí)就會(huì)出現(xiàn)許多問題:其一,表現(xiàn)性任務(wù)與評價(jià)方式不匹配。調(diào)查發(fā)現(xiàn),一些教師設(shè)計(jì)的學(xué)習(xí)任務(wù)屬于表現(xiàn)性任務(wù),但評價(jià)主要依賴于紙筆測驗(yàn)。雖然紙筆測驗(yàn)也能考量部分表現(xiàn)性學(xué)習(xí)成果,然而,如果過分依賴紙筆測驗(yàn),就會(huì)出現(xiàn)“新瓶裝舊酒”現(xiàn)象,表現(xiàn)性評價(jià)也就失去了其存在的價(jià)值;其二,表現(xiàn)性評價(jià)評分規(guī)則不清晰,致使老師無法正確運(yùn)用表現(xiàn)性評價(jià)。文獻(xiàn)研究發(fā)現(xiàn),大多數(shù)理論研究者主要從理論層面論述了表現(xiàn)性評價(jià)的價(jià)值、內(nèi)涵、原理、設(shè)計(jì)思路及注意事項(xiàng)等問題,對表現(xiàn)性評價(jià)的評分規(guī)則關(guān)注不夠,研究不深入,致使一線教師在具體的教育教學(xué)中無法正確運(yùn)用表現(xiàn)性評價(jià)。因此,在表現(xiàn)性評價(jià)的研究內(nèi)容方面,應(yīng)該加強(qiáng)表現(xiàn)性評價(jià)標(biāo)準(zhǔn)研究。一是要依據(jù)學(xué)習(xí)任務(wù)構(gòu)建表現(xiàn)性評價(jià)標(biāo)準(zhǔn)。標(biāo)準(zhǔn)對行為具有很強(qiáng)的引導(dǎo)作用。標(biāo)準(zhǔn)的設(shè)定本質(zhì)上是一種分析行為,需要不斷反思和回答“什么是好的表現(xiàn)”。只有理論研究者與一線教師深入合作,不斷基于教育教學(xué)實(shí)踐追問該問題并將其分解成可以觀測的學(xué)習(xí)行為,才能制定符合學(xué)生發(fā)展規(guī)律和表現(xiàn)性評價(jià)要求的評價(jià)標(biāo)準(zhǔn)。二是要引導(dǎo)教師科學(xué)運(yùn)用評價(jià)標(biāo)準(zhǔn)。調(diào)查發(fā)現(xiàn),許多教師雖然很認(rèn)同表現(xiàn)性評價(jià)之于學(xué)生發(fā)展的重要價(jià)值,但對于如何在教育教學(xué)實(shí)踐中正確運(yùn)用表現(xiàn)性評價(jià),顯得非常困惑。因此,亟待合作研究團(tuán)隊(duì)深入教育教學(xué)一線根據(jù)學(xué)生學(xué)習(xí)過程中的具體表現(xiàn),引導(dǎo)教師科學(xué)運(yùn)用表現(xiàn)性評價(jià)標(biāo)準(zhǔn)。
從表現(xiàn)性評價(jià)研究的演進(jìn)歷程來看,當(dāng)前我國表現(xiàn)性評價(jià)研究正在逐漸從概念界定、內(nèi)涵研討、實(shí)踐啟示、優(yōu)缺點(diǎn)辨析等理論研究向任務(wù)設(shè)計(jì)、模型構(gòu)建、課堂應(yīng)用等實(shí)證研究轉(zhuǎn)化,注重標(biāo)準(zhǔn)化測量和數(shù)據(jù)的收集,強(qiáng)調(diào)研究的客觀性和普適性,取得了許多有價(jià)值的研究成果。然而,從研究方法角度來看,我國表現(xiàn)性評價(jià)的研究存在“測量”過度,“判斷”不足的問題。許多研究非常重視用標(biāo)準(zhǔn)化工具測量和收集學(xué)生的表現(xiàn)性數(shù)據(jù),并借助信息技術(shù)使學(xué)生表現(xiàn)性數(shù)據(jù)的測量和收集顯得更加“準(zhǔn)確”。然而,測量只能測量到“能夠測量”的表現(xiàn)。一篇高質(zhì)量的論文、一個(gè)有價(jià)值的歷史研究項(xiàng)目、一項(xiàng)拓展性科學(xué)研究課題等,不可能通過標(biāo)準(zhǔn)化測量準(zhǔn)確判斷學(xué)生在這些學(xué)習(xí)任務(wù)中的表現(xiàn)。事實(shí)上,學(xué)生的許多表現(xiàn)無法用標(biāo)準(zhǔn)化的工具準(zhǔn)確測量。一定程度上可以說,標(biāo)準(zhǔn)化測量得到的學(xué)生表現(xiàn)的數(shù)據(jù)恰恰掩蓋了學(xué)生表現(xiàn)中最主要的行為。表現(xiàn)性評價(jià)的特征決定了其實(shí)施過程更多地需要人工參與,當(dāng)然也會(huì)更加耗費(fèi)時(shí)間。猶如駕駛證考試中的“路考”,需要一個(gè)訓(xùn)練有素的考官坐在副駕駛位置上,通過很長時(shí)間的不斷觀察,反復(fù)考核才能判斷其合格與否。由于表現(xiàn)性評價(jià)是一種更偏向質(zhì)性的評價(jià)方法,因此,關(guān)于表現(xiàn)性評價(jià)的研究應(yīng)該重視質(zhì)性方法的運(yùn)用。具體來說,可以從以下兩方面入手:一是要通過討論讓研究者認(rèn)識到質(zhì)性研究之于表現(xiàn)性評價(jià)研究的重要性,并引導(dǎo)研究者正確運(yùn)用質(zhì)性方法研究表現(xiàn)性評價(jià);二是要充分利用人工智能、大數(shù)據(jù)等可視化和自畫像技術(shù)收集表現(xiàn)性評價(jià)的過程性材料;三是重視表現(xiàn)性評價(jià)研究中研究者的現(xiàn)場參與??傊?,只有重視質(zhì)性研究方法的運(yùn)用,才能對表現(xiàn)性評價(jià)的問題做出更加準(zhǔn)確、全面的判斷。