趙鑫 李奇
摘 要:教育評價改革對深化我國教育體制改革至關(guān)重要。受傳統(tǒng)、文化、制度等因素的影響,教育評價在當(dāng)代教育實踐中“指揮棒”效應(yīng)加劇,引發(fā)了功利化嚴(yán)重、專業(yè)性較差、公信力缺乏等問題?;貞?yīng)與解決這些問題,須對理念、制度、技術(shù)等維度進行更新與變革,促使教育評價邁向人文化、專業(yè)化、智慧化,真正發(fā)揮“以評促建”的正向作用,回歸育人本分。
關(guān)鍵詞:教育評價改革;破“五唯”;現(xiàn)代化;專業(yè)化;信任危機
教育評價是教育活動中關(guān)鍵且復(fù)雜的環(huán)節(jié),是推進教育治理現(xiàn)代化的重要內(nèi)容之一,旨在通過科學(xué)系統(tǒng)地搜集、整理、分析各級各類教育活動的信息,監(jiān)測與判斷其過程、效果與價值,促進教育改革,提高教育質(zhì)量。評價兼有作為工具的科學(xué)性與作為公共政策的公共性,受到了效率與公平的雙重制約[1],在當(dāng)前“高競爭”的社會文化氛圍中,實踐中的教育評價存在涉及面廣、情境復(fù)雜、多因素性、結(jié)論主觀、結(jié)果高利害等特征,“功利化”傾向愈發(fā)凸顯,呈現(xiàn)出公信力缺乏、種類繁雜、價值缺失等現(xiàn)象[2]。
黨和政府高度重視教育評價在教育改革中的重要作用。2018年全國教育大會習(xí)近平總書記強調(diào),要“扭轉(zhuǎn)不科學(xué)的教育評價導(dǎo)向,堅決克服唯分?jǐn)?shù)、唯升學(xué)、唯文憑、唯論文、唯帽子的頑瘴痼疾,從根本上解決教育評價指揮棒問題”[3]。自此,破“五唯”引起各界熱議,成為我國教育評價改革的風(fēng)向標(biāo)。2020年6月30日,中央全面深化改革委員會第十四次會議審議通過了《深化新時代教育評價改革總體方案》,首次系統(tǒng)提出“改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價”。該方案既是對全國教育大會提出任務(wù)的落實,也是未來指導(dǎo)教育評價改革的綱領(lǐng)性文件,進一步突出教育評價要摒棄“功利化”的價值導(dǎo)向。本文旨在回顧與剖析我國教育評價改革的歷程,總結(jié)其實踐邏輯,為推動新時代背景下我國教育評價改革提供參考。
我國教育評價改革的歷史脈絡(luò)與發(fā)展趨勢
我國的教育評價最早可追溯至戰(zhàn)國時期《禮記·學(xué)記》對學(xué)生管理與考核的規(guī)定,系統(tǒng)性的教育評價活動發(fā)端于科舉制度,真正意義上的現(xiàn)代教育評價理論始于20世紀(jì)70年代末引進西方經(jīng)驗,并隨時代發(fā)展日漸完善。受國際教育評價新理念的影響,當(dāng)前我國教育評價的改革呈現(xiàn)了新的發(fā)展趨勢。
1.教育評價發(fā)展歷史脈絡(luò)
作為一門分支學(xué)科,教育評價隨行政管理的需要日益本土化、常規(guī)化、專業(yè)化,發(fā)展歷經(jīng)四個階段:一是理論翻譯與引進階段(1977年-1985年)。源于應(yīng)對1977年高校招生制度改革對教育評價理論、方法、專業(yè)人員的需要[4],開始大量引進國外及我國臺灣的研究成果。此時正趕上心理測驗研究的再度興起,因而,這一時期我國教育評價以修訂國外心理測驗量表為主,部分學(xué)校基于實踐開始嘗試探索本土化的評價制度、理論與方法[5]。二是持續(xù)發(fā)展與學(xué)科體系構(gòu)建階段(1985年-2002年)。1985年5月頒布的《中共中央關(guān)于教育體制改革的決定》,標(biāo)志著我國教育評價研究與實踐進入全面開展階段,國家愈發(fā)重視建立系統(tǒng)完備的教育質(zhì)量監(jiān)控系統(tǒng)[6],眾多政策文件的出臺使教育評價工作受到監(jiān)管的同時,得到了制度化保障,開始結(jié)合中國國情,改良國外經(jīng)驗,建設(shè)具有中國特色的教育評價模式,如發(fā)展性教育評價模式[7]、素質(zhì)教育三分合評價模式[8]等,并嘗試構(gòu)建學(xué)科體系。三是學(xué)科完善階段(2003年-2017年)。教育部于2002年底發(fā)出《關(guān)于積極推進中小學(xué)評價與考試制度改革的通知》,要求建立以促進學(xué)生、教師和學(xué)校發(fā)展為目標(biāo)的評價體系。2003年,教育部正式確立了周期性的教學(xué)工作水平評估制度,使教育評價成為全國范圍的常規(guī)工作。自此,我國教育評價研究呈現(xiàn)兩大趨勢:以中國特色教育評價理論為核心構(gòu)建學(xué)科體系并不斷擴大;學(xué)科分化派生,呈現(xiàn)生長勢頭[4]。四是全面推進階段(2018年至今)。2018年召開的全國教育大會成為新時代我國教育評價系統(tǒng)改革的風(fēng)向標(biāo),也是下一階段教育領(lǐng)域的工作要點。在此倡導(dǎo)下,我國教育評價進入全面推進與系統(tǒng)研究階段,以破“五唯”為主要抓手,從根本上扭轉(zhuǎn)功利化傾向[9],通過深入開展教育評價改革調(diào)查研究,針對不同領(lǐng)域、不同學(xué)段、不同對象,分層分類推出評價改革的相關(guān)舉措,以形成包含學(xué)生評價體系、教師評價制度、學(xué)科評價體系、“雙一流”建設(shè)成效評價體系等在內(nèi)的、較為完整的教育評價改革的邏輯與制度框架。
2.教育評價發(fā)展趨勢
當(dāng)前,教育評價領(lǐng)域正發(fā)生深刻的變化。從對教育的評價(Assessment of Education)到促進教育的評價(Assessment for Education),主要表現(xiàn)在評價理念從反映論到建構(gòu)論;價值取向從教育本體、社會需要轉(zhuǎn)向人的需要;評價主體從政府主導(dǎo)到引入第三方機構(gòu);評價內(nèi)容從基本的讀寫算技能到轉(zhuǎn)向綜合能力;評價功能從選拔鑒定到診斷激勵;評價方式從單一題目測驗到多種方法融合到借助大數(shù)據(jù)提供證據(jù)的項目設(shè)計,如“以證據(jù)為中心”的評價模式(Evidence Centered Design, ECD)[10];這一系列的轉(zhuǎn)變驅(qū)使教育評價的內(nèi)涵與外延日漸豐富,《教育和心理測量標(biāo)準(zhǔn)(2014版)(Standards for Educational and Psychological Testing 2014)》[11]的頒布昭示了教育評價從經(jīng)驗總結(jié)到日漸專業(yè),并伴隨行業(yè)發(fā)展孕育評價文化。
受此影響,我國教育評價呈現(xiàn)出四種變革傾向:一是評價主體日趨多元,由政府完全行政化主導(dǎo)向引入市場服務(wù)過渡,政府從絕對的行政主導(dǎo)漸變?yōu)榻逃綄?dǎo)的角色[12];二是評價對象的類型、范圍擴大,由單純指向?qū)W生的教學(xué)評價向?qū)處?、教育管理人員、學(xué)科、學(xué)校等專業(yè)發(fā)展與質(zhì)量評估擴展;三是評價方式由以測驗、測量為主的定量評價轉(zhuǎn)向融入檔案袋評價、同行評議等定性評價,結(jié)合教育心理、教育測量等理論,充分運用現(xiàn)代教育技術(shù)手段[13];四是評價功能由重在鑒定與選拔向重視激勵與發(fā)展轉(zhuǎn)變,強調(diào)通過形成性評價引導(dǎo)學(xué)生主動調(diào)節(jié)學(xué)習(xí)行為[14],重視將結(jié)果作為質(zhì)量保障與提升的依據(jù)[15]。要回應(yīng)上述變革的要求,大數(shù)據(jù)時代下信息技術(shù)的發(fā)展與教育領(lǐng)域的密切融合為此提供了重要的機遇,也帶來了相應(yīng)的挑戰(zhàn)。
我國教育評價改革中的現(xiàn)實問題和癥結(jié)剖析
我國現(xiàn)行教育評價體系脫胎于西方,成形于本土社會文化環(huán)境,已從單純的教學(xué)環(huán)節(jié)制度化、體系化,成為教育實踐的關(guān)鍵環(huán)節(jié)與重要參考,但囿于教育評價文化中存在的瑕疵,其負面導(dǎo)向不容小覷,各界對評價本身的科學(xué)性與專業(yè)性也時有質(zhì)疑。
1.教育評價的功利化問題
教育評價功利化有歷史淵源。最早的教育評價重在測量學(xué)生對事實的記憶力,隨后泰勒模式將重點集中于測量學(xué)生學(xué)習(xí)結(jié)果的目標(biāo)達成度上,重在發(fā)揮評價的總結(jié)性鑒定與選拔功能。在我國,“學(xué)而優(yōu)則仕”的傳統(tǒng)成為教育評價選拔功能的文化淵源,在高速發(fā)展與高度競爭的社會氛圍中被不斷催化,為層出不窮的“分?jǐn)?shù)至上”“名校情結(jié)”“文憑至上”“唯核心”“頭銜至上”等現(xiàn)象提供了“正當(dāng)性”的依據(jù),揭示了我國的教育實踐仍將評價作為甄別和篩選的主要功能的特點。
教育評價功利化也有現(xiàn)實因素。政府尤其是地方政府長期以來在行使教育行政職能的過程中,制造出各類不同等級的獎項、榮譽等,幾乎囊括學(xué)校工作的方方面面,引導(dǎo)學(xué)校、教師和學(xué)生參與競爭[16]。這些過度的評選活動打亂了學(xué)校的工作節(jié)奏、干擾各級各類教育工作者的心態(tài),助長了功利化的不正之風(fēng),客觀上造成了當(dāng)前教育評價的“五唯”現(xiàn)象??梢?,當(dāng)前凡是被納入教育教學(xué)范圍內(nèi)的所有活動、機構(gòu)、人員都被要求和經(jīng)受著名目繁多的評價,評價的頻率、類型、內(nèi)容與方式層出不窮,看似科學(xué)、多元評價的背后,對結(jié)果的解讀與應(yīng)用卻多簡化為數(shù)量化評價,這種形式化評價盛行的背后是功利化的價值追求、缺乏人文向度的評價文化、以篩選為核心的功能選擇。
2.教育評價體系的專業(yè)性問題
教育評價依托多學(xué)科理論發(fā)展,包括教育學(xué)、管理學(xué)、數(shù)學(xué)、統(tǒng)計學(xué)、哲學(xué)等[4]。西方教育評價具有深厚的理論根基,并從鮮活的教育實踐中源源不斷地汲取養(yǎng)分,理論與實踐間形成良性循環(huán)。相較而言,我國在“奮起直追式”的教育改革中急于追求肉眼可見的效率與成果,忽視對教育評價文化性、專業(yè)性、系統(tǒng)性的積累與鋪陳,至今尚未形成堅實的構(gòu)架,尚未與教育實踐形成良好互動。行政管理邏輯主導(dǎo)下的教育評價,長期依賴行政部門人員的主觀經(jīng)驗,忽視理論研究與專業(yè)人員的培養(yǎng)[17]。單是關(guān)于教育評價的概念,便存在“Assessment”和“Evaluation”等概念的混用,對日趨豐富的評價內(nèi)容及所屬領(lǐng)域缺乏系統(tǒng)的理論研究,難以對實踐指導(dǎo)發(fā)揮實際效用。同時,評價的工具與方法較為滯后:一是考試命題技術(shù)與西方社會存在落差,包括難度控制、題型使用及評分標(biāo)準(zhǔn)制定等[18];二是分?jǐn)?shù)報告與結(jié)果解讀較為原始,限于簡單的描述統(tǒng)計量(如原始分、平均分等)[19],而以標(biāo)準(zhǔn)分為基礎(chǔ)的分?jǐn)?shù)報告早已是國際大型測驗分?jǐn)?shù)合成的常用方法[20];三是支撐形成性評價發(fā)展的技術(shù)條件尚未實現(xiàn)??梢?,評價理論、專業(yè)人員、測量技術(shù)的缺乏,使我國教育評價依賴直觀單一傳統(tǒng)的量化評價標(biāo)準(zhǔn),加之文化、理論、技術(shù)的積淀不足,尚未建立起專業(yè)性的教育評價體系。
3.教育評價制度的公信力問題
我國正處于現(xiàn)代化轉(zhuǎn)型期,傳統(tǒng)的慣習(xí)、規(guī)約與道德規(guī)范無法應(yīng)對復(fù)雜多樣、自由與風(fēng)險并存的社會環(huán)境,制度在人際關(guān)系中的規(guī)范與調(diào)節(jié)作用日益突出。任何一項制度的順利實施都離不開規(guī)范對象發(fā)自內(nèi)心的認(rèn)可、信任與接納,教育領(lǐng)域亦是如此。遺憾的是,當(dāng)前我國教育評價飽受社會各界的質(zhì)疑,同行不認(rèn)可、社會不信任的現(xiàn)象此起彼伏。長期以來,我國教育評價制度處于管理邏輯導(dǎo)向的慣習(xí)中,早已形成固定模式:由教育行政部門或教育管理者自上而下組織,基于權(quán)力、控制、管理、甄別等邏輯的評價工作,渲染了追求效率至上的行政化教育評價文化,使教育評價主體單一化,評價方法易操作化、定量化的行政化性質(zhì),極大限制了教育評價的信度與效度。近年來,我國教育評價實踐開始改變政府完全行政化主導(dǎo)的模式,引入家長、社會、企業(yè)、行業(yè)的多方參與,獨立于教育行政系統(tǒng)之外的,以獨立性、專業(yè)性、公正性見長的社會第三方教育評價機構(gòu)在高等教育與職業(yè)教育領(lǐng)域出現(xiàn)與發(fā)展[21],并通過教育行政部門、行業(yè)協(xié)會兩種方式實施監(jiān)管[22],這在一定程度上彌補了政府作為單一主體參與教育評價的不足。然而,由于缺乏統(tǒng)籌管理、相應(yīng)政策法規(guī)及市場發(fā)育的土壤,加之尚未完全脫離行政化評價慣習(xí)與教育行政管理部門的權(quán)威[23],我國真正開展第三方教育評價業(yè)務(wù)的機構(gòu),數(shù)量、質(zhì)量的發(fā)展都極不平衡,行業(yè)規(guī)范、專業(yè)性、公信力難以得到市場的認(rèn)可。
我國教育評價改革的方向和路徑
“評價本身并無好壞,只是我們沒有把評價用好”[24],對教育評價的不當(dāng)使用才是其負面導(dǎo)向作用占據(jù)主導(dǎo),造成各類教育問題的原因。為此,基于對我國教育評價改革現(xiàn)狀及問題的梳理,結(jié)合國際教育評價理論與實踐,我國教育評價改革可從以下四個方面進行改進。
1.觀念轉(zhuǎn)變:回歸以人為本的邏輯起點
評價制度對于教育發(fā)展具有診斷、選拔、發(fā)展等多重功能,發(fā)展性功能是教育評價的綜合性功能,重視評價的發(fā)展性能有效避免各種單項評價的局限性,使教育評價回歸教育本原。這也提醒我們,教育評價本身不是目標(biāo),只是教育管理的方式之一,終點指向人的發(fā)展。值得欣喜的是,當(dāng)前無論是國際經(jīng)驗還是國內(nèi)政策,已經(jīng)開始意識到探索與發(fā)揮評價增值性功能的重要性與必要性,開始改變將人作為工具,而是作為主體與目的,以促進人的全面發(fā)展[25]。在學(xué)生評價上開始探索超越考試和課程的評價方式(如創(chuàng)造力、團隊合作、移情等人際技能);在教師評價和學(xué)校認(rèn)證上,開始探索如何將學(xué)生、教師和測試方式等因素綜合納入評價體系。由此可見,重視增值性評價,秉持“以評促學(xué)”的理念已成為國際教育評價的趨勢。在此背景下,如何挖掘并結(jié)合我國教育傳統(tǒng)與現(xiàn)實,有效借鑒國際經(jīng)驗進行本土化改造,推行全程性、全面性的發(fā)展性評價,建立面向?qū)W生未來發(fā)展,尤其是對高階思維能力、跨學(xué)科能力和技術(shù)能力的評價體系,切實發(fā)揮教育評價的育人功能,構(gòu)建有人文向度的教育評價體系與文化,是當(dāng)前我國教育評價改革中的重要命題。
2.系統(tǒng)更新:構(gòu)建多元化的教育評價體系
面對深化教育體制改革的需求,多元化、全景式、過程式的評價是今后教育評價的趨勢。這要求將教育評價作為一個系統(tǒng)來思考,著力構(gòu)建多元化、綜合性的教育評價體系:依托成熟理論,建立專業(yè)評價人員隊伍,制定科學(xué)的評價標(biāo)準(zhǔn),更新評價工具與方法,對不同評價對象采取不同的標(biāo)準(zhǔn)與策略。我國教育評價發(fā)展至今已在實踐中積累了豐富的經(jīng)驗,一方面,學(xué)界可充分梳理實踐中存在的問題,厘清與界定教育評價的內(nèi)涵外延,構(gòu)建概念清晰、核心突出、問題明晰的研究框架,密切關(guān)注理論與實踐的互動,促使該研究框架能在實踐反饋的基礎(chǔ)上不斷調(diào)整與修正,在學(xué)理上為教育評價實踐工作保駕護航。另一方面,基于未來學(xué)科發(fā)展角度,亟須構(gòu)建涵蓋各類教育領(lǐng)域與階段、面向不同對象的全方位的教育評價學(xué)科體系,為此須融入多學(xué)科視角,除傳統(tǒng)的統(tǒng)計學(xué)、教育學(xué)、數(shù)學(xué)等學(xué)科視角外,應(yīng)結(jié)合新時代發(fā)展將計算機科學(xué)、測量學(xué)、系統(tǒng)科學(xué)等學(xué)科,拓寬研究視角與方法體系[26]。
3.技術(shù)保障:以技術(shù)變革推動評價過程的專業(yè)化
多元化、全景式、過程式教育評價體系的實現(xiàn)離不開技術(shù)支持。國外已開始嘗試將其他學(xué)科的研究成果應(yīng)用于教與學(xué)評價中。例如:將統(tǒng)計學(xué)、技術(shù)和認(rèn)知研究的發(fā)展應(yīng)用于不同領(lǐng)域、目的和類型的教育測量中,如將項目反應(yīng)理論作為教育測驗與量表開發(fā)的工具,指導(dǎo)題庫建設(shè)、測驗編制、分析考試成績等[27];利用數(shù)據(jù)挖掘技術(shù)分析學(xué)生在線教育的學(xué)習(xí)日志、人口統(tǒng)計學(xué)數(shù)據(jù)和結(jié)課評價等信息,以提供決策支持[28]。隨著信息化與教育領(lǐng)域的緊密融合,我國教育評價的技術(shù)方法、專業(yè)人才正面臨著信息化與大數(shù)據(jù)的機遇與挑戰(zhàn)。因此,我國可在借鑒國際經(jīng)驗的基礎(chǔ)上,一方面,將統(tǒng)計學(xué)、腦科學(xué)等其他學(xué)科研究成果與教育實踐相結(jié)合,運用多元方法、改進測試方式與結(jié)果解讀提高教育評價的專業(yè)性、有效性與公平性。另一方面,融入智能化的數(shù)據(jù)挖掘技術(shù),建立全方位、多維度的數(shù)據(jù)庫,從海量的數(shù)據(jù)挖掘信息,監(jiān)測、診斷評價對象的群體特征與個體特征,并通過數(shù)據(jù)建模預(yù)測未來趨勢,真正建立起基于證據(jù)的教育評價,優(yōu)化學(xué)習(xí)行為、教學(xué)方式、教育管理與決策,實現(xiàn)從心理測量、數(shù)學(xué)矩陣、價值解讀到積極建構(gòu)的轉(zhuǎn)變[29],從而滿足精準(zhǔn)測評、深度反饋、個性化評價的需求,及時調(diào)整教育決策,推動教育評價的專業(yè)化發(fā)展。
4.文化建設(shè):營造具有信任感的制度保障
營造具有信任感的制度保障離不開思維轉(zhuǎn)變、體系構(gòu)建、專業(yè)技術(shù),更離不開政府的角色轉(zhuǎn)變、市場監(jiān)督與信息公開。以往的教育評價主要由政府教育職能部門擔(dān)當(dāng),本質(zhì)上屬于被評價者的上級部門,與被評價者之間是自上而下的利益相關(guān)關(guān)系,這種利益矛盾對等性,使評價者很難做出真正客觀科學(xué)的評價,第三方機構(gòu)是緩解相關(guān)各方利益沖突關(guān)系、規(guī)范市場評價秩序的調(diào)和劑。國際經(jīng)驗告訴我們:第三方教育評價機構(gòu)作為利益無涉者,往往可以發(fā)揮政府與學(xué)校之間“緩沖器”的作用。針對我國第三方教育評價機構(gòu)在實踐中的亂象,當(dāng)務(wù)之急是要引導(dǎo)教育觀念,鼓勵培育和創(chuàng)設(shè)適合第三方機構(gòu)的發(fā)展空間,增強第三方機構(gòu)在社會公眾中的認(rèn)可度。具體來說,一是要減少行政控制。實現(xiàn)政府職能轉(zhuǎn)變,適當(dāng)給學(xué)校更多的課程評價等自主權(quán),教育督導(dǎo)由督政向督學(xué)傾斜,教育問責(zé)以數(shù)據(jù)為判斷依據(jù)[30]。二是要加強制度規(guī)范。通過立法手段,約束和規(guī)范第三方教育評價的市場秩序,同時建設(shè)好評審專家數(shù)據(jù)庫,建立年檢制度,做到信息公開,并輔之評價責(zé)任與榮譽制度[21]。三是第三方機構(gòu)要從制度建設(shè)和隊伍建設(shè)等方面提升自身核心競爭力[31]。依據(jù)評價的范圍、對象,關(guān)注與尊重利益相關(guān)者的教育訴求,形成評價中利益雙方共同參與協(xié)商的氛圍,政府作為監(jiān)督者,保證第三方機構(gòu)的督導(dǎo)質(zhì)量與公信力。
參考文獻:
[1]謝維和.教育評價的雙重約束—兼以高考改革為案例[J].教育研究,2019,40(9):4-13.
[2]葉賦桂.教育評價的浮華與貧困[J].清華大學(xué)教育研究,2019,40(1):18-21.
[3]習(xí)近平.堅持中國特色社會主義教育發(fā)展道路 培養(yǎng)德智體美勞全面發(fā)展的社會主義建設(shè)者和接班人[N].人民日報.2018-09-11(1).
[4]邱均平,王碧云,湯建民.教育評價學(xué):理論·方法·實踐[M]. 北京:科學(xué)出版社,2016:10,11-12,21.
[5]陳玉琨, 李如海. 我國教育評價發(fā)展的世紀(jì)回顧與未來展望[J].華東師范大學(xué)學(xué)報(教育科學(xué)版), 2000(1):1-12.
[6]辛濤, 李雪燕. 教育評價理論與實踐的新進展[J]. 清華大學(xué)教育研究, 2005(6):38-43.
[7]劉川, 王仕堯, 張承德. 發(fā)展性評價的實踐與思考[J].教育研究, 1999(3):75-76.
[8]雷鳴強, 陳緒常. 構(gòu)建導(dǎo)向素質(zhì)教育的三分合評價模式[J].中國教育學(xué)刊, 1998(6):22-25.
[9]中華人民共和國教育部.教育評價制度改革持續(xù)深入推進[EB/OL].(2019-09-11)[2022-03-21].http://www.moe.gov.cn/jyb_xwfb/moe_2082/zl_2019n/2019_zl67/201909/t20190911_398722.html.
[10]ZIEKY M J. An introduction to the use of evidence-centered design in test development [J].Psicologia Educativa, 2014, 20(2): 79-87.
[11]AERA. New Edition of Standards for Educational and Psychological Testing To Be Released This Month[EB/OL]. [2022-03-21].https://www.aera.net/Newsroom/AERA-Highlights-E-newsletter/AERA-Highlights-July-2014/New-Edition-of-Standards-for-Educational-and-Psychological-Testing-To-Be-Released-this-Month.
[12]U.S. Department of Education. Guidance on Standards, Assessments, and Accountability[EB/OL].(2009-02-04)[2022-04-02].https://www2.ed.gov/policy/elsec/guid/standardsassessment/guidance_pg4.html.
[13]JING D. The Study on Educational Technology Abilities Evaluation Method [J]. Physics Procedia, 2012, 24(Part C), 2111-2116.
[14]PANADERO E, BROADBENT J, BOUD D,& LODGE J M. Using formative assessment to influence self-and co-regulated learning: the role of evaluative judgement [J]. European Journal of Psychology of Education, 2019(34):535-557.
[15]LIU S Y. Higher education quality assessment in China: An impact study[J]. Higher Education Policy, 2015(28):175-195.
[16]吳康寧. 政府部門超強控制:制約教育改革深入推進的一個要害性問題[J]. 南京師大學(xué)報(社會科學(xué)版), 2012(5):6-11.
[17]孫玉潔. 我國教育督導(dǎo)制度存在的問題與改進建議[J]. 教育研究, 2004(10):64-68.
[18]王鼎, 章衛(wèi)華. PISA測試命題與國內(nèi)初中學(xué)業(yè)考試命題的比較分析[J].全球教育展望, 2013, 42(9):60-70.
[19]談松華, 黃曉婷. 我國教育評價現(xiàn)狀與改進建議[J]. 中國教育學(xué)刊, 2012(1):8-11.
[20]姜秉圻, 韋小滿. 測評項目中標(biāo)準(zhǔn)分的使用及對我國高考改革的啟示[J].教育測量與評價, 2017(8):59-64.
[21]顧志躍, 李彥榮. 我國教育評價的現(xiàn)狀、問題與發(fā)展對策[J]. 人民教育, 2007(12):2-6.
[22]王璐,王世赟,尤錚.國際視野下第三方教育評價機構(gòu)的規(guī)范、認(rèn)證與行業(yè)自律行為研究[J].現(xiàn)代教育管理,2020(5):36-45.
[23]徐彬,蘇澤.論教育評價改革的動因、阻力與路向[J].當(dāng)代教育科學(xué),2020(2):80-85.
[24]李鵬.評價改革是解決教育問題的“鑰匙”嗎?—從教育評價的“指揮棒”效應(yīng)看如何反對“五唯”[J].教育科學(xué),2019,35(3):7-13.
[25]金柏燕,蔣一之.人學(xué)視野下教育評價改革的新取向[J].現(xiàn)代大學(xué)教育,2020(2):32-38.
[26]吳鋼.我國教育評價學(xué)研究的回顧與展望[J]. 教育測量與評價, 2010(3):19-22.
[27]SHARKNESS J,DEANGELO L.Measuring Student Involvement: A Comparison of Classical Test Theory and Item Response Theory in the Construction of Scales from Student Surveys[J]. Research in Higher Education, 2011(52): 480-507.
[28]HUNG J L,HSU Y C, RICE K. Integrating data mining in program evaluation of K-12 online education[J]. Educational Technology & Society, 2012, 15(3): 27-41.
[29]朱成晨, 閆廣芬. 現(xiàn)代化與專業(yè)化:大數(shù)據(jù)時代教育評價的新技術(shù)推進邏輯[J]. 清華大學(xué)教育研究, 2018, 39(5):75-80.
[30]辛濤. 我國教育問責(zé)制建立的幾個關(guān)鍵問題[J]. 北京大學(xué)教育評論, 2013, 11(1):164-171.
[31]王璐, 王小棟. 英國第三方教育評估的發(fā)展與規(guī)范:基于英國獨立學(xué)校督導(dǎo)團的研究[J]. 外國教育研究, 2018,45(2):16-28.
(作者單位:北京師范大學(xué)教育學(xué)部高等教育研究院)
[責(zé)任編輯:于 洋]