胡 娟,徐鑫悅
(中國人民大學(xué)教育學(xué)院,北京 100872)
教育評價作為教育改革發(fā)展的重要環(huán)節(jié),深刻影響著教育發(fā)展方向和辦學(xué)導(dǎo)向。2020年10月,中共中央、國務(wù)院印發(fā)《深化新時代教育評價改革總體方案》,明確指出要破除“五唯”、扭轉(zhuǎn)不科學(xué)的教育評價導(dǎo)向,并提出要“改進結(jié)果評價,強化過程評價,探索增值評價,健全綜合評價”[1],首次從國家指導(dǎo)層面提出了“增值評價”的概念,表明新時代教育評價工作迫切需要新的舉措與嘗試?!霸鲋翟u價”也因此成為當(dāng)前中國教育研究領(lǐng)域的熱點主題之一。
早在20世紀(jì)90年代末,“增值評價”的概念便已引入我國。1996年香港教育統(tǒng)籌委員會發(fā)布的《優(yōu)質(zhì)學(xué)校教育》報告中提出了對學(xué)校教育質(zhì)量的增值評價[2],引起了內(nèi)地學(xué)界的廣泛關(guān)注。國內(nèi)已有研究主要集中在對增值評價的概念、方法及應(yīng)用進行介紹;同時,借鑒國外增值評價工具展開的一些全國性、地區(qū)性調(diào)查也在推進,在高等教育領(lǐng)域的大型調(diào)查就有清華大學(xué)借鑒“全美大學(xué)生學(xué)習(xí)性投入調(diào)查”(National Survey of Student Engagement,NSSE)并結(jié)合中國實際于2009年發(fā)起的“中國大學(xué)生學(xué)習(xí)性投入調(diào)查”(NSSE-China)、北京大學(xué)在參考NSSE等調(diào)查的基礎(chǔ)上結(jié)合我國高等教育發(fā)展和學(xué)生群體特征實施的“首都高校學(xué)生發(fā)展調(diào)查”等。從已有研究來看,我國高等教育界對增值評價的研究尚處在初步引進階段,雖已有一些頗具規(guī)模的實踐,但仍缺乏對增值評價所面臨的爭論和深層次問題的追本溯源的梳理分析。厘清這些爭論和問題,對于理解并把握增值評價的實質(zhì)、在實踐中有效探索增值評價有著重要意義。
之所以選取高等教育領(lǐng)域的增值評價為研究對象,是因為高等教育評價更加復(fù)雜,標(biāo)準(zhǔn)更加多樣,更能體現(xiàn)增值評價的本質(zhì)與面臨的挑戰(zhàn),因此更具有代表性。那么,到底什么是高等教育增值評價?在高等教育領(lǐng)域圍繞其發(fā)展有哪些爭論和問題?我國在實際運用增值評價時應(yīng)當(dāng)注意什么?
“增值”原本是經(jīng)濟學(xué)中的概念,通常指用于生產(chǎn)產(chǎn)品的原材料成本或供給成本與產(chǎn)品價值之間的差額[3]。在高等教育語境中,“產(chǎn)品”即為學(xué)生,“價值”為學(xué)生所擁有的知識和技能,將學(xué)生進入大學(xué)前后所具備的知識和技能相比較,之間的差異便被認為是高等教育帶來的增值[4],目前這一理念已被廣泛應(yīng)用于英美等國家及地區(qū)的高等教育評價領(lǐng)域?!霸鲋怠崩砟钤诮逃u價中歷經(jīng)由萌芽到發(fā)展再到實踐的演化過程,高等教育增值評價也從理念的初步迸發(fā),到實踐探索,再到反思改造,逐漸成為一種被廣泛采用的評價方式。
關(guān)于增值評價理念的緣起,許多學(xué)者認為應(yīng)追溯到1966年的《科爾曼報告》。該報告認為教育機會均等不能僅局限于依靠平等的投入來衡量,而應(yīng)將關(guān)注的重心轉(zhuǎn)到獨立于家庭背景的學(xué)生學(xué)業(yè)成就[5],對教育投入與產(chǎn)出進行綜合分析的思維客觀上帶出了增值的理念,促生了增值評價方式,為高等教育增值評價的萌生奠定了思想基礎(chǔ)。
1970年,加州大學(xué)洛杉磯分校高等教育研究所創(chuàng)始主任阿斯?。ˋstin)在一項關(guān)于大學(xué)影響的研究中提出了“輸入-環(huán)境-輸出”模型(input-environmentoutput model,IEO)?!拜斎搿敝浮皩W(xué)生投入”,即新生入學(xué)時就已具備的才能、技能、志向以及其他成長和學(xué)習(xí)的潛力;“輸出”指“學(xué)生產(chǎn)出”,即學(xué)生的成就、知識、技能、價值觀、態(tài)度、志向、興趣和日?;顒?;“環(huán)境”為“大學(xué)環(huán)境”,指大學(xué)對學(xué)生產(chǎn)生影響的各方面,包括行政政策和實踐、課程、校舍和設(shè)施、教學(xué)實踐、同行協(xié)會以及大學(xué)環(huán)境的其他特征。該模型旨在衡量學(xué)生的輸入和輸出情況,以此來推斷大學(xué)是否以及如何給學(xué)生帶來影響[6]。阿斯汀綜合考察了學(xué)生的輸入輸出和大學(xué)之間的關(guān)系,雖然尚未明確提出“增值”的概念,但證實了大學(xué)環(huán)境對學(xué)生發(fā)展的影響,為早期高等教育增值評價提供了理論支持[7]。
在這一階段,研究者們跳出以往結(jié)果性評價追求單一標(biāo)準(zhǔn)的思維框架,開始關(guān)注教育投入與產(chǎn)出,試圖解釋學(xué)校教育是如何對學(xué)生發(fā)展產(chǎn)生影響的。特別是阿斯汀的IEO模型,為高等教育增值評價提供了理論基礎(chǔ),增值理念開始萌芽,增值評價開始進入人們的視野。
1975年,美國東北密蘇里州立大學(xué)校長邁克柯蘭(McClain)構(gòu)思并初步實施了針對該大學(xué)的增值評價計劃,通過跟蹤學(xué)生的大學(xué)經(jīng)歷來分析大學(xué)對學(xué)生成長的影響。該計劃有3個主要目標(biāo),即了解學(xué)生潛能、證明大學(xué)對學(xué)生生活產(chǎn)生了積極影響以及證明該校畢業(yè)生在全國范圍內(nèi)具有競爭力。評價方式是分別在學(xué)生入學(xué)時、大學(xué)就讀期間、畢業(yè)前和畢業(yè)后進行問卷調(diào)查。調(diào)查結(jié)果被用于改善課程教學(xué),幫助大學(xué)明確并振興使命[8]。盡管東北密蘇里州立大學(xué)的評價計劃沒有系統(tǒng)地介紹增值的概念,其評價模型被寬泛地稱為增值模型,但這卻是早期大學(xué)注重學(xué)生成長變化并采用增值評價的創(chuàng)新嘗試,其經(jīng)驗為其他大學(xué)提供了有益借鑒。
20世紀(jì)70年代初期,美國高等教育進入普及化階段,呈現(xiàn)出多元化的發(fā)展特征,然而教育質(zhì)量卻參差不齊。1983年,美國國家卓越教育委員會發(fā)布了《國家處于危機之中:教育改革勢在必行》報告,特別關(guān)注學(xué)校的教學(xué)質(zhì)量,提出要回歸學(xué)校教育的根本目的,助力學(xué)生在大學(xué)取得顯著進步,并指出卓越教育的目標(biāo)應(yīng)當(dāng)是“最充分地發(fā)展所有人的才能”[9]。該報告帶動了美國各州的教育改革,學(xué)校問責(zé)制被提出,增值評價作為回應(yīng)問責(zé)的重要手段得到施行[10]。這一時期,“增值評價的先行者”——田納西州的改革產(chǎn)生了重要影響。該州于1992年實行了田納西增值評價系統(tǒng)(Tennessee Value-Added Assessment System,TVAAS),并于同年通過了《教育改進法》,明確要求將TVAAS作為對教育者進行的績效評價方法[11],增值評價在教育實踐中的地位由此得到了立法肯定。雖然TVAAS主要面向基礎(chǔ)教育階段,但該模式實踐的成功以及合法性的獲得對推動高等教育增值評價的發(fā)展具有重要意義;該系統(tǒng)對教育效能評估的一些技術(shù)方法也被大學(xué)生學(xué)習(xí)評價(CLA)、美國教育考試服務(wù)中心水平輪廓考試(EPP)等高等教育評價工具所借鑒。
這一時期高等教育增值評價由初發(fā)理念轉(zhuǎn)向付諸實踐,成為衡量并提升教育質(zhì)量的重要手段。增值評價明確了學(xué)生的主體地位,關(guān)注學(xué)生在接受教育后的成長變化,評價結(jié)果也被作為學(xué)校問責(zé)的依據(jù)。該階段的探索為高等教育增值評價的后續(xù)應(yīng)用擴展提供了可能性。
20世紀(jì)90年代以來,高等教育增值評價從理論到實踐持續(xù)發(fā)展,多種基于增值理念的評價模式和工具被開發(fā)出來。1999年,美國國家中學(xué)后教學(xué)改進中心設(shè)計并實施了“大學(xué)就讀成果調(diào)查”(Collegiate Results Survey,CRS),通過訪談了解學(xué)生畢業(yè)后6-9年在工作中所需的技能和能力,并讓受訪者評價大學(xué)教育在多大程度上滿足了這些需求,從而考察大學(xué)教育帶來的增值[12]。
“全美大學(xué)生學(xué)習(xí)性投入調(diào)查”(NSSE)創(chuàng)始人庫(Kuh)認為,評價一所大學(xué)教育質(zhì)量高低的核心要素是學(xué)生參與程度??梢詮膬蓚€層面就學(xué)生參與度進行院校評價:一是學(xué)生在學(xué)習(xí)及其他教育活動中投入的時間和精力;二是學(xué)校如何配置資源、組織課程和其他學(xué)習(xí)機會以有效促進學(xué)生參與。庫提出的學(xué)生參與理論豐富了增值評價,也成為設(shè)計NSSE的重要理論基礎(chǔ)。2000年,NSSE在全美范圍內(nèi)啟動,通過調(diào)查收集一年級和高年級大學(xué)生參與學(xué)校為其學(xué)習(xí)和個人發(fā)展提供的計劃和活動的信息,來考察高等院校的教育質(zhì)量[13-14]。
同年,美國教育援助委員會發(fā)起了國家增值評價倡議,在此倡議下開發(fā)了“大學(xué)生學(xué)習(xí)評價”(Collegiate Learning Assessment,CLA)等評價項目,旨在通過衡量本科教育對學(xué)生的影響來評估教育質(zhì)量。以往大多數(shù)質(zhì)量評價僅基于畢業(yè)率、同行評議、聲譽排名等指標(biāo),但這些指標(biāo)并不是從高等教育本身出發(fā)對學(xué)生學(xué)習(xí)進行系統(tǒng)而直接的衡量,忽略了學(xué)生在大學(xué)中獲得的知識和能力,忽視了高等教育的復(fù)雜性和多樣性[15],而CLA關(guān)注大學(xué)教育對學(xué)生成長變化的影響,并側(cè)重考察學(xué)生的批判性思維、問題解決等高階思維能力。
這一時期學(xué)生參與理論的提出進一步擴充了增值評價的理論基礎(chǔ),增值評價在實踐的檢驗中得以不斷反思、改進。NSSE和CLA的推出及完善,說明高等教育增值評價已經(jīng)脫離了以學(xué)生成績?yōu)闇y量指標(biāo)的簡單狀態(tài),進入了一個注重學(xué)生能力變化和就讀體驗的新時期。除上述評價工具外,具有代表性的還有美國教育考試服務(wù)中心水平輪廓考試(ETS Proficiency Profile,EPP)、學(xué) 術(shù) 能 力 與 進 步 測 試(Measure of Academic Proficiency and Progress,MAPP)、大學(xué)生就讀經(jīng)驗問卷調(diào)查(College Student Experience Questionnaire,CSEQ)等。
這些評價工具使用的方法可分為直接法和間接法,主要區(qū)別在于信息來源的不同。直接法為直接測量與評價,直接對比學(xué)生在多次標(biāo)準(zhǔn)化測試中的得分,剔除外界影響后結(jié)果的差值即為增值量;間接法為間接調(diào)查與評價,主要通過學(xué)生自主匯報在教育活動中的參與程度和自我評價就讀體驗來反映增值情況[7,12,16]。表1列出了兩種方法的主要評價工具、指標(biāo)及測量方法[7,17-20]。
表1 主要評價工具、指標(biāo)及測量方法
經(jīng)過半個多世紀(jì)的發(fā)展,增值評價作為一種發(fā)展性評價方式被實際運用于不少國家和地區(qū)的高等教育領(lǐng)域。增值評價是通過對比學(xué)生入學(xué)成績、能力起點與接受學(xué)校教育的結(jié)果,來考查學(xué)生學(xué)業(yè)成就的“增值”,據(jù)此判斷學(xué)校教育對學(xué)生的影響。高等教育增值評價則是指追蹤大學(xué)生在不同時間點上的學(xué)業(yè)成績、能力變化或就讀體驗,并利用一定的統(tǒng)計方法對變化情況進行分析的一種高等教育質(zhì)量評價方式。
增值評價是對傳統(tǒng)教育評價的一種變革和補充,從提出到被理解和接受經(jīng)歷了一個循序漸進的過程,這也是一個不斷回應(yīng)質(zhì)疑并在質(zhì)疑中改善的過程。相較于基礎(chǔ)教育,高等教育機構(gòu)的層次類型更加多樣,學(xué)校擔(dān)負的教育功能與育人過程更加復(fù)雜,更容易受到知識生產(chǎn)模式和技術(shù)變革的影響。因此,高等教育增值評價需要考慮的因素和克服的困難也更多。圍繞高等教育增值評價的爭論既有增值評價的共性問題,也有特性問題。梳理發(fā)展過程中的關(guān)鍵爭論,有助于更好地理解和把握高等教育增值評價。
關(guān)于增值評價最基本的爭論圍繞增值的理念展開,主要探討評價方式的科學(xué)合理性及公平性。支持者認為,增值評價不同于靜態(tài)的總結(jié)性評價,是具有動態(tài)特征的發(fā)展性評價方式,是對以測量、描述和判斷為主的前三代評價方式的改進,符合注重個體與環(huán)境互動的第四代評價的原則[21]。傳統(tǒng)的評價方式一般得到的是單次的、絕對的結(jié)果,對學(xué)校和學(xué)生的評判比較片面。例如,安德烈科(Andrejko)的研究表明,按照傳統(tǒng)的方式評價,賓夕法尼亞州的學(xué)生成績低于全國及鄰州學(xué)生的平均水平,但在增值評價方式下,該州的學(xué)校在學(xué)生成績增值方面表現(xiàn)良好,甚至是鄰州水平的三倍[22]。增值評價不以成果的絕對值為參考,而是注重成長的相對值,改變了以往使用平均值或其他標(biāo)準(zhǔn)進行比較的模式[10],不用單一標(biāo)準(zhǔn)評判不同基礎(chǔ)的學(xué)生,也更有利于增強學(xué)生和學(xué)校發(fā)展的主動性。同時,增值評價可以將學(xué)校的教育作用從眾多非教育性因素中分離出來,如家庭背景、學(xué)校經(jīng)費等[23],進一步保證了評價的相對公平性。質(zhì)疑者則認為,每個人都可能比他人更容易學(xué)習(xí)或掌握某方面的知識或技能[15],這種個人稟賦的特殊性會使相同的學(xué)校教育體現(xiàn)在不同學(xué)生個體上的效果差異較大,增值評價很難測量出個體差異性造成的教育效果差異。
聚焦到高等教育增值評價,理念之爭不僅反映在個體稟賦上,也反映在機構(gòu)效率上。在個體稟賦上,支持者認為高校的教學(xué)質(zhì)量評價對學(xué)生發(fā)展的回應(yīng)應(yīng)當(dāng)走近個體學(xué)生,正因為不同受教育者的“增值”大小不等,說明增值評價尊重了個性化差異[24]。質(zhì)疑者則認為,學(xué)生存在的個體差異使得增值評價難以進行,因為學(xué)校貢獻很難測量;大學(xué)教育與基礎(chǔ)教育不同,其目標(biāo)不僅是傳授知識,更是挖掘潛力和培養(yǎng)全人,而這是一件很難評估的事情[15]。而且,因為高等教育層次類型較為多樣,增值評價難以反映機構(gòu)的實際效率,運用增值評價對機構(gòu)進行比較的適切性仍有待商榷。麥克米蘭(McMillan)認為高校有著各自的使命、目標(biāo)、歷史及課程,往往會吸引獨特的學(xué)生群體,每個機構(gòu)所提供的教育都是獨一無二的[25]。哈維(Harvey)與格林(Green)則舉例論證,牛津、劍橋帶給優(yōu)秀學(xué)生的增值可能反而較小,而技術(shù)類院校帶給稍弱學(xué)生的增值可能較大,但是否就可以說牛津、劍橋的教育質(zhì)量不如技術(shù)類院校呢?顯然不能僅憑增值結(jié)果進行院校間的比較[26]。
增值評價的第二個重要爭論在于過程方面,圍繞增值評價的準(zhǔn)確性與有效性展開,具體包括問責(zé)效用和指標(biāo)選取。2004 年美國《教育與行為統(tǒng)計》雜志以專欄的形式發(fā)表了一組文章,學(xué)者們就增值評價展開了探討。以特克維(Tekwe)等人為代表的支持一方對學(xué)??冃г鲋翟u估的四種統(tǒng)計模型進行了分析,從統(tǒng)計學(xué)角度證明了增值評價結(jié)果的準(zhǔn)確性,為把增值評價作為問責(zé)的依據(jù)提供了支持[27]。而勞登布什(Raudenbush)認為,影響學(xué)生增值的實際上是學(xué)校實踐,包括學(xué)校管理和教師教學(xué),然而學(xué)校實踐既無完全定義也不能被觀察到,因此不能判定學(xué)生學(xué)業(yè)成就中哪些部分受到學(xué)校管理及教師教學(xué)的影響,無法得出因果結(jié)論[28]。麥卡弗里(McCaffrey)等人贊同勞登布什的觀點,反對將增值評價作為問責(zé)的依據(jù),認為需要建立實證數(shù)據(jù)庫來匹配增值評價的指標(biāo)與教師效能的聯(lián)系[29]。還有研究者指出,不同學(xué)科標(biāo)準(zhǔn)會對增值分數(shù)產(chǎn)生影響;學(xué)?;蚪處熯€會采用策略去適應(yīng)評估,導(dǎo)致增值分數(shù)變得不可靠[30]。也有研究者認為,評價分數(shù)在學(xué)校層面是可靠的,但是從學(xué)生個體層面來看,僅通過學(xué)生回答有限數(shù)量的問題來判斷能力,其可靠性值得商榷[31]。
盡管一些工具和方法已經(jīng)在盡可能剔除外部因素的條件下考察了大學(xué)生的學(xué)習(xí)發(fā)展,不少研究者依舊對評價內(nèi)容和指標(biāo)選取提出了疑義。卡羅爾(Carol)認為,增值評價方式尚未回應(yīng)大學(xué)在幫助學(xué)生獲得能力上取得哪些進展,在離開學(xué)校后學(xué)生遇到問題時能否運用這些能力,應(yīng)當(dāng)采取增值評價與總結(jié)性評價相結(jié)合的評價模式[32]。貝內(nèi)特(Bennett)認為,大學(xué)并非致力于培養(yǎng)學(xué)生的單一能力,因此在衡量增值時需要考慮不同的價值維度,這就涉及評價指標(biāo)的多元化,目前的評價指標(biāo)和價值維度顯然是不夠的[33]。貝爾德(Baird)則指出,增值評價在用于評估大學(xué)的專業(yè)教育和通識教育上存在難點,因為專業(yè)教育和通識教育都可能涉及不同學(xué)生主體、學(xué)習(xí)順序、課程組合等差異問題,因此很難做比較[4]。
關(guān)于增值評價結(jié)果的爭論主要圍繞評價結(jié)果是否有診斷意義、該如何應(yīng)用等問題。支持者認為,增值評價關(guān)注的是學(xué)生的學(xué)習(xí)發(fā)展,反饋結(jié)果能使學(xué)生更好地了解自身的成長,并能隨著時間的推移進行自我提升。同時,增值評價提供的數(shù)據(jù)有助于改進課程和教學(xué),并可得出教育機構(gòu)對學(xué)生影響的相關(guān)結(jié)論[25]。增值評價對增值與發(fā)展的關(guān)注決定了它的可追蹤和可重復(fù)性,這種“不以一次成敗論英雄”的多次測評方式更有助于了解學(xué)生的進步情況,分析學(xué)校層面和學(xué)生個體層面等各種因素對學(xué)業(yè)成績發(fā)展變化的影響效應(yīng)[34],從而進行診斷,為教育質(zhì)量改進提供更具體的方向。在高等教育增值評價當(dāng)中,對評價結(jié)果的診斷性持肯定態(tài)度的學(xué)者認為,增值評價在追蹤評價的過程中能夠提供診斷性預(yù)測與反饋。教育評估的根本目的是激勵和幫助學(xué)校改進教育工作,特別是有關(guān)人才發(fā)展的評估,其用途主要是反饋,收集有益信息服務(wù)于相關(guān)各方,而不是僅僅用來判斷誰是合格或不合格的[35]。也有研究者對增值評價的結(jié)果使用提出了疑義,如皮克林(Pickering)和鮑爾斯(Bowers)認為,增值評價結(jié)果的實際意義比統(tǒng)計意義更值得分析,要按照不同的課程目標(biāo)及實際情況對結(jié)果進行分類討論。他們進一步提出,學(xué)生在某方面進步顯著可能是由于教師在課程中對該領(lǐng)域強調(diào)得過多,而學(xué)生在某方面沒有進步可能是由于這些領(lǐng)域需要更高階段的培養(yǎng),因此對學(xué)生成績、能力、素養(yǎng)的增值分析要視實際情況而定[36]。貝內(nèi)特關(guān)注到教育成效的滯后性,認為大學(xué)教育對學(xué)生的增值或許在數(shù)年后才得以展現(xiàn),因而需要評估的對象是畢業(yè)數(shù)年的校友,而不是即將畢業(yè)的高年級學(xué)生[33]。芬奇(Fincher)認為當(dāng)前的教育理論或政策并不能為增值評價在高等教育中的開展提供指導(dǎo),增值評價也不能具體解釋大學(xué)課程安排、專業(yè)領(lǐng)域、大學(xué)氛圍、教學(xué)方式方法和教學(xué)質(zhì)量是如何給學(xué)生學(xué)習(xí)結(jié)果帶來影響的[37]。舍米斯(Shermis)認為大學(xué)生學(xué)習(xí)評價的目的是大學(xué)的自我改進,而不是將大學(xué)教育作為一種商品,用評價結(jié)果將不同大學(xué)進行排序。大學(xué)和教師應(yīng)該探索的是如何滿足學(xué)生的教育需要而不是避免被問責(zé)[38]。
歸納關(guān)于高等教育增值評價的爭論,可以看到在理念、過程和結(jié)果上幾乎都有正反兩方的觀點(見表2)。就理念而言,支持者認為高等教育增值評價關(guān)注相對成長,分離了非教育性因素,具有相當(dāng)?shù)目茖W(xué)性和公平性;質(zhì)疑者則認為增值評價無法考慮高等教育機構(gòu)與學(xué)生的特殊性,不適用于不同類型院校間的比較。就過程而言,支持者認為評價過程具有統(tǒng)計意義,能夠較為準(zhǔn)確地反映個體或院校的增值以回應(yīng)問責(zé);質(zhì)疑者則強調(diào)增值評價會受到諸多方面的影響,難以回應(yīng)問責(zé)。就結(jié)果而言,支持者認為增值評價能為人才發(fā)展提供反饋信息,可用于教育改進;質(zhì)疑者則認為缺乏理論指導(dǎo)及共識,需對結(jié)果進行分類討論。
表2 高等教育增值評價的主要爭論
增值評價緣起于對結(jié)果導(dǎo)向、單一標(biāo)準(zhǔn)的傳統(tǒng)評價模式的批評。從某種意義上看,建立在既有成果和基礎(chǔ)上的傳統(tǒng)評價模式是一種靜態(tài)的、截面的評價,不能反映起點的差異,這種評價結(jié)果往往會造成已有優(yōu)勢的結(jié)構(gòu)性傳遞,使得一些原有基礎(chǔ)好的學(xué)生和學(xué)校的固有優(yōu)勢通過評價的方式得到進一步固化和加強。這種評價模式把“贏者”的某些特征標(biāo)準(zhǔn)化,設(shè)置卓越模板,形成“理性神話”,極易帶來模仿效應(yīng)和規(guī)范效應(yīng),造成“贏者通吃”和“馬太效應(yīng)”。增值評價摒棄了這種評價上的“出身論”,通過強調(diào)“增值”和“后天努力”,突出了“進步”“個性”和“多元”的意義,突破了既得利益者在評價領(lǐng)域構(gòu)建的“理性神話”,體現(xiàn)了民主的力量,這與20 世紀(jì)下半葉高等教育普及化、民主化和多元化的浪潮是一致的,是時代精神在教育評價上的體現(xiàn)。然而,對“理性神話”的突破并不意味著高等教育增值評價就一定能走上科學(xué)理性的坦途,它在當(dāng)前至少存在以下局限:
從高等教育增值評價的現(xiàn)狀和爭論可以看到,無論是從評價理念還是評價手段來看,增值評價并不能真正跳出工具主義和標(biāo)準(zhǔn)化的套路。以相對成熟并具有代表性的CLA 為例,盡管它不再像以往的評價那樣僅基于畢業(yè)率、同行評議、聲譽排名等指標(biāo),但依舊使用一種標(biāo)準(zhǔn)化的測試方式,通過對學(xué)生進行多次標(biāo)準(zhǔn)化測試,直接對比能力變化以獲取差值。這種標(biāo)準(zhǔn)化的定量方法的可靠性和價值導(dǎo)向都值得懷疑。庫就認為,CLA 評價中大學(xué)最終的評價分數(shù)是由學(xué)生分數(shù)匯總產(chǎn)生的,學(xué)生得分誤差量的復(fù)合會將額外的錯誤引入大學(xué)得分中,因此很難對大學(xué)分數(shù)進行有意義的解釋[19]。把增值評價作為問責(zé)依據(jù)這一工具導(dǎo)向則很容易扭曲增值評價,如果政府以此作為問責(zé)的依據(jù),將會使教師的教學(xué)選擇趨同——因為大學(xué)和教師將不再愿意做有風(fēng)險的創(chuàng)新和嘗試,而會通過趨同的策略來獲得評價上的好成績[38]。相較于CLA,NSSE 在理念上更加注重個性化和個體感受,但依舊是在人為設(shè)定的有限維度下,通過計算頻次和時間投入量的模糊計數(shù)方式來進行增值測量[39]。所以,現(xiàn)有的增值評價未能避免方法上的工具化和標(biāo)準(zhǔn)化等問題。
增值評價對什么是好的高等教育質(zhì)量依舊只是在有限維度內(nèi)進行定義,規(guī)定了某種卓越的模板,并沒有能夠避免現(xiàn)代社會流行的優(yōu)績主義。
所謂優(yōu)績主義(meritocracy),是主張社會與經(jīng)濟的獎賞應(yīng)當(dāng)依據(jù)才能、努力和成就這些“優(yōu)績”來決定[40]。相對于強調(diào)出身、財富和世襲的觀念,優(yōu)績主義顯然具有相當(dāng)?shù)倪M步性。因為它勾畫了一種理想社會,這種社會相信人們的命運掌握在自己手中,成功不受制于外在的環(huán)境力量,個人是命運的主人,只要夠努力、有天分、有夢想,想飛多高就能飛多高[41]。這實際上許諾了一種愿景,即只要人們具備才能并愿意努力,就能夠獲得上升的機會,人人都有平等地獲得成功的機會。
增值評價似乎體現(xiàn)了這種理想和許諾,力圖剝離不可改變的先天因素,只評價學(xué)生或?qū)W校的“努力”與“進步”,但是這種理想在現(xiàn)實中就會變得骨感。就像優(yōu)績主義在現(xiàn)實中碰到的問題一樣,不但沒有實現(xiàn)更大的平等,反而加劇了差距;因為它存在一個根本性的假設(shè)問題,它預(yù)設(shè)社會分配是基于能力和功績,與其他因素?zé)o關(guān),但在現(xiàn)實生活中,人們獲取功績不僅僅依靠能力與努力,還依賴于很多其他因素,而這些因素往往被優(yōu)績主義所忽視[42]。增值評價也是如此,雖然在方法上分離了家庭等初始因素,強調(diào)個體自身的進步,但不同家庭的文化資本已經(jīng)產(chǎn)生了深刻的影響并內(nèi)化于學(xué)生身上;中上階層的子女由于家庭文化資本的影響更能適應(yīng)精英高校的文化,從而取得更好的學(xué)業(yè)成就,一些增值可能正源于此。
教育的根本目標(biāo)是實現(xiàn)每個人自由而全面的發(fā)展,真正的教育只可能是因人而異的全面質(zhì)量概念,而不應(yīng)該是對某些卓越模板的形式化計算和簡單模仿。因此,增值評價在突破舊的“理性神話”的同時,有可能會建立起新的“理性牢籠”,將教育帶入優(yōu)績主義的陷阱。
如前所述,增值測量是否可信和有效、獲得的證據(jù)是否科學(xué)還存在爭論。對增值測量效果提出最明顯挑戰(zhàn)的是“天花板效應(yīng)”,這也是在當(dāng)前增值評價中一直未能得到解決的重大難題。所謂“天花板效應(yīng)”,是指優(yōu)秀學(xué)生或優(yōu)質(zhì)生源學(xué)校因原有起點高、增值空間有限而不可能獲得較大進步幅度,因而得到較低增值評價結(jié)果的現(xiàn)象?!疤旎ò逍?yīng)”很容易造成增值評價結(jié)果與經(jīng)驗事實之間的悖論。如在爭論中有學(xué)者舉例的那樣,現(xiàn)實中可能存在“牛津、劍橋”等教育實力強的“名牌大學(xué)”帶給學(xué)生的增值反而小于技術(shù)類院校的情況。我國學(xué)者的實證研究也表明,由于進入不同層次高校的學(xué)生稟賦各異,那些基礎(chǔ)較好的學(xué)生即使進入頂尖大學(xué)就讀,其學(xué)習(xí)能力尤其是批判性思維能力也因觸及階段性的“天花板”而不再增長;如果要實現(xiàn)與其他同學(xué)同樣的增長幅度,他們需要付出多得多的努力,所在學(xué)校也需要付出更多的資源[43]。
關(guān)于高等教育增值評價的探索與爭論其實都離不開對教育評價本質(zhì)的回溯,相關(guān)爭論依舊是圍繞教育評價的元問題在進行,涉及評價的合法性、合理性與科學(xué)性等基本問題。回應(yīng)好這些問題,才能應(yīng)用好增值評價。毫無疑問,相較于傳統(tǒng)的“以結(jié)果論英雄”的評價模式,增值評價具有相當(dāng)?shù)倪M步性,不像原有評價那樣單一、靜態(tài),而是試圖在評價中注入更多“民主”“平等”“以學(xué)生為本”的時代精神,試圖調(diào)動人和教育機構(gòu)的主觀能動性。然而,增值評價畢竟濫觴于教育問責(zé),并為教育問責(zé)提供依據(jù)。推行增值評價的專家和教育管理者從效率的角度認為增值評價能夠反映教育的全過程,具有科學(xué)性和可操作性;而學(xué)校和教師從育人的角度大多認為這種評價無法覆蓋所有的努力和影響因素。尤其是在高等教育領(lǐng)域,學(xué)生的成長與發(fā)展涉及的因素更多,標(biāo)準(zhǔn)更加多元和難以統(tǒng)一,信息技術(shù)革命也使得學(xué)校之間、學(xué)校與社會之間的界線變得更加模糊,計算增值和評價因果關(guān)系更加困難,高等教育增值評價會面臨更多的挑戰(zhàn)。所以,在使用增值評價時要特別注意到它的局限性和高等教育的特性,不僅要科學(xué)探索如何測算“增值”,更要理性思考如何使用“評價”,才有可能發(fā)揮增值評價的進步作用,避免陷入標(biāo)準(zhǔn)化評價的套路和優(yōu)績主義的陷阱。
當(dāng)前我國實際運用高等教育增值評價時還應(yīng)注意以下問題:第一,要將增值評價與我國高等教育實際情況相結(jié)合。增值評價的理論與應(yīng)用發(fā)源于西方社會,在中國高等教育場域中運用增值評價要堅持以我為主、為我所用。我國高等教育發(fā)展要落實立德樹人的根本任務(wù),開創(chuàng)中國特色、世界一流大學(xué)新路,應(yīng)將我國獨特的教育目標(biāo)和使命納入增值評價的維度之中,并致力于生成、完善本土化的相關(guān)理論。第二,注重增值評價與結(jié)果評價、過程評價、綜合評價等評價方式的協(xié)同融合。由于高等教育具有成效滯后性、學(xué)科復(fù)雜性、教學(xué)多樣性等屬性,任何一個評價體系都不能覆蓋教育的全過程并反映所有人的努力,在使用增值評價時也要注重同其他評價方式互補。第三,使用增值評價結(jié)果時應(yīng)當(dāng)保持審慎態(tài)度。如在分析、使用增值評價結(jié)果時應(yīng)當(dāng)考慮到“天花板效應(yīng)”等測量缺陷,正視高等院校的類型差異,在評價教育質(zhì)量時做到具體問題具體分析。
注釋
①美國教育援助委員會于2013 年秋季推出了CLA 的升級版——CLA+,在參與形式與題型等方面做出較大改進。