詹春青
我國NAEQ與PISA之比較研究與啟示
詹春青
知識經(jīng)濟時代,隨著世界各國間教育交流和競爭的加強以及對教育產(chǎn)出評估的關注,不少國家都開展國內(nèi)和國際的基礎教育質(zhì)量測評。本文通過比較本國的國家教育質(zhì)量評估項目(NAEQ)和國際學生評估項目(PISA)在項目創(chuàng)立、項目實施、項目結(jié)果報告與反饋的異同,得出PISA對我國NAEQ的啟示,分別是樹立促進學生終身發(fā)展、全面發(fā)展的價值取向、建立測評結(jié)果報告的公開反饋機制、建立對教育問題的快速反應機制以及逐步采用現(xiàn)代化的計算機測試方式,以期引起我國大規(guī)模教育測評與評價的反思。
NAEQ;PISA;比較;機制;公開
知識經(jīng)濟時代,世界各國都希望本國基礎教育能切實增強學生的知識與技能,以提升國際競爭力,故特別重視教育質(zhì)量,教育質(zhì)量成為國際關注的熱點。通過開展大規(guī)模的外部統(tǒng)一學業(yè)測試,是了解基礎教育質(zhì)量的重要途徑。目前,許多國家都從國內(nèi)和國際兩個視野同時評估本國的基礎教育質(zhì)量,在開發(fā)本國的大規(guī)模學生學業(yè)測試的同時,引入國際性的大規(guī)模測試。如美國開發(fā)本土長期的、全國性的國家教育進步評價項目的同時也參加了國際學生評估項目(PISA)。在我國,上海也參加了PISA測試。上海于2006年提出申請,2007年開發(fā)測試工具,2008年進行試測,2009年正式測試。上海連續(xù)在PISA2009和PISA2012測試中奪冠,這一結(jié)果引起了國內(nèi)外教育界及媒體的廣泛關注。與此同時,我國于2007年也開發(fā)了本土的國家教育質(zhì)量評估項目(National Assessment of Educational Quality,NAEQ),迄今為止已開展了8年。
可以說,NAEQ和PISA均為教育評價項目,NAEQ的開展與PISA在我國的引入時間上也基本同步。那么作為本土的NAEQ和國際性的PISA究竟有何異同,他們在建立義務教育質(zhì)量評估體系、切實提高教育質(zhì)量上有何作用?尤其是對于超越本國課程的PISA對NAEQ有何啟示?本文將從項目創(chuàng)立、項目實施、項目結(jié)果報告與反饋三個方面作出比較,并得出PISA對NAEQ的啟示。
1.1 組織機構
PISA由經(jīng)濟合作與發(fā)展組織(簡稱OECD)參與國委員會、國際委員會、各國項目主管等機構共同完成[1]。參與國委員會負責確定指標、測量工具和報告結(jié)果。調(diào)查的設計和執(zhí)行則由國際委員會負責,包括澳大利亞教育研究委員會(ACER)和荷蘭國家教育測量學會(CITO)及其他一些成果。各國項目主管負責本國項目的執(zhí)行、調(diào)查結(jié)果的分析和報告。
NEAQ由政府、高校、科研機構等協(xié)同完成。國家教育督導委員會辦公室負責統(tǒng)籌規(guī)劃、政策指導、基礎教育質(zhì)量監(jiān)測中心(簡稱監(jiān)測中心)負責日常的組織管理,相關高校、科研機構參與具體的研究、研發(fā)工作,地方各級督導部門和教育局配合完成監(jiān)測數(shù)據(jù)的采集[2]。
值得一提的是,NEAQ監(jiān)測中心是教育部依托北京師范大學成立的第三方專業(yè)評價機構,它沒有獨立法人地位,也不具有政府機構的行政功能[3]。因此,第三方專業(yè)評價機構在開展工作過程中,要保持自身的相對獨立性和權威性,避免工作性質(zhì)上完全成為行政機構的附屬和工作內(nèi)容上與行政機構趨同的局面,否則,很難保證第三方機構開展評估與監(jiān)測的專業(yè)性和客觀性,第三方機構的生存空間也難以得到保障。
1.2 測評目的
PISA是以證據(jù)為本的政策研究,以改進教育政策為測評目的。PISA將學生學習結(jié)果的數(shù)據(jù)與其他影響因素聯(lián)系起來,用經(jīng)過科學研究得到的數(shù)據(jù),提高教育決策的客觀性和科學性??梢哉f,PI?SA為各參與國提供了國際比較的視角,通過把本國測評的結(jié)果放在國際大背景下進行比較,了解本國的優(yōu)勢和不足,改進教育決策。
我國的基礎教育一直都被貼以“應試教育”的標簽,社會公眾以升學率作為評價學校和學生的唯一標準,為糾正這種傳統(tǒng)應試的做法,引導社會樹立科學全面的教育質(zhì)量觀,同時為順應課程改革的趨勢和國際教育策略與評價的浪潮,我國也開發(fā)了本土的基礎教育質(zhì)量監(jiān)測與評價項目。NAEQ正是基于這樣的背景成立的,它旨在全面測評義務教育階段學生學業(yè)質(zhì)量、身心健康及變化情況,深入分析其影響因素,為轉(zhuǎn)變教育管理方式和改進學校教育教學提供參考,推動義務教育質(zhì)量和學生健康水平不斷提升。
綜上,PISA和NAEQ的測評目的有相似之處,即兩者都是把握教育現(xiàn)狀為教育決策提供參考,診斷問題為決策調(diào)整提供依據(jù)的;不同的是,前者注重國際比較,后者重在引導輿論為社會樹立良好的教育價值導向。
1.3 測評技術與方法
PISA綜合應用了統(tǒng)計測量技術。其抽樣應用了按照概率與抽樣元素的規(guī)模大小成比例的抽樣法(簡稱PPS抽樣方法),試題組卷采用了矩陣抽樣方法。在試題分析和能力量表制定中應用了項目反應理論,在結(jié)果數(shù)據(jù)分析中采用了多層線性模型分析方法等國際上較前沿的數(shù)據(jù)分析方法[4]。
NAEQ通過加強國際交流與合作,如國家教育督導團辦公室與法國教育部預測評估司共同主辦教育監(jiān)測與評估國際研討會、邀請國際組織機構的知名專家短期講學、開設研究生課程等方式,以PI?SA以及其他國際大型學生測評項目的經(jīng)驗為基礎,同步跟進和吸收了國際相關標準化工具研制的測量技術,如采用了國際廣泛使用的矩陣設計、錨題等值等技術。當然,NAEQ也對這些技術因地制宜,作出本土化改進。
2.1 測評對象和內(nèi)容
PISA通過閱讀素養(yǎng)、數(shù)學素養(yǎng)和科學素養(yǎng)三個領域,系統(tǒng)測試接近完成義務教育的15歲學生在多大程度上掌握了參與未來知識社會所必須的基礎知識和基本技能。NAEQ參照國家義務教育課程標準,監(jiān)測義務教育階段的四年級與八年級學生的全面發(fā)展狀況,測試包括語文、數(shù)學、科學、體育、德育和藝術共六個學科領域。PISA和NAEQ的測評對象和內(nèi)容如表1所示。
以PISA閱讀素養(yǎng)測評為例,重點測評學生訪問和檢索、整合和解釋、反思和評價等認知方面的能力,以及學生閱讀參與度和學習策略。此外,還通過“電子閱讀能力測評”(Electronic Reading Assess?ment,ERA)測評學生閱讀電子媒體文本的能力。以NAEQ語文學科測評為例,重點測評語文基礎、文本閱讀、書面表達、識別與推論、整合與解釋、評價與鑒賞、學習興趣、學習信心和學習習慣。
PISA和NAEQ兩者在測評學生學習態(tài)度、學習興趣與學習信心方面如出一轍,但PISA對素養(yǎng)的定義是在不斷發(fā)展的,與時俱進的。而且對學生進行電子閱讀能力測評,以及測評學生基于計算機問題解決能力,這些方面都是NAEQ缺乏的。
2.2 測評內(nèi)容與周期
PISA從2000年開始,每三年進行一次,每次從三個學科領域中選擇一個作為主要評估領域,另外兩個作為次要評估領域。前三次PISA測評的主要評估領域分別是閱讀(2000年)、數(shù)學(2003年)、科學(2006年),2009年主要評估領域又回到閱讀,2003年和2012年另外附加測試問題解決(Problem Solving)能力(如表2所示)。值得一提的是,2012年嘗試用計算機的方式來測評問題解決能力。
NAEQ從2007年開始,截至2014年連續(xù)八年開展測評,基本上每年選擇兩個學科領域作為測評領域(2011年和2012年除外)。2007—2014年NAEQ的測評內(nèi)容[5]如表3所示。自2015年開始,NAEQ每三年進行一次,每年測試兩個學科領域。第一年度測試數(shù)學和體育,第二年度測試語文和藝術,第三年度測試科學和德育。
從測評內(nèi)容來看,PISA和NAEQ有異曲同工之妙,兩者都涵蓋學科知識,也涉及能力、素養(yǎng),還將測評成績與外部環(huán)境進行關聯(lián)分析。從測評周期來看,PISA和NAEQ都以三年作為一個周期,既可以保證持續(xù)性,也可以避免因頻率過高,對學校造成負擔。另外,由于測評項目的復雜性,其測評指標、工具、報告等都需要不斷進行修訂,這種周期性實施的方式,也給測評項目自身的完善留有充足的時間[6]。
表1 PISA和NAEQ的測評對象和內(nèi)容
表2 PISA的測評內(nèi)容與周期
表3 2007—2014年NAEQ的測評內(nèi)容
2.3 測評樣本
抽樣在很大程度上決定了研究結(jié)果所適用的對象范圍??梢哉f,科學、正確的樣本保證了測評對象的有效性。PISA和NEAQ均采用按照概率與抽樣元素的規(guī)模大小成比例的抽樣法。
PISA抽樣要求每個國家(地區(qū))至少有150所學校、4 500名學生參加測試。以上海參加的PI?SA2012為例,樣本為155所學校,6 374名學生參加測試。抽樣分為學校抽樣和學生抽樣,上海嚴格按照PISA的抽樣技術要求,在學校抽樣中,學校類型包括初級中學、完全中學、實驗性示范性高中、一般普通高中、重點中職、一般中職[7];區(qū)域分類包括中心城區(qū)和郊區(qū);辦學體制包括公辦學校和民辦學校。學生抽樣中,基本覆蓋七年級以上15歲在校生。
NEAQ采用分層不等概率方式分三個階段抽取樣本。首先是抽取全國總縣數(shù)十分之一左右的縣(市、區(qū)),每個?。▍^(qū)、市)不少于6個樣本縣(市、區(qū));接著是在樣本縣(市、區(qū))采用按規(guī)模成比例概率抽樣方法抽取樣本學校,每個樣本縣(市、區(qū))抽取的小學不少于12所,初中不少于8所;最后在每所樣本校隨機抽取不少于30名學生。以NEAQ2015為例,全國31個省、自治區(qū)、直轄市和新疆生產(chǎn)建設兵團323個樣本縣(市、區(qū))6 476所中小學的近20萬名四、八年級學生參加了測試,近6 500名中小學校長、十萬余名數(shù)學、體育及班主任教師接受了問卷調(diào)查[8]。
2.4 測評方式
PISA和NEAQ兩者除了有學業(yè)測試外,均有調(diào)查問卷。PISA包括學生問卷、學校問卷和國家問卷,所收集的有關社會、文化、經(jīng)濟和教育因素的指標與學生的成就相聯(lián)系,并從學習者、教學者、學校及教育體制四個層面進行分析。NAEQ包括學生、教師和校長問卷,用于調(diào)查影響學生學業(yè)水平的影響因素。PISA滿足信息時代要求的,自2015年起,全面實行基于計算機的考試方式,及時反映最新的技術和教育成就。而NEAQ采用紙筆測試和現(xiàn)場測試。紙筆測試分為學科試卷和調(diào)查問卷?,F(xiàn)場測試主要用于體育、科學、藝術等學科領域,通過學生的現(xiàn)場演示和項目參與,考查運動、操作、創(chuàng)作能力。
3.1 測評結(jié)果的報告方法
PISA測評結(jié)果的報告方法有兩種。一是量化分數(shù),閱讀、數(shù)學和科學三個領域的分數(shù)一般設OECD國家學生的平均分為500,標準差為100,各個國家以此為標準得出相對的分數(shù)。表4呈現(xiàn)了PISA2012上海學生平均成績及排名。二是量表難度等級,即學生精熟度水平,難度等級越高代表精熟度水平越高,PISA三個學科的等級劃分稍有不同,基本上從水平1到水平6共有六個等級。
表4 PISA2012上海學生評價成績及排名
NAEQ對學生學業(yè)水平進行等級劃分,劃分為水平1到水平4共四個水平段,同時輔以具體描述。因難以從公共數(shù)據(jù)庫獲得NAEQ報告,故無法得知詳細內(nèi)容。
3.2 測評結(jié)果的反饋與政策調(diào)整
PISA在測試后的第二年公開發(fā)布國際報告。如《面向明日世界的學習:國際學生評估項目PI?SA2012報告》、《PISA2012技術報告》等。這些報告都是公開的,均可以在OECD的官方網(wǎng)站下載和相關權威媒體獲得。
當PISA測評結(jié)果公布之后,各參與國都清楚地知道本國的結(jié)果以及與其他國家的對比情況。2001年PISA評估結(jié)果公布后,德國作為參與測試的國家,其學生在三個學科的測試分數(shù)都低于OECD的平均值,與芬蘭、挪威、英國等歐洲其他國家相距甚遠。該報告使得德國政府開始實施教育改革,制度一系列政策,如統(tǒng)一教育標準,設定最低要求;加強學前教育,提早入學年齡;增加教育投入,調(diào)整優(yōu)先教育投資等[9]。
NAEQ測評結(jié)果反饋采取了“個別反饋、分級報告、互不交叉”的方式,國家級報告根據(jù)測評發(fā)現(xiàn)問題的歸口,分期、分批向相關負責部門呈送政策咨詢報告和簡報,成為中央和教育部制定教育政策的重要參考[10]。如,2012年11月,監(jiān)測中心向教育部呈報了關于《部分地區(qū)農(nóng)村小學沒有英語教師、不開英語課,學生英語學習質(zhì)量地域差異懸殊》的報告。教育部督導辦就該問題約談了相關省份的負責人。同時,根據(jù)監(jiān)測結(jié)果發(fā)現(xiàn)的各地學生英語學習條件、資源差異巨大,農(nóng)村學生處于不利境地的狀況,監(jiān)測中心向教育部提出了“改革英語教學評價制度,降低中考英語所占的分值比例,確保教育公平”、“改革英語課程方案,減少義務教育階段英語課程內(nèi)容,降低學習難度”等建議。教育部予以高度重視,并在后續(xù)的中、高考制度改革充分考慮了這些問題和建議。
通過對比可發(fā)現(xiàn),對于教育政策的調(diào)整,PISA參與國是自發(fā)的,自下而上的;而NAEQ參與省、縣是被動的,自上而下的。但兩者的共同之處都是基于科學的證據(jù)作出適切的教育決策改進與調(diào)整。
NAEQ是結(jié)合國情而開發(fā)的具有本土特色的教育測評項目,NEAQ也在不斷學習和吸收PISA的先進經(jīng)驗,取得了一定的成績。PISA濃縮了國際上多個領域的集體智慧,具有先進的測評理念、嚴密的測評程序、科學的測評方法和精密的測評工具,是世界上著名的國際教育測評項目,對我國的基礎教育質(zhì)量測評無疑是重要的參考與借鑒。PISA對NAEQ的啟示主要有以下四個方面:
4.1 樹立促進學生終身發(fā)展、全面發(fā)展的價值取向
價值取向問題是一切問題的根本。國際上越來越多的教育評價項目不是甄別學習者成績的優(yōu)劣,而是尊重個體差異,幫助學生挖掘與提高各項能力,PISA主要測評學生多大程度上掌握和適應未來社會發(fā)展所需的終身學習能力。NAEQ的開展為的是改革我國現(xiàn)有的功利性、及時性、顯性的價值取向,代之以促進學生終身發(fā)展、個性發(fā)展的價值取向。實際上,NAEQ對我國基礎教育改革與發(fā)展具有直接的導向和引領作用,是基礎教育發(fā)展的“風向標”?!秶抑虚L期教育改革和發(fā)展規(guī)劃綱要(2010—2020年)》指出,應該“把促進學生健康發(fā)展作為學校一切工作的出發(fā)點和落腳點”。為此,必須確實樹立以“人的全面發(fā)展和適應社會發(fā)展需要”作為基礎教育質(zhì)量監(jiān)測的根本價值取向,避免“唯分數(shù)論”[11]。
4.2 建立測評結(jié)果報告的公開反饋機制
PISA的測評結(jié)果報告是面向公眾公開的,其官方網(wǎng)站以及權威媒體都有相關的報道和公告,參與測評的國家(地區(qū))可以清楚地知道本國(地區(qū))的測評結(jié)果以及在國際上的排名;該報告還可以供研究人員做研究之用。美國聯(lián)邦政府教育部為了充分利用PISA測試的研究成果以促進美國的教育改革,教育部請OECD站在第三方的立場上,編撰可供美國學習的國際經(jīng)驗。為此,PISA專家專門為美國編撰了《優(yōu)秀的表現(xiàn)者與有力的改革者:PISA給美國的教訓》[12]。而NAEQ并非如此,監(jiān)測中心的官方網(wǎng)站并沒有任何測評結(jié)果報告。NAEQ是通過個別反饋、分級報告的形式向相關負責部門反饋政策咨詢報告和簡報。盡管截至2015年4月,監(jiān)測中心累計提供了600余份省、縣報告,但是這些報告僅呈送測評省、縣教育行政部門,如此,作為參與測評的省、市(縣)僅僅知道自己的測評結(jié)果以及在所有樣本中的排位,無法和其他參與測評的具體單位進行橫向比較。NAEQ既然已申明不是高利害考試,減弱甄別和選拔功能,那么這種不公開、不透明的保密行為無疑剝奪了公眾的知情權和參與權,因此建立測評結(jié)果報告的公開反饋機制對提高監(jiān)測中心的權威性與公信度有極大的作用,也只有如此,才能保障該項目的有生命力地持續(xù)發(fā)展下去。
4.3 建立對教育問題的快速反應機制
PISA測試結(jié)果在參加國(地區(qū))的公眾、媒體與政府中產(chǎn)生較大的影響,尤其是對于成績排位較后或者下滑的國家(地區(qū))來說,關鍵是要建立對教育問題的快速反應機制。如,俄羅斯在PISA2000中學生成績處于中等偏下的位置。意識到教育質(zhì)量的下滑以及教育問題的出現(xiàn),俄羅斯快速制定并出臺了一系列教育標準[13]。2001年12月,出臺了《2010年前俄羅斯實現(xiàn)教育現(xiàn)代化的構想》,提出了保證基礎教育質(zhì)量的國家社會機制,負責檢查和監(jiān)督教材質(zhì)量,同時提出了建立獨立于教育行政部門的國家教育質(zhì)量評估體系。次年,又相繼出臺了《普通基礎教育國家教育標準(草案)》和《普通教育國家標準的聯(lián)邦成分(草案)》等。鑒于此,對教育問題的快速反應機制同樣適用于NAEQ。通過測評結(jié)果反饋的教育問題,有針對性地制定適切的教育政策,解決問題,以評促改,提高教育質(zhì)量。
4.4 逐步采用現(xiàn)代化的計算機測試方式
PISA為適應信息時代發(fā)展的需求,自從2015年開始摒棄紙筆測試,全面采用計算機測試的方式進行測評。NAEQ2015采用的是紙筆測試和現(xiàn)場測試相結(jié)合的方式,而且應該在未來的幾年也是沿用這種方式。從國際大型教育評價項目發(fā)展趨勢來看,計算機測試將是未來教育質(zhì)量測評的發(fā)展方向。NAEQ測試后的測試卷要嚴格由專人保密,并郵遞寄回監(jiān)測中心,這個過程耗費很多人力、物力和財力。通過計算機測評可以縮短整體測評時間,提高效率,同時還可以測評學生基于計算機的問題解決能力。當然,這對樣本校在計算機配置、機房、數(shù)據(jù)提交與收集等計算機考試技術提出一定的要求。
綜上所述,我們要客觀地分析PISA和NAEQ的優(yōu)勢與不足,取PISA之精華,立足于我國本土實際,積極探索適合我國義務教育健康發(fā)展和不斷跨越的大規(guī)模教育質(zhì)量監(jiān)測體系。
[1]辛濤,李峰,李凌艷.基礎教育質(zhì)量監(jiān)測的國際比較[J].北京師范大學學報(社會科學版),2007(6):8.
[2]宋乃慶.我國義務教育質(zhì)量監(jiān)測的“四個創(chuàng)新”[EB/OL]http:// www.moe.gov.cn/jyb_xwfb/xw_fbh/moe_2069/xwfbh_2015n/xwfb_ 150415/150415_sfcl/201504/t20150415_187153.html,2015,7,5.
[3]梅松竹.美國NAEP與我國NAEQ之比較研究[J].天津師范大學學報(基礎教育版),2013(14):60.
[4]陸璟.PISA2009上海實施報告[J].教育發(fā)展研究,2009(24):74.
[5]教育部門戶網(wǎng).我國義務教育質(zhì)量監(jiān)測進展情況[EB/OL].http:// www.moe.edu.cn/publicfiles/business/htmlfiles/moe/s8677/201504/ 185889.html,2015-7-5.
[6]李勇.基礎教育質(zhì)量監(jiān)測的特點及實施建議[J].教育測量與評價,2014(11):18.
[7]陸璟.PISA測評的理論和實踐[M].上海:華東師范大學出版社,2013,6.
[8]教育部基礎教育質(zhì)量監(jiān)測中心門戶網(wǎng)站.2015年國家義務教育質(zhì)量監(jiān)測測試順利完成[EB/OL].http://www.eachina.org.cn/eac/ dcdt/ff8080814cf569e6014e43cf649e026b.htm,2015-7-1.
[9]孔祥娟.PISA對構建我國基礎教育質(zhì)量監(jiān)測體系的啟示[J].教育測量與評價(理論版),2009(7):35.
[10]董奇.基礎教育質(zhì)量監(jiān)測體系 體現(xiàn)中國特色和創(chuàng)新[N].光明日報,2012-10-15.
[11]范涌峰,廖其發(fā).基礎教育質(zhì)量監(jiān)測:國際經(jīng)驗與本土路向[J].教育導刊,2013(4):40.
[12]張民選,等.專業(yè)視野中的PISA[J].教育研究,2011(6):9.
[13]李偉濤.基于PISA測試結(jié)果的教育政策調(diào)整分析[J].教育發(fā)展研究,2012(4):45.
Comparative Research between Chinese NAEQ and US PISA
ZHAN Chunqing
In the knowledge economy times,with the strengthening of education exchanges and competition between countries all over the world and the focus of education output assessment,many countries have carried out both domestic and international education quality evaluation in basic education.The paper introduces the National Assessment of Educational Quality(NAEQ)and the Programme for International Student Assessment(PISA),by Comparing similarities and differences between the two among the establishment,implementation and results report of projects,draws inspirations from PISA to NAEQ.It is first to set up the value for promoting students’lifelong and all-round development;secondly to establish the public feedback mechanism of the evaluation results;thirdly to set up a rapid response mechanism to the problems of education,lastly to gradually adopt modern computer test way,in order to cause reflection to large-scale education assessment and evaluation for our country.
NAEQ;PISA;Comparative Research;Education Assessment;Mechanism
G405
A
1005-8427(2016)03-0058-7
本文系國家教育體制改革領導小組研究項目“研提OECD組織PISA測試項目經(jīng)驗啟示”的研究成果之一。
詹春青,女,廣東省教育研究院基礎教育研究室,助理研究員(廣州 510035)