龔春燕
中共中央關(guān)于“十三五”規(guī)劃的建議中,“提高教育質(zhì)量”成為教育板塊的總標(biāo)題。中國教育將步人把提高教育質(zhì)量作為教育改革和發(fā)展的核心任務(wù)的時代。
在此時代,基礎(chǔ)教育質(zhì)量監(jiān)測因其具有先導(dǎo)性功能,愈益受到重視。2015年4月,國務(wù)院教育督導(dǎo)委員會辦公室頒布《國家義務(wù)教育質(zhì)量監(jiān)測方案》,標(biāo)志著國家義務(wù)教育質(zhì)量監(jiān)測制度正式建立。國家義務(wù)教育質(zhì)量監(jiān)測工作將成為提高教育質(zhì)量的新常態(tài)。
然而,由于我國教育質(zhì)量監(jiān)測事業(yè)起步較晚,對教育質(zhì)量監(jiān)測的專業(yè)性認(rèn)識不足,社會公眾對于“什么是教育質(zhì)量監(jiān)測”仍然存在較大誤解,難以把握監(jiān)測與考試的區(qū)別,很難真正建立起質(zhì)量監(jiān)測的概念。
監(jiān)測是“醫(yī)生”,考試是“裁判”
教育質(zhì)量監(jiān)測強(qiáng)調(diào)以促進(jìn)學(xué)生全面發(fā)展為核心,通過對學(xué)生的公民與道德、學(xué)業(yè)成就、身心健康、藝術(shù)素養(yǎng)、興趣愛好、學(xué)業(yè)負(fù)擔(dān)等方面進(jìn)行測量,全面了解學(xué)生的綜合發(fā)展?fàn)顩r。同時,教育質(zhì)量監(jiān)測還將收集與學(xué)生相關(guān)的學(xué)校、教師、家庭等環(huán)境信息,深入探尋影響學(xué)生全面發(fā)展的關(guān)鍵因素,科學(xué)、客觀地評價學(xué)生、教師、學(xué)校的發(fā)展?fàn)顩r。
由于教育質(zhì)量監(jiān)測強(qiáng)調(diào)過程導(dǎo)向功能,因此,其測試結(jié)果不作排名、不作評比,只側(cè)重分析學(xué)生、教師、學(xué)校或區(qū)域在這段時間內(nèi)發(fā)展的優(yōu)勢與不足,從而為學(xué)生、教師、學(xué)校以及教育行政部門分層提出改進(jìn)建議,促進(jìn)教育質(zhì)量提升。
傳統(tǒng)考試比如中考、高考,其目的往往在于甄別與選拔符合標(biāo)準(zhǔn)的優(yōu)秀學(xué)生,并且由于傳統(tǒng)考試強(qiáng)調(diào)結(jié)果導(dǎo)向功能,其考試結(jié)果往往作為學(xué)生、教師、學(xué)校評優(yōu)評先的重要依據(jù)。這不僅導(dǎo)致學(xué)校過分重視升學(xué)率,過分重視對優(yōu)秀學(xué)生的培養(yǎng),在一定程度上忽視了較為后進(jìn)的學(xué)生,忽視了不同環(huán)境的學(xué)生,忽視了學(xué)生的興趣特長,而且使得學(xué)生、教師、學(xué)校為了應(yīng)付考試而承受了較大的負(fù)擔(dān)和壓力。傳統(tǒng)考試過分強(qiáng)調(diào)學(xué)生學(xué)業(yè)成績的高利害性,不利于了解與評價學(xué)生、教師、學(xué)校的綜合發(fā)展?fàn)顩r。
質(zhì)量監(jiān)測的主要功能是診斷,充當(dāng)“醫(yī)生”的角色,為學(xué)校或區(qū)域教育做“體檢”、開處方。傳統(tǒng)考試則是甄別,充當(dāng)“裁判”的角色。這是兩者在目的與功能上的最大不同。
教育質(zhì)量監(jiān)測要真實(shí)地收集學(xué)生、教師和學(xué)校的綜合發(fā)展情況
傳統(tǒng)考試的測查對象是全體學(xué)生,而教育質(zhì)量監(jiān)測是通過統(tǒng)計(jì)抽樣的方法,抽取有代表性的學(xué)生、教師、學(xué)校為樣本,以便有效地獲得受測地區(qū)或?qū)W校的教育發(fā)展?fàn)顩r。
目前,全國很多地方采用全縣(區(qū)、市)學(xué)科選擇、年級選擇進(jìn)行所謂的監(jiān)測,其實(shí)還是傳統(tǒng)的考試。因?yàn)闇y試工具、分析方法還是過去的老傳統(tǒng),測試對象仍是整班,只不過把原來的所有學(xué)科、所有年級變成了某一個或幾個學(xué)科與一個或幾個年級而已。國家實(shí)行監(jiān)測是三年一個周期,樣本的選擇必須科學(xué)性很強(qiáng)。首先按照經(jīng)濟(jì)發(fā)展、人口、民族及社會情況抽取有代表性的樣本縣,然后在樣本縣中按照城市、農(nóng)村、公辦、民辦等因素抽取有代表性的樣本學(xué)校,再在樣本學(xué)校中按照男生、女生、獨(dú)生子女、多子女、漢族、少數(shù)民族、寄宿、非寄宿、城市居住、農(nóng)村居住等多種因素抽取樣本學(xué)生,選擇四年級與八年級學(xué)生。重慶六年的監(jiān)測,也是通過這樣的程序與因素,通過計(jì)算機(jī)自動抽取樣本學(xué)校與學(xué)生、教師等。
在測量工具上,傳統(tǒng)考試強(qiáng)調(diào)對具體知識點(diǎn)及重點(diǎn)內(nèi)容進(jìn)行考查,大部分試卷的編制,均只由當(dāng)?shù)亟萄袉T或?qū)W科教師自行完成,試卷的質(zhì)量有待進(jìn)一步控制,全體考試學(xué)生用一種工具,有時雖然分成A、B卷,也只是兩種試卷的題目順序做了變化,所有題目本身沒有改變。教育質(zhì)量監(jiān)測的測量工具則包括學(xué)業(yè)成就測試與問卷調(diào)查兩部分。具體而言,學(xué)業(yè)成就測試強(qiáng)調(diào)在國家學(xué)科課程標(biāo)準(zhǔn)范圍內(nèi),重點(diǎn)考查學(xué)生綜合運(yùn)用所學(xué)知識解決實(shí)際問題的能力。教育質(zhì)量監(jiān)測要求測試盡可能覆蓋學(xué)科的各知識點(diǎn),因此其考查內(nèi)容較考試更廣,題量更大,為了不加重學(xué)生的答題負(fù)擔(dān),教育質(zhì)量監(jiān)測基于矩陣平衡設(shè)計(jì)技術(shù),通過設(shè)置鉚題,將測驗(yàn)工具拆分成了若干題本進(jìn)行測試,以更為完整、穩(wěn)定地測量學(xué)生的學(xué)業(yè)質(zhì)量。
國際學(xué)生測試項(xiàng)目PISA有21種工具,我們國家教育質(zhì)量監(jiān)測每一個學(xué)科或領(lǐng)域有6種工具。重慶市有小學(xué)語文、小學(xué)數(shù)學(xué)、小學(xué)科學(xué)、小學(xué)英語和中學(xué)語文、中學(xué)數(shù)學(xué)、中學(xué)科學(xué)、中學(xué)英語等,每個學(xué)科6種工具,同時還有與學(xué)科配套的學(xué)生、教師、管理干部、校長、家長調(diào)查問卷若干。研發(fā)一套工具,從目標(biāo)到最終形成需要1-2年時間,重慶市教育評估院研發(fā)這些工具,用了6年時間,上百人的專家團(tuán)隊(duì)開了150多次會議并還在不斷修訂中。與考試的工具相比,這些測試工具有更高的信度與效度。同樣,教育質(zhì)量監(jiān)測調(diào)查問卷的編制也歷經(jīng)了數(shù)個標(biāo)準(zhǔn)化環(huán)節(jié),保證問卷達(dá)到教育測量領(lǐng)域規(guī)定標(biāo)準(zhǔn),以便真實(shí)地收集學(xué)生、教師和學(xué)校的綜合發(fā)展情況。
5年前在重慶市政協(xié)年組的討論會上,一位市領(lǐng)導(dǎo)問:“你們開發(fā)的監(jiān)測體系與考試的最大不同在什么地方?”筆者以考查學(xué)生三角形面積公式這“知識點(diǎn)為例,我們傳統(tǒng)的考試題,基本上是告訴三角形的底邊與高的長度或通過其他條件求出底邊或高,計(jì)算三角形的面積。教師給分點(diǎn)一般分三步:一是寫出三角形面積公式,二是代數(shù)并正確計(jì)算,三是答案。如果是我們的監(jiān)測,它首先是給出一個情景,如幾個同學(xué)到河邊跳繩,繩長有5米,請你圍成一個三角形,計(jì)算三角形的面積。兩者之間差距就很大了,“怎么圍”是學(xué)生解決問題的關(guān)鍵,同時不同的學(xué)生因?yàn)閲姆椒ú灰粯?,結(jié)果不一樣,沒有標(biāo)準(zhǔn)答案。而且對學(xué)生的解答也只有代碼,沒有分?jǐn)?shù)。圍成了三角形是一個代碼,然后能找出底邊和高有正確的思路是另一個代碼,寫出三角形面積公式是一個代碼。市領(lǐng)導(dǎo)與其他政協(xié)委員都知道它們的不同了。
與考試相比,教育質(zhì)量監(jiān)測更全面、更精細(xì),有利于提升教育質(zhì)量
教育質(zhì)量監(jiān)測與考試的另一顯著區(qū)別在于其所采用的數(shù)據(jù)分析方法不同。傳統(tǒng)考試采用分值計(jì)分的方式,直接累加計(jì)算每位學(xué)生在每套試卷上的總分,以此衡量學(xué)生學(xué)業(yè)質(zhì)量的水平。然而,這種分析方法直接依賴于學(xué)生所完成的測驗(yàn)題目,也并未從計(jì)分匕區(qū)分“能力水平較低的學(xué)生答對一道容易的題目,與能力水平較高的學(xué)生答對一道高難度題目”的區(qū)別,因此存在一定的局限性。
教育質(zhì)量監(jiān)測的學(xué)業(yè)成就測驗(yàn)則依據(jù)項(xiàng)目反應(yīng)理論來進(jìn)行統(tǒng)計(jì)與分析,即通過對測驗(yàn)的主客觀題進(jìn)行編碼,對錨題進(jìn)行鏈接,采用項(xiàng)目反應(yīng)模型來估計(jì)每個學(xué)生在該學(xué)科上的能力值,并將其轉(zhuǎn)化為量尺分?jǐn)?shù)來衡量學(xué)生的學(xué)業(yè)水平。同時,教育質(zhì)量監(jiān)測還通過表現(xiàn)水平劃定、量尺分?jǐn)?shù)等值、多層線性模型、增長模型等分析技術(shù),多方面、多角度地反映學(xué)生的學(xué)業(yè)發(fā)展質(zhì)量。此外,教育質(zhì)量監(jiān)測還重在通過描述性分析、均值比較等方法,詳細(xì)描述學(xué)生、教師及學(xué)校在一段時間內(nèi)的綜合發(fā)展全貌,并通過方差分析、相關(guān)分析、回歸分析、聚類分析、結(jié)構(gòu)方程模型等多元統(tǒng)計(jì)分析技術(shù),深入挖掘影響學(xué)生、教師、學(xué)校發(fā)展的關(guān)鍵因素。
與考試只注重呈現(xiàn)學(xué)業(yè)成績的得分及排名不同,教育質(zhì)量監(jiān)測不僅注重從學(xué)業(yè)質(zhì)量、身心健康、興趣愛好、行為習(xí)慣、學(xué)業(yè)負(fù)擔(dān)等方面綜合性地描述與呈現(xiàn)學(xué)生、教師、學(xué)校的發(fā)展?fàn)顩r,而且注重圖文并茂地呈現(xiàn)影響學(xué)生、教師、學(xué)校發(fā)展的關(guān)鍵因素,并基于數(shù)據(jù)結(jié)果,組織專家團(tuán)隊(duì)對癥給出學(xué)生、教師、學(xué)校的改進(jìn)建議。與考試相比,教育質(zhì)量監(jiān)測更全面、更精細(xì),有利于提升教育質(zhì)量。質(zhì)量監(jiān)測不能對個體進(jìn)行評價,只能對群體進(jìn)行評價。