李 波 黃 斌
(南京財(cái)經(jīng)大學(xué)公共管理學(xué)院,南京 210023)
近五年來,教育學(xué)領(lǐng)域正在掀起一股實(shí)證研究浪潮,我國教育實(shí)證研究正處于一個(gè)由量變到質(zhì)變的轉(zhuǎn)折點(diǎn)。以華東師范大學(xué)舉辦的“全國教育實(shí)證研究論壇”為標(biāo)志的教育實(shí)證大會(huì),經(jīng)過五年的持續(xù)組織和推進(jìn),為教育實(shí)證研究學(xué)者營造了良好的交流平臺,極大地促進(jìn)了我國教育科學(xué)事業(yè)的發(fā)展。當(dāng)前我國教育領(lǐng)域?qū)?shí)證研究的重要性已基本達(dá)成共識,教育研究范式逐步轉(zhuǎn)型。但諸多問題也相伴而生,如研究方法的誤用、研究設(shè)計(jì)和步驟不嚴(yán)謹(jǐn)、重參數(shù)估計(jì)而輕統(tǒng)計(jì)檢驗(yàn)、估計(jì)結(jié)果報(bào)告錯(cuò)誤、簡單套用和移植已有研究、調(diào)換數(shù)據(jù)的重新驗(yàn)算和重復(fù)發(fā)表等問題亟待解決。本文以教育生產(chǎn)函數(shù)實(shí)證研究為研究對象,通過對比近五年和以往國內(nèi)外實(shí)證研究,探尋近五年教育生產(chǎn)函數(shù)實(shí)證研究取得的進(jìn)步及存在的問題,并對我國未來教育生產(chǎn)函數(shù)實(shí)證研究進(jìn)行展望。
教育學(xué)將人類教育活動(dòng)作為主要研究內(nèi)容,經(jīng)濟(jì)學(xué)是研究稀缺資源配置的學(xué)科。在教育經(jīng)濟(jì)學(xué)出現(xiàn)以前,經(jīng)濟(jì)學(xué)和教育學(xué)鮮有關(guān)聯(lián)和互動(dòng)。教育生產(chǎn)函數(shù)是將經(jīng)濟(jì)學(xué)和教育學(xué)相融合的完美典范,其依據(jù)微觀經(jīng)濟(jì)學(xué)的廠商理論,通過建立生產(chǎn)函數(shù)來研究各種投入要素對教育產(chǎn)出的影響。教育生產(chǎn)函數(shù)是教育經(jīng)濟(jì)學(xué)這一學(xué)科研究的重點(diǎn)問題,更是破解教育生產(chǎn)“黑箱”的有力工具。Cohn & Geske(1990)在其撰寫的《教育經(jīng)濟(jì)學(xué)》教材中指出:“合理地估計(jì)和解釋教育生產(chǎn)函數(shù)也許是經(jīng)濟(jì)學(xué)家為教育所作的最重要貢獻(xiàn)”。最早的教育生產(chǎn)函數(shù)研究可追溯至1966 年科爾曼報(bào)告。1966 年科爾曼(Coleman)基于美國4000 所學(xué)校64 萬名學(xué)生的大規(guī)模調(diào)查,向美國國會(huì)遞交了《關(guān)于教育機(jī)會(huì)平等性的報(bào)告》(又稱科爾曼報(bào)告)。報(bào)告發(fā)現(xiàn)影響學(xué)生成績最關(guān)鍵的因素不是學(xué)校質(zhì)量、師資水平、學(xué)校設(shè)備等學(xué)校投入,而是與學(xué)生家庭背景相關(guān)的家庭投入。科爾曼報(bào)告對以往學(xué)術(shù)界廣泛認(rèn)同的,學(xué)校對學(xué)生學(xué)業(yè)成績起決定性作用的認(rèn)知形成了重大沖擊,引發(fā)了學(xué)術(shù)界激烈討論。后續(xù)漢納謝克(Hanushek)、克魯格(Krueger)等眾多學(xué)者,通過教育生產(chǎn)函數(shù)尋找學(xué)生學(xué)業(yè)成績的決定因素,并涌現(xiàn)出了大量的研究成果。
本文根據(jù)中國知網(wǎng)和Web of Science 對近五年來教育生產(chǎn)函數(shù)相關(guān)領(lǐng)域研究成果進(jìn)行可視化分析,所檢索數(shù)據(jù)庫包括中文社會(huì)科學(xué)引文索引(Chinese Social Sciences Citation Index,CSSCI)、社會(huì)科學(xué)引文索引(Social Science Citation Index,SSCI)、中文和英文權(quán)威期刊①。
由于教育生產(chǎn)函數(shù)關(guān)注各種教育投入對教育產(chǎn)出的影響,僅以“教育生產(chǎn)函數(shù)”為主題進(jìn)行檢索,會(huì)遺漏大量既有研究成果。本文以“教育生產(chǎn)函數(shù)”“家庭投入”“學(xué)校投入”“課外補(bǔ)習(xí)”“父母參與”“學(xué)校資源”“教師工資”“班級規(guī)?!薄皩W(xué)業(yè)成績”和“實(shí)證研究”等主題進(jìn)行中英文檢索,結(jié)果如圖1 所示。剔除重復(fù)和不相關(guān)文獻(xiàn)發(fā)現(xiàn)2015—2019 年共有SSCI 論文3321 篇,英文權(quán)威論文356 篇;CSSCI論文768 篇,中文權(quán)威論文227 篇。近五年,英文論文數(shù)量保持相對平穩(wěn),SSCI 和英文權(quán)威論文年均發(fā)文量為664 和71 篇。中文論文數(shù)量呈現(xiàn)小幅上漲趨勢,CSSCI 和中文權(quán)威論文由2015 年的139 和37 篇,上升至2019 年172 和57 篇。近五年中文實(shí)證論文發(fā)文量的上升,體現(xiàn)了國內(nèi)教育學(xué)領(lǐng)域?qū)W者對實(shí)證研究的逐漸重視,全國教育實(shí)證研究論壇對我國教育研究范式的轉(zhuǎn)型發(fā)揮了積極的推動(dòng)作用。
圖1 2015—2019 年教育生產(chǎn)函數(shù)實(shí)證研究趨勢圖
通過Web of Science 對近五年英文期刊國家的發(fā)文量進(jìn)行分析,如圖2 所示。近五年在SSCI 和英文權(quán)威期刊發(fā)表中,美國在教育生產(chǎn)函數(shù)研究領(lǐng)域處于世界領(lǐng)先地位,在SSCI 和英文權(quán)威論文數(shù)量上分別為1756 篇和140 篇,具有絕對優(yōu)勢。德國、澳大利亞、中國和英國屬于第二梯隊(duì),SSCI 論文分別為186、180、168 和165 篇;英文權(quán)威論文分別為38、40、25 和33 篇。加拿大、荷蘭、西班牙和意大利屬于第三梯度,發(fā)文數(shù)量相對較少。通過知網(wǎng)對近五年中文期刊的論文資助基金項(xiàng)目分析發(fā)現(xiàn),在CSSCI 和中文權(quán)威期刊中,獲得國家社會(huì)科學(xué)基金項(xiàng)目資助的論文分別為91 篇和31 篇;獲得全國教育科學(xué)規(guī)劃課題資助的論文分別為76 篇和18 篇;獲得國家自然科學(xué)基金資助的論文分別為68 篇和37 篇??傮w上,我國教育生產(chǎn)函數(shù)實(shí)證研究在近五年CSSCI 和中文權(quán)威期刊發(fā)文量上呈現(xiàn)穩(wěn)步上升態(tài)勢,國家級基金資助項(xiàng)目比例逐漸提高。
圖2 2015—2019 年教育生產(chǎn)函數(shù)英文論文主要發(fā)表國家
教育生產(chǎn)函數(shù)與經(jīng)濟(jì)學(xué)中的生產(chǎn)函數(shù)類似,將教育系統(tǒng)類比成企業(yè),把家庭背景、家庭貨幣投入、家庭時(shí)間投入、學(xué)校經(jīng)費(fèi)投入、學(xué)校資源、師資水平、班級規(guī)模等看作教育投入,把學(xué)生學(xué)業(yè)成績、認(rèn)知能力、非認(rèn)知能力、升學(xué)率、受教育年限等看作教育產(chǎn)出。一般類型的教育生產(chǎn)函數(shù)形式可以表示為:Yi ja=f(Xija(F,S,I),eija)。 其中Yi ja為學(xué)生i在j家庭a 年齡段時(shí)的教育產(chǎn)出,一般多以學(xué)生學(xué)業(yè)成績來衡量。eija為函數(shù)殘差項(xiàng),包括所有不可觀測變量和遺漏變量。Xija(F,S,I)表示學(xué)生i在j家庭a 年齡段時(shí)的所有家庭、學(xué)校和學(xué)生個(gè)體特征(例如遺傳稟賦)的投入組合。本文結(jié)合教育生產(chǎn)函數(shù)的一般類型,并參考Todd &Wolpin(2007)和其他學(xué)者相關(guān)研究,將已有文獻(xiàn)中所涉及的教育生產(chǎn)函數(shù)大致分為如下三個(gè)類型。
單期投入型教育生產(chǎn)函數(shù)(Contemporaneous Education Production Function)如式(1)所示,將教育投入和產(chǎn)出看作一個(gè)單期過程,數(shù)據(jù)層面上反映為橫截面數(shù)據(jù)。式中i為學(xué)生個(gè)體代碼,j為家庭代碼,a 為學(xué)生個(gè)體所處年齡段。Xi ja為學(xué)生i在家庭j年齡為a 時(shí)的個(gè)體、家庭和學(xué)??捎^測投入組合。Yi ja為個(gè)體i在j家庭a 年齡段時(shí)學(xué)業(yè)成績。eija為殘差項(xiàng),包括所有遺漏變量、可觀測和不可觀測的前期投入、遺傳基因稟賦和測量誤差。為了得到 ?1的一致估計(jì)量,單期投入型教育生產(chǎn)函數(shù)必須滿足eija與所有投入要素Xi ja不相關(guān),即滿足相互獨(dú)立假設(shè)。
多期投入型教育生產(chǎn)函數(shù)(Cumulative Education Production Function)如式(2)所示。其在單期投入型教育生產(chǎn)函數(shù)式(1)基礎(chǔ)上進(jìn)行擴(kuò)展,加上投入要素的多期滯后項(xiàng)。多期投入型教育生產(chǎn)函數(shù)假設(shè)教育產(chǎn)出的獲得是一個(gè)累積過程,由現(xiàn)在和過去教育投入與孩子基因遺傳稟賦(生命孕育時(shí)決定)相結(jié)合 產(chǎn) 生 的 認(rèn) 知 結(jié) 果。同 樣,為 了 得 到 各 期 ?1、 ?2···?a的 一 致 估 計(jì) 量,eija必 須 與 各 期 投 入 要 素Xi ja、Xi ja?1···Xi j1不相關(guān),即滿足相互獨(dú)立假設(shè)。
當(dāng)數(shù)據(jù)包含前期教育產(chǎn)出而不包含前期教育投入時(shí),常使用增值型教育生產(chǎn)函數(shù)(Value?added Education Production Function)估計(jì)教育投入對教育產(chǎn)出的影響。增值型教育生產(chǎn)函數(shù)認(rèn)為學(xué)業(yè)成績與當(dāng)期學(xué)校和家庭教育投入有關(guān),同時(shí)與前期(基線)學(xué)業(yè)成績相關(guān)。前期學(xué)業(yè)成績會(huì)影響當(dāng)期教育投入,如果方程不控制前期學(xué)業(yè)成績,模型將存在遺漏變量偏誤。增值型教育生產(chǎn)函數(shù)基本形式如式(3)所示。
為了確定增值型模型隱含的假設(shè)和限制條件,在式(3)兩端同時(shí)減去 γYija?1,整理后得到式(4)。
在式中,ei ja?γeija?1滿足
為了得到教育投入對教育產(chǎn)出的一致估計(jì),增值型教育生產(chǎn)函數(shù)需要滿足如下假設(shè)。第一,各期教育投入系數(shù)隨著時(shí)間推移,對產(chǎn)出的影響呈現(xiàn)下降趨勢,且這種下降率對各類教育投入相同,即對于所有j均存在 ?j=γ?j?1;第二,遺漏的教育投入(當(dāng)期和前期)與已包含教育投入、基期考試成績無關(guān);第三,先天稟賦的效應(yīng)系數(shù)下降速率對各類教育投入相等,即 βa=γβa?1; 第四, εija必須序列相關(guān),并且序列相關(guān)程度與投入效應(yīng)的下降率相匹配,才能得到 εija?γεija?1獨(dú)立同分布。如果這一條件不能滿足,則基期學(xué)業(yè)成績Yi ja?1將與其自身測量誤差相關(guān)。
家庭因素對學(xué)生教育產(chǎn)出具有重要影響,大量研究均已證實(shí)弱勢家庭學(xué)生的人力資本具有先天劣勢(Coleman et al.,1966)。盡管世界各國出臺了一系列旨在促進(jìn)入學(xué)機(jī)制公平、縮小區(qū)域間學(xué)校質(zhì)量差異、補(bǔ)償貧困家庭學(xué)生學(xué)費(fèi)等一系列法律和政策,但學(xué)生學(xué)業(yè)成績和家庭背景高度正相關(guān)的狀況尚未改變(Holmlund et al.,2011)。究竟哪些家庭投入真正對學(xué)生教育產(chǎn)出具有顯著影響?本文將現(xiàn)有家庭投入型教育生產(chǎn)函數(shù)實(shí)證研究成果歸納為家庭背景、家庭貨幣投入和家庭時(shí)間投入三大類,分析各類投入存在的內(nèi)生性偏估,就國內(nèi)外相關(guān)研究進(jìn)行綜述,并重點(diǎn)分析五年來我國相關(guān)研究存在的問題。
1. 內(nèi)生性偏估
家庭背景對學(xué)生教育產(chǎn)出的研究,實(shí)證研究最關(guān)鍵的是如何解決內(nèi)生性偏估。關(guān)于家庭收入對學(xué)生教育產(chǎn)出影響的內(nèi)生性問題。第一,遺漏變量問題。家庭收入可能是家庭其他有利特征(父母學(xué)歷、父母職業(yè)、父母社會(huì)關(guān)系、父母能力等)的外在表現(xiàn),無法觀測的家庭因素可能會(huì)引起家庭收入對學(xué)生教育產(chǎn)出的過高估計(jì)(Upward?biased)(Duncan et al.,1998)。第二,關(guān)聯(lián)問題。Dahl & Lochner(2012)認(rèn)為傳統(tǒng)的家庭收入與學(xué)生教育產(chǎn)出的實(shí)證研究,不能從其他無法衡量的家庭情況變化中單獨(dú)識別出家庭收入變化帶來的影響。例如家庭收入增加可能會(huì)因?yàn)榕c之關(guān)聯(lián)的其他家庭環(huán)境惡化(例如家庭收入增加可能是父母兼職或外出打工,導(dǎo)致父母陪伴子女的時(shí)間減少)而阻礙教育產(chǎn)出獲得。
關(guān)于父母學(xué)歷對學(xué)生教育產(chǎn)出影響的內(nèi)生性問題。高學(xué)歷父母一般具有更高的能力,通過遺傳使子女同樣具有較高能力,并最終影響子女教育產(chǎn)出。如果不解決模型的內(nèi)生性問題,普通回歸結(jié)果不僅是父母受教育水平對子女教育產(chǎn)出的影響,還包括諸如父母能力對子女教育產(chǎn)出的影響。目前研究中,主要有三種方法來解決上述內(nèi)生性問題,分別為“雙胞胎數(shù)據(jù)+組內(nèi)差分”“領(lǐng)養(yǎng)數(shù)據(jù)+OLS”和“普通數(shù)據(jù)+IV”。
第一,基于“雙胞胎數(shù)據(jù)+組內(nèi)差分”解決內(nèi)生性問題。雙胞胎數(shù)據(jù)多來自同卵雙胞胎而非異卵雙胞胎。該方法將雙胞胎相同的不可觀測先天能力和成長環(huán)境剔除,用父母學(xué)歷差值對雙胞胎教育產(chǎn)出差值進(jìn)行回歸。在這一過程中,只有父母學(xué)歷不同和子女教育產(chǎn)出不同的雙胞胎才能真正進(jìn)入回歸,如式(6)所示: ?Yic為i家 庭同卵雙胞胎教育產(chǎn)出差值, ?XiP為i家 庭同卵雙胞胎父母學(xué)歷差值, ?μci為i家庭同卵雙胞胎隨機(jī)擾動(dòng)項(xiàng)差值,則 δ1為估計(jì)的父母學(xué)歷對子女教育產(chǎn)出的影響系數(shù)。
第二,基于領(lǐng)養(yǎng)數(shù)據(jù)解決內(nèi)生性問題。將養(yǎng)父母學(xué)歷對領(lǐng)養(yǎng)子女教育產(chǎn)出回歸,可以有效將父母能力等先天不可觀測變量剔除。領(lǐng)養(yǎng)數(shù)據(jù)應(yīng)確保領(lǐng)養(yǎng)過程隨機(jī)。如果領(lǐng)養(yǎng)過程非隨機(jī),領(lǐng)養(yǎng)父母和親生父母之間相關(guān)信息可能高度相關(guān),回歸結(jié)果難以剔除選擇效應(yīng),如式(7)所示:Yiac為領(lǐng)養(yǎng)學(xué)生i的教育產(chǎn)出,Xiap為領(lǐng)養(yǎng)父母受教育水平, μaic為領(lǐng)養(yǎng)學(xué)生隨機(jī)擾動(dòng)項(xiàng),則 δ1為父母學(xué)歷對子女教育產(chǎn)出的影響。
第三,基于工具變量法解決內(nèi)生性問題。部分研究采用教育改革作為工具變量來解決模型內(nèi)生性問題,如式(8)和式(9)的兩階段最小二乘法方程。式(8)為第一階段,REFip j為與父母相關(guān)的工具變量,Xip
j為父母學(xué)歷, α1為 工具變量對父母學(xué)歷影響。式(9)為第二階段,將第一階段Xip j擬合值代入第二階段,得到父母學(xué)歷對學(xué)生教育產(chǎn)出的因果估計(jì),系數(shù)為 δ1IV。
2. 國外實(shí)證研究綜述
當(dāng)前已有大量實(shí)證研究探討了家庭背景與學(xué)生教育產(chǎn)出之間的關(guān)系(Coleman et al.,1966;Ermisch& Francesconi,2001;Dahl & Lochner,2012)。家庭背景包括家庭收入、父母學(xué)歷和父母職業(yè)等。關(guān)于家庭收入的研究,Belley & Lochner(2007)發(fā)現(xiàn)家庭收入與高中學(xué)業(yè)完成率無因果關(guān)系,但對高等教育入學(xué)率有顯著正向關(guān)系。Humlum(2011)基于2000 年P(guān)ISA 數(shù)據(jù)中出生在1984 年的4000 名丹麥學(xué)生,采用單期教育生產(chǎn)函數(shù)和永久收入假設(shè),發(fā)現(xiàn)永久收入增加一個(gè)標(biāo)準(zhǔn)差,閱讀分?jǐn)?shù)增加0.14 個(gè)標(biāo)準(zhǔn)差。早期收入增加一個(gè)標(biāo)準(zhǔn)差(后期收入相對減少),閱讀分?jǐn)?shù)減少0.06 個(gè)標(biāo)準(zhǔn)差。Dahl & Lochner(2012)使用美國所得稅抵免政策的收入支持項(xiàng)目作為工具變量,對NLSY 數(shù)據(jù)中4200 名學(xué)生及父母的面板數(shù)據(jù)進(jìn)行實(shí)證研究,發(fā)現(xiàn)家庭收入每增加1000 美元可使同期學(xué)生數(shù)學(xué)和閱讀測試成績提高0.06 個(gè)標(biāo)準(zhǔn)差,尤其對男生、弱勢群體和低年級學(xué)生的影響更為明顯。
關(guān)于父母學(xué)歷對教育產(chǎn)出的影響,Haveman & Wolfe(1995)認(rèn)為父母學(xué)歷是學(xué)生教育產(chǎn)出中最重要的解釋變量。第一,基于雙胞胎數(shù)據(jù)的研究。采用美國明尼蘇達(dá)州同卵雙胞胎數(shù)據(jù),剔除先天能力和成長環(huán)境等不可觀測變量后,Behrman & Rosenzweig(2002)和Antonovics & Goldberger(2005)均發(fā)現(xiàn)母親學(xué)歷對子女受教育水平幾乎無顯著影響,而父親學(xué)歷有顯著正向影響?;谒箍暗募{維亞(Scandinavia)登記數(shù)據(jù)中的丹麥同卵雙胞胎樣本,Bingley et al. (2009)發(fā)現(xiàn)母親學(xué)歷對9 年級學(xué)生平均學(xué)分績點(diǎn)(Grade Point Average,GPA)成績無顯著影響。父親學(xué)歷對9 年級學(xué)生GPA 有顯著負(fù)向影響,但對受教育年限有顯著正向影響。Haegeland et al. (2010)采用挪威2002—2007 年初中學(xué)生雙胞胎數(shù)據(jù),控制了家庭背景和個(gè)體特征后,發(fā)現(xiàn)父親和母親學(xué)歷對子女學(xué)業(yè)成績均無顯著影響。
第二,基于領(lǐng)養(yǎng)數(shù)據(jù)的實(shí)證研究。Dearden et al. (1997)和Sacerdote(2002)發(fā)現(xiàn)養(yǎng)父母學(xué)歷對子女受教育年限具有顯著正向影響。Plug(2004)發(fā)現(xiàn)養(yǎng)父學(xué)歷對子女受教育年限具有顯著正向影響,但養(yǎng)母學(xué)歷對子女沒有影響。Haegeland et al.(2010)采用挪威2002—2007 年初中學(xué)生領(lǐng)養(yǎng)數(shù)據(jù)得到與Plug(2004)完全相反結(jié)論??刂萍彝ケ尘昂蛡€(gè)體特征后,發(fā)現(xiàn)養(yǎng)母學(xué)歷對子女學(xué)業(yè)成績影響顯著,但估計(jì)系數(shù)很小。養(yǎng)父學(xué)歷對子女學(xué)業(yè)成績無顯著影響。此外,領(lǐng)養(yǎng)數(shù)據(jù)的使用需要額外注意領(lǐng)養(yǎng)過程是否隨機(jī)。如果領(lǐng)養(yǎng)過程隨機(jī),則模型不存在樣本自選擇問題。例如Sacerdote(2007)基于1964—1985 年美籍韓國學(xué)生的隨機(jī)領(lǐng)養(yǎng)數(shù)據(jù),發(fā)現(xiàn)養(yǎng)母學(xué)歷對子女學(xué)業(yè)成績有顯著正向影響,對吸煙和飲酒行為有顯著負(fù)向影響。如果領(lǐng)養(yǎng)不隨機(jī),需要控制親生父母信息。例如,Bj?rklund et al.(2006)通過在方程中額外控制親生父母相關(guān)信息,解決模型因領(lǐng)養(yǎng)過程非隨機(jī)性導(dǎo)致的偏誤,發(fā)現(xiàn)養(yǎng)父母學(xué)歷對子女教育產(chǎn)出有顯著正向影響,且養(yǎng)母影響小于養(yǎng)父。
第三,基于工具變量法的實(shí)證研究。Black et al.(2008)采用1960—1970 年挪威義務(wù)教育法年限延長作為工具變量,發(fā)現(xiàn)父親學(xué)歷對子女受教育年限無影響。母親學(xué)歷對子女受教育年限有顯著正向影響,但影響系數(shù)很小。Oreopoulos(2006)基于美國義務(wù)教育法實(shí)施的不同時(shí)間順序,采用工具變量法發(fā)現(xiàn)高學(xué)歷父母的子女留級概率更低。Oreopoulos et al.(2006)利用二戰(zhàn)退伍軍人數(shù)據(jù),發(fā)現(xiàn)父母受教育年限提高1 年,子女留級概率下降2%—3%。Carneiro et al.(2013)采用家庭到學(xué)校的距離作為工具變量,發(fā)現(xiàn)在子女8 歲時(shí),父母學(xué)歷對子女?dāng)?shù)學(xué)成績具有顯著影響。在子女12—14 歲時(shí),父親學(xué)歷對子女的閱讀能力有顯著影響,但母親學(xué)歷對子女閱讀能力無顯著影響。
3. 國內(nèi)實(shí)證研究綜述
田丹(2017)基于2010—2014 南京市中學(xué)生發(fā)展?fàn)顩r調(diào)查的711 名中學(xué)生數(shù)據(jù),采用OLS 方法發(fā)現(xiàn)高收入父母對高中階段學(xué)生成績有顯著正向影響,對大學(xué)階段學(xué)生無影響。母親的收入和中等收入的父親對高中和大學(xué)階段學(xué)生均具有顯著影響。王甫勤和時(shí)怡雯(2014)采用2010 年上海居民家庭生活狀況調(diào)查數(shù)據(jù),對1181 個(gè)家庭采用Logistic 回歸發(fā)現(xiàn),接受過高等教育的父母對子女上大學(xué)期望較高,能夠更多參與到子女教育過程,為子女創(chuàng)造更多條件支持,進(jìn)而提高子女上大學(xué)概率。李忠路(2016)基于首都大學(xué)生成長追蹤調(diào)查數(shù)據(jù),采用Logistic 回歸發(fā)現(xiàn),父母學(xué)歷和家庭收入對學(xué)生就讀高校類型和學(xué)業(yè)表現(xiàn)有顯著正向影響。李佳麗等人(2016)以2014 年鄭州區(qū)域教育質(zhì)量健康體檢與改進(jìn)提升項(xiàng)目的八年級50461 名學(xué)生為對象,采用OLS 方法發(fā)現(xiàn)父母職業(yè)、父母受教育程度和家庭經(jīng)濟(jì)水平對語數(shù)外標(biāo)準(zhǔn)化考試成績有顯著正向影響。利用Bootstrap 方法對中介效應(yīng)進(jìn)行檢驗(yàn),發(fā)現(xiàn)家庭背景通過影響父母教育期望和課外補(bǔ)習(xí)決策來影響學(xué)生學(xué)業(yè)成績。李忠路和邱澤奇(2016)采用CFPS 2010 年數(shù)據(jù)和OLS 回歸分析發(fā)現(xiàn),父母受教育年限和家庭人均收入對兒童基準(zhǔn)測試平均分有顯著正向影響,并通過多重中介模型發(fā)現(xiàn)家庭社會(huì)經(jīng)濟(jì)地位通過家教服務(wù)、學(xué)校質(zhì)量、學(xué)習(xí)行為和家長參與進(jìn)而影響學(xué)生學(xué)習(xí)成績。
4. 近五年國內(nèi)實(shí)證研究存在的問題
近五年相關(guān)實(shí)證研究,研究者開始逐漸關(guān)注家庭背景對學(xué)生學(xué)業(yè)成績的影響機(jī)制(李佳麗等人,2016;李忠路和邱澤奇,2016),關(guān)于因果識別的研究相對較少,研究可能還存在如下幾點(diǎn)問題。第一,近五年國內(nèi)相關(guān)研究較多采用OLS 回歸分析,而基于領(lǐng)養(yǎng)數(shù)據(jù)、雙胞胎數(shù)據(jù)或工具變量等因果識別方法的研究尚未發(fā)現(xiàn)。孫志軍(2014)使用了雙胞胎數(shù)據(jù)研究了教育收益率,但研究內(nèi)容不屬于教育生產(chǎn)函數(shù)領(lǐng)域。主要原因是領(lǐng)養(yǎng)數(shù)據(jù)或雙胞胎數(shù)據(jù)在國內(nèi)收集較為困難,未來國內(nèi)研究可以通過高等教育擴(kuò)張、義務(wù)教育法實(shí)施等外生沖擊作為工具變量,對父母學(xué)歷和子女學(xué)業(yè)成績進(jìn)行因果關(guān)系分析。第二,較多研究在OLS 回歸方程中沒有控制學(xué)生個(gè)體和學(xué)校特征變量,亦沒有控制班級或?qū)W校固定效應(yīng),模型存在較大的遺漏變量偏誤(王甫勤和時(shí)怡雯,2014;田丹,2017)。部分研究中,家庭背景僅是控制變量,而非研究的主要內(nèi)容(王駿等人,2017)。第三,研究較多采用某市或縣內(nèi)學(xué)校調(diào)查數(shù)據(jù),研究結(jié)論不具有全國代表性。數(shù)據(jù)較多沒有對外公開,研究過程可重復(fù)性較差,研究結(jié)論真實(shí)性有待考驗(yàn)(王甫勤和時(shí)怡雯,2014;田丹,2017)。第四,數(shù)據(jù)使用過于隨意。例如田丹(2017)所使用數(shù)據(jù)中的成績?yōu)閷W(xué)生自報(bào)在班級中的成績排名,但研究對象來自南京市11 所不同中學(xué),學(xué)生成績在學(xué)校間不具有可比性,研究所用數(shù)據(jù)無法滿足研究需要。研究應(yīng)采用區(qū)縣統(tǒng)一標(biāo)準(zhǔn)化命題和統(tǒng)一閱卷的考試成績,才能實(shí)現(xiàn)11 所學(xué)校不同學(xué)生成績之間的可比。
1. 家庭貨幣投入類型
家庭貨幣投入包括學(xué)校內(nèi)家庭貨幣投入和學(xué)校外家庭貨幣投入,其中學(xué)校內(nèi)家庭貨幣投入主要包括學(xué)雜費(fèi)、教材教輔費(fèi)、校服、醫(yī)保和體檢費(fèi)、擇校費(fèi)和食宿費(fèi)等;學(xué)校外家庭貨幣投入主要包括校外補(bǔ)習(xí)費(fèi)、學(xué)習(xí)資料和用品等。魏易(2020)基于2017 年中國教育財(cái)政家庭數(shù)據(jù)發(fā)現(xiàn),中小學(xué)學(xué)生每年家庭教育支出超過1 萬元,占家庭總支出的16%,過去一年參加課外補(bǔ)習(xí)和興趣班的學(xué)生比例為59%。隨著義務(wù)教育免費(fèi)政策的普及和學(xué)校均衡化的推進(jìn),家庭對子女教育投入的差異逐漸從校內(nèi)轉(zhuǎn)為校外(魏易,2020)。鑒于學(xué)校內(nèi)家庭貨幣投入差異較小,相關(guān)研究主要探討學(xué)校外家庭貨幣投入。學(xué)校外家庭貨幣投入主要為購買課外補(bǔ)習(xí)服務(wù),早在2001 年土耳其課外補(bǔ)習(xí)支出就已經(jīng)占GDP 的1.44%,而公立教育支出僅為2%(Tansel & Bircan,2006)。魏易(2020)研究發(fā)現(xiàn)2017 年我國中小學(xué)學(xué)生每年平均課外補(bǔ)習(xí)支出在3000 元以上。校外補(bǔ)習(xí)已然成為市值百億美元的教育產(chǎn)業(yè),下文重點(diǎn)介紹課外補(bǔ)習(xí)對學(xué)生教育產(chǎn)出影響的實(shí)證研究。
2. 內(nèi)生性偏估
實(shí)證研究中,模型設(shè)定需要特別處理課外補(bǔ)習(xí)的內(nèi)生性問題。大量研究均證實(shí)學(xué)生的課外補(bǔ)習(xí)決策非隨機(jī)。第一,課外補(bǔ)習(xí)決策與父母學(xué)歷相關(guān)。父親學(xué)歷(Kim & Park,2010;薛海平,2015;李波,2018b)或母親學(xué)歷(雷萬鵬,2005; Bray et al.,2014;陳彬莉和白曉曦,2015)越高,子女參與補(bǔ)習(xí)的可能性越大。龐曉鵬等人(2017)研究發(fā)現(xiàn)父親學(xué)歷能夠顯著提高子女參與補(bǔ)習(xí)的概率,但母親的影響不顯著。薛海平等人(2014)甚至發(fā)現(xiàn)母親學(xué)歷對子女課外補(bǔ)習(xí)有顯著負(fù)向影響,因?yàn)楦邔W(xué)歷母親對子女學(xué)業(yè)指導(dǎo)替代了對課外補(bǔ)習(xí)的需求。第二,課外補(bǔ)習(xí)決策與家庭收入相關(guān)。家庭收入水平對學(xué)生參與補(bǔ)習(xí)的影響顯著為正(Stevenson & Baker,1992; Liu,2012;李佳麗和胡詠梅,2017;李波,2018b)。但薛海平(2015)、薛海平等人(2014)發(fā)現(xiàn)家庭收入對課外補(bǔ)習(xí)影響并不顯著。第三,課外補(bǔ)習(xí)決策與學(xué)校質(zhì)量相關(guān)。薛海平和丁小浩(2009)發(fā)現(xiàn)就讀學(xué)校質(zhì)量越高、學(xué)習(xí)成績越好的學(xué)生,參與補(bǔ)習(xí)的可能性越高。雷萬鵬(2005)對北京、江蘇、湖北和陜西高中學(xué)生的研究,曾滿超等人(2010)對甘肅、湖南和江蘇高中一年級學(xué)生的研究,Bray et al.(2014)對香港學(xué)生的研究,以及龐曉鵬等人(2017)對陜西榆林農(nóng)村小學(xué)生的研究都表明,就讀于重點(diǎn)學(xué)校、學(xué)業(yè)表現(xiàn)較好的學(xué)生參與課外補(bǔ)習(xí)的可能性更低。學(xué)校質(zhì)量和課外補(bǔ)習(xí)存在替代效應(yīng),學(xué)校師資水平提高,課外補(bǔ)習(xí)支出顯著降低(Dang,2007),生師比高的學(xué)校課外補(bǔ)習(xí)支出更多(Kim & Park,2010)。此外,Bray et al.(2014)發(fā)現(xiàn)在香港家庭,子女?dāng)?shù)量會(huì)對課外補(bǔ)習(xí)支出有顯著負(fù)向影響,研究滿足了資源稀釋理論。
3. 國外實(shí)證研究綜述
為解決課外補(bǔ)習(xí)的內(nèi)生性偏估,在無隨機(jī)實(shí)驗(yàn)數(shù)據(jù)的情況下,研究較多采用兩種方法識別課外補(bǔ)習(xí)與學(xué)業(yè)成績的因果關(guān)系。第一,控制課外補(bǔ)習(xí)的影響因素,例如控制家庭背景、學(xué)生學(xué)習(xí)基礎(chǔ)、學(xué)校質(zhì)量等。但由于調(diào)查數(shù)據(jù)無法涉及上述所有變量的全部信息,故該方法不具有現(xiàn)實(shí)可行性。大量采用此方法的研究僅控制了作者認(rèn)為比較重要的幾個(gè)變量,無法將所有影響因素都控制。Briggs(2001)基于美國1990—1992 年NELS 高中數(shù)據(jù),基于普通最小二乘法發(fā)現(xiàn)課外補(bǔ)習(xí)使得SAT 考試成績提高了14%?15%,其中詞匯成績提高6%?8%,數(shù)學(xué)和英語提高0%—0.6%,閱讀下降0.6%—0.7%。Lee et al.(2004)基于韓國數(shù)據(jù)發(fā)現(xiàn)課外補(bǔ)習(xí)對學(xué)生短期和長期的成績幫助均不大,影響不顯著。Cheo &Quah(2005)發(fā)現(xiàn),課外補(bǔ)習(xí)不僅不能提高成績,反而有不利影響。第二,尋找一個(gè)外生變量,其和課外補(bǔ)習(xí)相關(guān)但和學(xué)業(yè)成績無關(guān),即采用工具變量法。不同研究中工具變量的選擇也不同,例如學(xué)生在兄弟姐妹中的出生順序不同會(huì)導(dǎo)致父母的重視程度和教育投入存在投入差異(Powell & Steelman,1995)。Kang(2007)用學(xué)生在兄弟姐妹中的出生順序作為工具變量,發(fā)現(xiàn)校外補(bǔ)習(xí)投入增加10%,子女學(xué)業(yè)成績提高0.56%。Ono(2007)采用1995 年日本學(xué)生數(shù)據(jù),將當(dāng)?shù)卮髮W(xué)生質(zhì)量作為參加大學(xué)準(zhǔn)備考試補(bǔ)習(xí)的工具變量,發(fā)現(xiàn)課外補(bǔ)習(xí)效果明顯。Choi(2012)使用同伴補(bǔ)習(xí)率、非學(xué)業(yè)型課外補(bǔ)習(xí)費(fèi)用和子女出生順序作為工具變量,發(fā)現(xiàn)課外補(bǔ)習(xí)可以顯著提高學(xué)生的認(rèn)知能力,且年級越低效果越明顯。
4. 國內(nèi)實(shí)證研究綜述
國內(nèi)關(guān)于課外補(bǔ)習(xí)對學(xué)生學(xué)業(yè)成績影響的實(shí)證研究最近幾年才逐漸展開,但發(fā)展迅速。本文根據(jù)實(shí)證方法的識別效果從低到高進(jìn)行排序并綜述,包括OLS、HLM、PSM、RPSM、PSM?DID 和IV 等六種實(shí)證方法。薛海平等人(2014)基于2013 年全國六省市義務(wù)教育階段學(xué)生課后活動(dòng)基線數(shù)據(jù),采用OLS 方法并控制了家庭因素、學(xué)校因素和個(gè)人因素的幾個(gè)主要變量(并沒有控制前期學(xué)習(xí)成績),發(fā)現(xiàn)課外補(bǔ)習(xí)有助于學(xué)校質(zhì)量較高、成績較好的留守兒童縮小其與非留守兒童的成績差異?;诒本┦心呈痉缎猿踔腥w學(xué)生的追蹤調(diào)查數(shù)據(jù),張羽等人(2015)采用多層線性模型(HLM)發(fā)現(xiàn),小學(xué)過早、過多參與數(shù)學(xué)和英語補(bǔ)習(xí)雖然能夠提高學(xué)生升入初中時(shí)的初始成績,但對初中數(shù)學(xué)和英語成績的持續(xù)增長沒有幫助。薛海平(2015)和李波(2018b)使用傾向得分匹配法(PSM)發(fā)現(xiàn),參與補(bǔ)習(xí)以及補(bǔ)習(xí)支出對義務(wù)教育階段學(xué)生的數(shù)學(xué)成績有顯著正影響,但對語文成績影響不顯著。胡詠梅等人(2015)使用再加權(quán)傾向得分匹配法(RPSM)發(fā)現(xiàn),參與數(shù)學(xué)補(bǔ)習(xí)能夠顯著提高學(xué)生數(shù)學(xué)成績。但不同學(xué)科的補(bǔ)習(xí)時(shí)間對數(shù)學(xué)成績的影響不同,科學(xué)補(bǔ)習(xí)與數(shù)學(xué)補(bǔ)習(xí)效果存在“疊加效應(yīng)”,語言補(bǔ)習(xí)與數(shù)學(xué)補(bǔ)習(xí)效果存在“擠出效應(yīng)”。龐曉鵬等人(2017)使用差分傾向得分匹配法(PSM?DID)發(fā)現(xiàn),在中國農(nóng)村地區(qū)參與數(shù)學(xué)補(bǔ)習(xí)降低了數(shù)學(xué)成績,但不具有統(tǒng)計(jì)顯著性??赡苁钦n外補(bǔ)習(xí)方式不當(dāng),補(bǔ)習(xí)教師牟利性動(dòng)機(jī)等原因?qū)е?。Zhang(2013)將學(xué)生五個(gè)好朋友參與補(bǔ)習(xí)的比重、離家最近補(bǔ)習(xí)機(jī)構(gòu)與家的距離作為工具變量,基于增值模型,研究發(fā)現(xiàn)課外補(bǔ)習(xí)對來自薄弱學(xué)?;虺煽冚^差的城市學(xué)生產(chǎn)生了顯著的正向影響。
5. 近五年國內(nèi)實(shí)證研究存在的問題
近五年課外補(bǔ)習(xí)效果的實(shí)證研究中,逐漸出現(xiàn)了PSM、RPSM、PSM?DID 和IV 等多種識別方法。實(shí)證研究取得了長足進(jìn)步,模型和方法選擇上更加科學(xué),但可能還存在如下問題。第一,受到數(shù)據(jù)的限制,許多研究沒有使用增值模型(張羽等人,2015;薛海平,2015;胡詠梅等人,2015;李佳麗等人,2016)。由于課外補(bǔ)習(xí)投入是流量,學(xué)業(yè)成績是存量,不控制學(xué)生初始學(xué)業(yè)水平,會(huì)給估計(jì)結(jié)果帶來嚴(yán)重的遺漏變量偏誤,甚至產(chǎn)生錯(cuò)誤結(jié)論(例如學(xué)習(xí)差的學(xué)生參加課外補(bǔ)習(xí),而不是參加課外補(bǔ)習(xí)導(dǎo)致學(xué)習(xí)差。不采用增值模型會(huì)得到課外補(bǔ)習(xí)導(dǎo)致學(xué)習(xí)變差的因果顛倒結(jié)論)。第二,為得到課外補(bǔ)習(xí)對學(xué)生學(xué)業(yè)表現(xiàn)影響的一致估計(jì)量,一些研究采用PSM 方法(薛海平,2015;李波,2018b),但該方法在本質(zhì)上只是加權(quán)的OLS,僅能解決由樣本選擇偏差帶來的內(nèi)生性問題,無法糾正由遺漏重要解釋變量帶來的內(nèi)生性偏誤。第三,盡管劉騰堯和王晴(2018)、張雪和張磊(2017)使用IV 來糾正遺漏重要解釋變量偏誤,但I(xiàn)V 的測量誤差可能比課外補(bǔ)習(xí)變量本身更大,潛在的弱工具變量可能帶來更大的估計(jì)偏誤。此外,劉騰堯和王晴(2018)雖然解決了個(gè)體層面的內(nèi)生性問題,但并沒有通過加入固定效應(yīng)項(xiàng)控制班級和學(xué)校層面內(nèi)生性偏誤,僅控制部分班級和學(xué)校特征。第四,在衡量學(xué)業(yè)表現(xiàn)時(shí),一些研究采用看似更加科學(xué)的國際通用認(rèn)知測試得分(龐曉鵬等人,2017),但以此評估課外補(bǔ)習(xí)效果并不全面。因?yàn)橐詰?yīng)試為目的的課外補(bǔ)習(xí)并不旨在提高學(xué)生的認(rèn)知水平,而是提高學(xué)生考試成績。還有一些研究使用學(xué)業(yè)成績自評等級(薛海平,2015),這種衡量方法主觀性強(qiáng),測量誤差大。
家庭時(shí)間投入是區(qū)別于貨幣投入的另一種重要的家庭投入類型。Guryan et al.(2008)基于2003—2006 年美國勞工統(tǒng)計(jì)局實(shí)施的美國時(shí)間使用調(diào)查,對21—55 歲的22693 名父母的研究發(fā)現(xiàn),母親每周對孩子時(shí)間投入為13.96 小時(shí),父親為6.81 小時(shí)。Gracia & Ghysels(2017)發(fā)現(xiàn),在比利時(shí)、丹麥、西班牙和英國母親在工作日每天對孩子的平均時(shí)間投入分別為82、77、64 和61 分鐘,周末分別為96、93、66 和64 分鐘。關(guān)于中國父母對孩子的時(shí)間投入,Zhao(2018)基于2004 年、2006 年、2009 年和2011 年中國健康和營養(yǎng)調(diào)查數(shù)據(jù)發(fā)現(xiàn),父親和母親平均每周在子女身上的時(shí)間投入分別為13.53 和27.15 小時(shí)。出生在1965—1972 年、1973—1980 年和1981—1989 年的父親每周在子女身上的時(shí)間投入分別為9.41、17.63 和14.84 小時(shí),母親分別為10.13、21.90 和32.84 小時(shí)。母親對子女的時(shí)間投入更多為孩子的衣食起居,父親更多為輔導(dǎo)學(xué)習(xí)和玩耍。
1. 家庭時(shí)間投入的內(nèi)容
在教育生產(chǎn)函數(shù)實(shí)證研究領(lǐng)域,學(xué)者更加關(guān)注父母在子女教育上的時(shí)間投入,且更加關(guān)注時(shí)間投入的具體事情或內(nèi)容,并稱之為父母卷入或父母參與(parental involvement)。愛普斯坦(Epstein,1990)將父母在子女教育上的時(shí)間投入根據(jù)行為劃分為:交流與溝通,即父母和孩子交流學(xué)校生活和煩惱;志愿參與活動(dòng),即父母和孩子共同參加校內(nèi)、校外活動(dòng);家庭學(xué)習(xí),即父母指導(dǎo)孩子功課、檢查家庭作業(yè)和探討學(xué)習(xí)方法等;決策制定,即父母以代表的方式對學(xué)校教育計(jì)劃、資金募集、發(fā)展方向等決策提供建議;社會(huì)合作,即父母有效發(fā)揮社區(qū)資源應(yīng)用于學(xué)校教育。Sui?Chu & Willms(1996)將父母在子女教育上的時(shí)間投入分為四類,分別包括:家庭討論、家庭督導(dǎo)、學(xué)校聯(lián)系和學(xué)校參與。李波(2018a)將父母在子女教育上的時(shí)間投入按內(nèi)容和行為劃分為五類,分別包括親子交流、親子活動(dòng)、親子閱讀、作業(yè)督導(dǎo)和家?;?dòng)。作業(yè)督導(dǎo)為父母檢查子女家庭作業(yè),指導(dǎo)其功課;親子閱讀為父母和子女一起讀書或讀書給子女聽;親子交流為父母和子女交流學(xué)校發(fā)生的事情、與同學(xué)和老師的關(guān)系、心事和學(xué)習(xí)上的煩惱;親子活動(dòng)為父母帶子女參觀博物館、圖書館、動(dòng)物園、科技館,觀看演唱會(huì)、電影等文化活動(dòng);家校聯(lián)系為父母參加學(xué)校家長會(huì),或主動(dòng)聯(lián)系老師交流學(xué)生學(xué)校表現(xiàn)。
2. 內(nèi)生性偏估
在實(shí)證研究中要想精確識別父母在作業(yè)督導(dǎo)、親子閱讀、親子活動(dòng)、親子交流和家校互動(dòng)等時(shí)間上的投入是否能夠提高子女的教育產(chǎn)出,首先要確定父母時(shí)間投入是否隨機(jī),其是否會(huì)因家庭收入、父母學(xué)歷、家庭子女?dāng)?shù)量的不同而存在群體差異。拉魯(Lareau,1987)根據(jù)貧困文化理論指出,窮人因?yàn)樨毨Ф诰幼〉确矫婢哂歇?dú)特性,在這種環(huán)境熏陶下的父母并不能意識到教育的重要性,且不相信教育是改變階層命運(yùn)的有效手段和主要途徑。相較于上層家庭,貧困家庭在子女教育上的時(shí)間投入相對較少,主要是因?yàn)閷ψ优慕逃谕桓撸ˋnderson & Minke,2007)。家庭收入較低會(huì)直接導(dǎo)致父母情緒低落,間接導(dǎo)致父母對子女教育缺乏耐心和關(guān)注,家庭教育過程缺乏自信、方式也不科學(xué)(Guryan et al,2008),甚至將生活和婚姻的不滿發(fā)泄到子女身上,出現(xiàn)打罵甚至虐待的現(xiàn)象。Sebastian et al.(2016)發(fā)現(xiàn)擁有大學(xué)及以上學(xué)歷的母親更了解子女在學(xué)校的表現(xiàn),與學(xué)校任課教師交流也更為頻繁。Boonk et al.(2018)通過元分析發(fā)現(xiàn),高學(xué)歷家長在子女的教育過程中,認(rèn)為父母和學(xué)校是平等的,具有同樣重要的地位。家庭子女?dāng)?shù)量能夠直接影響父母對每一個(gè)孩子時(shí)間投入上的多寡。Zedan(2012)發(fā)現(xiàn)子女?dāng)?shù)量和父母在子女教育上的時(shí)間投入之間存在顯著的負(fù)相關(guān),即孩子數(shù)量越多,每個(gè)孩子得到父母的時(shí)間投入越少。
3. 國外實(shí)證研究綜述
關(guān)于父母作業(yè)督導(dǎo)對子女成績影響,研究結(jié)論莫衷一是。Finn(1998)采用增值模型的多元回歸發(fā)現(xiàn)作業(yè)督導(dǎo)對子女學(xué)業(yè)成績有顯著正向影響;Singh et al.(1995)使用相關(guān)分析發(fā)現(xiàn)作業(yè)督導(dǎo)對學(xué)業(yè)成績有顯著負(fù)向影響;Perna & Titus(2005)發(fā)現(xiàn)父母和學(xué)生之間的交流行為能夠明顯提高學(xué)生考上大學(xué)的概率,但父母指導(dǎo)和檢查孩子作業(yè)則無顯著影響。Patall et al.(2008)發(fā)現(xiàn),在小學(xué)階段作業(yè)督導(dǎo)能夠明顯提高子女的學(xué)業(yè)表現(xiàn),但在中學(xué)階段會(huì)顯著降低子女的學(xué)業(yè)表現(xiàn)。Wilder(2014)指出中學(xué)生正處于青春期,更加渴望獨(dú)立和自主,內(nèi)心對父母作業(yè)檢查和指導(dǎo)行為存在排斥心理,導(dǎo)致作業(yè)督導(dǎo)降低子女學(xué)習(xí)成績。Xu et al.(2010)對五年級學(xué)生研究發(fā)現(xiàn),父母給子女布置過多作業(yè),不利于子女自主學(xué)習(xí)能力發(fā)展。關(guān)于親子交流對子女學(xué)業(yè)成績的影響,McNeal & Ralph(2012)使用國家教育追蹤數(shù)據(jù)發(fā)現(xiàn),親子交流比其余類型父母時(shí)間投入對子女的影響更大。Yan & Lin(2005)發(fā)現(xiàn),學(xué)業(yè)成績優(yōu)秀的學(xué)生,其父母更了解孩子朋友和小伙伴的情況。關(guān)于親子活動(dòng)對子女學(xué)業(yè)成績影響,Heymann & Earle(2000)發(fā)現(xiàn),經(jīng)常帶子女參加博物館、圖書館、音樂會(huì)和動(dòng)物園等活動(dòng)能提高學(xué)生學(xué)習(xí)成績。關(guān)于父母參加家長會(huì)或?qū)W校活動(dòng)的研究,大量基于單期投入型教育生產(chǎn)函數(shù)的研究肯定了家長與學(xué)校之間具有良好的溝通渠道有助于子女的學(xué)業(yè)發(fā)展(Xu et al,2010)。然而追蹤數(shù)據(jù),通過控制前測學(xué)業(yè)成績的增值模型發(fā)現(xiàn)父母參加學(xué)?;顒?dòng)和子女學(xué)業(yè)成績之間并無必然因果關(guān)系(Park & Holloway,2017)。Morgan &Todd(2009)利用NCES 數(shù)據(jù),發(fā)現(xiàn)父母參加家長會(huì)可以通過影響學(xué)校決策或教師教學(xué)模式,間接影響學(xué)校所有學(xué)生學(xué)習(xí)成績,對自己子女的私人收益較小,對校級外部性收益更大。
4. 國內(nèi)實(shí)證研究綜述
國內(nèi)相關(guān)實(shí)證研究起步較晚,研究較多集中在近十年內(nèi)。趙延?xùn)|和洪巖璧(2012)基于2009 年全國青少年科技素養(yǎng)調(diào)查數(shù)據(jù),對20 個(gè)省市61 個(gè)小學(xué)班和57 個(gè)中學(xué)班采用OLS 方法發(fā)現(xiàn),父母的時(shí)間投入對學(xué)生成績有積極影響。但父母指導(dǎo)子女學(xué)習(xí)、改正錯(cuò)題、檢查作業(yè)干擾了子女的正常學(xué)習(xí)過程,會(huì)對子女學(xué)業(yè)成績產(chǎn)生消極作用,老師也無法及時(shí)從學(xué)生的家庭作業(yè)中發(fā)現(xiàn)學(xué)生學(xué)習(xí)上存在的問題。李佳麗(2017)基于CEPS 2012 年數(shù)據(jù),采用HLM 方法發(fā)現(xiàn),父母生活陪伴和與學(xué)校老師交流可以顯著提高子女的認(rèn)知能力。但是親子交流、作業(yè)督導(dǎo)對認(rèn)知能力無顯著影響,并指出作業(yè)督導(dǎo)對子女學(xué)業(yè)成績負(fù)向影響可能和父母教育子女的方法不正確有關(guān)。雖然有些父母對子女作業(yè)督導(dǎo)的時(shí)間投入很多,但沒有正確的教育方法,而是單純增加時(shí)間反而會(huì)占用本屬于學(xué)生的學(xué)習(xí)時(shí)間,產(chǎn)生擠出效應(yīng)。郭筱琳等人(2017)基于山東聊城384 名小學(xué)生調(diào)查數(shù)據(jù),采用HLM 方法發(fā)現(xiàn),當(dāng)學(xué)生自我效能感和教育期望較高時(shí),父母時(shí)間投入對學(xué)業(yè)成績有負(fù)向影響;當(dāng)學(xué)生學(xué)業(yè)自我效能感較高但教育期望較低時(shí),父母時(shí)間投入對學(xué)業(yè)成績具有正向影響;當(dāng)學(xué)生學(xué)業(yè)自我效能感較低時(shí),無論其教育期望高低,父母時(shí)間投入對學(xué)業(yè)成績無影響。李波(2018a)基于北京市三個(gè)區(qū)縣的調(diào)查數(shù)據(jù),采用增值模型和PSM 方法發(fā)現(xiàn),親子閱讀、親子活動(dòng)和親子交流對學(xué)生期末考試總成績有顯著正向影響,其中親子交流影響效果最大。但作業(yè)督導(dǎo)和家?;?dòng)對成績影響不顯著。此外,通過中介效應(yīng)分析發(fā)現(xiàn),親子閱讀、親子活動(dòng)和親子交流能夠促進(jìn)諸如學(xué)生的自尊、自我控制、學(xué)校適應(yīng)、合作、人際交往和領(lǐng)導(dǎo)力等非認(rèn)知能力,進(jìn)而提高學(xué)生學(xué)業(yè)成績。
5. 近五年國內(nèi)實(shí)證研究存在的問題
近五年,關(guān)于父母時(shí)間投入的研究更注重實(shí)證方法和影響機(jī)制的探討,但可能還存在如下三個(gè)問題。第一,尚未發(fā)現(xiàn)旨在解決模型內(nèi)生性問題的實(shí)證研究(李佳麗,2017;郭筱琳等人,2017;李波,2018a)。父母在子女教育上的時(shí)間投入非隨機(jī),不同家庭背景父母之間存在群體差異。由于調(diào)查研究無法獲取所有既與父母時(shí)間投入相關(guān)又和學(xué)生學(xué)習(xí)成績相關(guān)的變量信息,僅采用一般的相關(guān)分析或OLS 方法無法獲得家庭時(shí)間投入對學(xué)生教育產(chǎn)出的因果效應(yīng)。雖然有些研究在模型中控制了部分家庭、學(xué)校和個(gè)體特征,但可能會(huì)存在遺漏變量問題。第二,家庭時(shí)間投入并不直接作用于教育生產(chǎn)過程,其究竟是如何影響學(xué)業(yè)成績,相關(guān)研究探討較少(李佳麗,2017;郭筱琳等人,2017),影響機(jī)制和路徑仍是未知的“黑箱”。第三,面板數(shù)據(jù)或增值模型的使用相對較少,這樣會(huì)導(dǎo)致逆向選擇問題(郭筱琳等人,2017)。例如以父母作業(yè)督導(dǎo)對子女學(xué)業(yè)成績的影響為例,較多研究發(fā)現(xiàn)父母作業(yè)督導(dǎo)對子女學(xué)業(yè)成績不僅沒有促進(jìn)作用,反而降低了子女學(xué)業(yè)成績。上述結(jié)論可能很大程度上和模型沒有控制前期學(xué)習(xí)成績而導(dǎo)致的逆向選擇有關(guān)(學(xué)生學(xué)習(xí)成績差會(huì)導(dǎo)致父母作業(yè)督導(dǎo),而不是父母作業(yè)督導(dǎo)會(huì)導(dǎo)致學(xué)生學(xué)習(xí)成績差),相關(guān)實(shí)證研究結(jié)論混淆了因果。
世界各國對學(xué)校進(jìn)行了大量經(jīng)費(fèi)投入,那么為學(xué)校“花錢有用嗎(Does money matter)”?教育經(jīng)濟(jì)學(xué)的一個(gè)經(jīng)典議題就是探討學(xué)校資源和學(xué)生學(xué)業(yè)成績之間的因果關(guān)系,其對教育政策制定和教育經(jīng)費(fèi)投入發(fā)揮了重要的政策價(jià)值。1966 年《科爾曼》報(bào)告指出學(xué)生學(xué)業(yè)成績之間的差異更多來自家庭背景而非學(xué)校投入,自此涌現(xiàn)出了大量關(guān)于學(xué)校對學(xué)生學(xué)業(yè)成績影響的研究(Glewwe et al.,2011),尤其以漢納謝克(Hanushek)和赫吉斯(Hedges)雙方之間關(guān)于學(xué)校投入是否有效的長期爭論更是將教育生產(chǎn)函數(shù)研究推向高潮。漢納謝克(Hanushek,1989,1997,2003)的系列研究對四十年的教育生產(chǎn)函數(shù)研究成果進(jìn)行再分析,并指出學(xué)校投入并不能提高學(xué)生學(xué)業(yè)成績。但赫吉斯等(Hedges et al.,1994)基于漢納謝克的187 項(xiàng)研究資料發(fā)現(xiàn),學(xué)校資源可以提高學(xué)生的學(xué)業(yè)成績。本文基于現(xiàn)有學(xué)校投入型教育生產(chǎn)函數(shù)的研究成果,將其劃分為四類,包括:重點(diǎn)學(xué)校與學(xué)生教育產(chǎn)出、學(xué)校經(jīng)費(fèi)投入與學(xué)生教育產(chǎn)出、教師投入與學(xué)生教育產(chǎn)出、班級規(guī)模與學(xué)生教育產(chǎn)出。
世界上眾多國家都設(shè)有重點(diǎn)學(xué)校,一般被稱為磁石學(xué)校(Magnet School)、貴族學(xué)校(Elite School)、精英學(xué)校(Selective School)、特許學(xué)校(Charter School)或文法學(xué)校(Grammar School)等,主要通過隨機(jī)派位、就近入學(xué)、擇?;蚍?jǐn)?shù)錄取等方法招生。我國重點(diǎn)校政策由來已久,1962 年教育部《關(guān)于有重點(diǎn)地辦好一批全日制中、小學(xué)校的通知》,明確規(guī)定要求各地選取一批重點(diǎn)中小學(xué)。1978 年教育部《關(guān)于辦好一批重點(diǎn)中小學(xué)的試行方案》,指出全國重點(diǎn)中小學(xué)形成“小金字塔”結(jié)構(gòu),同時(shí)在經(jīng)費(fèi)投入、辦學(xué)條件、師資隊(duì)伍、學(xué)生來源等方面向重點(diǎn)學(xué)校傾斜,并最終形成國家級、省級、地級、縣級的重點(diǎn)學(xué)?!皩訉又攸c(diǎn)”的格局。在這個(gè)歷史背景下,重點(diǎn)校得到了大力的發(fā)展,但一些弊端也逐步顯現(xiàn),學(xué)校之間差距越來越大。在這一背景下,國家2006 年修訂施行的《中華人民共和國義務(wù)教育法》第22 條規(guī)定:“縮小學(xué)校之間辦學(xué)條件的差距,不得將學(xué)校分為重點(diǎn)學(xué)校和非重點(diǎn)學(xué)校,學(xué)校不得分設(shè)重點(diǎn)班和非重點(diǎn)班”。雖然法律有明確規(guī)定,但地方仍然普遍存在“喬裝打扮,偷梁換柱”的現(xiàn)象,大力舉辦“示范?!薄皩?shí)驗(yàn)班”,重點(diǎn)學(xué)校實(shí)際上是“名亡實(shí)存”。
1. 內(nèi)生性偏估
要識別重點(diǎn)學(xué)校對學(xué)生學(xué)業(yè)成績影響,較為簡單的方法就是比較重點(diǎn)學(xué)校和非重點(diǎn)學(xué)校學(xué)生在學(xué)業(yè)成績上的差異,但可行的前提條件是進(jìn)入重點(diǎn)學(xué)校是隨機(jī)的。大量研究已證實(shí)進(jìn)入重點(diǎn)學(xué)校的過程非隨機(jī),重點(diǎn)學(xué)校學(xué)生在家庭背景和個(gè)人能力上存在顯著差異(Clark,2010;王駿和孫志軍,2015)。高中教育階段,重點(diǎn)高中錄取分?jǐn)?shù)線較高,其會(huì)根據(jù)學(xué)生的中考成績選擇能力較強(qiáng)的學(xué)生入學(xué),重點(diǎn)高中和學(xué)生能力高度相關(guān)。義務(wù)教育階段,小學(xué)和初中均實(shí)行就近入學(xué)政策,學(xué)生要想進(jìn)入重點(diǎn)小學(xué)和初中必須購買高昂的學(xué)區(qū)房,因此重點(diǎn)中小學(xué)和學(xué)生的家庭背景高度相關(guān)。除了上述正規(guī)的通過考試和就近入學(xué)的方式,還有很多學(xué)生通過擇校的方式進(jìn)入重點(diǎn)學(xué)校,例如以錢擇校、以權(quán)擇校、以社會(huì)關(guān)系擇校等(王善邁,2008)。因此,學(xué)生會(huì)根據(jù)不可觀測的特征選擇學(xué)校,而這些不可觀測特征又會(huì)反過來影響學(xué)生的學(xué)業(yè)成績,這種自選擇帶來的內(nèi)生性問題會(huì)導(dǎo)致OLS 估計(jì)結(jié)果出現(xiàn)偏差。
2. 國外實(shí)證研究綜述
國外研究中,本文重點(diǎn)介紹采用因果識別的研究成果,實(shí)證方法包括隨機(jī)派位、工具變量和斷點(diǎn)回歸法。第一,采用隨機(jī)派位的研究。Cullen et al.(2006)基于芝加哥公立學(xué)校的隨機(jī)派位制度,發(fā)現(xiàn)對于那些贏得派位(Win Lotteries)的學(xué)生比那些未被抽中(Lose Lotteries)的學(xué)生能獲得更高的學(xué)業(yè)成績,并且更加自律,犯罪率也更低。Dobbie & Fryer(2011)基于Harlem Children Zone 重點(diǎn)學(xué)校計(jì)劃,采用隨機(jī)派位和工具變量兩種方法均發(fā)現(xiàn)重點(diǎn)中學(xué)對學(xué)生學(xué)業(yè)成績有顯著正向影響,并可以縮小白人和黑人學(xué)生在數(shù)學(xué)成績上的差異。Abdulkadiro?lu et al.(2011)利用美國波士頓州的學(xué)校供不應(yīng)求或招生名額已滿的情況下,采用隨機(jī)派位或搖號的方式分配學(xué)生入學(xué)的政策構(gòu)造準(zhǔn)實(shí)驗(yàn),發(fā)現(xiàn)重點(diǎn)學(xué)校對初中和高中學(xué)生成績有顯著的正向影響。第二,采用工具變量的研究。Cullen et al.,(2005)以芝加哥公立學(xué)校60623 名學(xué)生為研究對象,采用OLS 回歸發(fā)現(xiàn)重點(diǎn)學(xué)校對學(xué)生學(xué)業(yè)成績有顯著正向影響。但采用學(xué)生家庭距離最近重點(diǎn)學(xué)校的距離為工具變量,發(fā)現(xiàn)重點(diǎn)學(xué)校對學(xué)生學(xué)習(xí)成績無顯著影響。Clark(2010)基于英國初中學(xué)校的數(shù)據(jù),采用學(xué)生小學(xué)成績預(yù)測的學(xué)生進(jìn)入重點(diǎn)學(xué)校的概率作為工具變量,發(fā)現(xiàn)重點(diǎn)學(xué)校對學(xué)生學(xué)習(xí)成績幾乎沒有影響,但可以提高學(xué)生未來大學(xué)錄取率。因此,研究指出重點(diǎn)高中對學(xué)生短期教育產(chǎn)出沒有影響,但長期具有顯著影響。第三,采用斷點(diǎn)回歸的研究。Pop?Eleches & Urquiola(2013)基于羅馬尼亞初中考試入學(xué)錄取線制度,構(gòu)建了約2000 個(gè)斷點(diǎn),發(fā)現(xiàn)重點(diǎn)學(xué)校可以提高學(xué)生的學(xué)業(yè)成績,但是對學(xué)生的非認(rèn)知能力有顯著的負(fù)向影響,學(xué)生感覺自己能力有限,且被邊緣化。此外,研究還發(fā)現(xiàn)進(jìn)入重點(diǎn)學(xué)校降低了母親自身對子女教育的投入程度。
3. 國內(nèi)實(shí)證研究綜述
在國內(nèi)研究中,大量實(shí)證研究較多采用HLM 或OLS 方法。馬曉強(qiáng)等人(2006)基于保定市的高中數(shù)據(jù),采用迭代廣義最小二乘法(IGLS)發(fā)現(xiàn)學(xué)生高考成績的60%—80%差異是由學(xué)校間質(zhì)量差異導(dǎo)致。胡詠梅和杜育紅(2008)基于西部五省農(nóng)村小學(xué)數(shù)據(jù),采用HLM 方法發(fā)現(xiàn)學(xué)校質(zhì)量的提高可以促進(jìn)學(xué)生的學(xué)業(yè)成績。丁延慶和薛海平(2009)基于2006 年昆明市高中調(diào)查數(shù)據(jù),采用HLM 方法發(fā)現(xiàn),學(xué)校對學(xué)生的學(xué)業(yè)成績影響較小,學(xué)生成績更多由自身能力和前期學(xué)習(xí)成績決定。唐俊超(2015)采用CGSS 2008 年數(shù)據(jù),利用Logistic 回歸發(fā)現(xiàn)進(jìn)入重點(diǎn)學(xué)校對學(xué)生升學(xué)概率有顯著正向影響,且影響效果隨著小學(xué)升初中、初中升高中和高中升大學(xué)而逐漸變大。薛海平(2015)基于CFPS 2012 年數(shù)據(jù),采用PSM 方法發(fā)現(xiàn)重點(diǎn)學(xué)校能夠顯著提高學(xué)生的數(shù)學(xué)和英語成績。王駿等人(2017)基于我國某市高中數(shù)據(jù),采用HLM 方法發(fā)現(xiàn)重點(diǎn)高中能夠顯著提高學(xué)生的學(xué)業(yè)成績。謝桂華和張陽陽(2018)基于CEPS 數(shù)據(jù)中的認(rèn)知能力代替學(xué)業(yè)成績,控制個(gè)人和家庭等各因素采用HLM 方法,發(fā)現(xiàn)學(xué)校質(zhì)量對學(xué)生學(xué)業(yè)成績具有顯著正向影響。進(jìn)一步控制學(xué)生2013—2014 年前測認(rèn)知能力,采用增值模型發(fā)現(xiàn)學(xué)校質(zhì)量對學(xué)生成績的影響由顯著變?yōu)椴伙@著。國內(nèi)解決內(nèi)生性的研究很少,且均采用錄取線制度構(gòu)造斷點(diǎn)回歸設(shè)計(jì)。Dee & Lan(2015)基于內(nèi)蒙古教育局的行政數(shù)據(jù),涉及2006?2008 年12 所高中的14245 名學(xué)生,發(fā)現(xiàn)成績高于重點(diǎn)高中錄取分?jǐn)?shù)線可以提高學(xué)生進(jìn)入重點(diǎn)高中的概率,據(jù)此采用模糊斷點(diǎn)回歸發(fā)現(xiàn)進(jìn)入重點(diǎn)高中對學(xué)生成績無顯著影響。王駿和孫志軍(2015)基于F 縣2009—2010 屆17 所高中(4 所重點(diǎn)高中)7660 名畢業(yè)生數(shù)據(jù),采用斷點(diǎn)回歸設(shè)計(jì)發(fā)現(xiàn),重點(diǎn)高中可以微弱提高理科生的高考數(shù)學(xué)、語文和總成績,但對文科生高考成績無顯著影響。
4. 近五年國內(nèi)實(shí)證研究存在的問題
近五年來,相關(guān)研究逐漸從OLS、HLM 方法過渡到采用準(zhǔn)實(shí)驗(yàn)的研究設(shè)計(jì),但可能還存在如下幾點(diǎn)問題。第一,大量研究無法識別學(xué)校與學(xué)生教育產(chǎn)出之間的因果關(guān)系(唐俊超,2015;王駿等人,2017;謝桂華和張陽陽,2018),基于工具變量和斷點(diǎn)回歸的研究設(shè)計(jì)相對較少。第二,采用多層線性模型和多元線性回歸的研究中,采用控制學(xué)校投入變量的研究居多(唐俊超,2015;王駿等人,2017)。但是影響學(xué)校質(zhì)量的因素很多,上述變量并不能控制學(xué)校的全部影響因素。有些難以觀測的學(xué)校因素可能對教育產(chǎn)出有一定影響,模型可能存在遺漏變量偏誤。第三,謝桂華和張陽陽(2018)采用認(rèn)知能力代替學(xué)業(yè)成績,研究結(jié)論可靠性存疑。作者采用2014 年認(rèn)知能力作為前測成績,研究重點(diǎn)學(xué)校對2015 年學(xué)生認(rèn)知增值的影響。但認(rèn)知能力與學(xué)業(yè)成績不同,很難在一年之內(nèi)發(fā)生改變,認(rèn)知能力數(shù)據(jù)很難滿足研究需要。第四,薛海平(2015)雖然采用PSM 方法解決樣本自選擇問題,但PSM 方法僅針對可觀測變量的匹配,無法克服不可觀測變量給估計(jì)結(jié)果帶來的偏誤。學(xué)生成績?yōu)榧议L自報(bào)的優(yōu)良中差等級,而非考試分?jǐn)?shù),數(shù)據(jù)過于主觀,研究也沒有使用增值模型。第四,基于斷點(diǎn)回歸設(shè)計(jì)的研究(王駿和孫志軍,2015;Dee & Lan,2015),只是分析了重點(diǎn)高中是否有效,并沒有進(jìn)一步探討重點(diǎn)高中的哪些投入有效。研究對象僅為斷點(diǎn)附近的學(xué)生,研究結(jié)論的外部有效性存疑。
1. 內(nèi)生性偏估
關(guān)于學(xué)校經(jīng)費(fèi)投入對學(xué)生學(xué)業(yè)成績的影響,基于不同的數(shù)據(jù)和實(shí)證方法會(huì)得到不同研究結(jié)論,其中很重要的原因是如何處理估計(jì)過程中的內(nèi)生性問題(Goldhaber & Brewer,1997)。教育生產(chǎn)函數(shù)框架試圖控制其他變量,來估計(jì)增加教育經(jīng)費(fèi)投入的平均效應(yīng)。但由于學(xué)校、家庭、地區(qū)經(jīng)濟(jì)發(fā)展水平、財(cái)政收入等不可觀測因素和學(xué)校經(jīng)費(fèi)投入以及學(xué)生教育產(chǎn)出相關(guān),很難通過調(diào)查數(shù)據(jù)獲取所有信息。例如,政府可能會(huì)將經(jīng)費(fèi)支出重點(diǎn)放在成績不佳的學(xué)?;蛘呷雽W(xué)率極低的學(xué)校,或者富裕的父母可能會(huì)把孩子轉(zhuǎn)到生均支出較高的學(xué)校。學(xué)校經(jīng)費(fèi)投入和家庭教育支出之間可能存在替代或互補(bǔ)的關(guān)系,例如段義德(2018)發(fā)現(xiàn)教育財(cái)政支出可以通過“擴(kuò)張效應(yīng)”和“補(bǔ)償效應(yīng)”影響家庭教育投入決策;袁誠等人(2013)發(fā)現(xiàn)政府教育支出對于家庭教育總支出、義務(wù)教育學(xué)雜費(fèi)和家教費(fèi)有著明顯的“替代效應(yīng)”。
2. 國外實(shí)證研究綜述
國外研究中,Hanushek(2003)對65 篇相關(guān)研究進(jìn)行綜述,發(fā)現(xiàn)僅13 篇顯示生均經(jīng)費(fèi)支出對學(xué)生成績有顯著正向影響,3 篇為負(fù)向影響,49 篇無影響。本文根據(jù)研究采用的實(shí)證方法進(jìn)行綜述,包括固定效應(yīng)、增值型、工具變量法等。第一,固定效應(yīng)的研究。Ram(2004)基于1997 年的美國教育統(tǒng)計(jì)文摘數(shù)據(jù),發(fā)現(xiàn)學(xué)校生均經(jīng)費(fèi)對學(xué)生SAT 分?jǐn)?shù)有顯著正向影響,且對數(shù)學(xué)成績影響要大于語言成績。同時(shí)為了控制各州的不可觀測因素影響,研究更進(jìn)一步控制州的固定效應(yīng),發(fā)現(xiàn)學(xué)校生均經(jīng)費(fèi)對學(xué)生學(xué)業(yè)成績的影響減弱但依然顯著。第二,增值型教育生產(chǎn)函數(shù)研究。Holmlund et al.(2010)使用2001—2006年英國國家學(xué)生數(shù)據(jù)庫,將學(xué)生7 歲時(shí)考試總成績(包括英語、數(shù)學(xué)和科學(xué))作為前測成績,11 歲時(shí)總成績作為當(dāng)期成績,采用增值模型發(fā)現(xiàn)學(xué)校生均經(jīng)費(fèi)支出增加1000 英鎊,將使英語、數(shù)學(xué)和科學(xué)的標(biāo)準(zhǔn)化分?jǐn)?shù)分別提高0.04、0.05 和0.05 個(gè)標(biāo)準(zhǔn)差。對處于經(jīng)濟(jì)弱勢的學(xué)生(看其能否獲得學(xué)校的免費(fèi)午餐),生均經(jīng)費(fèi)支出增加1000 英鎊,數(shù)學(xué)、英語和科學(xué)的成績將會(huì)提高0.06、0.07 和0.07 個(gè)標(biāo)準(zhǔn)差。第三,基于工具變量法的研究。Roy(2011)使用1990—2001 年密歇根教育部數(shù)據(jù)庫數(shù)據(jù),研究學(xué)校財(cái)政改革(其旨在加大對貧窮區(qū)域?qū)W校的援助,同時(shí)對富裕地區(qū)學(xué)校的支出加以限制)是否能夠減少各區(qū)間學(xué)校經(jīng)費(fèi)支出差距及其對學(xué)生學(xué)業(yè)成績的影響。作者使用政府規(guī)定的基礎(chǔ)津貼作為工具變量,發(fā)現(xiàn)學(xué)校生均經(jīng)費(fèi)支出每增加1000 美元,低生均經(jīng)費(fèi)支出地區(qū)的學(xué)生閱讀成績增加0.2—0.4 個(gè)標(biāo)準(zhǔn)差,數(shù)學(xué)成績增加0.4—0.55 個(gè)標(biāo)準(zhǔn)差,但是對大學(xué)預(yù)科考試ACT 的參與率和成績沒有影響。
3. 國內(nèi)實(shí)證研究綜述
國內(nèi)相關(guān)研究中,胡詠梅和杜育紅(2008)采用西部地區(qū)5 省區(qū)農(nóng)村初級中學(xué)的較大樣本調(diào)查數(shù)據(jù),采用HLM 方法發(fā)現(xiàn),生均事業(yè)費(fèi)、生均公用經(jīng)費(fèi)與學(xué)生學(xué)習(xí)成績呈現(xiàn)負(fù)向關(guān)系,并指出可能的原因是現(xiàn)行教師工資制度沒有真正反映教師績效,公用經(jīng)費(fèi)被人員經(jīng)費(fèi)擠占。丁延慶和薛海平(2009)基于2006 年昆明市公辦學(xué)校的調(diào)查數(shù)據(jù),以中考成績?yōu)榍捌诳荚嚦煽儯呖汲煽優(yōu)楫?dāng)期考試成績,采用增值模型和HLM 方法發(fā)現(xiàn)學(xué)校生均公用經(jīng)費(fèi)對學(xué)生高考成績有顯著影響。學(xué)校生均公用經(jīng)費(fèi)每提高100 元,學(xué)生高考成績提高大約3 分。李祥云和魏萍(2014)基于2012 年對某市郊縣30 所小學(xué)三年級和五年級學(xué)生的調(diào)查數(shù)據(jù),選取全縣統(tǒng)一考試成績作為教育產(chǎn)出,采用HLM 方法發(fā)現(xiàn)學(xué)校生均公用經(jīng)費(fèi)對學(xué)生語文和數(shù)學(xué)成績均具有顯著影響,同時(shí)較高的學(xué)校經(jīng)費(fèi)支出可以弱化因父母職業(yè)、母親受教育水平和家庭收入不同導(dǎo)致的學(xué)生數(shù)學(xué)成績差異。因此,對家庭背景普遍較差的學(xué)校加大財(cái)政投入,可以縮小學(xué)生因家庭背景不同導(dǎo)致的學(xué)生成績上的差異,促進(jìn)教育結(jié)果公平。李祥云和張建順(2018)基于湖北省70 所小學(xué)數(shù)據(jù),采用相關(guān)分析法發(fā)現(xiàn)生均公用經(jīng)費(fèi)與學(xué)生期末語文和數(shù)學(xué)成績顯著正相關(guān),但是相關(guān)系數(shù)小于教師質(zhì)量與成績之間的關(guān)系。陳純槿和郅庭瑾(2017)基于CEPS 2013—2014 年基線數(shù)據(jù),同時(shí)采用“縣區(qū)受訪學(xué)校初中生人數(shù)對數(shù)”和“外縣區(qū)學(xué)生是否也有生均經(jīng)費(fèi)”作為工具變量,在控制了學(xué)生家庭背景和學(xué)校特征的情況下發(fā)現(xiàn),生均公用經(jīng)費(fèi)對學(xué)生標(biāo)準(zhǔn)化測試成績的影響呈現(xiàn)倒“U”型結(jié)構(gòu)。生均公用經(jīng)費(fèi)的正向效應(yīng)在經(jīng)濟(jì)發(fā)展水平較低的農(nóng)村更加顯著,且生均公用經(jīng)費(fèi)的提高顯著降低了家庭經(jīng)濟(jì)收入對學(xué)生學(xué)業(yè)成績的影響。
4. 近五年國內(nèi)實(shí)證研究存在的問題
近五年實(shí)證研究方法經(jīng)歷了從單期教育生產(chǎn)函數(shù)和HLM 方法、增值模型和HLM 方法發(fā)展到近兩年的工具變量法,但研究可能還存在如下幾點(diǎn)問題。第一,使用學(xué)生成績作為衡量教育經(jīng)費(fèi)投入的目的及效果還有待商榷,越來越多的證據(jù)表明,關(guān)注考試分?jǐn)?shù)的影響可能會(huì)忽略一系列更廣泛長期結(jié)果的重要影響(Heckman et al.,2013)。第二,部分研究無法識別學(xué)校經(jīng)費(fèi)投入對學(xué)生學(xué)業(yè)成績影響的因果效應(yīng)。例如李祥云和張建順(2018)采用的僅是相關(guān)分析法,沒有對其他相關(guān)影響變量加以控制,研究結(jié)論僅能證明學(xué)校生均經(jīng)費(fèi)投入與學(xué)生學(xué)業(yè)成績之間存在相關(guān)關(guān)系。第三,選擇固定效應(yīng)模型的研究相對較少。例如李祥云和魏萍(2014)關(guān)于生均公用經(jīng)費(fèi)等學(xué)校資源對區(qū)縣標(biāo)準(zhǔn)化語文和數(shù)學(xué)成績影響的研究中,僅控制了師生比例、高級教師比例、生均固定資產(chǎn)、生均圖書冊數(shù)和學(xué)校規(guī)模等。但研究不同學(xué)校間生均經(jīng)費(fèi)等學(xué)校資源對學(xué)生學(xué)業(yè)成績的影響,不應(yīng)控制學(xué)校特征,而應(yīng)控制區(qū)縣特征,例如區(qū)縣經(jīng)濟(jì)發(fā)展水平、財(cái)政收入和財(cái)政支出等。如果區(qū)縣層面數(shù)據(jù)不易獲取,可以直接控制區(qū)縣固定效應(yīng),相較于控制區(qū)縣特征效果更好。
1. 內(nèi)生性偏估
在實(shí)證模型設(shè)定之前,最重要的是分析教師投入在班級或?qū)W生中是否隨機(jī)。大量研究已證實(shí)教師投入與家庭、學(xué)校和班級相關(guān)。第一,教師投入水平與學(xué)生家庭背景相關(guān),擁有較高社會(huì)經(jīng)濟(jì)地位的家庭會(huì)更大概率選擇師資力量較強(qiáng)的學(xué)校。楊東平(2005)基于北京、蘇州、寧波等10 個(gè)城市的調(diào)查,發(fā)現(xiàn)強(qiáng)勢家庭(高級和中級管理人員、技術(shù)人員)學(xué)生近60%在師資雄厚的重點(diǎn)學(xué)校讀書,而弱勢家庭則剛好相反,近60%學(xué)生就讀于非重點(diǎn)學(xué)校。第二,教師投入與學(xué)校質(zhì)量相關(guān)。學(xué)校和教師之間存在雙向選擇關(guān)系,優(yōu)質(zhì)學(xué)校會(huì)聘請高質(zhì)量的老師,同樣優(yōu)秀教師會(huì)選擇優(yōu)質(zhì)學(xué)校就職進(jìn)而獲取更高的工資(Britton & Vignoles,2017)。第三,學(xué)校會(huì)根據(jù)學(xué)生的考試成績或能力,將不同學(xué)習(xí)水平的學(xué)生放在不同的班級,并配上不同質(zhì)量的教師,優(yōu)秀教師最終被分配到重點(diǎn)班的概率較大(Clotfelter et al.,2007;Rothstein,2010)。
2. 國外實(shí)證研究綜述
鑒于實(shí)證模型的內(nèi)生性問題,國外較多實(shí)證研究采用了增值模型,并控制學(xué)生家庭背景和學(xué)校固定效應(yīng)。Clotfelter et al.(2007)基于1995—2004 年3—5 年級學(xué)生數(shù)據(jù),發(fā)現(xiàn)教師學(xué)歷和教齡對學(xué)生學(xué)業(yè)成績有顯著正向影響,尤其對數(shù)學(xué)成績影響最大。Rivkin et al.(2005)使用教師和學(xué)生信息的得克薩斯州大樣本行政數(shù)據(jù),數(shù)據(jù)包括1993—1995 年四年級60 萬名來自近一萬所公立學(xué)校的學(xué)生,并獲取了學(xué)生從三年級到七年級所有考試成績。研究基于多期投入型教育生產(chǎn)函數(shù)和校內(nèi)固定效應(yīng),發(fā)現(xiàn)教師質(zhì)量對學(xué)生閱讀和數(shù)學(xué)成績有顯著正向影響。Kane et al.(2008)使用來自紐約公立學(xué)校的數(shù)據(jù)基于增值模型發(fā)現(xiàn),認(rèn)證教師對學(xué)生數(shù)學(xué)成績的影響比國際教師顯著高0.02 個(gè)標(biāo)準(zhǔn)差,對語文成績的影響比教員顯著高0.01 個(gè)標(biāo)準(zhǔn)差。Britton & Propper(2016)采用增值模型并控制了學(xué)生特征之后,發(fā)現(xiàn)英國過去五年教師工資變化對學(xué)業(yè)成績有顯著正向影響,但影響系數(shù)較小。教師工資上漲10%,學(xué)生學(xué)業(yè)成績提高約2%。
關(guān)于教師績效工資的研究,Lavy(2009)對以色列1999?2001 年高中采用實(shí)驗(yàn)研究設(shè)計(jì),發(fā)現(xiàn)教師績效工資可以提高學(xué)生數(shù)學(xué)和英語成績,并能提高學(xué)生考試通過率。鑒于實(shí)驗(yàn)學(xué)校非隨機(jī)分配,文章又使用斷點(diǎn)回歸和雙重差分進(jìn)行檢驗(yàn),發(fā)現(xiàn)結(jié)論穩(wěn)健。Woessmann(2011)使用經(jīng)合組織國家教育系統(tǒng)數(shù)據(jù)和2003 年P(guān)ISA 數(shù)據(jù),以28 個(gè)國家的19000 名學(xué)生為對象,在對學(xué)生、學(xué)校和國家背景進(jìn)行嚴(yán)格控制后,發(fā)現(xiàn)采用績效工資國家學(xué)生在PISA 數(shù)學(xué)測試中分?jǐn)?shù)比平均分高出24.8%。Fryer(2013)在紐約市200 多所公立學(xué)校進(jìn)行隨機(jī)績效工資實(shí)驗(yàn),教師績效工資被設(shè)計(jì)為取決于其所在團(tuán)體的整體表現(xiàn),研究并未發(fā)現(xiàn)教師激勵(lì)能夠提高學(xué)生學(xué)業(yè)成績。后續(xù)學(xué)者對Fryer(2013)的研究提出質(zhì)疑,Goodman &Turner(2013)認(rèn)為團(tuán)體激勵(lì)會(huì)導(dǎo)致搭便車行為;Neal(2011)指出如果目標(biāo)太容易或太難,教師可能不會(huì)做出最佳反應(yīng)。Fryer et al.(2012)發(fā)現(xiàn)教師被罰款而不是獎(jiǎng)勵(lì)效果更明顯。Balch & Springer(2015)基于奧斯汀獨(dú)立學(xué)院教師績效工資項(xiàng)目(該項(xiàng)目用于招聘、發(fā)展、留住教師),通過比較參與和未參與學(xué)校學(xué)生成績,發(fā)現(xiàn)教師績效工資對學(xué)生成績產(chǎn)生顯著正向影響。
3. 國內(nèi)實(shí)證研究綜述
國內(nèi)研究中,王駿等人(2017)以某市6 個(gè)區(qū)縣17373 名高中生為研究對象,以中考成績?yōu)榍皽y成績,高中會(huì)考成績?yōu)楫?dāng)期成績。通過增值模型和HLM 方法,發(fā)現(xiàn)教師學(xué)歷對高中會(huì)考理科、文科和總成績均有顯著正向影響,教師職稱僅對文科成績有顯著正向影響。胡詠梅和杜育紅(2008)基于西部地區(qū)5 省區(qū)農(nóng)村初級中學(xué)數(shù)據(jù),采用兩水平線性模型發(fā)現(xiàn),少數(shù)民族專任教師比例、專任教師任職資格比例對學(xué)生學(xué)業(yè)成績有顯著正向影響。胡詠梅和盧珂(2010)基于西部地區(qū)基礎(chǔ)教育發(fā)展數(shù)據(jù),采用影響力評價(jià)的倍差法,發(fā)現(xiàn)具有任職資格的教師和骨干教師對學(xué)生學(xué)業(yè)成績有顯著正向影響。梁文艷和杜育紅(2011)基于西部地區(qū)基礎(chǔ)教育發(fā)展項(xiàng)目監(jiān)測調(diào)查數(shù)據(jù),采用增值模型和兩水平線性模型發(fā)現(xiàn),中國西部農(nóng)村地區(qū)的小學(xué)教師在學(xué)生學(xué)業(yè)發(fā)展中發(fā)揮著關(guān)鍵作用,教師差異是造成學(xué)生學(xué)業(yè)發(fā)展不均衡的重要因素。
國內(nèi)關(guān)于教師工資對學(xué)生學(xué)業(yè)成績影響的實(shí)證研究起步較晚,且多采用的是非實(shí)驗(yàn)數(shù)據(jù)。丁延慶和薛海平(2009)采用增值模型和多層線性模型,發(fā)現(xiàn)高三教師平均月收入對學(xué)生高考成績無顯著影響。王駿等人(2017)發(fā)現(xiàn)教師工資對學(xué)生高中會(huì)考理科和文科成績均無顯著影響。師均培訓(xùn)費(fèi)對學(xué)生理科成績有顯著正向影響,但對文科成績影響不顯著。薛海平和王蓉(2016)以中國農(nóng)村義務(wù)教育狀況調(diào)查數(shù)據(jù)的299 所學(xué)校為對象,采用多層線性模型發(fā)現(xiàn),教師個(gè)人績效獎(jiǎng)金和集體績效獎(jiǎng)金對學(xué)生成績均有顯著影響,但集體績效獎(jiǎng)金影響更大。集體績效獎(jiǎng)金中,班級績效獎(jiǎng)金影響最大。常芳等人(2018)利用西北農(nóng)村地區(qū)350 名數(shù)學(xué)老師和10784 名學(xué)生數(shù)據(jù),對教師進(jìn)行了基于學(xué)生成績“絕對值”“增加值”和“增加值百分位”的績效激勵(lì)隨機(jī)干預(yù)實(shí)驗(yàn)。發(fā)現(xiàn)對老師進(jìn)行增加值百分位的激勵(lì)方式能夠促進(jìn)老師改變教學(xué)行為,將學(xué)生的學(xué)業(yè)表現(xiàn)分別提高0.10 和0.15 個(gè)標(biāo)準(zhǔn)差,尤其是對成績較差的學(xué)生激勵(lì)效果更加明顯。
4. 近五年國內(nèi)實(shí)證研究存在的問題
近五年國內(nèi)研究逐漸從教師工資轉(zhuǎn)變?yōu)榻處熆冃ЧべY的探討,也出現(xiàn)了隨機(jī)干預(yù)實(shí)驗(yàn)的研究。但實(shí)證研究可能還存在如下問題:第一,較多研究無法從教師努力獲取的績效工資中剔除出教師質(zhì)量(教師學(xué)歷和教師職稱)的疊加影響,無法識別因果(薛海平和王蓉,2016;王駿等人,2017)?;陔S機(jī)干預(yù)實(shí)驗(yàn)設(shè)計(jì)探討教師績效工資對學(xué)生學(xué)業(yè)成績影響的研究相對較少,通過中國知網(wǎng)檢索僅發(fā)現(xiàn)一篇,即常芳等人(2018)采用的陜西榆林市和甘肅天水市16 個(gè)縣216 所學(xué)校的實(shí)驗(yàn)。第二,研究采用的績效工資更多是以學(xué)校或教研組為單位的“平均主義”,無法完全調(diào)動(dòng)教師積極性(王駿等人,2017)。鑒于績效工資沒有真正做到“多勞多得,優(yōu)績優(yōu)酬”的特點(diǎn),存在教師搭便車行為,這導(dǎo)致研究過程中無法精確識別績效工資對學(xué)生學(xué)業(yè)成績的影響。第三,有些研究沒有采用增值模型,且數(shù)據(jù)使用存在一定問題。例如薛海平和王蓉(2016)采用2016 年的績效工資研究2017 年考試成績。一般而言,績效工資具有滯后性,2016 年績效工資更大概率是由于教師在2015 或2016 年的教學(xué)工作優(yōu)秀、學(xué)生考試成績優(yōu)異而發(fā)的獎(jiǎng)金,顯然和2017 年學(xué)生考試成績無直接關(guān)系。第四,薛海平和王蓉(2016)的研究在沒有證明績效工資與學(xué)生前期成績之間不相關(guān)的情況下,沒有采用增值模型進(jìn)行研究。精確的識別策略應(yīng)是,識別績效工資實(shí)施給學(xué)生成績帶來的增值而非絕對值。
教育經(jīng)濟(jì)學(xué)研究的一個(gè)重點(diǎn)問題是確定科學(xué)合理的班級規(guī)模,使其既能確保教學(xué)質(zhì)量又不過度增加財(cái)政負(fù)擔(dān)(Glass & Smith,1979)。美國二戰(zhàn)以后由于嬰兒潮的發(fā)生,學(xué)齡人口急劇增加,使班級規(guī)模隨之增加。其推行了一系列班級規(guī)??s減政策,包括美國田納西州生師比成績項(xiàng)目(STAR)、威斯康辛州學(xué)生成績保障項(xiàng)目(SAGE)、加利福尼亞州班級規(guī)模縮減項(xiàng)目(GSR)。Hanushek(2003)指出在1955—1985 年間,85%的教育經(jīng)費(fèi)增長是由于班級規(guī)??s減政策造成的。在我國,《2017 年全面改善貧困地區(qū)義務(wù)教育薄弱學(xué)?;巨k學(xué)條件工作專項(xiàng)督導(dǎo)報(bào)告》顯示,2017 年全國義務(wù)教育階段學(xué)校有66 人以上的超大班額班級8.6 萬個(gè),占全國總班數(shù)的2.4%。56—66 人的大班額班級36.8 萬個(gè),占全國總班數(shù)的10.1%,且大部分集中在中西部縣鎮(zhèn)?!秶鴦?wù)院關(guān)于統(tǒng)籌推進(jìn)縣域內(nèi)城鄉(xiāng)義務(wù)教育一體化改革發(fā)展的若干意見》要求2018 年基本消除66 人以上的超大班額,2020 年消除56 人以上的大班額。
1. 內(nèi)生性偏估
班級規(guī)模對學(xué)生學(xué)業(yè)成績影響的研究需注意班級規(guī)模的非隨機(jī)性,其主要體現(xiàn)在如下四個(gè)方面。第一,測量誤差。研究人員可能很難獲取每個(gè)學(xué)生所在班級的班級規(guī)模,而更多的是學(xué)生所在學(xué)校的平均班級規(guī)模,其可能會(huì)高估班級規(guī)模對學(xué)業(yè)成績的影響(Hanushek,1996)。第二,班級規(guī)??赡芘c學(xué)生家庭背景相關(guān)。二者可能正相關(guān),例如家庭條件較好的父母可能更愿意將子女送進(jìn)小班。二者也可能負(fù)相關(guān),例如家庭條件好的父母可能將子女送入重點(diǎn)學(xué)校,而重點(diǎn)學(xué)校受市場青睞,導(dǎo)致學(xué)生數(shù)量多,進(jìn)而可能存在大班。第三,班級規(guī)??赡芘c學(xué)生學(xué)習(xí)基礎(chǔ)相關(guān)。二者可能正相關(guān),對于補(bǔ)償式教育的學(xué)??赡軐⒊煽冚^差的學(xué)生分配到小班。二者也可能負(fù)相關(guān),對于精英式教學(xué)的學(xué)??赡軐⒒A(chǔ)較好的學(xué)生分配到小班。第四,班級規(guī)??赡芘c學(xué)校其他投入相關(guān)。二者可能正相關(guān),經(jīng)費(fèi)充足的學(xué)校有更多經(jīng)費(fèi)去支持小班教學(xué),而這些學(xué)校在其他資源(如設(shè)備、教師工資)上可能也更具優(yōu)勢。二者可能負(fù)相關(guān),學(xué)??赡軐⒏嗟慕?jīng)費(fèi)用于小班教學(xué),而降低對學(xué)校其他資源的經(jīng)費(fèi)投入,進(jìn)而產(chǎn)生擠出效應(yīng)。
2. 國外實(shí)證研究綜述
鑒于班級規(guī)模非隨機(jī),單期投入型教育生產(chǎn)函數(shù)無法克服內(nèi)生性和自選擇問題。Rockoff(2009)對文獻(xiàn)回顧發(fā)現(xiàn),班級規(guī)模對學(xué)業(yè)成績的影響不確定。其發(fā)現(xiàn)1950?1970 年的研究主要基于大規(guī)模數(shù)據(jù)和統(tǒng)計(jì)分析,之后的研究主要使用隨機(jī)控制實(shí)驗(yàn)和準(zhǔn)實(shí)驗(yàn)等更加嚴(yán)謹(jǐn)?shù)囊蚬茢喾椒?。下文主要綜述基于因果識別的研究,包括四種研究范式。第一,利用班級規(guī)模限制,構(gòu)建斷點(diǎn)回歸的研究(Angrist &Lavy,1999;Fredriksson et al.,2016)。Angrist & Lavy(1999)使用以色列小學(xué)國家測試項(xiàng)目數(shù)據(jù),基于猶太教義形成的班額政策②,采用斷點(diǎn)回歸法發(fā)現(xiàn)縮減班級規(guī)模對五年級學(xué)生閱讀和數(shù)學(xué)成績有顯著正向影響,對四年級學(xué)生閱讀成績有微弱影響,但對三年級學(xué)生成績無影響。第二,利用學(xué)齡人口變動(dòng),構(gòu)建自然實(shí)驗(yàn)的研究(Hoxby,2000;Woessmann & West,2006;Leuven et al.,2008)。例如,Hoxby(2000)利用美國康涅狄格州649 所小學(xué)各年級人口的縱向變化作為外生工具變量,發(fā)現(xiàn)班級規(guī)模和學(xué)生成績之間并無因果關(guān)系。第三,利用政策實(shí)施前后的面板數(shù)據(jù),采用差分法消除不隨時(shí)間變化的不可觀測因素。Dearden et al.(2002)使用英國國家兒童發(fā)展追蹤數(shù)據(jù),其追蹤1958 年出生的組群,獲取了從教育階段到進(jìn)入勞動(dòng)力市場的豐富數(shù)據(jù)。通過面板數(shù)據(jù)控制了能力和家庭背景后發(fā)現(xiàn),班級規(guī)模對學(xué)生成績無顯著影響。第四,隨機(jī)控制實(shí)驗(yàn),使學(xué)生的班級規(guī)模隨機(jī)。例如,在田納西州STAR 實(shí)驗(yàn)中,個(gè)體被隨機(jī)分到小班(15—17 人),普通班(22—55 人)或從幼兒園到三年級有助手的普通班。Schanzenbach(2006)發(fā)現(xiàn)減少班級規(guī)模能夠提高成績。Krueger(1998)發(fā)現(xiàn)參加小班提高閱讀和數(shù)學(xué)測試分?jǐn)?shù)0.20—0.28 個(gè)標(biāo)準(zhǔn)差,并且對低齡兒童、黑人學(xué)生和來自貧困家庭的孩子影響最為明顯。也有研究發(fā)現(xiàn)STAR 影響長期存在,小班化的學(xué)生在高中畢業(yè)、降低少女早孕、大學(xué)入學(xué)等方面表現(xiàn)更好(Chetty et al.,2011;Schanzenbach,2014)。
3. 國內(nèi)實(shí)證研究綜述
國內(nèi)研究中,多基于單期投入型教育生產(chǎn)函數(shù),研究結(jié)論也不一致。有的研究發(fā)現(xiàn)班級規(guī)模正向影響學(xué)生學(xué)業(yè)成績(胡詠梅和杜育紅,2008;唐一鵬,2014;胡詠梅等人,2015;王駿等人,2017;),負(fù)向影響(薛海平和閔維方,2008;孫志軍等人,2009;丁延慶和薛海平,2009),無影響(胡詠梅和杜育紅,2009;孫志軍等人,2009;袁玉芝,2016),存在異質(zhì)性(史耀波和趙欣欣,2016;崔盛和吳秋翔,2019)。第一,基于OLS 的研究。孫志軍等人(2009)采用甘肅省20 個(gè)縣小學(xué)數(shù)據(jù)發(fā)現(xiàn)班級規(guī)模對小學(xué)生數(shù)學(xué)成績無影響,但對語文成績有顯著負(fù)向影響。崔盛和吳秋翔(2019)基于CEPS 數(shù)據(jù)以初中一年級及其追蹤數(shù)據(jù)為樣本,控制基期學(xué)業(yè)能力及相關(guān)變量,采用增值模型發(fā)現(xiàn)班級規(guī)模對學(xué)業(yè)能力的影響在不同行政區(qū)域、學(xué)校布局和家庭選擇間存在異質(zhì)性。第二,基于HLM 的研究。胡詠梅和杜育紅(2008)采用西部五省農(nóng)村初中數(shù)據(jù),發(fā)現(xiàn)生師比對初中生學(xué)業(yè)成績有顯著正向影響。胡詠梅和杜育紅(2009)發(fā)現(xiàn),班級規(guī)模對小學(xué)生學(xué)業(yè)成績無顯著影響。王駿等人(2017)采用增值模型發(fā)現(xiàn)班級規(guī)模對學(xué)生高中會(huì)考文科成績和理科成績均有顯著正向影響。鄭琦和楊釙(2018)采用2015 年P(guān)ISA 數(shù)據(jù),通過泛精確匹配消除不同規(guī)模班級學(xué)生在個(gè)體和家庭特征上的不平衡,發(fā)現(xiàn)初中的班級規(guī)模和成績存在非線性關(guān)系。高中的班級規(guī)模越大,成績越好。
4. 近五年國內(nèi)實(shí)證研究存在的問題
近五年來,國內(nèi)相關(guān)研究已有一定研究成果,但還可能存在如下幾點(diǎn)不足。第一,專門研究班級規(guī)模的實(shí)證研究僅發(fā)現(xiàn)兩篇(鄭琦和楊釙2018,崔盛和吳秋翔,2019)。在其他相關(guān)研究中班級規(guī)模僅是控制變量,并不是文章研究的重點(diǎn),故沒有考慮班級規(guī)模的內(nèi)生性問題。第二,崔盛和吳秋翔(2019)采用CEPS 中的認(rèn)知能力代替學(xué)業(yè)能力,控制2013—2014 年認(rèn)知能力,分析2013—2014 年班級規(guī)模對2014—2015 年學(xué)生認(rèn)知能力的影響。該研究用認(rèn)知能力代替學(xué)業(yè)能力可能欠妥。學(xué)業(yè)能力在一年內(nèi)可能很容易發(fā)生改變,但認(rèn)知能力很難在一年內(nèi)發(fā)生改變,尤其是當(dāng)改變認(rèn)知能力的因素是班級規(guī)模時(shí)就更難以令人信服(CEPS 數(shù)據(jù)使用手冊中已指出,認(rèn)知能力測試試題不包括學(xué)習(xí)課程所教授的具體識記性知識,而是測量學(xué)生邏輯思維和問題解決能力)。第三,鄭琦和楊釙(2018)用大量篇幅闡述了班級規(guī)??赡芎图彝ケ尘昂蛯W(xué)生特征相關(guān),因此采用泛匹配法解決樣本內(nèi)生性問題。但是該研究遺漏了一個(gè)最重要變量,即學(xué)生的前期學(xué)習(xí)成績,沒有采用增值模型導(dǎo)致的偏差要遠(yuǎn)大于其采用泛匹配法解決的樣本自選擇帶來的偏差。第四,當(dāng)前尚未發(fā)現(xiàn)基于實(shí)驗(yàn)、自然實(shí)驗(yàn)或準(zhǔn)實(shí)驗(yàn)的研究。雖然鄭琦和楊釙(2018)在文章中稱其通過泛精確匹配構(gòu)建了準(zhǔn)實(shí)驗(yàn)的研究設(shè)計(jì)。但泛匹配法僅基于可觀測變量的特征進(jìn)行匹配,該方法無法克服遺漏不可觀測變量導(dǎo)致的估計(jì)偏誤,很難稱得上是準(zhǔn)實(shí)驗(yàn)設(shè)計(jì)。
近五年來,教育生產(chǎn)函數(shù)研究得益于統(tǒng)計(jì)學(xué)、計(jì)量軟件和數(shù)據(jù)獲取技術(shù)的發(fā)展,實(shí)證過程的嚴(yán)謹(jǐn)性與結(jié)果的準(zhǔn)確性得到逐漸提高。本文基于上述國內(nèi)外文獻(xiàn)綜述,通過對比近五年與以往文獻(xiàn)實(shí)證方法和研究內(nèi)容,總結(jié)出近五年教育生產(chǎn)函數(shù)研究的六大發(fā)展趨勢。此外,雖然近五年教育生產(chǎn)函數(shù)模型在誤差控制較早期有了較大改進(jìn),但教育生產(chǎn)的復(fù)雜性和聯(lián)系性等非可控因素的存在決定了改進(jìn)模型的難度。在實(shí)證研究中,針對具體情境選擇合適的模型將有助于提高估計(jì)的準(zhǔn)確性。當(dāng)前教育生產(chǎn)函數(shù)研究還有諸多不足之處,本文在發(fā)展趨勢的基礎(chǔ)上提出相應(yīng)的建議,并對我國未來教育生產(chǎn)函數(shù)的研究進(jìn)行展望。
早期教育生產(chǎn)函數(shù)較多探討教育投入與產(chǎn)出的相關(guān)關(guān)系,但不能識別教育產(chǎn)出是否為我們要考察的教育投入產(chǎn)生的。此外,相關(guān)分析在模型設(shè)定上也忽略了內(nèi)生性問題,可能得到有偏的實(shí)證結(jié)論。近五年來,教育生產(chǎn)函數(shù)實(shí)證研究逐漸注重因果關(guān)系的識別。因果識別方法主要包括三類:第一,控制變量法。教育生產(chǎn)中環(huán)境的復(fù)雜性決定了教育產(chǎn)出結(jié)果的多變性,學(xué)生教育獲得是家庭和學(xué)校共同作用的結(jié)果。在探討教育投入對教育產(chǎn)出影響時(shí),要控制既和教育投入相關(guān)又和教育產(chǎn)出相關(guān)的所有變量。但現(xiàn)實(shí)中調(diào)查數(shù)據(jù)很難獲取上述全部信息,進(jìn)而會(huì)導(dǎo)致遺漏變量偏誤。第二,自然實(shí)驗(yàn)或準(zhǔn)實(shí)驗(yàn)法。近五年我國教育生產(chǎn)函數(shù)領(lǐng)域已有相當(dāng)?shù)难芯坎捎昧酥T如傾向得分匹配法、雙重差分法、工具變量法和斷點(diǎn)回歸法等計(jì)量方法,并依據(jù)外生沖擊或政策實(shí)施來構(gòu)造自然實(shí)驗(yàn)或準(zhǔn)實(shí)驗(yàn),進(jìn)而解決模型存在遺漏重要解釋變量而導(dǎo)致的內(nèi)生性問題。第三,隨機(jī)控制實(shí)驗(yàn)。相較于控制變量法和準(zhǔn)實(shí)驗(yàn)法,隨機(jī)控制實(shí)驗(yàn)是識別因果關(guān)系最直接有效的方法。隨機(jī)控制實(shí)驗(yàn)最早應(yīng)用于臨床研究和新藥實(shí)驗(yàn),近幾十年來逐漸受到社會(huì)科學(xué)研究者的青睞。在我國,鑒于資金投入、倫理道德、協(xié)調(diào)成本、項(xiàng)目獲批難度,隨機(jī)控制實(shí)驗(yàn)研究相對較少。但近五年來較多學(xué)者已充分肯定了隨機(jī)控制實(shí)驗(yàn)的巨大優(yōu)勢,其必將在未來教育生產(chǎn)函數(shù)實(shí)證研究中發(fā)揮更大作用。
早期教育生產(chǎn)函數(shù)研究多采用單層線性模型,但要想獲得無偏且一致的估計(jì)量,方程殘差項(xiàng)需滿足獨(dú)立同分布和方差恒定假設(shè)。但在教育生產(chǎn)過程中,學(xué)生的教育產(chǎn)出受到家庭、學(xué)校和班級的共同影響,相同學(xué)?;虬嗉墝W(xué)生之間的特征差異要小于不同學(xué)校和班級學(xué)生之間的特征差異。倘若方程未考慮學(xué)生嵌套于班級和班級嵌套于學(xué)校的現(xiàn)實(shí)情況,把學(xué)生、班級和學(xué)校放置于同一水平上分析,將導(dǎo)致殘差方差與班級或?qū)W校層面的變量相關(guān),違背了OLS 回歸關(guān)于獨(dú)立同分布和方差恒定的前提假設(shè)。實(shí)證研究中,解決變量嵌套問題較多采用多層線性模型。例如就兩水平線性模型而言,把學(xué)生特征變量歸為方程第一水平,把學(xué)校層面相關(guān)變量歸為方程第二水平,進(jìn)而收縮估計(jì),剝離不同水平上的影響因素,并基于變量所在層面分別回歸并加權(quán)處理。其過程相較于OLS 回歸更接近于變量嵌套的真實(shí)情況。因此,未來的教育生產(chǎn)函數(shù)研究應(yīng)充分重視教育生產(chǎn)過程中存在的嵌套關(guān)系,認(rèn)識到影響教育產(chǎn)出的多維度變量多重交互這一客觀現(xiàn)實(shí)。
近五年來,伴隨著計(jì)量模型和識別策略的不斷進(jìn)步,實(shí)證研究對數(shù)據(jù)的要求也逐漸苛刻(見表1),高質(zhì)量的數(shù)據(jù)幾乎成為文章能夠在頂級期刊發(fā)表的必要不充分條件。鑒于教育生產(chǎn)過程的累積性和動(dòng)態(tài)性這一基本事實(shí),數(shù)據(jù)需要更加注重對教育投入的流量進(jìn)行精確的追蹤和統(tǒng)計(jì),對教育產(chǎn)出的測量需要更加科學(xué)和精準(zhǔn)。我國當(dāng)前行政數(shù)據(jù)獲取較難,教育追蹤數(shù)據(jù)庫資源有限。數(shù)據(jù)的相對匱乏,從某種程度上限制了教育生產(chǎn)函數(shù)研究在我國的推進(jìn)和發(fā)展。近五年我國教育生產(chǎn)函數(shù)研究更多采用國際教育項(xiàng)目數(shù)據(jù)。部分研究基于研究者自己收集的小規(guī)模調(diào)查數(shù)據(jù),數(shù)據(jù)結(jié)構(gòu)多為單期,缺乏長期的追蹤觀測。此外,我國教育生產(chǎn)函數(shù)研究采用的數(shù)據(jù)多針對某地區(qū)或某學(xué)校展開,研究結(jié)論和政策建議的推廣存在很大局限。未來我國建立高質(zhì)量的追蹤數(shù)據(jù),營造數(shù)據(jù)共享的良性學(xué)術(shù)氛圍尤為重要和緊迫。例如可以尋求新興互聯(lián)網(wǎng)調(diào)研經(jīng)費(fèi)眾籌模式,眾籌者在保護(hù)期內(nèi)有數(shù)據(jù)使用的獨(dú)享權(quán),避免出現(xiàn)部分學(xué)者在數(shù)據(jù)使用上的搭便車行為。
表1 數(shù)據(jù)結(jié)構(gòu)、模型選擇與一致性
此外,當(dāng)面板數(shù)據(jù)獲取存在困難時(shí),建議研究者應(yīng)盡可能獲取多期的教育產(chǎn)出數(shù)據(jù),并推薦使用增值模型。其理由主要有如下幾點(diǎn):第一,教育投入是流量,教育產(chǎn)出是存量,增值模型通過控制前期教育產(chǎn)出,來研究當(dāng)期教育投入對當(dāng)期教育產(chǎn)出的影響,滿足了教育生產(chǎn)函數(shù)流量投入存量產(chǎn)出的特征。第二,家庭背景和學(xué)校特征短期內(nèi)不易改變,增值模型控制了前期教育產(chǎn)出等于在一定程度上控制了家庭背景和學(xué)校特征等不可觀測變量,有效解決了模型遺漏變量偏誤。第三,前期教育產(chǎn)出有可能會(huì)影響到當(dāng)期教育投入,如果不選擇使用增值模型對前期教育產(chǎn)出進(jìn)行控制,會(huì)導(dǎo)致樣本自選擇導(dǎo)致的估計(jì)偏誤。第四,控制了前期學(xué)業(yè)成績,一定程度上等于控制了不易測量的學(xué)生能力(學(xué)業(yè)成績和學(xué)生能力高度相關(guān)),可以有效解決模型存在的內(nèi)生性問題。因此,未來教育生產(chǎn)函數(shù)研究應(yīng)充分重視教育生產(chǎn)的累積性,在條件允許情況下優(yōu)先選擇多期投入型教育生產(chǎn)函數(shù)。若多期投入數(shù)據(jù)獲取存在困難,應(yīng)盡可能選擇增值型教育生產(chǎn)函數(shù)。
教育生產(chǎn)函數(shù)研究除了幫助尋找出教育產(chǎn)出的決定因素,更為重要的是能夠指導(dǎo)政府、學(xué)校和家庭進(jìn)行科學(xué)合理的教育投入,以最小投入獲取最大程度教育產(chǎn)出。但如果研究關(guān)注的教育投入是在短期內(nèi)不容易改變或不能改變的(如家庭經(jīng)濟(jì)地位、父母學(xué)歷、政治面貌、居住地特征、戶口類別、種族、學(xué)校選擇、同伴構(gòu)成等),則研究成果的可操作性弱、指導(dǎo)性差,研究結(jié)論的政策建議就會(huì)大打折扣。近五年來,國內(nèi)教育生產(chǎn)函數(shù)研究更加關(guān)注投入的可操作性,包括作業(yè)督導(dǎo)、親子交流、親子互動(dòng)、課外補(bǔ)習(xí)、學(xué)校經(jīng)費(fèi)、教師績效工資等教育投入的研究。上述研究成果可以引導(dǎo)家庭教育行為,優(yōu)化政府經(jīng)費(fèi)投入方式和結(jié)構(gòu),改進(jìn)學(xué)校的管理模式,具有較強(qiáng)的可操作性。建議未來教育生產(chǎn)函數(shù)研究中,學(xué)者應(yīng)多關(guān)注可操作教育投入對教育產(chǎn)出的研究,引導(dǎo)教育投入主體通過改變投入方式來獲取最大的教育產(chǎn)出,并最終使研究成果能夠真正地服務(wù)社會(huì)。
數(shù)據(jù)的準(zhǔn)確性是教育生產(chǎn)函數(shù)估計(jì)結(jié)果準(zhǔn)確性的前提條件,建議在條件允許的情況下,優(yōu)先選擇行政數(shù)據(jù)而非調(diào)查數(shù)據(jù)。以學(xué)業(yè)成績數(shù)據(jù)為例,具體分析數(shù)據(jù)獲取中可能存在的問題,以及由此引發(fā)的控制變量的固定效應(yīng)選擇。我國教育生產(chǎn)函數(shù)研究中,學(xué)業(yè)成績數(shù)據(jù)存在兩方面問題。第一,受限于行政數(shù)據(jù)獲取難度,部分研究的成績數(shù)據(jù)取自問卷中學(xué)生或家長自報(bào)學(xué)生成績在班級中排名,數(shù)據(jù)過于主觀,存在較大的測量誤差。有少量研究通過中小學(xué)管理信息系統(tǒng)調(diào)取了學(xué)生百分制考試成績,但多為區(qū)域性數(shù)據(jù),樣本量較小。第二,當(dāng)前我國中小學(xué)生考試成績多以優(yōu)良中差等級劃分的形式告知學(xué)生和家長,而具體的考試分?jǐn)?shù)根據(jù)教育部門的規(guī)定不允許公布,且不允許對學(xué)生成績進(jìn)行班級或?qū)W校排名。但是義務(wù)教育階段學(xué)生,尤其是小學(xué)生的學(xué)習(xí)成績多屬于優(yōu)秀水平,學(xué)生考試成績的變異系數(shù)較小,會(huì)導(dǎo)致研究中教育投入對教育產(chǎn)出影響不顯著。因此,未來研究應(yīng)在條件允許情況下,盡可能獲取確切考試分?jǐn)?shù)而非等級,且數(shù)據(jù)盡可能來源于系統(tǒng)調(diào)取而非學(xué)生或家長自報(bào)成績,確保數(shù)據(jù)的客觀性。
數(shù)據(jù)測量方式也會(huì)影響模型控制變量選擇,下文同樣以學(xué)習(xí)成績?yōu)槔⒎治宸N情況進(jìn)行分析(見表2)。第一,考試成績?yōu)閰^(qū)縣統(tǒng)一命題且區(qū)縣統(tǒng)一判卷,則學(xué)校和班級層面投入對成績影響應(yīng)分別控制區(qū)縣和學(xué)校固定效應(yīng)。第二,考試成績?yōu)閰^(qū)縣統(tǒng)一命題但學(xué)校自主判卷,鑒于不同學(xué)校判卷尺度差異,學(xué)校間學(xué)生成績不具有可比性。該數(shù)據(jù)不能研究學(xué)校層面投入,但可以研究班級層面投入對成績影響,并控制學(xué)校固定效應(yīng)。第三,考試成績?yōu)閷W(xué)校統(tǒng)一命題、學(xué)校統(tǒng)一判卷,該數(shù)據(jù)不能研究學(xué)校層面投入,但可以探討班級層面投入對成績影響,并控制學(xué)校固定效應(yīng)。第四,考試成績?yōu)閷W(xué)校統(tǒng)一命題、班級自主判卷。鑒于不同班級老師判卷尺度差異,班級間學(xué)生成績不具有可比性。該數(shù)據(jù)不能用于學(xué)校和班級層面投入對成績影響的研究。第五,考試成績?yōu)榘嗉壸灾髅}、班級自主判卷。該數(shù)據(jù)不能用于學(xué)校和班級層面投入對成績影響,但可以研究家庭層面投入對學(xué)業(yè)成績的影響,并應(yīng)控制班級固定效應(yīng)。未來教育生產(chǎn)函數(shù)研究參照上文涉及的五種情況,應(yīng)有選擇地控制區(qū)縣、學(xué)校或班級固定效應(yīng),以提高實(shí)證結(jié)果的準(zhǔn)確性。
表2 命題、判卷形式和固定效應(yīng)選擇
教育生產(chǎn)函數(shù)研究的是教育投入對教育產(chǎn)出的影響,但隨著中介效應(yīng)模型和STATA、AMOS 等統(tǒng)計(jì)軟件的發(fā)展,近五年研究不僅關(guān)注教育投入對教育產(chǎn)出的影響,更關(guān)注教育投入如何影響教育產(chǎn)出,即探討投入和產(chǎn)出之間的內(nèi)部影響機(jī)制。中介效應(yīng)模型最近幾年在教育學(xué)、心理學(xué)領(lǐng)域的實(shí)證分析中得到了大量使用,其通過逐步檢驗(yàn)回歸系數(shù)、系數(shù)乘積檢驗(yàn)(Sobel 檢驗(yàn)、Bootstrap 檢驗(yàn))、系數(shù)差異檢驗(yàn)來分析自變量對因變量的影響路徑。例如以家庭層面教育投入對教育產(chǎn)出的影響為例,近五年來國內(nèi)的研究中,薛海平(2018)發(fā)現(xiàn),家庭背景通過影響子女的課外補(bǔ)習(xí)機(jī)會(huì),進(jìn)而影響子女學(xué)業(yè)成績;李波(2018a)發(fā)現(xiàn),家庭背景通過影響諸如作業(yè)督導(dǎo)、親子閱讀、親子活動(dòng)、親子交流、家校互動(dòng)等父母時(shí)間投入,進(jìn)而提高子女非認(rèn)知能力(包括自尊、自我控制、人際交往、學(xué)校適應(yīng)、領(lǐng)導(dǎo)力、合作),并最終影響子女的學(xué)習(xí)成績;李忠路和邱澤奇(2016)發(fā)現(xiàn)家庭背景通過教育參與和行為支持來影響子女學(xué)習(xí)行為和態(tài)度,并最終影響子女的學(xué)習(xí)成績。因此,未來教育生產(chǎn)函數(shù)研究中,學(xué)者不僅要識別教育投入對教育產(chǎn)出的影響,更要分析教育投入對教育產(chǎn)出的影響路徑,破解教育投入對教育產(chǎn)出影響機(jī)制的“黑箱”。
華東師范大學(xué)學(xué)報(bào)(教育科學(xué)版)2020年9期