王湛晨
摘要:間斷點(diǎn)回歸(RD)是僅次于隨機(jī)實(shí)驗(yàn)的,能夠有效利用現(xiàn)實(shí)約束條件分析變量之間因果關(guān)系的實(shí)證方法。本文旨在簡(jiǎn)要介紹間斷點(diǎn)回歸,并對(duì)一些問(wèn)題予以解釋。
關(guān)鍵詞:間斷點(diǎn)回歸;處理效應(yīng);有效性
中圖分類號(hào):F224 文獻(xiàn)識(shí)別碼:A 文章編號(hào):1001-828X(2016)010-000-01
一、簡(jiǎn)介
間斷點(diǎn)回歸(也成RD)首次被在Thistlethwaite和Campbell(1960)用于在準(zhǔn)自然實(shí)驗(yàn)中評(píng)估處理效應(yīng),實(shí)驗(yàn)準(zhǔn)則便是參與實(shí)驗(yàn)的某一樣本(也可稱為強(qiáng)制變量)是否超過(guò)了既定的“間斷點(diǎn)”。該評(píng)估策略盡管已有五十多年歷史,但直到最近才被引入經(jīng)濟(jì)學(xué)中使用。自從教育領(lǐng)域運(yùn)用RD逐漸成熟后,之后涌現(xiàn)一大批運(yùn)用此方法研究各種問(wèn)題的文獻(xiàn)。Hahn Jinyong,Petra Todd和Wilbert van der Klaauw(2001)認(rèn)為RD相比于其他準(zhǔn)實(shí)驗(yàn)的需要的假設(shè)更為寬泛并且為RD的使用建立了規(guī)范。RD興起的另一個(gè)原因在于它不僅僅是效用評(píng)估的方法,基于RD的因果推論也比其他傳統(tǒng)的自然實(shí)驗(yàn)更為可信(雙重差分法和工具變量法),因此被更多的應(yīng)用在應(yīng)用研究領(lǐng)域。
因此,為了提供一個(gè)具有高可信度和透明的項(xiàng)目效應(yīng)評(píng)估方法,RD能夠被用于分析許多重要經(jīng)濟(jì)學(xué)問(wèn)題。盡管RD在經(jīng)濟(jì)學(xué)中的地位日漸重要,始終沒(méi)有對(duì)于如何理解RD的總結(jié)的文獻(xiàn),以及對(duì)RD的優(yōu)缺點(diǎn)評(píng)判的文獻(xiàn)。另外,對(duì)于使用RD的具體細(xì)節(jié)步驟也尚未涵蓋標(biāo)準(zhǔn)的計(jì)量經(jīng)濟(jì)學(xué)檢驗(yàn)。撰寫本文的目的便在于彌補(bǔ)上述的不足,把RD在經(jīng)濟(jì)學(xué)中使用的一些要求明確出來(lái),給予對(duì)此方法感興趣的學(xué)者以引導(dǎo)。
二、如果樣本能夠準(zhǔn)確的改變所賦值的變量,那么RD便是無(wú)效的
當(dāng)接受處理會(huì)獲得獎(jiǎng)勵(lì)或收益時(shí),經(jīng)濟(jì)學(xué)家自然會(huì)想要知道該個(gè)體會(huì)如何表現(xiàn)進(jìn)而得到獎(jiǎng)勵(lì)。比如,學(xué)生通過(guò)努力有效“提高”自己的測(cè)試成績(jī)。得分為c的樣本應(yīng)該比起得分低于c的樣本來(lái)說(shuō)應(yīng)該不同。這就告訴我們,處理的存在就好比賦值變量的函數(shù)為不連續(xù)函數(shù),但僅僅有這一點(diǎn)并不能夠分辨RD是否合理。因此,任何產(chǎn)生激勵(lì)進(jìn)行為的間斷規(guī)則都能導(dǎo)致RD無(wú)效。
三、如果個(gè)體不能夠準(zhǔn)確改變賦值變量,實(shí)驗(yàn)中處理的變化在臨界值附近可以視為和通過(guò)隨機(jī)實(shí)驗(yàn)得到的結(jié)果是一樣的
這也是RD其如此被追捧的原因。當(dāng)個(gè)體不能準(zhǔn)確的控制賦值變量時(shí),尤其在臨界附近的X的值,每個(gè)樣本大致上得到略高于(處理)或略低于(不處理)臨界值的概率,可以看做拋硬幣實(shí)驗(yàn)的翻版。這也區(qū)別了RD和工具變量法的不同。當(dāng)使用工具變量法分析因果推論,必須假設(shè)工具變量的選擇是外生決定的(比如通過(guò)擲硬幣決定),但這一點(diǎn)很難區(qū)分。相反,在假設(shè)樣本不能準(zhǔn)確控制賦值變量的前提下,RD所隔離的變化和隨機(jī)試驗(yàn)得到的效果是一樣的。
四、和隨機(jī)試驗(yàn)一樣,RD也能被分析以及檢驗(yàn)
這也是局部隨機(jī)結(jié)果的一個(gè)關(guān)鍵內(nèi)涵。如果在臨界點(diǎn)附近,處理的差異大致上隨機(jī)的,所有變量的確定先于賦值變量的識(shí)別,略高或略低于臨界值的變量應(yīng)具有相同的分布,則服從所有“基準(zhǔn)特征”。如果這些基線協(xié)變量中存在間斷點(diǎn),基礎(chǔ)的識(shí)別假設(shè)“樣本不能準(zhǔn)確控制賦值變量”就顯得毫無(wú)依據(jù)。因此,常常用基線協(xié)變量來(lái)測(cè)試RD是否合理有效。對(duì)比之下,在選擇工具變量和匹配或回歸控制策略時(shí),需要設(shè)定有關(guān)處理的協(xié)變量和結(jié)果變量之間關(guān)系的假設(shè)條件。
五、RD的圖形表達(dá)是有幫助的,但圖像不應(yīng)以是否有效標(biāo)示
用坐標(biāo)圖分析RD中賦值變量與結(jié)果變量的關(guān)系已成為標(biāo)準(zhǔn)做法。這確實(shí)有一定的優(yōu)勢(shì),因?yàn)樵紨?shù)據(jù)會(huì)增加研究的透明度。圖示法會(huì)直白告訴讀者,相比于回歸曲線遠(yuǎn)離臨界點(diǎn)凸起的部分,結(jié)果變量在臨界處的跳躍是否更加明顯。另外,圖形展示會(huì)幫助解釋為什么不同的函數(shù)形式會(huì)得到不同的答案,而且能夠識(shí)別出實(shí)證分析中存在一個(gè)問(wèn)題,即極端值的存在問(wèn)題。對(duì)于圖示法的一個(gè)問(wèn)題便是,學(xué)者會(huì)去構(gòu)造看起來(lái)有效果的圖形,或者有意掩蓋實(shí)際存在的效應(yīng)。
六、非參數(shù)估計(jì)并不是解決由RD產(chǎn)生的函數(shù)形式問(wèn)題的方法。對(duì)于非參數(shù)估計(jì),我們有必要將其看作是參數(shù)估計(jì)的補(bǔ)充而不是替代
當(dāng)學(xué)者選擇參數(shù)函數(shù)形式是錯(cuò)誤的,回歸結(jié)果通常是有偏的。而采用非參數(shù)程序,比如局部線性回歸,僅僅對(duì)臨界值附近的樣本點(diǎn)做回歸得到的結(jié)果同樣是有偏的(除非選取的區(qū)域?yàn)檎鎸?shí)線性存在的)。對(duì)于確定函數(shù)的形式,有可能低階多項(xiàng)式是很好的近似表達(dá),帶來(lái)偏誤很小甚至是無(wú)偏的。但在其他情況下,多項(xiàng)式的形式或許不是好的近似表達(dá),而采用局部線性回歸會(huì)得到更小的偏誤。舉例來(lái)說(shuō),討論結(jié)果Y對(duì)X和處理虛擬變量D做回歸,既可被看作是參數(shù)回歸也可以是寬帶寬的局部線性回歸。因此我們建議不要僅依賴一種方式。在實(shí)證分析環(huán)節(jié),由兩種同樣可信的設(shè)定的方法所得出的結(jié)果更加穩(wěn)定,且比對(duì)設(shè)定輕微變動(dòng)敏感的結(jié)果更加可靠。RD構(gòu)思對(duì)此也不例外。
七、擬合優(yōu)度和其他統(tǒng)計(jì)檢驗(yàn)?zāi)軒椭懦量痰脑O(shè)定
通常采用不同規(guī)則導(dǎo)致估計(jì)結(jié)果取值范圍更寬。雖然不存在某個(gè)方程形式適用于所有情形且能除去不合適的設(shè)定,該說(shuō)法似合乎情理。至少我們應(yīng)認(rèn)為,不要依賴于設(shè)定一旦更靈活便會(huì)被拒絕的設(shè)定得出的估計(jì)結(jié)果。舉例說(shuō)明,當(dāng)結(jié)果來(lái)于低階多項(xiàng)式模型,因?yàn)楦傧拗频模▍^(qū)分每個(gè)離散變量X的均值)而被拒絕,對(duì)于這種結(jié)果我們給予小可信度是合理的。同樣的,沒(méi)有理由使我們更青睞于對(duì)所有數(shù)據(jù)采用同一設(shè)定的情況。但限制僅選擇臨界值附近的觀測(cè)值會(huì)給出實(shí)質(zhì)上且統(tǒng)計(jì)上不同的答案。
總之,RD更應(yīng)該被看作是一種特殊的數(shù)據(jù)產(chǎn)生過(guò)程的描述。為研究某一事物我們青睞于隨機(jī)試驗(yàn)或是RD得出的數(shù)據(jù)。但事實(shí)是,和隨機(jī)試驗(yàn)一樣(被看做是具體的數(shù)據(jù)產(chǎn)生方式更加合適而不是研究分析的方法),RD的存在不是在于回答一系列問(wèn)題。這就是說(shuō),會(huì)涌現(xiàn)出一股潮流來(lái)揭示RD會(huì)涉及更多經(jīng)濟(jì)學(xué)領(lǐng)域中。
參考文獻(xiàn):
[1] Thistleth waite,Donald L.,and Donald T. Campbell, “Regression-Discontinuity Analysis: An Alternative to the Ex Post Facto Experiment”,Journal of Educational Psychology,51(6),1960.
[2] Hahn Jinyong,Petra Todd,Wilbert van der Klaauw, “Evaluating the Effect of An Antidiscrimination Law Using a Regression Discontinuity Design”NBER Working paper 7131.