李群峰
(河南師范大學(xué) 經(jīng)濟(jì)與管理學(xué)院,河南新鄉(xiāng) 453007)
作為一種精確地描述自變量對(duì)于因變量的變化范圍以及條件分布影響的統(tǒng)計(jì)方法,分位數(shù)回歸的概念最早由Koenker和Bassett(1978)[1]提出。借助Laplace(1818)提出的最小絕對(duì)殘差估計(jì)思想,他們針對(duì)最小二乘回歸的某些缺陷,創(chuàng)建了線性分位數(shù)回歸理論。Bassett(1986)[2]、Powell(1986)[3]和 Chernozhuko(2002)[4]等人在此基礎(chǔ)上進(jìn)行了深入的研究,陸續(xù)解決了分位數(shù)回歸的線性假設(shè)檢驗(yàn)、異方差的穩(wěn)健性檢驗(yàn)、估計(jì)量的一致性和線性規(guī)劃解法等應(yīng)用方面的難題,使其成為了近幾十年來發(fā)展較快、應(yīng)用廣泛的回歸模型方法。和最小二乘方法相比,分位數(shù)回歸放寬了對(duì)被解釋變量分布假設(shè)的限制,采用加權(quán)殘差絕對(duì)值之和的方法估計(jì)參數(shù),應(yīng)用的條件更為寬松,挖掘的信息更豐富,存在以下優(yōu)勢(shì):(1)分位數(shù)回歸對(duì)模型中的隨機(jī)誤差項(xiàng)不需做任何分布的假定,對(duì)殘差分布的限制大為減少,當(dāng)誤差呈現(xiàn)非正態(tài)分布時(shí),其參數(shù)估計(jì)量比最小二乘法更有效;(2)分位數(shù)回歸法通過測(cè)度回歸變量在不同分位數(shù)水平下的參數(shù)估計(jì)值,突出了局部之間的相關(guān)關(guān)系,能更加全面的刻畫分布的特征;(3)和最小二乘方法通過誤差平方和最小進(jìn)行參數(shù)估計(jì)不同,分位數(shù)回歸通過加權(quán)殘差絕對(duì)值之和最小來得到參數(shù)估計(jì)量,因而對(duì)于異常值的敏感程度也遠(yuǎn)遠(yuǎn)小于最小二乘方法,從而其參數(shù)估計(jì)量更為穩(wěn)健;(4)在回歸系數(shù)的解釋效果方面,最小二乘回歸反映的是自變量對(duì)因變量影響的平均邊際效果,而分位數(shù)回歸則是自變量對(duì)因變量在某個(gè)特定分位數(shù)水平上影響的邊際效果。分位數(shù)回歸可以提供不同分位點(diǎn)處的估計(jì)結(jié)果,因此可以對(duì)因變量的整個(gè)分配情況作出更為清楚的闡釋。
面板數(shù)據(jù)作為截面數(shù)據(jù)與時(shí)間序列數(shù)據(jù)綜合起來的二維數(shù)據(jù)類型,在經(jīng)濟(jì)生活中有著極其廣泛的應(yīng)用。將分位數(shù)回歸和面板數(shù)據(jù)模型結(jié)合對(duì)變量之間的關(guān)系進(jìn)行分析,可以充分利用面板數(shù)據(jù)的特點(diǎn),更好地識(shí)別和度量純時(shí)間序列和純橫截面數(shù)據(jù)所不能發(fā)現(xiàn)的影響因素。同時(shí)面板數(shù)據(jù)分位數(shù)回歸還可以測(cè)度自變量對(duì)因變量的某個(gè)特定分位數(shù)的邊際效果,更好地在控制個(gè)體異質(zhì)性的基礎(chǔ)上分析因變量條件分布的不同分位點(diǎn)上變量之間的關(guān)系。
從理論上講,分位數(shù)回歸是對(duì)以古典條件均值模型為基礎(chǔ)的最小二乘法的拓展。由于其采用多個(gè)分位函數(shù)對(duì)整體模型進(jìn)行估計(jì),因而可以測(cè)度自變量對(duì)因變量每個(gè)特定分位數(shù)的邊際影響。對(duì)一個(gè)連續(xù)隨機(jī)變量y,如果y小于等于qτ的概率是τ,則我們說y的τ分位值是qτ,或者說qτ就稱作y的第τ分位數(shù)。這也就是說,對(duì)于F(y)=prob(Y≤y),可得
類似地,如果我們將被解釋變量y表示為一系列解釋變量X的線性表達(dá)式,并使得該表達(dá)式滿足小于等于qτ的概率是τ,就稱為分位數(shù)回歸。
分位數(shù)回歸的參數(shù)估計(jì)原理實(shí)際上是使一個(gè)關(guān)于y與其擬和值之差絕對(duì)值的表達(dá)式最小,即加權(quán)絕對(duì)殘差最小(WLA)??紤]一般模型
其中,τ為估計(jì)中所取的各分位點(diǎn),βτ為各分位點(diǎn)斜率系數(shù)的估計(jì)值,ατ為各分位點(diǎn)截距項(xiàng)的估計(jì)值。其分位數(shù)回歸的基本思想是對(duì)于在回歸線上方的點(diǎn)(殘差為正),賦予其權(quán)重為τ,對(duì)于在回歸線下方的點(diǎn)(殘差為負(fù)),賦予其權(quán)重為(1-τ),然后求誤差絕對(duì)值的加權(quán)和。分位數(shù)回歸的參數(shù)估計(jì)量的求解則是要在加權(quán)殘差絕對(duì)值之和最小化的條件下計(jì)算參數(shù)α和β的值。中位數(shù)回歸是分位數(shù)回歸的特殊情況,在加權(quán)殘差絕對(duì)值之和中采用對(duì)稱權(quán)重,而其他的條件分位數(shù)回歸則使用非對(duì)稱權(quán)重。
在參數(shù)估計(jì)量的求解上,分位數(shù)回歸要比傳統(tǒng)的最小二乘回歸復(fù)雜得多。傳統(tǒng)的最小二乘回歸是使得被解釋變量y與其擬合值之差的平方和最小,而分位數(shù)回歸是使得這個(gè)殘差的加權(quán)絕對(duì)值的一個(gè)表達(dá)式最小,并且這個(gè)表達(dá)式不可微,因此傳統(tǒng)的求導(dǎo)方法不再適用,而只能采取線性規(guī)劃法(LP)估計(jì)其最小加權(quán)絕對(duì)偏差,從而得到解釋變量的回歸系數(shù)。目前較為流行的算法有三種,即單純形算法、內(nèi)點(diǎn)算法和平滑算法等。這些計(jì)算方法基本上都是通過迭代求解?,F(xiàn)在大部分統(tǒng)計(jì)計(jì)算軟件SAS、STATA、EViews、MATLAB等中都具有分位數(shù)回歸功能。
面板數(shù)據(jù)分位數(shù)回歸是對(duì)面板數(shù)據(jù)模型采用分位數(shù)回歸的方法進(jìn)行參數(shù)估計(jì)。通過將分位數(shù)回歸和面板數(shù)據(jù)模型相結(jié)合對(duì)變量之間的關(guān)系進(jìn)行研究,可以更好地在控制個(gè)體差異的基礎(chǔ)上對(duì)因變量條件分布的不同分位點(diǎn)上各種變量之間的關(guān)系進(jìn)行分析。面板數(shù)據(jù)模型可以分為混合估計(jì)模型、固定效應(yīng)模型和隨機(jī)效應(yīng)模型三類?;旌瞎烙?jì)模型因?yàn)樵诓煌瑫r(shí)間和截面上均不存在顯著差異,可以視為普通最小二乘模型。隨機(jī)效應(yīng)模型因?yàn)檎`差項(xiàng)在時(shí)間和截面上均具有相關(guān)性,一般采用廣義最小二乘估計(jì)。固定效應(yīng)模型由于對(duì)于不同的截面或不同的時(shí)間序列,模型的截距是不同的,則可以采用在模型中加虛擬變量的方法通過分位數(shù)回歸得到參數(shù)估計(jì)量。我們以固定效應(yīng)情形為例,進(jìn)行面板數(shù)據(jù)模型的分位數(shù)回歸,并對(duì)分位數(shù)回歸和最小二乘回歸的優(yōu)劣加以比較。
考慮以板數(shù)據(jù)模型:
當(dāng)τ在(0,1)上變動(dòng)時(shí),求解加權(quán)絕對(duì)殘差最小化問題就可以得到分位數(shù)回歸在不同分位點(diǎn)上的參數(shù)估計(jì)量。最小化加權(quán)絕對(duì)殘差的表達(dá)式為
其中,i代表不同的樣本個(gè)體,t代表不同的樣本觀察時(shí)點(diǎn),u表示隨機(jī)誤差項(xiàng)向量,βi表示解釋變量的系數(shù)向量,αi表示不同樣本不可觀察的隨機(jī)效應(yīng)向量。
如果采取分位數(shù)回歸方法對(duì)于上述面板數(shù)據(jù)模型進(jìn)行參數(shù)估計(jì),則首先需要建立條件分位數(shù)方程
如果不用向量表示,則可以表示為
其中,ρτj為與各分位數(shù)相對(duì)應(yīng)的權(quán)重。
利用Eviews6.0軟件的分位數(shù)回歸功能通過迭代求解,可以很方便的對(duì)以上面板數(shù)據(jù)模型求出因變量在不同分位點(diǎn)水平上對(duì)應(yīng)的參數(shù)估計(jì)量。
分位數(shù)回歸方法對(duì)于因變量的某些非標(biāo)準(zhǔn)分布下回歸方程的系數(shù)估計(jì)有較好的效果?;谶@個(gè)特點(diǎn),在對(duì)變量之間的關(guān)系進(jìn)行分析時(shí),采用面板數(shù)據(jù)模型進(jìn)行分位數(shù)回歸可以使各參數(shù)估計(jì)顯著程度更高,回歸分析結(jié)果更加穩(wěn)健。本文在對(duì)比最小二乘法與分位數(shù)回歸方法在面板數(shù)據(jù)模型中的估計(jì)效果時(shí),以1998~2006年25個(gè)行業(yè)企業(yè)銷售收入為因變量,專利申請(qǐng)數(shù)量為自變量,分析企業(yè)研發(fā)能力和銷售收入之間的關(guān)系,分別采取最小二乘法和分位數(shù)回歸法進(jìn)行參數(shù)估計(jì)和比較分析。為了簡(jiǎn)便起見,本文僅僅對(duì)混合估計(jì)模型和固定效應(yīng)模型的估計(jì)結(jié)果進(jìn)行比較分析(表1)。
表1 最小二乘法與分位數(shù)回歸結(jié)果比較(固定效應(yīng)模型)
面板數(shù)據(jù)分位數(shù)回歸能夠估計(jì)因變量在給定自變量下在各個(gè)分位點(diǎn)上的條件分布。從回歸結(jié)果中可以看出,分位數(shù)回歸得到的系數(shù)符號(hào)和最小二乘回歸基本相似,但是隨著企業(yè)銷售收入在條件分布的不同位置而發(fā)生變動(dòng),呈現(xiàn)出一定的變化趨勢(shì)。從結(jié)果看,專利申請(qǐng)量的系數(shù)在所考察分位點(diǎn)的值隨著條件分布由低端向高端變動(dòng)時(shí),系數(shù)逐漸開始增大。如在0.1低分位點(diǎn)處系數(shù)值為0.4195,在0.5分位點(diǎn)處為0.4341,而在0.9分位點(diǎn)處為0.4538。其經(jīng)濟(jì)意義為:當(dāng)企業(yè)銷售收入的條件分布位于0.9分位點(diǎn)處時(shí),專利申請(qǐng)量的促進(jìn)作用最為顯著;而在其他分位點(diǎn)水平上,專利申請(qǐng)量的促進(jìn)作用則相對(duì)較弱。在不同分位點(diǎn)位置上,專利申請(qǐng)數(shù)量的影響表現(xiàn)出一定的變化規(guī)律,這是最小二乘回歸模型所無法反映的信息。此外,在同一情形下做回歸分析,顯然分位數(shù)回歸分析結(jié)果更加穩(wěn)健,各系數(shù)顯著性更強(qiáng)。因而,面板數(shù)據(jù)模型的分位數(shù)回歸估計(jì)在實(shí)際應(yīng)用中可以發(fā)揮重要作用。
本文在對(duì)分位數(shù)回歸方法的基本原理進(jìn)行全面分析說明的基礎(chǔ)上,對(duì)其在面板數(shù)據(jù)模型中的應(yīng)用作了深入分析,并對(duì)不同回歸估計(jì)方法在面板數(shù)據(jù)模型中的估計(jì)效果進(jìn)行了比較分析。結(jié)果表明,在對(duì)變量之間的關(guān)系進(jìn)行分析時(shí),面板數(shù)據(jù)模型的分位數(shù)回歸除了可以測(cè)度自變量對(duì)因變量的某個(gè)特定分位數(shù)的邊際效果外,還可以使各參數(shù)估計(jì)量顯著程度更高,回歸分析結(jié)果更加穩(wěn)定和精確。
[1]Koenker,Bassett.Regression Quantiles[J].Econometrica,1978,(46).
[2]Bassett,Koenker.Strong Consistency of Regression Quantiles and Related Empirical Processes[J].Econometric Theory,1986,(2).
[3]Powell,James L.Censored Regression Quantiles[J].Journal of Econometrics,1986,(32).
[4]Hong H,Chernozhukov V.Three-Step Censored Quantile Regression and Extramarital Affairs[J].Journal of the American Statistical Association,2002,(97).