郭毅夫(湖南文理學院 經濟管理學院,湖南 常德 415000)
基于分位數分解的城鄉(xiāng)收入差′研究
郭毅夫
(湖南文理學院 經濟管理學院,湖南 常德 415000)
文章基于中國家庭金融調查(CHFS)的調查數據,分別利用分位數回歸和分布函數分解的方法,檢驗了城鄉(xiāng)居民收入水平的主要影響因素,分解比較城鄉(xiāng)收入差距中城鄉(xiāng)居民稟賦特征構成差異和個體特征回報率差異的相對貢獻。根據實證結果可以看到,受教育程度、職業(yè)性質等對城鄉(xiāng)居民收入有顯著影響,稟賦特征構成差異和個體特征回報率差異都擴大了城鄉(xiāng)居民收入,其中城鄉(xiāng)居民稟賦特征構成差異的影響更大。
城鄉(xiāng)收入差距;分位數回歸;反事實模擬;分位數分解
近年來在我國居民的收入水平不斷提高的同時,但收入差距持續(xù)擴大的問題也日益突出,城鄉(xiāng)收入差距擴大的特征更加明顯。嚴重的收入分配差距不僅會影響到社會的穩(wěn)定和諧,而且可能對我國長期經濟發(fā)展的質量帶來負面影響。根據相關學者的研究,城鄉(xiāng)間收入差距的擴大是中國總體收入分配差距擴大的主要原因(白瑩、吳建瓴,2011;魯玲,2010)。因此,深入探討導致我國城鄉(xiāng)收入差距擴大的關鍵因素,對于有效調控收入差距、促進經濟社會和諧發(fā)展都具有重要的理論和實踐意義。
在相關研究的基礎上,本文根據抽樣單元覆蓋全國主要省份的中國家庭金融(China Household Finance Survey, CHFS)調查數據,首先構建分位數回歸模型,討論了影響城鄉(xiāng)居民收入差距的個體稟賦特征及城鄉(xiāng)回報率的區(qū)別;其次,按照反事實模擬的思路,在給定城市或農村居民個體特征的情況下,利用分位數回歸方法測算不同系數對應的條件反應分布,比較分析了城鄉(xiāng)居民稟賦特征構成區(qū)別和城鄉(xiāng)二元結構下個體特征的回報率差異對城鄉(xiāng)收入差距的作用,以期通過對我國城鄉(xiāng)收入差距擴大原因的討論,為改善我國收入分配狀況提供參考。
1.1 數據來源及描述
本文利用的是中國家庭金融調查與研究中心2013年發(fā)布的中國家庭金融調查(CHFS)的最新數據,該調查的抽樣單元覆蓋了全國除西藏、新疆、內蒙和港澳地區(qū)外的2585個市/縣,調查樣本具有廣泛的代表性。在實證分析之前,本文對樣本數據進行了整理,剔除了個別極端值以及缺失值較多的觀測。從表1可以看到,樣本中城鄉(xiāng)家庭的人均收入的差距顯著,城市家庭平均收入約為農村家庭平均收入的2.5倍。城鄉(xiāng)家庭的特征也存在較大區(qū)別,比如城市家庭中戶主為中共黨員比重遠高于農村家庭,受教育程度在高中及以上的城市居民約有46%,而農村居民僅有15%左右。
表1 樣本中主要變量的描述與統(tǒng)計
圖1((見下頁)為樣本家庭人均收入對數的核密度分布函數,為減少觀測較少區(qū)域的估計方差以及觀測較多區(qū)域的估計偏誤,本文選擇了自適應核密度函數估計方法,隨著樣本數據來改變函數估計的窗寬,即有其中hi=h×λi,λi為窗寬因子,h為整體固定窗寬,控制整體的平滑程度,窗寬設定為w=0.9sd×n-0.2,sd和n分別是人均收入對數的標準差和觀察值數。從圖1可以看到,全國家庭平均收入的分布還比較廣,居民之間的收入差距還比較明顯,并且左側低收入人群的比重較高;而城市家庭人均收入分布密度函數位于農村家庭人均收入分布密度函數的右邊,城市家庭人均收入高于農村,并且城市家庭人均收入的分布相對更加集中。
圖1樣本家庭人均收入對數的核密度函數
1.2 實證模型與方法
1.2.1 分位數回歸估計
本文參考了LI(2004)和李紅梅(2012)的相關研究,進一步細化了Mincer提出的收入方程,構建了如下收入函數模型:
由于OLS只能在均值水平上反映相關解釋變量對居民收入的影響,不能體現在不同收入水平上相關解釋變量的作用可能出現的變化,本文首先利用Koenker和Bassett提出的分位數回歸在居民收入的整個分布上討論影響收入水平的相關因素。給定解釋變量Xi,Qp(lnyi|Xi)為第p個分位數點上的家庭收入,對應的條件分位數函數可以定義為:
Qp(lnyi|Xi)=Xi',其中Xi包含了戶主受教育程度、工作經驗等解釋變量。
第p個分位數的系數估計定義為最小化擬合值和觀測值加權距離和的數值,即最小化:
為計算估計值的標準差,本文采用了常用非參數統(tǒng)計方法Bootstrap方法(Davidson和MacKinnon,2006),在進行分布假設或增加新的樣本信息的前提下,對樣本的分布特性進行了統(tǒng)計推斷。通過放回抽樣從初始樣本中抽取大小為n的自舉樣本,對每個自舉樣本計算系數估計值;重復抽樣M次,即可產生M個系數估計值m(p),其標準差就可以用來估計系數標準差。
1.2.2 基于分布函數的城鄉(xiāng)收入差距分解
為了充分刻畫收入分布的特征,本文根據Machado和Mata(2005)、Melly(2005)和 Elena Martinez-Sanchis等(2012)提出的思路,將條件均值收入擴展為條件分位數收入,使用分位數回歸對收入分布函數進行反事實模擬,對城鄉(xiāng)家庭收入差異進行分解研究。
具體而言,對于家庭收入y,C1C2分別表示城鄉(xiāng)家庭相關解釋變量x,根據構建的實際邊緣分布和反事實邊緣分布,就可以得到相應的分位數估計,并且能夠得到第p個分位數上城鄉(xiāng)收入差距的兩成分分解。以 f(ω(s))表示樣本s中收入觀測{ωi(s)}的邊緣分布,f*(ω(s))表示生產樣本中相應密度函數的估計。反事實密度函數可以表示 f*(ω(2);Z(1)),即假設農村居民自變量構成不變時,利用城市居民的要素回報率可能得到的收入分布。用q(·)表示收入分布的分位數,則城鄉(xiāng)居民收入差異可以表示為:
第一部分反應了自變量構成的變化導致的整體收入差距的變化,第二個部分反映了系數上的變化所導致的整體收入差距的變化,第三個部分ε為殘差項。
而為獲得基于模型的和基于樣本的邊緣分布,本文從(0,1)中隨機選取分位數值,從一個樣本中抽取一行協(xié)變量數據,并將該行插入對應的分位數回歸模型中,得到的反應變量則具有正確的邊緣分布。具體而言,得到基于模型的邊緣分布包含以下步驟:
(1)從均勻分布U[0 ,1]中生成隨機數u;
(2)使用完整樣本來估計第u個分位數回歸;
(3)選取一個自舉樣本,并根據分位數回歸模型估計得到預測值;
(4)根據所選取的各行協(xié)變量xt和分位數回歸系數βu,計算相應的條件分位數;
(5)重復以上4步n次,將得到的值作為基于模型的y*t的邊緣分布中抽取的一個隨機樣本。
估計基于模型的反事實分布包括以下步驟:
(1)根據前面隨機抽取樣本1的各行數據xt和估計的樣本2處的分位數回歸系數,計算條件分位數,以建立一個從反事實邊緣分布y*()中抽取的樣本;
(2)通過使用隨機抽取的城市樣本t=2的各行數據xt=2和估計的農村樣本t=1處的分位數回歸系數t=1,能夠建立一個倒序的反事實邊緣,以構建一個從反事實邊緣分布y*(t=1;xt=2)中抽取的樣本。此外,本文還借鑒Melly的分解思路(Melly方法),考慮到殘差效應的影響,將中位數回歸估計作為收入分布集中趨勢的度量,將式(3)中的城鄉(xiāng)收入差距分解成以下三個部分:
其中q(f*(ω(2);Z(2)))估計時分位數回歸系數取值為β(0.5)為中位數回歸估計的系數;第一部分代表殘差效應,第二部分代表系數效應,第三部分代表自變量效應。
2.1 城鄉(xiāng)居民收入影響因素的分析
表2為自變量中心化后城鄉(xiāng)居民收入的均值模型、中位數模型和0.1/0.9分位數模型的系數估計結果。從戶主的人力資本特征來看,戶主的受教育程度和工作經驗對居民收入都有顯著影響。與參照組小學及以下文化程度的居民相比,文化程度的提高,明顯能增加居民收入,平均來看農村居民的教育回報率比城鎮(zhèn)居民的更高,而大學及以上文化程度(edu3)對收入的作用最大,城鄉(xiāng)居民對應的系數分別為0.757和1.154;比較不同分位數上受教育程度的影響,在收入水平較高的人群中(0.9分位數)只有大學及以上文化程度(edu3)的作用比較明顯,而在低收入人群中(0.1分位數),受教育承程度對于收入狀況的改善作用最為突出,比如高中文化程度在城鄉(xiāng)居民收入方程的系數都分別達到了0.579和0.661。工作經驗對于居民收入的影響比較復雜,平均來看工作經驗對于農村居民的影響呈現倒U型(一次方和二次方系數符號分別為正和負),并且其影響強度很小,而工作經驗對于城市居民為正U型,隨著工作經驗增加收入水平也會提高;比較不同分位數上工作經驗的影響,在收入水平較高的人群中(0.9分位數),工作經驗對城市和農村居民的影響都為正;在中位數模型中(0.5分位數),工作經驗僅僅對城市居民的有影響;而在低收入人群中(0.1分位數),工作經驗對城市居民沒有顯著影響,但對農村居民的影響呈現倒U型,可能隨著工作經驗增加年齡變大,多從事體力勞動的低收入農村居民的收入水平可能出現下降。
在其他解釋變量中,黨員身份的影響比較顯著,平均來看黨員身份對城市居民收入的影響要高于農村居民,其對應系數分別為0.403和0.280,而結合分位數估計的結果,可能在低收入人群中黨員身份對城市居民的影響更大,在中高收入人群中,黨員身份對城鄉(xiāng)居民的影響相當。而總體來看民族因素對居民收入的影響并不顯著,僅在中低收入人群中漢族身份對城市居民有一定影響。地區(qū)因素在城鄉(xiāng)居民收入中的作用中比較明顯,與參照組中西部地區(qū)居民收入相比,東部地區(qū)城鄉(xiāng)居民收入水平更高,并且城市居民之間的地區(qū)差距大于農村居民,均值模型中對應的系數分別為0.516和0.313;從分位數模型的估計結果來看,在農村居民的低收入人群中地區(qū)差異并不顯著,而在中高收入人群中城鄉(xiāng)居民收入的地區(qū)差異都十分突出,在0.9分位數模型中農村居民和城市居民地區(qū)變量對應的系數分別為0.549和0.516。由于區(qū)位條件、經濟基礎以及政策傾斜等因素都存在差異,我國地區(qū)之間經濟發(fā)展不平衡的問題比較突出,東部地區(qū)經濟發(fā)展水平更高,也帶來了東部地區(qū)居民收入水平明顯高于中西部地區(qū)。
由于不同經濟部門員工的收入決定機制不同,勞動力在不同所有制之間的流動性也較差,居民所在單位的所有制性質一直是影響其收入水平的重要原因。表2中,國有/集體和外資/合資變量對應的系數也都顯著為正,并且單位性質對農村居民的影響要比城市居民更大,國有/集體和外資/合資的收入水平要顯著高于參照組民營/私營企業(yè)的收入水平。在低收入人群中,國有/集體變量的作用更大,并且其對農村居民的影響遠大于城市居民,對應系數分別為0.785和0.332;外資/合資變量類似的也在低收入人群中的影響最大,其對農村居民和城市居民的影響系數分別為1.611和1.199。
表2 均值模型、中位數模型和0.1/0.9分位數模型估計
2.2 城鄉(xiāng)家庭收入差距的分解研究
通過上文的討論可以看到,我國城鄉(xiāng)居民的個體特征差異明顯,并且這些特征變量在城市和農村的回報率也不相同。這里就利用上文介紹的分解方法,利用分位數回歸模型估計居民收入的反事實分布,比較城鄉(xiāng)居民稟賦差異和城鄉(xiāng)二元結構下回報率差異在城鄉(xiāng)收入差距中的作用。表3給出了不同分位數上城鄉(xiāng)收入差距兩個成分的分解結果(M-M方法),在分解過程中計算了200個分數估計來進行收入分布的反事實模擬,各個分解效應的標準差通過Bootstrap方法獲得(Bootstrap次數為100)。從表3可以看到,城鄉(xiāng)居民收入差距在整個收入分布上區(qū)別不大,低收入水平下城鄉(xiāng)收入的差距略大;在中低收入水平中,城鄉(xiāng)收入差距中來自稟賦構成和要素回報的影響基本一致,其中來自要素回報的影響略大,但是在高收入水平中來自稟賦構成的影響遠大于要素回報;收入差距中要素回報率的影響為正意味著,如果農村居民的受教育程度、工作經驗等特征不變,在要素回報率與城市居民相同的話,農村居民的收入水平將增加;而收入差距中稟賦構成的影響為正意味著,即使城鄉(xiāng)要素回報率相同,城鄉(xiāng)居民之間也會由于稟賦特征上區(qū)別而存在收入差距。
表3 基于MM方法的城鄉(xiāng)收入差距分解
表4和圖2是根據Melly方法測算的城鄉(xiāng)收入差距分解結果,同樣在分解過程中計算了200個分數估計來進行收入分布的反事實模擬,各個分解效應的標準差通過Bootstrap方法獲得(Bootstrap次數為100)??梢钥吹剑纸饨Y果與M-M方法存在一定區(qū)別,但研究結論基本一致??紤]到殘差效應以后,稟賦特征構成和要素回報率對低收入人群中的解釋能力有所下降,但總體來看影響較小。也就是說可能在低收入人群中,造成城鄉(xiāng)居民收入過大的其他不確定因素很多,而總體而言稟賦特征差異和要素回報率差異是造成城鄉(xiāng)收入差距的主要原因。比較稟賦特征構成和要素回報率的影響,稟賦特征構成作用明顯大于要素回報率作用。此外,為了討論以上研究結論的穩(wěn)健性,本文還調整了式(3)中三種效應的分解順序、增加反事實模擬中分位數的選取個數,實證結果基本也與上述分解結論一致。
表4 基于Melly方法的城鄉(xiāng)收入差距分解
圖2基于Melly方法的城鄉(xiāng)收入差距分解效應變化
本文根據中國家庭金融調查的微觀數據,實證檢驗了影響城鄉(xiāng)居民收入水平的主要因素,并比較分析了稟賦特征構成區(qū)別和個體特征的回報率差異對城鄉(xiāng)收入差距的作用。第一,根據城鄉(xiāng)居民收入水平影響因素的分位數回歸估計,結果表明受教育程度、工作性質等對收入水平作用顯著,但在城鄉(xiāng)二元結構下,城鄉(xiāng)要素特征的回報率存在明顯區(qū)別。第二,按照通過反事實模擬的思路,利用分位數回歸方法測算不同系數對應的條件反應分布函數,分解比較稟賦差異和二元結構的作用大小,結果發(fā)現從自變量效應來看,城市和農村居民自身稟賦特征不同對城鄉(xiāng)收入差距的影響顯著,尤其在收入水平最高和最低的兩類人群作用更加明顯。由于農村居民在受教育程度等個體特征與城市居民存在較大距離,而這些特征又是影響收入水平的顯著因素,這就必然導致了城鄉(xiāng)居民之間的收入差距;從系數效應來看,城鄉(xiāng)二元結構下城鄉(xiāng)要素回報率差異也是影響城鄉(xiāng)收入差距的重要原因,在整個收入分布上都表現出對城鄉(xiāng)收入差距擴大的作用;考慮到殘差效應以后,稟賦構成和要素回報率對低收入人群中的解釋能力有所下降,但總體而言稟賦特征差異和要素回報率差異是造成城鄉(xiāng)收入差距的主要原因,并且城鄉(xiāng)收入差距受居民自身稟賦特征的影響更大。
[1]Martinez-Sanchis E,Mora J,Kandemir I.Counterfactual Distribu?tions of Wages via Quantile Regression With Endogeneity[J].Computa?tional Statistics and Data Analysis,2012(10).
[2]Démurger S,Li S,Yang J.Earnings Differentials Between the Public and Private Sectors in China:Exploring Changes for Urban Local Res?idents in the 2000s[J].China Economic Review,2012,23(1).
[3]白瑩,吳建瓴.中國收入分配差距的城鄉(xiāng)分解分析[J].經濟體制改革,2011,(2).
[4]孫寧華,堵溢,洪永淼等.勞動力市場扭曲、效率差異與城鄉(xiāng)收入差距[J].管理世界, 2009,(9).
[5]胡榮才,馮昶章.城鄉(xiāng)居民收入差距的影響因素——基于省級面板數據的實證研究[J].中國軟科學,2011,(2).
[6]王書華,楊有振.城鄉(xiāng)居民家庭金融資產配置與收入差距的動態(tài)影響機制——基于狀態(tài)空間系統(tǒng)的估計[J].上海財經大學學報(哲學社會科學版),2015,17(2).
[7]程莉,劉志文.地區(qū)經濟差距對城鄉(xiāng)收入差距的影響機理與實證分析——以統(tǒng)籌城鄉(xiāng)綜合配套改革試驗區(qū)重慶市為例[J].中國人口·資源與環(huán)境,2013,23(9).
[8]劉長庚,田龍鵬,陳彬等.農村金融排斥與城鄉(xiāng)收入差距——基于我國省級面板數據模型的實證研究[J].經濟理論與經濟管理,2013, (10).
[9]孫敬水,黃秋虹.中國城鄉(xiāng)居民收入差距主要影響因素及其貢獻率研究——基于全國31個省份6 937份家庭戶問卷調查數據分析[J].經濟理論與經濟管理,2013,(6).
[10]譚飛燕,李孟剛,吳偉等.基于微觀調查數據的城鄉(xiāng)家庭收入差距分解[J].統(tǒng)計與決策,2015,(8).
[11]李紅梅.我國城鄉(xiāng)居民收入差距的反事實因素分解[J].數學的實踐與認識,2012,42(10).
[12]楊娟,Sylvie Démurger,李實等.中國城鎮(zhèn)不同所有制企業(yè)職工收入差距的變化趨勢[J].經濟學(季刊),2012,11(1).
(責任編輯/浩 天)
F224.9
A
1002-6487(2016)24-0092-04
國家社會科學基金資助項目(14BJY159);教育部博士點基金資助項目(20130161110044);湖南省哲學社會科學基金資助項目(13JD09);湖南省重點建設學科建設項目(湘教發(fā)[2011]76號);廣東省科技廳項目(2012B070200014)
郭毅夫(1976—),男,湖南益陽人,博士,副教授,研究方向:企業(yè)創(chuàng)新。