梁 英,楊 含,李 強,梁學章
(吉林大學a.商學院;b.數(shù)學學院,長春 130012)
Lorenz曲線是分析居民收入分布狀況及財富分配不平等程度的重要工具,并且基尼系數(shù)的精確估計依賴于Lorenz曲線的精確估計。在已知居民收入分組數(shù)據(jù)的基礎(chǔ)上,有多種方法逼近Lorenz曲線,如插值法、Lorenz曲線模型法等[1-3]。這些方法各有優(yōu)缺點,但目前對中國分組數(shù)據(jù)的應用結(jié)果并不十分理想。本文針對《中國統(tǒng)計年鑒》已發(fā)布關(guān)于城鎮(zhèn)和農(nóng)村居民收入2006—2012年的分組數(shù)據(jù),基于線性規(guī)劃和帶重節(jié)點三次樣條提出了一種新的Lorenz曲線逼近方法,并應用這種方法估計了2006—2012年城鎮(zhèn)和農(nóng)村Lorenz曲線。該方法不僅精確插值所給分組數(shù)據(jù),而且使得到的Lorenz曲線在保持凸性[4]的基礎(chǔ)上具有更好的逼近性能。進一步,本文利用文獻[5]所提供的方法進行加總,估計了相應的全國居民收入的Lorenz曲線與基尼系數(shù),所估計得到的基尼系數(shù)值與國家公布的基尼系數(shù)十分接近。
將收集到的全國居民收入分配數(shù)據(jù),以低收入端人口累計比例為橫坐標,以該組人口擁有的收入占全國總收入的比例為縱坐標,在座標平面中繪點,再將這些點聯(lián)接起來就得到近似的Lorenz曲線。通常認為Lorenz曲線是定義在[0,1]區(qū)間上的漸升的下凸連續(xù)曲線,滿足L(0)=0,L(1)=1。將居民收入的分布函數(shù)、密度函數(shù)、分布函數(shù)逆函數(shù)分別表示為:
其中x∈[0,∞)為收入,p∈[0,1]為累計人口份額。平均收入記為:
則Lorenz曲線及其導函數(shù)可分別表示為:
顯然有:
基尼系數(shù)是反映收入差距的指標,定義為Lorenz曲線與完全平均線之間面積的兩倍,即:
設給定一組節(jié)點0=x0<x1<…<xn=1,若分段函數(shù)s(x)滿足如下兩個條件:
(1)在每個區(qū)間[xj,xj+1](j=0,1,…,n-1)上,s(x)是一個次數(shù)不超過3的實系數(shù)代數(shù)多項式。
(2)s(x)在[0,1]上具有一階的連續(xù)微商,則稱s(x)為區(qū)間[0,1]上帶有重節(jié)點的三次樣條。
設由居民收入分組數(shù)據(jù)給出的Lorenz曲線L(p)的自變量值及其相應函數(shù)值分別為:
其中0=X1≤X2≤…≤Xm=1,0=Y1≤Y2≤…≤Ym=1,滿足Yi=L(Xi)(i=1,2,…,m)。本文試圖用[0,1]上帶重節(jié)點三次樣條函數(shù)s(p)逼近Lorenz曲線L(p),其中是的子集,并假定...,m)。
其中hi=xi+1-xi(0≤i≤n-1)
其二階導數(shù)可表示為:
因此,s(x)在[0,1]上是單調(diào)上升的光滑凸曲線的充要條件為:
此時對應于s(p)的基尼系數(shù)可計算如下:
其中:
顯然,滿足條件(12)及條件s(Xi)=Yi,i=1,2,...,m的曲線s(x)均是逼近分組數(shù)據(jù)的Lorenz曲線。當式(14)中定積分達到極小值時,基尼系數(shù)達到極大值;式(14)中定積分達到極大值時,基尼系數(shù)達到極小值。
鑒于文獻[1]和[5]根據(jù)中國統(tǒng)計年鑒所給的中國居民收入分組數(shù)據(jù)(此分組數(shù)據(jù)點數(shù)偏少)所推出Lorenz擬合曲線的基尼系數(shù)值偏小,為了使Lorenz曲線的逼近效果更好,本文采取了人為增加分組數(shù)據(jù)點的策略,即用帶重節(jié)點三次樣條來保凸逼近Lorenz曲線,并使得利用擬合的Lorenz曲線所算出的基尼系數(shù)達到最大值。從而將帶重節(jié)點三次樣條保凸逼近Lorenz曲線的問題轉(zhuǎn)化為求解如下線性規(guī)劃問題:
滿足約束條件:
本文在逼近中國城鎮(zhèn)和農(nóng)村2006—2012年居民收入的Lorenz曲線時利用單純形(大M)法[7]求解使得利用擬合曲線計算出的相應基尼系數(shù)達到最大值的線性規(guī)劃問題,可分別計算出2006—2012年中國城鎮(zhèn)和農(nóng)村居民收入的Lorenz曲線及相應基尼系數(shù)。
下面分別介紹用帶重節(jié)點三次樣條保凸逼近中國城鎮(zhèn)和農(nóng)村的Lorenz曲線時引入樣條節(jié)點的方式。設已給的城鎮(zhèn)居民收入分組數(shù)據(jù)有m1組,引入樣條節(jié)點后,城鎮(zhèn)的樣條節(jié)點可寫為:
其中hi=xi+1-xi(0≤i≤n-1)。則逼近城鎮(zhèn)Lorenz曲線的樣條節(jié)點個數(shù)為n=3k+m1(在本文計算實例中m1=9,k=4)。
設已給的農(nóng)村居民收入分組數(shù)據(jù)有m2組,引入樣條節(jié)點后,農(nóng)村的樣條節(jié)點可表示為:
則逼近農(nóng)村Lorenz曲線的樣條節(jié)點個數(shù)為n=(m2-1)k+1(在本文計算實例中m2=5,k=4)。
設城鎮(zhèn)總?cè)丝诤袜l(xiāng)村總?cè)丝诜謩e為P1,P2,則全國總?cè)丝跒镻=P1+P2,全國城鎮(zhèn)和農(nóng)村的人口份額分別表示為,則
設城鎮(zhèn)的收入分布函數(shù)、密度函數(shù)及Lorenz曲線分別表示為:
農(nóng)村的收入分布函數(shù)、密度函數(shù)和Lorenz曲線分別表示為:
初始條件設為有機溶劑用量10mL,KOH甲醇質(zhì)量濃度為0.2g/mL,用量5mL,提取溫度為40℃,提取時間為2h,BHT添加量為0.2g,研究甲醇、四氫呋喃、正己烷和乙酸乙酯對稻谷中葉黃素提取效果的影響。取上述實驗的最佳有機溶劑,溶劑用量分別設為 5mL、10mL、15mL、20mL,探究有機溶劑用量對稻谷中葉黃素提取量的影響。
又設全國Lorenz曲線為:
則加總后的Lorenz曲線計算公式[6]如下:
μ1、μ2分別是城鎮(zhèn)和農(nóng)村居民人均收入。
則由上述帶重節(jié)點的三次樣條保凸逼近方法得到的城鎮(zhèn)和農(nóng)村的Lorenz曲線及樣條節(jié)點處的一階導數(shù)值,利用加總公式(22),可導出加總的全國Lorenz曲線(具體加總方法見文獻[5])。
本文將此方法應用于《中國統(tǒng)計年鑒》2007—2013年發(fā)布的2006—2012年關(guān)于城鎮(zhèn)和農(nóng)村居民收入的分組數(shù)據(jù),分別得到了相應的Lorenz曲線和Gini系數(shù)逼近,并通過加總公式得到了全國居民收入的Lorenz曲線逼近。
(1)由《中國統(tǒng)計年鑒》2006—2012年中國城鎮(zhèn)居民收入分組數(shù)據(jù)基于線性規(guī)劃和用帶重節(jié)點三次樣條逼近所得到的2006—2012年城鎮(zhèn)Lorenz曲線的函數(shù)值,如表1所示:
表1 2006—2012年城鎮(zhèn)Lorenz曲線的函數(shù)值的估計
表2 2006—2012年中國農(nóng)村Lorenz曲線的函數(shù)值的估計
(3)利用加總公式所得到的2006—2012年全國Lorenz曲線如下頁表3所示:
表4(見下頁)為2006—2012年我國城鎮(zhèn)、農(nóng)村居民收入的Lorenz曲線逼近的基尼系數(shù)。特別地,本文給出了中國2011年和2012年加總Lorenz曲線逼近的示意圖(見下頁圖1和圖2)。
本文計算出的2006—2012年中國加總Lorenz曲線的基尼系數(shù)均高于林平關(guān)于2007年、Chen等關(guān)于2009—2012年的計算結(jié)果[8,9](見表5),低于國家統(tǒng)計局公布的2004—2006年度全國居民收入基尼系數(shù)(見表6),但非常接近。這說明上文所提出的目標函數(shù)極小化從而使得基尼系數(shù)最大化的策略是適宜的,本文提出的用帶重節(jié)點三次樣條保凸逼近的方法不僅保持了Lorenz曲線的單調(diào)性和凸性,還具有更好的逼近性能。可見,根據(jù)《中國統(tǒng)計年鑒》公布的分組數(shù)據(jù)計算出的加總Lorenz曲線的函數(shù)值是有一定參考價值的。
表3 2006—2012年加總?cè)珖用袷杖隠orenz曲線值的估計
表4 2006—2012年城鎮(zhèn)、農(nóng)村居民收入的Lorenz曲線逼近的基尼系數(shù)
圖1 2011年中國加總Lorenz曲線的逼近
圖2 2012年中國加總Lorenz曲線的逼近
表5 林平關(guān)于2007年、陳建東關(guān)于2009—2012年的加總基尼系數(shù)計算結(jié)果
表6 2006—2012年加總得到的基尼系數(shù)及國家公布值