□劉書成 程開明 吳湞凱 柴燚
城鎮(zhèn)化是當(dāng)今世界最重要的社會經(jīng)濟現(xiàn)象之一,是推動經(jīng)濟發(fā)展和國家現(xiàn)代化的重要動力,也是社會進步的必然趨勢。然而,城鎮(zhèn)化水平與經(jīng)濟發(fā)展的不匹配性也帶來一系列問題,諸如土地過度開發(fā)、城鄉(xiāng)差距擴大等。中國大力推進以人為核心的新型城鎮(zhèn)化發(fā)展戰(zhàn)略,目的是實現(xiàn)城鎮(zhèn)化進程由“量”的增加到“質(zhì)”的提升轉(zhuǎn)變。
2020年中國城鎮(zhèn)化水平達63.89%,已邁入城鎮(zhèn)化快速發(fā)展中后期,呈現(xiàn)出“多期”疊加的新特征。未來一段時期,中國城鎮(zhèn)化發(fā)展態(tài)勢如何?這一問題涉及到采用什么樣的推進與調(diào)控策略,以進一步釋放城鎮(zhèn)化對經(jīng)濟社會發(fā)展的帶動效應(yīng)。因此,運用科學(xué)方法對中國城鎮(zhèn)化水平做出合理預(yù)測,能夠明晰中國城鎮(zhèn)化發(fā)展態(tài)勢,為后續(xù)戰(zhàn)略措施和政策制定提供依據(jù),促進城鎮(zhèn)化與經(jīng)濟協(xié)調(diào)高質(zhì)量發(fā)展。
目前,國內(nèi)外學(xué)者針對城鎮(zhèn)化水平增長曲線的擬合方法較多,其中常用的方法主要包括Logistic 增長模型、時間序列分析模型、城鎮(zhèn)化水平與經(jīng)濟變量的回歸模型,也有部分學(xué)者采用灰色預(yù)測模型、神經(jīng)網(wǎng)絡(luò)模型等(蘭海強等,2014)。然而,這些方法在實際應(yīng)用中均存在一定的不足之處,譬如中國城鎮(zhèn)化水平并不滿足“S”型曲線特征、時間序列模型的選擇存在主觀性和不易解釋性、回歸模型容易遺漏變量、灰色預(yù)測模型的短期性以及神經(jīng)網(wǎng)絡(luò)模型的“黑箱”性質(zhì)等。為彌補這些不足,本文嘗試引入一種新方法——自動分段曲線擬合,為預(yù)測城鎮(zhèn)化水平提供新思路,并開展改革開放以來中國城鎮(zhèn)化水平的實際擬合及效果檢驗,對2021-2025年的城鎮(zhèn)化水平做出預(yù)測。
諾瑟姆(Northam,1975)將不同國家和地區(qū)人口城市化進程的共同規(guī)律概括為一條被拉平的S 型曲線,并把城市化進程分為初期、中期和成熟期三個階段。Karmeshu(1992) 通過梳理20 世紀50年代以來發(fā)達國家的城市化發(fā)展進程也發(fā)現(xiàn),隨著經(jīng)濟不斷發(fā)展,城市化水平的增長曲線大致表現(xiàn)為一條拉伸的“S”型曲線,這一曲線特征可用Logistic 增長模型進行擬合。通常,有兩種方式推導(dǎo)出城鎮(zhèn)化水平增長的“S”型曲線:一是城鄉(xiāng)人口增長率差值法;二是城鎮(zhèn)化率變化時間路徑法。
1.城鄉(xiāng)人口增長率差值法。設(shè)U0、R0分別為基期(t=0) 城鎮(zhèn)人口和農(nóng)村人口,u、r 分別為t 期城市人口和農(nóng)村人口的指數(shù)增長率,那么t 期城市人口Ut 和農(nóng)村人口Rt可表示為:
由式(1)可推算出t 期的城鎮(zhèn)化率yt為:
2.城市化率變化時間路徑法。已知t 期城鎮(zhèn)人口增長率ut和農(nóng)村人口增長率rt分別為:
那么,城鄉(xiāng)人口增長率之差dt為:dt=ut-rt,城鎮(zhèn)化率速度為:
若dt=b 是常數(shù),由式(2)和式(4)可得:
其中,yt表示城鎮(zhèn)化率;a 為積分常數(shù),反映城鎮(zhèn)化開始時間的早晚;b 為斜率,反映城鎮(zhèn)化發(fā)展速度的快慢。一般而言,將式(5)稱作城鎮(zhèn)化水平的“S”(Logistic) 型增長曲線,城鎮(zhèn)化率飽和值為100%。
王遠飛和張超(1997)探討了以Logistic 模型擬合城鎮(zhèn)化水平的合理性,指出城鎮(zhèn)化率的飽和值可以不為100% (80%以上)。宋麗敏(2007)采用Logistic 增長模型預(yù)測2030年中國城鎮(zhèn)化率將達到60%,實踐證明這一結(jié)果明顯偏低。簡新華和黃錕(2010)對Logistic 模型作對數(shù)變換后擬合中國城鎮(zhèn)化率,結(jié)果顯示模型擬合誤差呈逐步擴大的趨勢,存在顯著系統(tǒng)性差異。曹飛(2012)基于突變結(jié)構(gòu)理論對中國城鎮(zhèn)化水平進行Logistic 模擬,指出1995年為結(jié)構(gòu)突變點,表明城鎮(zhèn)化發(fā)展受到某些外部因素的影響。
結(jié)合以上學(xué)者的研究可以發(fā)現(xiàn),雖然Logistic 增長模型在城鎮(zhèn)化水平增長曲線擬合方面具有一定適用性,但這一模型不太適用于中國,原因在于:“S”型增長曲線是基于美國等發(fā)達國家城鎮(zhèn)化進程而得到的,中國城鎮(zhèn)化水平顯然并不滿足“S”型曲線的典型特征,實際應(yīng)用中需對模型結(jié)構(gòu)做出調(diào)整。將Logistic 增長模型運用于中國城鎮(zhèn)化進程擬合及預(yù)測時,需要格外關(guān)注三個方面的問題:(1)中國城鄉(xiāng)人口增長率之差不為常數(shù)。經(jīng)典“S”型增長曲線假設(shè)城鄉(xiāng)人口增長率之差保持不變,但人口普查數(shù)據(jù)顯示中國城鄉(xiāng)人口增長率處于不斷波動之中。(2)城鎮(zhèn)化率的飽和值難以確定。經(jīng)典“S”型增長曲線假設(shè)城鎮(zhèn)化率飽和值為100%,但結(jié)合世界城鎮(zhèn)化進程和中國經(jīng)濟社會發(fā)展情況,飽和值取100%顯然是不切實際的。此外,這一飽和值是基于城鄉(xiāng)人口增長率之差為常數(shù)這一條件推出的,若城鄉(xiāng)人口增長率之差不為常數(shù),則城鎮(zhèn)化率飽和值不可能為100%。(3)中國城鎮(zhèn)化發(fā)展進程并不符合Logistic 增長模型特征。自1949年新中國成立以來,城鎮(zhèn)化水平增長曲線呈現(xiàn)“快—慢—快”的特征,這與Logistic 增長模型“慢—快—慢”的曲線特征有較大差異。
城鎮(zhèn)化作為一種重要的社會經(jīng)濟現(xiàn)象,其發(fā)展是一個動態(tài)過程,兼具一定的運行規(guī)律。作為一種動態(tài)擬合方法,時間序列分析模型以年份為自變量,以城鎮(zhèn)化水平為因變量,根據(jù)城鎮(zhèn)化水平的變動特征構(gòu)建合適的時間序列模型,以對城鎮(zhèn)化水平進行擬合與預(yù)測。
時間序列模型的種類繁多,需要學(xué)者根據(jù)時間趨勢圖、自相關(guān)和偏自相關(guān)系數(shù)等信息來選取適合的模型。常見的時間序列模型有AR(p)、MR (q) 和ARMA (p,q) 等,模型具體結(jié)構(gòu)分別為:
其中,yt為城鎮(zhèn)化率,{εt} 為白噪聲。
李林杰和金劍(2005)對1949-2004年城鎮(zhèn)化水平數(shù)據(jù)作一階差分后建立AR(1)和ARMA(1,2)模型擬合,比較發(fā)現(xiàn)AR(1)模型的擬合精度較高,預(yù)測2010年城鎮(zhèn)化率為44.67%,事實證明這一預(yù)測值是偏低的。張松林和熊紅軼(2009)對1949-2007年中國城鎮(zhèn)化率進行時間序列分析,認為城鎮(zhèn)化水平提高主要受滯后一期和滯后五期的隨機誤差影響,預(yù)測2010年城鎮(zhèn)化率為46.59%。丁剛(2010)采用PDL 和ARMA 模型的組合方法,構(gòu)建基于時間序列分析的混合有限PDL 模型,預(yù)測2010年中國城鎮(zhèn)化率為51.41%,這一預(yù)測結(jié)果偏高。
時間序列分析作為一種動態(tài)分析方法,能夠?qū)Τ擎?zhèn)化水平進行擬合與預(yù)測,通常模型預(yù)測精度也較高。然而,時間序列分析存在兩大缺陷:一是模型結(jié)構(gòu)較為復(fù)雜,學(xué)者通常需要根據(jù)自身經(jīng)驗和主觀判斷選取所要構(gòu)建的模型;二是時間序列模型只能反映城鎮(zhèn)化水平的發(fā)展進程,而無法解釋背后原因,故只適用于預(yù)測而不能開展經(jīng)濟解釋。
城鎮(zhèn)化與經(jīng)濟發(fā)展是密切相關(guān)的,這一方法通過選取與城鎮(zhèn)化水平具有一定相關(guān)性的經(jīng)濟指標,以其作為解釋變量來構(gòu)建城鎮(zhèn)化水平的回歸模型,如簡單線性回歸模型、對數(shù)線性回歸模型、非線性回歸模型等。該方法的核心思想是根據(jù)相關(guān)經(jīng)濟變量的變動情況來預(yù)測未來的城鎮(zhèn)化水平。以多元線性回歸和對數(shù)線性回歸為例,具體模型為:
其中,Y 為城鎮(zhèn)化率指標,Xi(i=1,…,n) 為與城鎮(zhèn)化水平相關(guān)的經(jīng)濟指標,μ 為隨機擾動項,式 (9)為簡單線性回歸模型,式(10) 為對數(shù)線性回歸模型。
周一星(1995)建立城鎮(zhèn)化指數(shù)與經(jīng)濟發(fā)展指數(shù)之間的對數(shù)回歸模型,對城鎮(zhèn)化水平進行擬合;基于城鎮(zhèn)化水平與工業(yè)化、經(jīng)濟發(fā)展之間的相關(guān)關(guān)系,可以構(gòu)建城市化率與工業(yè)勞動人口比重的一元回歸模型來擬合城鎮(zhèn)化水平。李迅等(2000)構(gòu)建城鎮(zhèn)化率與人均GDP的對數(shù)線性回歸模型,預(yù)測中國2020年城鎮(zhèn)率約為52%,這一預(yù)測結(jié)果明顯偏低。王金營(2003)分別建立城鎮(zhèn)化率與人均GDP 的線性回歸模型和Logistic 曲線模型,經(jīng)檢驗發(fā)現(xiàn)線性回歸模型的擬合精度較高。
城鎮(zhèn)化水平與經(jīng)濟變量的回歸模型受到學(xué)者廣泛青睞的主要原因是模型構(gòu)建簡單,同時易于對結(jié)果做出經(jīng)濟解釋,這是回歸模型的優(yōu)勢所在。然而,此類模型存在兩大問題:一是虛假回歸問題,雖然城鎮(zhèn)化與眾多經(jīng)濟指標之間存在一定的相關(guān)關(guān)系,但從長期看卻不一定是均衡關(guān)系,而基于非協(xié)整的變量關(guān)系構(gòu)建回歸模型時可能造成虛假回歸;二是解釋變量的選擇問題,城鎮(zhèn)化是一個錯綜復(fù)雜的社會經(jīng)濟現(xiàn)象,難以將眾多影響因素考慮周全,因此構(gòu)建回歸模型時面臨著變量取舍的問題。
除以上三種擬合方法與模型外,部分學(xué)者還嘗試使用灰色預(yù)測模型和BP 神經(jīng)網(wǎng)絡(luò)模型等來對中國城鎮(zhèn)化發(fā)展水平進行擬合。白先春和李炳?。?006)針對1992-2003年城鎮(zhèn)化率數(shù)據(jù),構(gòu)建新陳代謝GM(1,1) 模型,發(fā)現(xiàn)模型擬合誤差與時間間隔存在顯著正相關(guān)。郭志儀和丁剛(2006)以人均GDP 為特征向量,城鎮(zhèn)化率為響應(yīng)變量,建立BP神經(jīng)網(wǎng)絡(luò)模型擬合城鎮(zhèn)化水平與經(jīng)濟發(fā)展水平之間的復(fù)雜關(guān)系,擬合精度顯著優(yōu)于普通線性模型。
無論是灰色預(yù)測模型還是BP神經(jīng)網(wǎng)絡(luò)模型,都還存在一些弊端。灰色預(yù)測模型要求數(shù)據(jù)期數(shù)較短,長序列的擬合誤差通常大于短序列,故不適用于城鎮(zhèn)化水平這類長期增長曲線的擬合;BP 神經(jīng)網(wǎng)絡(luò)模型雖然擬合精度較高,但由于其“黑箱”性質(zhì)和慣性特征,難以對結(jié)果做出經(jīng)濟解釋,且誤差率可能隨預(yù)測期數(shù)延長而激增。
綜上所述,現(xiàn)有的城鎮(zhèn)化水平擬合模型均存在一定缺陷與不足。中國城鎮(zhèn)化水平不滿足“S”型曲線特征,故Logistic 增長模型并不適用;時間序列模型在模型形式選擇上存在主觀性,且只適合于預(yù)測而不適用于經(jīng)濟解釋;回歸模型難以將所有影響因素考慮周全,且容易造成虛假回歸;灰色預(yù)測模型不適用于長期數(shù)據(jù),神經(jīng)網(wǎng)絡(luò)模型具有“黑箱”性質(zhì)。因此,有必要嘗試引入一種新方法——自動分段曲線擬合,開展中國城鎮(zhèn)化水平擬合及預(yù)測。
多項式曲線擬合是一種常用的數(shù)據(jù)擬合方法,當(dāng)數(shù)據(jù)點較多時,只采用一種多項式曲線函數(shù)進行擬合往往難以取得較好的擬合精度和效果。因此,一種改進思路是先對數(shù)據(jù)進行分段,分別采用不同的函數(shù)形式加以擬合,即分段曲線擬合方法。然而,傳統(tǒng)分段曲線擬合主要依據(jù)主觀經(jīng)驗和數(shù)據(jù)散點圖來確定分段區(qū)間和經(jīng)驗函數(shù),遇到復(fù)雜數(shù)據(jù)時可能出現(xiàn)較大偏差(蔡山等,2007)。為解決這一問題,本文擬采用自動分段曲線擬合,該方法具有兩大優(yōu)點:一是根據(jù)不同函數(shù)形式的擬合誤差,自動確定擬合精度較高的經(jīng)驗函數(shù)形式;二是自動確定分段區(qū)間,并在每個區(qū)間內(nèi)進行最小二乘擬合。
數(shù)據(jù)擬合方法較多,具體包括簡單線性擬合、對數(shù)線性擬合、二次曲線擬合、指數(shù)擬合、冪函數(shù)擬合等。一般來說,通過觀察數(shù)據(jù)分布散點圖可確定大致的擬合函數(shù),但這一方式較為主觀。自動分段曲線擬合的優(yōu)勢在于能夠客觀地選取最優(yōu)經(jīng)驗函數(shù),主要基于兩個條件:(1)歷史數(shù)據(jù)點誤差符號相反的個數(shù)之差小于調(diào)節(jié)參數(shù);(2)分別計算不同擬合函數(shù)誤差的方差,取方差最小者為最優(yōu)經(jīng)驗函數(shù)。誤差方差的數(shù)學(xué)表達式為:
其中,r1為第一數(shù)據(jù)點的擬合誤差,ri為后續(xù)數(shù)據(jù)點的擬合誤差,可理解為相較于第一數(shù)據(jù)點來說,各數(shù)據(jù)點誤差的波動大小。s2越小,表示各數(shù)據(jù)點的誤差越接近,擬合精度越高。通過觀察時間趨勢圖,發(fā)現(xiàn)中國城鎮(zhèn)化水平存在明顯的長期趨勢且波動幅度較小,結(jié)合曲線特征,采用直線函數(shù)、對數(shù)函數(shù)、指數(shù)函數(shù)和多項式函數(shù)四種典型的回歸方程分別進行擬合,選取最優(yōu)經(jīng)驗函數(shù)的流程圖如圖1 所示。
圖1 選取最優(yōu)經(jīng)驗函數(shù)的流程
圖1 中,直線擬合方程為y=ax+b;對數(shù)擬合方程為y=logax;指數(shù)擬合方程為y=beax;多項式擬合方程為pn。
在確定最優(yōu)經(jīng)驗函數(shù)后,可以得到各數(shù)據(jù)點的擬合誤差,由此計算出誤差絕對值的均值,記為S,計算公式為:
為防止分段區(qū)間過多導(dǎo)致過擬合,結(jié)合模型擬合效果,在此將調(diào)節(jié)參數(shù)設(shè)置為4,即若出現(xiàn)連續(xù)四個數(shù)據(jù)點的誤差絕對值大于S,那么就從第一個數(shù)據(jù)點處分段,并對分段點后的數(shù)據(jù)重新選取最優(yōu)經(jīng)驗函數(shù)進行擬合。依此類推,直至不會出現(xiàn)連續(xù)四個數(shù)據(jù)點的誤差絕對值大于S 的情況。
新中國成立以來,受到國際局勢和國內(nèi)政策的影響,城鎮(zhèn)化道路可謂是一波三折,城鎮(zhèn)化率也呈現(xiàn)出較大波動。改革開放后,中國城鎮(zhèn)化才步入一個平穩(wěn)發(fā)展期。本文選取1978-2020年中國城鎮(zhèn)化率數(shù)據(jù),構(gòu)建自動分段曲線擬合模型,擬合結(jié)果見表1 所示。
表1 中國城鎮(zhèn)化率與擬合值比較
對于1978-2020年中國城鎮(zhèn)化水平的擬合,模型自動將其分為四段:1978-1983年、1984-1991年、1992-1999年和2000-2020年,分別選取二次多項式函數(shù)、二次多項式函數(shù)、指數(shù)函數(shù)、直線函數(shù)作為最優(yōu)經(jīng)驗函數(shù)進行擬合。設(shè)1978年t=1(t 為正整數(shù)),四個分段區(qū)間的模型表達式分別為:
結(jié)合城鎮(zhèn)化發(fā)展歷程,這四個分段區(qū)間分別與國家重大戰(zhàn)略決策相對應(yīng):1984年中央實行經(jīng)濟體制改革,明確提出加快以城市為重點的改革步伐;1992年鄧小平南方談話重申深化改革的必要性,進一步明確擴大開放,刺激了大規(guī)模的人口流動;2000年,中央發(fā)布《關(guān)于促進小城鎮(zhèn)健康發(fā)展的若干意見》,指出加快城鎮(zhèn)化進程的時機和條件已經(jīng)成熟??梢?,模型分段點符合實際背景,具有現(xiàn)實意義。
由表1 可知,模型擬合精度較高,相對誤差控制在5%以內(nèi),且擬合誤差隨時期變動呈下降趨勢。結(jié)合擬合效果圖可知,各個分段區(qū)間內(nèi)城鎮(zhèn)化水平變動趨勢符合相應(yīng)的最優(yōu)經(jīng)驗函數(shù)特征,模型擬合存在合理性。同時,擬合曲線與實際曲線間距離不斷縮小,21 世紀以來中國城鎮(zhèn)化進入穩(wěn)定的高速增長階段,2000-2020年這一區(qū)間內(nèi)的平均擬合誤差也達到最小。進一步利用自動分段曲線模型對未來中國城鎮(zhèn)化率進行預(yù)測,為保證預(yù)測精度,僅將預(yù)測期延長至2025年,結(jié)果見表2。2021-2025年中國城鎮(zhèn)化水平平均每年提升1.47 個百分點,2025年城鎮(zhèn)化水平預(yù)計達71.22%。
表2 中國城鎮(zhèn)化率預(yù)測結(jié)果
針對現(xiàn)有的各類城鎮(zhèn)化水平擬合方法存在一些缺陷與不足,本文嘗試構(gòu)建自動分段曲線模型進行改革開放以來中國城鎮(zhèn)化水平的擬合,并預(yù)測2021-2025年中國城鎮(zhèn)化發(fā)展趨勢,得到以下結(jié)論:其一,自動分段曲線擬合模型能夠有效處理結(jié)構(gòu)變動問題,客觀選取分段區(qū)間和經(jīng)驗函數(shù),模型擬合精度較高,可解釋性強;其二,自動分段曲線模型適用于中國城鎮(zhèn)化水平的擬合及預(yù)測,為預(yù)測城鎮(zhèn)化水平提供了新的思路與經(jīng)驗;其三,21 世紀以來,中國城鎮(zhèn)化發(fā)展進入穩(wěn)定的高速增長階段,年均城鎮(zhèn)化率提高1.4個百分點,自動分段曲線模型預(yù)測2025年中國城鎮(zhèn)化率將突破70%,達到71.22%左右。
需要指出的是,將自動分段曲線擬合模型用于中長期預(yù)測時,預(yù)測精度可能隨時期發(fā)展而有所下降,這是由于該模型對原始序列進行分段處理,在各區(qū)間內(nèi)使用不同的經(jīng)驗函數(shù)擬合,故對未來進行預(yù)測時沒有利用到原始數(shù)據(jù)的全部信息,存在一定的信息損失。為解決這一問題,可通過適當(dāng)調(diào)整模型參數(shù)以達到更好的長期預(yù)測效果。