陳路明 李沛鴻
摘要:以福州市2001-2013年建成區(qū)用地面積及社會經(jīng)濟發(fā)展各類數(shù)據(jù)為基礎(chǔ),利用嶺回歸分析對建成區(qū)用地規(guī)模的預(yù)測方程加以參數(shù)校正,重新選擇變量,并再次建立新的嶺回歸模型。利用新建立的模型計算出2014-2017年建成區(qū)用地規(guī)模的預(yù)測值,加以驗證。研究表明,模型的精度具有一定可靠性,可為福州市建成區(qū)用地規(guī)劃管理提供相關(guān)建議。
Abstract: Based on the data of land area and social and economic development of built-up areas in Fuzhou from 2001 to 2013, ridge regression analysis was used to correct the prediction equation of the scale of land use in built-up areas, reselect variables, and establish a new ridge regression model. The newly established model was used to calculate the predicted value of the land use scale of the built-up area from 2014 to 2017 and verify it. The research shows that the accuracy of the model has certain reliability, which can provide relevant suggestions for the planning and management of land use in built-up areas of Fuzhou.
關(guān)鍵詞:嶺回歸;選擇變量;預(yù)測
Key words: ridge regression;selection variable;prediction
中圖分類號:TU984.2? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標(biāo)識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)09-0232-02
0? 引言
隨社會的不斷發(fā)展,城市建成區(qū)也在不斷擴張,土地供需的矛盾日益嚴(yán)重。由于城市建成區(qū)土地的難以逆轉(zhuǎn)性,為保障土地資源的合理分配及可持續(xù)性利用,防止城市的無序擴張與蔓延,對建成區(qū)用地規(guī)模進行預(yù)測具有十分的必要性。普通的最小二乘估計面對多重共線性問題時,預(yù)測的結(jié)果往往不盡人意,文章發(fā)現(xiàn),使用嶺回歸分析可以較好的解決此類問題。
1? 研究方法
有多重線性回歸模型Y=X?茁+?著,則?茁的最小二乘估計為:。其中?茁為待估參數(shù),X為自變量的n×m階的矩陣,X′為X的轉(zhuǎn)置,X′X為對稱m×m方陣,(X′X)-1為X′X的逆矩陣,Y為因變量n×1的向量。m為待估回歸系數(shù)的個數(shù),n為觀測數(shù)。當(dāng),X′X非滿秩或至少有一個特征根接近零時,最小二乘估計模型預(yù)測的結(jié)果會產(chǎn)生一定偏差,預(yù)測結(jié)果會不理想。而嶺回歸可解決此問題,對多重線性回歸模型的回歸系數(shù)估計方法為:。[1]即X′X矩陣主對角線元素上添加非負(fù)的因子k,Im為m階單位矩陣,k>0時,k被稱為嶺參數(shù)。當(dāng)k取值不同,得到嶺估計也不同。當(dāng)k取零時,就是?茁的最小二乘估計。k取值在,對任意i,有?茁(k)對應(yīng)的第i個分量?茁i(k)取值為k的函數(shù),將直角坐標(biāo)系中點■的點的變化軌跡稱之為嶺跡。相對于最小二乘估計,嶺估計就是把X′X變換成了X′X+kIm。X為病態(tài)矩陣時,X′X的特征根至少有一個十分趨近于0,X′X+kIm的特征根就變成了其中有一些趨近于0的特征根會被加以改善,由此便解決了原設(shè)計陣復(fù)共線性的問題。[2]
2? 模型的建立
2.1 驅(qū)動因素分析
本文通過對福州市2001-2013年的統(tǒng)計年鑒數(shù)據(jù)進行分析,由可獲得性及福州市建成區(qū)面積變化的特征,篩選出了農(nóng)村人口X1(萬人)、城鎮(zhèn)人口X2(萬人)、建成區(qū)綠化面積X3(公頃)、第一產(chǎn)業(yè)所占比X4(%)、年底實有道路總長X5(公里)、地區(qū)生產(chǎn)總值X6(億元)、年底公路通車?yán)锍蘕7(公里)、年底竣工面積X8(萬平方米)共8個與建成區(qū)面積Y相關(guān)性皆大于0.9的因子構(gòu)驅(qū)動因子的指標(biāo)體系。
2.2 嶺回歸模型分析
對數(shù)據(jù)加以處理,構(gòu)建嶺回歸模型,得到8個驅(qū)動因子的嶺跡圖如圖1(a)所示。根據(jù)嶺回歸選擇變量的標(biāo)準(zhǔn),剔除掉變量X1、X4、X7和X8,重新構(gòu)建嶺回歸模型,得到4個驅(qū)動因子的嶺跡圖如圖1(b)所示。
由圖1(b)可看出,剔除掉變量X1、X4、X7和X8后,嶺回歸系數(shù)變化幅度明顯變小,當(dāng)嶺參數(shù)k的值接近0.05的時候,所對應(yīng)的各個參數(shù)已趨于穩(wěn)定。所以選取k=0.05,得到嶺回歸方程為:
2.3 預(yù)測結(jié)果
運用所構(gòu)建的嶺回歸模型對2014-2017年福建省建成區(qū)用地規(guī)模進行預(yù)測,將所得的結(jié)果與實際值進行比較,具體如表1所示。
3? 結(jié)論
①由變量城鎮(zhèn)人口X2、建成區(qū)綠化面積X3、年底實有道路總長X5、地區(qū)生產(chǎn)總值X6構(gòu)建的嶺回歸模型預(yù)測的結(jié)果滿足精度要求。②雖然對2014-2017年建成區(qū)預(yù)測的誤差都控制在3%以內(nèi),但是越往后誤差越大,所以建立的嶺回歸模型只能用于中短期預(yù)測。
參考文獻:
[1]余長坤,宋文博,等.基于嶺回歸與灰色耦合模型的建設(shè)用地規(guī)模預(yù)測——以河南省焦作市為例[J].地域研究與開發(fā),2015,34(01):155-159.
[2]賈敏,張永彬,韓子斌.基于嶺回歸的城市建成區(qū)面積預(yù)測研究[J].華北理工大學(xué)學(xué)報(自然科學(xué)版),2019,41(04):19-24.
[3]馮浩程,邵俊馳,耿鑫,田玉柱.基于嶺回歸建模的洛陽市旅游收入統(tǒng)計分析[J].價值工程,2019,38(14):4-6.
作者簡介:陳路明(1991-),男,江西贛州人,碩士研究生,主要研究方向為機器學(xué)習(xí)、城市研究與建模等。