吳忠誠, 朱家明, 鄧卓航
(1.安徽財經(jīng)大學 統(tǒng)計與應用數(shù)學學院,安徽 蚌埠 233030; 2.安徽財經(jīng)大學 管理科學與工程學院,安徽 蚌埠 233030)
隨著我國經(jīng)濟的快速發(fā)展,普通家庭可支配收入越來越多,這一切為追求高品質生活帶來可能,宜居城市逐漸成為新時期選擇概念.宜居城市的主要影響因素包括人均可支配收入、環(huán)境、房價、醫(yī)療等,本文試圖就城市的適宜居住條件,綜合城市的主要指標,給出劃分適宜的量化標準來對城市適宜進行綜合評價.經(jīng)查閱諸多文獻,發(fā)現(xiàn)當前研究文獻所采取評價體系在權重的賦值上都帶有很強的主觀因素,這會導致結果偏向研究者的預先設想,從而降低結果的可靠性.若為了研究結果可靠而通過問卷統(tǒng)計賦權,則會耗用大量的人力物力且會拖長研究的時間,進而影響研究進度.本文就此目的,來挖掘對城市的宜居性產(chǎn)生顯著影響的因素指標,并對此進行篩選,找出主成分,建立一套基于影響指標的模糊評價體系,推廣并應用到實際.這對于居民綜合選擇宜居城市給出有效的建議,同時指出了另外城市不宜居的內(nèi)在原因所在,為提高和完善各城市建設與發(fā)展指明方向.
本文的數(shù)據(jù)均來源于各個城市的統(tǒng)計年鑒和統(tǒng)計局官網(wǎng),為了保證數(shù)據(jù)的準確定,查閱宿遷、連云港、宿州、商丘、濟寧、棗莊、徐州、淮北8個城市2016年的《統(tǒng)計年鑒》和各城市的統(tǒng)計局數(shù)據(jù)如表1.為了便于解決問題,提出兩條假設:所選取的20個初始指標已經(jīng)覆蓋了宜居評價的所有方面;評價指標中各個數(shù)據(jù)來源準確、有效.
表1八個城市的各評價指標數(shù)據(jù)
宜居性評價指標宿遷連云港宿州商丘濟寧棗莊徐州淮北社會保障覆蓋率/%84.781.482.283.883.082.081.681.8刑事案件破案/(件·a-1)120.7106.8223.7189.8149.2154.2182.3261.0流動人口就業(yè)率/%74.178.470.572.783.976.286.370.1人均生產(chǎn)總值/元4356648535225262485448702530146165635220第三產(chǎn)業(yè)貢獻率/%39.442.540.437.441.439.746.234.1GDP年增長率/%10.19.99.76.75.62.67.20.0社會職工勞動生產(chǎn)率/%906179755567629692111017898868011009470792教育支出占GDP的比率/%3.93.44.53.92.82.32.92.9人均公共綠地面積/m318.446.49.97.510.619.918.619.6年空氣質量指數(shù)高二級天數(shù)242260182190255194225219生活垃圾無害化處理率/%88.295.289.490.597.691.793.688.7工業(yè)三廢綜合處理率/%55.154.945.544.150.452.649.038.7噪聲達標區(qū)覆蓋率/%95.695.893.192.394.996.394.690.2人均可用淡水資源總量/m3424.5400.0602.0280.0558.0400.0394.0373.0公共交通分擔/(輛·萬人-1)5.88.93.96.59.85.511.65.2城市燃氣管道覆蓋率/%95.596.794.293.396.694.397.193.5城鎮(zhèn)人均住房面積/m245.643.935.540.737.638.636.138.9每萬人擁有的醫(yī)生數(shù)18.419.512.918.822.720.123.419.4甲乙類傳染的病發(fā)率/%98.299.4113.9104.186.292.1124.2118.6生命線工程完工率/%69.870.070.075.680.072.076.060.0
注:表1的部分數(shù)據(jù)的來源無法從《統(tǒng)計年鑒》和統(tǒng)計信息網(wǎng)站上直接獲取,需進行相應的轉換處理,但數(shù)據(jù)的有效性可以得到保證.
為了得到較全面地對城市的宜居性做出評價的指標,依據(jù)2016年12月最新出臺的“宜居城市科學評價標準[1]”,選取社會文明、經(jīng)濟富裕、環(huán)境優(yōu)美、資源承載、生活便宜、公共安全六個方面作為二級指標.這六個方面融合了廣大專家和社會公眾的智慧,簡繁得當、權重合理,可操作性強,達到了較高水平,對于貫徹科學發(fā)展觀、構建和諧社會,指導全國各城市規(guī)劃、建設、管理,具有較高的科學指導價值和實用價值.然后再對六個方面二級指標下面僅僅選取易于統(tǒng)計數(shù)據(jù)和具有代表性的城市宜居評價指標,可構建出宜居性評價指標體系[2],如圖1所示.
圖1 影響城市宜居的評價指標體系
針對表1中的八個城市各評價指標數(shù)據(jù),考慮到初始選定評級指標中會存在變量數(shù)據(jù)之間存在較大關聯(lián)度,可選擇用主成分分析法進行相應的指標篩選.對消除量綱后的一致性數(shù)據(jù)進行因子分析并抽取主成分[3],最后對主成分的的可靠性進行相關系數(shù)檢驗.
1)截面數(shù)據(jù)消除量綱
考慮到表1中數(shù)據(jù)屬于統(tǒng)計學中截面數(shù)據(jù),而截面數(shù)據(jù)存在數(shù)據(jù)非一致性的特性,故先進行數(shù)據(jù)的標準化.采用min-max標準化,對原始數(shù)據(jù)進行線性變換.設mina和maxa分別為屬性a的最小值和最大值,將a的一個原始值x通過min-max標準化映射成在區(qū)間[0,1]中的值x,其公式為:
2)數(shù)據(jù)的因子分析
對上述消除量綱后的具有一致性的數(shù)據(jù)進行SPSS降維因子分析[4],僅僅選取得到對總的數(shù)據(jù)貢獻率為1的前七個宜居性評價指標的總方差解釋表2.
表2部分總方差解釋表
因子成分初始特征值提取平方和的平方和特征值特征值百分比累積占比/%特征值特征值百分比累積占比/%19.17345.86545.8659.17345.86545.86523.59917.99663.8623.59917.99663.86232.47212.36076.2212.47212.36076.22141.8649.32185.5421.8649.32185.54251.3116.55592.0971.3116.55592.09760.9404.70196.79970.6403.201100.000
在表2中,特征值的大小反映了公因子的方差貢獻.特征值百分比為特征值占方差的百分數(shù).方差累積占比為特征值占百分數(shù)的累加值.抽取平方和載入欄為根據(jù)特征值大于1的原則抽取的5個因子的特征值,占方差百分數(shù)及其累加值.這5個因子能夠較全面的反映92.10%的信息.故可以用這五個因子來代表原研究過程中的20個評級指標,極大地簡化了運算的復雜度,為后續(xù)的研究提供了方便.
3)主成分提取
為了得到這五個主成分所代表的原數(shù)據(jù)指標.采用SPPS軟件進行因子得分計算,計算結果顯示:五種主成分分別是GDP年增長率(%)、社會職工勞動生產(chǎn)(萬元/人)、人均公共綠地面積(平方米)、人均可用淡水資源總量(m3)、甲乙類傳染的病發(fā)率(例/10萬).為了后續(xù)研究的需要,我們分別對以上五個變量賦予變量符Xi(i=1,2,3,…,5).
4)相關系數(shù)檢驗
從分析的結果可以看出,雖然對于城市宜居性產(chǎn)生影響的指標有很多,但是其中的大部分指標之間都存在一定的相關性,采用主成分提取技術可以將其中五個在顯著性的水平下不能相互替代的指標數(shù)據(jù)提取出來,為了證實所得到的指標之間沒有明顯的相關關系,采用相關系數(shù)分析法進行驗證[5],驗證所需的公式為
使用統(tǒng)計軟件STATA進行計算相關系數(shù)矩陣如下:
相關系數(shù)矩陣顯示在不考慮其他影響因素的情況之下,以上五個主成分之間存在非常弱的相關關系.即驗證了了所得到的五個主成分的相對獨立性.
“宜居性”是一個較為模糊的概念,本文采用模糊評價模型,對上述八個城市建立模糊評價模型,對上述城市在宜居性這一個方面劃歸為三類,即適宜居住、較適宜居住、較不適宜居住.
1)數(shù)據(jù)預處理
在進行模糊聚類之前,因為所要進行聚類的數(shù)據(jù)分為兩種類型,即越大越好的數(shù)據(jù)和越小越好的數(shù)據(jù).為了進行合理的標準化,采用如下的量化標準[6].
其中:sij為第j個城市的第i個指標的標準值;cij為評價體系中根據(jù)實際查閱資料所得到的第j個城市的第i個指標的實測值;cmin為所對應指標中的最小值乘以1.05;cmax為所對應指標中的最大值乘以1.05;得到標準化后的八個城市的五個指標數(shù)據(jù)表3.
表3八個城市主要指標數(shù)據(jù)
城市GDP年增長率社會職工勞動生產(chǎn)率人均公共綠地面積人均可用淡水資源總量甲乙類傳染的病發(fā)率宿遷1.55981.22270.95790.96711.2474連云港1.5291.65543.50630.78551.2009宿州1.4981-0.21090.18432.28250.6394商丘1.0347-0.1122-0.0341-0.10381.0189濟寧0.86491.91940.2481.95651.7121棗莊0.40151.10191.09440.78551.4836徐州1.1122.43730.97610.74110.2405淮北0-0.01371.06710.58550.4574
2) 進行模糊C均值聚類[7]
把以上八個城市每行五個指標數(shù)據(jù)作為一個向量xi(i=1,2,…,8)分為3個模糊組(即適宜居住、較適宜居住和較不適宜居住),并求每組的聚類中心,使得非相似性指標的目標函數(shù)達到最小,而每個給定數(shù)據(jù)點用0~1之間的隸屬度來確定其屬于各個組的程度.
其中:dik=‖xk-vi‖表示第k個序列到第i類中心的歐幾里得距離.
由拉格朗日乘數(shù)法構造新的輔助函數(shù):
當Y(X,v1,v2,v3)取得最小值的必要條件是:
和
因上述兩個必要條件的存在,模糊C均值聚類算法就可以看成如下迭代過程:
①取定c,m和初始隸屬度矩陣U0,迭代步數(shù)I=0;
②計算聚類中心V為:
③修正的U:
在Matlab軟件中調(diào)用fcm函數(shù)進行編寫程序,求解最終對上述的8個城市的樣本的分類結果如表4所示. 表4中聚類的結果表示:在所要進行分析的八個城市中,宿遷、濟寧、棗莊和徐州表現(xiàn)出了較好的宜居性,城市連云港相對于上面四個城市而言,其宜居性稍差一些,而宿州、商丘和淮北這三個城市在此次聚類中相比較而言的宜居性最差.為了檢驗模糊C均值聚類結果的準確性,對上述模糊C均值聚類的有效性進Friedman檢驗.
表4各個城市宜居程度聚類
類別適宜居住較適宜居住較不適宜居住城市名稱宿遷濟寧棗莊徐州連云港宿州商丘淮北
的周圍,統(tǒng)計量
Q≥c
其中:臨界值c由PH0{Q≥c}=α確定,此檢驗稱為Friedman檢驗[8].
對于檢驗水平α=0.05,使用軟件Matlab編程后采取各類別之間檢驗,分別得到所分的三類樣本數(shù)據(jù)之間的的非參數(shù)檢驗P值如表5.
表5各類別之間的Friedman檢驗P值
宜居類別適宜居住較適宜居住不適宜居住類別樣本間非參P值0.35921.00000.4021
顯然,各類別之間的檢驗全部接受原假設,即分類后的各個城市樣本之間的差異性很小,可以分為一類.符合聚類的基本原則.
本文就現(xiàn)代城市的宜居性做出了一套完整的評價方案.盡管模型的主成分分析和模糊C均值聚類的結果每一步都進行檢驗,但是作為對于現(xiàn)代城市的各項數(shù)據(jù)之間的復雜關系,僅僅用這一種方法是稍有片面的,不能較完整的分析出正確的結論.對于整個模型來說,最大的特點是將城市的一個較為模糊的宜居概念,通過數(shù)據(jù)的處理轉化、分析數(shù)據(jù)所能承載的最大信息并對城市做出一個合理的評價.但是因考慮到研究內(nèi)容的簡潔性,本文所選取的評價指標只是所有指標中較小的一部分,這也決定了最終模糊分類會存在一定的誤差,但這并不影響整個模型的評價效用,后續(xù)的研究只需在此論文的基礎上再做調(diào)整即可.對于這種模糊概念量化綜合評價模型,不僅僅可以評價城市的宜居度,還可以推廣到城市的教育水平、衛(wèi)生情況等領域.具有較高的研究和發(fā)展價值.
[1] 中國城市科學研究會.宜居城市科學評價標準[R].中華人民共和國建設部科技司:中華人民共和國建設部科技司, 2007.
[2] 全少莉,劉養(yǎng)潔.我國主要城市的宜居性評價[J].山西師范大學學報:自然科學版,2010,24(2):112-116.
[3] 朱曉峰.主成分分析與因子分析在體育科研中的應用研究[D].蕪湖:安徽師范大學,2006.
[4] 李 欣,張明明.SPPS22.0統(tǒng)計分析[M]. 北京:電子工業(yè)出版社, 2015.
[5] 朱存斌,朱家明,陳巖.葡萄酒質量的評價與分析[J]. 佳木斯大學學報:自然科學版,2013,31(3):419-424.
[6] 李麗萍,吳祥裕.宜居城市評價指標體系研究[J].中共濟南市委黨校學報,2017(1): 16-21.
[7] 楊桂元.數(shù)學建模[M]. 上海:上海財經(jīng)大學出版社, 2015.
[8] 王炯滔,金 明,李有明,等.基于Friedman檢驗的非參數(shù)協(xié)作頻譜感知方法[J].電子與信息學報,2014(1): 61-66.