◇徐 偉 高 帆
為促進(jìn)國(guó)家中部地區(qū)崛起,推動(dòng)中原城市群科學(xué)發(fā)展,建造中國(guó)經(jīng)濟(jì)增長(zhǎng)新引擎,2016年12月國(guó)家發(fā)改委印發(fā)《中原城市群發(fā)展規(guī)劃》,文中提出構(gòu)建“一核四軸四區(qū)”的中原城市群網(wǎng)絡(luò)化空間格局。中原城市群地處“兩橫三縱”城市化戰(zhàn)略格局通道與京廣線交會(huì)區(qū)域,交通區(qū)位優(yōu)勢(shì)顯著,人力資源豐富,城鎮(zhèn)空間聚合形態(tài)較好,城鎮(zhèn)化率達(dá)到51.46%,城鄉(xiāng)協(xié)調(diào)發(fā)展格局初步形成。
房地產(chǎn)投資在促進(jìn)中原城市群經(jīng)濟(jì)快速增長(zhǎng)、增加財(cái)政收入及加快城市化進(jìn)程中發(fā)揮了重要作用。沈悅、劉洪玉(2004)通過對(duì)住宅價(jià)格與經(jīng)濟(jì)基本面進(jìn)行研究,得出房地產(chǎn)價(jià)格與經(jīng)濟(jì)基本面之間存在密切聯(lián)系。然而,伴隨房地產(chǎn)價(jià)格增長(zhǎng)和市場(chǎng)規(guī)模膨脹,社會(huì)資金分配機(jī)制扭曲和資源配置與利用效率降低等問題也逐步加劇。諸多因素影響房地產(chǎn)市場(chǎng)價(jià)格,通過建立模型,將這些影響因素與房地產(chǎn)市場(chǎng)做關(guān)聯(lián)度分析,能夠總結(jié)出規(guī)律性的特征。城鎮(zhèn)化率直接反映了城市人口數(shù)量,城鎮(zhèn)化率的提高意味著農(nóng)村人口向城市轉(zhuǎn)移,促使城市住房剛性需求增長(zhǎng),帶動(dòng)房地產(chǎn)價(jià)格上漲,通過建立杜賓模型得出,城鎮(zhèn)化是近年來推動(dòng)房地產(chǎn)價(jià)格上漲的重要因素(王鶴,2007)。
學(xué)者們通過建立模型,在微觀與宏觀層面對(duì)影響房地產(chǎn)價(jià)格因素進(jìn)行統(tǒng)計(jì)分析與實(shí)例驗(yàn)證,而少有學(xué)者應(yīng)用R語言進(jìn)行數(shù)據(jù)分析。R語言作為統(tǒng)計(jì)學(xué)中常用的數(shù)據(jù)分析軟件,具有占有空間小、開源、靈活、功能全面等優(yōu)勢(shì)。多數(shù)學(xué)者將其應(yīng)用于股票市場(chǎng)、產(chǎn)品季節(jié)性供應(yīng)量、區(qū)域旅游效率等大數(shù)據(jù)分析及預(yù)測(cè)。將R語言運(yùn)用于重新梳理房地產(chǎn)市場(chǎng)價(jià)格及其影響因素上,能夠更加科學(xué)直觀地反映現(xiàn)象?;诖耍恼峦ㄟ^R語言對(duì)中原城市群的房地產(chǎn)市場(chǎng)價(jià)格影響因素進(jìn)行定量探索,找出房地產(chǎn)價(jià)格主要影響因素。
R語言是一個(gè)包含眾多學(xué)科、工程統(tǒng)計(jì)的編程系統(tǒng),能夠做到統(tǒng)計(jì)計(jì)算、統(tǒng)計(jì)制圖和大數(shù)據(jù)分析與挖掘。作為一個(gè)由統(tǒng)計(jì)學(xué)家開發(fā)的軟件,它能夠適應(yīng)各種統(tǒng)計(jì)方法,其開源的優(yōu)點(diǎn)使更多學(xué)者不斷積極制作新的擴(kuò)展包,使R語言的運(yùn)用能夠更加普遍化、多樣化。R語言有著繪圖、趨勢(shì)分析、參數(shù)估計(jì)、主成分分析、時(shí)間序列分析等數(shù)十種數(shù)據(jù)分析方法。
文章選取了2013年至2017年14個(gè)中原城市的統(tǒng)計(jì)數(shù)據(jù),根據(jù)學(xué)者們的研究進(jìn)行總結(jié),得到多個(gè)房地產(chǎn)市場(chǎng)影響因素,并選取了GDP、居民人均可支配收入、固定資產(chǎn)投資、城鎮(zhèn)化率、房地產(chǎn)開發(fā)投資額、金融機(jī)構(gòu)貸款余額、建筑業(yè)增加值七個(gè)對(duì)房地產(chǎn)價(jià)格影響最大的因素。文中數(shù)據(jù)來源于《中國(guó)統(tǒng)計(jì)年鑒》《河南省統(tǒng)計(jì)年鑒》以及各地級(jí)市統(tǒng)計(jì)年報(bào),對(duì)于缺失的數(shù)據(jù)采用R語言中的多重差補(bǔ)法對(duì)缺失數(shù)據(jù)進(jìn)行模擬預(yù)測(cè),通過主成分分析法客觀評(píng)價(jià)7個(gè)相關(guān)因素。
中原城市群作為國(guó)家經(jīng)濟(jì)增長(zhǎng)新動(dòng)力,有必要分析其經(jīng)濟(jì)增長(zhǎng)的動(dòng)力要素,而房地產(chǎn)業(yè)的持續(xù)發(fā)展是經(jīng)濟(jì)繁榮的有效保障,較準(zhǔn)確的房?jī)r(jià)預(yù)測(cè)能夠有效預(yù)控中原城市群房地產(chǎn)市場(chǎng)。當(dāng)?shù)氐姆康禺a(chǎn)價(jià)格預(yù)測(cè)模型選取影響因素較多,數(shù)據(jù)收集任務(wù)量較大,并通常會(huì)遇到數(shù)據(jù)缺失等問題。將多項(xiàng)影響因素進(jìn)行精簡(jiǎn),選取更有效的影響因素,能夠提高房地產(chǎn)價(jià)格預(yù)測(cè)效率,更準(zhǔn)確地反映市場(chǎng)趨勢(shì)。通過對(duì)所選因素的官方數(shù)據(jù)進(jìn)行統(tǒng)計(jì),將缺失值處理后,對(duì)中原城市群房地產(chǎn)價(jià)格影響因素做準(zhǔn)確分析,得出精簡(jiǎn)后的影響因素。
相對(duì)于要求較高的JM模型,F(xiàn)SC(Fully Approaches Specification)在沒有合適的多維分布時(shí)也能使用,是一種基于鏈?zhǔn)椒匠痰牟逖a(bǔ)方法,插補(bǔ)時(shí)不需要考慮被插補(bǔ)變量和協(xié)變量的聯(lián)合分布,而是利用單個(gè)變量的條件分布逐一進(jìn)行插補(bǔ),使用范圍相對(duì)更加廣泛。R語言的mice包能夠?qū)崿F(xiàn)這一方法,通過隨機(jī)模擬,得到多個(gè)完整數(shù)據(jù)集存入Imp,并對(duì)Imp線性回歸,最后用Pool函數(shù)對(duì)回歸結(jié)果進(jìn)行匯總。在統(tǒng)計(jì)過程中,5年間14個(gè)中原城市的7項(xiàng)影響因素中,共有9個(gè)數(shù)據(jù)缺失,通過R語言對(duì)缺失數(shù)據(jù)進(jìn)行預(yù)測(cè),在得出的5個(gè)結(jié)果中,選出與實(shí)際最相關(guān)的值作為補(bǔ)充值對(duì)缺失數(shù)據(jù)進(jìn)行填補(bǔ)。
影響房地產(chǎn)市場(chǎng)的因素是多元的,為深入分析,需要綜合對(duì)各相關(guān)因素進(jìn)行分析和評(píng)價(jià),選出影響度最大的因素。而多變量、大樣本會(huì)產(chǎn)生多重共線性問題,影響因素反映的信息線性重疊或影響度不高,最終可能使分析結(jié)果的可靠性產(chǎn)生偏移。為減輕統(tǒng)計(jì)量,可以采用“降維”的思想,通過幾個(gè)互不相關(guān)的關(guān)鍵變量來反映原始數(shù)據(jù)中的絕大部分主要信息。主成分分析法是解決降維的一種多元統(tǒng)計(jì)方法,在保證數(shù)據(jù)丟失最少的原則下,將多個(gè)變量簡(jiǎn)化出幾個(gè)最優(yōu)綜合因素,同時(shí)也可以反映出原影響因素的影響度。
調(diào)用R語言中的Labdsv多元數(shù)據(jù)分析程序包中的pca函數(shù),對(duì)主成分進(jìn)行分析,然后繪制碎石圖,確定主成分個(gè)數(shù),得出結(jié)果為:
表1 2017年中原城市群房地產(chǎn)價(jià)格的7個(gè)主成分貢獻(xiàn)度
附圖 7個(gè)新的中原城市房地產(chǎn)價(jià)格主成分貢獻(xiàn)度碎石圖
由附圖可得,在Comp.3之后線條明顯由陡變緩,因此,2017年中原城市群房地產(chǎn)價(jià)格主成分可確定為3個(gè),舍去其余4個(gè)。第一主成分與各影響因素均產(chǎn)生正相關(guān),相關(guān)性分布較均勻,可認(rèn)為F1反映了房地產(chǎn)業(yè)各綜合情況;第二主成分與X2(居民人均可支配收入)、X4(城鎮(zhèn)化率)產(chǎn)生了較強(qiáng)的負(fù)相關(guān),體現(xiàn)了城鎮(zhèn)居民可支配收入總值;第三主成分與X2呈現(xiàn)較強(qiáng)正相關(guān),與X5(房地產(chǎn)開發(fā)投資)呈現(xiàn)了較強(qiáng)的負(fù)相關(guān)。為確認(rèn)可靠性,避免結(jié)論的偶然性,對(duì)2013~2015年的中原城市相同影響因素采用了該方法,將每組數(shù)據(jù)的三個(gè)主成分相關(guān)變量出現(xiàn)次數(shù)進(jìn)行累計(jì),得出:
表2 2013~2017年中原城市群房地產(chǎn)價(jià)格主成分相關(guān)變量出現(xiàn)次數(shù)
表2反映出X2、X6(金融機(jī)構(gòu)貸款余額)累計(jì)出現(xiàn)次數(shù)最多,即與主成分相關(guān)性最大。
當(dāng)加入商品房?jī)r(jià)格變量時(shí),通過各變量對(duì)商品房的價(jià)格影響因子疊加統(tǒng)計(jì),得出:
表3 2013~2017年中原城市群房地產(chǎn)價(jià)格各影響因子疊加
觀察表3,X3(固定資產(chǎn)投資)是影響房地產(chǎn)價(jià)格的關(guān)鍵因素,在宏觀經(jīng)濟(jì)變量中,X1是關(guān)鍵影響因素。
根據(jù)對(duì)2013~2017年中原城市群的GDP、居民人均可支配收入、固定資產(chǎn)投資、城鎮(zhèn)化率、房地產(chǎn)開發(fā)投資、金融機(jī)構(gòu)貸款余額、建筑業(yè)增加值7個(gè)房地產(chǎn)價(jià)格影響因素的分析,固定資產(chǎn)投資影響分子疊加值為2.981,城鎮(zhèn)化率影響分子疊加值為2.249,宏觀經(jīng)濟(jì)的GDP影響分子疊加值為1.793,這三個(gè)變量對(duì)房地產(chǎn)價(jià)格的影響最大。此外,通過降維的思想,對(duì)7個(gè)變量做主成分分析,得出2個(gè)新的影響因素,即城鎮(zhèn)居民可支配收入總值、居民用于房地產(chǎn)投資占收入的份額,兩個(gè)新的影響因素包含了原7個(gè)影響因素的大部分信息。研究結(jié)果表明,固定資產(chǎn)投資、城鎮(zhèn)化率、GDP、城鎮(zhèn)居民可支配收入總值、居民用于房地產(chǎn)投資占收入的份額五項(xiàng)影響因素與中原城市群的房地產(chǎn)價(jià)格的相關(guān)性最強(qiáng)。
在后續(xù)建立中原城市群房地產(chǎn)價(jià)格預(yù)測(cè)模型時(shí),文中研究得到的影響因子疊加值排序?qū)r(jià)格預(yù)測(cè)影響因素的選取提供了指導(dǎo)意見,可直接選用影響度最大的固定資產(chǎn)投資、城鎮(zhèn)化率、房地產(chǎn)開發(fā)投資作為變量,或者使用兩個(gè)新的影響因素進(jìn)行分析,即城鎮(zhèn)居民可支配收入總值、居民用于房地產(chǎn)投資占收入的份額作為變量。