袁秀芳,鄭伯川,焦偉超
(西華師范大學(xué) 數(shù)學(xué)與信息學(xué)院,四川 南充 637009)
?
基于SVR的上海市商品房?jī)r(jià)格預(yù)測(cè)
袁秀芳,鄭伯川,焦偉超
(西華師范大學(xué) 數(shù)學(xué)與信息學(xué)院,四川 南充637009)
摘要商品房?jī)r(jià)格受諸多因素影響,研究因素與商品房?jī)r(jià)格的關(guān)系是當(dāng)前研究房?jī)r(jià)的一個(gè)熱點(diǎn)。從1998—2013年的上海市商品房基本信息中,選取了對(duì)商品房?jī)r(jià)格產(chǎn)生影響的8個(gè)因素,利用LIBSVM工具建立了基于SVR的商品房?jī)r(jià)格預(yù)測(cè)模型,并對(duì)1998—2013年的商品房?jī)r(jià)格進(jìn)行預(yù)測(cè)。實(shí)驗(yàn)表明,SVR模型比ARIMA模型具有更好的預(yù)測(cè)值,預(yù)測(cè)能力更強(qiáng)。
關(guān)鍵詞商品房?jī)r(jià)格;ARIMA;SVR;預(yù)測(cè)
在市場(chǎng)經(jīng)濟(jì)條件下,具有經(jīng)營(yíng)資格的房地產(chǎn)開(kāi)發(fā)公司通過(guò)出讓方式取得土地使用權(quán)后經(jīng)營(yíng)的住宅就是商品房,其價(jià)格由成本、稅金、利潤(rùn)、代收費(fèi)用以及地段、層次、朝向、質(zhì)量、材料差價(jià)等組成。進(jìn)入21世紀(jì)以后,商品房?jī)r(jià)格不斷上漲,房?jī)r(jià)已經(jīng)成為關(guān)乎國(guó)計(jì)民生的問(wèn)題,對(duì)商品房?jī)r(jià)格的研究也成為了學(xué)術(shù)界的一個(gè)熱點(diǎn)。孔凡文等[1]采用直線趨勢(shì)法和一元線性回歸法預(yù)測(cè)沈陽(yáng)市商品房?jī)r(jià)格,劉悅婷等[2]基于MATLAB建立多元線性回歸模型預(yù)測(cè)蘭州市商品住宅價(jià)格,武秀麗等[3]采用時(shí)間序列預(yù)測(cè)房?jī)r(jià),常振海等[4]采用非參數(shù)自回歸預(yù)測(cè)房?jī)r(jià),陳森君[5]采用BP神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)房?jī)r(jià),徐富強(qiáng)[6]采用神經(jīng)網(wǎng)絡(luò)組合預(yù)測(cè)合肥市房?jī)r(jià),陳博[7]采用灰色GM(1,1)模型預(yù)測(cè)西安市商品房?jī)r(jià)格。目前,支持向量回歸(SVR,support vector regression)機(jī)被認(rèn)為是預(yù)測(cè)能力十分出色的工具,它通過(guò)引入一個(gè)損失函數(shù),將 SVR回歸問(wèn)題轉(zhuǎn)化成對(duì)偶問(wèn)題進(jìn)行求解,克服了最小二乘回歸方法的過(guò)擬合問(wèn)題,在時(shí)間序列預(yù)測(cè)上得到了更為精準(zhǔn)的結(jié)果。不僅如此,SVR不受數(shù)據(jù)區(qū)間較短的影響,能在數(shù)據(jù)樣本較小的情況下建立良好的模型,采用原始數(shù)據(jù)建模即可,具有較高的泛化能力和預(yù)測(cè)精度。因此,我們采用SVR預(yù)測(cè)模型對(duì)上海市商品房?jī)r(jià)格進(jìn)行預(yù)測(cè),并與自回歸求和移動(dòng)平均(ARIMA,autoregressive integrated moving average)模型的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比。
1基于SVR模型的房?jī)r(jià)預(yù)測(cè)
1.1數(shù)據(jù)選取
1998年中國(guó)住房市場(chǎng)發(fā)生了變革,那么1998年就是商品房?jī)r(jià)格的一個(gè)分水嶺,故從1998年的數(shù)據(jù)開(kāi)始進(jìn)行研究,從供給和需求[8,9]兩個(gè)方面選取了8個(gè)影響上海市商品房?jī)r(jià)格的因素,通過(guò)1999—2014年的《上海市統(tǒng)計(jì)年鑒》[10]得到1998—2013年房地產(chǎn)價(jià)格相關(guān)數(shù)據(jù),見(jiàn)表1。表1中X1為上海市生產(chǎn)總值(億元);X2為上海市居民消費(fèi)價(jià)格指數(shù);X3為上海市土地交易價(jià)格指數(shù);X4為上海市房屋租賃價(jià)格指數(shù);X5為上海市建筑業(yè)總產(chǎn)值(億元) ;X6為上海市房屋竣工面積(萬(wàn)m2);X7為上海市恩格爾系數(shù);X8為上海市房地產(chǎn)住宅投資總額(億元)。上海市單位面積商品房?jī)r(jià)格Y(元)=商品房銷(xiāo)售額/商品房銷(xiāo)售面積。
表1 上海市1998—2013年商品房基本信息
1.2數(shù)據(jù)歸一化處理
以1998—2013年的Y、X1、X2、X3、X4、X5、X6、X7和X8的時(shí)間序列為SVR預(yù)測(cè)模型的輸入變量,以Y的時(shí)間序列作為目標(biāo)向量建立商品房?jī)r(jià)格預(yù)測(cè)模型。為消除各時(shí)間序列之間不同量綱的影響,對(duì)數(shù)據(jù)做歸一化處理,使得每一時(shí)間序列向量在區(qū)間[0,1]之間,采用公式為
(1)
1.3房?jī)r(jià)預(yù)測(cè)步驟
采用以下步驟進(jìn)行房?jī)r(jià)預(yù)測(cè):
(1)數(shù)據(jù)歸一化處理;
(3)利用LIBSVM軟件工具[11]的svmtrain函數(shù),選擇ε-SVR算法和徑向基核函數(shù),對(duì)表1中選定的樣本數(shù)據(jù)進(jìn)行學(xué)習(xí),得到回歸模型。通過(guò)反復(fù)實(shí)驗(yàn)和效果對(duì)比,發(fā)現(xiàn)參數(shù)在一定范圍內(nèi)取值時(shí),不同參數(shù)下的實(shí)驗(yàn)結(jié)果相差很小。因此,實(shí)驗(yàn)表明取多組不同參數(shù)都能得到相似的結(jié)果,上述實(shí)驗(yàn)結(jié)果所選用參數(shù)值為:g=0.2,c=10,p=0.005,e=0.001。其中:g表示多項(xiàng)式、徑向基函數(shù)(RBF,radial basis function)和sigmoid核函數(shù)中的γ系數(shù);c表示ε-SVR中的懲罰系數(shù);p為ε-SVR的損失函數(shù)p的值;e為允許的終止判據(jù);
2實(shí)驗(yàn)結(jié)果
首先采用房?jī)r(jià)預(yù)測(cè)步驟對(duì)表1的數(shù)據(jù)進(jìn)行實(shí)驗(yàn),得到SVR模型的預(yù)測(cè)值和真實(shí)值的對(duì)比圖和絕對(duì)百分比誤差,結(jié)果見(jiàn)圖1和表2。然后使用Eviews 7.2軟件對(duì)表1中的Y建立ARIMA模型[12],得到Y(jié)的預(yù)測(cè)值和真實(shí)值的對(duì)比圖和絕對(duì)百分比誤差,結(jié)果見(jiàn)圖1和表2。根據(jù)圖1可知,兩種模型的預(yù)測(cè)效果都比較好,但ARIMA模型的預(yù)測(cè)曲線波動(dòng)比較大,SVR模型的預(yù)測(cè)曲線更接近真實(shí)值。
圖1 商品房?jī)r(jià)格真實(shí)值以及兩種模型下的預(yù)測(cè)值對(duì)比Fig.1 Comparison diagram of actual value of commodity house price and forecasting values under two models
年份真實(shí)值/元SVR模型預(yù)測(cè)值/元ARIMA(1,2,6)預(yù)測(cè)值/元SVR模型預(yù)測(cè)值誤差/%ARIMA(1,2,6)預(yù)測(cè)值誤差/%19983758.913700.22NA1.56NA19993616.073548.703676.991.861.6920003565.453630.623536.061.830.8220013993.303925.543968.391.700.6220024284.814345.604702.231.429.7420035118.415112.804118.590.1119.5320046488.976550.656315.280.102.6820056842.006771.767188.521.035.0620067196.017259.837748.110.897.6720078360.988224.328140.461.632.6420088255.019671.108709.0417.155.50200912839.9812771.6411198.560.5312.78201014399.8914340.3114899.970.413.47201114502.7914440.9315679.200.438.11201214061.3414131.4015466.300.509.99201316419.9916359.4716331.380.370.54注:NA表示空值,由于進(jìn)行了差分運(yùn)算,開(kāi)頭就會(huì)少一位。
根據(jù)表2可知SVR模型在2008年商品房?jī)r(jià)格預(yù)測(cè)值與真實(shí)值相差較大,其他年份的預(yù)測(cè)值與真實(shí)值比較接近。查閱相關(guān)資料可知造成2008年預(yù)測(cè)值偏差大有兩個(gè)原因:一是由于2008年宏觀經(jīng)濟(jì)形勢(shì)惡化、房地產(chǎn)行業(yè)呈現(xiàn)衰退局面;二是2007年國(guó)家多次提出加息政策調(diào)控住房民生問(wèn)題,在2008年得到了集中體現(xiàn),導(dǎo)致房?jī)r(jià)出現(xiàn)空前下降。除此之外,比較兩種模型的預(yù)測(cè)值絕對(duì)百分比誤差,大致上可見(jiàn)ARIMA模型的預(yù)測(cè)值絕對(duì)百分比誤差更大更波動(dòng)一些,反之SVR模型的預(yù)測(cè)值絕對(duì)百分比誤差更小更均勻,所以SVR模型的預(yù)測(cè)效果比較好。為進(jìn)一步對(duì)比SVR模型和ARIMA模型的預(yù)測(cè)效果,計(jì)算預(yù)測(cè)值絕對(duì)百分比誤差的均值和標(biāo)準(zhǔn)差,計(jì)算公式為
(2)
(3)
表3 預(yù)測(cè)結(jié)果的均值和標(biāo)準(zhǔn)差
由表3可知SVR模型預(yù)測(cè)值的絕對(duì)百分比誤差均值和標(biāo)準(zhǔn)差都小于ARIMA模型,說(shuō)明SVR模型預(yù)測(cè)值更接近于真實(shí)值。因此得出基于SVR模型的擬合精度很高,能夠較好地?cái)M合出商品房房?jī)r(jià)的走勢(shì)。該模型在處理類(lèi)似小樣本多影響因素的預(yù)測(cè)分析中呈現(xiàn)了很大的優(yōu)勢(shì)和參考價(jià)值,能夠?yàn)槲覈?guó)政府部門(mén)、宏觀經(jīng)濟(jì)工作者及房地產(chǎn)相關(guān)人員提供參考和指導(dǎo)。
3結(jié)語(yǔ)
通過(guò)建立一種誤差較小、回歸效果理想的SVR商品房房?jī)r(jià)預(yù)測(cè)模型,與ARIMA模型的實(shí)驗(yàn)結(jié)果進(jìn)行對(duì)比,得出了SVR模型的預(yù)測(cè)效果更好,預(yù)測(cè)能力更強(qiáng)的結(jié)論。該模型不僅為預(yù)測(cè)商品房?jī)r(jià)格提供了一種有效的方法,同時(shí)也通過(guò)實(shí)例體現(xiàn)了解決回歸問(wèn)題的優(yōu)越性。
參考文獻(xiàn):
[1]孔凡文,李忠利,張春雨.沈陽(yáng)市商品房?jī)r(jià)格預(yù)測(cè)分析[J].沈陽(yáng)建筑大學(xué)學(xué)報(bào):自然科學(xué)版,2001,23(3):232-234,238.
[2]劉悅婷,鄭卓.基于MATLAB的蘭州市商品住宅價(jià)格變動(dòng)分析預(yù)測(cè)[J].甘肅科學(xué)學(xué)報(bào),2011,23(3):155-158.
[3]武秀麗,張鋒.時(shí)間序列分析法在房?jī)r(jià)預(yù)測(cè)中的應(yīng)用——以廣州市的數(shù)據(jù)為例[J].科學(xué)技術(shù)與工程,2007,7(21):5 631-5 635.
[4]常振海,劉薇.基于非參數(shù)自回歸模型的房?jī)r(jià)預(yù)測(cè)[J].天水師范學(xué)院學(xué)報(bào),2010,30(2):56-58.
[5]陳森君.中國(guó)商品房?jī)r(jià)格的影響因素分析及價(jià)格預(yù)測(cè)[D].武漢:華中科技大學(xué),2008.
[6]徐富強(qiáng).神經(jīng)網(wǎng)絡(luò)組合預(yù)測(cè)模型及其在房?jī)r(jià)趨勢(shì)中的應(yīng)用[D].合肥:安徽大學(xué),2011.
[7]陳博.西安市商品房?jī)r(jià)格趨勢(shì)的研究及其預(yù)測(cè)[D].西安:西安建筑科技大學(xué),2012.
[8]曹玉.我國(guó)商品房?jī)r(jià)格影響因素研究[D].昆明:云南大學(xué),2011.
[9]董艷芳.我國(guó)商品房?jī)r(jià)格形成的主要因素及形成機(jī)制分析[J].軟科學(xué),2012,26(6):96-98.
[10]上海市統(tǒng)計(jì)局.上海市統(tǒng)計(jì)年鑒[M].北京:中國(guó)統(tǒng)計(jì)出版社,1999-2014.
[11]Chang Chihchung,Lin Chihjen.LIBSVM :a Library for Support Vector Machines[EB/OL].http://www.csie.edu.tw/~cjlin/libsvm/,2015-06-22.
[12]王黎明,王連,楊楠.應(yīng)用時(shí)間序列分析[M].上海:復(fù)旦大學(xué)出版社,2012.
SVR-based Price Forecasting of Commodity House in Shanghai
Yuan Xiufang,Zheng Bochuan,Jiao Weichao
(CollegeofMathematicandInformation,ChinaWestNormalUniversity,Nanchong637009,China)
AbstractThe price of the commodity house may be influenced by many factors;and study on relationship between the factors and the price of the commodity house is deemed as one hot issue in research of house price so far.The SVR-based commodity house price forecasting model was set up and the prices of the commodity house from 1998 to 2013 was forecasted by using LIBSVM tool after selecting eight factors generating influence to the price of the commodity house from the basic information of the commodity house in shanghai from 1998 to 2013.The experiments showed that SVR model,compared with the ARIMA model,had more excellent forecasting value and stronger forecasting ability.
Key wordsPrice forecasting of commodity house;ARIMA;SVR;Forecasting
中圖分類(lèi)號(hào):O29
文獻(xiàn)標(biāo)志碼:A
文章編號(hào):1004-0366(2016)01-0025-04
作者簡(jiǎn)介:袁秀芳(1990-),女,陜西延安人,碩士,研究方向?yàn)榻y(tǒng)計(jì)回歸分析和支持向量機(jī).E-mail:1141512393@qq.com.通訊作者:鄭伯川.E-mail:80700399@qq.com.
基金項(xiàng)目:四川省教育廳自然科學(xué)重點(diǎn)項(xiàng)目(12ZA172);西華師范大學(xué)啟動(dòng)基金(12B023).
收稿日期:2015-05-25;修回日期:2015-07-13.
doi:10.16468/j.cnki.issn1004-0366.2016.01.006.
引用格式:Yuan Xiufang,Zheng Bochuan,Jiao Weichao.SVR-based Price Forecasting of Commodity House in Shanghai[J].Journal of Gansu Sciences,2016,28(1):25-28.[袁秀芳,鄭伯川,焦偉超.基于SVR的上海市商品房?jī)r(jià)格預(yù)測(cè)[J].甘肅科學(xué)學(xué)報(bào),2016,28(1):25-28.]