李然 章政 繆華昌
摘要:房產(chǎn)在我國(guó)國(guó)民經(jīng)濟(jì)中占據(jù)重要地位。隨著深度學(xué)習(xí)算法發(fā)展,關(guān)于房?jī)r(jià)預(yù)測(cè)問(wèn)題算法也有深入的研究。文章將調(diào)試Logistic、ReLu各隱含層函數(shù)來(lái)預(yù)測(cè)結(jié)果,并將結(jié)果綜合后判斷本模型的預(yù)測(cè)精度完成房?jī)r(jià)預(yù)測(cè)。
關(guān)鍵詞:房?jī)r(jià)預(yù)測(cè);神經(jīng)網(wǎng)絡(luò);Logistic;ReLu
中國(guó)經(jīng)濟(jì)實(shí)驗(yàn)研究城市生活質(zhì)量中心2019年報(bào)告顯示,整體上來(lái)看房地產(chǎn)市場(chǎng)仍然還是以謹(jǐn)慎的態(tài)度為主,且近幾年來(lái)國(guó)家住房政策的調(diào)整使得房地產(chǎn)行業(yè)將迎來(lái)新一輪的“洗牌”。房地產(chǎn)作為我國(guó)國(guó)民重要的資產(chǎn)項(xiàng)目,微觀層面在轉(zhuǎn)讓、售賣(mài)、租賃的時(shí)候有可靠的參考標(biāo)準(zhǔn)對(duì)消費(fèi)者與產(chǎn)權(quán)擁有者意義重大。從中觀角度企業(yè)可基于房?jī)r(jià)預(yù)測(cè)判斷用多大的成本建設(shè)可獲得最高收益,能夠幫助企業(yè)做出精準(zhǔn)的市場(chǎng)戰(zhàn)略,防止資金浪費(fèi)在低投資回報(bào)率項(xiàng)目上導(dǎo)致資金鏈斷裂。宏觀角度可靠的房?jī)r(jià)預(yù)測(cè)在精準(zhǔn)調(diào)整政策、提高政策在基層可實(shí)施性、防范系統(tǒng)性金融風(fēng)險(xiǎn)等方面有積極作用。
基于現(xiàn)狀,本文以如何構(gòu)建一個(gè)新行業(yè)背景下不動(dòng)產(chǎn)定價(jià)預(yù)測(cè)這個(gè)問(wèn)題進(jìn)行建模,最終輔助國(guó)民涉及房產(chǎn)方面的決策。數(shù)據(jù)源于kaggle官網(wǎng)“House Prices-Advanced Regression Techniques”。
一、神經(jīng)網(wǎng)絡(luò)構(gòu)建
Logistic函數(shù)又稱(chēng)sigmoid函數(shù)源自邏輯斯蒂方程。原用以描述自然界物種無(wú)天敵的理想狀態(tài)下,物種最快增長(zhǎng)函數(shù)。其式:
求解得到以上,式中Wij是指連接權(quán)重,xj是指輸入的特征變量,δi指神經(jīng)元閾值,yi指在Logistic的激活函數(shù)下的加工后的數(shù)值。
相比sigmoid函數(shù)ReLu只需要一個(gè)閾值就可以得到激活值不必進(jìn)行大量臃余計(jì)算。
式中yi指經(jīng)過(guò)ReLu加工后的數(shù)據(jù),Wij是指連接權(quán)重,xj是指輸入的特征變量,δ指神經(jīng)元閾值。
Logistic和ReLu情形下神經(jīng)網(wǎng)絡(luò)模型的構(gòu)建各有特點(diǎn),因此對(duì)兩結(jié)果取均值對(duì)預(yù)測(cè)精度的好處如表1所示。
二、神經(jīng)網(wǎng)絡(luò)運(yùn)行結(jié)果
用“藍(lán)鯨”軟件建模。數(shù)據(jù)累計(jì)53個(gè)提供信息的特征列參與建模,其中10列為名義型變量其余為數(shù)值型和序列型變量。名義型變量的處理方式是轉(zhuǎn)換為編碼,序列型變量的處理方式是轉(zhuǎn)換為評(píng)分形式的數(shù)值型變量。預(yù)測(cè)結(jié)果與實(shí)測(cè)結(jié)果存在誤差的原因可能是由于數(shù)據(jù)記錄時(shí)本身就存在錯(cuò)誤,導(dǎo)致記錄數(shù)與真值存在誤差?;蚴怯捎谀P捅旧硖匦詫?dǎo)致的。因此本文利用兩個(gè)不同隱藏層函數(shù)跑出的結(jié)果進(jìn)行加權(quán)平均。其原理為兩個(gè)模型自身的精度較好,但是存在一些異常的數(shù)值。兩組數(shù)據(jù)如果差距不大則很有可能這個(gè)結(jié)果本身是對(duì)的。如果兩組數(shù)據(jù)的差距比較大,則取其均值以平抑其錯(cuò)誤的大小。結(jié)果如表2所示。
本文以對(duì)應(yīng)真實(shí)房?jī)r(jià)為比較對(duì)象。并繪制了圖2橫軸為本模型結(jié)果縱軸為真實(shí)結(jié)果的平面圖。房?jī)r(jià)預(yù)測(cè)時(shí)應(yīng)當(dāng)存在一個(gè)區(qū)間,在該區(qū)間以?xún)?nèi)可視為有效合理定價(jià)。如果超出該區(qū)間過(guò)多將視其為噪點(diǎn)。圖2中的兩條箭頭線代表的是可接受合理區(qū)間上下沿分別是一個(gè)均方根誤差。RMSE=25752.16,R2=0.897648,表明預(yù)測(cè)結(jié)果與真實(shí)情況接近。
鑒于房?jī)r(jià)定價(jià)除了客觀因素影響還有個(gè)體喜好差異的因素。因此圖2中兩個(gè)雙箭頭線是個(gè)體差異導(dǎo)致的可接受的誤差,誤差值為一個(gè)均方誤差。
導(dǎo)致誤差的原因包含標(biāo)準(zhǔn)化后的數(shù)值轉(zhuǎn)回預(yù)測(cè)目標(biāo)數(shù)值時(shí)較大的量綱使誤差被放大,也包含數(shù)據(jù)集本身就有錯(cuò)誤數(shù)據(jù)的可能。但是從大體上來(lái)看,除去少數(shù)極端異常點(diǎn)多數(shù)的點(diǎn)落在合理區(qū)間的。其余在合理范圍邊緣的點(diǎn)可能是數(shù)據(jù)除噪精度低導(dǎo)致的。約97%的點(diǎn)在區(qū)間內(nèi),總體的精度較優(yōu)。
三、模型仿真
為進(jìn)一步驗(yàn)證模型效果,參考了《中國(guó)房地產(chǎn)統(tǒng)計(jì)年鑒2006》至《中國(guó)房地產(chǎn)統(tǒng)計(jì)年鑒2020》南京市商品房平均銷(xiāo)售價(jià)格以及南京市統(tǒng)計(jì)局對(duì)應(yīng)年份的統(tǒng)計(jì)年鑒。其中a為地區(qū)生產(chǎn)總值(億元);b為地區(qū)人口總數(shù)(人);c為城市居民人均可支配收入(元);d為城市居民人均消費(fèi)支出(元);e為農(nóng)村居民人均可支配收入(元);f為農(nóng)村居民人均生活消費(fèi)支出(元);g為商品房銷(xiāo)售面積(萬(wàn)平米);h為本年完成投資額(萬(wàn)元);i為商品房平均銷(xiāo)售價(jià)格(元/平米),數(shù)據(jù)如表3所示。
為平抑量綱對(duì)模型的影響,將數(shù)據(jù)標(biāo)準(zhǔn)化。并使用2005~2018年的數(shù)據(jù)為訓(xùn)練集,2019年舍去i的數(shù)據(jù)為預(yù)測(cè)集。
最終利用以上的方法得到兩種激活函數(shù)綜合之后2019年預(yù)測(cè)結(jié)果為19472.25元/平米,誤差僅2.45%。因此本模型可用于研究近幾年我國(guó)房地產(chǎn)房?jī)r(jià)問(wèn)題。
四、結(jié)語(yǔ)
本文基于神經(jīng)網(wǎng)絡(luò)算法解決了如何在新時(shí)代背景下對(duì)房?jī)r(jià)的合理區(qū)域的預(yù)測(cè),并結(jié)合了本模型的均方誤差給出了相應(yīng)合理的區(qū)間,達(dá)到了便于消費(fèi)者合理評(píng)估不動(dòng)產(chǎn)價(jià)值、輔助房地產(chǎn)企業(yè)判讀是否購(gòu)買(mǎi)某塊地區(qū)的土地建設(shè)、有利于國(guó)家對(duì)居民端房地產(chǎn)交易環(huán)節(jié)實(shí)施精準(zhǔn)的宏觀調(diào)控的研究目標(biāo),為房?jī)r(jià)預(yù)測(cè)問(wèn)題提供了一種新解決方式。
參考文獻(xiàn):
[1]張連城,郎麗華,趙家章,王銀,郝宇彪,張自然,王鈺.城市居民生活質(zhì)量“總體穩(wěn)定、穩(wěn)中有憂”——2019年中國(guó)35個(gè)城市生活質(zhì)量報(bào)告[J].經(jīng)濟(jì)學(xué)動(dòng)態(tài),2019(09):3-17.
[2]張樨樨.房?jī)r(jià)泡沫抑制了生育率復(fù)蘇嗎?——論生育率與房?jī)r(jià)的動(dòng)態(tài)因果關(guān)系[J].華東師范大學(xué)學(xué)報(bào)(哲學(xué)社會(huì)科學(xué)版),2021,53(02):164-175+180.
[3]Nellis J G,Longbottom J A.An empirical analysis of the determination of house prices in the United Kingdom[J].Urban Studies,1981,18(01):9-21.
[4]Baffoe-BonnieJ.The dynamic impact of macroeconomic aggregateson housing price and stock of houses:A national and regional analysis.Dordrecht:111e Journal of Real Estate Finance and Economics,1998,17(02):179-197.
(作者單位:蘇州大學(xué)應(yīng)用技術(shù)學(xué)院。章政為通信作者)