【摘要】本文以探究如何將大數(shù)據(jù)運(yùn)用在房地產(chǎn)評(píng)估領(lǐng)域?yàn)橹攸c(diǎn)進(jìn)行分析,以當(dāng)下房地產(chǎn)行業(yè)的大數(shù)據(jù)基礎(chǔ)為主要依據(jù),為大數(shù)據(jù)的獲取和分析提供了系統(tǒng)方法,試圖為人工智能時(shí)代下的房地產(chǎn)預(yù)測(cè)提供一種新的思路和解決方式。
【關(guān)鍵詞】房地產(chǎn)評(píng)估;大數(shù)據(jù)
房地產(chǎn)行業(yè)是我國(guó)的支柱型產(chǎn)業(yè),對(duì)國(guó)民經(jīng)濟(jì)發(fā)展影響深遠(yuǎn)。當(dāng)前,大數(shù)據(jù)的發(fā)展與應(yīng)用為房地產(chǎn)評(píng)估行業(yè)帶來(lái)了巨大的機(jī)遇和挑戰(zhàn),基于大數(shù)據(jù)分析下的評(píng)估結(jié)果,企業(yè)能夠最大限度地消除評(píng)估過(guò)程中的主觀性,改善融資鏈條下風(fēng)控中的房地產(chǎn)評(píng)估環(huán)節(jié),進(jìn)而控制資產(chǎn)交易的風(fēng)險(xiǎn)。
1、大數(shù)據(jù)下房地產(chǎn)數(shù)據(jù)信息概況
1.1大數(shù)據(jù)技術(shù)簡(jiǎn)介
大數(shù)據(jù)通常指系統(tǒng)地抽取并處理信息的一系列方式,這些信息可以指任何類(lèi)型,包括數(shù)字、文本、照片、視頻、音頻和其他形式,海量信息由廉價(jià)且眾多的信息傳感物聯(lián)網(wǎng)設(shè)備收集,揭示行業(yè)內(nèi)存在的問(wèn)題和規(guī)律。大數(shù)據(jù)中所包含的數(shù)據(jù)集大小和計(jì)算復(fù)雜度,通常超過(guò)了常用軟件工具在有限時(shí)間內(nèi)對(duì)數(shù)據(jù)的捕獲,整理,管理和存儲(chǔ)能力,因此大數(shù)據(jù)往往依賴于云計(jì)算等并行計(jì)算處理工具,例如在數(shù)十,數(shù)百甚至數(shù)干臺(tái)服務(wù)器上運(yùn)行的大規(guī)模并行軟件。從本質(zhì)上說(shuō),大數(shù)據(jù)擴(kuò)大了數(shù)據(jù)分析的抽樣方法和范疇,降低了對(duì)精確性的要求,更多地轉(zhuǎn)向揭示房地產(chǎn)經(jīng)濟(jì)領(lǐng)域的復(fù)雜聯(lián)系,并且預(yù)測(cè)其經(jīng)濟(jì)行為。在大數(shù)據(jù)時(shí)代這一大背景下,企業(yè)評(píng)估人員需從數(shù)據(jù)中提煉有效信息,并與具體業(yè)務(wù)知識(shí)進(jìn)行結(jié)合分析,從而引導(dǎo)企業(yè)評(píng)估環(huán)節(jié)的有效變革。
1.2房地產(chǎn)行業(yè)大數(shù)據(jù)構(gòu)成
房地產(chǎn)評(píng)估行業(yè)是一個(gè)典型的數(shù)據(jù)密集型行業(yè)。各房地產(chǎn)土地評(píng)估機(jī)構(gòu)通過(guò)長(zhǎng)期經(jīng)營(yíng),已經(jīng)逐步積累了海量的數(shù)據(jù)信息。比如以房地產(chǎn)行業(yè)為中心的交易活動(dòng)便派生出各種交易數(shù)據(jù),包括房?jī)r(jià)評(píng)估數(shù)據(jù),抵押登記數(shù)據(jù),各渠道消費(fèi)數(shù)據(jù)等。而宏觀經(jīng)濟(jì)、土地、人口等數(shù)據(jù)作為傳統(tǒng)房地產(chǎn)行業(yè)的基本評(píng)估維度,其信息主要包括土地規(guī)劃,宏觀經(jīng)濟(jì)政策,土地應(yīng)用等級(jí)及金融投資等,這些同樣是房地產(chǎn)企業(yè)開(kāi)展評(píng)估工作不可或缺的。此外,通過(guò)獲知消費(fèi)者群體的年齡分布,性別分布,消費(fèi)能力,分析不同時(shí)間段的人口流動(dòng)軌跡和人口聚集情況等數(shù)據(jù),企業(yè)也能輕易完成目標(biāo)消費(fèi)者畫(huà)像,判斷市場(chǎng)的消費(fèi)活力。房地產(chǎn)行業(yè)龐大的結(jié)構(gòu)性數(shù)據(jù)資源集合了本行業(yè)受到產(chǎn)業(yè)上下游的綜合作用,收集房地產(chǎn)大數(shù)據(jù)是確保評(píng)估工作順利進(jìn)行的有利條件。
2、房地產(chǎn)大數(shù)據(jù)獲取技術(shù)
2.1傳感器
傳感器是房地產(chǎn)城市大數(shù)據(jù)最經(jīng)典的形式,它們被放置在建筑物及道路之間,以各種物理信息作為輸入,包括光線,溫度,空氣質(zhì)量,噪音污染水平等。例如聲光傳感器可以放置在地塊中的十字路口或橋頭,測(cè)得這些區(qū)域的交通狀況和人流量;光纖傳感器可以監(jiān)控地塊的土質(zhì)狀況并標(biāo)記裂縫。隨著傳感器價(jià)格持續(xù)走低,性能不斷提升,數(shù)據(jù)共享和傳輸?shù)靡詫?shí)現(xiàn)持續(xù)化與便捷化。
2.2APP
隨著智能手機(jī)的廣泛應(yīng)用,APP成為了新的大數(shù)據(jù)渠道。大量的開(kāi)放式公交應(yīng)用與滴滴,共享單車(chē)定位等商業(yè)應(yīng)用提供的大量交通數(shù)據(jù),能夠判斷地塊是否處于高速發(fā)展國(guó)內(nèi),以及是否存在配套生活設(shè)施的虹吸效應(yīng)。部分應(yīng)用程序還允許用戶有意識(shí)的輸入數(shù)據(jù)。通過(guò)對(duì)在線評(píng)價(jià)數(shù)據(jù)的研究,地產(chǎn)商可以定位潛在消費(fèi)者,并預(yù)測(cè)他們的購(gòu)買(mǎi)力和購(gòu)買(mǎi)偏好,從而預(yù)測(cè)商圈的前景。
2.3GIS與遙感技術(shù)
地理信息系統(tǒng)(GIS)和遙感技術(shù)能提供一套完整的空間數(shù)據(jù)獲取,存儲(chǔ),顯示,和處理的模式,其綜合了房地產(chǎn)空間位置,形狀,大小,分布狀況和拓?fù)潢P(guān)系等空間方面的信息,并且借助計(jì)算機(jī)技術(shù)實(shí)現(xiàn)了對(duì)數(shù)據(jù)的批量管理和可視化。由于房地產(chǎn)的價(jià)值嚴(yán)重依賴地理位置,周邊環(huán)境等信息,GIS和遙感技術(shù)能使得評(píng)估人員能夠更有效的分析影響房地產(chǎn)價(jià)格的空間區(qū)位因素,從而提高評(píng)估結(jié)果的準(zhǔn)確性。
3、房地產(chǎn)大數(shù)據(jù)分析技術(shù)
幾十年來(lái),房地產(chǎn)評(píng)估的準(zhǔn)確性一直是業(yè)界爭(zhēng)論和研究的話題。傳統(tǒng)的房地產(chǎn)評(píng)估方法過(guò)于依賴過(guò)去的價(jià)格,然而由于市場(chǎng)變化難以預(yù)期,所選的可比實(shí)例與持估房地產(chǎn)不可能完全相同,通過(guò)過(guò)去市場(chǎng)變化情況預(yù)測(cè)未來(lái)房地產(chǎn)價(jià)格時(shí)通常會(huì)產(chǎn)生很大偏差。同時(shí),評(píng)估人員對(duì)房地產(chǎn)狀況的勘察難以做到細(xì)致入微,僅僅依靠賣(mài)家,買(mǎi)家或時(shí)中介人員的陳述勢(shì)必會(huì)造成評(píng)估結(jié)果的主觀偏差。
盡管房地產(chǎn)估價(jià)領(lǐng)域的不精確性和低效性依然存在,然而隨著機(jī)器學(xué)習(xí)技術(shù)的出現(xiàn),房地產(chǎn)行業(yè)數(shù)據(jù)的可用性已經(jīng)顯著增加。將大數(shù)據(jù)應(yīng)用于某些復(fù)雜的建模技術(shù)中,即可實(shí)現(xiàn)用于房地產(chǎn)開(kāi)發(fā)發(fā)自動(dòng)商業(yè)估價(jià)模型。
3.1基于決策樹(shù)
決策樹(shù)模型是將數(shù)據(jù)按順序劃分為子集的一種算法。每一次劃分之后,數(shù)據(jù)將向下被傳遞到樹(shù)分支的下一個(gè)結(jié)點(diǎn),直到所有實(shí)例具有相同的分類(lèi)。根據(jù)目標(biāo)數(shù)據(jù)的性質(zhì),有兩種類(lèi)型的決策樹(shù),分類(lèi)樹(shù)(預(yù)測(cè)類(lèi)別)和回歸樹(shù)(預(yù)測(cè)連續(xù)變量)。因?yàn)橘Y產(chǎn)的價(jià)值是連續(xù)的,通常使用回歸樹(shù)作為大數(shù)據(jù)分析模型。
回歸樹(shù)算法通過(guò)最小化平方誤差在當(dāng)前特征集中選取最佳的預(yù)測(cè)因子,進(jìn)而根據(jù)特征的重要性生成一個(gè)序列,序列中的每一個(gè)特征表示決策樹(shù)中的一個(gè)節(jié)點(diǎn)。第一個(gè)節(jié)點(diǎn)(也成為根節(jié)點(diǎn))包含整個(gè)數(shù)據(jù)集,根節(jié)點(diǎn)數(shù)據(jù)集的分割方法基于成本函數(shù)確定的預(yù)測(cè)因子,該因子可以使得兩個(gè)子數(shù)據(jù)集的回歸方差最小化。在葉子節(jié)點(diǎn)中繼續(xù)對(duì)數(shù)據(jù)集進(jìn)行分析,選出表現(xiàn)最好的特征進(jìn)行劃分,這一過(guò)程在樹(shù)的所有分支中都是遞歸的,直到達(dá)到樹(shù)的期望深度。
與傳統(tǒng)的回歸模型相比,決策樹(shù)易于理解和應(yīng)用,統(tǒng)計(jì)顯著性明顯,即使數(shù)據(jù)量很大也可以在短時(shí)間內(nèi)做出預(yù)測(cè)。盡管有這些優(yōu)點(diǎn),決策樹(shù)也有一些局限性,一方面訓(xùn)練集中可以使決策樹(shù)無(wú)限制垂直增長(zhǎng),這樣的深樹(shù)產(chǎn)生了非常復(fù)雜的模型,對(duì)未知數(shù)據(jù)的預(yù)測(cè)存在較大偏差,這種現(xiàn)象稱為過(guò)擬合。另一方面,如果決策樹(shù)太淺,訓(xùn)練數(shù)據(jù)的小變化就會(huì)導(dǎo)致預(yù)測(cè)結(jié)果的大變化,這樣的模型是欠擬合的。為了克服決策樹(shù)模型的局限性,可以通過(guò)創(chuàng)建多個(gè)決策樹(shù)獲得平均預(yù)測(cè)。最流行的決策樹(shù)集合是隨機(jī)森林模型,其在減少方差上表現(xiàn)優(yōu)異,適用于降低單一決策樹(shù)的過(guò)擬合現(xiàn)象。另一種著名的集成方法是梯度增強(qiáng)模型,其根據(jù)初始決策樹(shù)的殘差生成新樹(shù),各決策樹(shù)預(yù)測(cè)結(jié)果的加權(quán)和即為分析結(jié)果。隨著迭代次數(shù)的增加,梯度增強(qiáng)模型的精度逐步提高,減少了決策樹(shù)的欠擬合現(xiàn)象。
3.2基于神經(jīng)網(wǎng)絡(luò)
神經(jīng)網(wǎng)絡(luò)是由大量處理單元廣泛互聯(lián)而成的網(wǎng)絡(luò),它反應(yīng)人腦的基本特征,是對(duì)人腦的抽象,簡(jiǎn)化和模擬。人工神經(jīng)網(wǎng)絡(luò)由一個(gè)輸入層一個(gè)輸出層和若干個(gè)隱含層組成,不同層之間的節(jié)點(diǎn)通過(guò)權(quán)進(jìn)行連接。除輸入節(jié)點(diǎn)之外的任意節(jié)點(diǎn)都可以用激活函數(shù)表示,可選擇線性型,閾值型或S型等。實(shí)際中以影響房地產(chǎn)價(jià)格的因素作為輸入信號(hào),上層節(jié)點(diǎn)的數(shù)據(jù)經(jīng)由連接權(quán)的處理,通過(guò)激活函數(shù)變換并輸出到下層,最終得到房地產(chǎn)的估計(jì)價(jià)格。
神經(jīng)網(wǎng)絡(luò)的訓(xùn)練由兩階段組成,信息正向傳遞與誤差反向傳播。首先通過(guò)輸入學(xué)習(xí)樣本,層層激活神經(jīng)網(wǎng)絡(luò)中的節(jié)點(diǎn),得到實(shí)際輸出。然后計(jì)算神經(jīng)網(wǎng)絡(luò)估計(jì)值與學(xué)習(xí)樣本標(biāo)簽之間的誤差,反向傳播該誤差,得到各節(jié)點(diǎn)對(duì)誤差的貢獻(xiàn),并修改各層的連接權(quán),再次進(jìn)行預(yù)測(cè)。正向傳遞與反向傳播兩個(gè)階段循環(huán)進(jìn)行,直到網(wǎng)絡(luò)收斂為止。傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)采用最速下降法,通過(guò)梯度方向來(lái)確定各連接權(quán)的修改幅度,這樣能保證每次迭代之后輸出的誤差逐步減小。
傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)是一種依賴梯度下降的算法,這種優(yōu)化算法有著諸多缺點(diǎn),例如過(guò)于依賴空間誤差表面的瞬間梯度值,使得算法的收斂速度不能保證。若誤差曲面對(duì)權(quán)值的導(dǎo)數(shù)很小,則算法需要多次迭代才能收斂。若誤差曲面在權(quán)空間上是陡峭的,對(duì)權(quán)值的調(diào)整有可能越過(guò)誤差的極小值點(diǎn),導(dǎo)致算法來(lái)回震蕩。再如誤差曲面并不是單峰的,梯度下降算法可能收斂在局部極小值點(diǎn),降低神經(jīng)網(wǎng)絡(luò)擬合的精確性。為了改進(jìn)傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的缺點(diǎn),通常使用自適應(yīng)學(xué)習(xí)算法和浮動(dòng)加量法來(lái)優(yōu)化梯度下降過(guò)程。將每一次權(quán)值的變化加上一個(gè)正比于上一次權(quán)值的調(diào)整量,并且通過(guò)對(duì)比誤差函數(shù)下降量的大小動(dòng)態(tài)調(diào)整學(xué)習(xí)速率,這樣可以提高梯度下降算法的收斂速率,使網(wǎng)絡(luò)陷入局部極小值的可能性大大降低。
結(jié)語(yǔ):
在大數(shù)據(jù)技術(shù)不斷發(fā)展的今天,傳統(tǒng)資產(chǎn)評(píng)估逐漸暴露出一系列缺陷與問(wèn)題。不斷產(chǎn)生的新的評(píng)估需求要求評(píng)估人員科學(xué)合理地收集數(shù)據(jù),并搭建智能化的分析模型,從而提高回款效率,控制投資風(fēng)險(xiǎn),完成土地價(jià)值評(píng)估這一行業(yè)的有效變革。
參考文獻(xiàn):
[1]朱品,王培娟,汪麗麗,等.大數(shù)據(jù)下房地產(chǎn)土地價(jià)值評(píng)估的分析方法[J].價(jià)值工程,2018,37(10):219-220.
[2]郭欣欣.人工神經(jīng)網(wǎng)絡(luò)在住宅類(lèi)房地產(chǎn)評(píng)估中的應(yīng)用[D].首都經(jīng)濟(jì)貿(mào)易大學(xué),2012
作者簡(jiǎn)介:
王巖(1969-),女,漢族,湖南省湘鄉(xiāng)縣,中級(jí),學(xué)士,研究方向:評(píng)估。
中國(guó)房地產(chǎn)業(yè)·下旬2020年7期