• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于神經(jīng)網(wǎng)絡(luò)對房價預(yù)測的研究分析

      2022-09-15 09:29:28鄭偉鵬司亞超
      關(guān)鍵詞:房價房屋權(quán)重

      鄭偉鵬 司亞超

      (河北建筑工程學(xué)院,河北 張家口 075000)

      0 引 言

      住房滿足是使人民獲得幸福感的重要因素.近些年來隨著人民對住房需求的增高,我國的住房建筑面積也出現(xiàn)遞增趨勢,由于房價受到了諸多因素的影響,人們在買房時候很難考慮到影響房屋價格的主要因素,如果有一個模型能準(zhǔn)確的根據(jù)影響房價的因素去預(yù)測房價趨勢,將會高效的幫助人們找到房價規(guī)律[4-5].

      20世紀(jì)40年代首次提出了“M-P神經(jīng)網(wǎng)絡(luò)模型”.在此之后提出MLP(多層感知機(jī))模型和BP(Backward propagation)神經(jīng)網(wǎng)絡(luò)模型.其中BP神經(jīng)網(wǎng)絡(luò)的出現(xiàn)有效解決了多層神經(jīng)網(wǎng)絡(luò)隱藏層中權(quán)重學(xué)習(xí)問題.本文中我們將根據(jù)影響房屋價格的因素并結(jié)合BP神經(jīng)網(wǎng)絡(luò)的模型來實(shí)現(xiàn)對房屋價格的預(yù)測[1].

      1 數(shù)據(jù)處理

      1.1 數(shù)據(jù)集介紹

      實(shí)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)(神經(jīng)網(wǎng)絡(luò))模型對房價的預(yù)測需要大量的數(shù)據(jù)訓(xùn)練模型.由于我國房價數(shù)據(jù)難以收集以及一些不可量化因素的存在所以本文中將使用1990年美國人口普查下的加利福尼亞州的房屋價格等數(shù)據(jù)進(jìn)行預(yù)測,該數(shù)據(jù)集一共包含20000多個樣本,其中部分?jǐn)?shù)據(jù)樣本如表一所示.該樣本數(shù)據(jù)中包含8個特征:人均收入、房屋年齡、房間數(shù)、臥室數(shù)、房區(qū)人口數(shù)、房屋居住人數(shù)、房屋經(jīng)度、房屋緯度.房價中位數(shù)是神經(jīng)網(wǎng)絡(luò)模型所要預(yù)測的結(jié)果,其余的8個變量均為特征變量,是影響房價中位數(shù)的重要因素.如圖1樣本數(shù)據(jù)熱力圖所示房間數(shù)這個特征與房屋價格的相關(guān)性系數(shù)達(dá)到了0.846兩者之間具有較強(qiáng)的相關(guān)性,也就是說房間數(shù)量是影響當(dāng)前房屋價格的重要因素.

      表1 影響房價特征的數(shù)據(jù)樣本

      圖1 樣本特征的熱力圖

      1.2 數(shù)據(jù)處理

      在對數(shù)據(jù)進(jìn)行訓(xùn)練之前,需要對數(shù)據(jù)進(jìn)行一些處理操作.通過求得數(shù)據(jù)集的均值、方差、最大值、最小值等來找到當(dāng)前部分的整體指標(biāo),然后再通過歸一化處理(如表2所示)將數(shù)據(jù)放縮到(-1,1)的區(qū)間上.

      表2 歸一化處理后的數(shù)據(jù)樣本

      使用歸一化處理數(shù)據(jù)的好處主要有兩點(diǎn):一是可以加快模型的收斂速度,較大的數(shù)據(jù)在訓(xùn)練過程中可能出現(xiàn)梯度爆炸,數(shù)據(jù)通過歸一化處理可以防止在梯度下降過程中模型的迭代速度較慢.二是可以提高模型的準(zhǔn)確度由于這八個變量中的具有不同的數(shù)量級,如表1所示的5個樣本中房區(qū)人口數(shù)的平均值為868,而平均臥室量的平均值為1.樣本數(shù)據(jù)中不同特征之間數(shù)量級相差太大,可能會導(dǎo)致訓(xùn)練過程中數(shù)值較高的特征對網(wǎng)絡(luò)權(quán)重的影響比較大,削弱了數(shù)值小的特征對結(jié)果的影響.為了保證神經(jīng)網(wǎng)絡(luò)在訓(xùn)練時對樣本不同特征之間的“公平性”所以需要對樣本數(shù)據(jù)進(jìn)行歸一化處理.

      2 神經(jīng)網(wǎng)絡(luò)模型

      2.1 神經(jīng)網(wǎng)絡(luò)模型

      神經(jīng)網(wǎng)絡(luò)通常定義為三部分:輸入層、隱藏層、輸出層.其中輸入數(shù)據(jù)作為第一層,神經(jīng)網(wǎng)絡(luò)預(yù)測的結(jié)果作為最后一層,輸入層和輸出層之間的統(tǒng)稱為隱藏層.這三層的結(jié)合模擬了生物學(xué)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),神經(jīng)網(wǎng)絡(luò)模型如圖2所示.

      2.2 前向傳播

      神經(jīng)網(wǎng)絡(luò)的前向傳播可以簡單的理解為矩陣相乘.神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)模型如圖3所示,W1、W2、W3作為神經(jīng)網(wǎng)絡(luò)的輸入,這些輸入與該分支的權(quán)重x1、x2、x3分別相乘然后累加得到輸出y.因?yàn)閥是輸入值與權(quán)重值相乘得到的線性值,所以需要再通過非線性函數(shù)S用來模擬神經(jīng)元傳遞信號的閾值處理.最終得到的值A(chǔ)就是經(jīng)過這個神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)的結(jié)果.

      圖2 神經(jīng)網(wǎng)絡(luò)模型

      圖3 神經(jīng)網(wǎng)絡(luò)結(jié)節(jié)點(diǎn)圖

      2.3 反向傳播

      樣本數(shù)據(jù)在經(jīng)過神經(jīng)網(wǎng)絡(luò)運(yùn)算后會輸出相應(yīng)的預(yù)測值,為了提高神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確度需要更新神經(jīng)網(wǎng)絡(luò)的權(quán)重,通常需要將預(yù)期值和神經(jīng)網(wǎng)絡(luò)模型輸出值代入到損失函數(shù)中進(jìn)行計算,然后根據(jù)鏈?zhǔn)角髮?dǎo)法則,由輸出層向輸入層去更新神經(jīng)網(wǎng)絡(luò)各層之間節(jié)點(diǎn)的權(quán)重,使得權(quán)重和輸入的數(shù)據(jù)計算出的結(jié)果能夠接近預(yù)測的數(shù)值,從求誤差到更新權(quán)重的過程我們就稱為神經(jīng)網(wǎng)絡(luò)的反向傳播.神經(jīng)網(wǎng)絡(luò)預(yù)測模型重常用的損失函數(shù)是交叉熵?fù)p失函數(shù)(公式1)和均方差損失函數(shù)(公式2).

      (1)

      (2)

      3 實(shí) 驗(yàn)

      在本次實(shí)驗(yàn)中輸入層的格式統(tǒng)一是[32,8](一次處理32個樣本數(shù)據(jù),每個樣本數(shù)據(jù)有8個特征),輸入層的第一個參數(shù)是根據(jù)電腦性能決定的,神經(jīng)網(wǎng)絡(luò)一次處理樣本數(shù)據(jù)的數(shù)量,在電腦性能得到保證的情況下該值越大就會使得神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練的速度越快,這個參數(shù)并不會影響神經(jīng)網(wǎng)絡(luò)模型的精準(zhǔn)度.第二參數(shù)是訓(xùn)練的樣本的特征決定的,本文選取數(shù)據(jù)集的特征是8所以該值就是數(shù)據(jù)特征數(shù)量,因?yàn)橛嬎銠C(jī)是二進(jìn)制所以隱藏層節(jié)點(diǎn)的設(shè)置為2的倍數(shù).

      神經(jīng)網(wǎng)絡(luò)模型隱藏層的選取則在2、3層.如果神經(jīng)網(wǎng)絡(luò)模型的層數(shù)太少則可能導(dǎo)致神經(jīng)網(wǎng)絡(luò)的參數(shù)太少無法很好的擬合樣本數(shù)據(jù)中的特征得到準(zhǔn)確的預(yù)測值,如果隱藏層數(shù)太多則可能導(dǎo)致網(wǎng)絡(luò)模型的性能下降.為了提高網(wǎng)絡(luò)模型的魯棒性,本文中的所有實(shí)驗(yàn)在第二個隱藏層添加了Dropout隨機(jī)失活函數(shù),隨機(jī)將部分隱含層節(jié)點(diǎn)的權(quán)重歸零,由于每次迭代受影響的節(jié)點(diǎn)不同,因此各節(jié)點(diǎn)的“重要性”會被平衡這樣會使得神經(jīng)網(wǎng)絡(luò)模型更加的健壯.

      在神經(jīng)網(wǎng)絡(luò)模型優(yōu)化中本實(shí)驗(yàn)選擇了SGD(Stochastic Gradient Descent)優(yōu)化器,相比其他優(yōu)化器SGD優(yōu)化器在計算中不易于陷入局部極值點(diǎn).損失函數(shù)則選用了均方差損失函數(shù),因?yàn)榫讲钕啾扔诮徊骒負(fù)p失函數(shù)更加適合回歸問題.

      實(shí)驗(yàn)參數(shù)如圖表3所示,當(dāng)神經(jīng)網(wǎng)絡(luò)的隱藏層數(shù)為2且每個節(jié)點(diǎn)的個數(shù)為64時神經(jīng)網(wǎng)絡(luò)模型取得66.97%的準(zhǔn)確度,此時對應(yīng)測試集的預(yù)測圖如圖3所示.

      表3 實(shí)驗(yàn)參數(shù)

      圖4 神經(jīng)網(wǎng)絡(luò)預(yù)測曲線

      4 結(jié)束語

      本文通過加利福尼亞州的房屋價格數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù)證實(shí)了神經(jīng)網(wǎng)絡(luò)對房價預(yù)測的良好表現(xiàn),針對于大規(guī)模多特征的房價數(shù)據(jù)神經(jīng)網(wǎng)絡(luò)有著較好的擬合能力.在未來的研究中,如果可以量化影響我國房價的因素,神經(jīng)網(wǎng)絡(luò)模型對于我國的房價的預(yù)測將會達(dá)到一個不錯的效果.

      猜你喜歡
      房價房屋權(quán)重
      房屋感冒了
      UMAMMA歷史房屋改造
      兩大手段!深圳土地“擴(kuò)權(quán)”定了,房價還會再漲?
      房屋
      文苑(2020年10期)2020-11-22 03:28:43
      權(quán)重常思“浮名輕”
      防范未然 “穩(wěn)房價”更要“穩(wěn)房租”
      為黨督政勤履職 代民行權(quán)重?fù)?dān)當(dāng)
      基于公約式權(quán)重的截短線性分組碼盲識別方法
      去庫存的根本途徑還在于降房價
      公民與法治(2016年8期)2016-05-17 04:11:34
      2016房價“漲”聲響起
      宝清县| 太原市| 兰溪市| 宁安市| 青川县| 舞阳县| 阳谷县| 武川县| 交城县| 宜城市| 高青县| 衡南县| 乌拉特后旗| 简阳市| 合江县| 聊城市| 中江县| 阿坝县| 泉州市| 友谊县| 桦甸市| 望江县| 奈曼旗| 平江县| 赤壁市| 乐至县| 宝鸡市| 宜州市| 谢通门县| 霍山县| 大连市| 漳平市| 射洪县| 太仓市| 明星| 永善县| 秦皇岛市| 高碑店市| 长丰县| 山阳县| 永安市|