• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于scikit-learn的房價回歸分析

      2019-07-13 00:46:09秦培煜胡艷芬
      消費導(dǎo)刊 2019年51期
      關(guān)鍵詞:均方房價標準化

      秦培煜 胡艷芬

      1.武漢軟件工程職業(yè)學(xué)院; 2.中國地質(zhì)大學(xué)(武漢)

      隨著大數(shù)據(jù)和人工智能時代的到來,機器學(xué)習(xí)應(yīng)用的場景越來越多。機器學(xué)習(xí)分為監(jiān)督學(xué)習(xí)和無監(jiān)督學(xué)習(xí),回歸屬于監(jiān)督學(xué)習(xí)范疇[1]。本文對scikit-learn自帶的房價數(shù)據(jù)進行了回歸分析。

      一、回歸分析過程

      (一)房價數(shù)據(jù)加載

      數(shù)據(jù)使用scikit-learn自帶的boston房價數(shù)據(jù),使用load_boston函數(shù)加載。

      import numpy as np

      from sklearn.datasets import load_boston

      house = load_boston()

      首先導(dǎo)入numpy和sklearn.datasets中l(wèi)oad_boston函數(shù),使用 load_boston加載boston房價數(shù)據(jù),其中house.data是特征數(shù)據(jù),house.target是標簽數(shù)據(jù)。

      (二)數(shù)據(jù)標準化

      from sklearn.preprocessing import StandardScaler

      stdHouse = StandardScaler().fit_transform(house.data)

      特征數(shù)據(jù)中有些特征量綱比較大,有些特征量綱比較小,如果放在一起使用,會對最終分析結(jié)果產(chǎn)生不好影響。這里使用sklearn.preprocessing里的StandardScaler對房價數(shù)據(jù)進行標準化。house是標準化前的數(shù)據(jù),stdHouse是標準化后的數(shù)據(jù)。

      (三)數(shù)據(jù)劃分

      from sklearn.model_selection import train_test_split

      data_train,data_test,target_train,target_test = train_test_split(stdHouse,house.target,random_state=100)

      這里使用sklearn.model_selection里train_test_split對數(shù)據(jù)進行劃分。默認數(shù)據(jù)的75%劃分為訓(xùn)練集,25%劃分為測試集。

      (四)回歸模型選用

      from sklearn.linear_model import LinearRegression

      linReg = LinearRegression().fit(data_train,target_train)

      pred = linReg.predict(data_test)

      使用sklearn.linear_model里的LinearRegression模型對數(shù)據(jù)進行訓(xùn)練和預(yù)測。得到的pred是預(yù)測數(shù)據(jù)。

      (五)均方誤差評價指標

      from sklearn.metrics import mean_squared_error

      mean_squared_error(target_test,pred)

      mean_squared_error是均方誤差指標,最后得到真實值target_test和預(yù)測值之間的均方誤差為27.18。

      二、結(jié)論

      本文用scikit-learn,對boston房價數(shù)據(jù)進行了回歸分析。首先加載房價數(shù)據(jù);其次對數(shù)據(jù)進行標準化;然后將數(shù)據(jù)劃分成訓(xùn)練集和測試集,并用線性回歸模型對訓(xùn)練集進行訓(xùn)練,對測試集進行預(yù)測;最后用均方誤差指標對真實值和預(yù)測值進行評價。整個過程對于回歸分析有著重要的指導(dǎo)作用。

      猜你喜歡
      均方房價標準化
      一類隨機積分微分方程的均方漸近概周期解
      標準化簡述
      兩大手段!深圳土地“擴權(quán)”定了,房價還會再漲?
      Beidou, le système de navigation par satellite compatible et interopérable
      防范未然 “穩(wěn)房價”更要“穩(wěn)房租”
      標準化是綜合交通運輸?shù)谋U稀庾x《交通運輸標準化體系》
      中國公路(2017年9期)2017-07-25 13:26:38
      去庫存的根本途徑還在于降房價
      公民與法治(2016年8期)2016-05-17 04:11:34
      2016房價“漲”聲響起
      基于抗差最小均方估計的輸電線路參數(shù)辨識
      論汽車維修診斷標準化(上)
      嘉禾县| 漳浦县| 滨海县| 灌南县| 西峡县| 鸡西市| 华宁县| 泰安市| 岗巴县| 资源县| 新丰县| 宁明县| 新化县| 长海县| 天峻县| 大石桥市| 体育| 清徐县| 繁峙县| 射阳县| 临漳县| 满洲里市| 论坛| 安丘市| 肇源县| 外汇| 彝良县| 东丽区| 朝阳县| 浑源县| 株洲县| 遵义县| 筠连县| 榆社县| 同心县| 斗六市| 琼结县| 博兴县| 卢氏县| 红原县| 永善县|