【摘 要】 住房是保障民生安定的根本條件之一。相較于新房房價的飆升與波動,二手房的價格更具規(guī)律性,對于民眾更加經(jīng)濟適用。因此,研究二手房價格的影響因素,對于社會住房經(jīng)濟鏈的形態(tài)與穩(wěn)定有重要意義。本文收集昆明二手房價格及面積、朝向、樓層、裝修、區(qū)域、建筑、產(chǎn)權(quán)、結(jié)構(gòu)、物業(yè)費、廳室和衛(wèi)生間數(shù)等變量,對其進行嶺回歸分析,結(jié)果表明,昆明二手房價格與房屋面積、朝向、樓層等有更加密切的關(guān)系
【關(guān)鍵詞】 二手房 嶺回歸 價格
1 引言
隨著社會和經(jīng)濟的發(fā)展,人們對住房的需求更大、要求更高。新樓盤的影響因素復(fù)雜,價格居高或持續(xù)波動,此時,二手房相對來說成為了不錯的備用選擇。
二手房有自己獨特的優(yōu)勢。二手樓盤的小區(qū)或周邊配套多數(shù)比新房成熟,往往生活便利、交通方便;物權(quán)法頒布后,表明二手房和新房在產(chǎn)權(quán)使用年限并無較大區(qū)別,所以在使用權(quán)上無本質(zhì)差異;最重要的是,相對于新房,二手房的價格更加實惠,減輕了民眾的購房壓力,可以有更多自主選擇的可能。因此研究二手房價格的主要影響因素有較大的現(xiàn)實意義,可以為民眾選擇,宏觀調(diào)控提供一定的依據(jù)。
2 數(shù)據(jù)來源及數(shù)據(jù)處理
本文的數(shù)據(jù)來自房源網(wǎng)站-房天下,首先使用python軟件,以網(wǎng)絡(luò)爬蟲的方式獲取,經(jīng)過清洗整合,得到了房天下網(wǎng)站的964組2017年9月昆明二手房信息,其中包括價格(price)及面積(area)、朝向(orientations)、樓層(floor)、裝修(decoration)、區(qū)域(district)、建筑(district)、產(chǎn)權(quán)(rights)、結(jié)構(gòu)(structure)、物業(yè)費(property costs)、廳室(bedroom)和衛(wèi)生間數(shù)(toilet)等12個變量。其中面積、物業(yè)費是定量變量,其余朝向、樓層等10個變量是分類型的定性變量。
將964組數(shù)據(jù)按0.5的概率劃分成訓練集和測試集,用訓練集來擬合嶺回歸模型,用cew來得出前者模型的預(yù)測誤差。
3 基于嶺回歸的實驗分析
3.1嶺回歸
當設(shè)計陣存在復(fù)共線關(guān)系時,最小二乘回歸的性質(zhì)就會不夠理想,前人提出有偏估計嶺估計,并定義為
嶺回歸,是一種專用于共線性數(shù)據(jù)分析的有偏估計回歸方法,通過放棄最小二乘法的無偏性,以損失部分信息、降低精度為代價,對最小二乘法進行改良,獲得回歸系數(shù)更為符合實際、更可靠的回歸方法。
首先,使用R軟件在上章分好的訓練集上擬合嶺回歸,再使用10折交叉驗證找到使預(yù)測誤差最小的最優(yōu)的參數(shù)lambda。
3.2交叉驗證
10折交叉驗證即將原始數(shù)據(jù)分成10組(一般均分),將每個子集數(shù)據(jù)分別做一次測試集,其余的9組子集數(shù)據(jù)作為訓練集,這樣總共可擬合10個模型,用10個模型最終測試集的預(yù)測準確率的平均數(shù)作為此10折交叉驗證的回歸性能指標。可以有效的避免過學習以及欠學習狀態(tài)的發(fā)生,最后得到的結(jié)果也比較具有說服性。10折交叉驗證得到的均方誤差,見下圖:
3.3 測試誤差
接下來,本節(jié)使用上文通過訓練集擬合的模型以及通過交叉驗證得到的最優(yōu)參數(shù)在測試集上擬合變量,來得到預(yù)測誤差,誤差約為為37.77。
3.4 回歸系數(shù)
本節(jié)使用最優(yōu)lambda擬合全集以得到對昆明二手房價格有顯著影響的變量,以及這些變量的回歸系數(shù),詳見表1。
由上表可見,最終得到的回歸系數(shù)顯示,面積的系數(shù)為正但很小,說明房屋面積雖對二手房價有一定影響,但較小。朝向中東北、東南、東西、西、西北的都有較大的回歸系數(shù)且為負值,則會說明這些朝向和昆明二手房價格呈負向相關(guān);而朝向為南或南北布局的系數(shù)較大且為正數(shù),說明朝南、南北布局對房價有正向影響。高樓層的回歸系數(shù)也較大,但為負數(shù),說明高樓層對昆明二手房價的影響顯著并且是負方向的。
4 結(jié)論
本文通過通過嶺估計來擬合昆明二手房的價格和面積、朝向、樓層、裝修、區(qū)域、建筑、產(chǎn)權(quán)、結(jié)構(gòu)、物業(yè)費、廳室和衛(wèi)生間數(shù)等其他因素的回歸模型,找到了對昆明二手房價格有明顯影響的因素。綜上得到的結(jié)果可以總結(jié)并作如下解釋:
面積大小對二手房的單價影響不明顯??赡苡捎谌藗兏晳T傳統(tǒng)南北朝向的房屋、偏愛朝南向陽的居室,所以朝向為南、南北的二手房房價更高。可能由于人們更習慣傳統(tǒng)平樓,故樓層越高,二手房價格越低。關(guān)于其他裝修、區(qū)域、建筑、產(chǎn)權(quán)、結(jié)構(gòu)、物業(yè)費、廳室和衛(wèi)生間數(shù)這些因素,在本研究中未發(fā)現(xiàn)對昆明二手房的價格有明顯影響。
【參考文獻】
[1] 王松桂. 線性模型引論[M]. 科學出版社, 2004.:78-186.
[2] Shao, J. (1993). Linear model selection by cross-validation. Journal of the American statistical Association 88, 486-494.
作者簡介:姓名:白婧毓,性別:女,出生年月:199205,民族:漢,學歷:在讀碩士,學校:云南財經(jīng)大學,學校郵編:650221,研究方向:數(shù)據(jù)挖掘。