祁 煒
(北京師范大學 地理科學學部,北京 100875)
住宅的異質性問題是房價指數(shù)編制中需要面對的重要問題。構成不同住宅價格的各個特征,如位置、樓層、朝向、小區(qū)環(huán)境、所在區(qū)域的交通狀況、教育資源等,因缺乏統(tǒng)一的價格標準,無法直接進行比較,需要客觀準確的方法對住宅價格進行合理評估。特征價格法較好地克服了市場比較法等傳統(tǒng)方法中存在的問題,有較好的評估效果。國際上從20世紀80年代已經(jīng)在房地產(chǎn)價格評估中采用這一方法,我國仍處于理論研究和實踐的探索階段。
本文以非線性Hedonic模型為基本模型。在影響住宅價格的各種因素中廣泛地選擇特征變量,進行顯著性檢驗,通過顯著性檢驗的特征作為特征價格模型的自變量保留,建立房價與特征變量之間的關系。選取足夠的樣本,運用傳統(tǒng)的參數(shù)回歸方法進行回歸分析,檢驗模型的解釋能力。通過對線性、半對數(shù)、對數(shù)等形式特征價格模型的對比分析,選取擬合度較好的模型,并采用Box-Cox變換進行優(yōu)化,建立特征價格模型,并以武漢市新建商品住宅為例進行住宅價格指數(shù)編制。
基于國內(nèi)外研究經(jīng)驗及武漢市的城市特點,結合數(shù)據(jù)獲取的難易程度,本文從住宅的區(qū)位特征、建筑特征、環(huán)境特征三方面綜合選取了22個特征因素,加上時間變量,共量化為26個特征變量。具體解釋如下頁表1所示:
(1)網(wǎng)簽數(shù)據(jù)。房管部門備案登記的武漢市2015年1月至2016年5月期間的網(wǎng)簽數(shù)據(jù)。網(wǎng)簽數(shù)據(jù)中包含的特征變量有:住房價格、住房區(qū)位、所在樓層、層高類別和建筑結構。(2)國家統(tǒng)計局房價信息管理系統(tǒng)數(shù)據(jù)。包含的特征變量主要有:綠化率、容積率、車位比、開盤時間。(3)實地調查取得的補充數(shù)據(jù)。網(wǎng)簽數(shù)據(jù)只能提供部分特征變量值,考慮到數(shù)據(jù)搜集的可操作性和數(shù)據(jù)的可獲得性,通過抽樣調查的方法補充網(wǎng)簽和房價信息管理系統(tǒng)無法直接提供的特征值。主要包括樓盤交通情況、教育資源、休閑環(huán)境、商業(yè)環(huán)境等。
1.3.1 分層抽樣選取實地調查樣本
采用精度控制下分層簡單隨機抽樣的方法,在有網(wǎng)簽數(shù)據(jù)的1707個樓盤中抽選94個樣本樓盤。抽樣方法如下:①精度控制:以1707個樓盤17個月網(wǎng)簽數(shù)據(jù)為總體,控制總量指標的抽樣精度,要求在95%的概率保證程度下,樓盤價格的最大相對誤差控制在5%以內(nèi)。②數(shù)據(jù)清理:在抽樣之前,剔除網(wǎng)簽數(shù)據(jù)中保障性住宅、存在明顯登記錯誤的記錄、累計銷售套數(shù)在200以下和每月均價4000元以下的樓盤。③樣本抽選:以各樓盤17個月成交均價為依據(jù),采用累計平方根法確定分層界限,共分為5層,確定出本文所需樣本數(shù)為94個。分配結果如下頁表2所示。采用“永久隨機數(shù)”方法抽取樣本。
1.3.2 實地調查收集數(shù)據(jù)
根據(jù)建模指標設置需要,設計調查問卷,通過到有關部門走訪和樣本樓盤實地調研,了解商品住宅樓盤特征值。
1.3.3 數(shù)據(jù)整理和補缺
整合多渠道獲得的數(shù)據(jù),形成規(guī)范、統(tǒng)一、準確的數(shù)據(jù)庫。由于部分樓盤在17個月的時間跨度中存在少數(shù)月份無銷售的現(xiàn)象,造成該月價格缺失。在所抽取的94個樓盤17個月共1598個價格值中,缺失價格81個,占總量的5%,使用整理后的標準化未缺失房價數(shù)據(jù)和對應的特征值數(shù)據(jù),運用人工神經(jīng)網(wǎng)絡方法進行建模。
1.3.4 數(shù)據(jù)標準化處理
對數(shù)據(jù)進行標準化處理主要為了避免數(shù)據(jù)性質不同和數(shù)據(jù)不可比的問題。不同性質和不可比指標直接加總不能正確反映不同作用力的綜合結果,須先考慮改變逆指標數(shù)據(jù)性質,使所有指標對模型的作用力同趨化。代表異質性商品的基本功能;X為住房的n個特征;β為各個特征所對應的特征價格;t為反映住房價格中時間影響的系數(shù);Dt為住房在t期的啞元變量;ε為隨機誤差項。
表1 特征價格模型常用解釋變量
表2 分層抽樣每層所需樣本數(shù)
1.4.1 模型形式選取
本文首先構建Hedonic模型的線性、對數(shù)和半對數(shù)形式。由表3可知,總體來看,半對數(shù)形式的Hedonic模型最優(yōu),因此,本文選擇半對數(shù)Hedonic模型繼續(xù)進行指數(shù)測算。
半對數(shù)Hedonic模型的擬合優(yōu)度檢驗:方程的相關系數(shù)為0.928,調整后的判定系數(shù)R2為0.859,模型能夠解釋因變量差異的85.9%。該模型在特征價格擬合程度上具有良好的解釋能力。
回歸模型總體顯著性檢驗:方差分析的檢驗統(tǒng)計量F值為407.434,在概率小于0.01拒絕自變量系數(shù)均為0的原假設下,表明進入模型的自變量對因變量的共同影響具有顯著性,回歸方程總體有效。
1.4.2 特征變量顯著性檢驗
基于構建的半對數(shù)形式Hedonic模型,對選取的26個變量進行顯著性檢驗,結果見下頁表4。
表3 三種形式的Hedonic模型統(tǒng)計量對比
除“學校個數(shù)”、“休閑得分”、“生活得分”和“離最近公交站點距離”外,其他特征變量的回歸系數(shù)在10%顯著水平下均
一般而言,Hedonic模型有線性、半對數(shù)、對數(shù)和Box-Cox變換等多種形式,在構建模型過程中,通過測算選出擬合度較好的模型形式。特征價格法基本模型如下:
其中,p為異質性商品的市場價格;c為模型常數(shù)項,能通過t檢驗,表明模型中所選的特征變量具有較好的顯著性。
多重共線性檢驗:各特征變量的方差膨脹因子VIF均小于5,絕大多數(shù)小于2,可以認為模型中不存在明顯的多重共線性問題。
由半對數(shù)形式模型運算得到殘差圖,模型的殘差近似正態(tài)分布,構建的半對數(shù)Hedonic模型對武漢市的住宅價格具有較高的擬合優(yōu)度和較好的解釋能力,可以解釋該市樓盤特征變量對住宅價格的影響。
表4 半對數(shù)Hedonic模型系數(shù)的顯著性檢驗
1.4.3 分月價格指數(shù)的計算
(1)確定標準住宅。標準住宅代表著市場上住宅的普遍水平,標準住宅的選取,是消除住宅異質性的關鍵。樣本樓盤在選取時充分考慮了代表性,本文以考察的17個月中各個特征變量的平均值作為市場存在的普遍水平,代表本區(qū)域房地產(chǎn)市場的標準住宅。
(2)測算指數(shù)對比。把標準住宅的各個特征值代入17個分月半對數(shù)Hedonic模型,得到各月的標準住宅價格。17個標準住宅價格消除了住宅價格的異質性(特征差異),具有同質可比性,當月價格比上月價格即可得到當月房地產(chǎn)價格環(huán)比指數(shù),見表5。
表5 2015年1月至2016年5月武漢市商品住宅特征價格指數(shù)計算結果
圖1半對數(shù)Hedonic模型編制環(huán)比與國家公布指數(shù)對比
通過半對數(shù)Hedonic模型測算,所得環(huán)比指數(shù)呈震蕩上行態(tài)勢,幅度在-5.7%~6.9%之間波動。國家統(tǒng)計局每月公布環(huán)比指數(shù)處于溫和上漲態(tài)勢,漲幅在0%~2.3%之間。對比發(fā)現(xiàn)(見圖1)半對數(shù)Hedonic模型測算結果與國家公布數(shù)據(jù)總體趨勢一致,17個月測算環(huán)比指數(shù)圍繞國家統(tǒng)計局公布指數(shù)上下波動,少數(shù)月份與公布指數(shù)完全吻合,超五成月份與公布指數(shù)漲跌趨勢存在一定差異。對于存在的這種差異,將進一步通過Box-Cox變換進行優(yōu)化,以達到更優(yōu)的效果。
將半對數(shù)形式的因變量進行Box-Cox變換,運用R軟件,可以得到λ最優(yōu)值,其最優(yōu)值為λ=-0.15?;貧w結果顯示,Box-Cox變換的半對數(shù)形式模型回歸結果中,各特征變量系數(shù)基本與預期影響相符,在10%的顯著性水平下,26個變量中除“周圍1公里軌道交通條數(shù)”、“總層高”和“平均每戶車位個數(shù)”三個特征變量外,其余特征變量均具有較好的顯著性。
擬合優(yōu)度檢驗結果表明,回歸模型的相關系數(shù)為0.89,調整后的判定系數(shù)R2=0.789,表明模型能夠解釋因變量差異的78.9%,擬合程度較好。
回歸模型的總體顯著性檢驗表明,方差分析檢驗統(tǒng)計量F值為260,在概率小于0.01拒絕自變量系數(shù)均為0的原假設下,表明進入模型的自變量對因變量的共同影響具有顯著性,回歸方程總體有效。
多重共線性檢驗結果表明,各自變量的方差膨脹因子均小于5,表明模型中不存在明顯的多重共線性。模型殘差近似正態(tài)分布。
綜上所述,構建的武漢市商品住宅Box-Cox變換的半對數(shù)形式特征價格模型具有良好的擬合優(yōu)度和較高的解釋能力,各特征變量的回歸系數(shù)具有統(tǒng)計意義上的顯著性,通過統(tǒng)計檢驗,可以用來分析住宅特征變量對住宅價格的影響。
按照上述各步驟,可以得出武漢市17個月的分月住宅特征價格模型。
下頁圖2是采用半對數(shù)和Box-Cox變換的半對數(shù)模型編制出的住宅價格指數(shù)與國家公布指數(shù)的比較。通過Box-Cox變換的半對數(shù)模型測算所得環(huán)比指數(shù)呈震蕩上行態(tài)勢,幅度在-3.92%~5.14%之間波動,與之前的半對數(shù)模型相比變化幅度縮小,17個月環(huán)比指數(shù)據(jù)中超五成月份與國家公布指數(shù)漲跌趨勢一致,整體來看更接近國家公布的環(huán)比指數(shù)趨勢。
圖2不同方法編制的住宅價格指數(shù)比較
(1)數(shù)據(jù)來源更加全面準確有效。本模型以武漢市房管局提供的網(wǎng)簽數(shù)據(jù)為基礎,比網(wǎng)絡搜索和網(wǎng)絡爬蟲方法獲取的數(shù)據(jù)更為準確。通過實地采訪調研的方式獲取樓盤特征值,補充網(wǎng)簽數(shù)據(jù)無法提供的房地產(chǎn)特征,構建了較為完整的住宅價格特征變量體系。采用在一定精度控制保證下分層抽樣方法抽取樓盤樣本,確保了實地調查樣本的代表性。
(2)對特征價格模型的線性、半對數(shù)、對數(shù)、Box-cox變換模型形式進行對比分析。在真實的市場交易中,住宅價格受多方面因素共同影響,與各個特征變量之間并不是簡單的線性關系,因此,本文在線性模型的基礎上引進了半對數(shù)、對數(shù)和Box-Cox變換模型,更全面地考量了住宅價格和各個特征變量之間的關系。
(3)以樓盤為樣本單位,避免了以個體住宅為樣本的缺陷。樓盤均價能較好地反映住宅價格分布結構。當前,國內(nèi)外研究多以住宅為樣本單位,這種做法存在一定缺陷。一是住宅的朝向、景觀等特征值收集困難;二是若某研究時間段內(nèi),具有同一特征因素的住宅銷售量占比過大時,該特征值會產(chǎn)生較大影響,造成這些特征值相關度過大。以樓盤為研究對象可以平滑影響。
本文為研究城市住宅價格提供了一種統(tǒng)計技術上的有益探索,但離全面深入運用Hedonic模型編制住宅價格指數(shù)還有一段距離,因此對Hedonic模型及其應用的研究還得繼續(xù)。第一,本文在建模時樓盤價格仍使用混合平均價,沒有實現(xiàn)用樓盤標準價進入模型,在后續(xù)研究中,將進一步探索用樓盤標準價進行建模測算;第二,可嘗試非參數(shù)、半?yún)?shù)等多種參數(shù)估計方法在模型中的運用;第三,進一步探索對大數(shù)據(jù)的匹配、篩選、挖掘等預處理的有效方法。
參考文獻:
[1]Case B,Pollakowski H O,Wachter S M.On Choosing Among House Price Index Methodologies[J].AREUEA Journal,1991,19(3).
[2]程亞鵬.基于住房子市場的Hedonic住房價格指數(shù)[J].經(jīng)濟問題,2010,(10).
[3]李占風,周歆毅.我國房地產(chǎn)價格的統(tǒng)計方法研究[J].統(tǒng)計與決策,2012,(8).
[4]孫玉環(huán).基于海量交易數(shù)據(jù)的房地產(chǎn)特征價格模型的構建[J].統(tǒng)計與決策,2011,(10).
[5]程亞鵬.我國城市住宅價格測試—Hedonic方法與實證[M].北京:光明日報出版社,2013.