• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      新型租賃模式在線短租的決定性因素研究

      2020-06-01 07:53:52田亞男鄭瑞坤
      中國經貿導刊 2020年2期

      田亞男 鄭瑞坤

      摘要:基于小豬平臺的微觀數據,挖掘在線短租服務的決定因素。運用python網絡爬蟲技術獲得房源的有關數據,對影響因子進行Lasso變量識別和決策樹CART算法的預測。研究結果表明,訂單的接受率、價格、點評數、交通位置和是否為超棒房東這五個變量對房源的訂單量有顯著影響。運用決策樹CART算法對識別后的變量進行預測,研究結果顯示,決定性影響因素模擬的訂單量預測值能夠很好的擬合真實值,進一步證明了在線短租共享服務的決定性因素甄別的合理性。

      關鍵詞:在線短租 決定因素 Lasso變量選擇 決策樹CART算法

      一、引言

      近年來,互聯網消費帶動了共享經濟的繁榮發(fā)展。2010年,由互聯網搭建雙邊市場交易平臺,在線短租業(yè)務在中國興起,它是中國住宅租賃市場出現的一種以房屋共享租賃為特征的新型經濟模式。雖然在線短租業(yè)務在中國發(fā)展時間不長,但行業(yè)增長迅速。據iiMedia Research(艾媒咨詢)權威發(fā)布《2018-2019中國在線租房行業(yè)專題報告》數據顯示,2018年中國在線短租市場交易額達178.08億元,用戶規(guī)模達1.47億人,同比增長83%,預計2020年用戶規(guī)模將達到3億人,在線短租市場的持續(xù)升溫,為中國住宅租賃行業(yè)創(chuàng)造了新的經濟增長點。

      但與此同時,數據也顯示,在線短租用戶規(guī)模的增長率已經從2017年的103%下降至2018年的83%,預計到2020年,用戶增長率將降至30.6%,中國在線短租行業(yè)規(guī)模的增長率逐年下降,表明用戶對短租市場房屋共享需求發(fā)生了轉移,那么,是什么因素影響了用戶對在線短租的需求呢?

      在線短租共享租房追求以人為本和可持續(xù)發(fā)展的經濟發(fā)展目標,在滿足消費者多樣化需求的同時,以低成本、高效率匹配的方式達到了空余房源的合理利用和用戶最佳體驗的目的。與傳統租賃相比,在線短租滿足各類人群的不同租房需求,實現了房源的供需雙方快速匹配與交易。因此,在線短租的交易過程,供需雙方信息顯露在平臺上,特別是用戶在體驗了短租服務后會將自己的體驗信息公布于平臺用戶欄中,這些信息對引導新的用戶選擇房源與房東具有很強的導向性。如何運用數據挖掘方法挖掘這些信息,甄別在線短租共享服務的決定性影響因素,不僅能夠回答在線短租服務用戶需求訴求狀況,對指導在線短租行業(yè)穩(wěn)定持續(xù)發(fā)展也具有重要意義。

      本文通過Lasso變量識別和決策樹CART算法,甄別在線短租共享服務的決定性影響因素。研究特色在于:(1)基于在線短租服務信息相對對稱的特征,利用python挖掘在線數據,利用在線數據信息抓取數據共同特征,遵循了大數據數字信息經濟的研究范式;(2)采用Lasso變量識別的方法識別變量,并配備決策樹算法進一步驗證,在研究方法上體現了大數據研究方法的功能。

      二、文獻綜述

      在線短租是房屋的承租人通過互聯網或移動互聯網的方式查詢及預訂短租住房,與房屋的所有者或經營者通過線上平臺形成租賃關系。互聯網技術的進步促使了新的經濟模式的產生,共享經濟帶來了住房的共享消費。相較于傳統租賃,共享租房降低了失業(yè)率,增加了家庭收入。雖然在不同的研究領域,在線短租的定義能夠達到一致性。但是,在線短租的研究側重點比較分散,學者們從不同的層面分別給出了不同的研究結論,主要表現在兩個方面:(1)在線短租的影響因素。影響因素研究主要集中在在線短租的消費動機、消費信任、購買意愿、房源價格等方面。傳統住宿業(yè)的消費者選擇酒店住宿服務的主要動機只包含了“價格、住宿設施和位置”,而在線短租的使用者在選擇住宿時有其特殊的需求,即“居家性、社交性和原真性”三大動機。基于消費者信任的角度考慮,在線度假租賃通過個性化的服務將游客和業(yè)主聯系起來。馬磐昊基于信任理論從房東屬性和信譽的角度研究了信任對房源銷量的影響,并強調了信任建立對在線短租發(fā)展的重要性。在逐漸替代傳統酒店住宿的發(fā)展趨勢中,在線短租服務的信息對稱性也在潛移默化地改變消費者的購買意愿和決策。由于網絡消費的公開透明性,評論信息是影響消費者決策的重要因素,總體評分和房源價格對用戶的購買意愿影響顯著。反過來,價格也能影響消費者的決策。除此之外,房源價格與短租消費者的家庭可支配收入、年齡、好評率的關注度、對用戶評價的關注度等具有較強的相關性。(2)在線短租的影響因素的分析方法。從使用的研究方法來看,傳統的統計分析方法和數據挖掘法是研究在線短租影響因素常用的方法。趙建欣通過相關分析和回歸分析得出中國地區(qū)和美國地區(qū)購買意圖是基于不同因素的影響。張廣宇和葉作亮通過建立線性回歸模型分析了酒店特征信息、顧客評論信息和預訂平臺信息對酒店在線預訂的影響?;谪摱椕姘寤貧w模型,房東屬性對在線短租房源訂單增量有顯著影響,并且該模型具有一定的魯棒性。王佳園和徐薛艷通過建立服務質量評價的指標體系將網絡文本分析應用于在線短租的影響研究,強調要提高在線短租服務質量的重要性。

      在線短租的特征是供需雙方的信息披露過程,但綜述現有研究成果發(fā)現,大部分學者在考察在線短租的影響因素時要么立足于用戶,要么立足于房東,這種單視角分析使在線短租信息披露得不到完整的體現。另外,在分析方法上,采用回歸分析通過事先預設影響因素可能會使得一些重要因素排除在研究范圍外而得不到體現。本文根據在線短租平臺上披露的信息,運用Lasso選擇變量的方法對各項指標進行變量識別,并利用決策樹CART預測算法加以驗證。相較已有研究,本文最大的特色在于:在遵循大數據的研究規(guī)律與研究方法基礎上去實現甄別在線短租共享服務的影響因素研究。

      三、研究方法與數據來源

      (一)研究方法

      對數據變量進行降維和決定性影響因素的選取有很多種方法可以選擇,本文在對在線短租的數據特征和數據挖掘方法的研究基礎上,決定使用Lasso選取變量的方法和分類回歸樹CART算法結合的方式來研究在線短租服務的影響因素。

      1.Lasso變量選擇法.在以往的文獻中,經常采用普通最小二乘法對在線消費的影響因素進行實證研究,建立回歸模型并進行假設檢驗,對解釋變量的選取采用的則是逐步回歸。然而,在處理高維度大數據樣本時,無論是最小二乘法還是逐步回歸,都有其不足之處。它們一般都局限于最優(yōu)解而不是全局最優(yōu)解。Tib-shirani在1996年提出Lasso變量選擇的算法,解決了數據降維的難題。Lasso方法是一種將高維數據進行壓縮的方法,并且可以使參數估計與變量選擇同時進行。Lasso方法剔除了相關性較小的變量,避免了這些變量的異常值對模型進行干擾,是近年來被各類學者廣泛應用于參數估計和變量選擇的方法之一??紤]到數據的形態(tài)特征,本文選擇Lasso方法對影響在線短租服務的因素進行變量識別。定義如下:

      2.決策樹CART預測法.在Lasso變量選擇法的基礎上,繼續(xù)采用決策樹CART預測法對識別因素進行檢驗。這種檢驗方法是將影響因素用于預測,利用預測的準確性判斷影響因素選擇的合理性。具體操作時將影響因素用于在線短租的訂單量預測,根據訂單量預測效果判斷所選擇的因素。

      決策樹技術是數據分析中用于將一組樣本分成若干類的數據挖掘方法。通過映射關于某個項目的觀測值,預測項目的目標值的模型。首先選擇被分類的原始數據,按照預先提供的分類規(guī)則進行每個類別的最佳分割。每個根節(jié)點都對應若干葉節(jié)點,當每個個體達到某片葉子所屬規(guī)則的最大概率時,就會被分配給該葉子。然后在到達的新節(jié)點上執(zhí)行相同的操作,直到進一步的分割不再可能或者合理,該個體就屬于某個分類。

      (二)數據來源

      目前國內的在線短租平臺有小豬短租、途家網、螞蟻短租等。作為最受消費者喜愛的房源預訂平臺,小豬短租以房源量大、房東身份信息實名認證、平臺管理規(guī)范聞名。所以,基于小豬平臺的優(yōu)勢和數據可得性的特點,本文采集了該平臺上每個房源從發(fā)布至2018年12月期間的房源數據。選擇北京、上海、武漢、廣州和成都5個城市的房源在線信息作為本研究的樣本數據。主要從房客在線評價、房源屬性、房東個體特征三個方面研究在線信息對在線短租服務的影響。

      對于每個房東,從房東頁面采集了在線回復率、平均確認時長、訂單接受率以及是否為超棒房東等房東信息;對于每個房源,從房源頁面采集了價格、房源類型(整套出租、單間出租)、押金等;在房客對房源的評價方面采集了點評數量和總評分,以及各項評分(整潔衛(wèi)生、描述相符、交通位置、安全程度、性價比等)。用房源的累積訂單量定量描述在線短租服務。在小豬短租平臺上,大部分房東都同時擁有多個房源,為了區(qū)分開每一個房源的訂單量,本文只研究擁有一個房源的房東和該房源的在線信息。所以,利用python爬蟲工具從小豬短租網站上獲取房東的訂單量數據作為在線短租服務的評價指標,并篩選出單套房源的房源信息,去掉沒有評分的房源信息,最終獲得150條有效數據作為本文的研究樣本。

      四、實證分析

      (一)變量特征分析

      表1給出了房源訂單量及全部采集的14個影響因素的數據特征。訂單量的均值和標準差分別是84.23和78.59,說明每個房東所獲得的房源預訂量有很大的差別,最多的訂單量達到了436個,最少的只有7個。這與房東發(fā)布房源的時間有關,也和房源的吸引度有關。而房屋類型、總評分、整潔衛(wèi)生評分、描述相符評分、交通位置評分、安全程度評分、性價比評分和是否為超棒房東等指標的標準差卻比較小,由此也可以說明在線短租的房源給房客住宿體驗差別不是特別大。但相比較而言,住宿的押金、價格、點評數的標準差卻非常大,這主要是因為在線短租是一種非標準化的住宿,房東對房源的押金和價格的決定上有很大的自主權,這就使得樣本之間出現了較大的差異。

      (二)決定因素的識別

      影響房源訂單量的因素有很多,為了識別主要的影響因素。本研究運用Lasso方法進行變量選擇,被識別的變量分別是:在線回復率、平均確認時長、訂單的接受率、押金、價格、點評數、交通位置評分和是否為超棒房東,具體見表2。剔除了房間類型、總評分、整潔衛(wèi)生評分、描述相符評分、安全程度評分和性價比評分這六個變量,因為這幾個變量之間存在多重共線性并且對因變量的貢獻度比較小。

      從表2的Lasso回歸系數來看,影響系數較大的有訂單的接受率、點評數、交通位置和是否為超棒房東四個變量,說明共享住宿用戶在選擇房源時更關注這些因素。房東對訂單的接受率越大,訂單量越多。每一個房源只要產生訂單就會有房客信息,房客對房源的點評數量會影響潛在用戶的選擇,根據消費者的心理特征,點評數量越多說明越多人入住過該房源,也就能吸引越來越多的潛在用戶。這種現象不僅在共享住宿中有,在很多的線上銷售平臺上也很常見。交通位置對訂單量也是有正向顯著的作用,當其他因素不影響訂單量時,交通位置評分每增加一個單位,房源會平均增加4.43個訂單量,這說明消費者很關注房源的地理位置。在影響訂單量這8個變量中,是否為超棒房東這個變量影響最顯著。而是否為超棒房東是小豬短租平臺根據房東個人的信用度以及房客對房源的各項評分和評價進行綜合判斷的。根據小豬平臺上對超棒房東的認定標準,房源提供者被評為超棒房東需要滿足的要求有六點:一是身份真實可信,二是房源驗真實拍,三是快速回復接單,四是接待經驗豐富,五是好評獲得率高,六是樂于待客之道。此外,在線回復率和價格也是影響房源訂單量的因素。平均確認時間和押金對訂單量的影響為負,這說明確認訂單的時間會影響消費者的選擇,如果房東遲遲沒有確認訂單就會錯失重要的顧客,訂單量就會越來越少。

      (三)決定性因素的檢驗

      1.預測模型的建立.根據變量識別的Lasso回歸結果,選擇以上八個顯著影響因子作為決策樹預測模型的輸入變量,對短租的訂單量進行預測。在建立Lasso-CART預測模型過程中,將房源數據的150個樣本按照7:3的比例隨機分成訓練集和測試集。對訓練集建立CART決策樹模型,每個訓練樣本經過若干節(jié)點的判斷后最終被分配到所屬的類別。根據決策樹修剪的規(guī)則,影響因子有較大的貢獻率才會成為決策樹的節(jié)點。通過調整每個節(jié)點中包含的最小樣本數,使錯誤率盡可能小。最終,將調整參數后的模型進行對比,當只有訂單的接受率、價格、點評數、交通位置和是否為超棒房東成為決策樹的節(jié)點時,錯誤率是最小的。用該模型進行預測,訓練集預測的結果和真實值的擬合情況如圖1所示,從圖中可以看出,Lasso-CART模型的擬合效果理想,擬合優(yōu)度系數R2為89%,預測值能夠很好的反映訂單量的真實情況。

      2.預測模型的檢驗,為了更好的檢驗Lasso-CART決策樹模型的預測效果,將Lasso-CART決策樹模型和Lasso-SVM支持向量機、Lasso-線性回歸模型做比較研究。如圖2所示,Lasso-CART決策樹模型在測試樣本中預測值和真實值之間相差最小。對比表3中三種組合模型的預測精度,Lasso-CART預測模型的均方根誤差、絕對誤差和相對誤差都達到最小。從模型本身來說,SVM算法在分類預測應用中,更適合對分類目標變量進行預測,對數值型目標變量進行預測時的誤差較大。而線性回歸模型在對大樣本數據進行預測時,顯著地削弱了樣本中的極大值和極小值的作用,所以真實值和預測值的擬合程度明顯不高。而Lasso-CART決策樹模型在處理大樣本數據時,能夠對連續(xù)型目標變量進行精準的預測,具有可靠性高、適用性強的特點,這些都是另外兩種模型無法實現的。通過比較三種組合模型的預測效果,說明Lasso-CART決策樹模型是檢驗在線短租服務決定性因素的最優(yōu)模型。

      3.Lasso-CART決策樹模型的評價,從決策樹算法的角度分析,CART算法的回歸預測跟分類預測有本質的區(qū)別。分類預測決策樹可以準確預測預測值是否等同于真實值,同時分類回歸樹CART算法基于非參數的識別技術,能夠處理大樣本數據信息,同時對連續(xù)型解釋變量和離散型解釋變量進行識別,利用最大概率分類原則和最小GINI系數測試屬性原則極大地提高了模型的準確率,充分利用樣本數據的信息,減少錯誤分類的成本。而對于回歸預測來說,預測值只能近似地分布在真實值的附近,這也是預測連續(xù)目標變量存在的缺陷。綜合考慮各種因素,Lasso-CART決策樹模型能夠將房源訂單量的預測最大可能地和真實值擬合,從整體上看,大部分的訂單量預測值可以接近真實值。

      因而,從在線訂單量預測效果判斷,Lasso-CART決策樹模型決定的因素就是在線短租共享服務的決定性因素。通過變量識別和預測檢驗獲知:訂單的接受率、價格、點評數、交通位置和是否為超棒房東這五個變量是在線短租服務的決定性影響因素。

      五、研究結論與建議

      理論上分析,影響在線短租服務的原因有很多,房東的個人屬性、房源的質量和平臺的管理都是影響消費者是否下單的決定性因素。但綜合Lasso選取變量和決策樹對訂單量的預測結果發(fā)現:訂單的接受率、價格、點評數、交通位置和是否為超棒房東這五個變量才是在線短租決定性影響因素。從表2中的Lasso回歸系數可以看到,對在線短租的訂單量產生正向顯著影響的因素還有在線回復率以及其有負向顯著作用的平均確認時間和押金,這些因素同樣發(fā)揮著一定影響力。

      從這些因素的性質可以發(fā)現,在線短租服務的發(fā)展依賴于消費者、房東和短租平臺的共同影響,信息對稱是在線短租服務的生命線。為此,必須建立良好的信任機制,完善消費者個人的信用機制體系,增加房東與房客之間的信任度。是否為超棒房東是影響在線短租服務訂單量最顯著的變量,說明平臺需要加強對房東的管理,加強對房東個人頁面的管理,完善房東個人信息,制定相應的獎懲機制規(guī)范房東的經營模式。同時,房東要提高對消費者的服務水平,認真對待每一個房源訂單,提高訂單的接受率和在線回復率,提高房東的房源預定量,促進在線短租共享模式良性發(fā)展。

      安远县| 中方县| 大悟县| 宁武县| 韶关市| 新昌县| 德州市| 巩留县| 恭城| 卢龙县| 霍林郭勒市| 峨边| 临漳县| 固阳县| 巴林右旗| 中阳县| 高雄县| 山阳县| 拉孜县| 凤冈县| 色达县| 沁阳市| 东莞市| 中阳县| 宣化县| 九龙坡区| 余庆县| 淳化县| 灵寿县| 西乌珠穆沁旗| 河曲县| 南靖县| 门源| 平江县| 德兴市| 乌兰县| 浮梁县| 丘北县| 长宁区| 渝北区| 满城县|