張曲智 李佳欣
摘 ?要:本文通過300w條摩拜用戶的歷史出行數(shù)據(jù),對(duì)用戶的出行規(guī)律進(jìn)行推測(cè)。再經(jīng)過數(shù)據(jù)清洗和數(shù)據(jù)探索后,分別通過時(shí)間和出行距離兩個(gè)維度,得出用戶使用量與出行時(shí)間有關(guān),與出行距離無關(guān)的結(jié)論。
關(guān)鍵詞:用戶行為;時(shí)間;訂單;行駛距離
一、公司背景
如今摩拜單車使用了新一代物聯(lián)網(wǎng)技術(shù),通過智能手機(jī) app 讓用戶隨時(shí)隨地可以定位并使用最近的摩拜單車,騎行到達(dá)目的地后,就近停放在路邊合適的區(qū)域,關(guān)鎖即實(shí)現(xiàn)電子付費(fèi)結(jié)算。摩拜單車于 2015 年 1 月成立,2016 年 4 月 22 日地球日當(dāng)天在上海正式推出智能共享單車服務(wù),并已先后進(jìn)入中國(guó)、新加坡、英國(guó)、意大利、日本、泰國(guó)、韓國(guó)等19個(gè)國(guó)家。
二、研究目的與意義
作為消費(fèi)者,希望得到更好的體驗(yàn),可以隨時(shí)隨地騎行;作為公司,面對(duì)競(jìng)爭(zhēng)激烈的共享單車市場(chǎng),為了面向消費(fèi)者多變的需求,尋找出行規(guī)律降低成本。摩拜需要定期對(duì)消費(fèi)者行為進(jìn)行分析,從而制定對(duì)應(yīng)的戰(zhàn)略,產(chǎn)品與運(yùn)營(yíng)調(diào)度,更好的調(diào)度和管理。
市場(chǎng)上來看,隨著互聯(lián)網(wǎng)不斷發(fā)展,數(shù)據(jù)儲(chǔ)存能力不斷提升,數(shù)據(jù)量需求持續(xù)增加的情況下,數(shù)據(jù)處理與分析變得困難。而Gatner Group[2]交出的答卷是商業(yè)智能(BI)。通過分析,決策人員獲得了知識(shí),從而為企業(yè)發(fā)展做出更加有力的決策[3]。本文希望通過數(shù)據(jù)處理,分析消費(fèi)者行為,為摩拜單車的調(diào)度和運(yùn)營(yíng)的策略提供依據(jù)。
三、分析過程
(一)數(shù)據(jù)處理
本次用到的數(shù)據(jù),包含300萬條北京地區(qū)的出行記錄數(shù)據(jù),覆蓋超過30萬用戶和40萬摩拜單車。經(jīng)清洗后,數(shù)據(jù)字段包括騎行起始時(shí)間(為包含年月日的時(shí)間戳)和地點(diǎn)、車輛ID、車輛類型和用戶ID等信息。本次分析目的是處理數(shù)據(jù),得出初步結(jié)論,同時(shí)為后期預(yù)測(cè)騎行目的地的區(qū)塊位置打好基礎(chǔ)。
(二) 基于Geohash劃分區(qū)域
在這里介紹Geohash[1]:GeoHash將二維的經(jīng)緯度轉(zhuǎn)換成字符串,比如右圖展示了北京9個(gè)區(qū)域的GeoHash字符串每一個(gè)字符串代表了某一矩形區(qū)域。字符串越長(zhǎng),表示的范圍越精確。如圖所示,5位的編碼能表示10平方千米范圍的矩形區(qū)域,而6位編碼能表示更精細(xì)的區(qū)域(約0.34平方千米)。
(三)時(shí)間與訂單量分析
首先,利用python,將時(shí)間戳中的每個(gè)時(shí)刻提取出來,同時(shí)進(jìn)行分組求和,可得每個(gè)時(shí)刻的訂單產(chǎn)生情況(如左圖);再次處理時(shí)間,將時(shí)間戳中的工作日記為0,非工作日記為1,按照是否為工作日和出行時(shí)刻同時(shí)進(jìn)行分組,按組計(jì)算沒時(shí)刻產(chǎn)生的訂單量(如右圖)
可知,橫軸是每日的時(shí)刻,縱軸代表訂單數(shù)量。由圖可知,藍(lán)色區(qū)域代表工作日,7-8點(diǎn),17-18點(diǎn)是工作日的高峰期,其他時(shí)刻波動(dòng)平緩,與高峰期時(shí)刻差別明顯。綠色區(qū)域代表非工作日,不存在訂單高峰期,基本趨于平緩。工作日與非工作日訂單規(guī)律不同。工作日存在訂單高峰期,明顯高于非工作日;但非工作日平常時(shí)刻(8-16點(diǎn))的訂單量要稍高
(四)出行距離分析
首先計(jì)算出行距離的描述統(tǒng)計(jì),結(jié)果如下:
出行距離的中位數(shù)是660米左右,按照摩拜單車的定位,五公里以內(nèi)都是合理的數(shù)據(jù),出行距離較遠(yuǎn)的訂單較為稀少,可以看做異常值處理。由此可以看出,
去除異常值之后,我們可以更為清晰的觀測(cè)到密度曲線主要分布在0-2000米以內(nèi),符合摩拜單車短距離出行的定位??梢愿鶕?jù)出行距離與訂單量作圖如上圖。
接下來探究,時(shí)間對(duì)出行距離有無明顯規(guī)律。圖中可以看出,雖然稍有波動(dòng),但是比較平緩,總體上沒有大的波動(dòng)。時(shí)間對(duì)出行距離沒有決定性影響。
四、結(jié)論總結(jié)
經(jīng)過上述分析,這幾個(gè)月內(nèi)的數(shù)據(jù)顯示,消費(fèi)者在工作日有明顯的高峰期出行規(guī)律,那么在對(duì)單車進(jìn)行調(diào)度和維護(hù)的時(shí)候,可以在工作日,約7-8點(diǎn),17-18點(diǎn)時(shí)刻,重點(diǎn)部署單車位于各高峰期地鐵站出口,公交站;而非工作日,但非工作日平常時(shí)刻,8-16點(diǎn),可以部署單車與各大商場(chǎng)出口,街邊指定擺放處,如此,根據(jù)消費(fèi)者習(xí)慣,針對(duì)性強(qiáng),也能給消費(fèi)者更好的體驗(yàn),有利于用戶留存提高,用戶增長(zhǎng);而經(jīng)過數(shù)據(jù)顯示,騎行距離中位數(shù)在600米左右,而絕大部分人都在2000米以內(nèi),公司應(yīng)在現(xiàn)階段應(yīng)把單車設(shè)計(jì)方向,和經(jīng)營(yíng)戰(zhàn)略,都面向2千米以內(nèi)的客戶。
在當(dāng)前市場(chǎng)環(huán)境中,經(jīng)過大數(shù)據(jù)分析挖掘,可以有效的指定戰(zhàn)略[5],抓住市場(chǎng)機(jī)遇,也可以更好的運(yùn)營(yíng)業(yè)務(wù),節(jié)省成本。
參考文獻(xiàn):
[1]邢凱, 羅永龍, 寧雪莉, et al. 基于Geohash編碼的位置隱私保護(hù)算法[J]. 計(jì)算機(jī)工程與應(yīng)用, 2019, 55(1).
[2]錢丹丹,周金海.基于大數(shù)據(jù)的商業(yè)智能在電商數(shù)據(jù)分析中的應(yīng)用[J].電子商務(wù),2019(04):29-30+96.
[3]黃秋雨,耿繼原.社交媒體數(shù)據(jù)的獲取與處理分析研究[J].測(cè)繪與空間地理信息,2019,42(02):141-144.
[4]李克(Ke Lee). 基于服務(wù)設(shè)計(jì)的共享單車系統(tǒng)改良研究[D]. 沈陽航空航天大學(xué), 2018.
[5] 劉靜. 摩拜單車的戰(zhàn)略分析[J]. 納稅, 2017(24):151-151.