岳鴻霄 韓雪源
【摘? 要】論文以??谑芯W(wǎng)約車運(yùn)營服務(wù)為例,以2017年10月1日??谑芯W(wǎng)約車訂單數(shù)據(jù)為研究對象,利用Python對原始訂單數(shù)據(jù)進(jìn)行清洗,借助ArcGIS與Surfer對清洗后的數(shù)據(jù)進(jìn)行挖掘和可視化分析并探尋訂單的空間特征,利用Excel分析訂單的時(shí)間特征,研究??谑袊鴳c長假首日網(wǎng)約車訂單需求變化的時(shí)空分布規(guī)律,提出最優(yōu)配置建議。
【Abstract】This paper takes the ride-hailing operation service of Haikou City as an example, takes the ride-hailing order data of Haikou City on October 1, 2017 as the research object, uses Python to clean the original order data, and uses ArcGIS and Surfer to mine the cleaned data, conduct visual analysis and explore the spatial characteristics of the order. By using Excel to analyze the time characteristics of orders, this paper studies the temporal and spatial distribution of the demand change of online ride-hailing orders on the first day of National Day long holiday in Haikou City, and puts forward the optimal allocation suggestions.
【關(guān)鍵詞】地理大數(shù)據(jù);網(wǎng)約車;配置優(yōu)化
【Keywords】geographic big data; online ride-hailing; allocation optimization
【中圖分類號】F572;F724.6? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文獻(xiàn)標(biāo)志碼】A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?【文章編號】1673-1069(2021)06-0107-03
1 引言
運(yùn)用地理大數(shù)據(jù)深度挖掘網(wǎng)約車運(yùn)營信息,如訂單類型、訂單起終點(diǎn)、經(jīng)緯度、出行品類、乘車人數(shù)、乘車時(shí)間和時(shí)長等,進(jìn)行數(shù)據(jù)可視化分析,精準(zhǔn)描述并匹配用戶對于車輛類型、用車時(shí)間、行程距離、乘車路線等用車需求,分析網(wǎng)約車運(yùn)營的時(shí)空分布規(guī)律,對于提高網(wǎng)約車的運(yùn)營效率和服務(wù)能力、提高城市運(yùn)力資源的配置效率具有重要意義。
2 文獻(xiàn)綜述
當(dāng)前研究出租車、網(wǎng)約車運(yùn)營管理與支持的文獻(xiàn),主要是基于時(shí)間和空間2個(gè)維度,研究車輛運(yùn)量投放和熱點(diǎn)區(qū)域探測及路徑推薦。時(shí)間維度上的研究,主要是基于車輛基本信息的統(tǒng)計(jì)分析,如運(yùn)行時(shí)空特性及運(yùn)營指標(biāo)分析,根據(jù)這些基本信息確定出租車的市場供求關(guān)系以及出租車的運(yùn)量投放規(guī)模,如翁劍成(2010)、程靜(2016)、吳華意(2019)等??臻g維度上的研究,主要是對車輛軌跡數(shù)據(jù)進(jìn)行深層挖掘,研究對象有車輛的行駛速度、行駛里程、載客里程、上下客點(diǎn)、空載率、司機(jī)的收益排名情況,對出租車進(jìn)行了行為分析,進(jìn)行出行熱點(diǎn)區(qū)域探測、尋客策略擬定和路徑推薦,出行方向判斷以及打車需求預(yù)測等,如孫飛(2015)、畢碩本(2018)等。
綜上,當(dāng)前研究車輛軌跡數(shù)據(jù)的文獻(xiàn)較為豐富,但大多文獻(xiàn)在進(jìn)行空間分析時(shí),未利用衛(wèi)星影像圖,沒有結(jié)合經(jīng)緯度、行政區(qū)劃圖等地理、地圖要素進(jìn)行可視化研究。本文基于地理大數(shù)據(jù),以??谑芯W(wǎng)約車運(yùn)營服務(wù)為例,以2017年10月1日??谑芯W(wǎng)約車訂單數(shù)據(jù)為研究對象,利用Python對原始訂單數(shù)據(jù)進(jìn)行清洗,借助ArcGIS與Surfer軟件對清洗后的數(shù)據(jù)進(jìn)行挖掘和可視化分析,并探尋訂單的空間特征,利用Excel分析訂單的時(shí)間特征,研究??谑袊鴳c長假首日網(wǎng)約車訂單需求變化的時(shí)空分布規(guī)律,在此基礎(chǔ)上提出節(jié)假日網(wǎng)約車運(yùn)營的最優(yōu)配置建議。
3 數(shù)據(jù)來源
本文數(shù)據(jù)均來源于滴滴出行公布的??谑?017年5月~10月每天的訂單信息。數(shù)據(jù)內(nèi)容包括:訂單起點(diǎn)與終點(diǎn)的經(jīng)緯度信息、訂單類型、出行品類、預(yù)估價(jià)格、乘車時(shí)長等。對于涉及乘客個(gè)人信息的數(shù)據(jù)已進(jìn)行處理,不涉及個(gè)人隱私侵犯問題。受數(shù)據(jù)和研究手段限制,本文以小時(shí)為時(shí)間單位,以??谑?0月1日7:00~20:00共計(jì)13個(gè)小時(shí)的訂單信息作為研究數(shù)據(jù),探尋以“十一長假”第一天為代表的節(jié)假日網(wǎng)約車運(yùn)營的時(shí)間與空間特征規(guī)律。
4 研究方法
首先,利用Python進(jìn)行數(shù)據(jù)清洗去除無效數(shù)據(jù),導(dǎo)入Excel中進(jìn)行格式轉(zhuǎn)換;其次,使用ArcGIS與Surfer軟件挖掘訂單的空間特征,對其進(jìn)行數(shù)據(jù)分析與可視化;最后,使用Excel軟件對訂單的時(shí)間特征進(jìn)行數(shù)據(jù)挖掘與數(shù)據(jù)分析。
4.1 訂單空間特征挖掘
①借助ArcMap與ArcScene,以50m×50m為單元,統(tǒng)計(jì)每個(gè)單元內(nèi)逐小時(shí)及整個(gè)研究時(shí)段內(nèi)的訂單數(shù)量,并使用不同的可視化方式使之更為直觀,便于分析。
在ArcMap中,根據(jù)清洗后的數(shù)據(jù)中的經(jīng)緯度坐標(biāo),將每小時(shí)和整個(gè)研究區(qū)的訂單顯示在??谑行姓^(qū)劃圖中的相應(yīng)位置。利用漁網(wǎng)功能,生成單元為50m×50m大小的漁網(wǎng)面。將生成的漁網(wǎng)面與導(dǎo)出后的訂單點(diǎn)數(shù)據(jù)關(guān)聯(lián),以??谑行姓^(qū)劃圖為掩模進(jìn)行裁剪。為統(tǒng)一且直觀地顯示訂單的密集程度,將裁剪后的圖層用自然斷點(diǎn)法分為8級,再進(jìn)行手動調(diào)整,將沒有訂單的區(qū)域設(shè)為不可見(透明)。由于ArcScene只可以識別柵格圖層,還需要在ArcMap中將圖層轉(zhuǎn)為柵格存儲。最后在制作專題圖時(shí)添加相應(yīng)的地圖要素。
②借助Surfer可以同時(shí)間對比多張圖的特征,對比逐小時(shí)的平均起點(diǎn)和平均終點(diǎn)與訂單數(shù)量。在Excel按時(shí)段進(jìn)行統(tǒng)計(jì),分別計(jì)算每個(gè)時(shí)段的總訂單數(shù)、平均起點(diǎn)和平均終點(diǎn)的經(jīng)緯度坐標(biāo),并導(dǎo)出為文本文件。在Surfer軟件中,按照建立表面圖、網(wǎng)格化數(shù)據(jù)、生成等值線圖、生成表面圖的順序,以反距離插值的網(wǎng)格化方式,根據(jù)離散的經(jīng)緯度坐標(biāo)點(diǎn)和單數(shù),完成東經(jīng)110.3°~110.5°,北緯19.9°~20.02°范圍內(nèi),平均起點(diǎn)圖和平均終點(diǎn)圖的制作。再利用百度地圖的坐標(biāo)反查功能,查找相應(yīng)平均起點(diǎn)與終點(diǎn)的坐標(biāo)與城市功能區(qū),探尋訂單整體的空間分布規(guī)律。
4.2 訂單時(shí)間特征挖掘
匯總?cè)繑?shù)據(jù)后,繪制時(shí)間-產(chǎn)品線關(guān)系圖,探尋滴滴出行產(chǎn)品線(專車、快車、豪華車)與時(shí)間之間的關(guān)系;繪制時(shí)間-訂單數(shù)與均價(jià)、平均時(shí)長關(guān)系圖,探尋全部訂單數(shù)量、平均預(yù)估價(jià)格、平均時(shí)長、時(shí)間之間的關(guān)系;繪制時(shí)間-訂單類型關(guān)系圖,探尋訂單類型(實(shí)時(shí)單、預(yù)約單)與時(shí)間之間的關(guān)系。
5 網(wǎng)約車節(jié)假日運(yùn)營時(shí)空特征分析
5.1 訂單空間特征分析
5.1.1 累計(jì)訂單起點(diǎn)的空間分布特征
在上述時(shí)間段內(nèi),滴滴出行一天累計(jì)訂單的空間分布及單位面積上訂單數(shù)量可視化圖(后續(xù)簡稱為訂單密度圖)如圖1、圖2所示。
根據(jù)訂單空間分布圖,可知:訂單數(shù)量的分布基本以城市核心區(qū)為中心,向外沿城市主干道、高速,呈輻射狀減少,其中沿河兩岸訂單數(shù)量明顯西岸多于東岸;西北部沿海區(qū)域訂單數(shù)相較于北部及東北部多,或許與中間隔著河有關(guān);城市的中部和南部為2個(gè)明顯的訂單密集區(qū)。根據(jù)訂單密度圖,可更為直觀地發(fā)現(xiàn)訂單密度以核心區(qū)為中心,沿城市主要道路和高速路向外輻射擴(kuò)散狀減少。
借助百度地圖經(jīng)緯度坐標(biāo)反查功能,查詢了所有訂單平均起點(diǎn)和終點(diǎn)的位置,如圖3所示。平均起點(diǎn)和終點(diǎn)之間的距離非常接近,但是向西北方向發(fā)生了一定的偏移,推測整體訂單中向西北方向移動的居多。其中平均起點(diǎn)為??谑旋埲A區(qū)坡博路,平均終點(diǎn)為??谑旋埲A區(qū)南沙路62號。由衛(wèi)星影像圖可知,平均起點(diǎn)和終點(diǎn)均處于??谑兄行奈恢?。
5.1.2 逐小時(shí)訂單起點(diǎn)的空間分布特征
按前述方法繪制??谑?017年10月1日7:00~20:00時(shí)間段內(nèi),滴滴出行每小時(shí)訂單密度圖(圖略)。通過觀察訂單空間分布圖可知,無論哪個(gè)時(shí)段,訂單的分布都較為集中,且單位面積上訂單數(shù)量多的位置也較為接近,同時(shí),這些區(qū)域幾乎完全覆蓋城市一級道路,可知該區(qū)域?yàn)楹?谑泻诵膮^(qū)。通過逐小時(shí)訂單數(shù)量空間分布圖間的對比,可發(fā)現(xiàn)隨著時(shí)間的推移,訂單數(shù)量高的區(qū)域在不斷增加,在上午7~8時(shí),訂單數(shù)量多的單元在實(shí)際中多為聚集性居民區(qū)。隨著時(shí)間的推移,由居民區(qū)向商業(yè)點(diǎn)或城市綠化景觀等休閑場所過度,但這2種區(qū)域的訂單數(shù)量都保持在較高的水準(zhǔn)。
5.1.3 逐小時(shí)訂單起點(diǎn)與終點(diǎn)的平均位置空間特征
在研究時(shí)段內(nèi)每小時(shí)對訂單的起點(diǎn)與終點(diǎn)的平均空間位置進(jìn)行統(tǒng)計(jì),數(shù)據(jù)如表1所示。隨著時(shí)間的推移,各時(shí)段平均起點(diǎn)整體呈現(xiàn)向西北方向移動的趨勢,平均終點(diǎn)整體呈現(xiàn)由西北向東南方向移動的趨勢。
利用Surfer對各個(gè)時(shí)段內(nèi)的平均起點(diǎn)與終點(diǎn)進(jìn)行分析,結(jié)合該時(shí)段的訂單數(shù)量得到圖4,其中,黃色為主色調(diào)的圖層為平均終點(diǎn)位置與用反距離插值后的訂單數(shù)量,深綠色為主色調(diào)的圖層為平均起點(diǎn)位置與用反距離插值后的頂點(diǎn)數(shù)量。通過2個(gè)圖層內(nèi)的訂單數(shù)量的多少與位置,可獲得和上述內(nèi)容一樣的結(jié)論。
5.2 訂單時(shí)間特征分析
根據(jù)滴滴出行數(shù)據(jù),按照訂單數(shù)、實(shí)時(shí)單與預(yù)約單、專車與快車和豪華車、平均預(yù)估價(jià)格、平均時(shí)長進(jìn)行逐小時(shí)統(tǒng)計(jì),分別從產(chǎn)品線的時(shí)間特征、訂單數(shù)和均價(jià)、平均時(shí)長的時(shí)間特征、訂單數(shù)量的時(shí)間特征進(jìn)行分析。
5.2.1 產(chǎn)品線時(shí)間特征
基于訂單數(shù)據(jù)繪制時(shí)間-產(chǎn)品折線圖(見圖5)。無論哪個(gè)時(shí)段,快車訂單的數(shù)量都遠(yuǎn)大于專車的數(shù)量,而豪華車訂單的數(shù)量始終為0,這與滴滴出行公司提供的3種產(chǎn)品線的價(jià)格和數(shù)量有著密不可分的關(guān)系。
5.2.2 訂單數(shù)、均價(jià)與平均時(shí)間特征
繪制時(shí)間-訂單數(shù)與均價(jià)、平均時(shí)長關(guān)系圖(見圖6)。由圖6可知,隨著訂單量的增加,平均預(yù)估價(jià)格與平均時(shí)長呈現(xiàn)出減少的趨勢。隨著平均價(jià)格的降低,平均價(jià)格呈現(xiàn)出了與之相似的變化規(guī)律,當(dāng)7~10點(diǎn)平均價(jià)格減少時(shí),平均時(shí)長反而呈現(xiàn)出了增加的趨勢。
6 網(wǎng)約車節(jié)假日運(yùn)營配置結(jié)論和建議
6.1 結(jié)論
①全市每個(gè)地理單位每小時(shí)訂單數(shù)量都隨時(shí)間的增加而增長,其中城市南部和中部的變化最為顯著。從10點(diǎn)開始,城南部的居民區(qū)訂單數(shù)量驟增,11~12點(diǎn)時(shí)達(dá)到頂峰,隨后緩慢下降,在15~16點(diǎn)時(shí)達(dá)到相對低谷,在16~17點(diǎn)時(shí)再次大量增長并保持相對穩(wěn)定。
②早晨時(shí)段城市中部的商業(yè)區(qū)、綠地等區(qū)域的訂單數(shù)量較低,隨后逐漸增長,但增速相較居民區(qū)緩慢,在12點(diǎn)過后訂單數(shù)量大幅增加又逐漸減少,在16~17時(shí)達(dá)到相鄰時(shí)段內(nèi)的谷底,隨后再次增加,直至18時(shí)后達(dá)到同時(shí)段內(nèi)訂單密度最高的區(qū)域。
③快車的訂單數(shù)量增長和減少與總訂單數(shù)同步,趨勢相同。
6.2 建議
6.2.1 空間配置建議
在進(jìn)行網(wǎng)約車配置時(shí),應(yīng)以市中心為核心,沿主要道路逐漸向外減少車輛的調(diào)度,同時(shí)注意適量增加??谑形鞅辈康能囕v配置;節(jié)假日的7~9點(diǎn)、中午11點(diǎn)前后、下午17點(diǎn)前后,應(yīng)主要配置在各個(gè)居民區(qū),且居民區(qū)密度越大,該區(qū)域網(wǎng)約車數(shù)量越多;中午12點(diǎn)后,應(yīng)注意商業(yè)區(qū)和居民區(qū)的均衡配置;下午18點(diǎn)后,應(yīng)以商業(yè)區(qū)為主要區(qū)域。
6.2.2 時(shí)間配置建議
自早上7時(shí)起,應(yīng)不斷提高空閑網(wǎng)約車數(shù)量,以面對迅速增長的訂單數(shù)量;在12~19點(diǎn)的訂單高峰期,提高快車的數(shù)量同時(shí)控制專車、豪華車數(shù)量;鼓勵乘客選擇提前計(jì)劃出行時(shí)間,避免8~11點(diǎn)道路擁擠時(shí)出行,減小對城市路面交通的壓力。
【參考文獻(xiàn)】
【1】翁劍成,劉文韜,陳智宏,等.基于浮動車數(shù)據(jù)的出租車運(yùn)營管理研究[J].北京工業(yè)大學(xué)學(xué)報(bào),2010,36(06):779-784.
【2】程靜,劉家駿,高勇.基于時(shí)間序列聚類方法分析北京出租車出行量的時(shí)空特征[J].地球信息科學(xué)學(xué)報(bào),2016,18(09):1227-1239.
【3】吳華意,黃蕊,游蘭,等.出租車軌跡數(shù)據(jù)挖掘進(jìn)展[J].測繪學(xué)報(bào),2019(11).
【4】孫飛,張霞,唐爐亮,等.基于GPS軌跡大數(shù)據(jù)的優(yōu)質(zhì)客源時(shí)空分布研究[J].地球信息科學(xué)學(xué)報(bào),2015,17(03):329-335.
【5】畢碩本,萬蕾,楊樹亮,等.基于GPS數(shù)據(jù)的南京出租車上下客時(shí)間特征及熱點(diǎn)時(shí)空分布[J].中國科技論文,2018,13(09):1023-1028.