楊沁樓,王飛翔
摘要:軌跡數(shù)據(jù)隱含著城市交通系統(tǒng)的豐富信息,出租車作為城市交通的重要組成部分,其軌跡具有數(shù)據(jù)源獲取容易、成本消耗小、更新快、反饋快等特點,其軌跡信息可以為城市道路網(wǎng)信息的提取和還原提供支持。基于這個背景,開展基于出租車軌跡數(shù)據(jù)提取道路信息和構(gòu)建道路模型的研究具備一定的實際意義,通過對道路中心線、道路交叉口等信息的提取,還原道路模型并對還原效果并進(jìn)行評價,所獲得的成果能為基于軌跡路網(wǎng)信息提取的進(jìn)一步研究提供參考,也能為大眾的出行和相關(guān)管理部門的工作提供決策支持。
關(guān)鍵詞:出租車軌跡數(shù)據(jù);數(shù)學(xué)形態(tài)學(xué);道路提??;ArcGis
中圖分類號:G642? ? ? ? 文獻(xiàn)標(biāo)識碼:A
文章編號:1009-3044(2022)35-0060-04
1 緒論
1.1 研究背景及意義
隨著時代的進(jìn)步,大數(shù)據(jù)研究成為一股熱潮,其目的在于實現(xiàn)數(shù)據(jù)的“增值”。大數(shù)據(jù)具有5V特點,即Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。大數(shù)據(jù)可以分為三類:傳統(tǒng)企業(yè)數(shù)據(jù)、機(jī)器和傳感器數(shù)據(jù)、社交數(shù)據(jù)。
軌跡數(shù)據(jù)是機(jī)器和傳感器數(shù)據(jù)的一部分,蘊含著相當(dāng)可觀的數(shù)據(jù)信息,對路網(wǎng)信息更新、智慧城市建設(shè)等方面起到相當(dāng)積極的作用。城市路網(wǎng)是城市范圍內(nèi)由不同功能、等級、區(qū)位的道路以一定的密度和適當(dāng)?shù)男问浇M成的網(wǎng)絡(luò)結(jié)構(gòu),是城市居民出行不可或缺的資源;隨著GPS儀器、衛(wèi)星定位、道路監(jiān)控、便攜式定位設(shè)備以及傳感器技術(shù)的迅速發(fā)展,對于移動對象的實時追蹤已經(jīng)成了現(xiàn)實,這就使得我們可以在低時間成本和經(jīng)濟(jì)成本條件下輕松獲得大量的、實時的軌跡數(shù)據(jù),進(jìn)而對城市交通系統(tǒng)進(jìn)行完善,諸多學(xué)者開始著眼于研究軌跡數(shù)據(jù),希望能從中提取出可靠有效的路網(wǎng)信息。
1.2 國內(nèi)外研究現(xiàn)狀
從各類數(shù)據(jù)中提取路網(wǎng)信息是當(dāng)下數(shù)據(jù)挖掘的熱點方向之一。
國外方面,針對道路信息數(shù)據(jù),Kim、Kyoungok同時分析了地鐵和出租車的數(shù)據(jù),以揭示首爾交通工具對人的流動性的影響因素,采用了聚類和分類等數(shù)據(jù)挖掘技術(shù),確定影響乘客模式的因素[1]。Gong和Cartlidge基于軌跡數(shù)據(jù),利用地理感興趣點(POI)數(shù)據(jù)和時空聚類相結(jié)合的方法,自動識別每個出租車行程的相關(guān)活動,并估計行程后的返回行程和后續(xù)活動[2]。
國內(nèi)方面,也有許多針對出租車數(shù)據(jù)的挖掘案例。李清泉通過出租車軌跡回復(fù)路線,與已有路徑進(jìn)行比對分析,以獲取經(jīng)驗最優(yōu)路徑[3]。何曉軍等學(xué)者提出基于 VGA 聚類的遙感影像道路中心線的提取,該方法解決了聚類數(shù)目難以確定的問題,但是數(shù)據(jù)源獲取昂貴,對于軌跡數(shù)據(jù)來說適用有待商榷[4]。劉笑等學(xué)者通過全卷積神經(jīng)網(wǎng)絡(luò)提取道路信息,該方法數(shù)據(jù)源使用的是遙感影像,需要大量的數(shù)據(jù)集支撐,效率慢,費用昂貴[5]。
2 有效軌跡提取
2.1數(shù)據(jù)采集
本文需要收集出租車的軌跡數(shù)據(jù)和北京市交通圖。其中,收集到的出租車軌跡數(shù)據(jù)為北京市10357輛出租車在2008年2月2日至2008年2月8日期間的GPS位置,數(shù)據(jù)以txt的格式存儲。其格式如圖1所示。各字段含義如下:車序列號、年月日、具體時間點、經(jīng)度值、緯度值。如圖1中的第一行出租車軌跡數(shù)據(jù)值表示:序列號為1的出租車在2008年2月2日15點36分08秒處于東經(jīng)116.351172°,北緯39.92123°的位置。
除此之外,筆者從谷歌地圖上截取了2008年北京市交通圖,用于對比分析路網(wǎng)信息提取的效果。
2.2數(shù)據(jù)預(yù)處理
數(shù)據(jù)預(yù)處理即針對數(shù)據(jù)噪聲進(jìn)行處理,旨在提高數(shù)據(jù)處理的速度,減少臟數(shù)據(jù)在模型構(gòu)建過程中的影響。異常數(shù)據(jù)即偏離預(yù)期道路軌跡的數(shù)據(jù),對已發(fā)表文獻(xiàn)總結(jié),找到異常軌跡數(shù)據(jù)處理主要有四種方法[6]:歷史軌跡相似性檢測法、閾值檢驗法、網(wǎng)格檢驗法、分類檢測法。
閾值檢驗法較為簡單且精度較高,可以相對準(zhǔn)確地將偏離主干線的點進(jìn)行刪除,滿足數(shù)據(jù)預(yù)處理的要求,且適合本文的數(shù)據(jù)量,所以本文采用此方法對交通軌跡數(shù)據(jù)進(jìn)行異常處理。
異常數(shù)據(jù)刪除示例如圖2所示。
2.3 道路中心線的提取
2.3.1 面狀道路要素構(gòu)建
面狀要素的構(gòu)建是道路中心線提取的關(guān)鍵一環(huán),構(gòu)建面狀要素即是構(gòu)建出整體的道路輪廓,該輪廓與城市交通路網(wǎng)相對應(yīng)。
面狀道路要素構(gòu)建可以直接建立要素緩沖區(qū)來達(dá)到目的,從我們搜索的資料來看,北京市的道路寬度平均為14.64米,所以我們對出租車軌跡點的緩沖區(qū)半徑設(shè)置為10-20米,希望建的緩沖區(qū)能夠相對全面地覆蓋道路。
本文分別選取10米、15米、20米、25米為緩沖區(qū)半徑進(jìn)行嘗試,具體實驗結(jié)果如圖3所示。
從中不難看出,20米的緩沖區(qū)半徑最為合適,而10米、15米緩沖區(qū)的道路面具有斷開、不連通的現(xiàn)象,且存在大量的噪聲干擾;當(dāng)緩沖區(qū)半徑大于20米,道路面無法體現(xiàn)出道路的細(xì)節(jié),相鄰的道路會融合在一起,從而無法精確地得出道路模型,所以本文采用20米作為緩沖半徑構(gòu)建道路面。
2.3.2基于數(shù)學(xué)形態(tài)學(xué)的柵格清理
數(shù)學(xué)形態(tài)學(xué)(Mathematical morphology)是一門建立在格論和拓?fù)鋵W(xué)基礎(chǔ)之上的圖像分析學(xué)科,是數(shù)學(xué)形態(tài)學(xué)圖像處理的基本理論。
進(jìn)行柵格清理時需要用到基于數(shù)學(xué)形態(tài)學(xué)的膨脹和腐蝕運算。膨脹可以理解為是求局部最大值的操作,設(shè)有兩個集合A,B,對B移動x距離后,仍存在與A集合內(nèi)的B要素點,即膨脹后的結(jié)果。也可以理解為A與B進(jìn)行了卷積處理,B為核,計算集合B所在區(qū)域的最大像素值,并將該像素值賦予我們指定的像素,使得該區(qū)域內(nèi)某些像素值得到突出顯示。
如公式(1)所示:
[A?B=B+x?A]? ? ? ? ? ? ? ? ? ? ? ? ? ? (1)
A為被處理集合,B為結(jié)構(gòu)元素,或可以理解為卷積運算中的核,[?]為卷積運算符;
腐蝕運算則不同,將集合B移動x距離,若新集合B’與A集合相交,則將相交要素集合輸出,即是腐蝕運算的結(jié)果;
如公式2所示:
[A⊕B=B+x?A≠0]? ? ? ? ? ? ? ? ? ? ? ? ? (2)
A為被處理集合,B為結(jié)構(gòu)元素,或可以理解為卷積運算中的核,[?]為卷積運算符;
細(xì)化前要將構(gòu)建的矢量的道路面數(shù)據(jù)進(jìn)行柵格化處理,盡可能地保留原來數(shù)據(jù)的信息,從而保持道路連通性。
采用大量的低精度的出租車移動軌跡數(shù)據(jù),在經(jīng)過緩沖區(qū)分析、柵格轉(zhuǎn)化之后難免存在一定的問題,數(shù)據(jù)中存在空洞,破壞了數(shù)據(jù)的連通性,數(shù)據(jù)邊緣存在毛刺,細(xì)化會產(chǎn)生零散的道路,對主干道產(chǎn)生干擾,如圖4所示。
如圖5所示,我們使用對柵格數(shù)據(jù)進(jìn)行清理,運算像元為前景像元,對像元進(jìn)行開運算和閉運算,
通過開運算可以看出:
圖像中孤立的點經(jīng)過開運算之后被消除,且要素邊緣的毛刺也被平滑,開運算起到了平滑、消除噪聲的作用,而且保持了原圖像整體的幾何形狀和位置沒有發(fā)生改變。
對數(shù)據(jù)進(jìn)行閉運算,結(jié)果如圖6:
通過閉運算結(jié)果,可以看出:
閉運算能夠填補(bǔ)空洞,閉合裂縫,而且與開運算一致,都保持了圖像要素整體的幾何形狀與位置不發(fā)生變化。
最后清理結(jié)果如圖7所示。
2.3.4 細(xì)化
細(xì)化算法的目的就是在保持圖像原有的拓?fù)浣Y(jié)構(gòu)和幾何結(jié)構(gòu)不變的前提下,提取圖像的中心像元,以消除冗雜要素,突出圖像主要特征,同時可以減少內(nèi)存消耗,加快計算機(jī)處理速度。
細(xì)化后的效果如圖8所示,道路提取結(jié)果如圖9所示,所得的線要素就是北京市交通道路網(wǎng)。
3 道路模型的構(gòu)建
3.1 道路交叉口提取及模型構(gòu)建
提取道路交叉口有助于完善道路的拓?fù)浣Y(jié)構(gòu),道路交叉口的位置、拓?fù)溥B接以及路口的方向關(guān)系是構(gòu)建路網(wǎng)不可或缺的,其定義如表1所示:
常用的道路交叉口提取方法有基于密度峰值聚類的道路交叉口提取方法和遍歷法以及拓?fù)浞ǖ鹊萚7],常用的是遍歷法和拓?fù)浞ā?/p>
基于ArcGIS,使用拓?fù)浞ǖ玫浇徊纥c,進(jìn)而提取交叉口;基于道路要素,建立網(wǎng)絡(luò)數(shù)據(jù)集,建立轉(zhuǎn)彎要素類,針對道路端點設(shè)置連通性,在添加屬性時,添加道路長度和道路交叉口,最終生成道路模型,如圖10所示:
3.2 道路模型評價
經(jīng)過道路交叉口的提取,我們構(gòu)建了路網(wǎng)模型,得到了交通圖,現(xiàn)將北京市交通圖作為底圖,對其進(jìn)行綜合評價:
(1)道路精度評價。道路模型與底圖基本重合,主要線路不偏離底圖道路,精度符合要求,如圖11所示:
(2)道路完整性評價。北京市的主要道路已經(jīng)完整地從出租車軌跡數(shù)據(jù)中得到提取,主要道路從模型中得到了體現(xiàn),可以從道路模型中看到北京三環(huán)內(nèi)的道路得到了體現(xiàn),道路完整性良好。
(3)道路拓?fù)潢P(guān)系評價。具備一定的拓?fù)浣Y(jié)構(gòu),具有連通性,標(biāo)識出了道路拐角、丁字路口、十字路口等要素,符合實際情況,具備合理性。
4 總結(jié)
在前人研究基礎(chǔ)上,本文基于出租車軌跡數(shù)據(jù)對道路進(jìn)行了還原,并對還原結(jié)果進(jìn)行了評價,在這個過程中取得以下一些認(rèn)識:
(1)基于異常數(shù)據(jù)檢測算法,對異常數(shù)據(jù)進(jìn)行了刪除,提高了數(shù)據(jù)精度。
(2)對道路中心線的提取,總結(jié)了一套方法,分析了緩沖區(qū)分析的半徑參數(shù),并利用數(shù)學(xué)形態(tài)學(xué)進(jìn)行了去噪和空洞填補(bǔ)等操作。
(3)基于道路模型,得到道路交叉口等信息,進(jìn)一步豐富了道路模型的數(shù)據(jù)內(nèi)涵。
(4)使用出租車軌跡數(shù)據(jù)來還原道路是提取最新道路信息的一種方式,由于出租車軌跡數(shù)據(jù)獲取容易、成本消耗小、更新快、反饋快,可以考慮選為更新道路信息的一種方法進(jìn)行使用?;谶@個背景,該設(shè)計開展了基于出租車軌跡數(shù)據(jù)提取道路信息和構(gòu)建道路模型的研究,所獲得的成果能為路網(wǎng)信息提取和更新提供幫助,有一定的實用價值。
本文在研究過程中有以下不足之處:
(1)在進(jìn)行道路面狀要素構(gòu)建的時候只考慮到全局的連通性,用相同的緩沖半徑構(gòu)建道路面,對局部細(xì)節(jié)處理不到位。
(2)細(xì)化算法的選擇較為單一,對目前主流的細(xì)化算法討論不到位。
參考文獻(xiàn):
[1] Bertolotto M,Di Martino S,F(xiàn)errucci F,et al.Towards a framework for mining and analysing spatio-temporal datasets[J].International Journal of Geographical Information Science,2007,21(8):895-906.
[2] 何曉軍,徐愛功,李玉.基于VGA聚類的遙感影像道路提取[J].計算機(jī)仿真,2018,35(5):288-293.
[3] 劉笑,王光輝,楊化超,等.全卷積神經(jīng)網(wǎng)絡(luò)遙感影像道路提取方法[J].遙感信息,2018,33(1):69-75.
[4] 王偉,譚松榮.基于軌跡大數(shù)據(jù)離線挖掘與在線實時監(jiān)測的出租車異常軌跡檢測算法[J].數(shù)字技術(shù)與應(yīng)用,2018,36(12):118-119.
[5] 李思宇,向隆剛,張彩麗,等.基于低頻出租車軌跡的城市路網(wǎng)交叉口提取研究[J].地球信息科學(xué)學(xué)報,2019,21(12):1845-1854.
[6] 王祖超,袁曉如.軌跡數(shù)據(jù)可視分析研究[J].計算機(jī)輔助設(shè)計與圖形學(xué)學(xué)報,2015,27(1):9-25.
[7] 鄔群勇,張良盼,吳祖飛.利用出租車軌跡數(shù)據(jù)識別城市功能區(qū)[J].測繪科學(xué)技術(shù)學(xué)報,2018,35(4):413-417,424.
[8] 呂海洋.基于車行GNSS軌跡數(shù)據(jù)的道路網(wǎng)絡(luò)構(gòu)建與增強(qiáng)方法研究[J].測繪學(xué)報,2019,48(2):268-270.
【通聯(lián)編輯:王力】