• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      城市公交GPS數(shù)據(jù)與IC卡數(shù)據(jù)時空特性融合算法*

      2021-06-14 15:54:44左精力王秋平
      交通信息與安全 2021年2期
      關(guān)鍵詞:平均偏差IC卡刷卡

      左精力 王秋平 陳 君

      (西安建筑科技大學(xué)土木工程學(xué)院 西安710055)

      0 引 言

      城市公交系統(tǒng)在運(yùn)行過程中產(chǎn)生大量公交車輛GPS數(shù)據(jù)和公交IC卡數(shù)據(jù),其具有采集方便、樣本量大、覆蓋面廣、連續(xù)記錄等優(yōu)點(diǎn)信息[1-2],若能準(zhǔn)確獲得公交IC卡乘客的上車站點(diǎn)信息,可為公交系統(tǒng)的規(guī)劃和管理提供重要的決策信息[3-5]。

      對于公交車輛GPS數(shù)據(jù)和公交IC卡數(shù)據(jù)有對應(yīng)關(guān)系表,且公交時刻表完整的情況,為了推算IC卡數(shù)據(jù)對應(yīng)站點(diǎn)信息,Zhao等[6]結(jié)合AFC及AVC數(shù)據(jù)獲取上車站點(diǎn);BARRY等[7]利用GPS數(shù)據(jù)和IC卡數(shù)據(jù)進(jìn)行融合,獲取到公交車行駛?cè)罩?,利用行駛?cè)罩炯叭诤蠑?shù)據(jù)推算上車站點(diǎn);馬曉磊等[8]對北京公交GPS數(shù)據(jù)和IC卡數(shù)據(jù)通過SIM卡信息進(jìn)行融合,推算上車站點(diǎn);陳君等[9]將公交IC卡數(shù)據(jù)與公交GPS數(shù)據(jù)進(jìn)行關(guān)聯(lián),結(jié)合調(diào)度數(shù)據(jù)推算公交IC卡乘客上車站點(diǎn);秦政[10]通過對公交IC卡和GPS數(shù)據(jù)的分析,給出了利用IC卡和GPS數(shù)據(jù)推導(dǎo)乘客上下車站點(diǎn)的判別方法。對于公交車輛GPS數(shù)據(jù)和公交IC卡數(shù)據(jù)有對應(yīng)關(guān)系表,但二者存在系統(tǒng)時間差的情況,為了推算IC卡數(shù)據(jù)對應(yīng)站點(diǎn)信息,陳紹輝等[11]對北京公交GPS數(shù)據(jù)和IC卡數(shù)據(jù)首先推算站點(diǎn)運(yùn)行時間,進(jìn)行首站匹配獲得時間偏差后,利用禁忌搜索算法進(jìn)行二次匹配;李海波等[12]為了修正公交IC卡數(shù)據(jù)時間偏差,提高上車站點(diǎn)識別的準(zhǔn)確性,在分析公交乘客上車刷卡行為的基礎(chǔ)上,提出了基于AVL數(shù)據(jù)的公交IC卡數(shù)據(jù)時間修正方法;程曉明等[13]通過密度聚類算法對IC卡數(shù)據(jù)進(jìn)行聚類,尋找刷卡中值,再結(jié)合公交時刻表站點(diǎn)匹配求系統(tǒng)時間差,利用禁忌搜索算法進(jìn)行二次匹配。

      但對于GPS數(shù)據(jù)和IC卡數(shù)據(jù)無直接對應(yīng)關(guān)系表,且系統(tǒng)存在不規(guī)律時間差的情況,還沒有較完整的數(shù)據(jù)融合算法。針對此種情況,以西安市公交數(shù)據(jù)為例,采用位置匹配、時間最大相似度、時間平均偏差算法,對二者的數(shù)據(jù)進(jìn)行融合算法研究,并以南寧市已知對應(yīng)關(guān)系的公交數(shù)據(jù)進(jìn)行算法驗(yàn)證,讓原本沒有關(guān)聯(lián)的2個數(shù)據(jù)一一對應(yīng),從而可以方便的計(jì)算上車刷卡的時間、線路和位置。

      1 數(shù)據(jù)描述

      采用西安市2017年某1 d的公交數(shù)據(jù),包括公交GPS數(shù)據(jù)和IC卡數(shù)據(jù),公交GPS數(shù)據(jù)來自公交調(diào)度管理系統(tǒng),公交刷卡數(shù)據(jù)來自公交運(yùn)行收費(fèi)系統(tǒng)。從網(wǎng)絡(luò)爬取公交線路站點(diǎn)數(shù)據(jù)(精度<20 m),基本數(shù)據(jù)結(jié)構(gòu)見表1。

      表1 基本數(shù)據(jù)結(jié)構(gòu)Tab.1 Basic data structure

      1)GPS數(shù)據(jù)(Data_A)。包含217條線路5 192輛公交車,共計(jì)21 104 785條軌跡記錄。軌跡記錄時間間隔為1~30 s的不規(guī)則分布,時間精度為1 s;線路編號和車輛編號不能對應(yīng)實(shí)際線路和車輛;坐標(biāo)采用WGS-84世界坐標(biāo)系。

      2)IC卡數(shù)據(jù)(Data_B)。取與GPS軌跡數(shù)據(jù)同時間段的數(shù)據(jù)集,包含192條線路5 413個設(shè)備,共2 997 772行記錄。其中刷卡模式為上車刷卡,時間精確到1 s。線路編號、車輛編號不能對應(yīng)實(shí)際線路、車輛。

      3)公交站點(diǎn)坐標(biāo)數(shù)據(jù)(Data_C)。通過Python數(shù)據(jù)爬取全市區(qū)385條公交線路數(shù)據(jù),坐標(biāo)轉(zhuǎn)換為WGS-84世界坐標(biāo)系(原為百度BD-09坐標(biāo)系)。

      數(shù)據(jù)特征如下。

      1)GPS數(shù)據(jù)、IC卡數(shù)據(jù)沒有標(biāo)明實(shí)際線路名,沒有刷卡站點(diǎn)數(shù)據(jù)。

      2)Data_A與Data_B中時間不同步,有未知時間差,且每臺車時差不等。

      3)各數(shù)據(jù)源的線路、車輛、卡號等無對應(yīng)關(guān)系表。

      2 數(shù)據(jù)融合算法

      為了獲得每個刷卡記錄的實(shí)際上車站點(diǎn)和實(shí)際線路,需要先解決公交GPS軌跡數(shù)據(jù)與IC卡數(shù)據(jù)融合問題,基于數(shù)據(jù)類型和特點(diǎn),為實(shí)現(xiàn)2個數(shù)據(jù)庫融合,需要解決以下5個問題。

      1)判斷GPS數(shù)據(jù)(Data_A)中每輛公交實(shí)際對應(yīng)的公交線路。

      2)根據(jù)實(shí)際公交線路站點(diǎn)信息和GPS數(shù)據(jù),判斷每輛公交的運(yùn)行時刻表。

      3)計(jì)算GPS數(shù)據(jù)(Data_A)與IC卡數(shù)據(jù)(Data_B)的設(shè)備號對應(yīng)關(guān)系。

      4)計(jì)算GPS數(shù)據(jù)(Data_A)與IC卡數(shù)據(jù)(Data_B)的時間修正值。

      5)計(jì)算IC卡數(shù)據(jù)(Data_B)每條記錄實(shí)際線路、站點(diǎn)名。

      2.1 公交車輛GPS數(shù)據(jù)與公交線路匹配

      公交車大部分時間運(yùn)行在固定線路上,且城市中不存在具有完全相同路徑的不同公交線路。常用的4種基于距離的軌跡相似性度量算法,分別為離散弗雷歇距離(DFD)[14]、動態(tài)時間規(guī)整(DTW)[15]、最長公共序列(LCS)[16]以及實(shí)序列編輯距離(EDR)[17],本研究通過DFD進(jìn)行相似度計(jì)算(見式(1)~(2)),可以求出二者的對應(yīng)關(guān)系。

      式中:gps_A為公交GPS軌跡向量[Lon,Lat];gps_C為公交線路站點(diǎn)坐標(biāo)向量[ZD_Lon,ZD_Lat];A d為軌跡向量gps_A中每個點(diǎn)到gps_C中最近點(diǎn)組成的距離向量。

      式中:num(Ad

      K AC越大,則軌跡向量gps_A越相似于軌跡向量gps_C。同理,互換gps_A和gps_C在式(1)中的位置,可求得相似度K CA。對于Bus_m線路Bus_i公交全天軌跡向量gps_A,和所有線路站點(diǎn)向量遍歷計(jì)算,分別求最大K AC和K CA對應(yīng)線路,若二者大于判斷閾值且對應(yīng)的同1條線路,則可判斷Bus_m線路Bus_i公交與此實(shí)際線路高度相似,可以判斷二者具有實(shí)際對應(yīng)關(guān)系。

      2.2 公交運(yùn)行時刻表判斷

      公交車輛一般按計(jì)劃在固定線路上逐個站點(diǎn)???,因此具有固定的??奎c(diǎn)和固定的運(yùn)行方向。車輛運(yùn)動狀態(tài)下GPS有慣性方向修正,在車輛停止情況下可能會出現(xiàn)不同程度的位置漂移,而車輛運(yùn)行時刻表主要是車輛停車靠站時間,如果直接采用未經(jīng)處理的GPS數(shù)據(jù)進(jìn)行判斷,會出現(xiàn)較大的偏差,因此需要先對原始的GPS數(shù)據(jù)根據(jù)實(shí)際情況進(jìn)行數(shù)據(jù)清洗,然后再進(jìn)行停車靠站判斷。

      2.2.1 GPS數(shù)據(jù)(Data_A)清洗

      軌跡數(shù)據(jù)清洗旨在去除軌跡中的冗余點(diǎn)和噪音點(diǎn),常采用曲線擬合、特征分析等方法進(jìn)行處理[18]。根據(jù)需要去掉漂移點(diǎn),保留正確的位置記錄,通過大量的數(shù)據(jù)觀察發(fā)現(xiàn)GPS軌跡數(shù)據(jù)是間隔的若干時間序列位置點(diǎn),前后的時差、距離、速度、轉(zhuǎn)角數(shù)值都在一定范圍內(nèi),數(shù)據(jù)特征如下。

      時差dt∈[1,1 200],時差為前后2點(diǎn)記錄的時間差,s。時差為0則表明數(shù)據(jù)重復(fù)記錄,時差較大時則可能是非行駛狀態(tài)。距離dl∈(0,2 000],為前后2點(diǎn)的直線距離,m。前后距離應(yīng)該大于0,距離過大則可能是信號中斷。速度dv∈(0,50],前后2點(diǎn)距離和時間的比值,km/h。前后速度應(yīng)大于0,城市公交運(yùn)營車速一般不大于50 km/h。轉(zhuǎn)角dθ∈[100°,180°],車輛實(shí)際軌跡一般不會出現(xiàn)小轉(zhuǎn)角,小轉(zhuǎn)角一般為漂移點(diǎn)。

      根據(jù)以上規(guī)律,對Data_A進(jìn)行軌跡數(shù)據(jù)清洗流程如下。

      步驟1。按時間排序,計(jì)算前后相鄰2點(diǎn)的dl,dt,dv,dθ。

      步驟2。去除dl,dt,dv,dθ閾值外所在行記錄;

      步驟3。重復(fù)步驟1~2,計(jì)算2次,完成數(shù)據(jù)清洗,獲得清洗后軌跡數(shù)據(jù)Data_a。

      數(shù)據(jù)清洗前后的效果見圖1。

      圖1 數(shù)據(jù)清洗Fig.1 Trajectory data cleaning

      2.2.2 公交車輛運(yùn)行時刻表判斷

      公交車輛在固定線路上運(yùn)行,遇到計(jì)劃內(nèi)的站點(diǎn)需要減速停車靠站,乘客上下完成后加速離開前往下1站,無乘客上下車時仍需要進(jìn)站???。對于已知實(shí)際運(yùn)行線路的某1個具體公交運(yùn)行軌跡,可以根據(jù)軌跡點(diǎn)與站點(diǎn)的距離判斷是否通過了站點(diǎn)。但因?yàn)镚PS數(shù)據(jù)精度問題,僅采用距離判斷會將部分對向站點(diǎn)識別為??空?,因此需要增加行車方向和線路方向一致性判斷,公交車輛運(yùn)行時刻表判斷流程如下。

      步驟1。對公交站點(diǎn)坐標(biāo)數(shù)據(jù)(Data_C)按照實(shí)際運(yùn)行排布,計(jì)算每1站到下1站的運(yùn)行方向角dθc(方向角為與正北方向順時針小于360°的夾角)。

      步驟2。對清洗后軌跡數(shù)據(jù)(Data_a),計(jì)算每1個點(diǎn)運(yùn)行方向角dθa;計(jì)算每1個站點(diǎn)距離閾值dlc范圍內(nèi)的軌跡點(diǎn),當(dāng)這些軌跡點(diǎn)對應(yīng)的方向角dθa與dθc夾角小于10°時,可判斷這些軌跡點(diǎn)對應(yīng)的時間段是車輛停車靠站的時間段,見圖2。

      步驟3。某線路上某輛車的軌跡,計(jì)算所有站點(diǎn)對應(yīng)的到站時間段,可得到此車輛在當(dāng)天的運(yùn)行時刻表矩陣Stop_t。

      圖2 車輛軌跡與公交站點(diǎn)位置關(guān)系Fig.2 Relationship between vehicle curves and bus stop location

      2.3 刷卡數(shù)據(jù)時間修正與GPS數(shù)據(jù)關(guān)聯(lián)分析

      取1輛車1 d的運(yùn)行時刻表矩陣Stop_t,在IC卡記錄中任取1輛車當(dāng)天的刷卡時間記錄Card_t,若Card_t中時間大部分落在Stop_t的記錄范圍內(nèi),則二者大概率是同1輛車產(chǎn)生的數(shù)據(jù)(見圖3),否則二者大概率沒有聯(lián)系,見圖4。

      圖3 公交到站時間與刷卡時間匹配Fig.3 Bus arrival time matching the time for swiping cards

      圖4 公交到站時間與刷卡時間不匹配Fig.4 Bus arrival time not matching the time for swiping cards

      另外根據(jù)實(shí)際運(yùn)行狀況和數(shù)據(jù)觀察,每輛車的刷卡系統(tǒng)時間不統(tǒng)一,存在未知時間偏差,需要對每輛車的刷卡時間做修正。對于某1個Stop_t和任1個Card_t,可以計(jì)算二者在dt i修正下的時間相似度和累計(jì)時間偏差值,從而判斷二者是否存在對應(yīng)關(guān)系。

      2.3.1 時間相似度

      對絕大部分車輛,1 d的Card_t數(shù)量足夠大,Card_t在dt i修正下落在Stop_t停車區(qū)間上的數(shù)量與Card_t自身數(shù)量的比值,可以用來表征二者的相似程度,相似度足夠大則可判斷二者可能相似。通過計(jì)算dt i∈[t1,t2]的所有相似度,并繪制曲線,若超過閾值且具有明顯凸峰特征,則可判斷在此極值對應(yīng)的時間修正下,二者相似。

      對刷卡時間進(jìn)行修正。

      時間交集。

      時間分布相似度。

      式中:num(Card_t i)為Card_t i的數(shù)量;num(SC_t i)為SC_t i的數(shù)量。

      對dt i∈[t1,t2]間隔為t的所有修正后刷卡時間進(jìn)行計(jì)算,得到相似度集合:Ρ=[ρ1,ρ2,…,ρn]。以dt i為橫軸,以Ρ為縱軸繪圖,見圖5~6。

      圖5 刷卡時間修正變化與停車靠站時間相似度曲線——匹配關(guān)系Fig.5 Similarity curve between the correction time of swiping cards and the parking time:matching relationship

      圖6 刷卡時間修正變化與停車靠站時間相似度曲線——非匹配關(guān)系Fig.6 Similarity curve between the correction time of swiping cards and parking time:mismatched relationship

      對于每組匹配曲線,可求最大相似度ρmax=max(Ρ)和對應(yīng)修正時間為tx。若同時符合以下判斷標(biāo)準(zhǔn),可認(rèn)為Stop_t和Card_t在修正時間tx下高度相似。

      1)最大相似度ρmax>0.6。

      2)相似度集合Ρ的圖形分布具有明顯的凸峰特性,見圖6。

      在圖5中,時間修正-156 s位置處,相似度增大到0.85,其他時間修正下相似度為0.2~0.3,表明刷卡時間序列在經(jīng)過-156 s修正后,與停車靠站時間具有高相似性;在圖6中,相似度均小于0.31,且無凸峰特性,則刷卡時間與停車靠站時間低相關(guān)。

      時間相似度曲線法特點(diǎn)是時間計(jì)算簡單,計(jì)算量小,實(shí)現(xiàn)速度快,對于dt i∈[-500,500],通過實(shí)列發(fā)現(xiàn)普通計(jì)算機(jī)上1次匹配耗時約為0.01~0.02 s,適用于大規(guī)模的篩選計(jì)算,但是算法上依賴公交運(yùn)行時刻表的準(zhǔn)確性,沒有落在停車區(qū)間的數(shù)據(jù)會被忽略。

      2.3.2 時間平均偏差

      公交IC卡站點(diǎn)判斷經(jīng)常采用k-means聚類算法分析上車站點(diǎn)位置[19],本研究對任意2個Stop_t和Card_t,計(jì)算Card_t中每次刷卡時間與Stop_t中最接近時間的時間差平均值,當(dāng)二者記錄同1輛車數(shù)據(jù)時,刷卡時間發(fā)生在停車時間范圍內(nèi),則時間差平均值應(yīng)該接近于零,否則會較大,利用這個規(guī)律可以用時間平均偏差法進(jìn)行對應(yīng)關(guān)系判斷。

      利用式(3),刷卡時間進(jìn)行修正后為Card_t i,求Card_t i中第j個時間ct j與Stop_T點(diǎn)的最小差值

      遍歷計(jì)算,得最小差值集合為DN=[dn1,dn2,…,dn j]。

      時間平均偏差為

      式中:sum(DN)為DN中所有值之和。

      對dt i∈[t1,t2]間隔為t的所有修正后刷卡時間進(jìn)行計(jì)算,得到時間平均偏差集合DX=[dx1,dx2,…,dxi],以dt i為橫軸,以DX為縱軸繪圖見圖7~8。

      圖7 刷卡時間修正變化與停車靠站時間平均偏差曲線——匹配關(guān)系Fig.7 Average deviation curve between the correction time of swiping cards and the parking time:matching relationship

      圖8 刷卡時間修正變化與停車靠站時間平均偏差曲線——非匹配關(guān)系Fig.8 Average deviation curve between the correction time of swiping cards and the parking time:mismatched relationship

      對每組曲線求最小時間平均偏差dxmin=min(DX)和對應(yīng)修正時間為ty。若同時符合以下判斷標(biāo)準(zhǔn),可認(rèn)為Stop_t和Card_t在修正時間ty下高度相似。

      1)最小時間平均偏差dxmin<20。

      2)時間平均偏差集合DX的圖形分布具有明顯的凹峰特性,見圖7。

      在圖7中,時間修正-155 s位置處,時間平均偏差為2.25 s,其他時間修正下時間平均偏差均大于20 s,表明刷卡時間序列在經(jīng)過-155 s修正后,與停車靠站時間具有高度相似性;在圖8中,時間平均偏差均大于250 s,且無凹峰特性,則刷卡時間與停車靠站時間低相關(guān)。

      時間平均偏差曲線法的特點(diǎn)是改善了時間相似度曲線法的缺點(diǎn),可以計(jì)算任何刷卡點(diǎn)與最近停車時間區(qū)間的關(guān)系,但是相對來說計(jì)算量較大,本案例中對于dt i∈[-500,500]通過實(shí)列發(fā)現(xiàn)普通計(jì)算機(jī)上1次匹配耗時為9~16 s,計(jì)算量是前者的上千倍,對于大規(guī)模計(jì)算效率較低,適用于通過時間相似度確定關(guān)系后的數(shù)據(jù)驗(yàn)證計(jì)算。

      通過時間相似度法和時間平均偏差法的配合使用,可以計(jì)算任意車輛GPS軌跡數(shù)據(jù)與IC卡數(shù)據(jù)之間的相似程度,再通過多天的數(shù)據(jù)驗(yàn)證,可完全鎖定二者的對應(yīng)關(guān)系和修正時間。

      3 算法試驗(yàn)

      從西安市公交大數(shù)據(jù)中選取5條線路3 d的GPS軌跡數(shù)據(jù)進(jìn)行試算,共包括195輛公交車。從數(shù)據(jù)庫以線路為單位調(diào)取數(shù)據(jù),以GPS軌跡數(shù)據(jù)中線路編號為第1層循環(huán)單元,車輛編號為第2層循環(huán)單元,每條線路分3個步驟步進(jìn)行運(yùn)算。

      步驟1。GPS數(shù)據(jù)(Data_A)與公交線路(Data_C)匹配。取經(jīng)緯度柵格化精度d1=0.000 5°(距離精度約為50 m),簡化化軌跡點(diǎn)數(shù)量,線路距離閾值取200 m,軌跡閾值取500 m,利用式(1)~(2)進(jìn)行公交線路匹配計(jì)算,匹配結(jié)果見表2,共識別191輛車,線路總識別率97.3%,可以完全確定每1個軌跡線路編號對應(yīng)的實(shí)際線路名。對于沒有識別的4輛車,發(fā)現(xiàn)軌跡數(shù)據(jù)量過少,實(shí)際上可能當(dāng)天沒有參與運(yùn)營活動。

      表2 GPS軌跡數(shù)據(jù)與公交線路匹配統(tǒng)計(jì)Tab.2 Matching statistics of the GPS track data and bus routes

      步驟2。公交運(yùn)行時刻表判斷。取時差d t小于1 s、距離dl小于1 m、速度dv小于2 km/h或大于50 km/h、轉(zhuǎn)角dθ小于120°為依據(jù),利用軌跡數(shù)據(jù)清洗流程對原始軌跡點(diǎn)進(jìn)行數(shù)據(jù)清洗;清洗后的軌跡數(shù)據(jù),結(jié)合已經(jīng)匹配的實(shí)際線路,取站點(diǎn)判斷閾值dlc=50 m、方向角dθa與dθc的小夾角小于10°,利用公交車輛運(yùn)行時刻表判斷流程,判斷經(jīng)過每1站的軌跡時間段,再轉(zhuǎn)化為公交運(yùn)行時刻表,191輛可識別線路車輛可以全部進(jìn)行公交時刻表判斷計(jì)算,統(tǒng)計(jì)數(shù)據(jù)見表3。

      表3 公交運(yùn)行時刻表判斷結(jié)果統(tǒng)計(jì)Tab.3 Result statistics of judging bus operation timetable

      步驟3。GPS數(shù)據(jù)(Data_A)與IC卡數(shù)據(jù)(Data_B)匹配。設(shè)置時間偏差范圍[t1,t2]=[-500,500],步長t3=10 s。取所選線路中某1條線路上1輛車的時刻表數(shù)據(jù)和所有刷卡數(shù)據(jù),采用時間相似度算法式(3)和式(5),進(jìn)行車輛和刷卡設(shè)備的逐一匹配,找到估計(jì)數(shù)據(jù)線路編號Bus_m和刷卡數(shù)據(jù)線路編號Card_m的對應(yīng)關(guān)系,再根據(jù)時間相似度算法匹配計(jì)算同1條線路下車輛編號Bus_i和Card_i的對應(yīng)關(guān)系,初步找到對應(yīng)關(guān)系后使用時間平均偏差法式(6)~(7)進(jìn)行關(guān)系驗(yàn)證。根據(jù)實(shí)際計(jì)算條件采用普通電腦,上述參數(shù)下2條軌跡與5 413輛車的刷卡數(shù)據(jù)進(jìn)行相似度曲線數(shù)據(jù)計(jì)算總耗時95.81 s,平均每次計(jì)算耗時約為0.017 7 s。通過對各條軌跡線路進(jìn)行循環(huán)匹配,獲取了對應(yīng)的刷卡線路編號和刷卡車輛編號。進(jìn)一步通過另外2 d的數(shù)據(jù)對對應(yīng)關(guān)系進(jìn)行驗(yàn)證性計(jì)算,結(jié)果一致。匹配統(tǒng)計(jì)結(jié)果見表4,對識別出具體線路的軌跡達(dá)到了100%的識別率。

      表4 GPS軌跡數(shù)據(jù)與IC卡數(shù)據(jù)匹配結(jié)果統(tǒng)計(jì)Tab.4 Statistics of matching results between GPS track data and IC data

      根據(jù)以上方法求出刷卡數(shù)據(jù)Data_B對應(yīng)的實(shí)際線路,進(jìn)行時間修正后可以根據(jù)對應(yīng)的Data_A軌跡數(shù)據(jù)時間所在經(jīng)緯度,通過經(jīng)緯度可以獲取具體的線路站點(diǎn)位置,從而獲得刷卡數(shù)據(jù)的線路、站點(diǎn)名、方向等信息。

      4 算法驗(yàn)證

      以上車輛及設(shè)備編號為數(shù)據(jù)庫內(nèi)部編號,無法通過實(shí)際調(diào)研來驗(yàn)證算法的可靠性和準(zhǔn)確性。本研究以IC卡數(shù)據(jù)、GPS軌跡數(shù)據(jù)、站點(diǎn)位置數(shù)據(jù)中線路、車輛、時間相互對應(yīng)的廣西南寧市2018年12月1日全天16條線路進(jìn)行算法驗(yàn)證,其中包括350個設(shè)備的IC卡數(shù)據(jù)、359個設(shè)備的GPS軌跡數(shù)據(jù)、全市線路站點(diǎn)及坐標(biāo)數(shù)據(jù)。

      采用本數(shù)據(jù)融合算法,對以上數(shù)據(jù)進(jìn)行融合計(jì)算,獲得的結(jié)果與實(shí)際對應(yīng)關(guān)系進(jìn)行對比,獲得算法的匹配度。

      1)GPS數(shù)據(jù)(Data_A)與公交線路(Data_C)匹配驗(yàn)證。對案例中的每輛車軌跡和對應(yīng)的實(shí)際公交線路按照坐標(biāo)位置進(jìn)行線路匹配并繪圖,359個設(shè)備的GPS軌跡數(shù)據(jù)中可計(jì)算出357條對應(yīng)線路,未匹配出線路的2個設(shè)備記錄數(shù)據(jù)異常,超出市區(qū)范圍。與數(shù)據(jù)庫中已知對應(yīng)線路進(jìn)行對比,有357個設(shè)備與實(shí)際線路完全相同。結(jié)果顯示,當(dāng)設(shè)備軌跡記錄正常時,本算法具有100%準(zhǔn)確性。

      2)軌跡數(shù)據(jù)公交站點(diǎn)??繒r間判斷驗(yàn)證。通過算法獲取357個設(shè)備記錄的GPS數(shù)據(jù)與實(shí)際站點(diǎn)的運(yùn)行時刻表,獲得349個設(shè)備的有效運(yùn)行時刻表。存在8個設(shè)備的運(yùn)行時刻表數(shù)據(jù)量少于10條,無法用于后續(xù)計(jì)算。

      得出的??繒r間對應(yīng)的坐標(biāo),與實(shí)際線路上站點(diǎn)位置進(jìn)行繪圖比較,符合大部分公交車輛的運(yùn)行規(guī)律。對停車靠站時間與對應(yīng)的修正后刷卡數(shù)據(jù)數(shù)據(jù)進(jìn)行對比,發(fā)現(xiàn)絕大部分刷卡記錄落在停車靠站時間段上,所占比例與實(shí)踐相似度結(jié)果一致。

      3)GPS數(shù)據(jù)(Data_A)與IC卡數(shù)據(jù)(Data_B)匹配驗(yàn)證。采用時間相似度法和時間平均偏差法繪制曲線,對350個設(shè)備的IC卡數(shù)據(jù)和349個設(shè)備的運(yùn)行時刻表進(jìn)行融合匹配計(jì)算,共獲得336對具有明顯特征的對應(yīng)關(guān)系,并與實(shí)際對應(yīng)數(shù)據(jù)對比,與真實(shí)關(guān)系完全對應(yīng)。實(shí)際數(shù)據(jù)中,350個設(shè)備的IC卡中,存在6個無GPS設(shè)備對應(yīng),實(shí)驗(yàn)有效IC設(shè)備為344個。IC卡系統(tǒng)和GPS系統(tǒng)時間偏差實(shí)際為0,時間相似度法中平均時間偏差為11 s,時間平均偏差法中平均時間偏差為22 s,案例驗(yàn)證平均時間偏差為IC卡時間需要修正16.5 s。

      驗(yàn)證案例中350輛車,獲得336對對應(yīng)關(guān)系,融合算法驗(yàn)證效率為96%;考慮實(shí)際情況,只有344輛車存在實(shí)際對應(yīng)關(guān)系,則算法準(zhǔn)確率為97.67%。

      5 結(jié)束語

      根據(jù)公交車GPS數(shù)據(jù)和IC卡數(shù)據(jù)的時空特性,對無直接關(guān)聯(lián)的2個數(shù)據(jù)進(jìn)行關(guān)聯(lián)計(jì)算,方法具有以下特點(diǎn)。

      1)采用時間相似度算法快速匹配、時間平均偏差算法進(jìn)行關(guān)系驗(yàn)證,多天數(shù)據(jù)進(jìn)行關(guān)系固定,可以解決公交GPS與IC卡數(shù)據(jù)分離無法直接關(guān)聯(lián)的問題。

      2)采用可修正步進(jìn)時間修正遍歷算法,可對不在同一時間軸,且具有大時間偏差的GPS數(shù)據(jù)和IC卡數(shù)據(jù)進(jìn)行快速分析,可以節(jié)約大量計(jì)算耗時。

      3)采用低耗時的時間相似度算法尋找對應(yīng)關(guān)系,利用對運(yùn)行時刻表精度要求低的時間平均偏差算法進(jìn)行關(guān)系驗(yàn)證,結(jié)合多天的數(shù)據(jù),可以高精度的確定二者關(guān)系。

      國內(nèi)外公交系統(tǒng)中GPS和IC卡不是1個系統(tǒng)的情況大量存在,給上下車站點(diǎn)判斷造成了很大的困難,通過數(shù)據(jù)融合計(jì)算,可以高精度的實(shí)現(xiàn)關(guān)系匹配,為原本難以應(yīng)用的數(shù)據(jù)提供了有效的處理方法,可以推進(jìn)公交大數(shù)據(jù)更加廣泛的應(yīng)用。但限于軌跡數(shù)據(jù)的精確度和上車時間判斷的模糊性,無法實(shí)現(xiàn)完全的關(guān)系識別判斷;在進(jìn)行時間糾偏時,采用了修正遍歷計(jì)算法,增加了計(jì)算量,對于超大規(guī)模城市的公交數(shù)據(jù)匹配計(jì)算,時間成本較大。另外,本算法假設(shè)前提為乘客在已知固定站點(diǎn)上車,對于某些運(yùn)行不規(guī)范的線路,計(jì)算參數(shù)設(shè)置還需要更深一步的研究。

      猜你喜歡
      平均偏差IC卡刷卡
      河北地方性震級量規(guī)函數(shù)與方位角校正值研究1
      工商業(yè)IC卡控制器改造為物聯(lián)網(wǎng)控制器實(shí)踐
      FY-3C/VIRR西北太平洋區(qū)域海表溫度精度評估?
      在用電梯加裝外接式IC卡運(yùn)行控制系統(tǒng)設(shè)計(jì)改進(jìn)
      一種新的無觸點(diǎn)IC卡的檢測方法
      電子測試(2017年15期)2017-12-18 07:19:05
      刷卡
      成長日記
      脛前動脈穿刺可行性及心肺流轉(zhuǎn)下脛前動脈與橈動脈壓力監(jiān)測的一致性研究
      讀IC卡
      黨員文摘(2014年12期)2014-12-05 20:10:56
      刷臉就可以購物
      奧秘(2014年8期)2014-08-30 06:32:04
      吉木乃县| 伊宁市| 醴陵市| 富民县| 墨江| 海门市| 民权县| 故城县| 历史| 镶黄旗| 息烽县| 吉林省| 栾川县| 达孜县| 教育| 哈尔滨市| 南宁市| 独山县| 涞水县| 通化市| 婺源县| 岳阳市| 武强县| 阳朔县| 玛曲县| 镇远县| 莫力| 常州市| 和龙市| 宿松县| 东台市| 绥中县| 乐安县| 贵溪市| 绥化市| 浑源县| 航空| 青浦区| 常山县| 长子县| 独山县|