周劍明, 黃杉
(1. 中國聯(lián)通廣州市分公司, 廣東 廣州 510000; 2. 智慧足跡數(shù)據(jù)科技有限公司, 北京 100023)
軌道交通方式成為我國大中型城市的主要交通方式之一,但巨大的客流量為軌道交通的運(yùn)營管理帶來新的挑戰(zhàn)[1]。短時流量預(yù)測是軌道交通運(yùn)營管理的基礎(chǔ),流量預(yù)測是以時間序列為基礎(chǔ)預(yù)測未來時間段的客流量[2],一般情況下,短時流量預(yù)測的時間粒度小于20min。短時流量預(yù)測可以為軌道交通客運(yùn)管理與組織安排提供有力參考并緩解軌道交通擁堵概率,提升交通服務(wù)質(zhì)量。手機(jī)基站發(fā)出的信令數(shù)據(jù)具有數(shù)據(jù)量大、客觀真實(shí)和易獲取等優(yōu)勢[3],隨著手機(jī)用戶數(shù)量的提升,手機(jī)定位技術(shù)的信令數(shù)據(jù)重要性日漸增強(qiáng)。同時與基于交通大數(shù)據(jù)[4]或基于組合模型的流量預(yù)測方法相比[5],手機(jī)信令數(shù)據(jù)還具有低成本,高覆蓋區(qū)域等優(yōu)勢。因此,在軌道交通短時流量預(yù)測過程中融入手機(jī)信令,提出基于手機(jī)信令大數(shù)據(jù)的軌道交通短時流量預(yù)測方法以預(yù)測軌道交通短時流量。
基于手機(jī)信令大數(shù)據(jù)的軌道交通短時流量預(yù)測方法的整體架構(gòu),如圖1所示。
預(yù)測過程主要分為以下幾個環(huán)節(jié):由手機(jī)網(wǎng)絡(luò)運(yùn)營商處和軌道交通運(yùn)營商處分別獲取用戶手機(jī)信令數(shù)據(jù)和軌道交通路線信息;依照道路匹配算法確定軌道交通路線上移動的手機(jī)用戶[6];搭建軌道交通流量大數(shù)據(jù)庫,實(shí)時更新軌道交通路線上手機(jī)用戶的手機(jī)信令數(shù)據(jù);分析軌道交通流量特性;基于K值自適應(yīng)算法預(yù)測軌道交通短時流量。
圖1 預(yù)測方法整體架構(gòu)
基于手機(jī)網(wǎng)絡(luò)運(yùn)營商的BSS(Business Support System,業(yè)務(wù)支撐系統(tǒng))域數(shù)據(jù)管理系統(tǒng)設(shè)定手機(jī)信令數(shù)據(jù)采集時間閾值,根據(jù)設(shè)定閾值實(shí)時采集城市范圍內(nèi)手機(jī)用戶的信令數(shù)據(jù)。所采集手機(jī)信令數(shù)據(jù)為從某運(yùn)營商處獲得的脫敏數(shù)據(jù),可以在不違反系統(tǒng)規(guī)則條件下,改造真實(shí)數(shù)據(jù)并提供測試使用[7]。所采集手機(jī)信令數(shù)據(jù)結(jié)構(gòu),如表1所示。
表1 所采集手機(jī)信令數(shù)據(jù)
在采集的手機(jī)信令數(shù)據(jù)內(nèi),各用戶具備唯一的身份識別ID,經(jīng)緯度維數(shù)為手機(jī)基站的所在位置,當(dāng)用戶手機(jī)達(dá)到基站服務(wù)范圍內(nèi)基站自動生成時間戳,并記錄用戶手機(jī)在該基站范圍內(nèi)停留時間,再獲取城市軌道交通路線信息。
選取GIS緩沖分析方法對基站與軌道交通路線實(shí)施疊加,根據(jù)手機(jī)信令數(shù)據(jù)將手機(jī)基站擬合至軌道交通路線上。由于城市內(nèi)基站服務(wù)范圍通常為500 m。因此設(shè)定緩沖半徑為500 m,基站與交通軌道路線擬合結(jié)果,如圖2所示。
圖2 基站與軌道交通路線擬合結(jié)果
基于GIS緩沖分析方法對基站與軌道交通路線的擬合,確定不同軌道交通路線上的基站分布序列,用Qi={n1,n2,…,nf}表示,Qi和nf分別表示第i條軌道交通路線和基站序列內(nèi)第f個基站,將Qi={n1,n2,…,nf}作為軌道交通路線的基站切換序列。依據(jù)時間維度整理排列用戶手機(jī)信令切換數(shù)據(jù),能夠確定不同用戶經(jīng)過基站的切換順序,用Pj={n1,n2,…,nm}表示用戶手機(jī)基站切換序列,Pj和nm分別表示第j個手機(jī)用戶和其經(jīng)過的第m個基站。計算Pj={n1,n2,…,nm}和Qi={n1,n2,…,nk}之間的相似度(歐氏距離),如式(1)。
(1)
基于式(1)確定手機(jī)用戶移動軌跡與軌道交通路線匹配的信息,當(dāng)相似度高于設(shè)定值時,即可判定該手機(jī)用戶為軌道交通路線上的手機(jī)用戶。
利用以上獲得的手機(jī)用戶和Oracle Database關(guān)系數(shù)據(jù)庫管理系統(tǒng),構(gòu)建手機(jī)信令樣本數(shù)據(jù)庫,手機(jī)信令數(shù)據(jù)采集時間閾值實(shí)時更新數(shù)據(jù)庫信息并分析軌道交通流量特性,可知城市軌道交通短時人流量時間序列存在顯著的周期性變化特征。由于交通流量及具體運(yùn)行模式不同時,其預(yù)測的精度和動態(tài)特征也不同,為了以最低計算量獲取相關(guān)的交通短時流量參數(shù),本文采用基于K值自適應(yīng)的軌道交通短時流量預(yù)測算法預(yù)測城市軌道交通短時流量。
利用軌道交通路線上用戶手機(jī)信令樣本數(shù)據(jù)庫,依照軌道交通人流量特性生成K近鄰模型的狀態(tài)向量。依照距離度量方式與自適應(yīng)K值計算確定近鄰搜索機(jī)制。根據(jù)當(dāng)前時刻軌道交通流量數(shù)據(jù)預(yù)測下一時刻軌道交通流量。狀態(tài)向量是對比交通軌道流量歷史狀態(tài)與當(dāng)前狀態(tài)的標(biāo)準(zhǔn),如式(2)。
Ea=(xa1,xa2,…,xat)
(2)
(3)
K近鄰模型中,K值表示數(shù)據(jù)庫內(nèi)選取近鄰數(shù)量的參數(shù),該值直接影響預(yù)測精度。因此選取基于平均絕對百分比誤差最小的K值自適應(yīng)計算模型計算K值。計算模型,如式(4)。
(4)
K=min{k1,k2,k3,…kλ}
(5)
(6)
采用本文方法對某市軌道交通二號線進(jìn)行短時流量預(yù)測以測試性能。預(yù)測過程中使用的手機(jī)信令大數(shù)據(jù)來源于同三大營銷商的合作項(xiàng)目,軌道交通路線信息來自研究對象所在城市軌道交通運(yùn)營商。
2.1.1K取值
采用本文方法進(jìn)行研究對象短時流量預(yù)測,基于數(shù)據(jù)庫內(nèi)已有數(shù)據(jù)得到不同K值下的預(yù)測結(jié)果平均絕對百分比誤差,其中曲線表示平均絕對百分比誤差值,如圖3所示。
圖3 不同K值下的平均絕對百分比誤差
分析圖3能夠得到,隨著K取值的提升,短時流量預(yù)測結(jié)果的平均絕對百分比誤差整體表現(xiàn)出先下降后提升的趨勢。當(dāng)K取值在1—4時,預(yù)測結(jié)果平均絕對百分比誤差從0.056下降至0.038;當(dāng)K取值在4—16時,預(yù)測結(jié)果平均絕對百分比誤差從0.038上升至0.076,這是因?yàn)楫?dāng)K取值過大或過小時,均會提升研究對象短時流量預(yù)測結(jié)果的平均絕對百分比誤差,而4恰巧在取值過大或過小的中間節(jié)點(diǎn)上,因此此取值為預(yù)測精度最高。實(shí)驗(yàn)結(jié)果表明采用本文方法預(yù)測研究對象短時流量時,K取值為4時,本文方法預(yù)測精度最高。
2.1.2 流量預(yù)測
以2020年5月1日(法定節(jié)假日)和5月6日(非節(jié)假日)為預(yù)測日,采用本文方法進(jìn)行研究對象短時流量預(yù)測,設(shè)定預(yù)測時間粒度為20 min,K取值為4。預(yù)測結(jié)果,如圖4所示。
(a) 2020年5月1日
綜合圖4(a)與圖4(b)的數(shù)據(jù)能夠得到本文方法針對節(jié)假日條件下研究對象流量預(yù)測結(jié)果較好。整體預(yù)測過程中本文方法對于研究對象流量的變化趨勢感知較為敏感,可依照實(shí)時流量波動快速修正預(yù)測趨勢。本文方法在節(jié)假日條件下針對研究對象進(jìn)行流量預(yù)測過程中,全天平均絕對百分比誤差低于5%,滿足實(shí)際預(yù)測需求。且本文方法針對非節(jié)假日條件下研究對象流量預(yù)測結(jié)果與實(shí)際流量基本一致,預(yù)測過程中,全天平均絕對百分比誤差低于3%。證明了本文方法可準(zhǔn)確預(yù)測研究對象短時流量,并根據(jù)實(shí)際流量,實(shí)施修正預(yù)測趨勢,提升后續(xù)預(yù)測精度。
選取均方根誤差(其值越小誤差越小)和運(yùn)行時間(其值越大方法復(fù)雜度越高)作為預(yù)測性能評價指標(biāo)。針對研究對象5月6日流量預(yù)測結(jié)果的評價指標(biāo),以文獻(xiàn)[4]和文獻(xiàn)[5]中方法對比本文方法,如表2所示。
表2 不同預(yù)測方法的評價
分析表2可得,本文方法在均方根誤差上的評價結(jié)果與基于交通大數(shù)據(jù)的預(yù)測方法差距較小,但顯著優(yōu)于基于組合模型的預(yù)測方法;在運(yùn)行時間方面的評價結(jié)果與基于組合模型的預(yù)測方法差距較小,但顯著優(yōu)于基于交通大數(shù)據(jù)的預(yù)測方法。綜合可知本文方法預(yù)測性能優(yōu)于對比方法。
本文提出基于手機(jī)信令大數(shù)據(jù)的軌道交通短時流量預(yù)測方法,擬合手機(jī)基站與交通軌道路線,根據(jù)手機(jī)信令數(shù)據(jù)判斷交通軌道路線上的用戶,采用基于K值自適應(yīng)的軌道交通短時流量預(yù)測算法進(jìn)行實(shí)時準(zhǔn)確的短時流量預(yù)測。但本文方法在研究過程未考慮天氣異常與突發(fā)事件等條件,因此,在后續(xù)優(yōu)化過程中將基于此對方法實(shí)施改進(jìn)。