王思韜 韓 斌 蒲 琪
基于移動通信數據分析的Elman神經網絡城市軌道交通客流預測*
王思韜 韓 斌 蒲 琪
(同濟大學鐵道與城市軌道交通研究院,201804,上海//第一作者,碩士研究生)
城市軌道交通的短時客流預測數據對運營組織單位面對潛在的大客流或突發(fā)事件的應對準備工作有著重要的作用。以原始移動通信數據作為換乘站點換乘客流統(tǒng)計的數據來源,得到了精確的單條線路某個換乘站的換乘人數,并結合自動售檢票系統(tǒng)的統(tǒng)計數據,通過建立Elman神經網絡模型對客流數據進行樣本對訓練,得到下游車站未來1 h內斷面客流量的預測結果。預測結果誤差符合要求,為站點的運營組織方案提供了良好的數據支撐。同時為了對比說明建立了ARIMA模型,并對預測結果作出分析比較。
城市軌道交通;客流量預測;移動通信數據;基站定位;Elman神經網絡
AbstractShort term passenger flow prediction data plays a significant role in urban rail transit operation and emergency events handling for operators.In this article;the original mobile communication data for passenger flow statistics are used to present the passenger flow at a transfer station and attain the precise amount of the interchange station passenger flow.Through the establishment of an Elman neural network;sample pairs training is conducted together with the AFC data in order to acquire the sectional passenger flow at the next station in the following hour.The prediction error meets the requirements and provides the operation organization scheme with solid confirmation.Meanwhile;ARIMA (autoregressive integrated moving average)model is developed to make a comparison with Elman network prediction results.
Key wordsurban rail transit; passenger flow prediction;mobile communication data; base station location; Elman neural network
Author′s addressInstitute of Urban Rail Transit,Tongji U-niversity,201804,Shanghai,China
為了更好地組織運營服務、合理地調配軌道交通資源、提供更加舒適安全的運行環(huán)境,準確合理地掌握歷史客流規(guī)律以及預測未來短期內的客流強度,是城市軌道交通運營管理過程中的重要一環(huán)。
在當前的研究成果中,已經提出了各種對客流預測的方法,并得到了實際應用。但是對于單個地鐵站點時變的客流預測還缺乏準確有效的方法。以往的研究中關于交通流量預測的模型主要有:時間序列模型、歷史趨勢模型、卡爾曼濾波模型及多元線性回歸模型[2-3]等。這些模型由于各自的缺點并不能很好地應用在城市軌道交通短時的站點客流預測中。目前,根據AFC(自動售檢票)系統(tǒng)計算的線路日換乘量是一種粗略的統(tǒng)計結果,其計算方法是依據人的出行OD(起訖)矩陣,以OD點間的最短換乘路徑作為乘客的交通出行軌跡,即在此路徑上的客流按100%分配。但乘客的實際OD路徑不一定與理想情況相同,故而計算結果存在誤差,統(tǒng)計的數據不能及時指導換乘車站面對真實客流或突發(fā)事件做好應急準備工作以保障線路的運營秩序。因此,是否能獲取原始數據,對于用交通流模型進行客流量預測的準確度和可靠性有很大影響。只有正確的預測結果才能對車站實際的運營組織工作進行有效引導。
根據以上分析,本文提出針對某個重要換乘車站,可利用移動通信數據分析得到精確的實際換乘客流量,并結合Elman神經網絡的適應時變特性能力進行城市軌道交通下游站點的截面客流量預測。即根據已知的歷史客流數據,建立計算模型,并利用Matlab軟件的神經網絡工具箱,實現數據輸入神經網絡后的復雜計算,再將預測結果返回。研究的基礎數據包括站點進出客流的AFC分時數據、線路單向全線客流分時數據、站內基于移動通信數據的分時換乘數據和下游站點的截面分時數據。
1.1 移動通信數據
移動通信數據最初是移動運營商為了運營維護及計費等目的,采集移動用戶在發(fā)生通信事件(包括開關機、主被叫、收發(fā)短信、位置更新以及小區(qū)切換等事件)時的移動信令記錄。
移動通信數據應用于城市交通數據分析,可較為全面、真實地反映移動用戶個體在時空間維度上的連續(xù)移動軌跡。移動臺(即移動用戶的終端設備,通常為手機)要完成通信功能需通過城市中的移動基站接入通信網絡,并相互交換數據以完成通信。通信網絡的服務區(qū)域可劃分成小區(qū)(Cell)及位置區(qū)(LA)等基本單元,并分別利用小區(qū)碼(CI)和位置區(qū)碼(LAC)進行標識。每個移動通信基站都有固定且唯一的LAC和CI編碼。
隨著移動臺的不斷運動,其位置不斷發(fā)生變化。移動通信數據記錄了移動臺的位置更新過程,進而形成對時空間軌跡的連續(xù)記錄與追蹤。通過查詢LAC和CI組合編碼對應的經緯度地理信息便可確定移動臺的實際運動軌跡。
移動通信數據應用于城市交通分析時日尚短,僅依靠原始的信令并不能直接獲取分析所需數據。我國大部分地鐵均有手機信號覆蓋。由于地下段的線路距離地面遠,地面基站信號難以穿透覆蓋,故在車站和隧道沿線均專門布置了小蜂窩網絡以供乘客使用。利用這種地鐵車站獨有的蜂窩網絡即可根據原始移動數據信令確定乘客的軌道交通出行路徑,進而篩選出具有換乘行為的乘客,得到某站點的實際換乘數據。
上海軌道交通人民廣場站為1、2、8號線的換乘車站,其周邊車站及基站分布見圖1。若要判斷某乘客是否在該站從其他線路換乘2號線,需先分析該乘客移動信令中出現過的LAC和CI編碼所對應的基站位置。如該基站在連接到人民廣場地鐵站對應的通信基站之前,是屬于1號線或者8號線沿線站點或區(qū)間的基站,并且在一定時間內該乘客的移動臺連接上2號線沿線除人民廣場站點以外的地鐵通信基站,則可判斷該乘客換乘有效。由1號線、2號線換乘至8號線或者2號線、8號線換乘至1號線的判斷篩選方法類似。根據這種篩選的規(guī)則,可準確濾除本站出站乘客、本站進站乘客和僅在本站地下通道通過的乘客客流量,從而得到本站每條線路的換乘人數。在此基礎上,站點在整個換乘通道中的總客流量也就不難計算。
根據上海軌道交通2014年相關數據統(tǒng)計,原始信令數據在剔除清理異常數據后,有效的數據占總體的95%,符合換乘行為的個體(即總換乘量)約占有效數據的43%。將換乘總量分解成小時客流量,并與AFC統(tǒng)計的數據比較,可發(fā)現二者殘差的自相關與偏自相關系數均能落入置信水平為90%的區(qū)間。這充分說明通過移動通信原始信令篩選出的換乘數據符合實際情況與客流趨勢。繼續(xù)進行具體線路換乘方式的按時數據細分,便可以得到具體車站換入換出的分時換乘人數。
1.2 AFC系統(tǒng)數據
目前,我國城市軌道交通建設正向著網絡化發(fā)展。AFC系統(tǒng)的聯網可準確獲取乘客的出行起訖點等信息,能分時分日監(jiān)測各線路出入閘機的流量,實現整體線網運營的可視化。AFC系統(tǒng)收集的數據信息可實時傳輸到服務器端,供遠程電腦實時分析,使管理者能根據當前客流量及時調整運營方案。
AFC系統(tǒng)也有不足之處。計算機是基于理想兩點之間的最短線路來推算乘客路徑的,或是以其他概率選擇模型來進行路徑推算的,無論哪種方式的結果都與乘客實際路徑有誤差。因此,本文將由AFC系統(tǒng)精確統(tǒng)計的站點分時進出客流數據、線路單向全線客流分時數據,與由移動通信數據得到的實際換乘數據相結合,完成對下游站點斷面客流數據的預測工作。
2.1 Elman神經網絡結構
在典型的前向傳播三層網絡結構(輸入層、隱層、輸出層)里,Elman網絡不同于BP(前饋)網絡或者RBF(徑向基函數)網絡,其在一般神經網絡結構的基礎上多了1個承接層。該承接層將其加權前的結果儲存起來,并再一次輸入給隱層。因此,可選擇Elman神經網絡建模進行軌道交通短時客流的預測工作。承接層的存在延遲了隱層數據的加權輸出,增強了歷史狀態(tài)數據的敏感性。這相當于增加了內部的反饋網絡,加強了網絡自身處理動態(tài)信息的能力,使得Elman神經網絡軌道交通短時下游車站斷面流量預測的動態(tài)建??梢詫崿F。Elman神經網絡的結構圖如圖2所示。
圖2 Elman神經網絡結構圖
由圖2的Elman神經網絡結構,可得出非線性的狀態(tài)空間表達式為:
其中,f(.)是隱層神經元的傳遞函數,通常取為Sigmoid型函數(S 型函數);g(.)是輸出層的傳遞函數,使得隱層輸出的數據可以線性組合輸出,通常取為線性函數。
目前,理論上Elman神經網絡已證明能很好地建立非線性網絡模型,通過網絡的訓練還可實現任意函數的逼近。函數值的逼近和樣本的訓練是通過神經網絡各層的傳遞函數實現的。
Elman神經網絡模型學習訓練的基本方法,就是通過梯度下降法,把網絡輸出的結果從輸出層依次向輸入層傳播,通過不斷調整神經元之間的權值和閾值,使網絡的誤差平方和E(k)最小,從而使整個網絡達到穩(wěn)定狀態(tài)。令y(k)為模型實際輸出值,y~(k)為期望輸出值,則:
2.2 Elman神經網絡預測模型建立
在地鐵短時站點斷面客流預測模型中,使用了2014年9月1日至9月7日上海軌道交通人民廣場站進站、出站、2號線單向(上行)分小時客流量的AFC系統(tǒng)數據,以及根據移動通信數據分析得到的2號線該站分小時換乘流量數據。小時數據從每天早上5∶30開始統(tǒng)計,每隔半小時統(tǒng)計一次,直至23點結束統(tǒng)計。研究的主要內容是換乘站點的當前時段進出站、換乘的客流及全線單向客流數量對該站下游站點斷面客流量影響的預計。因此,網絡的輸入層節(jié)點數為4,輸出層節(jié)點數為1。隱層數的選擇并沒有確定的方法和步驟,也缺乏相關的理論,通常是使用經驗法或試探法。根據Kolmogorov定理,先將隱層數設定為9,而實際操作中分別選擇隱層數為7、8、9、10、11 進行試驗。 最后發(fā)現當隱層數為 7 時網絡收斂速度最快,預測結果精度最高、效果最好。故本試驗隱層數取7。
把進站流量、出站、全線單向流量和換乘流量4個輸入量的t時刻數據和下游站點t+1時刻的斷面客流數據作為1個樣本對,輸入網絡中進行訓練,則每天有34個訓練樣本對。本研究進行7 d,共可構成238個樣本對。最后一天的34個樣本對可用作對網絡訓練后預測結果的檢驗。
在建立的網絡模型中,訓練方法選用Levenberg-Marquardt法。相對于其他的訓練方法,該方法在同樣初始條件下的收斂速度最快。對于大多數問題來說,使用Levenberg-Marquardt法都可獲得較好的預測結果;隱層神經元選擇tansig函數,輸出層神經元選擇purlin函數;設置學習速率為自適應學習速率,目標網絡誤差是10-3;最大訓練步數設定為2 000。
經過Matlab軟件仿真后得到Elman神經網絡的訓練指標參數如表1所示。
表1 Elman神經網絡訓練指標參數
由表1可見,經過65次訓練以后,網絡的訓練誤差僅為0.000 605,達到了設定的控制標準(0.001 00),Matlab訓練的均方誤差下降變化圖如圖3所示。
圖3 訓練的均方誤差曲線
用訓練好的網絡進行測試,以第7天5:30—22:00的人民廣場進站、出站、換乘,以及2號線上行方向全線分時客流量數據為輸入,得到第7天2號線南京東路站6:00~23:00點上行的分時斷面客流預測值(分時間隔為30 min)。預測值曲線與實際值曲線見圖4。
圖4 分時客流量預測值與實際值對比曲線
由仿真結果可見,該交通流量預測的模型總體上是讓人滿意的,在收斂速度及學習適應能力等方面表現突出,預測的數據走勢也與實際基本符合,整體網絡誤差達到要求,預測數據的精度在可接受范圍之內。由計算相對誤差可以看出,最大相對誤差達到11.93%,最小相對誤差為0.35%,絕對誤差最大值為122人次/30 min,最小僅為4人次/30 min。可見,采用預測結果指導車站日常運營工作并不會因預測誤差過大而出現突發(fā)客流量,從而擾亂運營秩序。因此,該交通流量預測模型的預測結果是可信的。
分析Elman神經網絡短時客流預測效果的優(yōu)劣,本文選擇ARIMA模型對南京東路站上行方向相同時間段內的斷面客流進行預測,作為對比。
3.1 ARIMA模型的建立
ARIMA模型預測時,首先,輸入已確定的預測目標,歷史時間數據作為1組序列;然后,通過自回歸和移動平均數學模型得到該序列的擬合值,從而確定模型的各參數;最后,利用參數回代模型對未來的時間序列進行預測計算。
根據斷面客流的數據序列圖可以發(fā)現其規(guī)律:在每天剛開始運營后與即將結束運營前的時間段客流量處于低峰值,在早晚高峰呈現高峰值。于是,本文選擇乘積季節(jié)模型 ARIMA(p,d,q)(P,D,Q)S對斷面客流量進行預測(其中,p為自回歸階數,d為差分次數,q為移動平均階數,P、D、Q分別為季節(jié)性的自回歸階數、差分次數、移動平均階數,S為季節(jié)周期),用SPSS軟件可對模型進行設置,并得到估計的參數值。
首先,對模型進行一階差分和一階季節(jié)差分,之后得到平穩(wěn)的序列,確定d=1,D=1;然后,根據統(tǒng)計量指標,對擬合后ARIMA模型的殘差自相關系數以及偏自相關系數進行判斷,觀察其值是否落入95%的置信區(qū)間內,從而確定是否為隨機的白噪聲序列。經過不斷嘗試和修正,并選擇標準化貝葉斯信息準則(BIC值最小、擬合參數顯著性概率低等擬合優(yōu)度參數,得到最佳模型為ARIMA(2,1,1)(1,1,1)12。 最佳模型的擬合優(yōu)度判定系數 R2為0.565,標準化BIC為10.077,各參數P值均遠小于0.05,說明具有顯著差異性;模型的平均絕對百分誤差(EMAP)為8.45%(小于10%),表明模型能夠很好的對斷面客流歷史數據進行擬合。由模型的殘差白噪聲檢驗結果可知,該模型的殘差自相關系數和偏自相關系數都落在95%的置信區(qū)間內,且各系數的P值都大于0.05。這表明原假設不成立,該殘差序列為隨機的白噪聲;模型符合預期要求,利用模型對上海軌道交通南京東路站上行方向2014年9月的斷面客流量進行預測,結果如圖5所示。
通過ARIMA季節(jié)模型預測的結果可知預測結果的相對誤差最小值為1.13%,最大值為15.29%。預測曲線基本符合時間序列的走行趨勢,對于客流量的預測有一定的參考價值。
3.2 對比分析
兩種模型的精度評價指標如表2所示。由表2發(fā)現,Elman神經網絡模型的預測精度比ARIMA模型好。ARIMA模型只能根據歷史時間序列的特點擬合模型參數以達到建模的目的;其預測是基于固定的模型表達式計算得出的,且只能以序列的周期為單位進行預測;周期越長,所需預測的項就越多,預測精度也將隨著時間的增加越來越低。ARIMA模型本身不能通過自學習更新。而Elman神經網絡模型卻能針對短時的時間數據進行學習和推演,能通過不斷學習新的數據,對未來短時間段內的數據作出預測??梢姡珽lmam神經網絡模型預測屬于智能化算法。
圖5 預測結果
表2 兩種模型的精度評價指標
精確預測軌道交通客流的變化情況可為運營部門在全日分時最大斷面客流量出現時提供策略支撐,以滿足乘客服務要求和保障運營秩序。一般策略包括調整列車運行間隔,增加大編組列車上線的數量,換乘車站及時根據客流量調整換乘通道和進出口布局等。本文提出的基于移動通信數據的線路換乘流量統(tǒng)計方法可準確反映出每條線路的換乘人數。這對于獲取精確的模型預測結果有著重要的意義,也使得票務清分、客流清分的工作變得更為清晰簡單。在此基礎上,建立動態(tài)性良好的Elman神經網絡模型對下游車站的斷面流量進行預測,并得到滿意的結果。但如何利用好這些預測數據同實時的運營組織相協(xié)調,還有待于建立更多的歷史數據并進行深入挖掘后才能實現。
[1]石莊彬,張寧,邵星杰.城市軌道交通客流高峰持續(xù)時間預測方法[J].城市軌道交通研究,2016(7):35-39.
[2]王珺,吳兵,王靖陽.ITS實時檢測交通數據的質量控制技術探討[J].交通控制,2005(7):30-32.
[3]王俊松.基于Elman神經網絡的網絡流量建模及預測[J].計算機工程,2009,35(9):190-191.
[4]蔡于.城市軌道交通應急處置中心若干核心問題[J].城市軌道交通研究,2007(7):9.
[5]司風琪,洪軍,徐治皋.基于改進Elman網絡的動系統(tǒng)測量數據檢驗方法[J].東南大學學報,2005,35(1):50-54.
[6]裘煒毅,孫立光,劉杰,等.一種基于手機信號數據的軌道交通出行方式識別方法:CN201110033832.X[P].2011-8-17.
[7]李佳.基于手機定位數據的動態(tài)OD矩陣獲取方法的研究[D].昆明:昆明理工大學,2013.
[8]姜平,石琴,陳無畏,等.公交客流預測的神經網絡模型[J].武漢理工大學學報,2009,33(3):414-417.
[9]丁洪東.淺談城市軌道交通的特性與概念區(qū)分[J].科技信息,2010,27(1):457.
[10]楊飛.基于手機定位的交通OD數據獲取技術[J].系統(tǒng)工程,2007(1):42-48.
[11]李春曉,李海鷹,蔣熙,等.基于廣義動態(tài)模糊神經網絡的短時車站進站客流量預測[J].都市快軌交通,2015,28(4):66-70.
[12]姚閩.城市軌道交通換乘客流問題分析探討[J].建筑工程技術與設計,2015(10):1551.
[13]熊杰,關偉,孫宇星.基于Kalman濾波的地鐵換乘客流預測[J].北京交通大學學報(自然科學版),2013,37(3):112-116.
[14]盧立能.基于數據挖掘的城市軌道交通換乘客流路徑選擇研究[D].杭州:浙江理工大學,2012.
[15]四兵鋒,毛保華,劉智麗.無縫換乘條件下城市軌道交通網絡客流分配模型及算法[J].鐵道學報,2007,29(6):12-18.
[16]劉狄,吳海燕.城市軌道交通換乘站內部換乘客流量算法研究[J].北京建筑工程學院學報,2010,26(2):44-48.
Elman Neural Network Prediction of Rail Transit Passenger Flow Based on of Mobile Data Analysis
WANG Sitao,HAN Bin,PU Qi
U293.13
10.16037/j.1007-869x.2017.09.014
2016-08-18)
*國家科技支撐計劃項目(2015BAG19B01);上海市科學技術委員會科研計劃項目(15DZ1204304)