劉曉磊 段征宇? 余慶 毛孝鑫 馬忠政
(1.同濟大學 道路與交通工程教育部重點實驗室,上海 201804;2.同濟大學 CAD研究中心,上海 201804; 3.上海申通地鐵集團有限公司,上海 201102)
城市軌道交通具有運量大、準時、環(huán)保等優(yōu)勢,已成為解決城市交通問題的重要交通方式。隨著城市軌道交通建設(shè)進程加快及成網(wǎng)運營,城市軌道交通客流量快速增長,客流時空分布失衡現(xiàn)象時有發(fā)生,上海地鐵2018年的日均客流量為1 016.5萬乘次[1],工作日高峰時段部分斷面客流飽和度常達130%[2],一旦出現(xiàn)運營異常,會迅速波及整個軌道網(wǎng)絡,造成嚴重的經(jīng)濟損失及安全隱患。因此,準確、合理的進行城市軌道交通網(wǎng)絡客流分布預測,可為管理者掌握線網(wǎng)客流狀態(tài)演化、制定站點客流組織策略、調(diào)整列車運行組織方案提供依據(jù),同時也能使乘客掌握軌道線網(wǎng)的擁擠程度,合理選擇出行時間和出行路徑。
目前,客流預測模型主要分為參數(shù)模型和非參數(shù)模型兩大類。參數(shù)模型計算快速、模型簡潔、所需數(shù)據(jù)量少,如歷史平均模型、時間序列模型[3]、線性回歸模型和卡爾曼濾波模型[4]等。但參數(shù)模型是以選定函數(shù)形式的方式來學習,通常只能應對簡單的問題,難以反映數(shù)據(jù)的非線性、不確定性特征。非參數(shù)模型能夠憑借自身學習能力和自適應能力對非線性規(guī)律進行有效捕捉,可以有效解決以上問題,常見的非參數(shù)模型有:支持向量回歸[5]、貝葉斯網(wǎng)絡模型[6]和神經(jīng)網(wǎng)絡模型[7- 8]等。
近年來,基于神經(jīng)網(wǎng)絡的客流預測或交通流預測方法受到眾多學者的關(guān)注。循環(huán)神經(jīng)網(wǎng)絡及其變體長短期記憶網(wǎng)絡[9- 10]和門控循環(huán)單元在預測中取得了良好的效果[11]。但這些模型只考慮了時間特征,忽略了空間特征。為表征空間特征,許多學者引入卷積神經(jīng)網(wǎng)絡[12- 13],卷積神經(jīng)網(wǎng)絡適用于具有歐幾里德結(jié)構(gòu)的數(shù)據(jù),如圖像、柵格等,但對于具有復雜的拓撲結(jié)構(gòu)的軌道交通網(wǎng)絡仍有一定的局限性。圖卷積網(wǎng)絡[14]則可以有效捕捉網(wǎng)絡的拓撲結(jié)構(gòu),為考慮網(wǎng)絡特征的軌道交通客流預測帶來可能。本研究組合圖卷積網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡實現(xiàn)對大規(guī)模城市軌道客流的預測,同時考慮其他因素對客流的影響,并通過隨機森林方法進行影響因素特征選擇。
圖卷積網(wǎng)絡GCN是卷積神經(jīng)網(wǎng)絡CNN在圖領(lǐng)域的拓展,可以從圖數(shù)據(jù)中提取特征從而進行節(jié)點分類、圖分類、邊預測等。圖由若干節(jié)點和連接兩個節(jié)點的邊組成,節(jié)點所具有的特征構(gòu)成了特征矩陣X,不同節(jié)點相互連通的邊的特征構(gòu)成了特征矩陣A。圖卷積網(wǎng)絡能夠考慮節(jié)點之間的結(jié)構(gòu)關(guān)聯(lián)性,實現(xiàn)對圖結(jié)構(gòu)的結(jié)構(gòu)信息和節(jié)點屬性信息同時學習,通過考慮圖節(jié)點及節(jié)點的一階鄰域的譜卷積實現(xiàn)捕捉圖的空間特征,層與層之間的傳播方式可以表示為[15]
(1)
城市軌道交通網(wǎng)絡是具有非歐幾里德結(jié)構(gòu)的復雜拓撲網(wǎng)絡,該網(wǎng)絡上下游斷面的客流量相互影響,本文在進行客流預測時,將上下游斷面客流量的關(guān)聯(lián)關(guān)系考慮在內(nèi),通過圖卷積網(wǎng)絡學習城市軌道交通網(wǎng)絡的拓撲關(guān)系和斷面的屬性特征,實現(xiàn)捕捉空間特征。
循環(huán)神經(jīng)網(wǎng)絡在處理時間序列數(shù)據(jù)方面有著廣泛應用,但傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡具有梯度消失和梯度爆炸的缺陷,無法解決長時依賴問題。由此,循環(huán)神經(jīng)網(wǎng)絡的變體長短期記憶模型(LSTM)及門控循環(huán)單元(GRU)出現(xiàn),兩者原理相似,預測效果相近,但GRU比LSTM少一個門控,參數(shù)更少,訓練速度更快,過擬合風險低。
zt=σ(Wz[ht-1,Xt])
(2)
rt=σ(Wr[ht-1,Xt])
(3)
(4)
(5)
GRU將前一時刻的隱藏狀態(tài)及當前的客流信息作為輸入,來預測當前時刻的客流狀態(tài)。根據(jù)其原理可知GRU在預測時保留了歷史數(shù)據(jù)的變化趨勢特征,可以實現(xiàn)捕捉客流數(shù)據(jù)的時間特征。
本文中考慮了城市軌道交通網(wǎng)絡中不同斷面間客流的相互影響,并以斷面為節(jié)點,斷面與斷面之間的關(guān)聯(lián)關(guān)系為邊構(gòu)造圖結(jié)構(gòu)G,G=(V,E),其中,V={v1,v2,…,vN}表示斷面節(jié)點集合,E為邊集合[14]。鄰接矩陣A表示斷面之間的連接關(guān)系,A∈RN×N,矩陣中的元素表示斷面之間是否連接,如果連接,表示為1,否則為0。網(wǎng)絡節(jié)點的屬性特征用特征矩陣X∈RN×P表示,P表示節(jié)點屬性特征的數(shù)目,包括歷史時間序列的長度和其他特征等。
組合圖卷積網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡構(gòu)建深度學習模型,實現(xiàn)通過城市軌道交通m個歷史斷面客流狀態(tài)來預測未來某一時段t的狀態(tài),模型結(jié)構(gòu)見圖1。首先將鄰接矩陣A和特征矩陣X輸入到GCGRU模型中,通過圖卷積網(wǎng)絡(GCN)學習斷面之間的關(guān)聯(lián)關(guān)系,得到邊的權(quán)重特征值,經(jīng)過激活函數(shù)后進入門控循環(huán)單元(GRU)學習不同斷面的時間序列規(guī)律特征,加入激活函數(shù)提高神經(jīng)網(wǎng)絡對模型的表達能力。在提取到城市軌道交通網(wǎng)絡客流的空間特征和時間特征后,通過全連接層實現(xiàn)預測任務,得到N個包含時空特征的輸出狀態(tài)ht,即{h1_t,h2_t,…,hN_t}。GCGRU的具體計算過程如下:Gc表示圖卷積過程。
zt=σ(Wz[ht-1,Gc(A,Xt)])
(6)
rt=σ(Wr[ht-1,Gc(A,Xt)])
(7)
(8)
(9)
圖1 組合圖卷積網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡模型結(jié)構(gòu)
文中旨在實現(xiàn)對大規(guī)模城市軌道交通網(wǎng)絡的客流預測,以上海市地鐵網(wǎng)絡客流預測為例展開研究。數(shù)據(jù)來源于上海地鐵2019年不同軌道線的上行斷面客流,2019年共有16條線路正常運行,運行時間基本為5:00~24:00。經(jīng)過數(shù)據(jù)處理,得到上海市地鐵網(wǎng)絡共計408個斷面,每個斷面全年共6 935個客流值。
2.2.1 影響因素分析
地鐵客流變化受多種因素的影響,文中考慮不同因素對客流量的影響,并將具有相關(guān)性且影響顯著的因素納入特征集中。
月份:客流量在不同的月份展現(xiàn)出不同特征,見圖2,12月客流量最少,2月客流量其次,而4月、8月、10月的客流量較多。
圖2 客流量按月份分布
星期:選取日常連續(xù)兩周的客流量進行可視化,如圖3所示,可以看出,周一至周五客流量較高,周六客流量大幅降低,周日客流量最小。
圖3 客流量周變化趨勢
時段:選取工作日與非工作日兩個特征日,分別繪制某斷面的客流時變圖,見圖4(a)及圖4(b),
(a)工作日
(b)非工作日
在工作日客流量呈現(xiàn)3個高峰,分別在9:00、13:00、18:00左右??土髁吭谠绺叻鍟r段最集中,晚高峰時段其次;在非工作日,客流量較低,且整體呈現(xiàn)出一個峰值。
工作日:將所有節(jié)假日及不被調(diào)休的周末視為非工作日,其余視為工作日,繪制工作日與非工作日客流量的箱型圖,如圖5(a)所示,工作日客流量分布更集中,非工作日客流量分布表現(xiàn)為分散,兩者日均客流量均值相當。
節(jié)假日:探究法定節(jié)假日對客流量的影響,繪制箱型圖,如圖5(b)所示,節(jié)假日客流分布更分散,非節(jié)假日客流量分布更集中,非節(jié)假日日均客流大于節(jié)假日日均客流量。
(a)非工作日與工作日
(b)非節(jié)假日與節(jié)假日
2.2.2 特征選擇
采用隨機森林的平均不純度減少方法進行特征重要度計算。平均不純度減少表示每個特征對誤差的平均減少程度,在隨機森林中,決策樹每次分裂都是針對一個可以使誤差最小化的特征。通過計算特定變量使得誤差減少的情況得到該特征貢獻程度,即特征重要程度。特征重要度排序如圖6所示。
通過圖6可知,在以上分析的6個因素中,時段特征最重要,其次重要的因素是月份、星期、工作日和節(jié)假日。工作日和節(jié)假日重要度評分均較低,非工作日特征中包含了節(jié)假日部分,且不同節(jié)假日對客流量影響程度不一樣,因此,這里刪掉節(jié)假日這一特征,保留其余4個特征。
圖6 特征重要度排序
將數(shù)據(jù)集按照8:2的比例劃分訓練集和測試集。目前上海城市軌道交通以小時為單位調(diào)整運行圖,因此,文中采用1天的客流歷史數(shù)據(jù)實現(xiàn)對未來1 h客流量的預測,預測結(jié)果可識別最大客流斷面,為運營管理者調(diào)整運行圖提供參考依據(jù)。由此,設(shè)定模型輸入的歷史時間窗口為19 h,加入時間、月份、星期及工作日4個特征,輸入的屬性特征為23個,用以預測未來1小時的客流量。
使用Adam優(yōu)化器和均方誤差訓練模型,模型在多次調(diào)參對比試驗后,最終確定的參數(shù)設(shè)置為:學習率0.001,迭代次數(shù)5 000;批量64。
指標1 均方根誤差R
(10)
指標2 平均絕對誤差M
(11)
指標3 準確率A
(12)
指標4 判定系數(shù)r2
(13)
R和M用于衡量預測誤差,值越小代表預測效果越好;A用于衡量預測精度,值越大代表預測效果越好;r2用于衡量預測能力,值越大代表預測能力越好。
模型在訓練過程中,測試集的損失函數(shù)值及模型準確率變化如圖7、圖8所示,可以看出,模型收斂速度較快,損失函數(shù)收斂值最終小于100,模型準確率接近90%。
圖7 損失函數(shù)值變化
圖8 模型準確率
將預測結(jié)果進行可視化分析,如圖9所示,可看出GCGRU預測的客流結(jié)果與實際客流變化趨勢基本一致,證明GCGRU能夠很好的捕捉上海地鐵全網(wǎng)的拓撲結(jié)構(gòu)及客流量的變化規(guī)律,預測效果較好。
圖9 斷面客流預測可視化結(jié)果
測試集中一周內(nèi)不同天的預測結(jié)果比較見圖10(a),周一至周五預測精度相近,預測準確率達90%以上;周末的預測誤差較大;周末居民出行更易受到是否調(diào)休、天氣好壞、是否有大型活動等因素的影響。對比工作日和非工作日預測結(jié)果精度,如圖10(b)所示,工作日預測準確率達到91%,而非工作日預測準確率為87%,非工作日居民出行需求彈性較大,是否節(jié)假日、天氣好壞、是否有大型活動等會影響居民的出行需求。
(a)周一至周日
(b)工作日與非工作日
為評價GCGRU模型的預測結(jié)果,選取歷史平均模型(HA)、移動平均自回歸模型(ARIMA)、循環(huán)神經(jīng)網(wǎng)絡(LSTM、GRU)及卷積循環(huán)神經(jīng)網(wǎng)絡(CNGRU)來進行對比。歷史平均法和移動平均自回歸模型是傳統(tǒng)的時間序列預測模型。歷史平均法是根據(jù)歷史時間序列,逐項推移,依次計算包含一定項數(shù)的序時平均數(shù)來進行預測的方法;移動平均自回歸模型是在將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列的過程中,將因變量僅對它的滯后值以及隨機誤差項的現(xiàn)值和滯后值進行回歸,建立模型來進行預測的方法。循環(huán)神經(jīng)網(wǎng)絡變體能夠捕捉時間特征,被廣泛地應用于時間序列預測中,其原理見1.2節(jié)。卷積循環(huán)神經(jīng)網(wǎng)絡為神經(jīng)網(wǎng)絡組合模型,是新興的用于時間序列預測的模型。CNGRU模型通過組合卷積神經(jīng)網(wǎng)絡CNN與循環(huán)神經(jīng)網(wǎng)絡變體GRU實現(xiàn)預測,CNN實現(xiàn)特征提取,保留有用信息并傳輸給GRU,GRU接收上層傳輸?shù)男畔⒉W習時間序列的特征進而實現(xiàn)預測。
通過表1可以看出,神經(jīng)網(wǎng)絡模型的預測精度高于參數(shù)模型HA和ARIMA,說明傳統(tǒng)的時間序列預測模型對于非線性變化的客流數(shù)據(jù)的擬合能力較差,具有局限性。LSTM與GRU的預測效果較好且近似,說明LSTM和GRU能夠?qū)W習到客流時間變化規(guī)律。與GRU相比,組合模型CNGRU和GCGRU預測精度進一步提升,RMSE預測誤差分別降低了15.25%、35.37%,精度分別提高了3.00%、6.95%。圖卷積循環(huán)神經(jīng)網(wǎng)絡模型GCGRU的預測效果最好,預測準確率達到89.38%。證明GCGRU能夠同時捕捉城市軌道交通網(wǎng)絡的空間拓撲特征和客流狀態(tài)變化的時間特征,具有良好的時空預測能力。
表1 預測結(jié)果比較
文中組合圖卷積網(wǎng)絡和循環(huán)神經(jīng)網(wǎng)絡構(gòu)建深度學習模型實現(xiàn)對大規(guī)模城市軌道交通網(wǎng)絡的客流量預測,將斷面客流視為圖結(jié)構(gòu)中節(jié)點的屬性,斷面間的聯(lián)系視為邊的屬性,利用圖卷積捕捉網(wǎng)絡的拓撲結(jié)構(gòu)從而得到空間特征,利用門控循環(huán)單元捕捉客流序列的變化規(guī)律從而得到時間特征。利用上海地鐵一年的客流數(shù)據(jù)進行研究,應用隨機森林提供的不純度減少方法進行影響因素特征選擇,預測結(jié)果表明,組合模型GCGRU的預測精度明顯優(yōu)于傳統(tǒng)時間序列預測模型HA、ARIMA,循環(huán)神經(jīng)網(wǎng)絡變體LSTM、GRU,以及神經(jīng)網(wǎng)絡組合模型CNGRU,說明GCGRU能夠同時捕捉城市軌道客流的空間依賴性和時間依賴性,預測效果較好。全網(wǎng)客流預測結(jié)果可識別最大客流斷面,為管理者調(diào)整列車運行組織方案、制定應急管控措施提供依據(jù),同時也為出行者提供軌道線網(wǎng)客流擁擠預警信息,從而合理選擇出行時間及路徑。