張建旭,賓 科,蔣雨洋
(1.重慶交通大學(xué) 交通運(yùn)輸學(xué)院, 重慶 400074; 2.重慶交通大學(xué) 山地城市交通系統(tǒng)與安全重慶市重點(diǎn)實(shí)驗(yàn)室, 重慶 400074)
軌道區(qū)間客流擁擠度反映了該區(qū)間內(nèi)軌道服務(wù)質(zhì)量,高密度區(qū)間將由于服務(wù)水平較低導(dǎo)致客流流失。軌道運(yùn)行區(qū)間客流預(yù)測能為列車運(yùn)行調(diào)度提供依據(jù),提高軌道服務(wù)質(zhì)量及運(yùn)營效益。
現(xiàn)有軌道客流預(yù)測常用時間序列模型[1-4]、機(jī)器學(xué)習(xí)[5-6]以及神經(jīng)網(wǎng)絡(luò)模型[7-16]。例如,楊靜等[17]利用變點(diǎn)模型處理進(jìn)站客流數(shù)據(jù),結(jié)合小波變換和ARMA模型預(yù)測單站點(diǎn)進(jìn)站客流,但站點(diǎn)客流無法反映區(qū)間客流擁擠度。部分研究以區(qū)間客流為研究對象,由歷史區(qū)間客流作為輸入,利用神經(jīng)網(wǎng)絡(luò)模型預(yù)測下一時段區(qū)間客流[18],模型輸入的區(qū)間客流需結(jié)合全線OD數(shù)據(jù)推算,導(dǎo)致預(yù)測時效性不足。劉巖等[19]利用多維標(biāo)度法分析線網(wǎng)各斷面之間的相關(guān)性,將研究斷面分為若干相關(guān)小組并結(jié)合卡爾曼濾波方法建立軌道交通斷面客流短時預(yù)測模型,僅研究了斷面客流數(shù)據(jù)本身規(guī)律,未考慮軌道客流出行時空分布特征,預(yù)測精度不高。
隨著軌道網(wǎng)絡(luò)化程度不斷加深,乘客出行路徑更加多樣化,普通模型無法反映軌道客流數(shù)據(jù)與區(qū)間客流的復(fù)雜關(guān)系。本文中通過分析軌道客流時空分布特征以及軌道出行分布與阻抗間的關(guān)系,標(biāo)定離散摩擦因子,借鑒重力模型并利用站點(diǎn)進(jìn)出客流,構(gòu)建出行引力因子,提取兩站點(diǎn)間客流出行關(guān)系,建立雙層LSTM模型,研究出行引力因子與全線區(qū)間客流之間的復(fù)雜關(guān)系。
站點(diǎn)空間位置與站點(diǎn)進(jìn)出客流將直接影響各區(qū)間客流分布。網(wǎng)絡(luò)化程度越高,其客流出行路徑分布愈復(fù)雜。
抽象軌道網(wǎng)絡(luò)如圖1所示,i0-i3,j0-j3表示軌道非換乘站點(diǎn),t0表示軌道換乘站點(diǎn)。軌道運(yùn)營過程中,線路兩端站點(diǎn)i0、i3的進(jìn)站客流出行方向?yàn)榫€路中部站點(diǎn)i1、i2等;線路中間段站點(diǎn)j1、j2的進(jìn)站客流出行方向?yàn)榫€路兩端站點(diǎn)j0、j3等。通常站點(diǎn)之間的進(jìn)、出關(guān)系的數(shù)量即客流出行OD,其數(shù)值大小和乘客數(shù)量及其出行目的、站點(diǎn)周圍的用地性質(zhì)和站點(diǎn)之間的出行距離等因素相關(guān)。
圖1 抽象軌道網(wǎng)絡(luò)圖
以圖1為例,出行起訖點(diǎn)對與區(qū)間段客流影響關(guān)系如圖2所示。
圖2 出行起訖點(diǎn)對與區(qū)間
以區(qū)間A為分析對象,由i0至t0、i2等站點(diǎn)間的客流出行OD將會通過區(qū)間A,各出行起訖點(diǎn)對與區(qū)間段距離遠(yuǎn)近將對區(qū)間客流產(chǎn)生不同的影響。這種影響程度可用w0、w1等數(shù)值表示,代表不同點(diǎn)對的客流吸引能力影響程度,將其命名為出行引力因子。
借鑒重力模型的構(gòu)造特征,出行引力因子可用下式構(gòu)造:
Tij(t)=Pi(t)×Aj(t)×Fij(t)
(1)
式中:Tij(t)表示t時段內(nèi)站點(diǎn)i、j間出行引力因子大??;Pi(t)表示t時段內(nèi)站點(diǎn)i進(jìn)站客流;Aj(t)表示t時段內(nèi)站點(diǎn)j出站客流;Fij(t)表示t時段內(nèi)站點(diǎn)i、j間摩擦因子。
根據(jù)重慶市2019年12月2日至12月23日4個星期一的軌道客流出行OD數(shù)據(jù)統(tǒng)計客流分布特征,隨機(jī)篩選4個站點(diǎn):翠云(人口聚集區(qū))、大渡口(區(qū)級組團(tuán)中心,但人口崗位密度較低)、江北機(jī)場T3航站樓、磁器口(市級文旅商發(fā)展中心),繪制其客流出行OD分布占比(即1 d內(nèi)由該站點(diǎn)出發(fā)到達(dá)其他站點(diǎn)的出行量占比)與出行距離的關(guān)系圖,如圖3所示。
圖3 軌道出行OD分布與出行距離關(guān)系
4 d內(nèi)的客流出行OD分布趨于一致,表明各站點(diǎn)OD占比分布在時空上存在規(guī)律。其中前兩者分布圖呈現(xiàn)出短距離出行量占比高的趨勢,如金童路、楊家坪等,存在部分站點(diǎn)如碧津、劉家壩等周邊用地性質(zhì)與出發(fā)站近導(dǎo)致出行分布占比低。出行距離超過10 km后,其客流占比分布隨距離增加總體呈現(xiàn)遞減趨勢,少部分站點(diǎn)如觀音橋、臨江門等周邊用地性質(zhì)與出發(fā)站間存在協(xié)調(diào)互補(bǔ)的關(guān)系,此時距離較遠(yuǎn)仍存在較高的出行量占比。后兩者出行輻射范圍更廣,同時由于用地性質(zhì)上的互補(bǔ),使得其存在不隨出行距離增加而遞減的出行需求,出行分布將呈多峰分布。
摩擦因子通常分為離散摩擦因子與連續(xù)摩擦因子函數(shù)。上述軌道客流出行分布受到出行距離以及站點(diǎn)周邊用地性質(zhì)的影響,使得連續(xù)的阻抗函數(shù)無法刻畫軌道出行規(guī)律,而離散摩擦因子表可以更加準(zhǔn)確并動態(tài)把握復(fù)雜軌道網(wǎng)絡(luò)下各站點(diǎn)間的出行阻力。由文獻(xiàn)[20]中離散摩擦因子標(biāo)定方法,不考慮同站進(jìn)出,根據(jù)客流出行OD及進(jìn)出站客流標(biāo)定得到t0時段內(nèi)站點(diǎn)i、j間離散摩擦因子Fij,t0為:
(2)
2.2 出行引力因子與區(qū)間客流分布關(guān)系分析
以上述客流出行OD數(shù)據(jù)為例,展示標(biāo)定完成的站間出行引力因子與區(qū)間客流間的關(guān)系。隨機(jī)選取4個區(qū)間斷面(1號線陳家橋-微電園、2號線金家灣-建橋、3號線嘉州路-紅旗河溝、6號線向家崗-蔡家),各區(qū)間左右兩端隨機(jī)選取3個站點(diǎn),通過兩兩組合的方式構(gòu)成客流出行OD對。堆疊各OD對出行引力因子,繪制各區(qū)間1 d內(nèi)客流分布與堆疊的出行引力因子之間的關(guān)系圖,如圖4所示。
圖4 出行引力因子與區(qū)間客流分布關(guān)系
1 d內(nèi)出行引力因子分布與區(qū)間客流分布存在高度相關(guān),表明疊加的出行引力因子作為模型輸入能有效反映區(qū)間客流分布趨勢。
原始AFC票卡數(shù)據(jù)可統(tǒng)計各站點(diǎn)各時段的進(jìn)出站客流數(shù)據(jù)。此時假設(shè)軌道網(wǎng)絡(luò)共有m個站點(diǎn),則t0時段內(nèi)各站點(diǎn)進(jìn)、出站客流可表示為:
Pi,t0=[p1,t0,p2,t0,…,pm,t0],i∈[1,m]
(3)
Aj,t0=[a1,t0,a2,t0,…,am,t0],j∈[1,m]
(4)
則可按照式(5)計算t0時段內(nèi)站間出行引力因子Tij,t0:
(5)
式中:i,j∈[1,m]且i≠j。結(jié)合式(5)可以得到每個時段內(nèi)的出行引力因子Tij,t,并將其扁平化得到一組一維向量,則k個時段構(gòu)成如下一組具有時間序列特征的出行引力因子矩陣:
上述步驟所構(gòu)造出的出行引力因子為(m2-m)×k維的矩陣,此時假設(shè)軌道網(wǎng)絡(luò)存在n個區(qū)間斷面,則為(m2-m)維輸入向n維輸出映射。普通模型無法刻畫此類復(fù)雜的映射關(guān)系,同時各時段所組成的出行引力因子為一組時序數(shù)據(jù)。長短期記憶人工神經(jīng)網(wǎng)絡(luò)作為非線性模型可以構(gòu)造更大型深度神經(jīng)網(wǎng)絡(luò),能處理高維時序數(shù)據(jù),自動學(xué)習(xí)輸入與輸出間的復(fù)雜映射關(guān)系,從而把握客流時空分布,預(yù)測區(qū)間客流分布。
長短期記憶人工神經(jīng)網(wǎng)絡(luò)通過輸入門、輸出門與遺忘門實(shí)現(xiàn)信息的有效控制及傳遞,能解決RNN無法處理長記憶信息依賴問題。其單個cell內(nèi)部結(jié)構(gòu)如圖5所示。
圖5 LSTM單個cell內(nèi)部結(jié)構(gòu)
遺忘門處理上層輸出與當(dāng)前輸入,篩選上一時刻細(xì)胞單元狀態(tài)Ct-1的有效信息。建立如下模型實(shí)現(xiàn)長久記憶信息的傳遞。
ft=σ(Wfht-1+UfTij,t+bf)
(6)
輸入門篩選當(dāng)前輸入的站點(diǎn)i,j間t時段內(nèi)的出行引力因子Tij,t的有效信息,更新細(xì)胞狀態(tài)Ct。建立如下模型得到輸入信息的重要度值,并經(jīng)過激活函數(shù)tanh處理得到當(dāng)前輸入細(xì)胞狀態(tài)。
it=σ(Wiht-1+UiTij,t+bi)
(7)
at=tanh(Wiht-1+UiTij,t+bi)
(8)
遺忘門保留長記憶信息,輸入門能避免無效信息的輸入。建立如下模型,將上一時刻細(xì)胞狀態(tài)Ct-1與遺忘門輸出ft按照對應(yīng)元素相乘的方式結(jié)合,同時將當(dāng)前輸入的細(xì)胞狀態(tài)at與輸入信息重要度it對應(yīng)相乘。最后,累加上述2個結(jié)果,更新當(dāng)前細(xì)胞狀態(tài)。
Ct=Ct-1⊙ft+it⊙a(bǔ)t
(9)
輸出門能夠控制細(xì)胞狀態(tài)Ct輸出,通過sigmoid激活函數(shù)決定輸出的細(xì)胞狀態(tài)信息,計算模型如下所示:
Ot=σ(Woht-1+UoTij,t+bo)
(10)
最終,由以下公式得到隱含層輸出,即對應(yīng)的區(qū)間客流值ht:
ht=Ot⊙tanh(Ct)
(11)
上述模型中,Uf、Ui、Ua以及Uo分別表示遺忘門、輸入門、細(xì)胞狀態(tài)更新和輸出門的權(quán)值參數(shù);Wf、Wi、Wa以及Wo分別對應(yīng)各個門控單元隱藏層的權(quán)重參數(shù);bf、bi、ba以及bo分別為遺忘門、輸入門、細(xì)胞狀態(tài)更新和輸出門的偏置項(xiàng);⊙運(yùn)算符表示矩陣對應(yīng)元素相乘。
如圖6所示,按照時間滑動窗口構(gòu)造時序數(shù)據(jù)作為模型輸入。針對單個時間窗口,cell個數(shù)與滑動窗口大小對應(yīng),多個cell之間按照上述步驟計算,每個cell前向計算當(dāng)前時間步的輸出值,最后一個時間步的cell輸出與對應(yīng)的訓(xùn)練標(biāo)簽計算誤差值。根據(jù)誤差反向傳播規(guī)則分別計算每個權(quán)重以及偏置的梯度,更新遺忘門、輸入門與輸出門參數(shù)直至訓(xùn)練收斂。
圖6 LSTM處理時序數(shù)據(jù)
堆疊的LSTM能處理更加復(fù)雜的輸入輸出對應(yīng)關(guān)系,但層數(shù)過多也會導(dǎo)致模型過擬合,泛化能力不強(qiáng)。綜合上述因素設(shè)計了如圖7所示的雙層LSTM模型,將第1層網(wǎng)絡(luò)的輸出序列作為輸入再次傳遞至LSTM第2層,能更加準(zhǔn)確地把握輸入特征規(guī)律,提升預(yù)測性能。
圖7 雙層LSTM模型結(jié)構(gòu)
原始的AFC票卡數(shù)據(jù)統(tǒng)計如表1所示。
表1 AFC票卡數(shù)據(jù)統(tǒng)計信息
本實(shí)例所分析的城市軌道交通數(shù)據(jù)為重慶市2019年12月共計31 d的15 min粒度軌道客流數(shù)據(jù)。包括進(jìn)出站客流數(shù)據(jù)、站間OD數(shù)據(jù)以及推算的區(qū)間客流數(shù)據(jù),其有效時段為6∶30—23∶30,每天共計68個時段。
結(jié)合摩擦因子標(biāo)定方法,得到如式(2)的各時段離散摩擦因子,結(jié)合式(5)以及進(jìn)出站客流數(shù)據(jù)得到多天內(nèi)各時段出行引力因子作為模型輸入數(shù)據(jù)。將數(shù)據(jù)集劃分為訓(xùn)練集、驗(yàn)證集及測試集。其中訓(xùn)練集及驗(yàn)證集用于模型訓(xùn)練和參數(shù)尋優(yōu),測試集不參與訓(xùn)練過程,待模型訓(xùn)練完成之后用于評估模型預(yù)測效果。去除特殊日期,數(shù)據(jù)集如表2所示。
表2 數(shù)據(jù)集
LSTM神經(jīng)網(wǎng)絡(luò)模型的結(jié)構(gòu)及參數(shù)設(shè)置將直接影響模型訓(xùn)練與預(yù)測效果。神經(jīng)元個數(shù)影響模型的擬合能力;Dropout的設(shè)置能避免模型過擬合;BatchSize表示一次輸入多少個批次進(jìn)行訓(xùn)練,應(yīng)結(jié)合輸入數(shù)據(jù)維度進(jìn)行設(shè)置;其中時間步的取值表示一次訓(xùn)練輸入多少個15 min時段數(shù)據(jù)。軌道客流出行時間長短不一,時間步取值過小時,部分出行還未完成將導(dǎo)致客流分布特征把握不完整;反之取值過大將輸入部分時效性不足的客流信息,需結(jié)合重慶市平均出行時間進(jìn)行考慮。最終設(shè)計了如表3所示的參數(shù)組合。
表3 參數(shù)方案尋優(yōu)設(shè)計
選用MAE(人次/15 min)評估各場景下全線區(qū)間客流預(yù)測平均誤差,為保證軌道全線各區(qū)間段客流預(yù)測效果,需通過分析各區(qū)間段客流MAE的離差從而選擇最佳模型預(yù)測結(jié)構(gòu)。
以出行引力因子作為輸入的模型(Pred1)在各場景下的全線區(qū)間客流預(yù)測平均誤差MAE(人次/15 min)如表4所示。
表4 參數(shù)測試結(jié)果
可見場景6效果最佳,模型收斂時loss如圖8所示。
圖8 訓(xùn)練loss曲線
4.3.1不同輸入模型比對分析
現(xiàn)有研究直接輸入進(jìn)出站客流預(yù)測區(qū)間客流,為比對不同輸入時模型預(yù)測效果,在上述場景6的參數(shù)組合下得到以進(jìn)出站客流作為輸入的模型(Pred2),其全線區(qū)間客流預(yù)測平均誤差MAE為82.91(人次/15 min)。進(jìn)一步分析單區(qū)間客流預(yù)測誤差,繪制各區(qū)間段客流預(yù)測誤差分布圖,如圖9、10所示。
圖9 不同輸入模型各區(qū)間客流預(yù)測誤差
圖10 不同輸入模型各區(qū)間客流預(yù)測誤差百分比
上述2個模型全線各區(qū)間客流預(yù)測誤差百分比分布如表5所示。
表5 不同輸入下模型預(yù)測結(jié)果誤差分布
由以上圖表可見,前者即Pred1在全線區(qū)間客流預(yù)測上平均誤差更低,同時各區(qū)間客流預(yù)測精度也更高。為分析模型在1 d中各時段內(nèi)的預(yù)測效果,隨機(jī)選定一個區(qū)間段(四公里—南湖)并繪制上述模型預(yù)測值以及真實(shí)值所對應(yīng)的各時段客流分布圖,如圖11所示。
圖11 不同輸入下各時段區(qū)間客流分布
可見,Pred2難以把握區(qū)間客流的上下波動,而Pred1在客流波動性方面表現(xiàn)更好。
4.3.2不同模型預(yù)測性能評估
進(jìn)一步比對時序模型(ARIMA)在上述區(qū)間客流預(yù)測時的效果并繪制其各時段的客流分布圖,如圖12所示,通過參數(shù)尋優(yōu)得到的最佳模型ARIMA(3,0,2)預(yù)測誤差MAE為40.91(人次/15 min),Pred1預(yù)測誤差為21.52(人次/15 min)。結(jié)合圖12可見ARIMA模型預(yù)測值較真實(shí)值波動較大,而Pred1能有效把握峰值的變化情況。
圖12 不同模型各時段區(qū)間客流分布
驗(yàn)證分析可得,Pred1預(yù)測效果最佳,根據(jù)重慶市軌道交通現(xiàn)階段的列車類型及其單節(jié)車廂乘客有效利用面積,以出行引力因子為輸入的預(yù)測模型在區(qū)間客流預(yù)測中單區(qū)間平均預(yù)測誤差能控制在5%以內(nèi),能準(zhǔn)確把握區(qū)間客流分布。
離散摩擦因子能夠刻畫各時段內(nèi)軌道出行阻力,同時出行引力因子的提出能夠體現(xiàn)區(qū)間客流與進(jìn)出站客流分布特征,以此作為雙層LSTM模型的輸入,對城市軌道全線區(qū)間客流預(yù)測有較好的效果,能為提升軌道運(yùn)營服務(wù)質(zhì)量提供依據(jù)。