摘要 文章針對城市公交OD客流預(yù)測問題,提出了一種融合圖注意力網(wǎng)絡(luò)和多源數(shù)據(jù)的時空客流預(yù)測模型。首先,通過構(gòu)建時空圖注意力網(wǎng)絡(luò)模型STGAT(Spatio-Temporal Graph Attention Network),引入圖注意力機(jī)制自適應(yīng)學(xué)習(xí)站點間的影響權(quán)重;然后,引入站點POI等空間特征增強模型的解釋性;最后,通過案例分析表明,所提出的STGAT模型在客流預(yù)測的精度和穩(wěn)定性方面均優(yōu)于其他主流方法。
關(guān)鍵詞 公交客流預(yù)測;圖注意力網(wǎng)絡(luò);時空依賴;POI
中圖分類號 U121 文獻(xiàn)標(biāo)識碼 A 文章編號 2096-8949(2024)24-0046-03
0 引言
近年來,城市規(guī)模不斷擴(kuò)大,人口數(shù)量持續(xù)增長,由此帶來的交通擁堵、環(huán)境污染等問題日益嚴(yán)重,已成為制約城市可持續(xù)發(fā)展的關(guān)鍵因素,因此準(zhǔn)確預(yù)測公交客流需求,特別是OD(Original Destination)客流分布,是制定公交合理調(diào)度方案的前提。
Yang[1]等人利用LSTM神經(jīng)網(wǎng)絡(luò)模型處理時間序列的優(yōu)勢,提出了ELF-LSTM遞歸神經(jīng)網(wǎng)絡(luò)模型對短時OD客流進(jìn)行預(yù)測,該模型克服了因時間滯后導(dǎo)致的長時間依賴性學(xué)習(xí)不足的局限性;侯曉云[2]等人將MLR、KNN、XGBoost和LSTM進(jìn)行集成,通過預(yù)測結(jié)果對比發(fā)現(xiàn)集成模型的預(yù)測效果優(yōu)于子模型;Yang[3]等人提出了一種基于時間的城市軌道交通客流分層網(wǎng)絡(luò)模型,該模型在深度優(yōu)化框架下,能夠有效地獲得相對準(zhǔn)確的客流估計結(jié)果。
該文提出一種融合圖注意力網(wǎng)絡(luò)和多源數(shù)據(jù)的時空客流預(yù)測模型,通過對北京公交1路車IC刷卡數(shù)據(jù)和站點POI數(shù)據(jù)的分析,揭示客流在時空維度上的分布特征;通過構(gòu)建時空圖注意力網(wǎng)絡(luò)模型,引入圖注意力機(jī)制自適應(yīng)學(xué)習(xí)站點影響權(quán)重,結(jié)合門控循環(huán)單元捕捉客流時序依賴,并引入POI等空間特征增強解釋性,最后通過案例驗證所提模型在預(yù)測精度和穩(wěn)定性方面的優(yōu)異
性能。
1 相關(guān)理論與數(shù)據(jù)準(zhǔn)備
1.1 公交IC刷卡數(shù)據(jù)
該文采集了北京公交1路車IC刷卡數(shù)據(jù)及各站點附近的POI情況,然后利用公交線路和站點基礎(chǔ)信息匹配其站點名和站點編號,從而得到模型和算法可用的OD矩陣數(shù)據(jù),最后基于線路站點基礎(chǔ)信息中匹配的站點名和站點編號,根據(jù)運營時間每小時將矩陣數(shù)據(jù)生成一個矩陣,一天運營時間為5:00—24:00,所以一天共有19個矩陣。
使用Arc GIS的緩沖區(qū)分析工具,建立北京公交1路車各站點500 m范圍內(nèi)的緩沖區(qū),通過對七種不同類型的POI數(shù)據(jù)進(jìn)行KMO和巴特利特檢驗,逐步剔除關(guān)聯(lián)不大的POI類型,最終確定五種與客流相關(guān)性較大的POI,分別是醫(yī)療保健、體育休閑服務(wù)、科教文化、購物、商務(wù)住宅,其中KMO檢驗值為0.86(gt;0.6)、Bartlett球形檢驗概率值為0.000(lt;0.01),可以判斷相關(guān)系數(shù)矩陣不是單位矩陣,原始變量存在相關(guān)關(guān)系,可以對客流的吸引力進(jìn)行解釋。
1.2 POI權(quán)重分析
POI,全稱為“Point of Interest”,可以泛指所有能夠抽象為點的地理實體,該文采用相關(guān)系數(shù)法,即以POI核密度與客流量之間的相關(guān)系數(shù)為權(quán)重[4],通過GIS進(jìn)行疊加分析,確定各類POI數(shù)據(jù)的權(quán)重,在各類POI數(shù)據(jù)分級評分的基礎(chǔ)上對各類POI數(shù)據(jù)的分析結(jié)果進(jìn)行加權(quán)疊加,最終得到這五種類型的POI權(quán)重如表1所示:
將POI權(quán)重分析的結(jié)果與前文的客流時空分布特征分析結(jié)果進(jìn)行結(jié)合,發(fā)現(xiàn)不同站點的客流不均勻性與周邊POI的豐富性和類型密切相關(guān)。
2 基于時空圖注意力網(wǎng)絡(luò)的OD客流預(yù)測
STGAT通過引入圖注意力機(jī)制刻畫各站點之間的空間依賴,并使用門控循環(huán)單元捕捉客流在不同時間尺度上的演變規(guī)律。
(1)模型輸入與圖構(gòu)建。該文將道路網(wǎng)絡(luò)定義為一張有向帶權(quán)圖G=(V, E, A),其中,V=v1,v1,…,vN,表示N個公交站點的集合;E表示站點間的連接關(guān)系;為鄰接矩陣,表示站點間的距離;在每個時間步t,輸入表示N個站點的P維特征,包括各站點的進(jìn)出站客流量、POI密度及相應(yīng)權(quán)重。
(2)時空卷積層。圖注意力模塊負(fù)責(zé)對站點間的空間依賴進(jìn)行建模,其計算過程可以表示如下:
(1)
式中,——第l層空間卷積后站點的特征向量;——可學(xué)習(xí)的權(quán)重矩陣;——站點對站點的注意力權(quán)重;Ni——站點的鄰居集合。
在對站點信息進(jìn)行空間聚合后,通過門控循環(huán)單元進(jìn)一步對時序信息進(jìn)行建模,而對于STGAT的GRU門控機(jī)制,則通過更新門zt和重置門rt控制其隱藏狀態(tài)的信息流:
(2)
(3)
(4)
(5)
式中,xt——t時刻的輸入;——上一時刻的隱藏狀態(tài)。
對于預(yù)測未來個時間步的客流分布,則STGAT的輸出可以表示如下:
(6)
式中,Th——歷史時間步數(shù)。
(3)模型訓(xùn)練與優(yōu)化。模型以端到端的方式進(jìn)行訓(xùn)練,以各站點歷史客流數(shù)據(jù)為輸入,以未來Tp個時間步的OD矩陣為監(jiān)督信號。其中,Xt分別為時間步t的真實OD矩陣,Tp為預(yù)測時間步數(shù)。
3 案例分析
STGAT模型的實例驗證選取2019年北京市公交1路車上行方向的OD客流量數(shù)據(jù),對數(shù)據(jù)集進(jìn)行劃分,將1—11月數(shù)據(jù)作為訓(xùn)練集、12月前三周數(shù)據(jù)作為測試集、12月第四周數(shù)據(jù)作為預(yù)測集,分別采用CNN、RNN、LSTM、GCN這四種預(yù)測模型對OD客流進(jìn)行預(yù)測對比分析,見圖1所示。
STGAT模型的驗證選取2019年北京公交1路車下行方向的OD客流量數(shù)據(jù),經(jīng)過上述對數(shù)據(jù)的處理可以得知,同樣采用CNN、RNN、LSTM、GCN這四種預(yù)測模型對OD客流進(jìn)行預(yù)測對比分析,見圖2所示:
圖1和圖2分別展示了各模型在北京公交1路車上、下行方向OD客流預(yù)測中的性能對比。從圖中可以看出,STGAT模型的預(yù)測結(jié)果最接近真實值,對客流量的變化趨勢和峰值捕捉得最為準(zhǔn)確。其次是GCN和LSTM模型,它們雖然在一些時段的預(yù)測值與真實值有所偏離,但總體上仍然能夠較好地擬合客流量的變化趨勢。
各模型評價指標(biāo)對比如表2所示:
由表2中的評價指標(biāo)比較表明,在北京公交1路上、下行方向的OD客流預(yù)測中:STGAT模型在該數(shù)據(jù)集上的預(yù)測性能最優(yōu),這表明STGAT模型能夠很好地捕捉數(shù)據(jù)的內(nèi)在模式和趨勢。
4 結(jié)語
時空客流預(yù)測模型STGAT通過構(gòu)建時空圖注意力網(wǎng)絡(luò),引入圖注意力機(jī)制自適應(yīng)學(xué)習(xí)站點之間的影響權(quán)重,捕捉客流在時空維度上的演變規(guī)律,同時結(jié)合站點POI等空間特征,增強了模型的解釋性。
參考文獻(xiàn)
[1]Yang D,Chen K,Yang M,et al.Urban rail transit passenger flow forecast based on LSTM with enhanced long-term features[J].Intelligent Transport Systems,IET, 2019,13(10): 1475-1482.
[2]侯曉云,邵麗萍,李靜,等.基于深度學(xué)習(xí)的城市軌道交通短時客流起訖點預(yù)測[J].城市軌道交通研究, 2020(1):55-58+115.
[3]Yang Y,Liu J,Shang P,et al.Dynamic Origin-Destination Matrix Estimation Based on Urban Rail Transit AFC Data: Deep Optimization Framework with Forward Passing and Backpropagation Techniques[J].Journal of Advanced Transportation, 2020:1-16.
[4]何惠雨,付曉,呂啟航.突發(fā)事件影響下的城市居民出行活動時空模式研究[J].時空信息學(xué)報, 2024(2):259-268.