李斐軒
摘要:由于當(dāng)前交通流預(yù)測(cè)中各參數(shù)之間的關(guān)聯(lián)性不能在模型中加以呈現(xiàn),因此提出了多因素融合的圖注意力交通流預(yù)測(cè)模型(MFI-GAT),將交通流量和交通平均速度兩個(gè)參數(shù)通過殘差網(wǎng)絡(luò)進(jìn)行融合,并將交通流特征矩陣與天氣屬性矩陣結(jié)合起來,使用圖注意力網(wǎng)絡(luò)(GATs)來捕捉空間特征,并通過添加了注意力機(jī)制的門控循環(huán)單元(AGRUs)來捕捉時(shí)間特征,通過采用真實(shí)數(shù)據(jù)集進(jìn)行試驗(yàn),證明該模型與現(xiàn)有部分模型相比準(zhǔn)確率有所提升。
關(guān)鍵詞:深度學(xué)習(xí);數(shù)據(jù)融合;短時(shí)交通流預(yù)測(cè);圖神經(jīng)網(wǎng)絡(luò);注意力機(jī)制
一、前言
交通流分析是智能交通網(wǎng)絡(luò)系統(tǒng)的主要部分,其研究方法經(jīng)歷了多個(gè)不同的發(fā)展階段。當(dāng)前,主要存在的技術(shù)類別:基于傳統(tǒng)理論的預(yù)測(cè)技術(shù)、基于單一智能模型的預(yù)測(cè)技術(shù)以及基于多種智能模型的預(yù)測(cè)技術(shù)。本文探討了一種基于混合智能模型的預(yù)測(cè)方法,它能夠充分利用交通流數(shù)據(jù)的時(shí)空特征和多種外部環(huán)境因素,從而提高預(yù)測(cè)的準(zhǔn)確度?;旌现悄苣P褪侵敢环N利用兩種或兩種以上的模型進(jìn)行短時(shí)交通流預(yù)測(cè)的模式,它可能包括兩種模式,一種是利用幾個(gè)不同的模型相互銜接的,一個(gè)模型的輸出結(jié)果可以作為另一個(gè)模型的輸入,并相互銜接以便得出最后的結(jié)論;而另一類則是利用多種模型一起進(jìn)行的,最后可以通過對(duì)他們的檢測(cè)結(jié)果做出若干數(shù)學(xué)計(jì)算,以便得出最后的預(yù)測(cè)結(jié)論。在2016年,Wu等人[1]利用復(fù)雜的空間依賴性關(guān)系,將一維CNNs和二維LSTM技術(shù)有機(jī)地結(jié)合起來,構(gòu)建出一個(gè)新的特征融合框架,以更好地預(yù)測(cè)短時(shí)交通流。首先,他們利用一維CNNs技術(shù)探索交通流的空間依賴性,隨后,他們又利用二維LSTM技術(shù),深入探究交通流量的短期變化趨勢(shì)及其周期性。次年,Liu等人[2]在國(guó)際WCSP大會(huì)上,提出了一種新的短時(shí)交通流預(yù)測(cè)技術(shù),它將單ConvLSTM模型與雙向LSTM模型有機(jī)結(jié)合,以獲取時(shí)間特性、周期特性以及其他相關(guān)信息,而不需要對(duì)車輛行駛軌跡數(shù)據(jù)集進(jìn)行任何預(yù)處理,從而實(shí)現(xiàn)了端到端的快速、準(zhǔn)確的短時(shí)交通流預(yù)測(cè)。Yu和其他研究者[3]使用GCNs架構(gòu)來描述時(shí)間相互作用的過程,他們發(fā)明的時(shí)間空間圖卷積網(wǎng)絡(luò)(STGCN)被廣泛應(yīng)用于交通流的預(yù)報(bào)。STGCN的架構(gòu)由多個(gè)時(shí)間分割單元組成,其中一個(gè)時(shí)間分割單元擁有兩個(gè)時(shí)間門限,另一個(gè)時(shí)間分割單元擁有一個(gè)時(shí)間分割單元,它們能夠有效地抓住時(shí)間的本質(zhì),同時(shí)也能夠揭示其中的空間規(guī)律。Zhu和其他研究者[4]利用A3T-GCN(圖卷積)模擬,將注意力機(jī)制納入其中,使得整個(gè)時(shí)期的數(shù)據(jù)能夠被有效地整合,進(jìn)一步大大提高了預(yù)測(cè)的精度。目前的研究方法主要是以交通流信息的時(shí)間特性作為研究重點(diǎn)的目標(biāo),只是少數(shù)時(shí)候顧及一些外界要素, 晏臻等人[5]提出了融合多因素的短時(shí)交通流預(yù)測(cè)模型(MFNN)的交通流預(yù)測(cè)模型,但其理論手段還僅僅把外界要素的全連接層直接整合在時(shí)間預(yù)報(bào)模型中,還不能很好地抓住其特點(diǎn)。
綜上所述,提出了多因素融合圖注意力網(wǎng)絡(luò)預(yù)測(cè)模型 (Multi Factor Integration-GAT, MFI-GAT),該模型注重?cái)?shù)據(jù)融合將已有參數(shù)(交通流量和車速)融合為單一參數(shù)后將路網(wǎng)空間與天氣等因素變?yōu)槿诤暇仃囎鳛槟P洼斎耄源诉M(jìn)一步提高了模型的精度。
二、基礎(chǔ)模型
(一)交通流定義
交通流量:即指定時(shí)間間隔內(nèi)該路段通過的車流量與指定時(shí)間間隔的比值。其時(shí)間間隔一般為5分鐘所以稱之為短時(shí)交通流預(yù)測(cè)。由于交通流數(shù)據(jù)會(huì)受到時(shí)間空間等一些不確定因素的干擾,所以這里簡(jiǎn)單介紹一下其具有的特征:
1.空間相關(guān)性。路網(wǎng)的拓?fù)浣Y(jié)構(gòu)會(huì)對(duì)交通流產(chǎn)生很大影響,當(dāng)路網(wǎng)結(jié)構(gòu)中路段的交通流發(fā)生變化時(shí)會(huì)對(duì)相鄰路段產(chǎn)生影響。
2.交通流的時(shí)間特征可以分為兩部分。一部分是有規(guī)律的,另一部分是無規(guī)律的。交通流數(shù)據(jù)因周期性會(huì)表現(xiàn)得十分相近,且會(huì)受到相鄰時(shí)間段交通流數(shù)據(jù)的影響。
3.不確定性。當(dāng)發(fā)生暴雨,大雪等特殊天氣時(shí)會(huì)對(duì)交通產(chǎn)生影響,交通流也將產(chǎn)生明顯變化,遇到車禍等人為因素交通流也會(huì)受到影響。
(二)數(shù)據(jù)融合
當(dāng)前,在短時(shí)間內(nèi)的交通流預(yù)測(cè)方面,有兩種主要的方法:一種是僅使用一個(gè)交通流參數(shù),另一種是將多個(gè)參數(shù)分別輸入到不同的模型中,并通過全連接層融合來得出結(jié)果。第一種方法可能會(huì)導(dǎo)致較大的預(yù)測(cè)誤差;第二種方法雖然能夠提取更多的交通流時(shí)空特征,但需要更多的模型,并且對(duì)硬件設(shè)備的要求也比較高。通過式1對(duì)數(shù)據(jù)進(jìn)行了加權(quán)融合[6],以找到最佳的加權(quán)參數(shù),以達(dá)到最佳的結(jié)果。
式中:F為路段交通流量; 為路段交通平均速度; 為加權(quán)參數(shù),其取值為[0,1];X加權(quán)融合后新的交通流參數(shù)。
我們首先使用加權(quán)平均法來整理兩個(gè)關(guān)鍵因素(交通流量和平均速度)的信息,從而創(chuàng)建一個(gè)全面的,能夠反映真實(shí)情況的數(shù)據(jù)集。研究結(jié)果顯示,這種方法能夠很好地整合這兩個(gè)因素的時(shí)間和空間信息,從而對(duì)短時(shí)交通流預(yù)測(cè)進(jìn)行更加精準(zhǔn)的預(yù)測(cè)。
(三)GATs模型
傳統(tǒng)GCN模型存在兩大局限性,首先它無法完成inductive任務(wù),即處理動(dòng)態(tài)問題。同時(shí)GCN模型還有處理有向圖的瓶頸,不容易實(shí)現(xiàn)分配不同的學(xué)習(xí)權(quán)重給不同的鄰居節(jié)點(diǎn)。而GAT模型完全不依賴于圖的結(jié)構(gòu),對(duì)于inductive任務(wù)無壓力。所以這里采用GAT模型進(jìn)行實(shí)驗(yàn)。
通過多層 AGRU 層的循環(huán),每一層的 AGRU 的輸入都考慮了上一層 AGRU的輸出,從而捕獲道路網(wǎng)絡(luò)的時(shí)間依賴關(guān)系。
三、MFI-GAT 預(yù)測(cè)模型
框架主要由數(shù)據(jù)預(yù)處理,時(shí)空建模和預(yù)測(cè)三部分組成。經(jīng)過大數(shù)據(jù)技術(shù)處理后,可以獲取路網(wǎng)拓?fù)浣Y(jié)構(gòu)G、交通流特征矩陣X、天氣特征矩陣K,將矩陣X和K經(jīng)時(shí)序特征進(jìn)行合并得到融合矩陣E,然后與路網(wǎng)拓?fù)浣Y(jié)構(gòu)輸入到GATs模型去獲取其空間特征,然后用AGRUs去獲取時(shí)間特征,最后將時(shí)空特征作為輸出。預(yù)測(cè)部分使用已有數(shù)據(jù)集進(jìn)行預(yù)測(cè)對(duì)比。
四、實(shí)驗(yàn)與分析
(一)數(shù)據(jù)集
本文數(shù)據(jù)集主要使用了來自滴滴打車的開放數(shù)據(jù)其包含了實(shí)驗(yàn)所需的特征,而通過查詢“天氣網(wǎng)”的數(shù)據(jù)獲取了車輛行駛過程的相關(guān)不確定因素。
1.車輛行駛軌跡數(shù)據(jù)集。收錄了2018年9月西安市局部地區(qū)滴滴打車的出租車軌跡信息,總?cè)萘窟_(dá)到71GB,并且對(duì)司機(jī)和訂單信息進(jìn)行了嚴(yán)格的加密和脫敏處理,該軌跡數(shù)據(jù)集的經(jīng)緯度范圍分別[34.2049,34.2800]和[108.9218,109.0094]。表1為數(shù)據(jù)集中原始加密數(shù)據(jù),數(shù)據(jù)內(nèi)容為出租車ID行駛軌跡的經(jīng)緯度與時(shí)間。
2.天氣數(shù)據(jù)集。通過查閱“天氣網(wǎng)”和中國(guó)國(guó)家氣象局得到了2018年9月西安市的相關(guān)天氣數(shù)據(jù)包括了天氣,溫度,降水量,風(fēng)速等多種天氣指標(biāo)。
(二)實(shí)驗(yàn)環(huán)境
見表2。
(三)評(píng)價(jià)指標(biāo)
使用均方根誤差(RMSE)平均絕對(duì)誤差(MAE) 準(zhǔn)確率(Accuracy)三種指標(biāo)來評(píng)估模型的預(yù)測(cè)性能。
(四)實(shí)驗(yàn)結(jié)果
1.數(shù)據(jù)特征分析
由于交通流數(shù)據(jù)會(huì)受到空間時(shí)間以及其他不確定因素的影響所以將從其空間相關(guān)性、時(shí)間相關(guān)性和不確定性這三種特征對(duì)其進(jìn)行可視化分析。
空間相關(guān)性:圖1中選取了以25號(hào)路段為核心路段其他路段為其相鄰路段,時(shí)間為9月18日上午,天氣晴,以此進(jìn)行探究。由圖中交通流趨勢(shì)變化我們可以看出25號(hào)路段會(huì)受到其相鄰路段(31,19,18,21,24號(hào)路段)交通流變化的影響,其影響因素包括因直行與左右轉(zhuǎn)彎而匯出或流出的交通流。以10:30這一時(shí)間點(diǎn)為例,在位于25號(hào)路段上游路段的18號(hào)31號(hào)以及24號(hào)路段的交通流減少時(shí),25號(hào)路段的交通流也有所減少,而位于其下游的19號(hào)路段的交通流大幅提高。同理在11:30左右,25號(hào)路段因上游路段的交通流減少而減少,之后因上游路段交通流增長(zhǎng)而增長(zhǎng),最后趨于穩(wěn)定。從這一點(diǎn)可以清楚地看出,一個(gè)路段的車流量會(huì)受到其他路段的限制,因此,車流量與道路網(wǎng)絡(luò)的空間布局之間存在著密切的聯(lián)系。
時(shí)間相關(guān)性:圖2選取了25號(hào)路段早高峰時(shí)間段(上午六點(diǎn)至九點(diǎn)),一周內(nèi)的交通流變化圖,其交通流變化大體相同,大約在每日的6:30左右達(dá)到低谷,之后開始上漲,8點(diǎn)左右交通流會(huì)達(dá)到峰值,并且在周末時(shí)的峰值數(shù)據(jù)一般會(huì)高于其他時(shí)間段。研究表明,休息日、節(jié)假日等因素會(huì)顯著改變交通流量,從而證實(shí)了交通流量與時(shí)間序列之間的密切聯(lián)系。
不確定性:圖3為25路段3日內(nèi)上午六點(diǎn)至下午五點(diǎn)的交通流趨勢(shì)圖,其天氣分別為大雨,晴天,多云。由圖中數(shù)據(jù)可明顯看出27日的交通流數(shù)據(jù)受天氣因素影響遠(yuǎn)低于其他兩日。所以天氣,車禍等之類的不確定因素會(huì)對(duì)交通流數(shù)據(jù)產(chǎn)生很大影響。
2.實(shí)驗(yàn)結(jié)果分析
為評(píng)估模型在交通流預(yù)測(cè)中的性能,將其與近五年來已有模型進(jìn)行比較,結(jié)果如表3所示。
由表3可以看出,將模型T-GCN與傳統(tǒng)模型GRUs和GATs相比其RMSE分別降低了約19.22%和20.36%,其準(zhǔn)確度也有一定提高;MFI-GAT模型在融入天氣要素以及進(jìn)行了數(shù)據(jù)融合后,其精準(zhǔn)度與T-GCN 模型相比提高了0.83%,RMSE 和 MAE 分別降低了1.7%和4%,其預(yù)測(cè)結(jié)果優(yōu)于模型T-GCN,可見MFI-GAT模型的可行性。
五、結(jié)語(yǔ)
本文提出了一種新的圖注意力交通流預(yù)測(cè)模型,它將多種因素,如天氣、時(shí)間、空間等,融合在一起,并利用滴滴打車“蓋亞”數(shù)據(jù)公開項(xiàng)目的數(shù)據(jù)集,開展性能評(píng)估,與GRUs、GATs和T-GCN等模型相比較。最終結(jié)果表明,本文模型相較于這三類模型有了一定的提升。
參考文獻(xiàn)
[1]Yuankai Wu and Huachun Tan. Short-term traffic flow forecasting with spatial-temporal correlation in a hybrid deep learning framework.[J].CoRR,2016,abs/1612.01022.
[2]Liu Y,Zheng H,F(xiàn)eng X,et al.Short-term traffic flow prediction with Conv-LSTM[C]//2017 9th International Conference on Wireless Communications and Signal Processing (WCSP). IEEE,2017:1-6.
[3]Yu B,Yin H,Zhu Z.Spatio-temporal graph convolutional networks:A deep learning framework for traffic forecasting[J].arXiv preprint arXiv:1709.04875, 2017.
[4]Bai J,Zhu J,Song Y,et al.A3t-gcn:Attention temporal graph convolutional network for traffic forecasting[J].ISPRS International Journal of Geo-Information,2021,10(7):485.
[5]晏臻,于重重,韓璐,等.基于CNN+LSTM的短時(shí)交通流量預(yù)測(cè)方法[J].計(jì)算機(jī)工程與設(shè)計(jì),2019,40(09):2620-2624+2659.
[6]董真杰,鄭琛瑤,張國(guó)龍.不同精度數(shù)據(jù)融合的自適應(yīng)加權(quán)平均法研究[J].艦船電子工程,2014,34(10):31-33+126.