陳 鈺,張安勤,許春暉
(上海電力大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,上海 201306)
隨著智能交通系統(tǒng)的發(fā)展,交通預(yù)測(cè)越來越受到重視,它是先進(jìn)交通控制的重要組成部分.準(zhǔn)確地對(duì)交通進(jìn)行預(yù)測(cè)對(duì)城市交通規(guī)劃、交通管理和交通控制等方面起到了重要的作用.交通預(yù)測(cè)是分析城市路網(wǎng)上的交通狀況、包括流量、車速和密度等,挖掘交通模式,對(duì)路網(wǎng)上的交通進(jìn)行預(yù)測(cè)的一個(gè)過程.交通預(yù)測(cè)不僅能給管理者提供科學(xué)依據(jù)來預(yù)測(cè)交通擁擠并提前限制車輛出行提供科學(xué)依據(jù),而且還可以給城市出行者提供適當(dāng)?shù)某鲂新肪€,提高出行效率提供保障.然而,交通預(yù)測(cè)由于其復(fù)雜的時(shí)空依賴性,一直是一項(xiàng)具有挑戰(zhàn)性的任務(wù).
目前有很多交通預(yù)測(cè)的方法,早期,有一些是基于時(shí)間依賴性來進(jìn)行分析的,例如ARIMA 模型[1]、卡爾曼濾波模型[2]和SVR[3]模型等.但在實(shí)際應(yīng)用中,這些方法對(duì)于不穩(wěn)定、非線性的數(shù)據(jù)處理是比較困難的.
近年以來,隨著深度學(xué)習(xí)的快速發(fā)展,深度神經(jīng)網(wǎng)絡(luò)能夠捕獲交通數(shù)據(jù)的動(dòng)態(tài)特征并取得很好的效果,例如,胡鑫澤等[4]構(gòu)建了基于BP 神經(jīng)網(wǎng)絡(luò)的模型來預(yù)測(cè)城市交通擁堵情況.
根據(jù)是否考慮空間依賴,神經(jīng)網(wǎng)絡(luò)模型可以劃分成兩類.一些方法只考慮時(shí)間依賴,例如,李校林等[5]構(gòu)建了PF-LSTM 來預(yù)測(cè)交通流量;滿春濤等[6]使用考慮上下游的LSTM 網(wǎng)絡(luò)來進(jìn)行短時(shí)交通流量的預(yù)測(cè),這些模型考慮時(shí)間特征但忽略了空間依賴性,所以交通數(shù)據(jù)的變化不受城市路網(wǎng)的限制,因此不能精確的預(yù)測(cè)路上的交通狀態(tài).
解決交通預(yù)測(cè)問題的關(guān)鍵在于充分利用空間和時(shí)間依賴性,為了更好地表現(xiàn)空間特征,很多研究已經(jīng)在這個(gè)基礎(chǔ)上進(jìn)行了改進(jìn).例如,LYU 等[7]提出了一個(gè)SAE模型從交通數(shù)據(jù)中捕獲空間特征;朱凱利等[8]使用圖卷積神經(jīng)網(wǎng)絡(luò)來捕捉城市道路網(wǎng)絡(luò)的空間特征,實(shí)現(xiàn)短期交通流的預(yù)測(cè);Yu 等[9]使用深度卷積神經(jīng)網(wǎng)絡(luò)捕獲空間依賴,用LSTM 捕獲時(shí)間動(dòng)態(tài)性,在北京交通網(wǎng)絡(luò)數(shù)據(jù)上展示出了SRCN 模型優(yōu)越性.
盡管上述方法引入了CNN 來捕獲空間依賴,在交通預(yù)測(cè)任務(wù)上有很大的進(jìn)步,但CNN 本質(zhì)上只適用于歐氏空間,在有著復(fù)雜拓?fù)浣Y(jié)構(gòu)的交通網(wǎng)絡(luò)上具有局限性,因此,這類方法有缺陷.近年以來,隨著圖卷積神經(jīng)網(wǎng)絡(luò)的發(fā)展,圖卷積神經(jīng)網(wǎng)絡(luò)(GCN)能夠被有效提取網(wǎng)格數(shù)據(jù)的的空間特征,為上述問題提供更好的解決方案.
在這一背景下,本文提出了一種新的深度學(xué)習(xí)模型:基于注意力機(jī)制的時(shí)空?qǐng)D卷積網(wǎng)絡(luò),可以從交通數(shù)據(jù)中捕獲復(fù)雜的時(shí)空特征,將其用于基于城市路網(wǎng)的交通預(yù)測(cè)任務(wù)上.與其他模型相比,A-TGCN 不僅可以捕捉空間形態(tài)和時(shí)間動(dòng)力學(xué)的判別特征,而且可以探索時(shí)空域之間的共生關(guān)系.
在本文中,交通預(yù)測(cè)的目標(biāo)是基于道路上的歷史交通信息來預(yù)測(cè)未來某段時(shí)間內(nèi)的交通信息.本文將交通速度作為實(shí)驗(yàn)中的一個(gè)預(yù)測(cè)對(duì)象.
定義1.路網(wǎng)G.用圖G=(V,E)來描述路網(wǎng)的拓?fù)浣Y(jié)構(gòu),將每條道路視為一個(gè)節(jié)點(diǎn),V就是道路節(jié)點(diǎn)的集合,V={v1,v2,···,vN},N為頂點(diǎn)數(shù),E為邊集.鄰接矩陣A=RN×N用來表示道路之間的關(guān)系.鄰接矩陣只包含0 和1.如果道路之間直接連接就設(shè)為1,如果沒有直接連接就設(shè)為0[9].
定義2.特征矩陣XN×P.將道路網(wǎng)絡(luò)中的每條道路上的速度視為道路網(wǎng)絡(luò)中節(jié)點(diǎn)的屬性特征,表示為X∈RN×P.其中P表示各個(gè)節(jié)點(diǎn)特征的數(shù)量(歷史時(shí)間序列的長(zhǎng)度),Xt∈RN×i用來表示在時(shí)刻i時(shí)每條道路的速度.
可以將時(shí)空交通預(yù)測(cè)的問題視為在確定了道路網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)G和特征矩陣X的前提下學(xué)習(xí)一個(gè)映射函數(shù),然后計(jì)算下一個(gè)T時(shí)刻的交通信息,模型表示為:
其中,n表示歷史時(shí)間序列的長(zhǎng)度,T表示需要預(yù)測(cè)的時(shí)間序列的長(zhǎng)度.
獲取復(fù)雜的空間依賴在交通預(yù)測(cè)中是一個(gè)關(guān)鍵性問題.傳統(tǒng)的CNN 只能應(yīng)用于歐氏空間,比如說圖片,常規(guī)網(wǎng)格等.但是城市路網(wǎng)并不是網(wǎng)格,CNN 不能反映其中復(fù)雜的拓?fù)浣Y(jié)構(gòu).近年來被提出的GCN 可以處理圖結(jié)構(gòu),GCN 的原理是在傅里葉域中構(gòu)建濾波器,作用在頂點(diǎn)及其一階鄰居上,捕獲頂點(diǎn)間的空間特征,可以通過堆疊多個(gè)卷積層來構(gòu)建 GCN 模型.GCN 模型可以獲取中心道路及其周圍道路的拓?fù)潢P(guān)系,以獲取空間依賴.總之,本文使用 GCN 模型[10]從交通數(shù)據(jù)中提取空間特征.對(duì)于本文,GCN 模型可以表示為:
式中,X表示特征矩陣,A表示鄰接矩陣,=A+IN是一個(gè)具有自連接結(jié)構(gòu)的矩陣,表示一個(gè)預(yù)處理的步驟,是 一個(gè)度矩陣,W0表示GCN的權(quán)重矩陣,σ (·)是激活函數(shù).
獲取時(shí)間依賴是交通預(yù)測(cè)中的另一個(gè)關(guān)鍵問題.目前,用于處理序列數(shù)據(jù)被最廣泛使用的是遞歸神經(jīng)網(wǎng)絡(luò)(RNN).但是,由于梯度消失和梯度爆炸等缺陷,傳統(tǒng)的遞歸神經(jīng)網(wǎng)絡(luò)對(duì)長(zhǎng)期預(yù)測(cè)具有局限性.
LSTM 模型是RNN 模型的變體,并且已被證明可以解決上述問題.LSTM 的基本原理是使用門控機(jī)制來記憶盡可能多的長(zhǎng)期信息,因此選用LSTM 模型為基礎(chǔ)進(jìn)行改進(jìn),從交通數(shù)據(jù)中獲取時(shí)間依賴.
基本LSTM 模型如圖1所示.
圖1 LSTM 模型
圖1中ht?1表示t?1時(shí) 刻的輸出同時(shí)也是t時(shí)刻的輸入.ct?1表示t?1時(shí)刻的細(xì)胞狀態(tài),會(huì)各個(gè)時(shí)刻一直前向傳遞.Xt表示t時(shí)刻從外界接受的輸入,ft為遺忘門,it和jt為輸入門,ot為輸出門.LSTM 模型就是通過ft,it等4 個(gè)門控邏輯單元實(shí)現(xiàn)對(duì)時(shí)間序列的記憶和預(yù)測(cè).
經(jīng)過改進(jìn)后的LSTM 模型如圖2所示.
圖2 改進(jìn)的LSTM 模型
將c細(xì)胞狀態(tài)隱藏在每一個(gè)改進(jìn)的LSTM 細(xì)胞中,使其包含于每個(gè)時(shí)間序列輸出的ht中,將LSTM 中的ft,it和jt合并為重置門rt和更新門ut,并且更換了激活函數(shù).具體的計(jì)算過程如下:
式中,σ (.),relu(.) 和t anh(.)為 激活函數(shù),W和b為訓(xùn)練過程中的權(quán)重和偏置.
rt用來將上一個(gè)細(xì)胞的狀態(tài)和當(dāng)前細(xì)胞的狀態(tài)融合;ut用來控制遺忘哪些信息并把新的信息傳入當(dāng)前細(xì)胞;ct用來將rt和ut融合,形成當(dāng)前細(xì)胞的輸出.
改進(jìn)后的LSTM 模型擁有更少的輸入和輸出以及門控邏輯單元,能夠擁有更好的時(shí)間復(fù)雜度.并且調(diào)整了激活函數(shù),實(shí)驗(yàn)結(jié)果表明其能夠更好地挖掘圖拓?fù)浣Y(jié)構(gòu)的數(shù)據(jù).
為了從交通數(shù)據(jù)中同時(shí)捕獲時(shí)間和空間依賴性,我們提出了一種基于圖卷積神經(jīng)網(wǎng)絡(luò)和改進(jìn)的LSTM模型的基于注意力機(jī)制的時(shí)間圖卷積模型(A-TGCN).
A-TCN 模型有3 個(gè)部分:圖卷積網(wǎng)絡(luò),改進(jìn)的LSTM 以及注意力機(jī)制.一方面利用圖卷積網(wǎng)絡(luò)來捕捉城市道路網(wǎng)的拓?fù)浣Y(jié)構(gòu),從而得到空間相關(guān)性.另一方面,利用門控邏輯單元捕捉道路上交通信息的動(dòng)態(tài)變化,獲取時(shí)間相關(guān)性.本文的模型使用圖卷積網(wǎng)絡(luò)算子來替換循環(huán)神經(jīng)網(wǎng)絡(luò)中的門控邏輯單元,與Ling 等人[11]所提出的T-GCN 相比,該模型在捕捉空間特征的同時(shí)將其融合進(jìn)入時(shí)間特征中,使得空間特征在隨著時(shí)間序列的推進(jìn)過程中產(chǎn)生關(guān)聯(lián)性.相比于先進(jìn)行空間特征捕捉,再進(jìn)行時(shí)間特征捕捉的模型,該模型減弱了由于傳遞過程中所造成的信息丟失所產(chǎn)生的誤差逐漸放大的現(xiàn)象,并且在每個(gè)A-TGCN 模塊中加入了注意力機(jī)制,使得該模型在每個(gè)時(shí)間段能夠?qū)β肪W(wǎng)上節(jié)點(diǎn)的信息進(jìn)行動(dòng)態(tài)的聚焦,從而提升了模型的泛化能力,也讓該模型在進(jìn)行長(zhǎng)時(shí)間交通信息預(yù)測(cè)是擁有更好的性能.
模型的結(jié)構(gòu)如圖3所示,其中Xt?1表示t?1時(shí)刻的一個(gè)輸入,Yt?1表示t?1時(shí) 刻的預(yù)測(cè)結(jié)果,ht?1和表示t?1時(shí) 刻的輸出同時(shí)也是t時(shí)刻的一個(gè)輸入.
圖3 A-TGCN 模型的結(jié)構(gòu)
圖3中的LS-GCN 細(xì)胞就是通過結(jié)合GCN,改進(jìn)的LSTM 以及注意力機(jī)制相融合,提出的新的網(wǎng)絡(luò)模型.A-TGCN 和改進(jìn)的LSTM 一樣包含3 個(gè)門:重置門rt,更新門rt和輸出門ot.但是,這些門控循環(huán)邏輯單元都是由式(2)的圖卷積算子得到的,A-TGCN 細(xì)胞的具體結(jié)構(gòu)如圖4所示.
圖4中ht?1和Xt為t時(shí)刻的輸入.gc表示圖卷積過程,ut和rt為更新門和重置門,ct為隱含的細(xì)胞狀態(tài)更新.具體的計(jì)算公式如下所示:
式中,σ (.),relu(.) 和t anh(.)為 激活函數(shù),f(·)為式(2)中定義的圖卷積過程,W和b是各個(gè)門控單元中的權(quán)重和偏置,為可訓(xùn)練參數(shù).
fatt(·)是一種能夠選擇關(guān)鍵節(jié)點(diǎn)信息的注意機(jī)制網(wǎng)絡(luò).fatt(ht)和ht的總和作為輸出的目的是在不削弱非聚焦節(jié)點(diǎn)信息的前提下,增強(qiáng)關(guān)鍵節(jié)點(diǎn)的信息,保持空間信息的完整性.
圖4 A-TGCN 細(xì)胞的具體結(jié)構(gòu)
通過GCN 和門控邏輯單元模塊所獲取到的為包含空間特征的時(shí)間序列信息.這就意味著,在時(shí)間序列中,路網(wǎng)中的信息一直在動(dòng)態(tài)的變化,所以在不同的時(shí)間點(diǎn)對(duì)于路網(wǎng)中各個(gè)節(jié)點(diǎn)的關(guān)注權(quán)重是不同的.但是,在每個(gè)時(shí)刻,應(yīng)該全局性的關(guān)注路網(wǎng)上的每個(gè)節(jié)點(diǎn),而不是單獨(dú)的幾個(gè)節(jié)點(diǎn),因此,本文通過使用Soft-attention[12]機(jī)制,它能夠?qū)τ谳斎氲男蛄刑崛〉奶卣餍畔?尋找其內(nèi)部聯(lián)系,從不同時(shí)間點(diǎn)的路網(wǎng)信息中自適應(yīng)的衡量各個(gè)節(jié)點(diǎn)的重要程度.
本文使用的注意力網(wǎng)絡(luò)的結(jié)構(gòu)如圖5所示.首先,將t時(shí)刻所以節(jié)點(diǎn)的信息聚合為一個(gè)向量.這里的信息包含t時(shí)刻路網(wǎng)的空間特征和節(jié)點(diǎn)信息.
圖5中qt即為t時(shí)刻所有節(jié)點(diǎn)信息的聚合.
式中,W為可訓(xùn)練參數(shù),hti表示t時(shí)刻路網(wǎng)上第i個(gè)節(jié)點(diǎn)的第一個(gè)隱含狀態(tài).
那么所有節(jié)點(diǎn)的注意力分?jǐn)?shù)的計(jì)算方法如式(13)所示:
其中,αt=(αt1,αt2,···,αtN),其中αti表示t時(shí)刻第i個(gè)節(jié)點(diǎn)相對(duì)于的注意力分?jǐn)?shù).Us,Wh和Wq為可訓(xùn)練參數(shù),bs和bu為偏置.
該注意力機(jī)制將t時(shí)刻所有節(jié)點(diǎn)聚合后的信息與t時(shí)刻所有節(jié)點(diǎn)的信息進(jìn)行拼接,再通過全連接層,從而得到各個(gè)節(jié)點(diǎn)相對(duì)于全部節(jié)點(diǎn)的的注意力權(quán)重.因?yàn)榻鉀Q的是非線性關(guān)系,所以本文采用了兩層全連接層的結(jié)構(gòu).可能存在多個(gè)關(guān)鍵節(jié)點(diǎn),本文使用S igmoid作為最后一層的激活函數(shù).
因此t時(shí)刻第i個(gè)節(jié)點(diǎn)的第2 個(gè)隱含狀態(tài)Hti可以表示為(1+αti)·hti.第2 隱含狀態(tài)包含時(shí)間信息,以及在空間特征下被注意力機(jī)制增強(qiáng)的節(jié)點(diǎn)信息,Hti將被送入下一個(gè)A-TGCN 層.
圖5 注意力機(jī)制結(jié)構(gòu)圖
在訓(xùn)練過程中,目標(biāo)是使道路上的實(shí)際交通速度與預(yù)測(cè)值之前的誤差最小.本文使用Yt和分別來表示實(shí)際的交通速度和預(yù)測(cè)速度,A-TGCN 的損失函數(shù)如式(15)所示:
式中,第一項(xiàng)用來最小化實(shí)際車速和預(yù)測(cè)值之間的誤差,第二項(xiàng)Lreg表示L2 正則化項(xiàng),有助于避免過擬合問題,λ為一個(gè)超參數(shù).
為了檢驗(yàn)A-TGCN 模型的性能,構(gòu)建交通流預(yù)測(cè)系統(tǒng)并選取城市道路歷史平均速度進(jìn)行測(cè)試,將ATGCN 模型和其他經(jīng)典模型的預(yù)測(cè)結(jié)果進(jìn)行比較,來分析模型的優(yōu)劣.
實(shí)驗(yàn)選取了兩個(gè)真實(shí)世界數(shù)據(jù)集SZ-taxi 數(shù)據(jù)集和Los-loop 數(shù)據(jù)集來評(píng)估A-TGCN 模型的預(yù)測(cè)性能.
SZ-taxi:該數(shù)據(jù)集為深圳市2015年1月1日至2015年1月31日的出租車軌跡.選擇羅湖區(qū)156 個(gè)主要道路為研究區(qū).實(shí)驗(yàn)數(shù)據(jù)包括兩部分:一個(gè)是156×156 鄰接矩陣,描述了道路之間的空間關(guān)系.每行代表一條道路,矩陣中的值代表道路之間的連通性.另一個(gè)是特征矩陣,它描述了每條道路上的速度隨時(shí)間的變化.每行代表一條道路;每列是不同時(shí)段道路上的交通速度.每15 分鐘匯總一條道路的交通速度.從中選取一條道路上的速度如圖6所示.(2)Los-loop:該數(shù)據(jù)集是在洛杉磯市的高速公路上實(shí)時(shí)收集的數(shù)據(jù).從2012年3月1日到2012年3月7日,每5 分鐘匯總一次交通流量.和SZ-taxi 數(shù)據(jù)集類似,數(shù)據(jù)分為鄰接矩陣和特征矩陣兩部分.從中選取一條道路上的速度如圖7所示.
圖6 深圳數(shù)據(jù)中一條道路的速度隨時(shí)間變化圖
圖7 Los-loop 數(shù)據(jù)中一條道路的速度隨時(shí)間變化圖
在實(shí)驗(yàn)中,將數(shù)據(jù)預(yù)處理,輸入數(shù)據(jù)被標(biāo)準(zhǔn)化在[0,1]之間.其中,80%的數(shù)據(jù)用作訓(xùn)練集,20%的數(shù)據(jù)用作測(cè)試集.將預(yù)測(cè)接下來的15 分鐘、30 分鐘、45 分鐘和60 分鐘的交通速度.
為了評(píng)估A-TGCN 的預(yù)測(cè)性能,使用2 個(gè)指標(biāo)來評(píng)估實(shí)際交通情況Yt和預(yù)測(cè)值之間的誤差,包括:
(1)RMSE:
(2)Accuracy:
其中,RMS E用于衡量預(yù)測(cè)誤差,它的值越小,表示此模型的預(yù)測(cè)效果就越好.Accuracy用于衡量模型預(yù)測(cè)精度,它的值越大,預(yù)測(cè)效果越好.
A-TGCN 模型的參數(shù)主要包括:學(xué)習(xí)率,訓(xùn)練次數(shù)以及隱藏層數(shù).在實(shí)驗(yàn)中,將學(xué)習(xí)率設(shè)置為0.001,將訓(xùn)練次數(shù)設(shè)定為1000 次.
隱藏單元的數(shù)量對(duì)于A-TGCN 模型是非常重要的參數(shù),不同的隱藏單元會(huì)影響預(yù)測(cè)精度.為了選擇最佳值,嘗試使用不同的隱藏單位,通過模型RMS E和Accuracy來選擇最佳值.
在實(shí)驗(yàn)中,對(duì)于SZ-taxi 數(shù)據(jù)集,使用二分法來尋找最優(yōu)的隱藏單元的數(shù)量,并分析預(yù)測(cè)精度的變化.如圖8所示,橫軸表示隱藏單元的數(shù)量,縱軸表示RMS E和Accuracy的變化.可以看出,當(dāng)隱藏單元數(shù)量為64時(shí),RMSE最小,Accuracy最大.因此,我們?cè)趯?shí)驗(yàn)中將SZ-taxi 數(shù)據(jù)隱藏單元數(shù)量設(shè)置為64.
圖8 SZ-taxi 數(shù)據(jù)不同隱含單元數(shù)量對(duì)應(yīng)的模型效果比較
對(duì)于Los-loop 的數(shù)據(jù)也使用相同的方法.經(jīng)過實(shí)驗(yàn)發(fā)現(xiàn),當(dāng)隱藏單元數(shù)為16 時(shí),預(yù)測(cè)精度最高,而預(yù)測(cè)誤差最低.所以最終將Los-loop 數(shù)據(jù)隱藏單元數(shù)量設(shè)置為16.
本文將A-TGCN 模型的性能與以下模型進(jìn)行比較:
(1)SVR:該模型通過使用歷史數(shù)據(jù)來訓(xùn)練模型,并獲得輸入和輸出之間的關(guān)系,來對(duì)未來交通數(shù)據(jù)來進(jìn)行預(yù)測(cè).
(2)ARIMA:將時(shí)間序列擬合到參數(shù)模型中來預(yù)測(cè)未來的交通數(shù)據(jù).
(3)LSTM+GCN:?jiǎn)渭兪褂瞄L(zhǎng)短期網(wǎng)絡(luò)和圖卷積神經(jīng)網(wǎng)絡(luò),捕獲時(shí)間和空間特征進(jìn)行預(yù)測(cè).
(4)T-GCN:使用GCN 和GRU,先使用GCN 捕捉空間信息,再送入使用GRU 捕捉空間信息.
表1和表2顯示了在SZ-taxi 和Los-loop 數(shù)據(jù)集上分別進(jìn)行15 分鐘,30 分鐘,45 分鐘和60 分鐘預(yù)測(cè)的A-TGCN 模型和其他模型上的結(jié)果.可以看出,ATGCN 模型在評(píng)估范圍內(nèi)均獲得了良好的預(yù)測(cè)性能,證明了A-TGCN 模型在時(shí)空交通量預(yù)測(cè)中的有效性.
表1 A-TGCN 模型和其他方法在SZ-taxi 數(shù)據(jù)集上的預(yù)測(cè)結(jié)果
表2 A-TGCN 模型和其他方法在Los-loop 數(shù)據(jù)集上的預(yù)測(cè)結(jié)果
從表1和表2中能夠發(fā)現(xiàn):
(1)預(yù)測(cè)精度:基于神經(jīng)網(wǎng)絡(luò)的模型,包括T-GCN模型,A-TGCN 模型等方法,一般都比SVR,ARIMA 等傳統(tǒng)機(jī)器學(xué)習(xí)算法具有更好的預(yù)測(cè)精度.例如,對(duì)于深圳數(shù)據(jù)15 min 的交通量預(yù)測(cè)任務(wù),A-TGCN 模型的RMSE 誤差比SVR 模型降低了約10%,準(zhǔn)確率比SVR模型提高了約24%.這主要是由于SVR 模型和ARIMA模型難以處理復(fù)雜,非平穩(wěn)的時(shí)間序列數(shù)據(jù),因?yàn)锳RIMA是通過計(jì)算各節(jié)點(diǎn)誤差并求平均值來計(jì)算的,如果時(shí)間的波動(dòng)較大,也將增加最終預(yù)測(cè)的總誤差.GCN 模型預(yù)測(cè)效果差的原因是因?yàn)镚CN 只考慮了空間特征,忽略了交通數(shù)據(jù)的時(shí)間特征.
(2)在Los-loop 數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果比在SZ-taxi 數(shù)據(jù)上的要好.經(jīng)過推測(cè),主要原因是GCN 模型在傅立葉域中定義了一個(gè)平滑的濾波器,并通過不斷移動(dòng)濾波器來捕獲空間特征,所以在處理更加平滑的數(shù)據(jù)時(shí),會(huì)具有更好的效果.從圖6和圖7,以及GCN 模型分別在兩個(gè)數(shù)據(jù)上的預(yù)測(cè)結(jié)果,可以看出,Los-loop 數(shù)據(jù)更加的平滑,總體的預(yù)測(cè)結(jié)果也越好.
(3)LSTM-GCN 模型相比于T-GCN 模型和ATCN 模型在進(jìn)行長(zhǎng)時(shí)間的預(yù)測(cè)時(shí)的能力下降的更快.本文分析,主要是因?yàn)長(zhǎng)STM-GCN 模型沒有對(duì)時(shí)間和空間特征進(jìn)行聯(lián)合的特征挖掘,而是分步進(jìn)行,這就導(dǎo)致了在較長(zhǎng)的時(shí)間序列的數(shù)據(jù)的傳遞過程中不可避免地出現(xiàn)信息的丟失,時(shí)間越長(zhǎng),丟失的信息就越多,最終的預(yù)測(cè)結(jié)果造成較大的誤差.
(4)T-GCN 相比于A-TGCN 模型在長(zhǎng)時(shí)間序列的預(yù)測(cè)方面的能力也有所下降,特別是對(duì)未來60 分鐘的交通流進(jìn)行預(yù)測(cè)時(shí),TGCN 模型的準(zhǔn)確率衰減的較為厲害.本文認(rèn)為,首先,相比于T-GCN 只是將GCN 模型挖掘出的空間特征在GRU 中聯(lián)合計(jì)算,A-TGCN 模型是將GCN 模型集成于循環(huán)神經(jīng)網(wǎng)絡(luò)中,使得空間特征隨著時(shí)間序列的推移實(shí)現(xiàn)了不同時(shí)刻的空間特征的動(dòng)態(tài)關(guān)聯(lián)性,增強(qiáng)了信息傳遞的時(shí)空依賴性,其次,ATGCN 模型在每個(gè)A-TGCN 細(xì)胞中加入了注意力機(jī)制,使得神經(jīng)網(wǎng)絡(luò)能夠具備專注于輸出信息中的重要特征的能力,從而使得重要的特征能夠一直傳遞下去.
本文提出了一種新的基于神經(jīng)網(wǎng)絡(luò)以及注意力機(jī)制相結(jié)合的交通預(yù)測(cè)方法,稱為A-TGCN.一方面,GCN 用于捕獲路網(wǎng)的拓?fù)浣Y(jié)構(gòu)以獲取空間依賴性;另一方面,改進(jìn)的LSTM 模型用于捕獲節(jié)點(diǎn)屬性的時(shí)間動(dòng)態(tài)變化以獲得時(shí)間依賴性.最終,使用Soft-attention機(jī)制來自適應(yīng)聚焦于關(guān)鍵節(jié)點(diǎn),增強(qiáng)預(yù)測(cè)效果.
在兩個(gè)真實(shí)的交通數(shù)據(jù)集上進(jìn)行評(píng)估,在與ARIMA模型、SVR 模型、GCN 模型,LSTM+GCN 以及TGCN 模型進(jìn)行比較后,A-TGCN 模型無論在長(zhǎng)期還是短期的交通速度預(yù)測(cè)能力都優(yōu)于這幾種算法,也更加接近真實(shí)的數(shù)據(jù).總之,A-TGCN 模型可以成功地從交通數(shù)據(jù)中捕獲時(shí)空特征,并且不僅局限于交通速度預(yù)測(cè),還可以應(yīng)用于其他的時(shí)空序列預(yù)測(cè)的任務(wù).