張曉晗,馮愛(ài)民,2*
(1.南京航空航天大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,南京 210000;2.南京航空航天大學(xué)人工智能學(xué)院,南京 210000)
隨著社會(huì)經(jīng)濟(jì)發(fā)展,私家車和人均汽車保有量激增,交通擁堵問(wèn)題日益嚴(yán)重,交通管理部門面對(duì)當(dāng)前交通壓力,提出兩種有效解決方案:其一,可通過(guò)擴(kuò)大車道數(shù)量以增大道路汽車容量。但由于額外的土地成本和政府巨額支出,通常在許多地區(qū)并不可行?;诖耍褂昧髁靠刂撇呗砸杂行Ю矛F(xiàn)有道路網(wǎng)絡(luò)成為主要技術(shù)手段,不僅開(kāi)支較低且多數(shù)情況下均可行,因此更為實(shí)用。本文提出一種流量控制策略以合理分配交通資源,從而節(jié)省時(shí)間并避免交通擁堵。
本文的主要工作如下:
1)長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)解決了數(shù)據(jù)長(zhǎng)期依賴問(wèn)題,通過(guò)尋找長(zhǎng)短期記憶(Long Short-Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)最優(yōu)參數(shù),可提高交通時(shí)序數(shù)據(jù)預(yù)測(cè)準(zhǔn)確性;
2)將原始交通數(shù)據(jù)流經(jīng)過(guò)經(jīng)驗(yàn)?zāi)B(tài)分解(Empirical Mode Decomposition,EMD)降噪,降低交通數(shù)據(jù)噪聲對(duì)預(yù)測(cè)的影響;
3)應(yīng)用在實(shí)際交通數(shù)據(jù)集的實(shí)驗(yàn)結(jié)果表明提出的EMDLSTM算法可有效提高交通數(shù)據(jù)預(yù)測(cè)精度。
目前,基于流量控制策略人們提出了大量的流量預(yù)測(cè)模型,以關(guān)注不同模型結(jié)構(gòu)的預(yù)測(cè)性能,它們可以分為兩類:參數(shù)方法和非參數(shù)方法。參數(shù)方法包括歷史平均值[1]、灰色預(yù)測(cè)模型[2]、指數(shù)平滑方法[3]、卡爾曼濾波方法[4-6]、自回歸綜合移動(dòng)平均值(AutoRegressive Integrated Moving Average,ARIMA)[7]模型、季節(jié)性自回歸綜合移動(dòng)平均值(Seasonal AutoRegressive Integrated Moving Average,SARIMA)[8]、多元時(shí)間序列模型[9-10]、頻譜分析[11-12]和結(jié)構(gòu)時(shí)間序列模型[13]等。而非參數(shù)模型包括人工神經(jīng)網(wǎng)絡(luò)(Artificial Neutral Network,ANN)[14]、非參數(shù)回歸模型[15]、模糊邏輯系統(tǒng)方法[16-17]、支持向量回歸(Support Vector Regression,SVR)[18-20]等。這些算法在某些特定應(yīng)用中表現(xiàn)出高性能,然而也各自有局限性,比如當(dāng)交通狀況急劇變化時(shí),歷史平均方法在應(yīng)對(duì)意外事件方面具有關(guān)鍵缺陷;卡爾曼濾波方法容易產(chǎn)生過(guò)沖,從而降低預(yù)測(cè)精度值。非參數(shù)法中如劉明宇等[21]、羅文慧等[22]基于深度學(xué)習(xí)的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),交叉驗(yàn)證法了非參數(shù)模型的預(yù)測(cè)性能,具有較高的精準(zhǔn)度。而非參數(shù)模型采用未指定數(shù)量的參數(shù)來(lái)隱式存儲(chǔ)交通數(shù)據(jù)的微妙方面,由于運(yùn)輸系統(tǒng)的外部環(huán)境復(fù)雜以及交通系統(tǒng)時(shí)空變化的不確定性,從檢測(cè)器收集的原始交通數(shù)據(jù)可能會(huì)受到一些不可觀察的因素干擾,這些干擾,稱之為噪聲,非參數(shù)模型不可避免地包括噪聲,這些噪聲將導(dǎo)致交通流量預(yù)測(cè)的可靠性和準(zhǔn)確性下降,嚴(yán)重影響預(yù)測(cè)性能,所以非參數(shù)模型需要更多的時(shí)間和計(jì)算量來(lái)學(xué)習(xí)最佳參數(shù)。
因此,原始數(shù)據(jù)增加去噪過(guò)程是提高交通流量預(yù)測(cè)準(zhǔn)確度的有效手段。本文提出了一種短期交通預(yù)測(cè)算法稱之為EMD-LSTM,可預(yù)測(cè)短期內(nèi)的交通量,經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)可以幫助確定復(fù)雜的非線性時(shí)間序列的特征,將原始時(shí)間序列信號(hào)分解為少量的振蕩模式以達(dá)到降噪目的,這些振蕩模式可以表示為某些本征模函數(shù)(Intrinsic Mode Function,IMF)和殘差,IMF 和殘差會(huì)保留原始信號(hào)的非周期性趨勢(shì)以及任何周期性波動(dòng)。長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)在長(zhǎng)時(shí)間視野預(yù)測(cè)方面較其他通用的機(jī)器學(xué)習(xí)算法如ARIMA、ANN 等表現(xiàn)更為突出。
本章主要介紹實(shí)驗(yàn)方法以及原理,包括經(jīng)驗(yàn)?zāi)B(tài)分解以及長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)。
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是一種將瞬時(shí)數(shù)據(jù)分解為多個(gè)本征模函數(shù)(IMF)和一個(gè)殘差r(t)同時(shí)獲得瞬時(shí)頻率模式的方法,這是Huang 等[23]在1998 年提出的一種時(shí)頻分析的自適應(yīng)方法。EMD 不僅突破了傅里葉變換的局限性,而且在確定小波基函數(shù)時(shí)避免了小波變換的主要問(wèn)題。EMD 具有良好的時(shí)頻分辨率和適應(yīng)性,能夠完美地重建原始信號(hào),同時(shí)具有突出信號(hào)中可能忽略的精細(xì)結(jié)構(gòu)的潛力。在噪聲抑制方面,EMD可以在將包含噪聲的信號(hào)分解后,將噪聲和有效信號(hào)分離為不同的本征模式函數(shù)和殘差,IMF 分量反映了原始時(shí)間序列的不同時(shí)間尺度的振蕩特性,殘差反映了原始數(shù)據(jù)的長(zhǎng)期趨勢(shì)。也可以通過(guò)合理選擇IMF來(lái)重構(gòu)信號(hào)來(lái)達(dá)到消除噪聲的目的。分解后的IMF與原始交通數(shù)據(jù)序列相比具有更強(qiáng)的規(guī)律性,去除了一定噪聲影響。EMD 已應(yīng)用于圖像分析[24]、短期負(fù)荷數(shù)據(jù)降噪[25]、變速箱故障診斷[26]等許多領(lǐng)域,經(jīng)驗(yàn)?zāi)B(tài)分解方法完全基于順序數(shù)據(jù)的固有信息,不同于傅里葉變換以及小波變換,該方法無(wú)需任何預(yù)定義的模式,并由于其具有數(shù)據(jù)自適應(yīng)功能而取得了巨大的成功。EMD 方法可以處理分析非線性、非平穩(wěn)數(shù)據(jù),這對(duì)于探索交通預(yù)測(cè)模型的隱藏時(shí)間序列關(guān)系起了至關(guān)重要的作用,該方法有助于揭示復(fù)雜的非線性時(shí)間序列的特征。IMF由以下步驟確定。
對(duì)于原始時(shí)序數(shù)據(jù)x0(t),根據(jù)其上下極值點(diǎn),分別確定其上包絡(luò)線u0(t)和下包絡(luò)線l0(t),如圖1所示。
圖1 原始信號(hào)的上下包絡(luò)線Fig.1 Upper and lower envelopes of original signal
a)平均包絡(luò)線m0(t)是上包絡(luò)線與下包絡(luò)線的平均值,通過(guò)計(jì)算原始數(shù)據(jù)x0(t)和平均包絡(luò)線m0(t)的差異,得出第一個(gè)IMF,即c0(t)以及第一個(gè)殘差r0(t)。
b)殘差r0(t)將會(huì)作為下一輪的原始數(shù)據(jù),返回式(1)、(2)計(jì)算,得到一系列殘差,如式(4)所示,原始數(shù)據(jù)將被分解成一系列IMF和一個(gè)殘差rn:
LSTM 神經(jīng)網(wǎng)絡(luò)是一種特殊類型的遞歸神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN)架構(gòu),以解決長(zhǎng)期依賴問(wèn)題。LSTM神經(jīng)網(wǎng)絡(luò)在確定時(shí)間序列之間的影響的基礎(chǔ)上,在長(zhǎng)時(shí)間預(yù)測(cè)方面比其他非參數(shù)模型表現(xiàn)更好。長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)引入了三個(gè)門來(lái)控制和保護(hù)存儲(chǔ)單元中的信息。門定義為輸入門、輸出門和遺忘門,每個(gè)門的狀態(tài)由變量通過(guò)梯度下降的訓(xùn)練來(lái)控制。LSTM模型中的每個(gè)門都有獨(dú)特的功能,遺忘門以一定的概率控制是否遺忘上一層的細(xì)胞狀態(tài)h(t-1),而輸入和輸出門控制輸入數(shù)據(jù)的流動(dòng)方向。yt的每個(gè)輸出都取決于外部輸入xt和前單元細(xì)胞的輸出yt-1,圖2 為L(zhǎng)STM 細(xì)胞單元更新詳細(xì)過(guò)程。式(5)列出了LSTM 更新公式,運(yùn)算符和×和+表示矩陣與元素的乘法和加法,Wi(i=f,h,u,o)是Ri(i=f,h,u,o) 對(duì)應(yīng)門的權(quán)重度量,相應(yīng)偏差是bi(i=f,h,u,o)。
圖2 LSTM細(xì)胞單元更新詳細(xì)過(guò)程Fig.2 Detailed process of LSTM cell unit update
本章將原始數(shù)據(jù)進(jìn)行了經(jīng)驗(yàn)?zāi)B(tài)分解,根據(jù)分解得到的IMF以及殘差構(gòu)建了基于EMD-LSTM預(yù)測(cè)模型。
使用圖3 所示的EMD-LSTM 預(yù)測(cè)模型,實(shí)現(xiàn)步驟如下所示:
圖3 LSTM-EMD預(yù)測(cè)模型Fig.3 LSTM-EMD prediction model
輸入 原始時(shí)序數(shù)據(jù)x0(t)。
以3 個(gè)周期的數(shù)據(jù)為例,原始交替數(shù)據(jù)經(jīng)過(guò)EMD 如圖4所示。從圖4 可以看出:IMF1、IMF2、IMF3 頻率較高,為交通數(shù)據(jù)中高頻分量;IMF4、IMF5、IMF6 周期性明顯,為交通數(shù)據(jù)中低頻分量;殘差R為整體變化趨勢(shì),為交通數(shù)據(jù)中的趨勢(shì)分量。EMD 分解了3 個(gè)周期的交通數(shù)據(jù),表明IMF 比原始數(shù)據(jù)更穩(wěn)定。
圖4 EMD結(jié)果Fig.4 Results of EMD
本章主要介紹實(shí)驗(yàn)數(shù)據(jù)集、實(shí)驗(yàn)評(píng)價(jià)指標(biāo)、實(shí)驗(yàn)設(shè)置,將參數(shù)法ARIMA 和ANN 與LSTM 分別對(duì)比分析,解決數(shù)據(jù)長(zhǎng)期依賴問(wèn)題,將LSTM 與EMD-LSTM 混合模型進(jìn)行對(duì)比預(yù)測(cè),并在不同時(shí)間步中分析預(yù)測(cè)結(jié)果。
本實(shí)驗(yàn)使用加利福尼亞州所有高速公路交通數(shù)據(jù)集,如圖5 所示,其中包含部分路段2000 年至今近20 年的流量監(jiān)測(cè)數(shù)據(jù)。該數(shù)據(jù)集由加州Caltrans 性能測(cè)量系統(tǒng)(PeMS)每30 s實(shí)時(shí)采集一次,截止目前該系統(tǒng)在加州各大城市的高速公路上部署了約4.5 萬(wàn)個(gè)探測(cè)器。數(shù)據(jù)集提供聚合以后的5 min粒度的數(shù)據(jù),主要字段包括流量、速度、占有率等,也包含傳感器站的地理信息。
圖5 加利福尼亞交通數(shù)據(jù)集Fig.5 California traffic dataset
數(shù)據(jù)集部分特征值如表1 所示,時(shí)間一列記錄間隔開(kāi)始的日期和時(shí)間,例如,時(shí)間08:00:00 表示聚合包含在08:00:00和08:04:59之間收集的數(shù)據(jù)信息;方向一列代表公路的方向;道路類型一列表示公路類型,比如ML(Mainline)表示主干道,OR(On Ramp)表示斜道等;車流量一列表示5 min 內(nèi)所有車道的流量總和;車道平均占用率一列表示所有車道的平均占用率,取值為0 到1 之間;平均速度一列表示所有車道在5 min內(nèi)的流量加權(quán)平均速度。
表1 實(shí)驗(yàn)數(shù)據(jù)集部分特征值Tab.1 Some engenvalues of experimental dataset
1)平均絕對(duì)誤差(Mean Absolute Error,MAE)。平均絕對(duì)誤差能更好地反映預(yù)測(cè)值誤差的實(shí)際情況,公式如下:
其中:fi為預(yù)測(cè)值,yi為真實(shí)值。
2)平均絕對(duì)百分誤差(Mean Absolute Percentage Error,MAPE):范圍為[0,+∞),MAPE 越小表示模型效果越好。公式如下:
其中:fi為預(yù)測(cè)值,yi為真實(shí)值。MAPE 只比MAE 多個(gè)分母,MAE考量絕對(duì)誤差,MAPE考量相對(duì)誤差。
當(dāng)使用1 h 的交通數(shù)據(jù)預(yù)測(cè)時(shí)間步長(zhǎng)為1 即5 min 后的交通流量時(shí),表2顯示了LSTM 神經(jīng)網(wǎng)絡(luò)使用不同數(shù)量的層和神經(jīng)單元個(gè)數(shù)時(shí)訓(xùn)練集以及測(cè)試集不同MAPE,可以得出,采用如圖6所示的LSTM 神經(jīng)網(wǎng)絡(luò)(每層有32個(gè)神經(jīng)單元的3層網(wǎng)絡(luò))能夠在訓(xùn)練集上產(chǎn)生非常低的誤差,再持續(xù)增加層數(shù)和神經(jīng)元只會(huì)改善訓(xùn)練集的精度,不僅不會(huì)提高測(cè)試數(shù)據(jù)的性能,還會(huì)增加算法時(shí)間復(fù)雜度,增加模型訓(xùn)練時(shí)長(zhǎng)。為了提高測(cè)試數(shù)據(jù),采用Dropout為正則化方法,優(yōu)化器使用RMSProp[27],損失函數(shù)使用可使模型有效收斂的MSE 指標(biāo),其余參數(shù)包括學(xué)習(xí)速率等使用默認(rèn)參數(shù),迭代1 000次得到訓(xùn)練模型。數(shù)據(jù)集70%用于訓(xùn)練數(shù)據(jù),30%用于測(cè)試。
當(dāng)輸入為12 維、步長(zhǎng)為1 的LSTM 最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)如圖6所示。
圖6 步長(zhǎng)為12的LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.6 LSTM neural network structure with step size of 12
首先解決交通數(shù)據(jù)長(zhǎng)期依賴的問(wèn)題。為了比對(duì)預(yù)測(cè)結(jié)果,此處選用了參數(shù)法ARIMA 和非參數(shù)法ANN 與LSTM 進(jìn)行交通流量預(yù)測(cè),而考慮到實(shí)際應(yīng)用場(chǎng)景,這里使用1 h 的流量數(shù)據(jù)分別預(yù)測(cè)5 min后以及1 h后的流量,結(jié)果如表3所示。
表3 ARIMA、ANN、LSTM交通流量預(yù)測(cè)結(jié)果對(duì)比Tab.3 Comparison of ARIMA,ANN,LSTM traffic flow prediction results
如實(shí)驗(yàn)結(jié)果可見(jiàn),在預(yù)測(cè)5 min的交通時(shí)序數(shù)據(jù)上,LSTM算法的MAE 比ARIMA 以及ANN 的分別低了2.802 19 和0.042 53,MAPE 比ARIMA 以及ANN 的分別低了3.613 48 個(gè)百分點(diǎn)和0.106 個(gè)百分點(diǎn);在預(yù)測(cè)1 h 的交通時(shí)序數(shù)據(jù)上,LSTM 算法的MAE 比ARIMA 以及ANN 的分別低了4.030 49和0.069 4,MAPE比ARIMA以及ANN的分別低了5.323 08個(gè)百分點(diǎn)和0.143 75 個(gè)百分點(diǎn)。ARIMA 算法較為適用于穩(wěn)定交通流量預(yù)測(cè),當(dāng)有外界干擾導(dǎo)致數(shù)據(jù)不穩(wěn)定時(shí)會(huì)使預(yù)測(cè)準(zhǔn)確率降低,非參數(shù)法比參數(shù)法性能更好;LSTM 比ANN 算法預(yù)測(cè)精度更高,而且在長(zhǎng)時(shí)預(yù)測(cè)中較ANN表現(xiàn)也更為突出。
進(jìn)一步降低交通數(shù)據(jù)集的噪聲影響,將2019 年1 月份數(shù)據(jù)的70%作為的訓(xùn)練集,30%作為測(cè)試集,進(jìn)行EMD 得到9個(gè)IMF和1個(gè)殘差,一共10個(gè)分量分別進(jìn)行預(yù)測(cè),使用12 h的數(shù)據(jù)預(yù)測(cè)1 h 后的交通數(shù)據(jù),最后進(jìn)行結(jié)果重構(gòu)。其中1 d 后的預(yù)測(cè)結(jié)果如圖7所示,實(shí)驗(yàn)得到的預(yù)測(cè)指標(biāo)如表4所示。
圖7 LSTM與EMD-LSTM預(yù)測(cè)結(jié)果Fig.7 Prediction results of LSTM and EMD-LSTM
表4 各算法交通流量預(yù)測(cè)效果對(duì)比Tab.4 Comparison of prediction effects of different algorithms
圖7 可以看出,本文所提出的EMD-LSTM 模型的預(yù)測(cè)曲線更接近于原始交通曲線。在噪聲影響較多的時(shí)間段(圖中23:00~5:00)的預(yù)測(cè)準(zhǔn)確性遠(yuǎn)遠(yuǎn)高于單一模型。在表4 中,將通過(guò)降噪處理以及未降噪模型進(jìn)行對(duì)比分析,總體精度性能從表4 中可以明顯看出,EMD-LSTM 的MAE 比LSTM 低了1.916 32,EMD-LSTM 的MAPE 比LSTM 降低了4.645 45 個(gè)百分點(diǎn),混合模型的預(yù)測(cè)效果明顯優(yōu)于單個(gè)LSTM神經(jīng)網(wǎng)絡(luò)。
進(jìn)一步研究表明,通過(guò)重構(gòu)結(jié)果即去除部分本征函數(shù)IMF的影響,如表4所示可進(jìn)一步提高預(yù)測(cè)精度,實(shí)驗(yàn)證明,去除IMF1和IMF2的效果是最好的,比全預(yù)測(cè)結(jié)果重構(gòu)的MAPE降低了0.368 08個(gè)百分點(diǎn),而僅去除IMF2之后的任何一個(gè)本征模函數(shù)都沒(méi)有全I(xiàn)MF 預(yù)測(cè)重構(gòu)預(yù)測(cè)精度高,如圖8 所示。實(shí)驗(yàn)表明EMD 方法將含有噪聲的數(shù)據(jù)分成單獨(dú)的IMF 并確定實(shí)時(shí)序列的總體趨勢(shì),降低了交通數(shù)據(jù)噪聲對(duì)預(yù)測(cè)的影響,從而有效地提高了預(yù)測(cè)性能和模型的魯棒性。
最后為了驗(yàn)證預(yù)測(cè)模型在不同時(shí)間步中的表現(xiàn),使用12 h 的數(shù)據(jù)分別預(yù)測(cè)1 h 后、24 h 后以及48 h 后的交通數(shù)據(jù),結(jié)果如表5所示。
實(shí)驗(yàn)結(jié)果所示,準(zhǔn)確性隨著預(yù)測(cè)時(shí)長(zhǎng)增加而降低,EMDLSTM 混合模型的表現(xiàn)均比LSTM 好,在短期(1 h)預(yù)測(cè)上性能提升最明顯,較中長(zhǎng)期(24 h、48 h)的預(yù)測(cè)準(zhǔn)確性雖有提升,但是不明顯。兩個(gè)不同的預(yù)測(cè)時(shí)間尺度之間的比較表明,雖然LSTM神經(jīng)網(wǎng)絡(luò)可以最大限度地提高原始數(shù)據(jù)的準(zhǔn)確性,可解決所預(yù)測(cè)數(shù)據(jù)依賴長(zhǎng)期的具有時(shí)序性輸入的問(wèn)題,但是在短期預(yù)測(cè)上比長(zhǎng)期預(yù)測(cè)的準(zhǔn)確率要高。
圖8 各算法交通流量預(yù)測(cè)效果對(duì)比Fig.8 Comparison of prediction effects of different algorithms
表5 不同時(shí)間步的交通數(shù)據(jù)預(yù)測(cè)效果對(duì)比Tab.5 Comparison of prediction effects of traffic data with different time steps
本文提出了EMD-LSTM 模型,解決了交通數(shù)據(jù)長(zhǎng)期依賴的問(wèn)題,LSTM在長(zhǎng)時(shí)間視野預(yù)測(cè)方面較參數(shù)法以及其他人工智能方法表現(xiàn)更為突出。對(duì)于高度不穩(wěn)定的交通流量分布,引入降噪算法EMD,以便在進(jìn)行預(yù)測(cè)之前將原始交通數(shù)據(jù)分解為更多固定的分量,這使原始時(shí)間序列信號(hào)分解為固定的振蕩模式以達(dá)到降噪目的,因此只需分別這些分量構(gòu)建合適預(yù)測(cè)模型,重構(gòu)最終預(yù)測(cè)結(jié)果。研究結(jié)果表明,將原始交通數(shù)據(jù)降噪后分別進(jìn)行預(yù)測(cè),預(yù)測(cè)精度明顯優(yōu)于為降噪處理的單一模型。但是準(zhǔn)確性隨著預(yù)測(cè)時(shí)長(zhǎng)增加而降低,短期預(yù)測(cè)的效果最優(yōu)。未來(lái)工作將考慮如何優(yōu)化對(duì)于中長(zhǎng)期的預(yù)測(cè),并且本文研究只考慮了數(shù)據(jù)的時(shí)序性,并沒(méi)有考慮交通數(shù)據(jù)的空間性,未來(lái)工作將考慮如何加入空間性進(jìn)一步提高預(yù)測(cè)精度。