顏秉洋,唐敏佳,周長庚,李銀萍
(山東建筑大學(xué) 信息與電氣工程學(xué)院,濟南 250101)
隨著社會的高速發(fā)展,越來越多的車輛出現(xiàn)在人們的日常生活中,給人們帶來一定程度出行便利的同時,也導(dǎo)致了城市交通的日益擁堵.城市短時交通流預(yù)測作為城市計算[1-3]中的一個重要研究方向,由城市交通大數(shù)據(jù)驅(qū)動,可以大大提高生活效率,提升城市的智能化水平.
短時交通流預(yù)測的研究已經(jīng)發(fā)展了很多年,從統(tǒng)計學(xué)方法到神經(jīng)網(wǎng)絡(luò)方法和模糊系統(tǒng)的方法,交通流預(yù)測越來越精確、適用.統(tǒng)計學(xué)方法是通過對歷史交通流數(shù)據(jù)進(jìn)行線性回歸處理來進(jìn)行交通流預(yù)測的.Sun 等[4]利用局部線性回歸模型對從休斯頓采集到的交通流數(shù)據(jù)進(jìn)行短時預(yù)測.Dang 等[5]采用多元線性自回歸模型進(jìn)行交通流預(yù)測.Williams 等[6,7]根據(jù)季節(jié)性自回歸移動平均(ARIMA)算法建模以便交通流預(yù)測.Tan 等[8]將ARIMA 模型和支持向量機(SVM)模型結(jié)合組成混合模型來預(yù)測交通流.作為樣本學(xué)習(xí)的優(yōu)勢方法,支持向量機在交通流預(yù)測中也有很多應(yīng)用.朱征宇等[9]把卡爾曼濾波和SVM 結(jié)合起來,發(fā)揮兩者的優(yōu)勢來共同預(yù)測短時交通流.文獻(xiàn)[10]中提出了一種將支持向量回歸(SVR)模型用到交通流預(yù)測上的方法,進(jìn)而應(yīng)用到動態(tài)導(dǎo)航系統(tǒng)上.文獻(xiàn)[11]運用SVR 和連續(xù)蟻群算法對城市間交通流量進(jìn)行了預(yù)測.神經(jīng)網(wǎng)絡(luò)方法由于其高效的學(xué)習(xí)能力,在交通流預(yù)測中得到了越來越多的應(yīng)用.Kim 等人[12]結(jié)合混合高斯和神經(jīng)網(wǎng)絡(luò)方法建模,結(jié)合道路和環(huán)境因素進(jìn)行交通流預(yù)測.文獻(xiàn)[13]中通過利用深信度神經(jīng)網(wǎng)絡(luò)(DBN)的方法建模來預(yù)測交通流.文獻(xiàn)[14]中將卷積神經(jīng)網(wǎng)絡(luò)(CNN)和SVR 結(jié)合起來組成預(yù)測交通流的混合模型.但上述方法其模型不具有可解釋性,近年來以規(guī)則刻劃的模糊方法在交通流預(yù)測中得到發(fā)展,特別是和神經(jīng)網(wǎng)絡(luò)有機結(jié)合的模糊神經(jīng)網(wǎng)絡(luò)方法.Yin 等[15]結(jié)合了模糊系統(tǒng)和神經(jīng)網(wǎng)絡(luò)提出一種模糊神經(jīng)模型來預(yù)測街道交通流.Quek 等[16]利用模糊神經(jīng)網(wǎng)絡(luò)模型來預(yù)測交通流,這種模型結(jié)合了模糊推理系統(tǒng)和神經(jīng)網(wǎng)絡(luò),互補的利用兩者的特點來預(yù)測.Chan 等[17]根據(jù)模糊神經(jīng)網(wǎng)絡(luò)和Taguchi 方法相對高精度的預(yù)測道路交通流數(shù)據(jù).
上述研究中采用了各種各樣的模型來預(yù)測交通流,可以看出對于交通流特征學(xué)習(xí)的改進(jìn)方法層出不窮,但是關(guān)于交通流數(shù)據(jù)的固有特性卻一直未能很好的利用.通過觀察交通流的數(shù)據(jù),可以發(fā)現(xiàn)一些關(guān)于交通流周期性的先驗知識,如不同工作日的交通流具有相似的趨勢,即交通流量具有周期性模式.交通流的周期性是城市交通數(shù)據(jù)的重要特征,可以很好的反應(yīng)出城市交通流量的特點,利用這種先驗知識訓(xùn)練交通流預(yù)測模型,可以提高模型的預(yù)測性能.本文將交通流的周期性先驗知識提取出來,獲得交通流殘差數(shù)據(jù),進(jìn)而通過殘差數(shù)據(jù)訓(xùn)練混合模型得到交通流預(yù)測值,通過跟BPNN 模型和普通ANFIS 模型進(jìn)行對比,驗證混合模型的優(yōu)越性.本方法利用ANFIS 結(jié)合交通流周期性的混合模型來預(yù)測短時交通流,即可以充分利用交通流的特性,也可以發(fā)揮ANFIS 適應(yīng)交通流非線性數(shù)據(jù)的特點,可以準(zhǔn)確的預(yù)測城市短時交通流量.該研究基于實際城市交通流數(shù)據(jù)來驗證混合模型的泛化能力,為接下來在其他應(yīng)用方面的研究提供全新的思路.
為了證明混合模型在交通流預(yù)測中的優(yōu)越性,本文用了混合模型跟BPNN 模型和普通ANFIS 模型相比較,ANFIS 模型和BPNN 模型具體內(nèi)容如下:
自適應(yīng)模糊推理系統(tǒng)(ANFIS)是由Jang[18]首次提出的,它有機結(jié)合了模糊推理系統(tǒng)(FIS)和神經(jīng)網(wǎng)絡(luò)(NN),利用神經(jīng)網(wǎng)絡(luò)的框架,通過自適應(yīng)的混合算法在數(shù)據(jù)中提取模糊規(guī)則,進(jìn)而調(diào)整前件參數(shù)和后件參數(shù),獲取最優(yōu)解,既發(fā)揮了FIS 和NN 的優(yōu)點,又彌補了彼此的不足,增強了FIS 的學(xué)習(xí)能力.假定采用規(guī)則庫:
其中,Dsj是輸入變量xj的模糊集,cis(i=0,1,···,n)是模糊規(guī)則R(s)的后件部分.
對應(yīng)該規(guī)則庫的ANFIS 結(jié)構(gòu)如圖1所示.該ANFIS一共有5 層,第一層為模糊化層,將輸入數(shù)據(jù)x1,x2,···,xn經(jīng)過隸屬函數(shù)處理輸出對應(yīng)模糊集的隸屬度,第二層實現(xiàn)前件部分模糊集的運算,輸出為每個規(guī)則的激勵強度,第三層將各個激勵強度歸一化,第四層計算每個模糊規(guī)則的輸出,第五層計算ANFIS 的輸出.
上述ANFIS 輸入輸出關(guān)系可以描述為:
其中,fs(x)和(x)代表激勵強度和歸一化后的激勵強度,其計算公式為:
ANFIS 模型的構(gòu)建過程,首先確定輸入數(shù)據(jù)的模糊劃分和模糊集合類型,然后采用反向傳播算法和線性最小二乘法的混合算法進(jìn)行前件參數(shù)和后件參數(shù)的訓(xùn)練,前件參數(shù)采用反向傳播算法進(jìn)行訓(xùn)練,后件參數(shù)運用最小二乘法進(jìn)行訓(xùn)練.輸入數(shù)據(jù)沿ANFIS 網(wǎng)絡(luò)運算到第四層,固定前件參數(shù),用最小二乘法訓(xùn)練后件參數(shù),信號正向傳遞至輸出層,利用反向傳播算法訓(xùn)練前件參數(shù),循環(huán)迭代至全局最優(yōu).
圖1 ANFIS 結(jié)構(gòu)圖
BPNN 是迄今應(yīng)用范圍最廣泛的人工神經(jīng)網(wǎng)絡(luò)之一,理論上具有無限逼近的能力,在BPNN 中,通常采用反向傳播算法或其變種來確定整個網(wǎng)絡(luò)的權(quán)重.在本文中考慮一個具有L個隱藏層的BPNN,具體結(jié)構(gòu)如圖2所示.
圖2 BPNN 結(jié)構(gòu)圖
BPNN 的輸入輸出關(guān)系可以表示為:
其中,f()為 激活函數(shù),為連接第l層 第i個神經(jīng)元和第l+1j層第 個神經(jīng)元的權(quán)重.
BP 算法會通過最小化平方差公式來獲得最優(yōu)值或者次優(yōu)值,如下式所示:
結(jié)合上述ANFIS 模型和周期性提取方法,本文提出了一個基于ANFIS 混合模型的交通流預(yù)測模型.結(jié)構(gòu)如圖3所示.
圖3 交通流ANFIS 模型
模型訓(xùn)練的步驟如下:
1)提取交通流數(shù)據(jù)周期性信息,從交通數(shù)據(jù)中移除提取的周期性信息,獲得交通流殘差數(shù)據(jù).
2)將交通流殘差數(shù)據(jù)輸入混合模型,利用混合訓(xùn)練方法訓(xùn)練前件、后件參數(shù)以取得最優(yōu)結(jié)果.
3)將訓(xùn)練完的交通流殘差數(shù)據(jù)和交通流周期性信息重新結(jié)合,得到最優(yōu)交通流預(yù)測值.
假設(shè)有M天歷史交通流數(shù)據(jù)Y={Y1,Y2,···,YM},每天有T個檢測點,將交通流數(shù)據(jù)表示為:
對于每天一個周期的周期性信息,提取的方法為:
然后,殘差數(shù)據(jù)可以表示為:
這個部分主要介紹利用混合模型進(jìn)行交通流預(yù)測實驗的細(xì)節(jié)和過程.
本文選用2009年10月1 號到2009年11月30 號的交通流數(shù)據(jù)用來訓(xùn)練和測試,實驗數(shù)據(jù)來源于PeMS(美國加州性能測量系統(tǒng)),數(shù)據(jù)通過探測器每30 秒收集一次.本文用10 分鐘、15 分鐘的時間間隔進(jìn)行交通流預(yù)測實驗,用來驗證模型的性能.初始數(shù)據(jù)如圖4所示.
圖4 原始交通流數(shù)據(jù)圖
模型的預(yù)測性能用均方根誤差(RMSE)、平均絕對誤差(MAE)、平均百分比誤差(APE)三個指標(biāo)來衡量,具體如下:
3.3.1 交通流預(yù)測(10 分鐘間隔)
本文采用的交通流實驗數(shù)據(jù)總共有39 天,前21 天的數(shù)據(jù)作為訓(xùn)練數(shù)據(jù),余下18 天的數(shù)據(jù)作為測試數(shù)據(jù),交通流數(shù)據(jù)每天有144 個10 分鐘間隔的數(shù)據(jù)點,所以訓(xùn)練數(shù)據(jù)有21×144=3024 個,測試數(shù)據(jù)有18×144=2592 個,如圖5(a)所示,周期性數(shù)據(jù)如圖5(b)所示,去除周期性的殘差數(shù)據(jù)如圖5(c).
圖5 交通流數(shù)據(jù)(10 分鐘間隔)
利用殘差數(shù)據(jù)訓(xùn)練混合ANFIS 模型,預(yù)測結(jié)果(10 分鐘間隔)如圖6所示.
圖6 交通流預(yù)測結(jié)果(10 分鐘間隔)
混合模型和其他交通流預(yù)測模型的實驗(10 分鐘間隔),各指標(biāo)對比如表1所示.
表1 不同模型的指標(biāo)對比(10 分鐘間隔)
3.3.2 交通流預(yù)測(15 分鐘間隔)
15分鐘間隔的交通流預(yù)測,交通流訓(xùn)練數(shù)據(jù)有2016 個點,1728 個測試點,原始數(shù)據(jù)如圖7(a)所示,周期性數(shù)據(jù)如圖7(b),殘差數(shù)據(jù)如圖7(c).
將殘差數(shù)據(jù)用來訓(xùn)練本文提出的混合交通流預(yù)測模型,預(yù)測結(jié)果如圖8所示.
混合模型15 分鐘時間間隔的交通流預(yù)測與ANFIS模型和BPNN 模型的預(yù)測指標(biāo)對比如表2所示.
交通流數(shù)據(jù)和二次交通流預(yù)測實驗的預(yù)測值散點圖如圖9所示.
從上述兩個不同時間間隔的交通流預(yù)測實驗中可以得到以下結(jié)論:
1)RMSE、MAE、APE 三個性能衡量參數(shù)越小,證明模型的預(yù)測性能越好.從表1和表2中可以發(fā)現(xiàn)本文提出的混合模型同ANFIS 模型和BPNN 模型相比表現(xiàn)是最好的,充分表明交通流周期性的提取,進(jìn)而利用殘差數(shù)據(jù)訓(xùn)練模型這一方法對與提高交通流預(yù)測精度的重要性.預(yù)測準(zhǔn)確率提升情況如表3所示.
圖7 交通流數(shù)據(jù)(15 分鐘間隔)
圖8 交通流預(yù)測結(jié)果(15 分鐘間隔)
表2 不同模型的指標(biāo)對比(15 分鐘間隔)
2)圖9為交通流數(shù)據(jù)和二次交通流預(yù)測實驗的預(yù)測值之間的散點圖.圖中可以看出交通流混合模型的預(yù)測值和實際交通流數(shù)據(jù)有著很小的差別,反映了混合模型突出的預(yù)測準(zhǔn)確度.
圖9 交通流散點圖
表3 交通流預(yù)測精度升降表(%)
本文提出了一個基于ANFIS 的混合交通流預(yù)測模型,提升了交通流預(yù)測的準(zhǔn)確度,該模型提取了交通流的周期性,利用去除周期性數(shù)據(jù)的殘差數(shù)據(jù)訓(xùn)練ANFIS 模型,進(jìn)而得到交通流預(yù)測值.本模型的理論貢獻(xiàn)是將ANFIS 模型和交通流周期性提取方法有機結(jié)合,根據(jù)交通流周期性這一固有特征和ANFIS 模型對交通流數(shù)據(jù)非線性特點的匹配,組成ANFIS 交通流預(yù)測混合模型.另一方面,該方法在交通流預(yù)測應(yīng)用中的突出表現(xiàn)也在實驗結(jié)果中得以驗證,證明了該混合模型的有效性和優(yōu)先性.
眾所周知,很多數(shù)據(jù)如電力負(fù)荷、建筑能耗都有周期性特征的存在,混合模型的方法同樣適合應(yīng)用于這些有相似時間序列的預(yù)測方向上.隨著大數(shù)據(jù)時代的不斷發(fā)展,其他同樣具有周期性特征的預(yù)測應(yīng)用如大數(shù)據(jù)環(huán)境下的建筑能耗預(yù)測是本文下一步的研究方向.