殷禮勝 高 賀 魏帥康 孫雙晨 何怡剛
(合肥工業(yè)大學(xué)電氣與自動化工程學(xué)院 合肥 230009)
智能交通的發(fā)展與社會經(jīng)濟(jì)的發(fā)展的聯(lián)系愈加緊密,智能交通系統(tǒng)的研究已然成為當(dāng)今熱點研究課題[1,2]。短時交通流預(yù)測是實現(xiàn)交通誘導(dǎo)和控制的關(guān)鍵,同時也是智能交通系統(tǒng)管理的基礎(chǔ)[3,4]。短時交通流具有較強的混沌性和非線性等,各專家針對其特點提出很多智能預(yù)測模型和算法。梅朵等人[5]采用主成分分析(Principal Component Analysis,PCA)與遺傳粒子群支持向量機結(jié)合的方法來預(yù)測交通流量,該方法有效地簡化了預(yù)測路段時空相關(guān)性極強的多個交通流預(yù)測變量,但其忽略了交通流量的非線性以及序列的混沌性。王科偉等人[6]采用多維相空間重構(gòu)(Phase Space Reconstructed,PSR)對交通流數(shù)據(jù)進(jìn)行混沌時間序列分析,但該模型沒有考慮城市交通的空間特性以及交通流量的非線性。錢偉等人[7]采用組合模型的短時交通流量預(yù)測,該模型具有訓(xùn)練時間短、抗干擾性強的特點,但該方法所需大量歷史交通流量數(shù)據(jù),對于采集數(shù)據(jù)較少的情況,結(jié)果未知。佟健頡等人[8]采用基于時空關(guān)聯(lián)性的深度殘差網(wǎng)絡(luò)預(yù)測算法,該算法考慮到交通流量數(shù)據(jù)的時空相關(guān)性并利用深度殘差網(wǎng)絡(luò)進(jìn)行預(yù)測,從而提高預(yù)測精度,但其忽略了交通流數(shù)據(jù)的非線性和混沌特性。
從多維時空交通流量序列的非線性、混沌的內(nèi)在規(guī)律角度來看,以上研究有的忽略了序列的非線性或者序列的混沌性甚至兩者均沒考慮。綜上所述,本文針對這些研究的不足在構(gòu)建模型時,考慮交通流量序列的非線性的同時結(jié)合序列的混沌性,嘗試提出一種基于多維時空的非線性主成分分析和相空間重構(gòu)的改進(jìn)灰色(NPCA-PSR-IGM(1,1))組合預(yù)測模型。并用該模型對合肥市蕪湖路與徽州大道交叉口部分交通流量進(jìn)行預(yù)測和對比分析,通過NPCA-PSR-GM(1,1)組合預(yù)測模型、PCA-PSRIGM(1,1)組合預(yù)測模型以及文獻(xiàn)[7]和文獻(xiàn)[8]所提出的預(yù)測模型的預(yù)測值的比較,以驗證本文模型在精度提升上的優(yōu)越性。
對 p個路段的采樣點進(jìn)行交通流量數(shù)據(jù)采集,每個路段等時間連續(xù)采樣l 次 ,即p 為路網(wǎng)中空間的數(shù)量, l為各空間中等時間采樣次數(shù),可以表示為Y1,Y2,···,Yp, 其中Yi=(yi,1,yi,2,···,yi,l), i =1,2,···,p。計算各觀測點與預(yù)測點交通流量序列的相關(guān)系數(shù)ρj,定義為
建立協(xié)方差矩陣R 并計算特征值和特征向量。
已知多維時空交通流量序列經(jīng)過數(shù)據(jù)相關(guān)性的非線性主成分分析后,將原始序列在空間和時間上降維,得到交通流量序列 X1,X2, ···,Xm,其中Xi=(xi,1,xi,2,···,xi,n), i =1,2,···,m。根據(jù)Takens嵌入定理[10],研究復(fù)雜的多維時間序列數(shù)據(jù)首先需要進(jìn)行相空間重構(gòu)。其主要目的是構(gòu)造出表征原序列的高位空間特性。對上述多維序列重構(gòu)相空間如式(4)。
將多維時空交通流量序列進(jìn)行相空間重構(gòu)后,每個相點代表交通路網(wǎng)的一個狀態(tài)。假設(shè)相點Vk的最鄰近相點Va, 則Vk和 Va之 間的距離為Zk
其中,vj.i=[xj,i,xj,i+τj,···,xj,i+(dj-1)τj]; xj,i表示路段 j 的 第i個交通流量。
常規(guī)灰色模型GM(1,1)的1階線性微分方程為
解方程得
其中,參數(shù)a, b,可按最小二乘法求得。
一般的指數(shù)形式為 y =aeb(x-c)+d ,其中a,b,c,d均為待定參數(shù),而為了確定其形式至少需要4 點,為便于計算這里簡化指數(shù)一般形式為y =aex+b,此時有
因此改正后的背景值為
通過上式背景值的改進(jìn),建立改進(jìn)的灰色模型IGM(1,1)。由于改進(jìn)的背景值比常規(guī)的背景值更加接近于實際,所以誤差更小。
本文選定合肥市蕪湖路與徽州大道交叉口出口處作為預(yù)測點,取樣時間為2018年10月15日上午7點到8點45分,時間間隔5 min記錄1次。本模型不失一般性,為節(jié)省篇幅不再考慮晚高峰。如圖1可知,預(yù)測點主要受到附近6個觀測點的影響,共得6組數(shù)據(jù),每組22個時間點交通量作為實驗數(shù)據(jù),取每組前16個時間點交通流量作為擬合數(shù)據(jù),記為Y1,Y2,···,Y6, 其中,Yi=(yi,1,yi,2,···,yi,16), i=1,2,···,6 。預(yù)測點Y1的后6個時間點的交通流量作為預(yù)測 對比真實值。
取路網(wǎng)中的6個采樣點,分別為觀測點1-觀測點6,其中觀測點1也是預(yù)測點。各觀測點與預(yù)測點按式(1)進(jìn)行數(shù)據(jù)相關(guān)性分析,計算得到各點相關(guān)系數(shù)ρ,結(jié)果見表1。
一般認(rèn)為相關(guān)系數(shù)取0.7以上為強相關(guān)[13]。由表1可知,影響預(yù)測點交通流量的主要因素有觀測點1、觀測點2以及觀測點3的交通流量,見圖1中虛線圈內(nèi)所示。
圖1 蕪湖路與徽州大道交叉口示意圖
表1 各觀測點與預(yù)測點交通流量數(shù)據(jù)相關(guān)系數(shù)
結(jié)合多維時空交通流量序列的情況,使用自相關(guān)法計算各序列的延遲時間,得τi=1, i =1, 2, 3。使用GP算法[14],對觀測點1的交通流量序列算出在不同維數(shù)下 ln r 和l n C(r) 的值,將嵌入維數(shù)d1=1至d1=6情況下的曲線繪制如圖2所示。
若去除曲線斜率為0和斜率為 ∞的直線段,每條曲線所包含的直線斜率,可作為各嵌入維數(shù)對應(yīng)的關(guān)聯(lián)維數(shù),結(jié)果如表2所示。
由表2 可知飽和關(guān)聯(lián)維數(shù) D趨于0.5,因d1≥2D+1,則可確定嵌入維數(shù)2。路網(wǎng)中各路段采樣點的交通流量序列的嵌入維數(shù)按照上述方法計算得到,同時由 M =n-(d-1)τ計算對應(yīng)的嵌入相點數(shù)。由于附近各路段交通環(huán)境的相似性和復(fù)雜性,一般取各維交通流量序列的嵌入相點數(shù)中最小作為統(tǒng)一的相點數(shù)[15],從而得知,多維時空交通流量序列的嵌入相點為
表2 觀測點1的嵌入維數(shù)與關(guān)聯(lián)維數(shù)
圖3 多維時空NPCA-PSR-IGM(1,1)組合預(yù)測模型
短時交通流的非線性和混沌性特征,很難采用單一的預(yù)測方式得到較好的預(yù)測結(jié)果。本文采用數(shù)據(jù)相關(guān)性的非線性主成分分析和相空間重構(gòu)的改進(jìn)灰色組合預(yù)測算法對短時交通流進(jìn)行預(yù)測,具體預(yù)測步驟如下:
步驟 1 對多維時空交通流量序列進(jìn)行空間降維。首先,對p 個路段等時間間隔連續(xù)采樣l次,得到多維時空交通流量數(shù)據(jù),然后由相關(guān)系數(shù)求解公式計算各觀測點與預(yù)測點的相關(guān)系數(shù)ρj(j =2,3,···,p),從而剔除與目標(biāo)路段相關(guān)性較低的觀測點,此時路段數(shù)為m (m =3)。
步驟 2 利用步驟1得到空間降維后的交通流量序列,進(jìn)行時間維度上的非線性主成分分析。由累計方差貢獻(xiàn)率的計算公式確定主成分的個數(shù)n(n =13),相應(yīng)的累計方差貢獻(xiàn)率取8 5%~95%時,也就說明前 n個的采樣序列已經(jīng)包含了對預(yù)測點影響較大的主要信息。
步驟 3 對降維后的交通流量序列進(jìn)行相空間重構(gòu)。首先,計算各交通流量序列的延遲時間 τi和嵌入維數(shù) di(i =1,2,···,m ) ,其次,由M =n-[(Di-1)Ti]從 而得到重構(gòu)后的多維相點數(shù) M(M =12),所以重構(gòu)后的相空間向量可表示為Vi(i =1,2,···,M)。
步驟 4 找到每個相點的最鄰近相點并計算出其值,得到相點的最鄰近相點距演變序列 Z:
Z =(Z1,Z2,···,ZM)。
步驟 6 建立
步驟 7 求得相點距離后,反演計算相點的位置,即得交通流量的預(yù)測值。設(shè)時刻 k 的相點Vk的最鄰近相點為Va, Vk與 Va距離為
其中, vj.i=[xj,i,xj,i+τj,···,xj,i+(dj-1)τj];可由灰色預(yù)測得出,僅xk,i為未知的預(yù)測值,通過解式(12)方程可以得出xk,i。
步驟 8 輸出預(yù)測點的預(yù)測值。
本文以平均相對誤差和標(biāo)準(zhǔn)偏差為評價模型預(yù)測精度的好壞的標(biāo)準(zhǔn),平均相對誤差和標(biāo)準(zhǔn)偏差公式分別為
本文分別使用基于多維時空的非線性主成分分析和相空間重構(gòu)的常規(guī)灰色(NPCA-PSR-GM(1,1))組合預(yù)測模型(如圖4)、基于多維時空的主成分分析和相空間重構(gòu)的改進(jìn)灰色(PCA-PSR-IGM(1,1))組合預(yù)測模型以及基于多維時空的非線性主成分分析和相空間重構(gòu)的改進(jìn)灰色(NPCA-PSRIGM(1,1))組合預(yù)測模型進(jìn)行擬合仿真,以此分別對預(yù)測點后6個時間點(序列號17~22)的交通流量進(jìn)行預(yù)測,預(yù)測點的真實值與3種組合預(yù)測模型的預(yù)測結(jié)果趨勢如圖5所示。由圖5進(jìn)一步分析可以得到3種組合預(yù)測模型預(yù)測的平均相對誤差和標(biāo)準(zhǔn)偏差如表3所示。
圖4 基于多維混沌時空NPCA-PSR-IGM(1,1)組合預(yù)測算法流程圖
由圖5可知,基于多維時空的NPCA-PSRIGM(1,1)組合預(yù)測模型預(yù)測效果更好,基于多維時空的PCA-PSR-IGM(1,1)組合預(yù)測模型其效果最差。由表3可知,該組合預(yù)測模型相對于NPCA-PSRGM(1,1)組合預(yù)測模型和PCA-PSR-IGM(1,1)組合預(yù)測模型其預(yù)測結(jié)果的平均相對誤測分別下降了3.12%和7.53%,同時其標(biāo)準(zhǔn)偏差分別從6.4336下降到2.0589和15.7091下降到2.0589。為了證明本文所提組合模型的優(yōu)劣,將組合預(yù)測結(jié)果與文獻(xiàn)[7]以及文獻(xiàn)[8]所提出的預(yù)測方法進(jìn)行對比,預(yù)測點的真實值與最新預(yù)測模型的預(yù)測結(jié)果趨勢如圖6所示。同時,得出性能指標(biāo)如表3所示。
圖5 3種組合預(yù)測模型預(yù)測結(jié)果圖
表3 3種組合預(yù)測模型預(yù)測誤差統(tǒng)計
圖6 本文組合預(yù)測模型與最新模型預(yù)測結(jié)果
由圖6的預(yù)測結(jié)果,結(jié)合表3預(yù)測性能指標(biāo)可以看出,在實際獲取的交通流量數(shù)據(jù)較少的情況下,文獻(xiàn)[7]所提出的組合預(yù)測模型其優(yōu)勢沒有得以體現(xiàn)并不能達(dá)到較好的預(yù)測效果。同時,文獻(xiàn)[8]所提出的基于時空關(guān)聯(lián)性的深度殘差網(wǎng)絡(luò)預(yù)測模型,雖然考慮到短時交通流量數(shù)據(jù)的時空相關(guān)性,利用大數(shù)據(jù)進(jìn)行深度學(xué)習(xí)構(gòu)建深度殘差模型,達(dá)到不錯的預(yù)測效果,但本文所提出的組合預(yù)測模型不僅涉及交通流量的時空相關(guān)性,而且考慮到交通流量數(shù)據(jù)的非線性以及混沌性,從而進(jìn)行非線性主成分分析剔除無關(guān)數(shù)據(jù)和利用多維時空相空間重構(gòu)凸顯交通流量數(shù)據(jù)的內(nèi)部規(guī)律,進(jìn)一步提高預(yù)測精度。
本文首先運用數(shù)據(jù)相關(guān)性的非線性主成分分析對多維時空交通流量序列進(jìn)行時空降維,其次應(yīng)用多維時空相空間重構(gòu)放大交通流量序列的內(nèi)部細(xì)微特征,最后結(jié)合改進(jìn)灰色模型在保留傳統(tǒng)模型易于計算的優(yōu)點的同時在預(yù)測精度上也有所提升。通過仿真結(jié)果可知,該組合預(yù)測模型相對于多維時空NPCA-PSR-GM(1,1)組合預(yù)測模型、多維時空PCA-PSR-IGM(1,1)組合預(yù)測模型以及一些最新的預(yù)測模型有著更高的預(yù)測精度。這種組合模型為短時交通流預(yù)測提供了一種新的想法,但本文沒有就天氣和不同節(jié)假日因素對路段的影響,因此這將是本文研究的下一步內(nèi)容。