楊 航, 王忠宇, 鄒亞杰, 吳 兵
(1.同濟(jì)大學(xué) 道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室,上海 201804;2.上海海事大學(xué) 交通運(yùn)輸學(xué)院,上海 201306)
短時(shí)行程時(shí)間預(yù)測(cè)是智能交通系統(tǒng)的基礎(chǔ)輸入之一,也是道路交通運(yùn)行狀態(tài)的重要評(píng)價(jià)指標(biāo)[1].一般認(rèn)為,兩個(gè)決策點(diǎn)之間的時(shí)間跨度小于或等于15 min屬于短時(shí)預(yù)測(cè)[2].高速公路行程時(shí)間的預(yù)測(cè)方法主要有時(shí)間序列法[3]、卡爾曼濾波模型[4]、支持向量機(jī)模型[5]、神經(jīng)網(wǎng)絡(luò)模型[6]、數(shù)據(jù)挖掘法[7]以及一系列組合模型[8]等.在近幾年的研究中,由于組合模型可以克服單一模型在預(yù)測(cè)時(shí)的缺陷,通常呈現(xiàn)出優(yōu)于單一模型的預(yù)測(cè)精度[9],因此組合模型出現(xiàn)的頻率逐漸提高.Zhang等[10]指出,交通流特征由兩部分組成:一是確定性特征,影響因素為道路幾何設(shè)計(jì)、常態(tài)下的交通需求、交通管理措施(限速)等;二是非確定性特征,影響因素為交通事件、惡劣天氣等突發(fā)因素.因此,高速公路行程時(shí)間不僅包含確定性的周期性特征,還存在非確定性的殘余成分[11].
周期性分析是行程時(shí)間預(yù)測(cè)中極其重要的一部分,現(xiàn)有研究已經(jīng)證明行程時(shí)間在時(shí)間上和空間上均存在著較為顯著的周期性.Zhang等[12]提出行程時(shí)間的周期性特征表現(xiàn)為以下兩種:一種是以一天24 h為比較維度,一種是以一周7 d為比較維度.兩種維度下相同路段的行程時(shí)間多數(shù)呈現(xiàn)較為明顯的周期性特征.Zou等[13]采用了基于三角函數(shù)成分的回歸模型對(duì)行程時(shí)間的周期性進(jìn)行了分析,并證明該回歸模型在預(yù)測(cè)間隔超過(guò)30 min時(shí)仍具有較好的預(yù)測(cè)精度.Zhang等[14]采用頻率分析法對(duì)車(chē)輛在不同路段的周期性特征進(jìn)行了提取和分析,并基于分析結(jié)果對(duì)車(chē)輛在不同貨運(yùn)點(diǎn)的延誤時(shí)間進(jìn)行了預(yù)測(cè).
除去體現(xiàn)確定性成分的周期性特征,還需要對(duì)非確定性的殘余成分進(jìn)行分析,以提高預(yù)測(cè)精度.Vlahogianni等[15]指出,需要對(duì)行程時(shí)間數(shù)據(jù)進(jìn)行去趨勢(shì)化分析,以提升預(yù)測(cè)精度.去趨勢(shì)化分析指的是將周期性預(yù)測(cè)值從原始數(shù)據(jù)中去除,對(duì)剩余不確定性的殘量部分進(jìn)行二次預(yù)測(cè).現(xiàn)有研究主要采用多狀態(tài)轉(zhuǎn)換模型[16]進(jìn)行去趨勢(shì)化分析.馬爾可夫鏈模型是去趨勢(shì)化分析中較為有效和常見(jiàn)的一種手段,往往用于和其他模型配合使用以提高預(yù)測(cè)精度.D’Angelo等[17]采用馬爾可夫鏈與周期性預(yù)測(cè)相結(jié)合的方式,對(duì)高速公路的常發(fā)性擁堵進(jìn)行了預(yù)測(cè),結(jié)果證明該模型比對(duì)照組模型有較為顯著的預(yù)測(cè)優(yōu)勢(shì).Yeon等[18]基于交通狀態(tài)劃分結(jié)果,建立了交通狀態(tài)概率轉(zhuǎn)移矩陣,構(gòu)建了非連續(xù)的馬爾可夫鏈模型,并比較了不同交通狀態(tài)下各模型對(duì)高速公路各路段行程時(shí)間的預(yù)測(cè)精度.
基于二次訓(xùn)練的周期性預(yù)測(cè)和去趨勢(shì)化分析的結(jié)合是當(dāng)前大部分組合模型的組成結(jié)構(gòu),但Polson等[19]通過(guò)分析一次訓(xùn)練與二次訓(xùn)練的誤差傳遞規(guī)律得出:基于多次訓(xùn)練的預(yù)測(cè)方法會(huì)造成過(guò)擬合的發(fā)生,降低模型在數(shù)據(jù)波動(dòng)性較強(qiáng)情況下的預(yù)測(cè)精度.Zhang等[20]考慮了預(yù)測(cè)中數(shù)據(jù)的波動(dòng)性因素,并采用頻譜分析法提高了行程時(shí)間的預(yù)測(cè)可靠度.
現(xiàn)有研究的關(guān)注點(diǎn)多數(shù)聚焦在如何提升短時(shí)行程時(shí)間預(yù)測(cè)模型的預(yù)測(cè)精度,而對(duì)于不同交通狀態(tài)下的預(yù)測(cè)穩(wěn)定性、組合模型可能產(chǎn)生的多余噪聲以及行程時(shí)間突變點(diǎn)(數(shù)值激增或驟降的時(shí)刻)的預(yù)測(cè)及時(shí)性等方面的內(nèi)容涉及相對(duì)較少[21-22],需要進(jìn)一步考慮模型在這些方面的優(yōu)化問(wèn)題.
本研究改善了傳統(tǒng)組合預(yù)測(cè)模型的結(jié)構(gòu),通過(guò)噪聲修正模型構(gòu)建了波動(dòng)性分析模塊,緩解了過(guò)擬合效應(yīng)所帶來(lái)的預(yù)測(cè)不穩(wěn)定性.同時(shí),面向相對(duì)誤差修正的馬爾可夫鏈不需要針對(duì)交通狀態(tài)進(jìn)行狀態(tài)劃分,提升了模型的應(yīng)用靈活性,使得模型具備了處理其他高速公路路段行程時(shí)間數(shù)據(jù)的潛力.此外,噪聲修正模塊的加入提高了模型在擁堵?tīng)顟B(tài)下的預(yù)測(cè)精度和魯棒性,使得模型具備了捕捉行程時(shí)間突變點(diǎn)的能力,緩解了預(yù)測(cè)的延遲性,從而可為高速公路交通運(yùn)行管理提供決策依據(jù).
本研究所使用的行程時(shí)間數(shù)據(jù)采集于美國(guó)高速公路US -290中的編號(hào) I-610 至 FM-1960間的路段,位于德克薩斯州的城市休斯頓.數(shù)據(jù)采集時(shí)間段為2008年1月至2008年8月的每周二到四,每隔30 s采集一次,每30 s的檢測(cè)數(shù)據(jù)集計(jì)成5 min的區(qū)間,一天共采集24 h.該路段有著較明顯的潮汐特征,路段由東向西方向在晚高峰承擔(dān)了大量交通流.這種交通流的不均衡性,有助于檢驗(yàn)組合模型波動(dòng)性分析模塊的有效性,也有助于驗(yàn)證組合模型在捕捉晚高峰行程時(shí)間“拐點(diǎn)”的及時(shí)性和穩(wěn)定性.研究路段長(zhǎng)19.3 km,自由流速度下的通過(guò)時(shí)間約為15 min.路段上共布設(shè)了六個(gè)AVI (automatic vehicle identification) 檢測(cè)器,在車(chē)輛通過(guò)時(shí)記錄車(chē)牌號(hào),通過(guò)相同車(chē)牌在各個(gè)檢測(cè)器經(jīng)過(guò)的時(shí)刻間隔獲取行程時(shí)間.六個(gè)檢測(cè)器將選定路段分為五個(gè)子路段(A、B、C、D、E),長(zhǎng)度分別為1.3、4.2、4.8、2.4、6.6 km.檢測(cè)器布置如圖1所示,虛線(xiàn)框包圍部分為本研究所要涉及的路段,每個(gè)雷達(dá)感應(yīng)器旁標(biāo)注的四位數(shù)為對(duì)應(yīng)編號(hào).
本研究的組合模型分為以下三部分:體現(xiàn)確定性特征的周期性部分,采用小波神經(jīng)網(wǎng)絡(luò)(WNN)預(yù)測(cè)原始數(shù)據(jù),得到初步預(yù)測(cè)值;體現(xiàn)非確定性誤差特征的殘量部分,采用馬爾可夫鏈(MKC)對(duì)初步預(yù)測(cè)值的相對(duì)誤差進(jìn)行修正,得到預(yù)測(cè)后的相對(duì)誤差值;體現(xiàn)非確定性噪聲的波動(dòng)分析模塊,采用GJR-GARCH (Glosten-Jagannathan-Runkle-generalized-autoregressive-conditional-heteroskedasticity)模型緩解噪聲.最終的短時(shí)行程時(shí)間組合預(yù)測(cè)值為三部分預(yù)測(cè)值之和,組合預(yù)測(cè)模型WNN-MKC-GJR的結(jié)構(gòu)表達(dá)式如下所示:
Xt=ct+rt+vt
(1)
式中:Xt為組合模型t時(shí)刻的預(yù)測(cè)值;ct為改進(jìn)后的小波神經(jīng)網(wǎng)絡(luò)t時(shí)刻的周期性預(yù)測(cè)值;rt為經(jīng)過(guò)馬爾可夫鏈修正的t時(shí)刻的相對(duì)誤差值;vt為GJR-GARCH模型預(yù)測(cè)的t時(shí)刻波動(dòng)量.
作為人工智能算法之一的神經(jīng)網(wǎng)絡(luò)可用于檢測(cè)常態(tài)下交通流的周期性特征,并在預(yù)測(cè)行程時(shí)間周期性的實(shí)例中得到了成功應(yīng)用[23].小波神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)如圖2所示.圖2中,ui為第i個(gè)輸入變量,wi為ui對(duì)應(yīng)的輸入層節(jié)點(diǎn),Ti為ui對(duì)應(yīng)的輸出層節(jié)點(diǎn),Y(ui)為ui對(duì)應(yīng)的小波基函數(shù).本研究的神經(jīng)網(wǎng)絡(luò)中,輸入層為各個(gè)時(shí)刻的行程時(shí)間真實(shí)值,輸出層為各個(gè)時(shí)刻對(duì)應(yīng)的行程時(shí)間預(yù)測(cè)值,中間層為各個(gè)輸入值對(duì)應(yīng)的小波變換函數(shù),因此各層的神經(jīng)元數(shù)量相同.
圖1 US-290路段
圖2 小波神經(jīng)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)
采用母小波基函數(shù)作為隱藏層激發(fā)函數(shù),該函數(shù)通過(guò)變換分析信號(hào)的局部特征,在捕捉原始數(shù)據(jù)的周期性特征上具有穩(wěn)定性和高效性[24],函數(shù)表達(dá)式為
(2)
小波神經(jīng)網(wǎng)絡(luò)的算法核心是小波分析和傅里葉變換,變換的頻率和振幅決定了小波預(yù)測(cè)結(jié)果的振蕩幅度.Antonini等[24]通過(guò)增加二次誤差反饋模塊,基于誤差動(dòng)態(tài)實(shí)現(xiàn)小波變換的頻率和振幅,增加了小波變換的穩(wěn)定性.動(dòng)態(tài)小波變換函數(shù)yt和小波系數(shù)關(guān)系函數(shù)O(yt-1)如下所示:
yt=f(yt-1)+g(xt-1)+et
(3)
(4)
式中:x(t-1)為(t-1)時(shí)刻的狀態(tài)向量;yt-1為(t-1)時(shí)刻反饋的行程時(shí)間輸入向量;f(·)為關(guān)于yt-1的標(biāo)量化非線(xiàn)性映射函數(shù);g(·)為關(guān)于xt的標(biāo)量化非線(xiàn)性映射函數(shù);et為t時(shí)刻實(shí)際行程時(shí)間值與未來(lái)輸出層預(yù)測(cè)值之間的誤差向量;M為分析時(shí)段內(nèi)出現(xiàn)的完整小波周期數(shù);O(yt-1)為f(yt-1)的極大似然估計(jì)值;Wq為第q個(gè)周期的離散化小波變換系數(shù);a為頻率(振幅);b為時(shí)空維度;L(yt-1)為小波變換函數(shù)yt-1的二維函數(shù)空間;ψa,b(yt-1)為二維小波衍生函數(shù).ψa,b(yt-1)是基于標(biāo)準(zhǔn)化小波函數(shù)轉(zhuǎn)化而來(lái),如下所示:
(5)
式中:φ(·)為標(biāo)準(zhǔn)化小波函數(shù).以這兩個(gè)函數(shù)構(gòu)成小波變換函數(shù),對(duì)傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行改進(jìn),減少需要標(biāo)定的參數(shù)個(gè)數(shù),提高算法的收斂速度.
Zhang[25]的研究指出,神經(jīng)網(wǎng)絡(luò)在t時(shí)刻的預(yù)測(cè)誤差與(t-1)時(shí)刻是高度相關(guān)的,而與之前時(shí)刻的相關(guān)性很小.馬爾可夫鏈模型的顯著特征是非后效性,即目標(biāo)在當(dāng)前時(shí)刻的狀態(tài)只與前一個(gè)時(shí)刻的狀態(tài)相關(guān),而與之前任何時(shí)刻的狀態(tài)無(wú)關(guān),與神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)誤差的特征相符合.現(xiàn)有研究多采用馬爾可夫鏈對(duì)交通流運(yùn)行狀態(tài)進(jìn)行劃分,分為擁堵、半擁堵與非擁堵三個(gè)狀態(tài)[18].該劃分方法的缺點(diǎn)在于半擁堵的過(guò)渡狀態(tài)很難量化,當(dāng)過(guò)渡狀態(tài)不明顯時(shí),會(huì)嚴(yán)重影響馬爾可夫鏈的收斂精度及速度.針對(duì)誤差的狀態(tài)劃分方法則具有更廣泛的適用性.采用馬爾可夫鏈對(duì)初步預(yù)測(cè)值的相對(duì)誤差進(jìn)行二次修正,獲得的修正值將作為相對(duì)誤差預(yù)測(cè)值.
多狀態(tài)轉(zhuǎn)換模型的預(yù)測(cè)過(guò)程包含以下三個(gè)步驟:確定各個(gè)狀態(tài)及對(duì)應(yīng)區(qū)間,將待處理數(shù)據(jù)放入對(duì)應(yīng)區(qū)間,預(yù)測(cè)每個(gè)區(qū)間出現(xiàn)的概率.作為多狀態(tài)轉(zhuǎn)換模型的一種,馬爾可夫鏈的構(gòu)建及求解過(guò)程亦遵循這一過(guò)程.首先將小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練組的相對(duì)誤差集合成數(shù)據(jù)鏈,將相對(duì)誤差劃分為N個(gè)狀態(tài)(s1,s2,…,sN),每一個(gè)狀態(tài)對(duì)應(yīng)一個(gè)相對(duì)誤差區(qū)間.采用一種基于二叉判定圖的劃分方法對(duì)數(shù)據(jù)鏈進(jìn)行狀態(tài)劃分,關(guān)于該方法的細(xì)節(jié)可參考Xie等[26]的研究,每個(gè)狀態(tài)對(duì)應(yīng)一個(gè)相對(duì)誤差的范圍區(qū)間.接著,將數(shù)據(jù)鏈中的各個(gè)誤差分入對(duì)應(yīng)的區(qū)間.最后,在數(shù)據(jù)劃分的基礎(chǔ)上對(duì)相對(duì)誤差的最終狀態(tài)進(jìn)行求解.
構(gòu)建馬爾可夫鏈一步轉(zhuǎn)移概率矩陣P,矩陣中的每個(gè)元素為pIJ,表達(dá)式如下所示:
(6)
式中:pIJ為小波神經(jīng)網(wǎng)絡(luò)訓(xùn)練組的相對(duì)誤差由第I個(gè)狀態(tài)轉(zhuǎn)移至第J個(gè)狀態(tài)的出現(xiàn)概率;oI為第I個(gè)狀態(tài)出現(xiàn)的次數(shù);oIJ為第I個(gè)狀態(tài)轉(zhuǎn)移至第J個(gè)狀態(tài)的次數(shù).
定義系統(tǒng)的初始狀態(tài)矩陣為S0,表達(dá)式如下所示:
(7)
經(jīng)過(guò)K次一步轉(zhuǎn)移概率矩陣運(yùn)算后得到最終狀態(tài)SK,SK可通過(guò)切普曼-柯?tīng)柲缏宸蚍匠糖蟮?,如下所示?/p>
SK=SK-1P=S0PK
(8)
待馬爾可夫鏈?zhǔn)諗恐?,每個(gè)最大概率對(duì)應(yīng)的狀態(tài)被選為修正狀態(tài),對(duì)應(yīng)的區(qū)間作為相對(duì)誤差的修正區(qū)間,取每個(gè)時(shí)刻t的預(yù)測(cè)區(qū)間中值Ut作為相對(duì)誤差值的預(yù)測(cè)值rt,表達(dá)式如下所示:
rt=dt(1-Ut)
(9)
式中:dt是經(jīng)過(guò)AVI檢測(cè)器獲取的t時(shí)刻行程時(shí)間原始數(shù)據(jù).
將人工智能算法與統(tǒng)計(jì)學(xué)方法相結(jié)合的組合預(yù)
測(cè)模型容易引入多余噪聲,從而產(chǎn)生過(guò)擬合效應(yīng),這對(duì)于高峰時(shí)期波動(dòng)性較大的行程時(shí)間的預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性帶來(lái)很大影響.一般認(rèn)為,過(guò)擬合效應(yīng)所帶來(lái)的白噪聲一般符合白噪聲屬性[20].廣義的自回歸條件化異方差(GARCH)模型能夠較好地描述過(guò)擬合效應(yīng)中波動(dòng)量vt的概率分布,如下所示:
(10)
(11)
式中:zt為t時(shí)刻符合標(biāo)準(zhǔn)正態(tài)分布的數(shù)集;ht為t時(shí)刻vt的中間變量;E為期望值計(jì)算;Ft-1為(t-1)時(shí)刻波動(dòng)量vt-1對(duì)應(yīng)的F檢驗(yàn)標(biāo)準(zhǔn)值.
基于條件化的異方差模型,本研究所采用的波動(dòng)分析模型考慮了不同時(shí)刻的行程時(shí)間數(shù)據(jù)所對(duì)應(yīng)的不同條件變量,通過(guò)異方差模型模擬波動(dòng)性變量vt在不同時(shí)刻的概率分布.
Bollerslev[27]首次提出可采用廣義的自回歸條件化異方差模型來(lái)模擬噪聲分布,該模型適用性較廣,但沒(méi)有考慮原數(shù)據(jù)的不對(duì)稱(chēng)性,而研究路段的行程時(shí)間具有明顯的潮汐性,因此該方法并不適用.Glosten等[28]在Bollerslev研究的基礎(chǔ)上提出了GJR-GARCH模型,通過(guò)引入新的二維條件變量,獲取股票數(shù)據(jù)初始預(yù)測(cè)誤差中的不對(duì)稱(chēng)特性,并通過(guò)正變量和負(fù)變量的交替以及不同時(shí)段下系數(shù)與波動(dòng)量的交叉修正,緩解了多步預(yù)測(cè)時(shí)誤差在傳播過(guò)程中所產(chǎn)生的振蕩,對(duì)過(guò)擬合所形成的多余噪聲進(jìn)行了平滑修正,從而很大程度上緩解了過(guò)擬合效應(yīng),表達(dá)式如下所示:
(12)
式中:G為常數(shù);l為系數(shù)βj對(duì)應(yīng)的波動(dòng)平滑時(shí)段;βj為與j時(shí)刻交叉對(duì)應(yīng)的中間變量ht-j的非負(fù)平滑系數(shù);Q為系數(shù)αk和γk對(duì)應(yīng)的波動(dòng)平滑時(shí)段;αk為與k時(shí)刻交叉對(duì)應(yīng)的波動(dòng)量vt-k的非負(fù)平滑系數(shù);γk為與k時(shí)刻交叉對(duì)應(yīng)的引入修正變量的波動(dòng)量vt-k的非負(fù)平滑系數(shù);λt-k為(t-k)時(shí)刻關(guān)于波動(dòng)量vt-k的二元修正變量.λt-k的表達(dá)式如下所示:
(13)
當(dāng)所有γk均為零時(shí),GJR-GARCH模型轉(zhuǎn)變?yōu)闃?biāo)準(zhǔn)化的GARCH(l,Q)模型.本研究中將采用該模型對(duì)行程時(shí)間預(yù)測(cè)中可能產(chǎn)生的過(guò)擬合效應(yīng)進(jìn)行緩解.
3.1.1改進(jìn)的小波神經(jīng)網(wǎng)絡(luò)模型
基于組合模型WNN-MKC-GJR的架構(gòu),對(duì)行程時(shí)間數(shù)據(jù)進(jìn)行組合預(yù)測(cè).本研究選用的WNN模型的輸入層為所選路段的歷史行程時(shí)間數(shù)據(jù).根據(jù)數(shù)據(jù)篩選,將3月至7月的每周二到四的行程時(shí)間數(shù)據(jù)作為訓(xùn)練組,將8月前12個(gè)研究日的數(shù)據(jù)作為測(cè)試組,輸出層為第13個(gè)研究日,即8月28日的行程時(shí)間預(yù)測(cè)值.將行程時(shí)間波動(dòng)較大的路段D作為目標(biāo)路段,用以檢驗(yàn)波動(dòng)性分析模塊的有效性.以路段D上游的路段A、B、C以及下游的路段E作為關(guān)聯(lián)路段,通過(guò)改進(jìn)的動(dòng)態(tài)小波變換函數(shù)對(duì)關(guān)聯(lián)路段進(jìn)行動(dòng)態(tài)權(quán)重賦值.五條路段的歷史行程時(shí)間數(shù)據(jù)的中值統(tǒng)計(jì)情況如圖3所示.
圖3 五個(gè)路段的歷史行程時(shí)間數(shù)據(jù)分布
圖3中,每個(gè)時(shí)間點(diǎn)對(duì)應(yīng)的行程時(shí)間值為2008年1月—8月中所有對(duì)應(yīng)時(shí)間點(diǎn)的行程時(shí)間值的平均數(shù).由圖3可以看出,各個(gè)路段上每天均有3 h左右的波峰時(shí)段,即高峰擁堵時(shí)段,但在出現(xiàn)的時(shí)間上有先后差異.路段A的行程時(shí)間在15∶00左右開(kāi)始增加,16∶30左右達(dá)到峰值,并在18∶00左右完成擁堵消散.路段B、C的行程時(shí)間同樣在15∶00開(kāi)始呈現(xiàn)上升趨勢(shì),17∶30左右達(dá)到峰值,并在19∶00左右恢復(fù)平峰速度.路段D、E的行程時(shí)間在16∶00左右開(kāi)始上升,較前三個(gè)路段晚了1 h,峰值在17∶30左右產(chǎn)生,擁堵結(jié)束時(shí)間為19∶00左右.五個(gè)路段的行程時(shí)間在時(shí)空分布上具有相似性和傳遞性,因此相互之間有著較強(qiáng)的相關(guān)性.基于此相關(guān)性,在小波神經(jīng)網(wǎng)絡(luò)中可將其中幾個(gè)路段作為關(guān)聯(lián)路段,將剩下的路段作為目標(biāo)路段進(jìn)行訓(xùn)練,以提高預(yù)測(cè)精度.路段D上的行程時(shí)間波動(dòng)較大,可用來(lái)檢驗(yàn)波動(dòng)分析模塊的有效性.因此,以路段D為目標(biāo)路段,以路段D上游的路段A、B、C以及下游的路段E作為關(guān)聯(lián)路段,通過(guò)改進(jìn)的動(dòng)態(tài)小波變換函數(shù)對(duì)關(guān)聯(lián)路段進(jìn)行動(dòng)態(tài)賦權(quán).
3.1.2馬爾可夫鏈模型
在小波神經(jīng)網(wǎng)絡(luò)模型得到初步預(yù)測(cè)值之后,采用馬爾可夫鏈對(duì)初步預(yù)測(cè)值的對(duì)應(yīng)相對(duì)誤差進(jìn)行修正,t時(shí)刻相對(duì)誤差Zt3的表達(dá)式如下所示:
(14)
式中:Zt1和Zt2分別為t時(shí)刻行程時(shí)間的實(shí)際值和小波神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)值.
根據(jù)基于二叉判定圖[26]的劃分方法對(duì)數(shù)據(jù)鏈進(jìn)行狀態(tài)劃分,將初始預(yù)測(cè)值對(duì)應(yīng)的相對(duì)誤差集合劃分為九個(gè)狀態(tài)(s1,s2,…,s9),具體對(duì)應(yīng)區(qū)間如表1所示.
基于狀態(tài)劃分結(jié)果,分別建立小波神經(jīng)網(wǎng)絡(luò)測(cè)試組在15∶30—19∶30各個(gè)時(shí)刻的狀態(tài)分布矩陣.將15∶30的狀態(tài)分布矩陣作為初始狀態(tài)矩陣S0,并構(gòu)建馬爾可夫鏈一步轉(zhuǎn)移概率矩陣P,如下所示:
(15)
表1 馬爾可夫鏈狀態(tài)劃分
基于切普曼-柯?tīng)柲缏宸蚍匠蹋傻玫?月28日15∶30—19∶30每隔5 min的時(shí)刻點(diǎn)對(duì)應(yīng)的預(yù)測(cè)相對(duì)誤差值.
3.1.3GJR-GARCH模型
不同的(l,Q)組合下,GJR-GARCH模型的噪聲削減效果不盡相同.Zhang等[20]指出,當(dāng)l、Q均為1時(shí),GJR-GARCH(1,1)模型相比于其他參數(shù)模型能夠更好地應(yīng)對(duì)非對(duì)稱(chēng)性較強(qiáng)的行程時(shí)間數(shù)據(jù),并且具有較好的白噪聲削減作用,因此研究也采用GJR-GARCH(1,1)模型作為波動(dòng)性分析模型.參數(shù)估計(jì)都采用最大似然估計(jì)法,并通過(guò)Matlab的“garch”工具箱中的多變量GARCH模型實(shí)現(xiàn)GJR-GARCH(1,1)模型的波動(dòng)性分析功能.
3.1.4對(duì)照模型
使用三個(gè)經(jīng)典模型作為組合預(yù)測(cè)模型的對(duì)照組,分別是傳統(tǒng)小波神經(jīng)網(wǎng)絡(luò)模型、BP神經(jīng)網(wǎng)絡(luò)模型以及兩步自回歸(automatic regression 2-step, AR(2))模型.AR(2)模型的計(jì)算表達(dá)式如下所示:
H(t)=θH(t-1)+(1-θ)H(t-2)+δ(t)
(16)
式中:H(t)為t時(shí)刻AR(2)模型的預(yù)測(cè)值;θ為平滑權(quán)重系數(shù);δ(t)為t時(shí)刻的隨機(jī)噪聲.
經(jīng)過(guò)對(duì)不同θ的檢驗(yàn)測(cè)試,當(dāng)平滑權(quán)重系數(shù)搜索至0.5附近時(shí),模型的預(yù)測(cè)表現(xiàn)最佳,并且在(0.50-0.01,0.50+0.01)范圍內(nèi)波動(dòng)時(shí)AR(2)的預(yù)測(cè)精度區(qū)別不大,因此以0.5作為AR(2)模型的平滑權(quán)重系數(shù).
除以上三個(gè)模型,本研究還將基于BP、AR(2)、MKC和GJR-GARCH模型構(gòu)建另外兩個(gè)對(duì)照組合模型,因此共有五個(gè)對(duì)照模型.兩個(gè)對(duì)照組合模型分別是BP-MKC-GJR模型和AR(2)-MKC-GJR模型,結(jié)構(gòu)及計(jì)算過(guò)程與WNN-MKC-GJR模型類(lèi)似,波動(dòng)分析模塊均采用GJR-GARCH(1,1)模型.
采用平均絕對(duì)誤差E1、平均絕對(duì)百分比誤差E2與均方根誤差E3評(píng)價(jià)模型性能,表達(dá)式如下所示:
(17)
式中:n為預(yù)測(cè)時(shí)段內(nèi)時(shí)刻點(diǎn)的總個(gè)數(shù).
所有模型對(duì)2008年8月28日路段D行程時(shí)間數(shù)據(jù)的預(yù)測(cè)如圖4、5所示.
圖4比較了各模型預(yù)測(cè)值與真實(shí)值的差異,用于觀察各模型的預(yù)測(cè)精度.圖5展示了各個(gè)時(shí)間點(diǎn)不同模型預(yù)測(cè)值與真實(shí)值的相對(duì)誤差,用于體現(xiàn)各模型在不同時(shí)段的預(yù)測(cè)穩(wěn)定性.
如圖4所示,在非擁堵時(shí)段15∶30—16∶45內(nèi),各模型曲線(xiàn)趨于平穩(wěn)且較為接近,說(shuō)明該時(shí)段內(nèi)各模型都能較好地預(yù)測(cè)行程時(shí)間;在擁堵時(shí)段16∶50—18∶50內(nèi),WNN-MKC-GJR組合模型所在的曲線(xiàn)最接近真實(shí)值曲線(xiàn),說(shuō)明該組合預(yù)測(cè)模型在高峰時(shí)段內(nèi)有較高的預(yù)測(cè)精度;AR(2)所在的曲線(xiàn)偏離真實(shí)值曲線(xiàn)較多,并且當(dāng)16∶50行程時(shí)間出現(xiàn)突變時(shí),AR(2)對(duì)于該拐點(diǎn)的預(yù)測(cè)滯后于其他五個(gè)模型,在拐點(diǎn)的預(yù)測(cè)誤差為62 s,說(shuō)明AR(2)模型在處理波動(dòng)性較強(qiáng)的數(shù)據(jù)時(shí)有明顯局限性;WNN-MKC-GJR組合模型在拐點(diǎn) 16∶50 預(yù)測(cè)上沒(méi)有滯后性,在16∶45—16∶50準(zhǔn)確預(yù)測(cè)了行程時(shí)間的突變趨勢(shì),在突變點(diǎn)的預(yù)測(cè)值與真實(shí)值最為接近,預(yù)測(cè)誤差為18 s.
圖4 行程時(shí)間預(yù)測(cè)結(jié)果
圖5 預(yù)測(cè)的相對(duì)誤差
如圖5所示,非擁堵時(shí)段內(nèi)各模型預(yù)測(cè)值對(duì)應(yīng)的相對(duì)誤差波動(dòng)較小,說(shuō)明各模型在該時(shí)段都有著較好的預(yù)測(cè)穩(wěn)定性;在行程時(shí)間發(fā)生突變的時(shí)間點(diǎn) 16∶50,各預(yù)測(cè)模型相對(duì)誤差曲線(xiàn)都出現(xiàn)了不同程度的振蕩,其中WNN-MKC-GJR組合模型的振蕩幅度最小,相對(duì)誤差為-15%,并且該值在擁堵時(shí)段內(nèi)一直保持相對(duì)較低的水平,曲線(xiàn)保持平穩(wěn),相對(duì)誤差極值為26%,說(shuō)明該組合模型在高峰時(shí)段內(nèi)有著較好的預(yù)測(cè)穩(wěn)定性;AR(2)模型在擁堵時(shí)段內(nèi)的相對(duì)誤差較于其他五個(gè)模型偏高,說(shuō)明該模型的預(yù)測(cè)穩(wěn)定性較低.
圖4、5表明:在增加馬爾可夫鏈二次修正模塊和GJR-GARCH模型的波動(dòng)性分析模塊后,模型的預(yù)測(cè)精度和預(yù)測(cè)穩(wěn)定性較之對(duì)應(yīng)的單個(gè)模型都會(huì)有不同程度的提升.通過(guò)三個(gè)指標(biāo)進(jìn)一步反映各個(gè)模型在不同時(shí)段(行程時(shí)間突變點(diǎn)前后)內(nèi)的預(yù)測(cè)能力,如表2所示.從表2可得出以下結(jié)論:
(1) 從整個(gè)晚高峰時(shí)段來(lái)看,WNN-MKC-GJR模型在三個(gè)指標(biāo)下的表現(xiàn)都要好于其他五個(gè)模型.在行程時(shí)間突變發(fā)生之前,基于線(xiàn)性預(yù)測(cè)的AR(2)模型表現(xiàn)最優(yōu),原因在于當(dāng)行程時(shí)間波動(dòng)較小時(shí),基于線(xiàn)性迭代的預(yù)測(cè)方法能更好地接近真實(shí)值;在行程時(shí)間發(fā)生突變之后,WNN-MKC-GJR模型明顯優(yōu)于其他模型,說(shuō)明所提出的組合模型在擁堵時(shí)段內(nèi)有著更好的預(yù)測(cè)精度.
表2 預(yù)測(cè)性能指標(biāo)比較
(2) 行程時(shí)間突變點(diǎn)之前,在增加MKC-GJR模塊之后,WNN、BP和AR(2)模型在三個(gè)指標(biāo)上并未全部提升;在行程時(shí)間發(fā)生突變之后,MKC-GJR模塊對(duì)于WNN、BP和AR(2)模型的預(yù)測(cè)精度均有不同程度的提升,說(shuō)明馬爾可夫鏈與GJR-GARCH模型的組合可以提升單一模型在擁堵時(shí)段內(nèi)的預(yù)測(cè)精度.
(3)E3值方面,單個(gè)模型在加入MKC-GJR模塊成為組合模型之后,某些預(yù)測(cè)性能上可能會(huì)超過(guò)原本比自己高級(jí)的單一模型,如BP-MKC-GJR在特定時(shí)段(全時(shí)段和突變后)內(nèi)三個(gè)指標(biāo)均優(yōu)于WNN,同時(shí)AR(2)-MKC-GJR在任何時(shí)段三個(gè)指標(biāo)均優(yōu)于BP.在實(shí)際運(yùn)營(yíng)管理中考慮計(jì)算時(shí)間的約束時(shí),這一個(gè)特征也可以為預(yù)測(cè)模型的選擇帶來(lái)更多的靈活性.
(1) 在充分考慮實(shí)際運(yùn)行過(guò)程中行程時(shí)間周期性、潮汐性、高峰時(shí)段不穩(wěn)定性后,基于周期性預(yù)測(cè)、殘量修正和波動(dòng)性分析三個(gè)部分構(gòu)建了新的組合架構(gòu),采用改進(jìn)后的小波神經(jīng)網(wǎng)絡(luò)、馬爾可夫鏈和GJR-GARCH模型構(gòu)建了WNN-MKC-GJR組合預(yù)測(cè)模型.基于相對(duì)誤差狀態(tài)構(gòu)建的馬爾可夫鏈成分使得組合模型無(wú)需對(duì)復(fù)雜的交通狀態(tài)進(jìn)行量化判別,因此具有較強(qiáng)的可移植性.
(2) 加入相對(duì)誤差修正以及過(guò)擬合噪聲修正這兩個(gè)模塊之后,WNN-MKC-GJR組合預(yù)測(cè)模型具有更高的預(yù)測(cè)精度和更強(qiáng)的預(yù)測(cè)穩(wěn)定性,這一表現(xiàn)在高峰時(shí)段內(nèi)尤為明顯,預(yù)測(cè)精度和穩(wěn)定性要明顯優(yōu)于其他五個(gè)對(duì)照模型.在平峰時(shí)段內(nèi),線(xiàn)性的AR(2)模型具有較好的預(yù)測(cè)精度,這表明在平峰時(shí)段內(nèi)采取平穩(wěn)的時(shí)間序列模型會(huì)取得更好的預(yù)測(cè)效果.
(3) 在行程時(shí)間發(fā)生突變的時(shí)刻,WNN-MKC-GJR組合預(yù)測(cè)模型可以及時(shí)捕捉突變的“拐點(diǎn)”,而其他五種模型都有不同程度的預(yù)測(cè)滯后.在實(shí)際城市交通管控策略的實(shí)施過(guò)程中,若能準(zhǔn)確感知行程時(shí)間突變(即大規(guī)模擁堵可能形成)時(shí)刻,則可以提前采取相關(guān)的主動(dòng)管控措施,緩解擁擠的擴(kuò)散速度,為高速公路交通流運(yùn)行管理的決策提供依據(jù).
本研究所涉及的路段上交通事件發(fā)生數(shù)量不多,因此需要在日后的研究中進(jìn)一步檢驗(yàn)組合模型處理交通事件數(shù)據(jù)的預(yù)測(cè)能力.
同濟(jì)大學(xué)學(xué)報(bào)(自然科學(xué)版)2019年9期