吳 鵬 翟嘉伊 汪 健 張鳳荔
(1.四川工程職業(yè)技術(shù)學(xué)院 德陽 618000)(2.電子科技大學(xué) 成都 610054)
隨著互聯(lián)網(wǎng)的普及,搜集的信息越來越多,眾多的歷史數(shù)據(jù)被有限的技術(shù)方法拿來分析利用,但仍有大量的數(shù)據(jù)閑置,或者說是并未得到充分的使用,因此需要更多的技術(shù)來發(fā)掘這些數(shù)據(jù)的潛在價(jià)值,時(shí)間序列預(yù)測方法便在這樣的發(fā)展背景下應(yīng)運(yùn)而生。時(shí)間序列顧名思義是按照時(shí)間順序來排列一些指標(biāo)的數(shù)值,有時(shí)表面上看這些數(shù)據(jù)可能是隨機(jī)的,但通過某些技術(shù)方法卻能發(fā)現(xiàn)其內(nèi)在的依賴關(guān)系,并且從長遠(yuǎn)來看,若能發(fā)現(xiàn)其蘊(yùn)含的發(fā)展規(guī)律,對于一些未知事件的預(yù)測也意義重大。
現(xiàn)如今,交通管理日趨復(fù)雜,國家的高速公路網(wǎng)絡(luò)的里程數(shù)以每年數(shù)以千級的數(shù)量在增長,但是在不同的時(shí)段特別是像國慶、春節(jié)等大型公眾假期、上下班高峰期、特殊事件活動(dòng)期等仍然會(huì)出現(xiàn)嚴(yán)重?fù)矶隆⒌缆凡粫?、事故發(fā)生率不可控的現(xiàn)象,這些給交通安全管理帶來了巨大的麻煩和困擾,各部門想了很多辦法來應(yīng)對,比如限行、增減收費(fèi)站出入口、增設(shè)ETC通道或者加強(qiáng)人工業(yè)務(wù)訓(xùn)練提高處理速度等,此類方法一般作為擁堵或者事故發(fā)生后的應(yīng)急處理,收效甚微,如何利用現(xiàn)有的網(wǎng)絡(luò)數(shù)據(jù)來對高速公路的交通狀況進(jìn)行預(yù)測成為研究重點(diǎn),車流量本身是典型的時(shí)間序列,且受眾多因素影響,很難準(zhǔn)確預(yù)測。
本文根據(jù)灰色模型簡便易用,且能弱化干擾信息所造成的影響這樣的特點(diǎn)構(gòu)建車流量預(yù)測的基礎(chǔ)模型,但該模型預(yù)測精度稍差,于是借助卷積積分提高模型預(yù)測精度,同時(shí)利用人工魚群算法對初值不敏感,且收斂速度快,不易陷入局部尋優(yōu)的特點(diǎn)再對該模型參數(shù)進(jìn)行進(jìn)一步優(yōu)化,大大提高了預(yù)測精度及收斂速度。這種改進(jìn)的時(shí)間序列方法能更好地實(shí)現(xiàn)對擁堵及事故的預(yù)防。
1)車流量作為交通狀況的最重要的特征,許多研究工作都集中在對其預(yù)測上,主要體現(xiàn)在以下方面:利用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)模型進(jìn)行預(yù)測[1~13],這類方法存在的問題是需要大量的訓(xùn)練數(shù)據(jù),而這對近些年才開始收集的某些地區(qū)的車流數(shù)據(jù)來說尚屬于小樣本,不易展現(xiàn)這些方法的神奇效果;
2)利用信號(hào)分解方法進(jìn)行預(yù)測[14],存在的問題是原始信號(hào)較平穩(wěn)時(shí)效果較好,但對突發(fā)事件短時(shí)波動(dòng)效果就不太好;
3)利用灰色模型進(jìn)行預(yù)測[15~17],存在的問題是初始數(shù)據(jù)量較小,如果參數(shù)設(shè)置不合理,則測試精度會(huì)大大降低;
4)利用概率分布模型進(jìn)行預(yù)測[18~19],存在的問題是前期需要大量的統(tǒng)計(jì)數(shù)據(jù),且對參數(shù)依賴較大,穩(wěn)定性較差;
5)利用時(shí)間序列挖掘算法進(jìn)行預(yù)測[20~21],存在的問題是不容易有效地降低噪聲對時(shí)間序列數(shù)據(jù)挖掘過程的影響;
基于上述,國內(nèi)外的許多研究者都在著手對如何改善交通狀況進(jìn)行技術(shù)探索,而其中的車流量預(yù)測已突顯出它的重要價(jià)值,立足在他們研究的基礎(chǔ)上,精研多種算法給出一個(gè)更為合理可行的預(yù)測模型。
灰色預(yù)測模型的主要特點(diǎn)是根據(jù)少數(shù)據(jù)、貧信息對事物發(fā)展規(guī)律作出模糊性的長期描述,基本思想是用原始序列經(jīng)累加生成法生成序列,弱化原始數(shù)據(jù)的隨機(jī)性,使其呈現(xiàn)較為明顯的特征規(guī)律。該預(yù)測模型對于車流量前期數(shù)據(jù)較為匱乏的情況比較適用,基礎(chǔ)灰色模型是單變量的,即一個(gè)輸入和一個(gè)輸出,繼而又延伸出多變量灰色模型,即多個(gè)輸入和一個(gè)輸出,在此基礎(chǔ)上,Tien 又發(fā)現(xiàn)了傳統(tǒng)的多變量灰色模型存在一些問題,于是提出了一種帶卷積積分的多變量灰色模型GMC(1,n)[22],目的是提高模型預(yù)測的精度,但因?yàn)榛疑P偷年P(guān)鍵參數(shù)一般跟數(shù)據(jù)本身大小相關(guān),而車流量數(shù)據(jù)還比較少,所以還得借助其他方法對其參數(shù)進(jìn)行優(yōu)化。
人工魚群算法(AFSA)是李曉磊等提出的[23],它模范自然魚群覓食行為,利用魚的覓食、聚群和追尾行為,構(gòu)造個(gè)體底層行為;通過魚群的個(gè)體局部尋優(yōu)達(dá)到全局尋優(yōu)。該算法具有良好的全局尋優(yōu)能力,對初值和參數(shù)選擇不敏感、魯棒性強(qiáng)、簡單和易于實(shí)現(xiàn),算法的實(shí)現(xiàn)無需了解問題的特殊信息,只需對問題進(jìn)行優(yōu)劣的比較,收斂速度較快[24],因此用人工魚群算法對上述帶卷積積分的多變量灰色模型進(jìn)行參數(shù)優(yōu)化,可以得到更精確的預(yù)測。
由于上述兩種模型特點(diǎn),本文提出了用人工魚群算法優(yōu)化的帶卷積積分的多變量灰色模型AFSA-GMC(1,n)用于高速公路的車流量預(yù)測。
AFSA-GMC(1,n)模型中的參數(shù)要先經(jīng)過一些預(yù)處理,包括累加,建立白化微分方程及使用最小二乘法求解,然后進(jìn)行人工魚群參數(shù)初始化,基于這些預(yù)處理后的參數(shù),AFSA-GMC(1,n)模型的建模流程如下。
第一步:人工魚行為及評價(jià)
每條人工魚模擬覓食、聚群、追尾、隨機(jī)四種行為,通過評價(jià)函數(shù)選擇最優(yōu)行為,對比不同人工魚的個(gè)體狀態(tài),記錄最優(yōu)人工魚的狀態(tài)。
第二步:尋優(yōu)并建立預(yù)測模型
迭代尋優(yōu),若迭代次數(shù)達(dá)到最大,或者有其他條件滿足,則尋優(yōu)結(jié)束,否則重回第一步,以此建立預(yù)測模型后進(jìn)行檢驗(yàn)和評估,檢驗(yàn)通過后即可用于實(shí)際的預(yù)測應(yīng)用。
對于AFSA-GMC(1,n)模型而言,數(shù)據(jù)的預(yù)處理很關(guān)鍵,變量太多而不加篩選會(huì)導(dǎo)致計(jì)算量增大,因此引入綜合灰色關(guān)聯(lián)度,用在數(shù)量小且變化較小的應(yīng)用場景。
具體算法如下:
算法1 綜合灰色關(guān)聯(lián)度算法
輸入:外部變量,i=1,2,…,n
2)計(jì)算距離關(guān)聯(lián)度
3)計(jì)算方向關(guān)聯(lián)度
4)計(jì)算綜合關(guān)聯(lián)度
算法2 人工魚群優(yōu)化預(yù)測算法
輸入:人工魚群優(yōu)化參數(shù):視野、最大步長、人工魚總數(shù)、嘗試次數(shù)(visual,max-step,max-fish,try_number,delta)
輸出:優(yōu)化后參數(shù),預(yù)測值及預(yù)測精度
1)將綜合關(guān)聯(lián)度靠前的變量累加得新序列變量
2)建立白化微分方程,再根據(jù)最小二乘法,得到初始參數(shù)
3)經(jīng)人工魚群算法優(yōu)化后得到參數(shù)
4)迭代運(yùn)算人工魚移動(dòng)及評價(jià),進(jìn)行模型檢驗(yàn)及評估
1)數(shù)據(jù)準(zhǔn)備
待處理的數(shù)據(jù)來源包括如表1 所示為某省高速公路路網(wǎng)2013 年-2017 年春節(jié)期間的車流量及其他外部變量,以及如表2所示的以2018年某一天為例的短時(shí)車流量及其他數(shù)據(jù)。
表1 節(jié)假日年度車流量及相關(guān)外部變量數(shù)據(jù)
表2 短時(shí)車流量及相關(guān)外部變量數(shù)據(jù)
2)實(shí)驗(yàn)結(jié)果分析
對上述數(shù)據(jù)進(jìn)行查漏補(bǔ)缺刪除重復(fù)等預(yù)處理后,應(yīng)用AFSA-GMC(1,n)模型進(jìn)行預(yù)測,如表3 為多年度春節(jié)車流量訓(xùn)練結(jié)果。
表3 春節(jié)年度車流量模型訓(xùn)練結(jié)果
根據(jù)上述訓(xùn)練模型再對2018、2019、2020 年的春節(jié)車流量進(jìn)行預(yù)測,如圖1所示。
圖1 春節(jié)車流量預(yù)測
可見2018 年的預(yù)測值與實(shí)際值的誤差為0.0190,2019 年的預(yù)測值與實(shí)際值的誤差為0.0195,如表4所示,該模型的預(yù)測精度比傳統(tǒng)的多變量灰色模型GM(1,3)以及未經(jīng)人工魚群算法優(yōu)化的GMC(1,3)模型有了較顯著的提升,這是多變量灰色模型首次在車流量預(yù)測上的有效應(yīng)用。
表4 模型預(yù)測結(jié)果對照表
本文針對目前車流量預(yù)測應(yīng)用精度還不夠高,未加入外部變量,以及多變量預(yù)測模型還未在車流量預(yù)測領(lǐng)域有所應(yīng)用的現(xiàn)實(shí)情況,提出了基于人工魚群算法優(yōu)化的多變量灰色模型AFSA-GMC(1,n),在某省近幾年春節(jié)高速車流量預(yù)測應(yīng)用上,提高了收斂速度及預(yù)測精度,效果良好,是多變量灰色模型在車流量預(yù)測領(lǐng)域應(yīng)用中的新的嘗試。
當(dāng)然該模型的研究還不盡完善,亟待持續(xù)跟進(jìn),下一步努力改進(jìn)的目標(biāo)包括:
1)可以將時(shí)間預(yù)測范圍加大,不局限于節(jié)假日,比如周末或者周一等。
2)現(xiàn)在選用的多變量維度較為單一,未來可以考慮更多時(shí)空數(shù)據(jù)加入,比如天氣數(shù)據(jù)、地理位置數(shù)據(jù)等。