李俊?胡婷
摘? 要:為了提高物流的配送效率,尋求合理的配送路徑,通過(guò)分析短期歷史交通流量,使用集合經(jīng)驗(yàn)?zāi)B(tài)分解去噪,以擬合優(yōu)度最大化為目標(biāo),運(yùn)用麻雀搜索算法優(yōu)化懲罰參數(shù)和核函數(shù)參數(shù)的最小二乘支持向量機(jī)回歸預(yù)測(cè)短期交通流。結(jié)果表明集合經(jīng)驗(yàn)?zāi)B(tài)分解能有效去除短期交通流中的噪聲,構(gòu)建的EEMD-SSA-LSSVR模型可以高效地預(yù)測(cè)短期交通流量。
關(guān)鍵詞:麻雀搜索算法;集合經(jīng)驗(yàn)?zāi)B(tài)分解;短時(shí)交通流預(yù)測(cè);最小二乘支持向量機(jī)回歸
中圖分類號(hào):TP18? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):2096-4706(2022)06-0093-04
Short Term Traffic Flow Prediction Based on EEMD-SSA-LSSVR
LI Jun, HU Ting
(School of Business Administration, Chongqing Technology and Business University, Chongqing? 400067, China)
Abstract: To improve the distribution efficiency of logistics and find the reasonable distribution route, the ensemble empirical mode is used to decompose noise signals by analyzing the short-term historical traffic flow. Aiming at maximizing the goodness of fit, the sparrow search algorithm is used to optimize the least squares support vector machine regression of penalty parameters and kernel function parameters to predict the short-term traffic flow. The results show that the ensemble empirical mode decomposition can effectively remove the noise in the short-term traffic flow, and the constructed EEMD-SSA-LSSVR model can effectively predict the short-term traffic flow.
Keywords: SSA; EEMD; short term traffic flow prediction; LSSVR
0? 引? 言
交通狀況直接影響著車輛的行駛速度,因而間接影響著物流的配送效率。本文在時(shí)變路網(wǎng)下冷鏈低碳物流路徑優(yōu)化研究和重慶市物流發(fā)展水平與農(nóng)業(yè)現(xiàn)代化測(cè)度及其時(shí)空耦合協(xié)調(diào)研究這兩個(gè)課題中,發(fā)現(xiàn)道路交通流預(yù)測(cè)對(duì)路徑優(yōu)化和區(qū)域經(jīng)濟(jì)發(fā)展至關(guān)重要。因此本文使用麻雀搜索算法優(yōu)化最小二乘支持向量機(jī)回歸的參數(shù)以提高交通流預(yù)測(cè)準(zhǔn)確度。
1? 模型構(gòu)建
1.1? 集合經(jīng)驗(yàn)?zāi)B(tài)分解
集合經(jīng)驗(yàn)?zāi)B(tài)分解(Ensemble Empirical Mode Decomposition, EEMD)是由Wu等[1]在2009年提出的一種噪聲輔助數(shù)據(jù)分析方法。EEMD首先將白噪聲wj(d)引入到初始數(shù)據(jù)I(d)中,如式(1)。其次對(duì)含噪數(shù)據(jù)Ij(d)進(jìn)行分解得到第j個(gè)本征模函數(shù)(intrinsic mode function, IMF)集。在EEMD的第j輪分解過(guò)程中,帶噪的Ij(d)被分解為IMFsj,k(d)和殘差rj,k(d),如式(2)。當(dāng)完成N輪分解后,求解N組IMF的平均值獲得最終IMF集,如式(3)所示:
Ij(d)=I(d)+wj(d)(1)
(2)
(3)
其中,j表示第j次分解,滿足0(4)
1.2? 最小二乘支持向量機(jī)回歸
對(duì)于一個(gè)給定的學(xué)習(xí)樣本集,,利用非線性映射φ把數(shù)據(jù)集從輸入空間映射一個(gè)高維特征空間,以使輸入空間中的非線性擬合問(wèn)題變成高維特征空間中的線性擬合問(wèn)題[2]。高維特征空間的線性回歸函數(shù)如式(5)所示。式中,w為權(quán)值矢量,b為偏置。
f (x)+wTφ (x)+b(5)
LSSVM選擇誤差ξi的二次項(xiàng),優(yōu)化問(wèn)題和約束條件為:
(6)
St.yi=wTφ(xi)+b+ξi,i=1,2,…,l (7)
式(6)中,ξi表示誤差,C為容錯(cuò)懲罰因子,定義Lagrange函數(shù):
i=1,2,…,l (8)
根據(jù)庫(kù)恩-塔克(KKT)條件可得:
,,αi=Cξi,(9)
消去變量w和ξ可得到如式(10)的線性系統(tǒng)。式中,lv=[1,…,1]T,Ωij=φT(xi)φ(xj)。
(10)
采用最小二乘法求解上面的線性方程組得到回歸函數(shù)為:
(11)
引入核函數(shù)K(x,xi)=φT(x)φ(xi),則LSSVR回歸模型見(jiàn)式(12):
(12)
本文K(x,xi)選取徑向基函數(shù)。
2? 算法設(shè)計(jì)
麻雀搜索算法(Sparrow Search Algorithm, SSA)由Xue等在2020年提出[3]。算法中麻雀分為發(fā)現(xiàn)者和加入者,發(fā)現(xiàn)者負(fù)責(zé)搜索食物和為加入者提供方向,加入者利用發(fā)現(xiàn)者提供的信息獲取食物。麻雀可以在這兩種身份之間相互轉(zhuǎn)換,但發(fā)現(xiàn)者和加入者的比例不變。
假設(shè)在d維空間中存在n只麻雀,第i只麻雀的位置為Xi=[xi1,xi2,…,xid],i=1,2,…,n,xid為第i只麻雀在第d維空間中的位置。f(Xi)=f([xi,1xi,2…xi,d])為麻雀i的適應(yīng)度,其中f()為適應(yīng)度函數(shù)。在算法迭代過(guò)程中,發(fā)現(xiàn)者的位置更新方式如式(13)所示。
(13)
t為當(dāng)前迭代次數(shù),維度j∈[1,2,…,d],為t次迭代中麻雀i在j維的位置,T為最大迭代次數(shù),隨機(jī)數(shù)Q服從正態(tài)分布,L為1×d的矩陣,隨機(jī)數(shù)α∈(0,1),預(yù)警值R2∈[0,1],安全值ST∈[0.5,1]。R2ST表示一些麻雀已經(jīng)發(fā)現(xiàn)了天敵,并發(fā)出了警報(bào),此時(shí)所有麻雀需迅速向安全區(qū)域移動(dòng)。
(14)
加入者的位置更新方式如式(14)所示。為在第t次迭代中全局最差位置,1×d的矩陣A中每個(gè)元素隨機(jī)賦值1或-1,A+=AT(AAT)-1。為t+1次迭代中發(fā)現(xiàn)者的最優(yōu)位置。當(dāng)i>n/2時(shí),適應(yīng)度值較低的加入者i處于十分饑餓的狀態(tài),需要飛往其他地方覓食。
當(dāng)麻雀發(fā)現(xiàn)天敵時(shí)會(huì)發(fā)出報(bào)警信號(hào),這些麻雀的位置在種群中隨機(jī)產(chǎn)生,如式(15)所示:
(15)
為第t次迭代中全局最優(yōu)位置,步長(zhǎng)控制參數(shù)β為服從正態(tài)分布的隨機(jī)數(shù),隨機(jī)數(shù)K∈[-1,1]表示麻雀移動(dòng)方向同時(shí)也是步長(zhǎng)控制參數(shù),fi為麻雀i的適應(yīng)度,fw為當(dāng)前全局最差適應(yīng)度值,fg為當(dāng)前全局最優(yōu)適應(yīng)度值,ε為極小常數(shù)。fi>fg表示麻雀處于種群邊緣,易受天敵攻擊。fi=fg表明處于種群中間的麻雀意識(shí)到了危險(xiǎn),需要靠近其他麻雀以減少被捕食的風(fēng)險(xiǎn)。SSA-LSSVR短期交通流預(yù)測(cè)的適應(yīng)度函數(shù)為擬合優(yōu)度,如式(16),其中yi為真實(shí)值,為預(yù)測(cè)值,為均值。算法流程圖如圖1所示。
(16)
3? 短期交通流預(yù)測(cè)
交通數(shù)據(jù)來(lái)自明尼蘇達(dá)州交通部數(shù)據(jù)研究實(shí)驗(yàn)室(http://www.d.umn.edu/~tkwon/TDRL-Software/Download.html)。數(shù)據(jù)是位于I-35W上S64站點(diǎn)的341號(hào)、342號(hào)和343號(hào)探測(cè)器2016年1月1日至2016年1月15日(15天)的平均值,站點(diǎn)位置如圖2所示。數(shù)據(jù)每隔5分鐘測(cè)量一次。數(shù)據(jù)集分為訓(xùn)練集和測(cè)試集,分別為14天和1天。實(shí)驗(yàn)采用PyCharm IDE編程,在Windows11 X64操作系統(tǒng)、AMD Ryzen 75800H CPU、16 GB內(nèi)存環(huán)境下運(yùn)行。本文麻雀種群規(guī)模為30,迭代次數(shù)為50,發(fā)現(xiàn)者比例為20%,預(yù)警麻雀比例為10%,預(yù)警值為0.6。
3.1? 數(shù)據(jù)預(yù)處理
3.1.1? 時(shí)序相空間重構(gòu)
設(shè)時(shí)間序列數(shù)據(jù)為[T1,T2,…,Tn],建立滑動(dòng)窗口如式(17)所示,參考文獻(xiàn)[4],本文m=5。
,(17)
3.1.2? 數(shù)據(jù)標(biāo)準(zhǔn)化
由于LSSVR的假設(shè)建立在數(shù)據(jù)集是正態(tài)分布的基礎(chǔ)上,因此采用Z-score規(guī)范化,將原始交通流映射到均值為0,標(biāo)準(zhǔn)差為1的分布上,見(jiàn)式(18),其中μ為均值,δ為方差[5]。
z=(Xi-μ)/δ(18)
3.2? 集合經(jīng)驗(yàn)?zāi)B(tài)分解
采用EEMD分解得到的IMF函數(shù)如圖3所示。根據(jù)波動(dòng)頻率和瞬時(shí)頻率,將IMF1和IMF2作為噪音去除,將IMF3-11求和重構(gòu)為去噪交通流。以2016年1月15日的交通流為例,由圖4可知,去噪后的交通流曲線更加平滑。
3.3? 預(yù)測(cè)結(jié)果比較
四種模型的預(yù)測(cè)結(jié)果如表1所示,預(yù)測(cè)效果如圖5至圖8所示。使用默認(rèn)參數(shù)的LSSVR預(yù)測(cè)原始交通流,擬合優(yōu)度R2為0.776 07。使用SSA優(yōu)化LSSVR的懲罰系數(shù)C和核函數(shù)參數(shù)gamma預(yù)測(cè)原始交通流,擬合優(yōu)度R2增加,均方誤差MSE減小,擬合效果提高。優(yōu)化后的懲罰系數(shù)C和核函數(shù)參數(shù)gamma分別為0.286 000 42和0.212 426 08。SSA-LSSVR的收斂曲線如圖9所示,發(fā)現(xiàn)收斂曲線呈階梯型,SSA在第12代收斂。
為降低噪聲對(duì)預(yù)測(cè)的影響,使用EEMD對(duì)原始交通流去噪,再使用LSSVR預(yù)測(cè)去噪后的交通流,擬合優(yōu)度R2為0.996 78。相比原始交通流預(yù)測(cè),去噪后的預(yù)測(cè)效果明顯提升。最后,使用SSA優(yōu)化LSSVR的懲罰系數(shù)C和核函數(shù)參數(shù)gamma預(yù)測(cè)去噪后的交通流,擬合優(yōu)度R2增加,為0.996 93;均方誤差MSE減小,為0.034 47,進(jìn)一步提高了LSSVR的預(yù)測(cè)效果,優(yōu)化后的懲罰系數(shù)C和核函數(shù)參數(shù)gamma分別為18.939 801 07和0.652 176 03。
SSA-EEMD-LSSVR的收斂曲線如圖10所示,發(fā)現(xiàn)SSA在第8代收斂,相比原始交通流預(yù)測(cè),去噪后算法收斂速度更快,尋優(yōu)精度更高。
4? 結(jié)? 論
針對(duì)短期交通流非線性、含噪性的特點(diǎn),本文使用集合經(jīng)驗(yàn)?zāi)B(tài)分解去除短期交通流中的噪音,提高了短期交通流預(yù)測(cè)的準(zhǔn)確率;其次,本文使用麻雀搜索算法優(yōu)化最小二乘支持向量回歸的懲罰參數(shù)和核函數(shù)參數(shù),可以減少試參的盲目性并提高模型預(yù)測(cè)的精度。
參考文獻(xiàn):
[1] WU Z H, HUANG N E. ENSEMBLE EMPIRICAL MO DEDECOMPOSITION:ANOISE-ASSISTED DATA ANALYSIS METHOD [J].Advances in Adaptive Data Analysis,2009,1(1):1-44.
[2] SUYKENS J A,VANDEWALLE J,MOOR B D. Optimal control by least squares support vector machines [J].Neural Networks,2001,14(1):23-35.
[3] XUE J K,SHEN B. A novel swarm intelligence optimization approach:sparrow search algorithm [J].Systems Science & Control Engineering,2020,8(1):23-24.
[4] 曹成濤,徐建閩.基于PSO-SVM的短期交通流預(yù)測(cè)方法 [J].計(jì)算機(jī)工程與應(yīng)用,2007(15):12-14.
[5] ZHANG Q Y,QIAN H,CHEN Y P, et al. A short-term traffic forecasting model based on echo state network optimized by improved fruit fly optimization algorithm [J].Neurocomputing,2020,416:117-124.
作者簡(jiǎn)介:李?。?998—),男,漢族,江西九江人,中級(jí)物流師,碩士研究生,研究方向:智能算法;胡婷(1996—),女,漢族,四川遂寧人,碩士研究生在讀,研究方向:智能算法。
收稿日期:2022-02-09
基金項(xiàng)目:重慶工商大學(xué)研究生創(chuàng)新型科研項(xiàng)目(yjscxx2021-112-14、yjscxx2021-112-15)