• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于MI-CEEMDAN-ADABOOST的快速路短時(shí)交通流預(yù)測

      2022-08-03 13:40:18奇興族
      公路交通科技 2022年6期
      關(guān)鍵詞:交通流分類器分量

      奇興族

      (深圳市城市交通規(guī)劃設(shè)計(jì)研究中心,廣東 深圳 518000)

      0 引言

      短時(shí)交通流預(yù)測是當(dāng)前針對快速路狀態(tài)判別的一個(gè)重要領(lǐng)域。目前,國內(nèi)外關(guān)于短時(shí)交通流預(yù)測方面的研究成果較多,并建立了大量預(yù)測模型[1-4]。針對交通流短時(shí)預(yù)測的模型主要有以下幾類:統(tǒng)計(jì)模型[5-6]、非線性預(yù)測模型[7-8]、深度學(xué)習(xí)模型[9-10]、組合預(yù)測模型[11-12]等,其中,將不同預(yù)測模型相結(jié)合的預(yù)測方式逐漸成為研究重點(diǎn)。如Guo等[13]提出了一種基于圖注意網(wǎng)絡(luò)(GAT)和時(shí)間卷積網(wǎng)絡(luò)(TCN)的深度學(xué)習(xí)流量預(yù)測框架,利用GAT處理空間特征和TCN處理時(shí)間特征的組合預(yù)測模型。Liu等[14]提出了一種鄰域信息煙花算法,通過產(chǎn)生不同階段的煙花亞種群,將相鄰種群的煙花信息融合并結(jié)合極限學(xué)習(xí)機(jī)進(jìn)行交通流預(yù)測。Lu等[15]提出了一種基于自回歸積分移動(dòng)平均(ARIMA)和長短時(shí)記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的短時(shí)交通流預(yù)測模型。該模型基于歷史交通數(shù)據(jù)對未來交通流量進(jìn)行短時(shí)預(yù)測,利用滾動(dòng)回歸ARIMA模型及LSTM網(wǎng)絡(luò)進(jìn)行訓(xùn)練捕捉,并通過滑動(dòng)窗口的動(dòng)態(tài)加權(quán)進(jìn)行交通流預(yù)測。

      由于交通流的非線性及不確定性較為突出,在短時(shí)交通流預(yù)測方面通常需要進(jìn)行先驗(yàn)分析,有助于提高模型的預(yù)測精度。Wu等[16]提出了一種基于集成經(jīng)驗(yàn)?zāi)B(tài)分解(EEMD)的算法,該算法能夠依據(jù)數(shù)據(jù)自身的時(shí)間尺度特征來進(jìn)行信號分解,無須預(yù)先設(shè)定任何基函數(shù),但該算法在分解時(shí)間序列的過程中會殘留一定的白噪聲,影響后續(xù)的分析和預(yù)測,而本研究使用CEEMDAN算法[17],將自適應(yīng)正負(fù)高斯白噪聲加入到時(shí)間序列的分量中,有效地解決了白噪聲從高頻到低頻的轉(zhuǎn)移傳遞問題。在交通流預(yù)測方面,針對常規(guī)的BP神經(jīng)網(wǎng)絡(luò)具有容易陷入局部極小值和收斂速度慢的缺點(diǎn),目前許多學(xué)者們提出了許多改善優(yōu)化算法,其中包括Adaboost算法、粒子群算法、多目標(biāo)遺傳算法等[18-20]。而Adaboost算法則將多個(gè)BP神經(jīng)網(wǎng)絡(luò)弱分類器組成的強(qiáng)分類器,預(yù)測準(zhǔn)確率得到大幅度的提升。

      為了提高城市快速路交通流的預(yù)測準(zhǔn)確性,本研究提出一種基于MI-CEEMDAN-Adaboost的組合預(yù)測模型,并采用美國西雅圖快速路數(shù)據(jù)驗(yàn)證模型的有效性和可行性。

      1 MI-CEEMDAN數(shù)據(jù)分解與重組

      1.1 互信息量確定歷史交通流相關(guān)性

      本研究以歷史交通流數(shù)據(jù)為基礎(chǔ),首先確定目標(biāo)路段歷史交通流之間的相關(guān)性。由于互信息量(MI值)可以估計(jì)任意一種隨機(jī)變量之間的關(guān)系,包括線性與非線性關(guān)系,并且目前已有多種方法使用互信息概念來進(jìn)行交通流分析和預(yù)測。因此,本研究選用MI值對歷史交通流進(jìn)行分析與選擇。

      MI值可由兩個(gè)離散隨機(jī)變量X和Y定義,其中p(x,y)為X和Y的聯(lián)合概率密度函數(shù),而p(x)和p(y)分別為X和Y的邊緣概率密度函數(shù),并在連續(xù)隨機(jī)變量的情況下可替換為二重定積分,即:

      (1)

      MI值在選擇變量方面必須滿足以下2個(gè)條件: (1)所選擇的變量必須為高度相關(guān)。(2)每個(gè)選定的變量與選定變量子集內(nèi)的任何其他變量之間的冗余應(yīng)該很小。

      假設(shè)輸入的數(shù)據(jù)標(biāo)簽有M個(gè)變量,則變量的總數(shù)可能為2M個(gè),很難遍歷所有變量的子集。因此,選擇基于互信息的貪心搜索,用于選擇出目標(biāo)路段交通流相關(guān)性強(qiáng)的時(shí)間序列,即:

      (2)

      式中,Xi和Xj分別為要添加到子集S的候選變量和在t時(shí)刻已選擇的變量;C為目標(biāo)變量;X為所有變量的集合;St為t時(shí)刻所選變量的子集;|St|為子集St的基數(shù)。

      式(2)中的第1項(xiàng)為給定變量Xi與目標(biāo)變量C之間的相關(guān)性,第2項(xiàng)為候選變量與被選變量之間的冗余度,第3項(xiàng)描述了C中的候選變量與St子集變量之間相互作用的程度。在時(shí)刻t,通過式(2)從變量集合St中選擇第(t+1)個(gè)變量Xt+1,通過選擇使得J(Xi)最大化的變量并將其加入到集合St中,得到新的集合St+1。

      (3)

      St+1←St∪{Xt+1}|。

      (4)

      利用該等式,可以選擇出與目標(biāo)變量相關(guān)性最大的變量子集,同時(shí)降低變量之間的冗余度。

      1.2 CEEMDAN數(shù)據(jù)分解與提取

      經(jīng)驗(yàn)?zāi)B(tài)(EMD)是一種用于分析非線性非平穩(wěn)信號的自適應(yīng)方法,它將時(shí)間序列在不同的波動(dòng)頻率下進(jìn)行分解,將一維的時(shí)間序列轉(zhuǎn)換到多維的相位空間中。然而,EMD在分解過程容易出現(xiàn)一些問題,例如在模態(tài)中存在振幅相差很大的振蕩,或在不同的模態(tài)中存在非常相似的振蕩,稱為模態(tài)混合。為了克服這些問題,提出了一種新的方法:集合經(jīng)驗(yàn)?zāi)B(tài)(EEMD)。它在信號中加入高斯白噪聲的集合上進(jìn)行EMD,通過加入高斯白噪聲,利用EMD的二元濾波器組特性填充整個(gè)時(shí)頻空間,解決了模態(tài)混合的問題。然而,EEMD也產(chǎn)生了新的問題,由于重構(gòu)信號中包含了殘余噪聲,不同信號加入噪聲后可能會產(chǎn)生不同數(shù)量的分量,為解決這一問題,本研究將使用EEMD的改進(jìn)方法自適應(yīng)經(jīng)驗(yàn)?zāi)B(tài)分解(CEEMDAN)。首先,將一維交通流時(shí)間序列分解為有限個(gè)本征模函數(shù)(IMF),所分解出來的各個(gè)IMF分量包含了原始交通流序列的不同時(shí)間尺度的局部特征信號,并且分解出來的各個(gè)IMF分量需要滿足以下條件才可判斷為真分量,否則為假分量,若為假分量則需要進(jìn)一步分解:

      (1)數(shù)據(jù)至少有2個(gè)極值點(diǎn),1個(gè)極大值點(diǎn)和1個(gè)極小值點(diǎn)。

      (2)數(shù)據(jù)的局部時(shí)域特性是由極值點(diǎn)間的時(shí)間尺度唯一確定的。

      (3)如果數(shù)據(jù)沒有極值點(diǎn)但有拐點(diǎn),則可以通過對數(shù)據(jù)微分1次或多次求得極值,然后通過積分來獲得分解結(jié)果。

      設(shè)1個(gè)一維的交通流時(shí)間序列為s(n)={si|i=1, 2,…,I},則第i(1, 2,…,I)次添加的標(biāo)準(zhǔn)正態(tài)分布的白噪聲序列為vi(n),則進(jìn)過i次經(jīng)驗(yàn)?zāi)B(tài)分解后的交通流序列為si(n)=s(n)+vi(n)。根據(jù)嵌入延時(shí)理論,如果嵌入維數(shù)m和時(shí)間延遲τ選擇適當(dāng),則進(jìn)行重構(gòu)后的相空間與原始相空間等價(jià),具有相同的拓?fù)浣Y(jié)構(gòu)。則重構(gòu)后的相空間表示為S={Si|Si=[si+si+τ,…,si+(m-1)τ],i=1,2,…,M}。其中,M=N-(M-1)τ為相點(diǎn)數(shù),在重構(gòu)相位空間中,每個(gè)相點(diǎn)包含了m個(gè)元素,并且每2個(gè)相鄰的元素之間的間隔為τ。其中,嵌入維數(shù)和時(shí)間延遲的確定可決定相空間重構(gòu)與原信號的相似程度,在近幾年的研究中發(fā)現(xiàn),嵌入維數(shù)m和時(shí)間延遲τ有密切關(guān)系,可利用延遲時(shí)間窗τw=(m-1)τ建立2個(gè)未知參數(shù)之間的關(guān)系。通過C-C算法建立關(guān)聯(lián)積分并構(gòu)建統(tǒng)計(jì)量和時(shí)間延遲之間的關(guān)系求解τ和τw,從而計(jì)算得出嵌入維數(shù),關(guān)聯(lián)積分定義為:

      (5)

      式中,M為相點(diǎn)數(shù);r為鄰域半徑;dij為相空間中兩點(diǎn)之間的歐氏距離;H(z)為Heaviside階躍函數(shù),可定義為:

      (6)

      將交通流時(shí)間序列為s(n)={si|i=1, 2,…,I}劃分為n個(gè)不相交的子序列,對于每個(gè)不相交的子序列有:

      (7)

      對所有的s(m,N,r,t)取平均值:

      (8)

      式中,M為嵌入維數(shù);j為r的個(gè)數(shù)。本研究定義ΔS(m,t)為r的最大偏差,則:

      ΔS(m,t)=max{S(m,rj,t)}-min{S(m,rj,t)}。

      (9)

      研究表明,當(dāng)樣本量小于1 024時(shí),嵌入維數(shù)m通常取值小于6,當(dāng)樣本量大于1 024時(shí),嵌入維數(shù)m取值范圍在6附近可以獲得穩(wěn)定的排列熵。為了更加精確地求得嵌入維數(shù)和延遲時(shí)間,分別計(jì)算以下3種統(tǒng)計(jì)量:

      (10)

      (11)

      (12)

      2 BP-Adaboost預(yù)測模型構(gòu)建

      自適應(yīng)增強(qiáng)(Adaboost)算法是一種迭代算法,其核心思想是針對同一個(gè)訓(xùn)練集訓(xùn)練不同的分類器(弱分類器),然后將這些弱分類器集合起來構(gòu)成1個(gè)強(qiáng)分類器。開始時(shí),每個(gè)訓(xùn)練樣本的權(quán)重是相同的,在此樣本下訓(xùn)練第1個(gè)弱分類器,對于分類出現(xiàn)錯(cuò)誤的樣本,增加其對應(yīng)的權(quán)重,而對于分類正確的樣本,則減小其對應(yīng)的權(quán)重,之后得到了1個(gè)新的樣本分布,在新的樣本下再次對新樣本進(jìn)行訓(xùn)練得到第2個(gè)弱分類器。以此類推,經(jīng)過N次循環(huán)得到N個(gè)弱分類器,最后將這N個(gè)弱分類器進(jìn)行組合,通過加權(quán)的投票機(jī)制讓分類效果較好的弱分類器具有較大的權(quán)重,而分類效果較差的分類器具有較小的權(quán)重。具體算法步驟如下。

      步驟1:從訓(xùn)練樣本中隨機(jī)選擇N組訓(xùn)練數(shù)據(jù)構(gòu)建訓(xùn)練數(shù)據(jù)集T={(x1,y1), (x2,y2),…, (xN,yN)},初始化訓(xùn)練樣本的權(quán)值分布:D1=(w1,1,w1,2,…,w1,i),w1,i=1/N,i=1, 2,…,N,根據(jù)樣本的輸入輸出維數(shù)確定神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),初始化BP神經(jīng)網(wǎng)絡(luò)權(quán)值和閾值。

      步驟2:弱分類器預(yù)測。使用具有權(quán)值分布Dm的訓(xùn)練集進(jìn)行學(xué)習(xí),訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)并預(yù)測訓(xùn)練輸出,得到弱分類器Gm(x),計(jì)算Gm(x)在訓(xùn)練集上的分類誤差率:

      (13)

      步驟3:計(jì)算Gm(x)在強(qiáng)分類器中所占的權(quán)重:

      (14)

      步驟4:測試數(shù)據(jù)權(quán)重調(diào)整。根據(jù)預(yù)測序列的權(quán)重更新訓(xùn)練數(shù)據(jù)集的權(quán)重分布:

      (15)

      步驟5:構(gòu)建強(qiáng)分類器。通過進(jìn)行N輪的弱分類器訓(xùn)練,將各個(gè)分類器按照分類精度重新分配權(quán)值組合,構(gòu)成一個(gè)強(qiáng)分類器進(jìn)行分類:

      (16)

      通過上述5個(gè)步驟構(gòu)建BP-Adaboost組合預(yù)測模型,并對CEEMDAN分解后的有效分量IMF進(jìn)行預(yù)測和重組。

      3 模型驗(yàn)證

      選用美國西雅圖高速公路檢測器數(shù)據(jù)進(jìn)行驗(yàn)證,選擇該高速公路路段104號檢測器的歷史數(shù)據(jù)作為訓(xùn)練集。數(shù)據(jù)采集時(shí)間為2019年10月1日至2019年10月31日,采集時(shí)間間隔為5 min,每天采集144組數(shù)據(jù),共采集4 464組數(shù)據(jù),試驗(yàn)環(huán)境為MatlabR2019b。

      計(jì)算樣本中的交通流數(shù)據(jù)之間的互信息量,并從中選出相關(guān)性最高的10 d的數(shù)據(jù)作為模型的訓(xùn)練集,MI值計(jì)算結(jié)果分布圖如圖1~2所示。i,j分別為目標(biāo)交叉口的第i天和第j天的交通流柵格化數(shù)據(jù),其中亮度越高表明相關(guān)性越高,任意2個(gè)變量之間的MI值反映了兩者之間的相關(guān)性。副對角線MI值均為1,是由于各個(gè)數(shù)據(jù)的自相關(guān)性最高。

      圖1 MI值相關(guān)性分布值三維圖Fig.1 Three-dimensional plot of MI correlation distribution values

      圖2 MI值相關(guān)性分布值二維熱圖Fig.2 Two-dimensional heatmap of MI correlation distribution values

      通過對31 d數(shù)據(jù)計(jì)算MI值,選擇出其中相關(guān)性最高10 d的交通流數(shù)據(jù)作為模型的訓(xùn)練集進(jìn)行訓(xùn)練,將前9 d的數(shù)據(jù)作為訓(xùn)練集訓(xùn)練模型,將第10 d數(shù)據(jù)進(jìn)行驗(yàn)證。

      通過MATLAB編程將訓(xùn)練集中的原始交通流數(shù)據(jù)進(jìn)行CEEMDAN分解,并在分解時(shí)添加標(biāo)準(zhǔn)差為0.2的白噪聲。原始交通流數(shù)據(jù)被分解為12個(gè)不同尺度的IMF分量,相鄰IMF分量之間的波動(dòng)程度相似,其中IMF12為時(shí)間序列的殘余分量。

      為了驗(yàn)證該方法的有效性,本研究將原始交通流序列分別使用EMD和CEEMDAN進(jìn)行分解,并對分解過程進(jìn)行分析。通過觀察2種方法分解分量的數(shù)量和迭代次數(shù)來評價(jià)方法的優(yōu)劣性,分解結(jié)果如圖3所示。使用EMD分解后的分量數(shù)與CEEMDAN分解后的分量數(shù)相同。但是,EMD分解過程中的迭代次數(shù)遠(yuǎn)遠(yuǎn)大于CEEMDAN,因此,使用CEEMDAN算法分解更加高效。

      圖3 與IMF箱線圖Fig.3 Boxplot of IMF components

      由于交通流數(shù)據(jù)具有一定的隨機(jī)性和非平穩(wěn)性,使得分解后得到的交通流IMF分量較多。因此,為了減少與原始信號相關(guān)性較小的IMF的干擾,通過計(jì)算各個(gè)IMF的時(shí)間序列復(fù)雜性,選擇流量序列相關(guān)性最高的幾個(gè)IMF分量。

      圖4 交通流量時(shí)間序列的曲線和 Scor(t)-t 曲線Fig.4 and Scor(t)-t curves of traffic flow time series

      將計(jì)算得出的嵌入維數(shù)和延遲時(shí)間代入排列熵中,計(jì)算各個(gè)IMF的排列熵值,選擇其中最大值的1/10作為閾值進(jìn)行篩選,由圖5可得分量IMF8的排列熵為最大值,因此篩選閾值為PE(IMF8)/10=0.087 35,圖中位于虛線以上的IMF即為有效分量,分別為IMF1,IMF4,IMF5,IMF6,IMF7,IMF8,IMF9,其中IMF12為余項(xiàng)分量,在重組階段添加。

      圖5 有效分量選取Fig.5 Effective component selection

      選用神經(jīng)網(wǎng)絡(luò)-自適應(yīng)增強(qiáng)(BP-Adaboost)對交通流進(jìn)行預(yù)測分析。自適應(yīng)增強(qiáng)是一種提升方法,將多個(gè)弱分類器組合成強(qiáng)分類器。該方法可充分利用不同分類算法的優(yōu)勢進(jìn)行建模,這樣訓(xùn)練的模型精度高于單一設(shè)置的模型。BP-Adaboost模型是將BP神經(jīng)網(wǎng)絡(luò)作為弱分類器,反復(fù)訓(xùn)練BP神經(jīng)網(wǎng)絡(luò)預(yù)測樣本,通過Adaboost得到多個(gè)BP神經(jīng)網(wǎng)絡(luò)弱分類器組成的強(qiáng)分類器。

      圖6 BP-Adaboost模型預(yù)測結(jié)果及有效性Fig.6 Prediction result and effectiveness of BP-Adaboost model

      使用BP-Adaboost模型對各個(gè)分量進(jìn)行訓(xùn)練和預(yù)測,并將各分量預(yù)測重組得到最終的預(yù)測結(jié)果。各個(gè)分量及分量預(yù)測結(jié)果重構(gòu)如下,真實(shí)值與預(yù)測值之間相關(guān)系數(shù)達(dá)到0.97。

      為驗(yàn)證本方法的有效性,分別構(gòu)建KNN,SVM,ELM,CEEMDAN-KNN,CEEMDAN-SVM,CEEMDAN-ELM進(jìn)行對比試驗(yàn),預(yù)測評價(jià)指標(biāo)選取平均均方誤差MAE、均方根誤差RMSE、平均絕對百分誤差MAPE。

      (17)

      (18)

      (19)

      由表1及圖7可知,與其他預(yù)測模型相比,經(jīng)過本研究的MI-CEEMDAN-Adaboost組合預(yù)測模型的MAE,RMSE,MAPE均低于其他模型,說明其預(yù)測誤差最小,預(yù)測精度最高。ELM模型與真實(shí)值的擬合度最低,而SVM和KNN模型的擬合度逐漸提高,但仍低于經(jīng)過經(jīng)驗(yàn)?zāi)B(tài)分解后的CEEMDAN-ELM,CEEMDAN-KNN,CEEMDAN-SVM的模型預(yù)測精度,表明經(jīng)過MI-CEEMDAN重構(gòu)后的模型預(yù)測效果有所提高。

      表1 各模型預(yù)測結(jié)果對比Tab.1 Prediction results of different models

      圖7 各模型經(jīng)過MI-CEEMDAN處理后的預(yù)測結(jié)果對比Fig.7 Comparison of prediction results of different models after MI-CEEMDAN processing

      綜上所述,基于MI-CEEMDAN-Adaboost的組合預(yù)測模型對快速路短時(shí)交通流預(yù)測有較好的預(yù)測效果。

      4 結(jié)論

      本研究利用快速路歷史交通流時(shí)間序列,提出了一種基于MI-CEEMDAN-Adaboost的快速路短時(shí)交通流量預(yù)測方法,該方法與其他經(jīng)典模型相比,交通流預(yù)測值更加接近真實(shí)值,并且MAE,RMSE,MAPE均低于其他模型。

      利用互信息量對歷史交通流時(shí)間序列進(jìn)行相關(guān)性分析,選擇相關(guān)性較高的時(shí)間序列,剔除相關(guān)性低的樣本,能夠保證訓(xùn)練樣本的有效性。

      通過對模型進(jìn)行MI-CEEMDAN分解并重構(gòu),各模型的預(yù)測誤差均明顯降低,預(yù)測精度明顯提高。

      猜你喜歡
      交通流分類器分量
      帽子的分量
      一物千斤
      智族GQ(2019年9期)2019-10-28 08:16:21
      論《哈姆雷特》中良心的分量
      BP-GA光照分類器在車道線識別中的應(yīng)用
      電子測試(2018年1期)2018-04-18 11:52:35
      分量
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      交通流隨機(jī)行為的研究進(jìn)展
      路內(nèi)停車對交通流延誤影響的定量分析
      具有負(fù)壓力的Aw-Rascle交通流的Riemann問題
      三明市| 福清市| 长治县| 滦南县| 霍林郭勒市| 炉霍县| 越西县| 大方县| 霞浦县| 东莞市| 东辽县| 巴中市| 蓬安县| 安新县| 鹤壁市| 广南县| 泗阳县| 邵武市| 资阳市| 舒城县| 梓潼县| 辉县市| 延安市| 景德镇市| 留坝县| 洛隆县| 临西县| 常熟市| 闵行区| 临沂市| 满洲里市| 安乡县| 龙海市| 扬中市| 托克托县| 清流县| 措勤县| 大田县| 钟山县| 视频| 固原市|