• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    考慮多特征的高速公路交通流預(yù)測(cè)模型

    2021-06-29 07:05:04李桃迎王婷張羽琪
    關(guān)鍵詞:交通流收費(fèi)站天氣

    李桃迎,王婷,張羽琪

    (大連海事大學(xué),航運(yùn)經(jīng)濟(jì)與管理學(xué)院,遼寧大連116026)

    0 引言

    高速公路交通擁堵現(xiàn)象不僅給人們出行帶來極大不便,也制約了高速公路服務(wù)質(zhì)量的提升,影響區(qū)域經(jīng)濟(jì)和社會(huì)發(fā)展。雖然高德地圖、百度地圖等多款A(yù)PP都提供了實(shí)時(shí)交通狀態(tài)查詢,但并未提供未來12 h、24 h 甚至更長(zhǎng)時(shí)間的交通流預(yù)測(cè)功能。提前一天或多天預(yù)知高速公路交通流,不僅可以輔助高速公路管理人員提前安排部署、合理誘導(dǎo)車輛分流、疏散,緩解高速公路擁堵現(xiàn)象,也可以為公眾出行提供參考。

    高速公路交通流預(yù)測(cè)作為研究熱點(diǎn)在不同發(fā)展時(shí)期均取得較為豐碩的成果,研究趨勢(shì)從單一的參數(shù)模型過渡到非參數(shù)模型及混合模型。典型的參數(shù)模型有自回歸積分移動(dòng)平均(Autoregressive Integrated Moving Average,ARIMA)模型和卡爾曼濾波器模型。如Williams 等[1]提出使用季節(jié)性ARIMA 模型對(duì)交通流進(jìn)行預(yù)測(cè)以提高預(yù)測(cè)精度。相較于非參數(shù)模型,參數(shù)模型依賴于平穩(wěn)性假設(shè),不能反應(yīng)交通流的非線性和不確定性特征,因此,非參數(shù)模型成為交通流預(yù)測(cè)的有效方法。非參數(shù)模型包括支持向量機(jī)回歸(Support Vector Regression,SVR)模型、貝葉斯模型以及深度學(xué)習(xí)模型[2]等。其中,深度學(xué)習(xí)模型通過其強(qiáng)大的非線性擬合和深層特征表達(dá)能力可以更精準(zhǔn)地表達(dá)交通流數(shù)據(jù)內(nèi)部的復(fù)雜結(jié)構(gòu)。如Zhao 等[3]將長(zhǎng)短期記憶(Long-Short Term Memory,LSTM)神經(jīng)網(wǎng)絡(luò)應(yīng)用于交通流預(yù)測(cè)以提高模型預(yù)測(cè)精度。Wu 等[4]提出將卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)和門控循環(huán)單元神經(jīng)網(wǎng)絡(luò)(Gated Recurrent Unit,GRU)結(jié)合,CNN捕獲路網(wǎng)交通數(shù)據(jù)的空間分布,GRU捕獲數(shù)據(jù)短期分布的變化及長(zhǎng)期依賴。

    LSTM 能夠處理具有長(zhǎng)期依賴關(guān)系的時(shí)序數(shù)據(jù),而GRU是LSTM的變體,通過犧牲預(yù)測(cè)精度而減少計(jì)算量。LSTM和GRU的集成解決了多層LSTM計(jì)算量大的問題,同時(shí)又維持了模型的精確度。但LSTM和GRU只能提取交通流的動(dòng)態(tài)時(shí)序特征,無法提取交通流數(shù)據(jù)的空間相關(guān)性,往往需要手工將空間信息編碼作為網(wǎng)絡(luò)輸入。為了更好地刻畫交通流的空間特征,一些學(xué)者又引入了CNN 進(jìn)行空間建模,通過CNN 共享卷積核能夠處理高維數(shù)據(jù),并自動(dòng)學(xué)習(xí)數(shù)據(jù)的空間特征,從而提高模型的預(yù)測(cè)精確度,但單一CNN 模型只能捕捉短期局部依賴關(guān)系。

    由于高速公路交通流的變化不僅與歷史交通流存在長(zhǎng)期的時(shí)間依賴關(guān)系,還與其上下游交通流的空間分布存在明顯相關(guān)性,且容易受天氣、路況等外界環(huán)境影響,為此,本文針對(duì)高速公路交通流的時(shí)空特性和外部因素影響,提出考慮多特征的高速公路交通流預(yù)測(cè)模型。該模型利用CNN自動(dòng)提取交通流的空間特征,運(yùn)用LSTM和GRU 提取數(shù)據(jù)的周期性和趨勢(shì)性特征,解決時(shí)序數(shù)據(jù)的長(zhǎng)期依賴性問題。采用某高速公路交通流數(shù)據(jù)進(jìn)行實(shí)驗(yàn),驗(yàn)證本文模型的預(yù)測(cè)精度。結(jié)果表明,本文模型與4 種典型深度學(xué)習(xí)模型(LSTM、GRU、CNN-LSTM、CNN-GRU)相比具有更高的預(yù)測(cè)精度。

    1 集成深度學(xué)習(xí)預(yù)測(cè)模型

    本文所提模型為一種集成深度學(xué)習(xí)模型(Hybrid Deep Learning,HDL),其框架如圖1所示,主要包括數(shù)據(jù)預(yù)處理、特征矩陣構(gòu)建、CNN和LSTM、GRU 這4 個(gè)方面。該模型首先針對(duì)高速公路交通流數(shù)據(jù)進(jìn)行預(yù)處理,構(gòu)造包含時(shí)空和天氣的二維特征矩陣,隨后將構(gòu)造的二維特征矩陣經(jīng)過CNN提取交通流的空間特征,然后利用一層LSTM和一層GRU 提取交通流的時(shí)間特征,最后通過全連接層,得到最終輸出的結(jié)果。

    圖1 集成深度學(xué)習(xí)模型的框架Fig.1 Framework of Hybrid deep learning model

    1.1 數(shù)據(jù)預(yù)處理與滑動(dòng)窗口

    高速公路交通流數(shù)據(jù)和天氣數(shù)據(jù)存在數(shù)據(jù)缺失的問題,為提高數(shù)據(jù)質(zhì)量需要考慮數(shù)據(jù)的預(yù)處理。線性插值是代數(shù)插值法中最簡(jiǎn)單的形式,是處理非線性函數(shù)運(yùn)用最多的方法,其以線性平滑的方式維系了數(shù)據(jù)趨勢(shì)的漸進(jìn)性,適用于連續(xù)缺失長(zhǎng)度小的數(shù)據(jù)集。鑒于此,本文選擇線性插值作為缺失值填充的方法。

    其次,為保證預(yù)測(cè)結(jié)果的可靠性,對(duì)數(shù)據(jù)進(jìn)行分析之前,先將數(shù)據(jù)進(jìn)行歸一化處理,消除不同屬性之間的量綱。選用應(yīng)用最為廣泛的min-max 方法對(duì)原始數(shù)據(jù)進(jìn)行線性變換,將數(shù)據(jù)統(tǒng)一映射到[0,1]區(qū)間上。min-max方法的公式為

    式中:xi為第i個(gè)原始數(shù)據(jù);為歸一化后的新數(shù)據(jù);xmin為最小值;xmax為最大值。

    隨后,考慮到外界因素對(duì)交通流預(yù)測(cè)結(jié)果的影響,將數(shù)據(jù)中的屬性兩兩之間進(jìn)行皮爾遜相關(guān)性分析,并根據(jù)相關(guān)系數(shù)大小選取相關(guān)特征。

    另外,時(shí)間序列數(shù)據(jù)的序列長(zhǎng)度可能影響預(yù)測(cè)精度,本文采用滑動(dòng)窗口方法[5]確定序列長(zhǎng)度,該方法為每一個(gè)時(shí)間序列t構(gòu)造一個(gè)樣本。[t0-Δt,t0)上的值作為特征,t0作為標(biāo)簽構(gòu)造樣本,Δt被稱為窗口大小。為了更直觀地介紹滑動(dòng)窗口方法,圖2給出利用滑動(dòng)窗口構(gòu)造時(shí)間樣本序列的例子。該例假設(shè)有10 條時(shí)間序列記錄,包括T1,T2,…,T9、T10。當(dāng)Δt=5 時(shí),對(duì)于樣本1來說,T1,T2,…,T5作為特征,T6作為標(biāo)簽;對(duì)于樣本2 來說,T2,T3,…,T6作為特征,T7作為標(biāo)簽。以此類推,共得到5個(gè)樣本;當(dāng)Δt=6 時(shí),T1,T2,…,T6作為特征,T7作為標(biāo)簽,以此類推,共得到4個(gè)樣本。

    圖2 滑動(dòng)窗口Fig.2 Sliding window

    窗口大小會(huì)影響構(gòu)造樣本的數(shù)量和樣本中的特征數(shù)量??梢钥吹剑寒?dāng)給定一個(gè)數(shù)據(jù)集,窗口越小,單個(gè)時(shí)間序列涵蓋的時(shí)間越短,構(gòu)造的時(shí)間序列樣本越多;窗口越大,單個(gè)時(shí)間序列涵蓋的時(shí)間越長(zhǎng),構(gòu)造的時(shí)間序列樣本越少。因此,選擇一個(gè)合適的窗口大小對(duì)高速公路交通流預(yù)測(cè)至關(guān)重要。

    1.2 構(gòu)建特征矩陣

    由于當(dāng)前道路交通流的變化與該道路的歷史交通流,上下游的交通流以及天氣的變化相關(guān)。構(gòu)建一個(gè)包含時(shí)間、空間以及天氣信息的二維特征矩陣,即

    式中:t時(shí)刻的交通流量數(shù)據(jù)為{xs1,t,xs2,t,…,xsm,t},其中,xsm,t為第m個(gè)目標(biāo)站口sm在t時(shí)刻的交通流量數(shù)據(jù);t時(shí)刻的天氣數(shù)據(jù)為{wq1,t,wq2,t,…,wqn,t},其中,wqn,t為第n個(gè)天氣屬性qn在t時(shí)刻的數(shù)據(jù)量;Δt為窗口大??;xsm,t-Δt為站口sm在當(dāng)前時(shí)間前Δt個(gè)時(shí)間統(tǒng)計(jì)單位的時(shí)刻交通流量數(shù)據(jù);wq1,t-Δt為天氣屬性q1在當(dāng)前時(shí)間前Δt個(gè)時(shí)間統(tǒng)計(jì)單位的時(shí)刻數(shù)據(jù)。

    1.3 卷積神經(jīng)網(wǎng)絡(luò)

    CNN 是一個(gè)多層監(jiān)督學(xué)習(xí)網(wǎng)絡(luò),用來處理類似網(wǎng)格結(jié)構(gòu)的數(shù)據(jù),被廣泛應(yīng)用于圖像分類、語(yǔ)音識(shí)別、自然語(yǔ)言處理等領(lǐng)域,并獲得顯著成果。在處理時(shí)間序列型數(shù)據(jù)時(shí),一維CNN 可以很好地識(shí)別出數(shù)據(jù)的簡(jiǎn)單空間模式,并據(jù)此在更高級(jí)的層中生成更復(fù)雜的模式。CNN 主要由卷積層、池化層和全連接層構(gòu)成,3個(gè)級(jí)聯(lián)層描述為

    式中:xl-1,i為卷積層的輸入;cl,j為卷積層的輸出,同時(shí)也是激活層的輸入;xl,j為激活層的輸出;wl,ij為第l層第j個(gè)單元和上一層第i個(gè)單元之間的權(quán)重;b為偏置項(xiàng);φ(?)為非線性的激活函數(shù);pool(?)為池化函數(shù)。式(3)表示CNN網(wǎng)絡(luò)中的卷積運(yùn)算。

    高速公路交通流數(shù)據(jù)具有周期性、長(zhǎng)時(shí)間變化的特性,在構(gòu)建特征矩陣之后,將特征矩陣輸入到一維的CNN中,以提取交通流數(shù)據(jù)的空間特征。

    假設(shè)將一個(gè)樣本為504×7的矩陣輸入一維卷積,經(jīng)過64 個(gè)大小為2的濾波器后,輸出的特征維度為503×64,如圖3所示。

    圖3 數(shù)據(jù)經(jīng)過一維卷積后的結(jié)果Fig.3 Results of data after 1-D convolution

    1.4 長(zhǎng)短期記憶網(wǎng)絡(luò)和門控神經(jīng)網(wǎng)絡(luò)

    運(yùn)用CNN 提取數(shù)據(jù)空間特征后,需要提取高速公路交通流數(shù)據(jù)的時(shí)間特征。LSTM 是RNN的結(jié)構(gòu)變種,是解決長(zhǎng)期依賴問題的有效技術(shù)。與傳統(tǒng)RNN的區(qū)別在于它在算法中加入了一個(gè)判斷信息有用與否的“處理器”,該處理器作用的結(jié)構(gòu)被稱為cell,具體涉及3 個(gè)門函數(shù):輸入門、遺忘門和輸出門,分別控制輸入值、記憶值和輸出值。當(dāng)一個(gè)信息輸入LSTM網(wǎng)絡(luò)時(shí),網(wǎng)絡(luò)根據(jù)規(guī)則判斷該信息是否有用。只有符合算法認(rèn)證的信息才會(huì)留下,無用的信息則通過遺忘門被遺忘。

    而GRU 相較LSTM 結(jié)構(gòu)更簡(jiǎn)單,收斂速度更快。GRU同樣可以解決RNN網(wǎng)絡(luò)中的長(zhǎng)期依賴問題,也是當(dāng)前非常流行的一種網(wǎng)絡(luò)。GRU 中引入兩個(gè)門函數(shù),如圖4所示。

    圖4 GRU結(jié)構(gòu)圖Fig.4 Structure of GRU

    式中:σ(?)為sigmiod激活函數(shù);Xt為當(dāng)前t時(shí)刻的輸入;Ht-1為上一時(shí)刻即t-1時(shí)刻的輸入;Wxr、Wxz和Whr、Whz分別為當(dāng)前時(shí)刻和上一時(shí)刻的權(quán)重參數(shù);br、bz、bn為偏置項(xiàng);為候選的隱含狀態(tài);Ht為最終的隱含狀態(tài);⊙為哈達(dá)瑪積。重置門Rt有助于捕捉時(shí)序數(shù)據(jù)中短期的依賴關(guān)系,更新門Zt有助于捕捉時(shí)序數(shù)據(jù)中的長(zhǎng)期依賴關(guān)系。且式(8)滿足

    式(9)滿足

    在CNN 提取空間特征之后,經(jīng)過扁平層和防止模型過擬合的Dropout 層,再經(jīng)過一層LSTM和一層GRU,提取交通流數(shù)據(jù)的時(shí)間特征,最后通過一層全連接層,得到預(yù)測(cè)結(jié)果。

    2 高速公路交通流預(yù)測(cè)

    2.1 數(shù)據(jù)來源與趨勢(shì)分析

    本文所用數(shù)據(jù)集來自KDD CUP 2017 提供的某省某高速公路交通流數(shù)據(jù)和天氣數(shù)據(jù)。目標(biāo)區(qū)域路網(wǎng)拓?fù)淙鐖D5所示。交通流數(shù)據(jù)來源于3個(gè)收費(fèi)站(1、2、3號(hào),除了2號(hào)收費(fèi)站只允許車輛進(jìn)入高速公路,其他收費(fèi)站允許車輛雙向通行(入口:0,出口:1)),交通流數(shù)據(jù)的時(shí)間周期為2016年9月19日-10月17日,數(shù)據(jù)頻率為每隔20 min記錄一條,即1 d有72條數(shù)據(jù)記錄。收費(fèi)站1號(hào),入口(1-0)共有2084條記錄,出口(1-1)共有2084 條記錄;收費(fèi)站2 號(hào)入口(2-0)共有1725 條記錄;收費(fèi)站3 號(hào),入口(3-0)共有2086 條記錄,出口(3-1)共有2085 條記錄。在該期間,收費(fèi)站1 號(hào)入口、出口的交通流量數(shù)據(jù)各有缺失值4 個(gè),收費(fèi)站2 號(hào)入口的交通流量數(shù)據(jù)共有缺失值362個(gè),收費(fèi)站3號(hào)入口、出口的交通流量數(shù)據(jù)各有缺失值2 個(gè)、4 個(gè)。天氣數(shù)據(jù)的時(shí)間周期為2016年9月19日-10月17日,天氣數(shù)據(jù)包含氣壓、海水壓力、風(fēng)向、風(fēng)速、溫度、濕度、降雨量共7個(gè)特征,數(shù)據(jù)頻率為每隔3 h記錄一條,而一天中天氣指標(biāo)數(shù)據(jù)的值通常是連續(xù)變化的,故將天氣數(shù)據(jù)通過頻率線性填充為每隔20 min 一條記錄。以降雨量數(shù)據(jù)為例說明天氣數(shù)據(jù)的可靠性,圖6為降雨量與交通流量數(shù)據(jù)的關(guān)系,可以看出,當(dāng)降雨量累計(jì)超過15 mm時(shí)交通流才會(huì)有明顯變化,而累積降雨量隨著時(shí)間的推移呈連續(xù)上升趨勢(shì),通過線性插值方法可以較好地?cái)M合降雨量的累積過程[6],如圖7所示,將頻率間隔為3 h的降雨量平均分割成9段,即每隔20 min一個(gè)值,最終得到2088個(gè)值。

    圖5 目標(biāo)區(qū)域路網(wǎng)拓?fù)銯ig.5 Road network topology of target area

    圖6 交通流量與降雨量Fig.6 Traffic flow and rainfall

    圖7 降雨量的線性填充Fig.7 Linear filling of rainfall

    圖8給出3個(gè)站口各個(gè)方向2016年9月19日-10月17日共29 d的交通流變化趨勢(shì),可以看到,3個(gè)站口交通流變化有很強(qiáng)的相似性,即上、下游收費(fèi)站的交通流變化具有明顯的空間相關(guān)性,并且從圖中可以看到,高速公路交通流變化有明顯的日周期性。圖9為氣壓、海水壓力、風(fēng)速、溫度、濕度、降雨量特征取值變化圖。

    圖8 3個(gè)收費(fèi)站口的交通流趨勢(shì)Fig.8 Traffic flow trend of three stations

    圖9 特征可視化圖Fig.9 Distribution of multiple features

    為更好地分析高速公路交通流的時(shí)間變化情況,圖10分別給出3 周(2016年9月19日-10月9日)、1周(2016年9月21日-9月27日)、1 d(2016年9月20日)的高速公路交通流的變化趨勢(shì),可以看出,高速公路交通流具有明顯的日周期性、周周期性、趨勢(shì)性以及復(fù)雜性。圖10(a)包含國(guó)慶期間7 d的交通流數(shù)據(jù),可以看出,國(guó)慶期間與平日的交通流變化趨勢(shì)有明顯差異。

    圖10 交通流變化趨勢(shì)Fig.10 Trend of traffic flow

    為評(píng)估預(yù)測(cè)模型的性能,選擇平均絕對(duì)誤差(EMAE)、均方根誤差(ERMSE)兩個(gè)評(píng)價(jià)指標(biāo),即

    式中:y=(y1,y2,…,yp)為觀測(cè)值;為預(yù)測(cè)值;p為交通流數(shù)據(jù)觀測(cè)點(diǎn)數(shù)量。

    2.2 特征選擇與滑動(dòng)窗口設(shè)置

    對(duì)高速公路收費(fèi)站數(shù)據(jù)進(jìn)行缺失值填充和歸一化后,分析不同屬性和交通流之間的皮爾遜相關(guān)系數(shù),以此判定各個(gè)屬性對(duì)交通流變化的影響。一般情況下,相關(guān)系數(shù)的絕對(duì)值越大,相關(guān)性越強(qiáng);反之,相關(guān)系數(shù)越接近于0,相關(guān)性越弱。通常認(rèn)為:[0.8,1.0]為極強(qiáng)相關(guān),[0.6,0.8)為強(qiáng)相關(guān),[0.4,0.6)為中等程度相關(guān),[0.2,0.4)為弱相關(guān),[0.0,0.2)為極弱相關(guān)或無相關(guān)。

    圖11給出站口1-0、2-0、3-0、1-1、3-1的交通流與7 個(gè)天氣屬性之間的皮爾遜相關(guān)系數(shù)。從圖中可以看出,3 個(gè)站口雙向交通流彼此之間的相關(guān)系數(shù)絕對(duì)值均大于0.6,說明這3個(gè)站口雙向的交通流之間具有強(qiáng)或極強(qiáng)的相關(guān)性,故本文在預(yù)測(cè)目標(biāo)站口交通流時(shí),其他站口的交通流均考慮在內(nèi)。

    圖11 屬性之間的皮爾遜相關(guān)系數(shù)圖Fig.11 Pearson correlation coefficient between attributes

    氣壓與站口1-0、2-0、3-0、1-1、3-1 交通流之間的相關(guān)系數(shù)分別為:-0.150、0.001、-0.064、-0.013、-0.008,相關(guān)系數(shù)均小于0.2,說明氣壓與目標(biāo)站口交通流的相關(guān)性為極弱相關(guān)或無相關(guān),故預(yù)測(cè)目標(biāo)站口交通流時(shí),不考慮氣壓對(duì)交通流變化的影響。同理,海水壓力、風(fēng)速、風(fēng)向、溫度與站口1-0、2-0、3-0、1-1、3-1 交通流之間的相關(guān)系數(shù)均小于0.2,說明這些因素與目標(biāo)站口交通流的相關(guān)性為極弱相關(guān)或無相關(guān),故預(yù)測(cè)目標(biāo)站口交通流時(shí),不考慮這些因素對(duì)交通流變化的影響。

    濕度與站口1-0、2-0、3-0、1-1、3-1 交通流之間的相關(guān)系數(shù)分別為-0.260、-0.20、0.210、0.20、0.190,降雨量與站口1-0、2-0、3-0、1-1、3-1交通流之間的相關(guān)系數(shù)分別為0.270、-0.250、0.210、0.220、0.200,說明濕度、降雨量與目標(biāo)站口交通流的相關(guān)性為弱相關(guān),為確保交通流預(yù)測(cè)的準(zhǔn)確性,預(yù)測(cè)目標(biāo)站口交通流時(shí),將濕度、降雨量考慮在內(nèi)。最終本文同時(shí)考慮3 個(gè)站點(diǎn)雙向的交通流量、濕度、降雨量作為模型輸入分別預(yù)測(cè)1-0、2-0、3-0、1-1、3-1未來1 d的交通流量。

    如1.1 節(jié)中分析,窗口較小無法保證模型有足夠的長(zhǎng)期輸入,窗口較大則會(huì)增加不相關(guān)的輸入和計(jì)算復(fù)雜性。因此有必要確定一個(gè)最優(yōu)的窗口大小值,確保模型的預(yù)測(cè)性能。

    2.1節(jié)分析得出高速公路交通流數(shù)據(jù)具有明顯日、周的周期性,為了讓樣本數(shù)據(jù)保持原本周期性特點(diǎn),并選擇出合適的滑動(dòng)窗口大小,將滑動(dòng)窗口值Δt分別設(shè)為72(1 d)、144(2 d)、216(3 d)、288(4 d)、360(5 d)、432(6 d)、504(7 d)、576(8 d)進(jìn)行比較并選擇。

    表1為不同滑動(dòng)窗口時(shí),HDL模型預(yù)測(cè)誤差的比較結(jié)果。較低的平均絕對(duì)誤差和均方根誤差值表明,該模型預(yù)測(cè)值與觀測(cè)值的總離差較小。從表1中可以看出,當(dāng)Δt=504 時(shí)平均絕對(duì)誤差和均方根誤差均為最小,分別為5.530 輛·(20 min)-1、7.700輛·(20 min)-1。所以,將窗口大小設(shè)定為504,即將長(zhǎng)度為504(7 d)的數(shù)據(jù)作為輸入,預(yù)測(cè)未來長(zhǎng)度為72(1 d)的高速公路收費(fèi)站交通流。

    表1 窗口大小對(duì)誤差的影響Table 1 Influence of window size on error

    2.3 網(wǎng)絡(luò)參數(shù)設(shè)置

    網(wǎng)絡(luò)結(jié)構(gòu)設(shè)置會(huì)對(duì)預(yù)測(cè)模型的性能產(chǎn)生很大影響,針對(duì)高速公路收費(fèi)站交通流數(shù)據(jù),采用Hyperband 算法[7]對(duì)模型中濾波器個(gè)數(shù)(con_filter,cf)、卷積核數(shù)(con_kernel,ck)、池化層(maxpool)、LSTM 單元數(shù)(lstm_units,ls)、GRU 單元數(shù)(gru_units,gs)、學(xué)習(xí)率(learning rate,lr)、優(yōu)化器(optimizer)、Dropout(dp)8 個(gè)參數(shù)進(jìn)行優(yōu)化,確定最佳參數(shù)組合。

    經(jīng)過 128 次迭代,得到預(yù)測(cè)誤差(val_loss_score)從小到大的前10組超參數(shù)組合,如表2所示,在128次迭代產(chǎn)生的最優(yōu)值數(shù)據(jù)中,cf的搜索覆蓋范圍為2~256,步長(zhǎng)為8;ck的搜索覆蓋范圍為2~8,步長(zhǎng)為1;maxpool的搜索覆蓋范圍為2~8,步長(zhǎng)為2;ls的搜索覆蓋范圍為2~256,步長(zhǎng)為8;gs的搜索覆蓋范圍為2~256,步長(zhǎng)為8;lr的值在[0.1,0.01,0.001,0.2,0.02,0.002,…,0.5,0.05,0.005]中選取;optimizer 在[Adam、SGD、RMSprop]中選??;dp的搜索覆蓋范圍為0.1~1.0,步長(zhǎng)為0.1。本文選擇誤差最小的第1組參數(shù)組合。

    表2 前10組超參數(shù)組合Table 2 Top-10 super parameter set

    2.4 結(jié)果分析與比較

    考慮到工作日和節(jié)假日的高速公路交通流變化有明顯的差異,分別訓(xùn)練和預(yù)測(cè)工作日和節(jié)假日(國(guó)慶假期)的交通流,同時(shí)為驗(yàn)證HDL 模型的性能,將其與4種典型的深度學(xué)習(xí)模型(LSTM、GRU、CNN-LSTM[8]、CNN-GRU[9])進(jìn)行對(duì)比分析,并針對(duì)工作日、十一假期做了兩組對(duì)比實(shí)驗(yàn)。其中,工作日交通流預(yù)測(cè)實(shí)驗(yàn)中,考慮到交通流數(shù)據(jù)的周期性,將2016年9月30日-10月7日交通流數(shù)據(jù)剔除,3 個(gè)站口各個(gè)方向均得到936 條訓(xùn)練數(shù)據(jù),576條測(cè)試數(shù)據(jù);十一國(guó)慶假日交通流預(yù)測(cè)實(shí)驗(yàn)中,3個(gè)站口各個(gè)方向均得到864 條訓(xùn)練數(shù)據(jù),567 條測(cè)試數(shù)據(jù)。

    2.4.1 工作日交通流預(yù)測(cè)結(jié)果

    圖12為考慮空間、時(shí)間、天氣特征的HDL模型和4種典型深度學(xué)習(xí)模型對(duì)3個(gè)收費(fèi)站口各個(gè)方向(1-0、2-0、3-0、1-1、3-1)的交通流預(yù)測(cè)結(jié)果(以2016年10月12日為例)。從圖12中可以看出,本文所提HDL模型的預(yù)測(cè)值與期望值吻合度均為最高。

    圖12 5種模型對(duì)3個(gè)站口各個(gè)方向交通流預(yù)測(cè)結(jié)果Fig.12 Prediction results of traffic flow in all directions of three stations by five models

    表3為HDL模型對(duì)3個(gè)站口各個(gè)方向在8 d工作日(2016年10月10日-17日)的交通流預(yù)測(cè)誤差。

    表3 HDL模型對(duì)8 d工作日的預(yù)測(cè)誤差Table 3 Prediction error of HDL model for eight working days

    為評(píng)估模型穩(wěn)定性,表4給出5種模型對(duì)8 d工作日(2016年10月10日-17日)的平均預(yù)測(cè)誤差。

    由表4可知,預(yù)測(cè)工作日交通流時(shí),本文所提HDL模型的MAE和RMSE在3個(gè)站口各個(gè)方向上的平均預(yù)測(cè)誤差值均為最低,表明本文模型在多次實(shí)驗(yàn)后預(yù)測(cè)誤差仍最小,且集成模型比單一模型的預(yù)測(cè)精度高。HDL 模型在3 個(gè)站口各個(gè)方向的MAE平均值為5.450輛·(20 min)-1。

    表4 5種模型對(duì)8 d工作日的平均預(yù)測(cè)誤差Table 4 Average prediction error of five models for eight working days

    2.4.2 十一國(guó)慶假日交通流預(yù)測(cè)結(jié)果

    表5為考慮空間、時(shí)間、天氣特征的HDL 模型對(duì)3 個(gè)站口各個(gè)方向在十一國(guó)慶假日7 d(2016年10月1日-7日)的交通流預(yù)測(cè)誤差。

    表5 HDL模型對(duì)十一國(guó)慶假日7 d的預(yù)測(cè)誤差Table 5 Prediction error of HDL model for seven days during National Day

    為評(píng)估模型的穩(wěn)定性,表6給出5 種模型對(duì)十一國(guó)慶假日7 d(2016年10月1日-7日)的平均預(yù)測(cè)誤差。

    由表6可知,預(yù)測(cè)高峰期(十一國(guó)慶期間)交通流時(shí),本文所提HDL 模型的MAE和RMSE 在3 個(gè)站口各個(gè)方向上的平均預(yù)測(cè)誤差值均為最低,同樣表明本文模型在多次實(shí)驗(yàn)后預(yù)測(cè)誤差仍最小,且集成模型比單一模型的預(yù)測(cè)精度高。

    表6 5種模型對(duì)十一國(guó)慶假日7 d的平均預(yù)測(cè)誤差Table 6 Average prediction error of five models for seven days during the National Day

    為驗(yàn)證天氣等外部因素對(duì)當(dāng)前道路交通流變化的影響,給出4 種典型深度學(xué)習(xí)模型在結(jié)合時(shí)間、空間及天氣因素下(MF),在3 個(gè)站口各個(gè)方向上對(duì)8 d工作日(2016年10月10日-17日)和十一國(guó)慶假日7 d(2016年10月1日-7日)的平均預(yù)測(cè)誤差,如表7和表8所示。

    表7 加入外部因素后工作日期間5種模型的預(yù)測(cè)誤差比較Table 7 Comparison of prediction errors among five models of working days after adding external factors

    表8 加入外部因素后十一國(guó)慶期間5種模型的預(yù)測(cè)誤差比較Table 8 Comparison of prediction errors among five models of during the National Day after adding external factors

    通過表4和表7、表6和表8的對(duì)比發(fā)現(xiàn):考慮天氣等外部因素后,集成模型的預(yù)測(cè)精度都有所提高,但總體來說本文所提HDL 模型的預(yù)測(cè)精度仍高于其他模型。預(yù)測(cè)工作日交通流時(shí),CNNLSTM 模型、CNN-GRU 模型的預(yù)測(cè)精度最大分別提高3 輛·(20 min)-1、6 輛·(20 min)-1。預(yù)測(cè)十一國(guó)慶期間交通流時(shí),CNN-LSTM 模型、CNN-GRU模型的預(yù)測(cè)精度最大分別提高1 輛·(20 min)-1、5 輛·(20 min)-1。考慮多因素后,單一模型LSTM和GRU的預(yù)測(cè)精度下降,原因是單一模型無法捕捉多個(gè)特征的信息。

    因此,無論是在工作日還是高峰期,集成模型的預(yù)測(cè)誤差都要小于單一模型,且本文所提HDL模型對(duì)高速公路交通流的預(yù)測(cè)精度明顯優(yōu)于其他4種典型深度學(xué)習(xí)模型。由于國(guó)慶假期數(shù)據(jù)量遠(yuǎn)少于工作日的數(shù)據(jù),且國(guó)慶假期交通流變化的不可控因素更多、波動(dòng)較大,故國(guó)慶假期交通流的預(yù)測(cè)精度低于工作日。

    為充分體現(xiàn)本文交通流預(yù)測(cè)效果,表9給出近兩年有關(guān)交通流預(yù)測(cè)結(jié)果的對(duì)比情況。

    表9 現(xiàn)有文獻(xiàn)對(duì)交通流的預(yù)測(cè)結(jié)果Table 9 Prediction results of traffic flow in existing literature

    文獻(xiàn)[8-9]考慮了交通流的時(shí)空因素,但未考慮天氣等因素對(duì)交通流變化的影響;文獻(xiàn)[10-11]只考慮了交通流的時(shí)間特征,未考慮空間及天氣等因素對(duì)交通流變化的影響,故其預(yù)測(cè)精度都低于本文HDL 模型。再次說明,考慮多種因素可以提升高速公路交通流預(yù)測(cè)精度。

    3 結(jié)論

    精準(zhǔn)地預(yù)測(cè)高速公路交通流,不僅可以為高速公路管理人員提供決策輔助,還可以為公眾出行路線選取提供參考,便于車輛分流,進(jìn)而緩解高速公路交通擁堵狀況。為更準(zhǔn)確地預(yù)測(cè)高速公路交通流,本文提出一種集成深度學(xué)習(xí)模型,該模型考慮高速公路交通流數(shù)據(jù)的周期性和趨勢(shì)性特點(diǎn),發(fā)揮了CNN 對(duì)空間特征提取,LSTM和GRU 對(duì)長(zhǎng)期依賴性特征提取的優(yōu)勢(shì)來實(shí)現(xiàn)預(yù)測(cè)過程,并采用某省某高速公路2016年9月19日-10月17日的數(shù)據(jù)進(jìn)行模型驗(yàn)證。首先,為因勢(shì)利導(dǎo),將交通流數(shù)據(jù)分成工作日和十一國(guó)慶假期兩部分分別進(jìn)行訓(xùn)練和預(yù)測(cè),利用滑動(dòng)窗口方法,以數(shù)據(jù)的周期性特點(diǎn)確定了最佳窗口大小為7 d;其次,構(gòu)建包含時(shí)間、空間和天氣的特征矩陣作為模型的輸入;再次,利用訓(xùn)練數(shù)據(jù)對(duì)HDL模型進(jìn)行訓(xùn)練;然后,利用測(cè)試數(shù)據(jù)對(duì)訓(xùn)練好的模型進(jìn)行測(cè)試同時(shí)評(píng)估該模型;最后,將本文所提HDL 模型和CNN、LSTM、CNNLSTM、CNN-GRU這4種典型的深度學(xué)習(xí)模型進(jìn)行對(duì)比分析,同時(shí)將本文預(yù)測(cè)結(jié)果與近兩年有關(guān)交通流預(yù)測(cè)文獻(xiàn)進(jìn)行對(duì)比。結(jié)果表明:集成深度學(xué)習(xí)模型對(duì)交通流的預(yù)測(cè)結(jié)果要優(yōu)于單一深度學(xué)習(xí)模型;本文提出的HDL 模型,由于綜合考慮了時(shí)空及天氣因素,其交通流的預(yù)測(cè)精度明顯高于其他模型,同時(shí)也體現(xiàn)出天氣對(duì)交通流有很大影響,是預(yù)測(cè)交通流不可忽略的因素。

    在未來的研究中,我們將探討更多可能影響交通流預(yù)測(cè)性能的因素,例如探討車輛的行駛速度、腹地城市人口與經(jīng)濟(jì)情況等因素,以期進(jìn)一步提升高速公路交通流的預(yù)測(cè)精度。

    猜你喜歡
    交通流收費(fèi)站天氣
    江蘇20個(gè)高速收費(fèi)站實(shí)施“準(zhǔn)自由流”改造
    浙江首個(gè)“云收費(fèi)站”投用
    天氣冷了,就容易抑郁嗎?
    誰是天氣之子
    盛暑天氣,覓得書中一味涼
    文苑(2020年7期)2020-08-12 09:36:38
    基于Spark的高速收費(fèi)站大數(shù)據(jù)系統(tǒng)的設(shè)計(jì)與實(shí)現(xiàn)
    Weather(天氣)
    一種收費(fèi)站排隊(duì)模型的模擬實(shí)現(xiàn)
    交通流隨機(jī)行為的研究進(jìn)展
    路內(nèi)停車對(duì)交通流延誤影響的定量分析
    缙云县| 凤山市| 临猗县| 黄骅市| 宾川县| 闵行区| 富宁县| 邢台县| 武乡县| 柳河县| 宣汉县| 开鲁县| 镇赉县| 崇明县| 灌南县| 芜湖县| 桦川县| 延津县| 深圳市| 黄龙县| 叶城县| 区。| 绥芬河市| 平阳县| 饶阳县| 博乐市| 博白县| 神农架林区| 宣化县| 大厂| 罗定市| 汝州市| 青岛市| 抚宁县| 古蔺县| 伊川县| 天等县| 盐城市| 巧家县| 亳州市| 芒康县|