• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于ABiLSTM 與XGBoost 組合模型的交通時間預測

      2021-08-24 08:36:34宋瑞蓉路樹華王斌君
      軟件導刊 2021年8期
      關鍵詞:遺傳算法注意力權重

      宋瑞蓉,路樹華,王斌君,仝 鑫

      (1.中國人民公安大學 信息網絡安全學院,北京 100038;2.山東省日照市人民醫(yī)院,山東 日照 276800)

      0 引言

      交通時間預測旨在利用已有的交通時間數據對未來出行時間進行預判。交通時間預測不僅在日常出行中具有重要意義,而且便于交通部門在交通擁堵發(fā)生之前,及時預測并采取有效的避免措施。此外,公安機關在偵破案件時利用交通時間預測能夠鎖定嫌疑車輛經過某地點的時間范圍,從而縮小排查范圍,提高工作效率,減少工作量。圍繞交通時間預測開展的研究基本可以分為兩類:時序方法和非時序方法。

      時序方法重點考慮了交通問題本身具有時序數據的特點,可以借鑒時序數據處理方法及模型,因此,時序方法在交通時間預測領域備受青睞。ARIMA(Autoregressive In?tegrated Moving Averrage Model)是一種經典的時序預測方法,文獻[1]將ARIMA 應用到交通時間預測任務中,使得ARIMA 利用所學習到的交通時間隨時間變化關系預測未來時間段的交通時間,而不需要其它任何輔助屬性。LSTM處理序列化數據具有很好的效果,文獻[2]將LSTM 應用于交通時間預測任務中,并充分考慮了相鄰時間步的結果對此刻預測結果的影響;文獻[3-4]將注意力機制與卷積神經網絡相結合用于交通時間及交通流量預測;文獻[5]將注意力機制與LSTM 模型相結合,對每一時間步賦予不同權重;文獻[6]將結合了注意力機制的LSTM 模型進行改進,并用于解決交通時間預測任務,相較于LSTM 只考慮一個方向的傳遞,雙向長短期記憶網絡(BiLSTM)是前向LSTM 與后向LSTM 的結合,能夠充分考慮相鄰時間步對預測結果的影響;文獻[7-9]將注意力機制與BiLSTM 相結合,應用于不同領域。

      交通時間預測領域常見的非時序方法有線性回歸、隨機森林、支持向量回歸(SVR)以及K 近鄰算法(KNN)等[10]。這類方法的優(yōu)點在于只需給出相關屬性即可進行預測,而不需要給出相鄰時間段的信息,在一些較為簡單的數據集上有較好的表現(xiàn);缺點是在交通時間預測中會遺漏掉一些時序信息,并且對于一些屬性間關系較為復雜的數據集不具有很好的預測效果。在機器學習方法中,極端梯度提升(XGBoost)模型常被用于分類和回歸任務,通過多棵決策樹預測最終結果,并且每增加一棵樹都能確保目標函數值有所下降,在多種任務中往往具有較好表現(xiàn)。文獻[11]將XGBoost 模型應用于短時交通流預測,采用hyperopt 方法進行自動調參,在所構造的時間序列與時空序列上分別進行實驗,均表現(xiàn)出了較好的效果;文獻[12]將遺傳算法與XG?Boost 模型相結合,利用遺傳算法良好的全局搜索能力為XGBoost 進行調參,提高模型表現(xiàn)效果。

      此外,許多研究基于組合模型開展。常見的組合模型使用時間序列方法與機器學習方法相結合。文獻[13]將LSTM 模型與XGBoost 模型相結合,利用誤差倒排法對不同模型賦予不同權重,由兩個模型共同決定最終預測結果;文獻[14]首先利用LSTM 處理時序化特征,然后將其預測結果作為一項新的特征與其它基礎特征共同用于XGBoost模型預測,結果相較于單一模型有所提升;文獻[15]利用卷積神經網絡提取特征,然后使用果蠅算法優(yōu)化XGBoost模型參數,將經過特征提取的數據投入參數被優(yōu)化的XG?Boost 模型中進行預測,在保證預測準確度的情況下,提升了預測效率;文獻[16]將時序方法Holt-Winters 與線性回歸相結合用于高鐵短期客流預測。利用時間序列模型可以關注數據隨時間變化的特征,機器學習方法能夠很好地挖掘屬性時間的依賴關系,這兩種模型結構相差較大,因此在一定情況下可以綜合兩種模型優(yōu)勢,提升預測效果。

      本文將BiLSTM 模型與XGBoost 模型相結合,其中BiL?STM 模型中添加了注意力機制,使得模型能夠對不同時間步賦予不同權重的關注,XGBoost 模型使用了兩種調參方式,分別為hyperopt 方法自動調參和利用遺傳算法進行調參,將兩種調參方法的結果進行對比,選用準確度更高的模型與改進的BiLSTM 模型進行組合,從而相較于單一模型提升了預測效果。

      1 改進的BiLSTM 模型

      1.1 BiLSTM 模型

      循環(huán)神經網絡(RNN)經常被用于具有序列化特征的數據處理,每一個隱藏層神經元h是由當前輸入與上一時刻的隱藏層神經元的輸出所組成,這使得數據能夠向后傳遞。但同時也帶來一大問題,這種長期依賴會導致網絡記住大量冗余信息,權重更新緩慢,一些重要信息會隨著節(jié)點的增多而被遺忘。長短期記憶網絡(LSTM)是RNN 的一種改進,可以解決RNN 存在的上述問題。LSTM 由輸入門、輸出門、遺忘門和內部記憶單元組成,如式(1)-式(6)所示。在設定時間步長后,可以對這些時間步內的特征進行自適應地關注,從而解決時間序列的交通預測問題。

      式(1)表示遺忘門,可控制丟棄一些不重要的信息,減少網絡傳遞中大量的冗余信息;式(2)表示輸入門,可用來控制輸入xt和當前狀態(tài)ht-1更新到記憶單元的程度大小;式(3)和式(4)是內部記憶單元,將上述遺忘門和輸入門的信息加以組合,決定哪些信息可以被更新;式(5)和式(6)是輸出門,是為了計算當前的隱藏層狀態(tài),以便網絡繼續(xù)向后傳遞。相較于RNN 共享同一組權重與偏置會導致梯度爆炸和消失問題,LSTM 對每一個門都各自共享了一組權重與偏置,這樣能夠控制一些信息的流入和流出,從而使得整個網絡更好地把握序列信息之間的關系。

      雙向長短期記憶網絡(Bidirectional Long Short-Term Memory,BiLSTM)是前向LSTM 與后向LSTM 的結合,它主要處理有時間序列關系的流數據,在保留數據順序性特征的同時充分地挖掘和利用上下文信息。BiLSTM 中每一個單元的結果受前后兩個單元的影響,在前向LSTM 中,此刻單元狀態(tài)At受上一單元At-1結果的影響,在后向LSTM 中受At+1狀態(tài)的影響,兩個狀態(tài)共同作用得到此時的結果[7]。前向LSTM 與后向LSTM 的結合更加充分地利用了時間序列的上下文信息,使得預測結果更加準確。

      在交通時間預測任務中,一個時間點的交通時間和與之相鄰的前、后時間點都有關系,那么采用雙向預測模型便具有很強的可解釋性。例如,一條路在9:00 時刻發(fā)生擁堵,那么9:15 的通行時間也一定會受到影響。LSTM 利用單向傳遞的特征,通過前5 個時間步的交通時間預測當前時刻。但這種傳遞方向并不只是單向的,如果得到9:30 的通行時間,發(fā)現(xiàn)此時道路是阻塞的,則有理由相信9:15 時刻的道路狀況也是如此,從而預測出相應的交通時間。當這種傳遞具有雙向性時,同時考慮與預測時刻相鄰的前、后時刻對該時刻的影響,將會使結果更加具有信服力。

      1.2 注意力機制

      注意力模型通過神經網絡模型與注意力機制的結合,提高模型對特征的關注能力。注意力機制借鑒于人類的視覺注意力機制,人類會在整個視覺范圍內將注意力集中于最重要的部分,從而有效地快速篩選出對自身最有意義的信息,極大地提高了信息處理準確率。神經網絡中添加的注意力機制也是為了達到這樣的效果,快速關注重要信息,減少無關信息對結果的影響。

      具體而言,在交通時間預測任務中,添加注意力機制是為了對每一個時間步賦予不同權重的關注,對于一些較遠的時間步減少關注,對于相鄰時間步賦予更多關注,從而使預測結果更加準確。式(7)—式(9)是描述注意力機制的神經網絡,其中,H是BiLSTM 網絡的輸出,W與w是注意力機制神經網絡中的權重,一開始被隨機初始化,通過模型訓練不斷更新得到,α是注意力權重向量,r表示BiL?STM 網絡的輸出與注意力機制進行加權求和,代表網絡最后輸出,具體網絡結構如圖1 所示。

      Fig.1 BiLSTM network structure with attention mechanism added圖1 添加了注意力機制的BiLSTM 網絡結構

      1.3 ABiLSTM 模型

      某一時刻的交通時間受相鄰時間段影響,BiLSTM 網絡可以充分利用該時刻前后的信息預測當前時刻的交通時間,但周圍時刻對于此時刻的影響程度并不相同,若模型對每一時間步都進行同等程度的關注,則將失去了焦點和重點。為解決該問題,本文建立了結合注意力機制的BiL?STM 網絡(Attenton-based BiLSTM,ABiLSTM),在BiLSTM網絡的輸出層上添加了注意力層,依據每一時間步對待預測時間點的貢獻程度不同,為每一時間步訓練出一組權重向量,將雙向LSTM 網絡的輸出與注意力權重進行加權求和作為模型最后的輸出結果。BiLSTM 中時間步長設置為5,每一個時間步中包含4 個屬性,模型經過訓練,會對這些特征分別計算出相應權重。

      本文所選取的實驗數據集來自英國公路局提供和管理的路段通行時間數據,每15min 為一個時段,記錄一條數據。經過篩選共保留5 個屬性,分別為日期類型、時間類型、平均速度、交通流量以及通行時間。選取AL1053、AL1249、AL1253 等20 條公路在2014 年1 月份的交通數據,其中每條公路有2 973 條數據,其中80%劃分為訓練集,20%為測試集。在每條公路上分別使用BiLSTM 模型與ABiLSTM 模型進行對比實驗。

      為了評價結果,使用了兩個評價指標,分別為平均絕對誤差mae 與R 平方R_square,計算公式如式(10)、式(11)所示。

      平均絕對誤差mae 是計算預測值與真實值偏差的絕對值大小,mae 值越小,表示模型預測效果越好。R平方是對模型擬合程度的打分,取值范圍為[-1,1]。如式(11)所示,分子是預測值與真實值之間的誤差,分母是真實值與目標值y的平均數之間的誤差。由此可以得出,R平方的值越接近1,模型吻合程度越高。

      實驗結果如表1 所示。

      Table 1 Comparison of experimental results of ABiLSTM model表1 ABiLSTM 模型實驗結果對比

      兩種模型在平均絕對值誤差和R 平方上的對比結果如圖2 所示。

      Fig.2 Comparison of experimental results of ABiLSTM model圖2 ABiLSTM 模型實驗結果對比

      由表1 和圖2 可以看出,ABiLSTM 在實驗中的20 條路段上均表現(xiàn)出了更好的預測效果。

      2 XGBoost 模型

      極端梯度提升(eXtreme Gradient Boosting,XGBoost)模型是為了緩解單棵決策樹可能造成過擬合的風險,對多棵決策樹進行集成,從而使目標函數值不斷下降[17],具體表達式如式(12)所示。

      XGBoost 最核心的思路是每增加一棵決策樹,整體表達效果都會有所提升,過程如式(13)所示。

      在決策樹中,葉子節(jié)點越多,造成過擬合的風險也就越大,所以需要限制葉子節(jié)點的個數,可以通過懲罰項實現(xiàn),如式(14)所示。

      式(14)中,T為葉子節(jié)點個數,? 為懲罰系數,表示懲罰力度的大小,w表示每個葉子節(jié)點的權重,表示對wj做了一次L2懲罰。

      將損失函數與懲罰項相結合可以得到目標函數Obj(t),接下來使用泰勒展開式處理目標函數,展開結果如式(15)所示。

      對式(15)進行簡化,為了便于合并,將懲罰項依據其定義進行展開,接著將樣本上的遍歷轉化為葉子節(jié)點的遍歷,最終結果如式(16)所示。

      依據式(16),XGBoost 模型可以遍歷不同決策樹的劃分方案,使得目標函數最小,即可以得到相較于上次決策樹劃分表現(xiàn)效果更好的模型。

      2.1 hyperopt 方法自動調參

      XGBoost 模型含有大量超參數需要設置,無論是采用手工調參方式還是采用網格搜索方式,都較為復雜,不利于模型優(yōu)化,使用hyperopt 可以簡化調參過程。hyperopt 有兩種搜索算法,分別是隨機搜索和TPE(Tree of Parzen Esti?mators)搜索[18]。本文使用的是TPE 搜索算法。

      TPE 搜索算法相較于隨機搜索在多數情況下表現(xiàn)出更好的效果。首先,采用隨機搜索方式產生超參數,然后將這些超參數代入模型進行訓練,通過目標函數值對參數進行評價。當隨機產生的參數超過20 組時(默認為20),使用這些參數以及訓練后模型的目標函數值產生無參數概率密度函數,然后使用概率密度函數生成新的超參數,對模型繼續(xù)進行訓練,直到產生相較于其它參數而言,具有較好表現(xiàn)效果的一組參數作為TPE 搜索算法的最終結果。TPE 搜索算法流程如圖3 所示[18]。

      Fig.3 Workflow of hyperopt using TPE search algorithm圖3 使用TPE 搜索算法的hyperopt 工作流程

      hyperopt 是一個支持自動調參的python 庫,在調參之前需要給出所要優(yōu)化的目標函數及參數的搜索空間[18]。本文使用hyperopt 調參方式的參數搜索空間如表2 所示。

      Table 2 Parameter search space of hyperopt method parameter adjustment表2 hyperopt 方法調參的參數搜索空間

      以路段AL1053 為例,經過hyperopt 調參后XGBoost 模型參數如表3 所示。

      Table 3 Super parameter values after adjusting parameters with hyperopt method表3 使用hyperopt 方法調參后的超參數取值

      2.2 遺傳算法調參

      生物遺傳時遵循分離規(guī)律及自由組合規(guī)律,變異時遵循重組規(guī)律、基因突變規(guī)律以及染色體變異規(guī)律。遺傳算法(GA,Genetic Algorithm)受到生物進化學說和遺傳學說的啟發(fā),模擬生物進化過程,借助復制、交換、變異等方法模仿生物優(yōu)勝劣汰、適者生存的自然法則,具體而言就是在初始解的基礎上通過智能式搜索逐步逼近最優(yōu)解。相較于其它方法,遺傳算法可以找到全局最優(yōu)解[19]。

      使用遺傳算法解決具體問題時,需要根據問題的特性進行編碼,確定適應度函數。該算法具有黑箱式結構,這使得可以用來研究一些函數關系不明確的復雜關系,如模型調參。

      遺傳算法具體可由以下遺傳算子組成:

      選擇:計算個體適應度,然后從第t 代群體P(t)中選擇出適應度較好的個體遺傳到下一代群體P(t+1)中。使用輪盤賭法確定每一個體被選擇的概率計算公式如式(17)—式(18)所示。

      其中,F(xiàn)i為個體i所對應的適應度函數值,N 代表現(xiàn)有的個體數。

      交叉:將群體P(t)內的個體進行隨機組合,選擇確定的概率交換個體之間的部分染色體,產生新的個體。

      其中,b為取值在[0,1]的隨機數。

      變異:以某一概率將群體P(t)中的某些基因值替換為其它的等位基因[20]。表達式如式(20)—式(21)所示。

      式(20)中,r2為隨機數,g代表已經進化的次數,Gmax代表最終迭代次數。式(21)中,aij代表發(fā)生變異的第i個體的第j號基因,amax和amin分別代表該基因取值范圍內的最大值和最小值,r是取值為[0,1]的隨機數。

      遺傳算法運算過程如圖4 所示。

      Fig.4 Operation process of genetic algorithm圖4 遺傳算法運算過程

      本文遺傳算法中所使用的適應度函數為R 平方,表達式如式(11)所示。

      利用遺傳算法對XGBoost 模型進行調參,參數名稱及參數搜索空間如表4 所示。

      同樣以路段AL1053 為例,顯示經過遺傳算法調參后XGBoost 模型的超參數如表5 所示。

      Table 4 Parameter search space of genetic algorithm parameter adjustment表4 遺傳算法調參的參數搜索空間

      Table 5 Super parameter values after parameter adjustment using genetic algorithm表5 使用遺傳算法調參后的超參數取值

      hyperopt 方法調參和遺傳算法調參具有不同的特點,為了使組合模型具有最佳表現(xiàn)效果,本文對于每一條路的數據集都采用了兩種調參方式,選擇其中表現(xiàn)最好的模型與ABiLSTM 模型進行組合。

      3 ABiLSTM與XGBoost組合模型

      ABiLSTM 擅長于處理時序化數據,XGBoost 模型基于決策樹對于回歸和分類問題有較好的表現(xiàn)。兩個模型結構相差較大,將兩個模型進行組合可以降低過擬合風險,提高預測準確度。

      使用殘差表示模型預測結果的誤差情況,殘差計算如式(22)所示。

      以路段AL1053為例,ABiLSTM 模型與XGBoost 模型前100個預測結果的殘差結果如圖5 所示。

      Fig.5 Residual error of traffic time prediction圖5 交通時間預測殘差

      由圖5 可以看出,這兩個模型預測結果的殘差除在個別數據點有較大偏差外,其余數據點集中在[-1,1],模型預測能力相差無幾。在組合模型中,若兩個模型的預測能力有較大差別,組合之后的結果往往差于兩個模型中表現(xiàn)較好的模型。在本文實驗中,單一模型BiLSTM 與XGBoost預測能力相近,通過將兩個模型的預測結果進行組合,可以在一定程度上提高結果預測準確度。交通時間預測領域一些表現(xiàn)較好的組合模型多是基于時間序列方法與機器學習方法的組合,因為這兩類模型的結構相差較大,可以減少過擬合程度,同時這兩類模型具有不同特點,時間序列方法可以考慮周圍時間段的結果對此刻的影響,可以提取到時間序列的隱藏特征,機器學習方法能夠更加充分地挖掘屬性間的依賴關系,將兩類模型進行組合可以綜合這兩類模型的優(yōu)點,表現(xiàn)出更好的預測效果。

      3.1 誤差倒排法

      本文采用并列的模型組合方式,讓每個模型單獨訓練,然后為每個模型的結果賦予不同的權重,讓其共同決定組合模型的預測結果。模型組合的關鍵在于確定不同模型的權重,關于組合模型權重的確定方法,常見的有誤差倒排法、等權組合預測法、方差—協(xié)方差法、最小二乘法以及最小絕對值法[21]。本文采用了誤差倒排法和最小絕對值法分別進行試驗。

      誤差倒排法的優(yōu)點在于計算簡便,同時考慮了不同模型之間預測效果的差異,在具有較好表現(xiàn)效果的同時,也具有很強的可解釋性。使用誤差倒排法組合模型的方法如式(23)—式(25)所示。

      其中,ε1和ε2分別代表BiLSTM 與XGBoost 模型預測值與真實值之間的誤差,w1與w2分別代表兩個模型的權重。由權重計算公式可以看出,該方法考慮了不同模型間預測能力的差異,對于誤差較小的模型賦予較大的權重,對誤差較大模型賦予較小權重[13],這樣能夠更好發(fā)揮組合模型的優(yōu)勢。

      3.2 最小絕對值法

      最小絕對值法相較于誤差倒排法的優(yōu)點在于可以為兩個以上的單一模型確定權重參數,在一些復雜場景中,更具實用價值。最小絕對值法是將誤差的絕對值作為目標函數,表達如式(26)所示[21]。

      將預測結果記為矩陣A,真實值記為矩陣Y,權重記為W,表達式如式(27)所示。

      其中,A的每一列表示一個模型所預測的n個數值,共有k個模型,表達式如式(28)所示。

      此時,該數學模型轉化為一個典型的線性規(guī)劃問題,可以使用單純性法求解,矩陣表達式如式(33)所示。

      將矩陣[A,In,-In]的最優(yōu)基記為B*,則B*在不失一般性條件下的表達式如式(34)所示。

      其中,W 為最終所要確定的權重系數。

      4 實驗結果及分析

      本文將ABiLSTM 模型與經過調參之后的XGBoost 模型采用誤差倒排法和最小絕對值法分別進行組合,實驗數據為AL1674 等20 條路段在2014 年1 月份的交通數據,訓練集與測試集劃分比例為8∶2,采用隨機劃分方式。其中,XGBoost 模型使用了兩種調參方式,選用表現(xiàn)效果最好的作為組合模型的一部分。表6 為單一模型及組合模型預測結果,使用的評價指標為均方誤差mse,權重表示單一模型的預測結果在組合模型中所占比重。在20 條實驗路段中,多數情況下,遺傳算法調參表現(xiàn)出較好的效果,但在某些路段中hyperopt 自動調參表現(xiàn)出更好的效果,用*加以區(qū)分。

      均方誤差的計算公式如式(36)所示。

      由表6 可以得出,使用誤差倒排法確定的組合模型并非在所有路段上均優(yōu)于單一模型,但使用最小絕對值法的組合模型相較于任何一個單一模型,均方誤差都有所下降且表現(xiàn)出最好的預測效果。

      Table 6 Comparison of the prediction results of single model and combined model表6 單一模型與組合模型預測結果對比

      為了顯示組合模型在某條具體路段上預測值與真實值之間的偏差,以路段AL1053 為例,將組合模型的前100個預測結果與真實值顯示在圖中,如圖6 所示。

      Fig.6 Predicted and actual traffic time of combined model圖6 組合模型交通時間的預測值與實際值

      由圖6 可以得出,組合模型能夠很好地擬合實際交通時間變化情況,具有較好的預測效果。

      相對百分誤差絕對值的平均值MAPE 可以用來評價模型的預測能力,MAPE 值越小,代表模型預測能力越強,計算如式(37)所示。為綜合對比本文所提到的所有模型,現(xiàn)將不同模型在20 條實驗路段上的MAPE 進行對比,結果如圖7 所示。其中,“xgboost_Y”代表用遺傳算法進行調參的XGBoost 模型,“xgboost_H”代表用hyperopt 方法自動調參的XGBoost 模型,組合1 代表用誤差倒排法確定權重的組合模型,組合2 代表用最小絕對值法確定權重的組合模型。

      Fig.7 Comparison of broken lines of different models of MAPE圖7 不同模型MAPE 的折線對比

      由圖7 可以看出,未添加注意力機制的BiLSTM 模型的預測能力相較于其它模型表現(xiàn)較差,添加了注意力機制之后,使得MAPE 指標有較大程度的下降,模型預測能力有較為明顯的提高。并且,利用了不同調參方式進行調參的XGBoost 模型的MAPE 指標相近。兩種組合模型在多數路段上表現(xiàn)優(yōu)于其它單一模型,但在路段AL1693 上,使用誤差倒排法確定權重的組合模型表現(xiàn)差于任何一個單一模型。綜合而言,使用最小絕對值法確定權重的組合模型預測能力優(yōu)于任何一個單一模型,在所有模型中表現(xiàn)最優(yōu)。

      箱線圖可以用來反映一組數據的中心位置和散布情況,為了更直觀統(tǒng)計不同模型在所有實驗路段上MAPE 指標的離散情況,現(xiàn)將不同模型在所有實驗路段上的MAPE指標繪制為箱線圖,如圖8 所示。

      Fig.8 Comparison of MAPE box lines of different models圖8 不同模型MAPE 箱線圖對比

      由圖8 可以得出,兩種組合模型MAPE 指標的中位數低于其它所有模型,但組合2 即使用最小絕對值法確定權重的組合模型,相較于使用誤差倒排法確定權重的組合模型,其MAPE 指標更為集中,上四分位數和上邊緣也更低,使用最小絕對值法確定權重的組合模型的異常值數量及取值也均小于使用誤差倒排法確定權重的組合模型。綜上所述,使用最小絕對值法確定權重的組合模型在所有模型中表現(xiàn)出最好的預測效果。

      通過表6、圖7 及圖8 可以得出,本文提出的使用最小絕對值法確定權重的組合模型在不同指標評價下,表現(xiàn)均優(yōu)于其它任何模型,從而說明ABiLSTM 與XGBoost 組合模型可以提高單一模型預測準確度。

      5 結語

      本文將BiLSTM 模型與注意力機制相結合,對BiLSTM模型進行了改進。通過實驗證明,該模型相較于BiLSTM模型表現(xiàn)出更好的預測效果。XGBoost 模型具有大量參數,本文嘗試了兩種不同的調參方法,即遺傳算法調參和hyperopt 自動調參,為確定組合模型的權重,使用誤差倒排法和最小絕對值法分別進行實驗,選取表現(xiàn)更好的最小絕對值法為不同模型確定權重系數,進而將模型進行組合。通過實驗證明,該組合模型較任何單一模型都表現(xiàn)出更好的預測效果。本文所使用的數據集考慮了時間相關性,但未考慮到空間相關性?,F(xiàn)實生活中,一條路段的通行情況不僅與它相鄰時間段的路況有關,還與相鄰路段的通行情況有關。因此,下一步還應使用時空數據進行實驗,更加全面地考慮影響交通時間的各種因素,從而提高交通時間預測準確性。

      猜你喜歡
      遺傳算法注意力權重
      讓注意力“飛”回來
      權重常思“浮名輕”
      當代陜西(2020年17期)2020-10-28 08:18:18
      為黨督政勤履職 代民行權重擔當
      人大建設(2018年5期)2018-08-16 07:09:00
      基于自適應遺傳算法的CSAMT一維反演
      基于公約式權重的截短線性分組碼盲識別方法
      電信科學(2017年6期)2017-07-01 15:44:57
      “揚眼”APP:讓注意力“變現(xiàn)”
      傳媒評論(2017年3期)2017-06-13 09:18:10
      一種基于遺傳算法的聚類分析方法在DNA序列比較中的應用
      基于遺傳算法和LS-SVM的財務危機預測
      A Beautiful Way Of Looking At Things
      基于改進的遺傳算法的模糊聚類算法
      忻城县| 中超| 景德镇市| 竹山县| 德江县| 盐边县| 兴城市| 克山县| 佛冈县| 芜湖县| 井冈山市| 汽车| 湟中县| 兴文县| 石嘴山市| 霸州市| 新绛县| 岳阳县| 嘉荫县| 南岸区| 临澧县| 甘洛县| 酒泉市| 益阳市| 南投县| 光泽县| 墨江| 上杭县| 双柏县| 南宫市| 田阳县| 新和县| 曲水县| 股票| 洞头县| 平泉县| 昌乐县| 汶上县| 鹤壁市| 巫山县| 蚌埠市|