樊博, 馬筱櫟
(1.重慶交通大學 交通運輸學院, 重慶 400074;2.重慶市交通運輸工程重點實驗室, 重慶 400074)
高速公路旅行時間是誘導公眾出行的重要依據,是評價道路實時運行狀態(tài)的重要指標,也是輔助道路管理人員進行管控資源配置的決策參考。旅行時間預測對于交通使用者和管理者都具有重要意義和應用價值,可以說,旅行時間預測是高速公路交通管理系統(tǒng)、出行者信息系統(tǒng)中不可或缺的部分。
由于國外檢測器鋪設密度相對較高,旅行時間預測研究可以在高精度交通流數據下開展,如Moonam H.等基于歷史真實數據,使用卡爾曼濾波器,針對不同類型道路預測旅行時間。對于利用收費數據進行旅行時間預測的研究,王翔等根據交通事故持續(xù)時間和不同時段交通狀態(tài)的特征,構建基于改進最近鄰非參數回歸的方法預測旅行時間,算法中各類別歷史真實數據集中K值采用交叉驗證的方法標定;趙建東等采用決策級融合策略,對收費數據和微波車檢數據進行融合,通過建立模型分配權重,使用BP神經網絡進行旅行時間預測,同時引入遺傳算法對BP神經網絡進行優(yōu)化,模型預測結果的相對誤差在10%以內。該文以高速公路中主線收費站路段為基礎進行分析,構建影響旅行時間的解釋變量,采用支持向量回歸算法,提出一種基于收費數據的高速公路站間旅行時間預測模型。
數據來自重慶高速公路網2017—2019年聯(lián)網收費數據,刪除其中異常數據(包括但不限于字段缺失、字段取值無效和車輛進出收費站的時間不合邏輯等)后提取每條信息中的車輛OD信息。經過數據預處理后一條完整的收費數據所包含的主要字段及含義見表1。
表1 收費數據中包含的主要字段
選取重慶G65包茂(包頭—茂名)高速公路渝湘段為研究對象。該項目全長84.5 km,由巴南主線收費站起,出城單向途經南彭、接龍、石龍、大觀、南川、金佛山8個收費站后到水江收費站為止。
以2018年為例,路網上總流量分布受客車流量分布影響最大,貨車流量則基本上維持在相對穩(wěn)定狀態(tài)(見圖1)。客車中的一型客車,其交通量占客車流量的絕大部分,具有一定的代表性。同時已有研究表明,高速公路交通系統(tǒng)中可用一型客車的旅行時間來推算其他車型的旅行時間。因此,以一型客車作為主要研究車型。
隨機統(tǒng)計工作日、周末和節(jié)假日路網流量小時分布,結果見圖2。由圖2可知:路網夜晚和凌晨時段流量相對稀少,該時段車輛以自由流速度行駛,無預測必要。因此,以7:00—20:00作為預測時段。
圖1 重慶高速公路網2018年全年流量月份分布
圖2 重慶高速公路網流量小時分布
如圖3所示,高速公路A、B收費站之間的路段稱為k站間,站間旅行時間是指在某時間周期內由A入口駛入、B出口駛出高速公路的所有車輛的平均行駛時間,也可稱為旅行時間。
圖3 高速公路收費站間示意圖
可根據收費數據中車輛經收費站進出高速公路的時間計算k站間在周期T內的旅行時間:
(1)
(2)
由于部分時間相鄰收費站間OD記錄較少,甚至某些相鄰站間在某些時段內無OD記錄,無法提取站間真實交通運行狀態(tài)的旅行時間。另外,由于某些特殊駕駛行為(如車輛長時間以低于最低限速或超速行駛、車輛進入服務區(qū)休息等)產生的異常旅行時間對提取OD間準確的旅行時間有所影響,有必要對該類數據進行控制。
對旅行時間數據的控制主要分為數據清洗和數據修補。數據清洗流程如下:1) 刪除旅行時間大于一個自然日的數據;2) 刪除平均速度超過道路最大限速20%的數據;3) 計算各周期內車輛旅行時間的均值μ和標準差δ,按照2δ原理刪除旅行時間不在[μ-2δ,μ+2δ]范圍內的數據;4) 重復步驟3直至剔除所有不在有效范圍內的數據。
(3)
(4)
(5)
在構建影響旅行時間的解釋變量時,將變量分為前期旅行時間,月份、周天、時段,大小車旅行時間差值,道路環(huán)境、天氣條件。
選取該預測站間k的前期旅行時間為備選變量,為確定變量中前期旅行時間的周期數量,隨機選取該項目某2個月、某2個不相鄰站間p和q的前5個周期旅行時間進行相關性分析,相關系數計算結果見表2。
表2 當前周期旅行時間與前期旅行時間的相關系數
由表2可知:當前時間下的旅行時間與其前3 個周期旅行時間的相關性較高。因此,選擇前3 個周期旅行時間作為備選變量。
以月份、周天和時段為變量對主線收費站交通量分布規(guī)律進行分析,確定各變量分類。
對于時段,根據圖2路網流量分布可將預測時段分為兩類:一類為出行高峰時段7:00—11:00和13:00—18:00;另一類為平峰時段11:00—13:00和18:00—20:00。
對于月份,統(tǒng)計2018年各月進入主線收費站的日均流量,結果見圖4。按照各月日均流量分布可將全年12個月分為兩類:第一類為1、3、4、5、10、11和12月;第二類為2、6、7、8和9月。
圖4 通道主線收費站日均流量月份分布
再統(tǒng)計各周天進入主線收費站的日均流量,并進行系統(tǒng)聚類,結果見圖5。根據圖5,將周天變量分為三類:周一到周四為一類;周日為一類;周五、周六為一類。
圖5 周天聚類譜系圖
相比城市交通系統(tǒng),高速公路系統(tǒng)各周期內貨車平均數量較多,交通流量中貨運車輛所占比例對交通運行狀態(tài)有一定影響,而交通運行狀態(tài)又與車輛旅行時間密切相關。小車(一型客車)旅行時間與大車(所有貨車)旅行時間的差值一定程度上能反映站間交通狀態(tài),在運行暢通的路段上,大、小車旅行時間基本維持在相對固定的差值;較為擁堵時,大、小車旅行時間差值會降低,意味著交通狀態(tài)已經或正在發(fā)生某些改變,這些改變又會對下一時刻的旅行時間產生影響。因此,引入周期內大小車旅行時間差值作為變量之一。
就道路環(huán)境而言,根據重慶山區(qū)高速公路多橋梁、隧道的特點,選取站間內橋梁、隧道長度作為備選變量。對于天氣條件,按晴天、陰雨天和霧天雪天對其進行劃分。
綜上,影響高速公路旅行時間的解釋變量及含義見表3。
表3 解釋變量
(6)
κ(xu,xv)=exp(-δ‖xu-xv‖)2
(7)
式中:δ為超參數,設置為1。
對式(6)進行求解,得:
(8)
式中:b為偏置誤差項,可借助KKT條件求解。
4.2.1 性能評價指標
選取均方根誤差(RMSE)、平均相對誤差(MAPE)作為模型的評價指標,計算公式如下:
(9)
(10)
4.2.2 預測結果分析
以某站間某天的旅行時間為例,通過修正,旅行時間相比未經處理的原數據波動范圍有所減小,缺少有效數據的周期也得到修補(見圖6)。
圖6 修正旅行時間
將真實旅行時間按7∶3劃分訓練集和測試集,選取m站間(路段長度為6 km,其中橋梁、隧道長度為零)和n站間(路段長度為16 km,其中橋梁、隧道長度為4.85 km)。圖7為m站間在一般情況場景下某周一和某事故場景下的模型預測結果,圖8為n站間在暑期場景下某周日和端午節(jié)假日下的模型預測結果。
圖7 m站間分場景預測結果
由圖7可知:模型在一般情況場景下表現(xiàn)較好;由于構建的解釋變量中缺少能準確描述偶然事件下旅行時間的影響因素,模型對偶然事件場景下的預測能力表現(xiàn)不足,但在非事故影響周期內,模型仍有一定的預測能力。
由圖8可知:模型在暑期場景下的預測精度總體較高;在節(jié)假日場景下也具有一定的預測能力。
綜上,模型總體表現(xiàn)能力較優(yōu),尤其是在一般場景和暑期場景下,平均相對誤差分別為5.17%、8.30%;相較于一般場景和暑期場景,節(jié)假日場景下短時間內或某些周期內的車流量更多,模型預測誤差較高。不同場景下模型預測結果的誤差見表4。
圖8 n站間分場景預測結果
表4 模型預測結果評價
(1) 構造SVR模型預測高速公路旅行時間可行、有效,模型在一般情況場景和暑期場景下的預測精度較高,對節(jié)假日也有一定的預測能力。
(2) 要實現(xiàn)模型對偶然事件下的準確預測,僅考慮大小車旅行時間差值還不夠,需引進更能描述偶然事件的參數變量。
(3) 下一步可考慮道路線形等相關變量,進一步提高模型的可靠性和適用性;同時使用特征選擇方法,去掉解釋變量中可能存在的冗余變量,進一步提高模型的計算能力。