陳喆, 巫立明, 楊恒旭, 溫惠英, 趙勝
(1.廣東聯(lián)合電子服務(wù)股份有限公司, 廣東 廣州 510075;2.華南理工大學 土木與交通學院, 廣東 廣州 510640)
高速公路由于車輛運行速度快、交通流量大,存在較大的事故隱患和風險。相關(guān)研究顯示,高速公路的受傷率、死亡率及百公里事故率是普通公路的3倍以上[1]。高速公路交通事故在造成人民群眾生命財產(chǎn)損失的同時,還會導(dǎo)致高速公路交通擁堵甚至路網(wǎng)癱瘓[2]。在高速公路交通事故中,常見的事故類型有追尾、翻車、撞擊護欄、貨物灑落、側(cè)面碰撞等,追尾作為發(fā)生頻率最高的高速公路事故類型之一,其處置時間過長,容易造成二次事故的發(fā)生,進而導(dǎo)致更大的生命財產(chǎn)損失與通行能力下降。
交通事故發(fā)生后,第一時間對其持續(xù)時間進行預(yù)測評估有利于后續(xù)相關(guān)救援疏散工作計劃制定。近年來,眾多學者開展了交通事故持續(xù)時間預(yù)測研究,形成了兩類主要方法,分別為基于人工智能的方法和基于統(tǒng)計的方法。在人工智能學習模型方面,姬楊蓓蓓等采用貝葉斯方法建立決策樹預(yù)測模型,對交通事故持續(xù)時間進行了預(yù)測[3];何珂等基于山西省2 115起高速公路隧道交通事故數(shù)據(jù),使用主成分分析和隨機森林組合模型對隧道交通事故持續(xù)時間進行了預(yù)測[4];紀柯柯等結(jié)合多種文本分類算法,構(gòu)建V-Fisher有序聚類模型,提升了對交通事故持續(xù)時間的預(yù)測效果[5];Tang J. J.等基于華盛頓事件系統(tǒng)中2 565起交通事故數(shù)據(jù),建立K-Means和XGBoost算法進行了事故持續(xù)時間預(yù)測[6]?;谌斯ぶ悄軐W習模型的事故持續(xù)時間預(yù)測具有較好的性能,但可解釋性較差,且對樣本量的要求較高,需要豐富的數(shù)據(jù)樣本及標簽?;诮y(tǒng)計方法的交通事故持續(xù)時間預(yù)測模型主要分為概率分布模型、線性回歸模型和基于風險的模型。Hou L.等建立非比例風險模型,基于西雅圖2 584起高速公路交通事故樣本,分析了事件、時間、地理、交通和運營對事件清除時間的時變影響,發(fā)現(xiàn)涉及重型卡車、夜間、周末等18個因素對清除時間有顯著影響[7];Ding C.等分別針對事故響應(yīng)時間、清除時間建立二元概率模型和切換回歸模型,分析了事故類型、時間、環(huán)境等因素的影響[8];夏正豐應(yīng)用多元回歸方法建立了高速公路交通事故持續(xù)時間預(yù)測模型[9];Zou Y. J.等利用分位數(shù)回歸方法和Copula模型分析了美國西雅圖高速公路交通事故持續(xù)時間的影響因素[10];Wali B.等對固定參數(shù)回歸、隨機參數(shù)回歸與基于分位數(shù)回歸的事故持續(xù)時間模型進行對比,結(jié)果顯示隨機參數(shù)模型的預(yù)測結(jié)果更準確[11]。以往的研究多是基于歷史事故數(shù)據(jù)對高速公路交通事故持續(xù)時間進行分析,較少考慮不同事故類型的事故持續(xù)時間的差異,且受限于數(shù)據(jù)采集難度,未充分考慮事故發(fā)生前后短時交通流參數(shù)變化對高速公路追尾事故持續(xù)時間的影響?;诟咚俟纷肺彩鹿食掷m(xù)時間的有序性,本文將追尾事故持續(xù)時間分為3個等級,綜合考慮追尾事故信息與事故前后短時交通流運行狀況,運用有序Logit模型和邊際效應(yīng)分析高速公路追尾事故持續(xù)時間的影響因素,為高速公路交通管理部門制定追尾事故救援及事故后交通疏散方案提供依據(jù)。
研究數(shù)據(jù)來自廣東省高速公路主線ETC(電子不停車收費系統(tǒng))門架數(shù)據(jù)及交警記錄的交通事故數(shù)據(jù),基礎(chǔ)數(shù)據(jù)結(jié)構(gòu)完整、字段齊全,具有良好的精度。通過數(shù)據(jù)匹配與數(shù)據(jù)挖掘進一步提取交通流數(shù)據(jù)與事故信息,其中交通流數(shù)據(jù)主要字段包括高速公路ETC門架監(jiān)測的交通流量、交通密度、區(qū)間速度等,交通事故數(shù)據(jù)主要字段包括事故類型、涉事車輛類型、涉事車輛數(shù)、事故持續(xù)時間、占據(jù)車道情況及事故發(fā)生地點車道數(shù)、上下游路段交通設(shè)施布局等。通過對上述交通流數(shù)據(jù)、事故數(shù)據(jù)及道路數(shù)據(jù)進行匹配,得到925起高速公路追尾事故數(shù)據(jù)及發(fā)生前后短時交通流參數(shù),為高速公路追尾事故持續(xù)時間分析及預(yù)測提供數(shù)據(jù)基礎(chǔ)。
如表1所示,所選數(shù)據(jù)集中高速公路追尾事故持續(xù)時間最大值為721.00 min,最小值為14.00 min,平均值為88.25 min,均方根為107.37 min。其中事故持續(xù)時間為50~100 min的追尾事故數(shù)量最多,約占全部追尾事故的52%(見圖1)。
由于存在多個難以觀測的變量影響事故持續(xù)時間,準確的追尾事故持續(xù)時間往往難以預(yù)測。高速公路交通管理部門在進行事故救援及事故后交通疏散時并不需要獲知事故準確的持續(xù)時間,而是需要根據(jù)預(yù)測的追尾事故持續(xù)時間長短將事故進行分級,以制定不同的事故處置方案。鑒于此,區(qū)別以往按照傷亡人數(shù)、財產(chǎn)損失對交通事故的分類,依據(jù)采集的925起追尾事故持續(xù)時間的分布及追尾事故對道路交通的影響,將追尾事故分為輕微追尾事故(事故持續(xù)時間小于100 min)、一般追尾事故(事故持續(xù)時間為100~200 min)和嚴重追尾事故(事故持續(xù)時間大于200 min)。
表1 高速公路追尾事故持續(xù)時間統(tǒng)計
圖1 高速公路追尾事故持續(xù)時間頻數(shù)分布
高速公路追尾事故的持續(xù)時間與事故發(fā)生時間、涉事車輛類型、涉事車輛數(shù)、傷亡人數(shù)、占據(jù)車道情況及交通流狀況等密切相關(guān)[11]。因此,以追尾事故持續(xù)時間的3個等級為因變量,從事故發(fā)生時間、涉事車輛類型、傷亡情況、車道情況、事故發(fā)生前后交通流運行狀況五方面選取12個自變量進行分析,變量定義見表2。
表2 變量編碼及描述
續(xù)表2
由表2可知:因變量是三分類的有序變量,且持續(xù)時間逐漸遞增,而自變量中既有連續(xù)變量又有分類變量。其中二分類變量為事故發(fā)生日期、晝夜劃分、時段劃分及占據(jù)路肩情況,多分類變量是指多于2種選擇的變量,將涉事車輛類型劃分為僅小車、僅貨車、貨車與小車、有客車、有特種車五類。事故信息中,涉事車輛數(shù)、受傷人數(shù)及占據(jù)車道數(shù)為連續(xù)變量??紤]到事故發(fā)生前后交通流運行狀況可能對事故清理造成影響,將事故發(fā)生前后10 min內(nèi)路段平均速度及到達上游門架的車輛數(shù)也作為自變量,探究其對追尾事故持續(xù)時間的影響。交通流影響因素中,追尾事故發(fā)生前后10 min內(nèi)路段平均速度及到達事故發(fā)生點上游門架的交通量均為連續(xù)變量。
多項Logit模型可視為二元Logit模型的拓展,二者的差異在于,二元Logit模型的被解釋變量只有0和1兩個取值,而多項Logit模型涉及被解釋變量有多個取值的情形。多項Logit模型基于效用理論擬合自變量與包含多個類別的分類變量間的內(nèi)在關(guān)系。假定事故影響因素相互獨立,且服從Gumbel分布(Ⅰ類廣義極值分布),對于任一交通事故i,事故持續(xù)時間等級的效用函數(shù)為:
Si,k=βkXi+εi,k(k=1,2,3)
(1)
式中:Xi為事故i對應(yīng)的影響因素觀測值組成的向量;βk為這些因素對應(yīng)事故持續(xù)時間等級k的回歸系數(shù)組成的向量(包括常數(shù)項);εi,k為隨機項。
有序Logit模型主要用于處理因變量為有序變量的多分類結(jié)果,屬于多項Logit模型的拓展[11],在多分類的交通事故等級預(yù)測中表現(xiàn)出較好的性能。傳統(tǒng)有序Logit模型中,假定解釋變量的系數(shù)是固定的,高速公路追尾事故持續(xù)時間第j個等級的有序Logit模型為:
(2)
式中:Yi為第i起追尾事故的持續(xù)時間等級;X為自變量向量;β為回歸系數(shù)向量;αj為第j追尾事故等級的截距;J為高速公路追尾事故持續(xù)時間劃分的等級數(shù)量。
本文將因變量(追尾事故持續(xù)時間)分為3個等級,有序Logit模型為:
(3)
P(Y=2|X)=P(Y≤2|X)-P(Y≤1|X)
(4)
P(Y=3|X)=1-P(Y≤2|X)
(5)
式中:xk為第k個自變量,k=1,2,…,K;βk為第k個自變量的回歸系數(shù)。
邊際效應(yīng)可用于定量分析不同因素對因變量影響的強弱程度與變化趨勢[12],其表達式為:
(6)
以廣東省某高速公路2020—2022年925起追尾事故的持續(xù)時間為研究對象,考慮到事故持續(xù)時間劃分等級具有有序性,通過回歸分析建立追尾事故持續(xù)時間的有序Logit模型。采用統(tǒng)計分析軟件Stata16.0進行求解,取顯著性水平為0.10,通過最大似然估計法估算得到有序Logit模型的參數(shù)結(jié)果(見表3)。
由表3可知:1) 受傷人數(shù)、占據(jù)車道數(shù)、追尾事故發(fā)生時間為工作日還是節(jié)假日、追尾事故發(fā)生時間為夜晚還是白天、事故發(fā)生后10 min內(nèi)路段平均速度及涉事車輛類型對高速公路追尾事故持續(xù)時間具有顯著影響。占據(jù)車道數(shù)、受傷人數(shù)越多及追尾事故發(fā)生于節(jié)假日和白天都會導(dǎo)致追尾影響交通的持續(xù)時間更長。2) 占據(jù)車道數(shù)、受傷人數(shù)每增加一個單位,追尾事故持續(xù)時間等級上升的概率分別增加38%和46%,驗證了前人的研究成果[13]。節(jié)假日發(fā)生的追尾事故持續(xù)時間等級更高的概率是工作日的1.321倍,白天發(fā)生的追尾事故持續(xù)時間等級更高的概率是夜晚的1.788倍。3) 相較于涉事車輛類型均為小車,涉事車輛中含有大客車、貨車及特種車往往會造成更長的事故持續(xù)時間,這點與高速公路交通事故規(guī)律相吻合,即有大型車輛參與的交通事故往往伴隨著更大的事故影響范圍與事故嚴重程度。而隨著追尾事故發(fā)生后10 min內(nèi)路段平均速度的增加,追尾事故持續(xù)時間等級更有可能下降,這可能是由于事故發(fā)生后上游駕駛員提高行車速度在短時間內(nèi)駛離事故現(xiàn)場,以減少對現(xiàn)場交通的影響,為事故現(xiàn)場清理及應(yīng)急救援提供良好條件。
表3 基于有序Logit模型的參數(shù)估計
表4為Pearson統(tǒng)計量和Deviance統(tǒng)計量擬合優(yōu)度檢驗結(jié)果。Pearson和Deviance統(tǒng)計量的p值均大于0.1,表明在顯著性水平α=0.10的條件下模型的擬合效果較好。有序Logit模型平行性檢驗結(jié)果原假設(shè)是各回歸方程互相平行,平行性檢驗p=0.271>0.10,接受原假設(shè),模型通過平行性檢驗,可進一步對高速公路追尾事故持續(xù)時間的影響因素進行分析。
表4 有序Logit模型的擬合優(yōu)度檢驗
分別計算有序多分類Logit模型和無序多分類Logit模型的赤池信息量(Akaike Information Criterion,AIC)和貝葉斯信息量(Bayesian Information criterion,BIC),結(jié)果見表5。有序多分類Logit模型的AIC與BIC均低于無序多分類Logit模型,表明有序Logit模型的擬合優(yōu)度更高。
表5 模型對比
結(jié)合邊際效應(yīng)對表3中顯著的自變量進行參數(shù)解釋,結(jié)果見表6。
表6 邊際效應(yīng)分析
由表6可知:1) 在90%置信水平上,受傷人數(shù)每增加1人,追尾事故為一般事故、嚴重事故的概率分別增加4.8%、1.3%,而輕微追尾事故的概率降低6.1%;占據(jù)車道數(shù)每增加1條,一般追尾事故、嚴重追尾事故的概率分別增加5.6%、1.5%,輕微事故概率降低7.1%;事故發(fā)生后10 min內(nèi)路段平均速度每增加一個單位,一般追尾事故與重大追尾事故的概率分別降低0.2%、0.1%。2) 相較于工作日和夜晚,節(jié)假日與白天容易發(fā)生持續(xù)時間更長、嚴重程度更大的追尾事故。節(jié)假日期間一般追尾事故、嚴重追尾事故的概率分別增加4.1%、1.1%,白天時段一般追尾事故、嚴重追尾事故的概率分別增加8.6%、2.3%。這是由于節(jié)假日和白天高速公路交通量更大,給事故清理與應(yīng)急救援帶來更大干擾,造成更長的事故持續(xù)時間。3) 在涉事車輛類型方面,涉事車輛中含有大客車、貨車及特種車會增加追尾事故的持續(xù)時間。
(1) 以廣東省某高速公路2020—2022年925起追尾事故為研究對象,從事故發(fā)生時間、涉事車輛類型、傷亡情況、車道情況、事故發(fā)生前后交通流運行狀況5個方面選取12個自變量,以事故持續(xù)時間為特征將追尾事故劃分為3個等級,并將其作為因變量,分別構(gòu)建無序多分類Logit模型和有序多分類Logit模型。結(jié)果表明,相較于無序多分類Logit模型,有序多分類Logit模型對高速公路追尾事故持續(xù)時間的擬合效果更優(yōu)。
(2) 高速公路追尾事故占據(jù)車道數(shù)、受傷人數(shù)、事故發(fā)生時間、事故發(fā)生后10 min內(nèi)路段平均速度及涉事車輛類型對事故持續(xù)時間具有顯著影響。
(3) 占據(jù)車道數(shù)和受傷人數(shù)越多、追尾事故發(fā)生于節(jié)假日和白天及涉事車輛中含有大客車、貨車及特種車輛會增加追尾事故的持續(xù)時間。
(4) 追尾事故持續(xù)時間隨著事故發(fā)生后10 min內(nèi)路段平均速度的增大而減少,事故發(fā)生后10 min內(nèi)路段平均速度每增加一個單位,一般追尾事故與重大追尾事故的概率分別降低0.2%、0.1%。