趙曉華,楊海益,姚 瑩,郭 淼,亓 航,戴義博,蘇岳龍
(1.北京工業(yè)大學(xué)城市建設(shè)學(xué)部,北京 100124;2.高德軟件有限公司,北京 102299)
相對(duì)高速公路的普通路段、隧道、服務(wù)區(qū)等,橋梁路段因其所處位置特殊性、外部環(huán)境復(fù)雜性,故其發(fā)生的交通事故嚴(yán)重性也最高[1]。作為高速公路交通安全治理的重要路段,有必要對(duì)其安全風(fēng)險(xiǎn)要素開(kāi)展深入分析,以識(shí)別高風(fēng)險(xiǎn)區(qū)域及其誘發(fā)因素,為提升高速公路橋梁路段的安全水平提供指導(dǎo)。
當(dāng)前,面向橋梁路段交通安全風(fēng)險(xiǎn)相關(guān)研究,國(guó)內(nèi)外學(xué)者主要關(guān)注由橋梁結(jié)構(gòu)特征所產(chǎn)生的風(fēng)險(xiǎn),例如陳豐等[2]通過(guò)駕駛模擬實(shí)驗(yàn)研究橋上側(cè)風(fēng)對(duì)于行車穩(wěn)定性的影響;周晉冬等[3]采用自然駕駛數(shù)據(jù),論證當(dāng)橋頭沉降差較大時(shí),橋頭跳車會(huì)增加駕駛員生理、心理上的負(fù)擔(dān);此外,也有學(xué)者圍繞車-橋耦合振動(dòng)、極端外力條件等對(duì)橋上行車安全性的影響作用開(kāi)展了相關(guān)研究[4]。而交通流(如流量、速度、擁堵指數(shù))、道路屬性(如跨河橋上、下游過(guò)渡區(qū))及外部環(huán)境(如天氣條件、風(fēng)力等級(jí)等)要素及其耦合作用作為影響橋梁交通運(yùn)行安全風(fēng)險(xiǎn)的關(guān)鍵,由于其位置的特殊性及數(shù)據(jù)采集的困難,相關(guān)研究受到制約。隨著車載導(dǎo)航等智能移動(dòng)終端的廣泛使用,通過(guò)GPS(全球定位系統(tǒng))衛(wèi)星定位及陀螺儀等內(nèi)置傳感器能夠精準(zhǔn)采集駕駛?cè)孙L(fēng)險(xiǎn)駕駛行為(如急加速、急減速、急轉(zhuǎn)彎等)、流量、速度、擁堵指數(shù)等參數(shù),一方面為從風(fēng)險(xiǎn)駕駛行為角度評(píng)價(jià)橋梁路段的安全性風(fēng)險(xiǎn)提供了可能,另一方面也為交通安全風(fēng)險(xiǎn)影響要素的深度解析提供了機(jī)遇。
針對(duì)交通安全風(fēng)險(xiǎn)評(píng)估問(wèn)題,其解決方法主要以事故數(shù)據(jù)為因變量構(gòu)建其與人、車、路、環(huán)境間的關(guān)聯(lián)關(guān)系模型。例如You等[5]基于支持向量機(jī)建立事故預(yù)測(cè)模型,分析速度標(biāo)準(zhǔn)差、流量等因素對(duì)事故發(fā)生頻次的影響;馬聰?shù)龋?]通過(guò)建立基于負(fù)二項(xiàng)和非線性負(fù)二項(xiàng)回歸模型的交通事故次數(shù)預(yù)測(cè)模型,指出道路濕滑、起霧是造成交通事故主要原因。事實(shí)上,受制于交通事故小概率、偶發(fā)性、滯后性的特點(diǎn),近年來(lái),也有研究開(kāi)始關(guān)注駕駛行為、速度波動(dòng)等變量與交通事故間的關(guān)聯(lián)關(guān)系,并以風(fēng)險(xiǎn)駕駛行為和速度差等風(fēng)險(xiǎn)替代指標(biāo)評(píng)估交通風(fēng)險(xiǎn),挖掘其與影響要素的關(guān)系[7],以期將交通安全風(fēng)險(xiǎn)的防控從事后分析轉(zhuǎn)向事前預(yù)防,這些研究均取得一定的進(jìn)展。由于基于事前替代指標(biāo)的安全風(fēng)險(xiǎn)評(píng)價(jià)可實(shí)現(xiàn)全域的實(shí)時(shí)評(píng)估與診斷,突破事故數(shù)據(jù)的制約,以替代指標(biāo)為核心的安全評(píng)價(jià)與關(guān)聯(lián)要素挖掘研究已受到學(xué)者們的廣泛關(guān)注[8],其具有良好的借鑒價(jià)值。
針對(duì)風(fēng)險(xiǎn)關(guān)聯(lián)要素挖掘問(wèn)題,相較傳統(tǒng)統(tǒng)計(jì)模型、線性模型和因果推斷模型,基于樹(shù)模型的機(jī)器學(xué)習(xí)算法雖具有更強(qiáng)大的非線性分類和自學(xué)習(xí)能力,在識(shí)別多源要素耦合作用下的交通安全風(fēng)險(xiǎn)更具優(yōu)勢(shì)[9],但可解釋性的匱乏是阻礙其應(yīng)用的重要因素。而部分依賴圖(partial dependence plots,PDP)技術(shù)作為一種新的機(jī)器學(xué)習(xí)模型解析方法,可定量化描述樹(shù)模型的特征變量對(duì)交通安全風(fēng)險(xiǎn)的影響作用,為交通風(fēng)險(xiǎn)影響要素挖掘提供新的途徑,也為交通管理部門及政策制定者開(kāi)展精準(zhǔn)的道路風(fēng)險(xiǎn)研判提供依據(jù)。
綜上所述,本文針對(duì)高速公路橋梁路段的安全評(píng)價(jià)及關(guān)聯(lián)因素挖掘問(wèn)題開(kāi)展研究,論文以風(fēng)險(xiǎn)駕駛行為及交通運(yùn)行狀態(tài)為核心形成交通秩序指數(shù)以評(píng)價(jià)交通安全風(fēng)險(xiǎn),突破交通事故數(shù)據(jù)不均衡的限制,及對(duì)于潛在的交通安全風(fēng)險(xiǎn)影響要素深度挖掘問(wèn)題,分別建立基于機(jī)器學(xué)習(xí)模型(隨機(jī)森林、梯度提升決策樹(shù))的高速公路橋梁路段風(fēng)險(xiǎn)識(shí)別模型,并通過(guò)個(gè)體條件期望圖挖掘交通流特征、路段屬性、外部環(huán)境條件、時(shí)間屬性與高速公路橋梁路段風(fēng)險(xiǎn)等級(jí)間的量化關(guān)系,以期實(shí)現(xiàn)對(duì)多因素安全風(fēng)險(xiǎn)間耦合作用的深度挖掘,消除基于部分依賴圖的影響要素解析中由數(shù)據(jù)異質(zhì)性及非均勻效應(yīng)的影響。研究結(jié)果為解決高速公路橋梁路段安全問(wèn)題提供了新的視角,為主動(dòng)安全防控和靶向治理方案提供理論支持。
本研究以鄂東長(zhǎng)江大橋?yàn)檠芯繉?duì)象,其是中國(guó)湖北省境內(nèi)連接黃石市和黃岡市的重要過(guò)江通道。論文所選數(shù)據(jù)來(lái)源于高德導(dǎo)航軟件的浮動(dòng)車軌跡數(shù)據(jù)和當(dāng)?shù)亟煌ü芾聿块T的事故調(diào)查數(shù)據(jù)。高德導(dǎo)航軟件數(shù)據(jù)集包含路段編號(hào)、交通流運(yùn)行狀態(tài)、外部環(huán)境及駕駛行為。事故調(diào)查數(shù)據(jù)集包含事故發(fā)生時(shí)間及所處的道路樁號(hào)。
研究以同質(zhì)性為劃分原則,將鄂東長(zhǎng)江大橋劃分為6個(gè)區(qū)域,分別為高速公路路基直線段、高速公路路基曲線段、跨河橋上游過(guò)渡段、跨河橋下游過(guò)渡段、跨河橋段、跨線橋段。但由于跨河橋上、下游過(guò)渡區(qū)分別連接圓曲線和互通立交匝道,而部分學(xué)者已證明圓曲線和互通立交匝道對(duì)駕駛行為有較大負(fù)面影響[10-11]。為防止這兩個(gè)特殊區(qū)域?qū)︼L(fēng)險(xiǎn)識(shí)別模型的影響,根據(jù)美國(guó)道路通行能力手冊(cè),入口匝道的影響緩沖區(qū)設(shè)置為450 m[11]。不同路段的起終點(diǎn)樁號(hào)范圍、路段長(zhǎng)度詳見(jiàn)表1。
表1 各路段單元的樁號(hào)范圍Tab.1 Stake number of each unit partition
在原始數(shù)據(jù)集中,部分變量可直接用于風(fēng)險(xiǎn)影響因素解析,例如路段限速值、能見(jiàn)度等。其余變量需在原始數(shù)據(jù)的基礎(chǔ)上提取獲得新的特征變量,例如速度變異系數(shù)、延誤系數(shù)等。具體定義如下。
1.2.1 激進(jìn)駕駛行為頻次
激進(jìn)駕駛行為事件主要包含急加速、急減速、急左并道、急右并道、急左轉(zhuǎn)和急右轉(zhuǎn)。激進(jìn)駕駛行為數(shù)據(jù)是由手機(jī)傳感器采集,其可精準(zhǔn)辨識(shí)用戶在行車過(guò)程中實(shí)時(shí)發(fā)生的激進(jìn)駕駛行為事件,并記錄事件發(fā)生的時(shí)間和經(jīng)緯度。而受用戶隱私保護(hù)協(xié)議的限制,具體的判定算法無(wú)法給出。此外,因不同道路長(zhǎng)度和某時(shí)段內(nèi)導(dǎo)航軟件用戶數(shù)量的差異,原始數(shù)據(jù)無(wú)法在同一尺度下衡量路段風(fēng)險(xiǎn)程度。故需將原始激進(jìn)駕駛行為發(fā)生的次數(shù)轉(zhuǎn)化為集計(jì)數(shù)據(jù)后再開(kāi)展分析,集計(jì)激進(jìn)駕駛行為頻次FEijk的計(jì)算方法如下:
式中:i與j分別表示某天和某時(shí)(i=1,2,3,…,62,j=0,1,2,…,23);k表示路段編號(hào);FEijk為i日j時(shí)k路段發(fā)生的駕駛行為事件頻次;sum(eventijk)為i日j時(shí)k路段發(fā)生的激進(jìn)駕駛行為次數(shù)之和;lk表示路段長(zhǎng)度;UPijk為i日j時(shí)k路段的導(dǎo)航軟件實(shí)際用戶量。
1.2.2 速度變異指數(shù)
相關(guān)研究表明,高風(fēng)險(xiǎn)和較高的事故頻次與某路段內(nèi)交通流平均速度的離散程度和速度變異系數(shù)(coefficient of speed variation,CSV)有顯著關(guān)聯(lián)[12]。速度變異系數(shù)是評(píng)價(jià)交通流速度離散程度的指標(biāo)。速度變異系數(shù)越大,則表明交通流速度的分布越離散,交通運(yùn)行狀態(tài)越混亂,交通安全風(fēng)險(xiǎn)越大。速度變異系數(shù)CSVijk的計(jì)算公式如下:
式中:σvijk為i日j時(shí)k路段的交通流速度標(biāo)準(zhǔn)差;vˉijk為i日j時(shí)k路段的交通流速度平均值。
1.2.3 延誤系數(shù)
擁堵會(huì)對(duì)交通安全產(chǎn)生負(fù)面影響[12]。延誤系數(shù)可有效衡量路段內(nèi)的擁堵程度。延誤系數(shù)CIijk的計(jì)算公式如下:
式中:vk表示k路段的自由流速度。
1.2.4 交通流量等級(jí)
為了表征交通流量在不同時(shí)段的差異性,使用K均值聚類算法,將導(dǎo)航軟件的用戶量離散化為三類,分別為低峰期、平峰期、高峰期,并以聚類后各類的最大值、最小值設(shè)定區(qū)間劃分閾值,具體定義如下所示。交通流量等級(jí)是一種狀態(tài)參量,而非具體量值。
低峰期:UPijk∈[0,343)
平峰期:UPijk∈[343,757)
高峰期:UPijk∈[757,+∞)
當(dāng)前,交通安全分析主要以事故作為評(píng)價(jià)指標(biāo),但交通事故具有偶發(fā)性、局部性、滯后性等特質(zhì),無(wú)法覆蓋全時(shí)空域的風(fēng)險(xiǎn)場(chǎng)景,易忽略事故發(fā)生時(shí)的潛在風(fēng)險(xiǎn)要素,實(shí)際應(yīng)用過(guò)程中,難以開(kāi)展全局動(dòng)態(tài)交通安全評(píng)估與辨識(shí)。此外,由于事故數(shù)據(jù)數(shù)量和質(zhì)量的限制,傳統(tǒng)統(tǒng)計(jì)分析及大數(shù)據(jù)機(jī)器學(xué)習(xí)算法均難以發(fā)揮真正效能,導(dǎo)致影響因素解析能力不足。借助導(dǎo)航軟件,依托海量駕駛行為及交通流狀態(tài)數(shù)據(jù),為提出以風(fēng)險(xiǎn)替代指標(biāo)為核心的交通安全風(fēng)險(xiǎn)評(píng)價(jià)方法提供了新的機(jī)遇。Yao等[13]提出了交通秩序指數(shù)(traffic order index,TOI),并通過(guò)交通秩序指數(shù)評(píng)價(jià)城市道路的安全性和順暢性。交通秩序指數(shù)是一種基于激進(jìn)駕駛行為和速度變化特性的交通安全風(fēng)險(xiǎn)替代指標(biāo)。Yao等[13]通過(guò)關(guān)聯(lián)交通秩序指數(shù)與事故數(shù)間的關(guān)系發(fā)現(xiàn),交通事故數(shù)多且事故持續(xù)時(shí)長(zhǎng)較長(zhǎng)的路段,交通秩序指數(shù)較低??傊?,當(dāng)路段內(nèi)激進(jìn)駕駛行為頻發(fā),且交通流紊亂時(shí),其交通秩序指數(shù)較低,交通安全風(fēng)險(xiǎn)較高,秩序指數(shù)代表風(fēng)險(xiǎn)發(fā)生的概率,其計(jì)算方法詳見(jiàn)文獻(xiàn)[13],簡(jiǎn)要計(jì)算流程如下所述。
交通秩序指數(shù)是由優(yōu)劣解距離法(technique for order preference by similarity to an ideal solution,TOPSIS)及熵權(quán)法等算法將多類激進(jìn)駕駛行為與速度變異系數(shù)加權(quán)而得。交通秩序指數(shù)的計(jì)算方法如式(4)所示。
式中:TOIijk為i日j時(shí)k路段的交通秩序指數(shù);Sdbijk、SCSVijk表示激進(jìn)駕駛行為和車流速度波動(dòng)的風(fēng)險(xiǎn)評(píng)分;wk為激進(jìn)駕駛行為和速度波動(dòng)風(fēng)險(xiǎn)評(píng)分在交通秩序指數(shù)中所占的權(quán)重,k={db,CSV}。
激進(jìn)駕駛行為風(fēng)險(xiǎn)評(píng)分Sdbijk是由TOPSIS算法綜合急加速、急減速、急左轉(zhuǎn)等激進(jìn)駕駛行為頻次計(jì)算而得。TOPSIS算法是一種多目標(biāo)決策分析中常用的有效方法,其已在交通安全分析領(lǐng)域獲得廣泛應(yīng)用。而速度波動(dòng)風(fēng)險(xiǎn)評(píng)分SCSVijk的計(jì)算方法如公式(5)所示:
激進(jìn)駕駛行為和速度波動(dòng)風(fēng)險(xiǎn)評(píng)分在交通秩序指數(shù)中所占的權(quán)重wk由式(6)求得:
式中:σk表示激進(jìn)駕駛行為或車流速度波動(dòng)風(fēng)險(xiǎn)評(píng)分的樣本標(biāo)準(zhǔn)差。
交通秩序指數(shù)是綜合評(píng)判道路秩序程度的指標(biāo),為了使其能研判路段內(nèi)的風(fēng)險(xiǎn)水平,故采用K-均值聚類方法將TOIijk劃為三個(gè)風(fēng)險(xiǎn)等級(jí),并以聚類后各類別的最大值、最小值設(shè)定區(qū)間劃分閾值,具體定義如下:
高風(fēng)險(xiǎn)道路:交通秩序較差,風(fēng)險(xiǎn)較高:TOIijk∈[0,0.359 8)
中風(fēng)險(xiǎn)道路:交通秩序良好,風(fēng)險(xiǎn)適中:TOIijk∈[0.359 8,0.410 7)
低風(fēng)險(xiǎn)道路:交通秩序較好,風(fēng)險(xiǎn)較低:TOIijk∈[0.410 7,+∞)
以橋梁路段單元及時(shí)間戳為基礎(chǔ)搭建時(shí)空網(wǎng)格,并匹配所有類型數(shù)據(jù),構(gòu)建橋梁路段安全分析數(shù)據(jù)庫(kù),共計(jì)17 856條(6個(gè)路段類型×2個(gè)方向×62 d×24 h)數(shù)據(jù),刪除空缺及異常數(shù)據(jù)后,共計(jì)17 160條數(shù)據(jù)。數(shù)據(jù)庫(kù)中各變量的統(tǒng)計(jì)性描述如表2及表3所示。
表2 分類變量的定義與統(tǒng)計(jì)Tab.2 Definition and statistics of categorical variables量
表3 連續(xù)變量的定義與統(tǒng)計(jì)Tab.3 Definition and statistics of continuous variables
隨機(jī)森林是一種以決策樹(shù)為基礎(chǔ)的算法,在訓(xùn)練模型的過(guò)程中引入隨機(jī)屬性選擇,并采用引導(dǎo)聚集方法,最終結(jié)合多個(gè)弱分類器形成強(qiáng)分類器。由于隨機(jī)森林模型結(jié)合了多個(gè)弱分類器的預(yù)測(cè)結(jié)果,故隨機(jī)森林模型可以較好地控制過(guò)擬合問(wèn)題。此外,隨機(jī)森林模型相較于人工神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)等,其在小樣本集上擁有更加出色的分類識(shí)別能力[14]?;诖耍S機(jī)森林模型更適于數(shù)據(jù)量較小、數(shù)據(jù)可能存在異質(zhì)性等情況。簡(jiǎn)易過(guò)程如下:
在已知訓(xùn)練集{(x1,y1),…,(xn,yn)},模型將隨機(jī)重復(fù)采樣B次,獲得b=1,…,B的不同訓(xùn)練集x'用以訓(xùn)練弱分類器fb。訓(xùn)練后的模型通過(guò)計(jì)算B個(gè)弱分類器的類別概率均值,獲得最終的分類結(jié)果,如式(7)所示:
本文選擇梯度提升決策樹(shù)模型為風(fēng)險(xiǎn)等級(jí)識(shí)別性能的對(duì)比模型。與隨機(jī)森林模型不同在于,隨機(jī)森林是一種引導(dǎo)聚集算法,該類算法會(huì)對(duì)樣本重采樣,預(yù)測(cè)結(jié)果是各個(gè)分類器的平均值。而梯度提升決策樹(shù)模型是一種提升算法,基于上次迭代后預(yù)測(cè)器的分類結(jié)果更新樣本權(quán)值和分類器權(quán)值,因此隨著模型迭代次數(shù)的增加,模型的預(yù)測(cè)偏差會(huì)降低。這兩種模型都可有效控制過(guò)擬合問(wèn)題,且在不同的應(yīng)用場(chǎng)景和數(shù)據(jù)特質(zhì)下有不同的性能表現(xiàn)。
此外,在建立高速公路橋梁路段安全風(fēng)險(xiǎn)識(shí)別模型時(shí),均需要完成以下步驟:
(1)基于隨機(jī)分布原則按7:3的比例將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于訓(xùn)練識(shí)別模型,測(cè)試集用于評(píng)估模型的分類性能;
(2)訓(xùn)練模型時(shí),采用十折交叉驗(yàn)證方法將訓(xùn)練集的數(shù)據(jù)隨機(jī)切分為10份,每次訓(xùn)練會(huì)以9個(gè)子樣本結(jié)合1個(gè)子樣本驗(yàn)證的形式進(jìn)行;
(3)本文使用網(wǎng)格搜索方式進(jìn)行參數(shù)調(diào)優(yōu),實(shí)現(xiàn)指定參數(shù)值的窮舉式搜索。
為了評(píng)估安全風(fēng)險(xiǎn)識(shí)別模型的性能,以機(jī)器學(xué)習(xí)模型中常用的分類評(píng)價(jià)指標(biāo)準(zhǔn)確率、召回率、精確率和F1·Score作為模型評(píng)價(jià)指標(biāo)。
對(duì)于多分類預(yù)測(cè),以各類別所占樣本集的比例為權(quán)重,計(jì)算各類別中每個(gè)評(píng)價(jià)指標(biāo)的加權(quán)平均值。召回率(Recall)、精確率(Precision)、F1·Score的相關(guān)定義如下:
式中:i表示交通風(fēng)險(xiǎn)等級(jí)的類別編號(hào)(i=1,2,3);M為交通風(fēng)險(xiǎn)等級(jí)的總類別數(shù),即M=3,wi為第i類在全樣本集所占的比例;TPi、FNi、FPi、TNi的相關(guān)定義請(qǐng)見(jiàn)表4。
表4 i類風(fēng)險(xiǎn)的混淆矩陣Tab.4 Confusion matrix of i risk level
傳統(tǒng)的部分依賴圖可反映響應(yīng)變量和一個(gè)或多個(gè)特征間依賴關(guān)系的平均值,其可能掩蓋由特征耦合作用產(chǎn)生的異質(zhì)關(guān)系,只有當(dāng)特征間相關(guān)交互較弱時(shí),才可客觀反映特征對(duì)自變量的影響關(guān)系。由于上述原因,Goldstein等[15]提出了一種全新的機(jī)器學(xué)習(xí)黑箱模型可視化工具——個(gè)體條件期望圖(plots of individual conditional expectation,ICE),可用于監(jiān)督學(xué)習(xí)算法的預(yù)測(cè)模型。ICE通過(guò)計(jì)算多組測(cè)試集的依賴關(guān)系以分解部分依賴值,有助于消除非均勻效應(yīng)的影響,并可通過(guò)繪制響應(yīng)變量和個(gè)別觀測(cè)特征間的函數(shù)關(guān)系細(xì)化圖形,便于深刻理解影響關(guān)系。
設(shè)S∈{1,…,P},且C為S的補(bǔ)集。此時(shí),S測(cè)試樣本集下,xs的依賴關(guān)系可以表達(dá)為
每個(gè)子集S都有其個(gè)體的依賴關(guān)系fs,當(dāng)特征xs固定且xC變化時(shí),fs可給出此時(shí)xC的邊際貢獻(xiàn)dP(xc)。由于無(wú)法直接求解f和dP(xc)的值,可通過(guò)計(jì)算公式(12)推算公式(11)中的值。
式中:N為S集中樣本的個(gè)數(shù);{xC1,…,xCN}為S集中xC的不同取值。
首先,論文分別構(gòu)建基于隨機(jī)森林及梯度提升決策樹(shù)的安全風(fēng)險(xiǎn)識(shí)別模型,并通過(guò)網(wǎng)格搜索調(diào)參及交叉驗(yàn)證提升識(shí)別模型的準(zhǔn)確性?;跇颖緳?quán)重的召回率、精確率等指標(biāo)評(píng)估模型的識(shí)別性能,并在后續(xù)分析中保留性能最佳的模型。其次,基于基尼指數(shù)的特征重要性排序,篩選對(duì)風(fēng)險(xiǎn)等級(jí)識(shí)別結(jié)果影響最大的7個(gè)影響要素。最后,應(yīng)用個(gè)體條件期望圖解析這些變量與風(fēng)險(xiǎn)等級(jí)間的關(guān)聯(lián)關(guān)系。模型構(gòu)建及分析流程圖如圖1所示。
圖1 模型構(gòu)建及分析流程圖Fig.1 Flowchart of modeling and feature analysis
網(wǎng)格搜索優(yōu)化調(diào)參及十折交叉驗(yàn)證后,隨機(jī)森林及梯度提升決策樹(shù)模型的混淆矩陣如圖2所示。經(jīng)計(jì)算,隨機(jī)森林模型的準(zhǔn)確率、召回率、精確率及F1·Score分 別 為89.35 %、89.35 %、89.71 %、89.50%,均高于梯度提升決策樹(shù)模型的88.70%、88.70%、88.58%、88.60%。結(jié)果表明,隨機(jī)森林模型在風(fēng)險(xiǎn)等級(jí)識(shí)別方面優(yōu)于梯度提升決策樹(shù)模型,其可更好地辨識(shí)高風(fēng)險(xiǎn)、中風(fēng)險(xiǎn)、低風(fēng)險(xiǎn)道路的特征。因此基于隨機(jī)森林的安全風(fēng)險(xiǎn)識(shí)別模型將用于下一步分析。
圖2 風(fēng)險(xiǎn)等級(jí)識(shí)別模型的混淆矩陣Fig.2 Confusion matrix of risk level identification models
特征重要性是一種衡量某特征對(duì)全局預(yù)測(cè)結(jié)果影響程度的指標(biāo),特征重要性越高,表明該特征對(duì)風(fēng)險(xiǎn)等級(jí)的識(shí)別結(jié)果影響作用越大。由圖3所示,特征重要性由大至小依次是延誤系數(shù)、平均車流速度與限速值差、能見(jiàn)度、天氣狀況、交通流量等級(jí)、風(fēng)力等級(jí)、路段類型。
圖3 隨機(jī)森林模型的特征重要性排序Fig.3 Feature importance score in RF model
個(gè)體條件期望值是綜合衡量全樣本集中,僅當(dāng)某單因素變化時(shí)導(dǎo)致分類結(jié)果變化程度的指標(biāo)。若某因素水平下的個(gè)體條件依賴值均值越高,則表明模型分類結(jié)果為高風(fēng)險(xiǎn)等級(jí)的概率越高。即在當(dāng)前外部條件下,交通秩序差,安全風(fēng)險(xiǎn)高。
3.3.1 交通流特征相關(guān)變量
在交通流特征類變量中,延誤系數(shù)、平均車流速度與限速值差、交通流量等級(jí)會(huì)對(duì)風(fēng)險(xiǎn)等級(jí)的識(shí)別結(jié)果有較大影響。
平均車流速度與限速值差方面,由圖4b可見(jiàn),隨平均車流速度與限速值差增大,該特征對(duì)道路安全的影響呈非線性變化趨勢(shì)。在平均車流速度與限速值差增長(zhǎng)時(shí)逐步降低,隨其進(jìn)一步增至24 km·h-1后反之上升,表明安全風(fēng)險(xiǎn)在增加。這兩種情況可通過(guò)兩種交通流狀況解釋。一方面,在平均車流速度與限速值差較小時(shí),則說(shuō)明此時(shí)平均車流速度較高,You等[17]研究得出在交通流較為順暢時(shí),駕駛員往往會(huì)更加激進(jìn),從而產(chǎn)生更高的追尾或側(cè)面碰撞的風(fēng)險(xiǎn)。另一方面,隨著二者速度差增加到一定限度,此時(shí)的情形與擁堵類似,過(guò)于密集的交通流會(huì)使駕駛員頻繁切換車道,安全有序性較差[18]。
圖4 交通流特征的個(gè)體條件期望圖Fig.4 Plots of individual conditional expectation of traffic flow factors
3.3.2 外部環(huán)境相關(guān)變量
在外部環(huán)境類變量中,能見(jiàn)度、風(fēng)力等級(jí)和天氣狀況會(huì)對(duì)風(fēng)險(xiǎn)等級(jí)的識(shí)別結(jié)果有較大影響。
圖5 外部環(huán)境及道路屬性的個(gè)體條件期望圖Fig.5 Plots of individual conditional expectation of external environment factors and road condition factors
3.3.3 道路屬性相關(guān)變量
針對(duì)跨河橋上、下游過(guò)渡段,可能造成其高風(fēng)險(xiǎn)的原因是:首先,在這兩個(gè)路段內(nèi)均存在橋梁伸縮縫。伸縮縫是一種橋梁特殊構(gòu)造物,會(huì)對(duì)行車造成負(fù)面影響,其造成的橋頭跳車可能導(dǎo)致駕駛員的心率失常、行車不舒適等[21]。其次,在跨河橋路段的限速為100 km·h-1,而跨河橋上、下游過(guò)渡段的限速分別為120、110 km·h-1,駕駛員看到限速標(biāo)志后,駕駛員會(huì)迫切改變自己的行車速度。此時(shí),駕駛員容易產(chǎn)生急加速或急減速等激進(jìn)駕駛行為。而上下游的速度差異性也是影響交通安全的重要因素之一,Cai等[12]在研究中發(fā)現(xiàn),當(dāng)上下游的車流平均速度差較大時(shí),發(fā)生交通事故的概率也同步增加。
根據(jù)2016年至2019年4月內(nèi)不同路段類型的事故空間分布,如表5所示,可評(píng)估基于秩序安全分析與事故安全分析關(guān)聯(lián)結(jié)果。單位公里事故數(shù)由大至小依次為:跨河橋上游過(guò)渡段(33.989)>跨河橋下游過(guò)渡段(21.467)>跨線橋(19.158)>路基直線段(13.103)>路 基直 線段(13.063)>跨河 橋(12.876)。結(jié)果表明,以基于導(dǎo)航數(shù)據(jù)的交通秩序指數(shù)作為風(fēng)險(xiǎn)替代指標(biāo),可在一定程度上反映道路安全風(fēng)險(xiǎn)程度。在宏觀層面,與事故安全分析所得出的結(jié)論基本相同。但交通秩序指數(shù)與單位公里事故數(shù)間并非呈現(xiàn)線性關(guān)系,交通秩序指數(shù)更多地關(guān)注于激進(jìn)駕駛行為和速度變化特性層面的運(yùn)行風(fēng)險(xiǎn),而非交通事故本身。未來(lái)研究中,將進(jìn)一步尋找二者間深層次的關(guān)聯(lián)關(guān)系。此外,也可拓展更多的研究對(duì)象,例如城市快速路、交叉口等,論證更多情景下交通秩序指數(shù)的有效性。
表5 2016年至2019年4月不同路段類型的事故空間分布Tab.5 Spatial distribution of accidents in different road sections from January 2016 to April 2019
論文主要依托導(dǎo)航軟件所采集的高頻、精準(zhǔn)、海量的浮動(dòng)車軌跡數(shù)據(jù),采用基于激進(jìn)駕駛行為和速度變化特性的交通秩序指數(shù)作為安全風(fēng)險(xiǎn)替代指標(biāo),主要貢獻(xiàn)在于突破了傳統(tǒng)事故分析中偶發(fā)性、局部性、滯后性等局限,實(shí)現(xiàn)全時(shí)空域下高速公路橋梁路段的交通安全風(fēng)險(xiǎn)辨識(shí)。此外,研究應(yīng)用個(gè)體條件期望圖描述及可視化黑箱模型的內(nèi)部影響關(guān)系。相較于傳統(tǒng)的部分依賴圖,個(gè)體條件期望圖可在一定程度上避免數(shù)據(jù)異質(zhì)性及非均勻效應(yīng)的影響。所獲得的主要結(jié)論如下:
(1)道路屬性方面,跨河橋上游及下游過(guò)渡區(qū)是高速公路橋梁路段交通秩序較差的區(qū)域,存在較大的交通安全風(fēng)險(xiǎn);
(2)交通流方面,交通擁堵的嚴(yán)重程度與安全秩序水平呈負(fù)相關(guān)關(guān)系。延誤系數(shù)每增加0.1,高風(fēng)險(xiǎn)等級(jí)的發(fā)生概率將增加8%。此外,平均車速與限速值差與安全風(fēng)險(xiǎn)間呈非線性關(guān)系,當(dāng)二者差值約為24 km·h-1時(shí),安全風(fēng)險(xiǎn)較低;
(3)外部環(huán)境方面,在能見(jiàn)度較低及不良天氣情況下,交通風(fēng)險(xiǎn)較高;隨橋梁側(cè)風(fēng)作用逐步增強(qiáng),安全風(fēng)險(xiǎn)略微上升。
本文研究結(jié)果對(duì)于橋梁路段行車安全改善工程和風(fēng)險(xiǎn)防控措施具有參考意義,特別是在主動(dòng)安全防控方案的設(shè)計(jì)具有理論支撐作用。在跨河橋上游過(guò)渡區(qū)及下游過(guò)渡區(qū)路段宜統(tǒng)一限速,并設(shè)置可變信息情報(bào)板、注意橋頭跳車標(biāo)志等。在橋梁路段可增設(shè)霧天行車誘導(dǎo)燈,一定程度上緩解由于能見(jiàn)度較低及不良天氣條件導(dǎo)致的跟車距離難以判斷、道路輪廓模糊等駕駛風(fēng)險(xiǎn)。
高速公路橋梁路段的交通安全風(fēng)險(xiǎn)還與橋梁的跨徑、橋型、跨越對(duì)象、是否設(shè)置風(fēng)屏障等結(jié)構(gòu)特性有關(guān),未來(lái)可采集不同類型的橋梁路段行車數(shù)據(jù)開(kāi)展秩序分析,進(jìn)一步深入探究橋梁結(jié)構(gòu)因素對(duì)交通安全風(fēng)險(xiǎn)的影響。此外,本文僅簡(jiǎn)單分析事故與交通安全風(fēng)險(xiǎn)替代指標(biāo)間的對(duì)應(yīng)結(jié)果,未來(lái)可探究二者間的深層次關(guān)聯(lián)關(guān)系。
作者貢獻(xiàn)聲明:
趙曉華:提出論點(diǎn),文獻(xiàn)綜述,模型推導(dǎo),初稿修改,校稿。
楊海益:方法論,模型編程實(shí)現(xiàn)及構(gòu)建,初稿撰寫。
姚瑩:論文修改,數(shù)據(jù)分析,模型調(diào)參及優(yōu)化。
郭淼:研究?jī)?nèi)容,論文寫作與修改。
亓航:模型構(gòu)建,文獻(xiàn)總結(jié)。
戴義博:數(shù)據(jù)庫(kù)構(gòu)建,文獻(xiàn)總結(jié)。
蘇岳龍:需求調(diào)研,提供數(shù)據(jù)。