摘 要:為分析車速、周期、沖突位置,以及交通量等因素對城市平面交叉口交通沖突的影響,從機動車特性、非機動車特性、交叉口特性三方面初選21個影響因素,選取南寧市桂林市4個典型平面交叉口進(jìn)行實地調(diào)研,記錄右轉(zhuǎn)機動車與非機動車之間345條交通沖突數(shù)據(jù)作為分析樣本,采用隨機森林法分析城市交叉口右轉(zhuǎn)車與非機動車風(fēng)險構(gòu)成要素間的致因及其顯著性。研究結(jié)果表明:在城市交叉口中右轉(zhuǎn)車與非機動車速度、各進(jìn)口道周期、綠燈時長、交通量越大,發(fā)生沖突的概率越大;當(dāng)機非沖突位置在交叉口中時,沖突的發(fā)生概率越大,應(yīng)加強右轉(zhuǎn)車在交叉口與非機動車轉(zhuǎn)彎的安全風(fēng)險防控。
關(guān)鍵詞:機非沖突 影響因素 隨機森林 交通安全
在城市道路交叉口交通安全的影響研究方面,Kathryn[1]得出騎行者騎行過程中打電話行為、聽音樂行為以及與同行者攀談行為等是誘發(fā)交通沖突發(fā)生的重要因素。程國柱[2]建立機非沖突數(shù)與非機動車流量的回歸分析模型,模型結(jié)果表明自行車數(shù)量與機非沖突數(shù)成正相關(guān),通過拓寬自行車道,可減少機非沖突的發(fā)生。Jiang等[3]在對交通沖突嚴(yán)重度進(jìn)行辨別與分析后認(rèn)為由紅燈期間駛?cè)胱筠D(zhuǎn)車輛待轉(zhuǎn)區(qū)的車輛而導(dǎo)致的二次沖突以及追尾沖突顯著地 增加了交通沖突的嚴(yán)重性。劉志士[4]分析非機動車與機動車發(fā)生沖突的影響因素,發(fā)現(xiàn)土地利用類型、停車泊位利用率以及機動車開關(guān)門行為等是重要影響因素。郭延永等[5]發(fā)現(xiàn)直行和右轉(zhuǎn)交通量與交通沖突存在顯著的正相關(guān)關(guān)系,右轉(zhuǎn)專用相位等可有效降低交通沖突。
目前對交通風(fēng)險因素的分析,多集中與事故數(shù)據(jù)的雙因素分析,基于交通沖突的更多要素的分析較少。本文通過對城市道路交叉口交通風(fēng)險因素的分類整理,構(gòu)建交叉口風(fēng)險影響因素模型。并基于實際交通沖突數(shù)據(jù)和特征分析,談?wù)摱囡L(fēng)險因素對交叉口交通安全的量化影響,為交叉口多因素風(fēng)險分析提供參考和借鑒。
1 基本思路
本文以實地調(diào)查采集和提取的數(shù)據(jù)為基礎(chǔ),對右轉(zhuǎn)機動車與非機動車沖突樣本提供了“嚴(yán)重性”標(biāo)簽,以便本文能夠?qū)⒚看螞_突的“嚴(yán)重性”與其影響因素狀況關(guān)聯(lián)起來,開展有監(jiān)督的機器學(xué)習(xí)訓(xùn)練。本文將介紹隨機森林理論,闡述了它對本研究的適用性以及進(jìn)行影響因素分析的思路。然后從交叉口、機動車、非機動車三個角度,選取21個影響因素并進(jìn)行了量化。之后通過調(diào)整隨機森林的超參數(shù),實現(xiàn)了高精度的分類。按照因素重要度計算結(jié)果,將各因素分為強影響、弱影響和基本無影響三個等級。最后結(jié)合統(tǒng)計數(shù)據(jù),分析了強弱影響因素的具體作用。
2 影響因素分析
2.1 隨機森林模型
本文通過使用隨機森林(RandomForest,RF)[6]的特征重要性評估,進(jìn)行交通沖突影響因素分析?;舅悸肥牵菏紫群饬棵總€因素特征在隨機森林中的每棵決策樹上做出的貢獻(xiàn),再根據(jù)決策樹的數(shù)量取平均值,最后比較不同因素特征的貢獻(xiàn)大小,進(jìn)行重要性排序。本文采用基尼指數(shù)作為貢獻(xiàn)度衡量指標(biāo),以下具體介紹因素重要性的計算思路和流程。
假設(shè)VIM為特征的重要性評分,GI代表Gini值。當(dāng)前節(jié)點分到的樣本中共有y個特征,表示第k個特征在節(jié)點m中所占的比例,則節(jié)點m的基尼值為:
(1)
可以看出,基尼值在0~1之間,越接近0,樣本分類就越統(tǒng)一,純度越大。
假設(shè)節(jié)點m以特征作為分支依據(jù),則在節(jié)點m的重要性表現(xiàn)為分支前后GI值的變化量:
(2)
其中,和分別表示分支后的左右兩個新節(jié)點的GI值。
設(shè)集合M是特征在決策樹i中出現(xiàn)的所有節(jié)點,則在決策樹i的重要性為:
(3)
若隨機森林中總共有n棵樹,則有:
(4)
最后對所有特征重要性評分進(jìn)行歸一化處理,得到最終重要性評分:
(5)
上述流程總結(jié)為:先計算某個特征在單個節(jié)點的純度,再遍歷一棵樹的所有相關(guān)節(jié)點進(jìn)行求和,之后遍歷整片森林求和,最終進(jìn)行歸一化處理即為該特征對隨機森林分類預(yù)測的貢獻(xiàn)度,據(jù)此對影響因素重要性進(jìn)行排序。
2.2 交通沖突影響因素
在交叉口安全影響因素研究中,Rodionova等[7]考慮了駕駛員、車輛、道路、事故形態(tài)和環(huán)境5個方面;初旭新等[8]則綜合考慮車、路和環(huán)境因素,本文主要選取人、車輛、道路和管理因素作為交叉口交通風(fēng)險的構(gòu)成要素。目前對交叉口風(fēng)險影響要素分析的研究中,并沒有對沖突位置、車輛轉(zhuǎn)彎半徑與轉(zhuǎn)彎車道半徑進(jìn)行區(qū)分,因而也忽視了分析由此而產(chǎn)生的交通沖突,而這種沖突在實際交通運行過程中會產(chǎn)生一定的安全隱患。本文從“交叉口”、“機動車”、“非機動車”這三個角度共提取21個因素對城市交叉口風(fēng)險構(gòu)成要素進(jìn)行分析,城市交叉口風(fēng)險構(gòu)成要素見表1。
3 實例分析
選取南寧市白沙大橋-教育路、桂林市普陀路-芳香路、桂林市六合路-普陀路、桂林市東二環(huán)-航天路,共4個交叉口對隨機森林模型進(jìn)行驗證,選擇17:00-18:00時段四個交叉口合計60min交通視頻,分析其中共計796輛機動車,4471輛非機動車。
沖突數(shù)據(jù)源于無人機采集高精度、連續(xù)的多車輛軌跡視頻,結(jié)合Labelimg可視化圖像標(biāo)定工具實現(xiàn)運行車輛狀態(tài)識別與跟蹤,并記錄車輛每一幀的運動數(shù)據(jù);其次,基于交通沖突識別指標(biāo)TTC,進(jìn)一步對提取的軌跡數(shù)據(jù)進(jìn)行以沖突角度、速度和距離、車身長度等為核心的機非沖突綜合判別,并使用K-medoids 聚類算法確定右轉(zhuǎn)車與非機動車各沖突的類型與嚴(yán)重程度,劃分為嚴(yán)重、一般、輕微沖突三個等級。
本文基于Python3.7實現(xiàn)隨機森林模型的分類預(yù)測和特征重要度排序,然后導(dǎo)入交通沖突嚴(yán)重性和影響因素量化的數(shù)據(jù)集,對各數(shù)據(jù)標(biāo)簽進(jìn)行命名,按0.8和0.2的比例劃分為訓(xùn)練集和測試集,使用訓(xùn)練集的數(shù)據(jù)訓(xùn)練隨機森林模型。然后將測試集代入模型,計算分類學(xué)習(xí)的精度。之后計算特征重要度,對各影響因素進(jìn)行排序。在超參數(shù)尋優(yōu)時,設(shè)置決策樹數(shù)量n_estimators范圍為10至100,間隔為10,設(shè)置決策樹深度max_depth范圍為1至總特征數(shù),間隔為1。分別計算兩種沖突的每種參數(shù)組合的分類精度,結(jié)果如表4-4和表4-5所示(標(biāo)紅加粗的數(shù)值為最優(yōu)值)
把上表繪制成三維圖,數(shù)值為精度,橫軸坐標(biāo)分別是決策樹數(shù)量與決策樹深度。
找到上面計算的最優(yōu)參數(shù),即最優(yōu)的決策樹數(shù)量和決策樹深度后,進(jìn)行500次訓(xùn)練,檢驗?zāi)P头诸惥扰c魯棒性,結(jié)果如圖所示,可以看出沖突測試集精度均穩(wěn)定在0.8以上,曲線波動較小,模型魯棒性較好。
每個數(shù)據(jù)樣本由上方進(jìn)入決策樹后,在各個節(jié)點按照某個因素特征進(jìn)行分割,最終劃分形成葉片,得到?jīng)_突嚴(yán)重性結(jié)果。本文的隨機森林模型以這些決策樹為基礎(chǔ),根據(jù)前面2.1“影響因素分析原理”,完成對影響因素與沖突嚴(yán)重性關(guān)系的評估。各影響因素重要度計算結(jié)果如表3圖3所示。
由圖3可以看出,對于右轉(zhuǎn)車與非機動車沖突,強影響因素有2個,分別是右轉(zhuǎn)車速度、非機動車速度,重要度均在0.18以上;弱影響因素有5個,包括周期時長、非機動車交通量、綠信比、非機動車起始過街位置、右轉(zhuǎn)車交通量,重要度在0.05~0.1;其余14個因素基本無影響。
4 結(jié)論
分析統(tǒng)計數(shù)據(jù)可以得出以下結(jié)論:
(1)在沖突雙方的速度方面,右轉(zhuǎn)車速度和非機動車速度越大,發(fā)生輕微沖突概率越小,發(fā)生嚴(yán)重沖突的概率越大。
(2)各進(jìn)口道周期、綠燈時長越大,發(fā)生沖突的概率越大,這可能是由于周期、綠燈時長越大,交通狀況越復(fù)雜。
(3)非機動車交通量與機動車交通量越大,發(fā)生沖突的概率越大。
(4)當(dāng)機非沖突發(fā)生的位置在交叉口中時,沖突的發(fā)生概率和嚴(yán)重性越大,原因可能是其沖突距離更小,沖突反應(yīng)時間更短。
(5)一塊板和兩塊板對于右轉(zhuǎn)hnJrJ3Pjg8Mn/OoF+uJS/2xsRw9X+ydic2WN0ixCpZQ=車和非機動車的沖突嚴(yán)重性影響相差不大,但三塊板和四塊板能明顯降低嚴(yán)重沖突的概率,這可能是機非分隔帶增加了右轉(zhuǎn)車與非機動車的距離,提供了相對較大的緩沖空間。
在接下來的工作中,對應(yīng)多因素風(fēng)險影響機理可以進(jìn)一步深入探討,對應(yīng)不同類型交叉口風(fēng)險或不同類型車輛沖突之間的多因素影響效應(yīng)還有待進(jìn)一步分析和研究。
基金項目:大學(xué)生創(chuàng)新訓(xùn)練計劃立項項目(S202210595279);2021年度廣西中國-東盟綜合交通國際聯(lián)合重點實驗室運行補助項目(21-220-21);南寧市科學(xué)研究與技術(shù)開發(fā)計劃項目(20223230)。
參考文獻(xiàn):
[1]HU F, LV D, ZHU J,等.Related Risk Factors for Injury Severity of E-bike and Bicycle Crashes in Hefei[J].Traffic Injury Prevention,2014,15(3):319-323.
[2]程國柱,王婉琦,徐慧智.城市道路機非沖突分析與自行車道寬度計算方法[J].哈爾濱工業(yè)大學(xué)學(xué)報,2019,51(9):130-136.
[3]Safety evaluation of signalized intersections with left-turn waiting area in China - ScienceDirect[EB/OL].(2021-05-19)[2024-01-28].https://www.sciencedirect.com/science/article/pii/S0001457515300634.
[4]路側(cè)停車對非機動車騎行干擾機理研究[EB/OL].(2021-05-19)[2024-01-28].https://d.wanfangdata.com.cn/thesis/ChJUaGVzaXNOZXdTMjAyNDAxMDkSCUQwMTA5Nzg5NBoIajE5eGM4b2U%3D.
[5]郭延永,劉攀,吳瑤,等.基于交通沖突模型的信號交叉口渠化島設(shè)置方法[J].交通運輸工程學(xué)報,2017,17(4):140-148.
[6]李英帥,張旭,王衛(wèi)杰,等.基于隨機森林的電動自行車騎行者事故傷害程度影響因素分析[J].交通運輸系統(tǒng)工程與信息,2021,21(1):196-200.
[7]RODIONOVA M,SKHVEDIANI A, KUDRYAVTSEVA T. Prediction of Crash Severity as a Way of Road Safety Improvement:The Case of Saint Petersburg, Russia[J].Sustainability,2022,14(16):9840.
[8]初旭新,宗剛,彭朝霞,等.基于ISM的道路交通安全影響因素研究[J].安全與環(huán)境學(xué)報,2017,17(5):1668-1672.