占雋均 云美萍▲ 張韡 董怡佳
(1.同濟(jì)大學(xué)道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室 上海 201804;2.長安大學(xué)汽車學(xué)院 西安 710064)
安全是交通的本質(zhì)要求和前提條件,其在《交通強(qiáng)國建設(shè)綱要》中被列為構(gòu)建現(xiàn)代化綜合交通體系5個(gè)核心要素的首位,并于第六部分明確要求提升和完善安全保障的相關(guān)措施,旨在強(qiáng)調(diào)和突出安全的重要性[1]。根據(jù)世界衛(wèi)生組織2021年6月發(fā)布的一則新聞可知:全球每年死于道路交通事故的人數(shù)約130萬,其造成的死亡人數(shù)是人類非正常死亡的主要原因之一[2]。由《中國統(tǒng)計(jì)年鑒》的相關(guān)數(shù)據(jù)可知:2016—2020年,中國道路交通事故造成的年平均死亡人數(shù)為62 905人,其中汽車駕乘人員約占72%,而民用小微型載客汽車擁有量接近同期民用汽車擁有量的88%(截止2020年底)[3]。由此可知,國內(nèi)小微型載客汽車的駕乘人員在道路交通事故死亡人數(shù)中占比較高,所以開展針對5座乘用車乘員(包括駕駛?cè)?,下同)在道路交通事故中安全性方面的研究具有重要意義。
近些年關(guān)于該方面的研究主要以碰撞試驗(yàn)、模擬仿真、事故統(tǒng)計(jì)等進(jìn)行相關(guān)分析。研究車輛碰撞情形下碰撞能量轉(zhuǎn)移路徑[4]、乘員的運(yùn)動狀態(tài)與動力學(xué)響應(yīng)[5]等理論基礎(chǔ)。同時(shí)挖掘碰撞事故下的有效特征[6],并對特征變量進(jìn)行深入分析[7-8],為建立精細(xì)化的乘員損傷評價(jià)模型[9]和事故預(yù)測模型[10]等提供必要條件。
對于不同碰撞形態(tài)的研究側(cè)重點(diǎn)或研究方向可能存在差異?;趥?cè)面碰撞情形,乘用車面對不同碰撞物對其造成的車身損壞程度和人員傷亡情況是存在差異的,常見的如進(jìn)行柱碰撞和壁障碰撞的測試研究[11],鈕嘉穎等[12]還進(jìn)一步細(xì)化不同角度(75°和90°)柱碰撞和不同壁障(AEMDB和MDB)碰撞下相關(guān)情況的分析?;谡媾鲎瞇13]情形,有些學(xué)者將碰撞重疊率與碰撞嚴(yán)重程度[14]、碰撞角度[15]、乘坐位置[16-17]、乘員年齡[14]等作為乘員損傷程度的特征變量,Shimamura等[18]還將后排乘員使用安全帶的情況作為前排乘員安全性的特征變量進(jìn)行專門研究?;谄渌聪薅ㄅ鲎残螒B(tài)的情形,有的研究重點(diǎn)分析了車輛升級換代能否改善前后排乘員的受傷情況[19],其他還有基于車型年份的研究,Durbin等[20]還將碰撞方向作為重點(diǎn)特征變量,Mitchell等[21]將性別、安全氣囊情況、速度、碰撞類型等作為特征變量。也有分析車車碰撞具體類型的研究[22],褚端峰等[23]則引入了車車之間的質(zhì)量比,并考慮了其他自變量進(jìn)行相關(guān)研究。Prochowski等[24]從坐姿方面切入,分析了后排乘員的傷害程度。還有的研究從前后排乘員使用安全帶的意識和行為層面進(jìn)行相關(guān)性分析[25]。
綜合上述國內(nèi)外相關(guān)的研究成果,主要以單個(gè)不同特征變量對乘員傷亡情況進(jìn)行對比分析,并未對不同特征變量組合情況下進(jìn)行分析。同時(shí)缺少不同特征變量在同一水平的橫向比較,較難分析出主要的影響因素。本文基于國內(nèi)5座乘用車發(fā)生2車碰撞事故的數(shù)據(jù)進(jìn)行乘員死亡風(fēng)險(xiǎn)分析,對比分析了不同特征變量在同一水平下對乘員死亡情況的相關(guān)程度,并重點(diǎn)對不同特征變量組合情況下進(jìn)行影響分析和預(yù)測分析。
為了保證研究樣本的可信度,原始的事故資料來源于長安大學(xué)機(jī)動車物證司法鑒定中心的事故鑒定報(bào)告、部分地區(qū)交通管理部門的道路交通事故資料、網(wǎng)絡(luò)媒體機(jī)構(gòu)的道路交通事故報(bào)道。
以乘員的死亡情況為目標(biāo)變量,相關(guān)變量的定義說明見表1。選取天氣情況、路段類型、行駛方向、碰撞接觸面、碰撞對象、乘坐位置作為特征變量,主要基于如下考慮:①不同的天氣情況、路段類型、行駛方向下,因?yàn)槭鹿实膰?yán)重程度不同,乘員的傷亡程度存在差異[26];②碰撞接觸面相對于碰撞類型表達(dá)的信息更直觀、更精準(zhǔn);③碰撞對象能反映出質(zhì)量信息,而質(zhì)量是碰撞能量直接的關(guān)聯(lián)變量;④乘坐位置不同,乘員的傷亡程度有所差異[16-17]。
表1 變量說明Tab.1 Description of variables
目標(biāo)車輛(下同)的車輛類型為5座乘用車,若2車都是5座乘用車,則均為目標(biāo)車輛,若目標(biāo)車輛中有多名乘員,均為研究樣本。
為最大程度挖掘可靠有用的事故數(shù)據(jù),同時(shí)保障樣本質(zhì)量,本文制定了針對目標(biāo)車輛乘員在2車碰撞事故中對應(yīng)的記錄規(guī)則,見圖1。
圖1 樣本記錄規(guī)則Fig.1 Rules of sample record
根據(jù)圖1的記錄規(guī)則,共整理出1 028個(gè)數(shù)據(jù)樣本,其中90%以上的樣本為2010—2021年間目標(biāo)車輛發(fā)生的2車碰撞事故數(shù)據(jù)。數(shù)據(jù)集通過分類統(tǒng)計(jì),并進(jìn)行了卡方檢驗(yàn),其分布情況見表2。由表2可見:死亡組相對于存活組在天氣情況、路段類型、碰撞接觸面、碰撞對象、乘坐位置下存在一定的差異。
表2 變量分布情況(N1=1 028)Tab.2 Distribution of variables(N1=1 028)
為確保數(shù)據(jù)集中的特征變量不存在重復(fù)設(shè)置的情況,可通過多重共線性診斷的方法進(jìn)行具體判斷,計(jì)算結(jié)果見表3。表3中Tol為容忍度;VIF為方差膨脹因子。
表3 共線性判斷Tab.3 Collinearity judgment
由表3可見:6個(gè)特征變量的容忍度(Tol)都大于0.1,且方差膨脹因子(VIF)均小于10,所以不存在共線性問題,無需刪減現(xiàn)有的特征變量,可以進(jìn)行后續(xù)研究。
為了解數(shù)據(jù)集中各個(gè)特征變量下的死亡情況,計(jì)算了不同特征變量對應(yīng)特征值下的乘員致死率,并將結(jié)果可視化,見圖2。
圖2 不同特征變量對應(yīng)的致死率Fig.2 Fatality rate of different feature variables
由圖2可見:①不同天氣情況下乘員致死率存在一定差異,從高到低的排列順序是中及大雨、小雨、無雨;②不同路段類型中交叉路段相對于高速路段和非交路段的乘員致死率差異相對明顯,從高到低的排列順序是高速、非交、交叉;③相同行駛方向下乘員致死率比不同行駛方向略低;④不同碰撞接觸面下乘員致死率存在一定差異,從高到低的順序排列是前面、側(cè)面、后面;⑤不同碰撞對象下乘員致死率存在明顯差異,從高到低的排列順序是商用貨車、商用客車、乘用車;⑥不同乘坐位置下乘員致死率存在一定差異,但并不明顯,從高到低的排列順序是前右、后中、后左、后右、前左。
為進(jìn)一步確定各個(gè)特征變量是否對乘員的死亡情況有顯著性影響,通過SPSS軟件中的二項(xiàng)Logistic回歸模型對6個(gè)特征變量進(jìn)行逐一計(jì)算,并對有顯著性影響的組合情況進(jìn)行分析,具體計(jì)算結(jié)果見表4。
由表4可見:路段類型、行駛方向、碰撞對象、乘坐位置對乘員的死亡情況影響顯著,天氣情況和碰撞接觸面影響不顯著。同時(shí)路段類型分別與碰撞對象、碰撞接觸面、乘坐位置組合成的變量影響顯著。具體分析情況如下。
表4 二項(xiàng)Logistic回歸分析結(jié)果Tab.4 Results of binary logistic regression
1)路段類型為交叉路段相對于高速路段的死亡風(fēng)險(xiǎn)降低68.9%。原因分析:非高速交叉路段下的車輛運(yùn)行速度相較于高速路段更小,基于速度因素(其他條件假設(shè)一樣)對碰撞能量(E=mv2)產(chǎn)生的影響,速度越小產(chǎn)生的碰撞能量越小,造成的碰撞沖擊越弱,對人所造成的傷害越輕,所以死亡風(fēng)險(xiǎn)相對更低?;诖藨?yīng)加強(qiáng)對常發(fā)、易發(fā)事故路段中車輛的運(yùn)行速度進(jìn)行監(jiān)管,如加強(qiáng)監(jiān)督與執(zhí)法的力度、增加減速措施等。
2)2車碰撞時(shí)不同行駛方向相對于相同行駛方向的死亡風(fēng)險(xiǎn)提升71.9%。原因分析:2車行駛方向相同時(shí),碰撞產(chǎn)生的能量幾近相減,人體承受的碰撞沖擊相對較弱,死亡風(fēng)險(xiǎn)相對更低,所以駕駛?cè)藨?yīng)在安全行車環(huán)境和交通規(guī)則允許的前提下進(jìn)行換道行為。
3)碰撞對象為商用貨車和商用客車的死亡風(fēng)險(xiǎn)分別是碰撞對象為乘用車的4.797倍和3.126倍。由此可知:相容性最好的是乘用車,其次是商用客車,商用貨車最差。原因分析:商用貨車、商用客車的質(zhì)量一般遠(yuǎn)大于乘用車,基于質(zhì)量因素對碰撞能量產(chǎn)生的影響,質(zhì)量越大產(chǎn)生的碰撞能量越大,造成的碰撞沖擊越大,對人所造成的傷害越嚴(yán)重,死亡風(fēng)險(xiǎn)相對更高。交通管理部門可考慮在交通事故易發(fā)處實(shí)施按車型分車道行駛的措施來降低死亡風(fēng)險(xiǎn)。
4)乘坐位置中死亡風(fēng)險(xiǎn)最高的是副駕位,其相對于駕駛位的死亡風(fēng)險(xiǎn)升高70.3%??赡艿脑颍厚{駛?cè)藶榱吮茏屌鲎玻鵁o意識的讓副駕駛?cè)颂幱陔x碰撞位置最近的乘坐位置。其他位置與駕駛位的死亡風(fēng)險(xiǎn)差異并不明顯。車輛廠商應(yīng)重點(diǎn)提升乘員的安全防護(hù)措施,特別是副駕駛的位置。
5)目標(biāo)車輛在高速路段與商用貨車、商用客車發(fā)生碰撞的死亡風(fēng)險(xiǎn)是與乘用車的14.326倍和16.466倍。在非高速非交叉路段與商用客車、商用貨車發(fā)生碰撞的死亡風(fēng)險(xiǎn)是在高速路段與乘用車碰撞的7.950倍和8.169倍。原因分析:質(zhì)量越大、速度越高,其產(chǎn)生的碰撞能量越大,死亡風(fēng)險(xiǎn)相對越高。
6)在高速路段發(fā)生側(cè)面碰撞的死亡風(fēng)險(xiǎn)相對于前面碰撞降低86.5%,而在非高速交叉路段中側(cè)面碰撞是在高速路段前面碰撞的9.219倍。原因分析:高速路段的側(cè)面碰撞可能較多的是輕微碰撞(剮蹭),而在非高速交叉路段則是嚴(yán)重的碰撞事故。
7)高速路段下副駕駛位的死亡風(fēng)險(xiǎn)是駕駛位的3.853倍。
綜合上述分析可知:組合特征變量相對于單一特征變量對乘員的死亡情況影響更加明顯,特別是高速路段與碰撞對象、乘坐位置的組合特征均在很大程度提高了乘員的死亡風(fēng)險(xiǎn),即有顯著影響的單一特征變量相互組合下對乘員的死亡風(fēng)險(xiǎn)明顯增加。同時(shí)也能挖掘出單一特征變量不明顯的特征變量,對事故特征挖掘研究具有一定的啟發(fā)作用。
為了在同一水平條件下比較各個(gè)單一特征變量與乘員死亡情況的相關(guān)程度,利用Python中corr函數(shù)進(jìn)行相關(guān)計(jì)算,結(jié)果見圖3。
圖3 乘員死亡情況與特征值之間的相關(guān)性Fig.3 Correlation between occupant death and eigenvalues
由圖3可見:不同特征值與乘員死亡情況的相關(guān)程度存在較大差異。其中,正相關(guān)的特征值按從大到小的排列順序是商用貨車、非交、前面、前右、高速、中及大雨、異向、小雨、后中、后左,負(fù)相關(guān)的特征值按絕對值從大到小的排列順序是乘用車、交叉、前左、后面、無雨、側(cè)面、同向、后右、商用客車。綜合不同特征值與乘員死亡情況的相關(guān)程度發(fā)現(xiàn):碰撞對象相對最大,其次是路段類型,天氣情況、行駛方向、碰撞接觸面、乘坐位置相對較低。
由于目標(biāo)變量為二分類(死亡作為正類),可采用機(jī)器學(xué)習(xí)中相關(guān)的分類算法來構(gòu)建多特征組合下乘員死亡情況的預(yù)測模型。筆者選取了9種常用的算法,即梯度提升(gradient boosting,GB)、隨機(jī)森林(random forest,RF)、決策樹(decision tree,DT)、樸素貝葉斯(naive bayes,NB)、支持向量機(jī)(support vector machine,SVM)、K鄰近(k-nearest neighbor,KNN)、AdaBoost、邏 輯 回 歸(logistic regression,LR)、投票分類器(voting classifier,VC),基于分層隨機(jī)抽樣的思想,調(diào)用分層K折交叉驗(yàn)證中的StratifiedKFold(n_splits=10)對訓(xùn)練集和測試集進(jìn)行劃分,并以F1為衡量指標(biāo),按圖4的流程進(jìn)行相關(guān)處理。經(jīng)計(jì)算,KNN、DT、GB、RF 4種算法默認(rèn)參數(shù)設(shè)置下的F1值大于0.5,可用網(wǎng)絡(luò)搜索(Grid-SearchCV)進(jìn)一步調(diào)參(見表5),并將對應(yīng)算法的F1值整理于表6。
表5 調(diào)參方法及結(jié)果Tab.5 Parameter adjustment methods and results
圖4 預(yù)測模型算法的選取流程Fig.4 Selection process of prediction model algorithms
根據(jù)表6的對比結(jié)果可知:泛化性能相對較好的前3種算法分別為調(diào)參后的VC、GB、DT,選取作為預(yù)測模型的算法。
表6 相關(guān)算法的F1值Tab.6 F1 value of correlation algorithms
利用上述選取的3種算法分別構(gòu)建模型進(jìn)行預(yù)測分析,具體過程步驟如下:①將原數(shù)據(jù)集按9∶1劃分為訓(xùn)練集和測試集;②將多特征組合成的810種(不同特征變量下特征值個(gè)數(shù)相乘)情況作為預(yù)測集;③將基于訓(xùn)練集的模型通過測試集進(jìn)行驗(yàn)證,并應(yīng)用于預(yù)測集進(jìn)行結(jié)果預(yù)測。經(jīng)計(jì)算VC、GB、DT的F1值(0.675、0.633、0.600)并不高,所以綜合3個(gè)模型的預(yù)測結(jié)果(見圖5),該方法可以一定程度上提升預(yù)測結(jié)果的可靠性。
由圖5可見:3種算法均預(yù)測死亡的特征組合共有58種,通過分析發(fā)現(xiàn),若5座乘用車(前面或后面)與商用貨車在高速路段或非高速非交叉路段發(fā)生2車碰撞事故,乘員的死亡風(fēng)險(xiǎn)高于生存幾率,而天氣情況、行駛方向、乘坐位置對乘員死亡情況的預(yù)測影響并不明顯。該預(yù)測結(jié)果中包含的要素與圖3中對乘員死亡情況正相關(guān)的前5項(xiàng)(降序)特征值基本一致,也驗(yàn)證了表4分析結(jié)論的可靠性。
圖5 預(yù)測結(jié)果(N2=810)Fig.5 Prediction results(N2=810)
路段類型、行駛方向、碰撞對象、乘坐位置對乘員的死亡情況影響顯著,其中碰撞對象相關(guān)程度相對最大,路段類型次之,其他特征變量相對較小,該方法可比較同一水平下的相關(guān)程度并發(fā)現(xiàn)影響乘員死亡情況的主要特征變量。同時(shí)路段類型與碰撞對象、乘坐位置、碰撞接觸面的組合特征變量比較于單一特征變量對乘員的死亡情況影響更加明顯,研究方法可應(yīng)用于特征挖掘工作,如單一特征變量影響不顯著,組合特征變量可能有顯著影響。碰撞對象和路段類型映射的是速度和質(zhì)量,所以應(yīng)重點(diǎn)加強(qiáng)大型車輛在高速路段、非高速非交叉路段中的車速管理,如在高危路段設(shè)置按車型分道管理的措施來減少交通事故。
對于3個(gè)及以上特征組合的情況較適用機(jī)器學(xué)習(xí)中分類預(yù)測的方法進(jìn)行研究,通過綜合預(yù)測分析可知:5座乘用車(前面或后面)與商用貨車在高速路段或非高速非交叉路段發(fā)生2車碰撞事故,乘員的死亡風(fēng)險(xiǎn)高于生存幾率。該方法可助力于為挖掘更多有效的事故特征提供研究思路,即單一特征預(yù)測不準(zhǔn)或無法確定,組合特征預(yù)測準(zhǔn)確且可確定。對交通事故主動預(yù)防、救援等政策措施制定提供理論依據(jù)。
目前研究挖掘的特征變量及樣本數(shù)量相對有限,導(dǎo)致預(yù)測結(jié)果的F1值不高,未來研究需建立完善的事故記錄系統(tǒng)。同時(shí)挖掘更多有研究價(jià)值的特征變量來提升預(yù)測結(jié)果的可靠性。