段洪琳,吳大勇,程 麗,郭 淼,伍毅平
(1.招商新智科技有限公司,北京 100070;2.北京工業(yè)大學(xué)城市交通學(xué)院,北京 100124)
道路交通安全是全球范圍內(nèi)面臨的公共安全問題之一,也是我國面臨的主要交通問題.據(jù)世界衛(wèi)生組織2018年最新的研究報告顯示,在我國因道路交通事故死亡的總?cè)藬?shù)位居世界第二,道路交通安全問題不容忽視[1].在聯(lián)合國提出的可持續(xù)發(fā)展目標(biāo)中明確指出:“到2020年將全球道路交通死亡人數(shù)減少到2015年的50%”[2].通過對我國31個省市道路交通事故的研究表明,除湖南省外,全國其他各省市均難以達到聯(lián)合國制定的可持續(xù)發(fā)展目標(biāo)[3].作為提升道路交通安全的基礎(chǔ),明確道路交通事故影響要素,是有針對性制定交通管控措施從而改善道路交通安全問題的前提.
截至2019年,我國高速公路總里程已超過14萬km,位居世界第一.高速公路作為流量大、速度快、行車種類多、封閉性強的高等級公路,發(fā)生交通事故的數(shù)量多,其后果和影響程度也比城市道路更為嚴(yán)重.影響高速公路交通安全的因素主要包括人、車、路以及環(huán)境因素.研究表明,在我國的道路交通事故中有90%以上是由于駕駛員操作不當(dāng)(如車速控制不當(dāng)、不合理環(huán)道等)導(dǎo)致的[4],國外的研究也表明:由于駕駛員的風(fēng)險駕駛行為導(dǎo)致的交通事故占比高達95%[5-6].同時,以車輛運行狀態(tài)為主的交通流因素也是影響交通事故的主要指標(biāo),高速公路的事故受交通流量、飽和度以及車輛速度分布特征等要素的影響[7],特別是交通流特征與交通事故嚴(yán)重程度之間存在顯著關(guān)系[8].另外,道路因素對于交通事故的影響占37%~41%[9],包括道路的圓曲線、緩和曲線、直線、豎曲線、坡度等道路幾何條件[10].通過研究道路幾何條件對于高速公路交通事故的影響關(guān)系,可為高速公路的前期設(shè)計與后期管控提供支撐.此外,環(huán)境因素也是導(dǎo)致交通事故的誘因之一,以天氣條件的影響最為顯著[11].雨、雪、霧等惡劣天氣不僅會影響駕駛員的視線,進而導(dǎo)致駕駛員對于剎車距離判斷的準(zhǔn)確性,延長車輛的制動距離[12],也會影響道路表面的狀態(tài),導(dǎo)致道路結(jié)冰、濕滑進而增加車輛碰撞的風(fēng)險和交通事故發(fā)生的幾率[13].
在道路交通安全影響要素分析方法中,國內(nèi)外學(xué)者也進行了較為豐富的研究.如胡驥等[14]使用有序Logit與Probit模型研究了路面狀況、道路線型等因素對翻車事故的影響.Yan等[15]使用邏輯回歸模型研究了交通事故特征與車道數(shù)、限速值等要素之間的關(guān)系.Wang等[16]使用帶有不同關(guān)聯(lián)函數(shù)的廣義估計方程研究了追尾事故之間的相關(guān)性.Shinohara等[17]使用卡方檢驗分析了安全帶和車型對駕駛員及乘客受傷程度的影響.由于交通事故數(shù)據(jù)具有隨機性、離散型以及非負(fù)性的特點,一些學(xué)者開始使用泊松回歸模型研究道路交通事故及其影響要素之間的關(guān)系[18-19].這一方法要求交通事故數(shù)的均值等于方差,但是通常情況下交通事故數(shù)的均值與方差是不等的,這在一定程度上影響了模型的精度.因此,有研究人員提出在泊松回歸模型中加入由于均值與方差不相等而導(dǎo)致的誤差項,轉(zhuǎn)化為使用負(fù)二項回歸模型來研究這一問題,能提高模型的精度[20].其中,事故數(shù)據(jù)統(tǒng)計間隔的確定是使用負(fù)二項回歸模型的關(guān)鍵所在.
本文以廣西省桂林市境內(nèi)的G65包茂高速部分路段發(fā)生的交通事故及其影響因素之間的關(guān)系為研究對象,使用負(fù)二項回歸模型,分析發(fā)生在該路段上的交通事故與道路幾何條件、交通流條件、道路設(shè)施條件之間的關(guān)系,以探究影響高速公路安全的顯著要素.通過對影響要素的彈性分析,確定各影響要素對該路段交通事故的影響程度,為科學(xué)制定交通事故預(yù)防措施,提高高速公路安全性水平提供理論支持.
高速公路交通事故的發(fā)生與否具有隨機性、小概率性的特點,并且交通事故沿高速公路的時空分布具有離散性、整數(shù)性的特點.因此,可使用泊松分布來描述交通事故在高速公路路段上的分布特征,泊松回歸模型也常用于道路交通事故的研究,其分布形式見式(1)
(1)
式中:ni為第i個路段發(fā)生交通事故的數(shù)量;λi為第i個路段上發(fā)生交通事故次數(shù)的期望值,并且λi可被看作事故影響因素的函數(shù),見式(2)
λi=exp(βjXij)
(2)
式中:Xij為第i個路段上影響交通事故的第j個自變量;βj為Xij的系數(shù).
泊松回歸模型適用于均值與方差相等的交通事故數(shù)據(jù),但是高速公路上的交通事故數(shù)據(jù)通常具有過度離散或者離散不足的特點(即均值小于方差或者均值大于方差). 而負(fù)二項回歸模型作為泊松回歸模型的一般形式,能更好地擬合這種類型的交通事故數(shù)據(jù),即當(dāng)事故數(shù)據(jù)的均值不等于方差時,泊松回歸模型將產(chǎn)生誤差,此時事故影響因素的函數(shù)λi轉(zhuǎn)換為式(3):
λi=exp(βjXij+ε)
(3)
式中:ε為當(dāng)事故數(shù)據(jù)的均值不等于方差時泊松模型產(chǎn)生的誤差項;exp(εi)為均值為1、方差為D的伽馬分布的誤差項. 將式(3)帶入泊松回顧模型中,得到含有誤差條件的泊松回歸模型:
(4)
對式(4)進行化簡,消去誤差項ε,得到負(fù)二項回歸模型:
(5)
式中:K為離散系數(shù);Γ為伽馬分布.
從2個方面對所建立的負(fù)二項模型進行檢驗,即擬合優(yōu)度檢驗和準(zhǔn)確性檢驗. 其中擬合優(yōu)度檢驗采用赤池信息量準(zhǔn)則(AIC)進行檢驗;準(zhǔn)確性檢驗采用相對誤差和累積殘差進行檢驗. 各指標(biāo)的計算方法如下.
1)赤池信息量準(zhǔn)則(AIC)是由日本統(tǒng)計學(xué)家Akaike提出的,計算方法見式(6):
AIC=-2lg(L)+2p
(6)
式中:L為負(fù)二項回歸模型的最大似然值;p為負(fù)二項回歸模型中估計參數(shù)的個數(shù). 其判斷標(biāo)準(zhǔn)為該值越小,表示所建立的負(fù)二項回歸模型的擬合效果越好.
2)相對誤差表示由負(fù)二項回歸模型得到的事故數(shù)的預(yù)測值與實際值之差的絕對值與實際值的比值,其計算方法見式(7):
(7)
式中:Re為相對誤差值;n為給定高速公路實際發(fā)生的交通事故次數(shù)之和;n′為使用負(fù)二項回歸模型得到的該高速公路交通事故次數(shù)預(yù)測值之和. 其判斷標(biāo)準(zhǔn)為該值越小,表示所建立的負(fù)二項回歸模型的準(zhǔn)確性越好.
3)累積殘差為標(biāo)準(zhǔn)殘差之和,標(biāo)準(zhǔn)殘差表示由負(fù)二項回歸模型得到的事故數(shù)的預(yù)測值與實際值之間的差別,其計算方法見式(8):
(8)
式中:CSR為累積殘差;ni為高速公路第i個路段上發(fā)生的交通事故次數(shù)的實際值;n′i為高速公路第i個路段上由負(fù)二項回歸模型得到的交通事故次數(shù)的預(yù)測值;u為路段總數(shù). 其判斷標(biāo)準(zhǔn)為該值越小,表示所建立的負(fù)二項回歸模型的準(zhǔn)確性越好.
與傳統(tǒng)的線性回歸模型不同,負(fù)二項回歸模型屬于非線性回歸(或廣義線型回歸)模型的范疇,某一自變量對因變量影響程度不僅取決于模型中該自變量系數(shù)值的大小,即:存在某些自變量雖然與因變量顯著相關(guān),但其影響程度可能很小. 因此,使用彈性分析方法來量化各自變量對因變量的影響程度. 其計算方法見式(9):
(9)
當(dāng)自變量為連續(xù)型變量時,為了計算方便,式(9)可使用式(10)近似計算:
(10)
當(dāng)自變量為離散型變量時,為了計算方便,式(10)可使用式(11)近似計算:
(11)
最終,根據(jù)各自變量彈性系數(shù)計算結(jié)果的絕對值的大小來確定模型中該自變量對因變量影響程度的大小.
本文的研究數(shù)據(jù)來自于廣西省桂林市境內(nèi)的G65包茂高速部分路段統(tǒng)計的事故數(shù)據(jù),該部分高速公路全長108 km,屬于招商公路桂林公司的運營管理范疇.包茂高速廣西省桂林市境內(nèi)部分路段的空間位置,如圖1所示.該路段組成復(fù)雜,所經(jīng)區(qū)域多橋梁、隧道、服務(wù)區(qū)、收費站等,全線共設(shè)橋梁23座,其中:大橋7座,中橋1座,小橋1座;分離式立交大橋1座,分離式立交中橋7座,分離式立交小橋3座;互通立交跨線大橋1座,互通立交跨線中橋2座.整體式連拱隧道1座,分離式隧道3座.互通立交2處,收費站5處,服務(wù)區(qū)3處.此外,沿線共設(shè)4個交調(diào)站用于調(diào)查經(jīng)過該路段車輛的交通流狀態(tài),其中客車的年平均日交通量為0.61萬輛/d,平均速度為99.87 km/h;貨車的年平均日交通量為0.11萬輛/d,平均速度為74.06 km/h.該路段交通事故頻發(fā),且事故形態(tài)以碰撞護欄事故為主,據(jù)公司統(tǒng)計2017年1月至—2019年12月該路段共發(fā)生碰撞護欄交通事故524起,照成的生命及財產(chǎn)損失較為嚴(yán)重.
圖1 包茂高速廣西省桂林市境內(nèi)部分路段
事故數(shù)據(jù)統(tǒng)計間隔即路段長度的確定是使用負(fù)二項回歸模型的關(guān)鍵所在,通常使用1 km長度的路段作為研究單元[21].路段劃分長度的大小將直接影響到道路的幾何條件、交通流條件、道路設(shè)施條件以及交通事故等因素的統(tǒng)計特征,進而影響模型的精度以及應(yīng)用效果.為了探索適合本文研究的高速公路路段劃分長度,采用逐步逼近的思路分別將路段劃分為1、2、3、4、5、6 km,分別代入模型中檢驗?zāi)P偷臄M合效果.經(jīng)過計算發(fā)現(xiàn),傳統(tǒng)的將路段劃分為1 km的做法并不適用于本路段,隨著路段劃分長度的增加,從1~5 km模型的擬合精度逐漸增加;而將路段長度劃分為6 km時模型的擬合精度又開始下降,即5 km是適合該高速公路最佳的研究單元.
以5 km為間隔將高速公路劃分為44個路段.統(tǒng)計每個路段上的交通條件數(shù)據(jù)、交通設(shè)施數(shù)據(jù)以及道路幾何條件數(shù)據(jù),從這些數(shù)據(jù)中選取影響交通事故次數(shù)的潛在自變量,其中,交通條件自變量包括:客車的年平均日交通量、貨車的年平均日交通量、客車的平均速度、貨車的平均速度;交通設(shè)施數(shù)據(jù)包括:隧道數(shù)、匝道數(shù);道路幾何條件數(shù)據(jù)包括:圓曲線長度、緩和曲線長度、直線長度、坡長、豎曲線半徑.3個方面共計11個變量,各自變量的名稱、單位以及統(tǒng)計特征見表1.
表1 自變量特征描述
在模型構(gòu)建過程中,首先將變量分為兩類:連續(xù)變量和分類變量,其中表1中的交通條件變量、道路幾何條件變量設(shè)置為連續(xù)變量,交通設(shè)施條件變量設(shè)置為分類變量,并且對分類變量中的隧道數(shù)、匝道數(shù)進行啞變量處理,使用0、1代表交通設(shè)施條件的有無以及數(shù)量的多少;其次,由于客車年平均日交通量、貨車年平均日交通量、客車平均速度、貨車平均速度等變量的數(shù)據(jù)方差較大,有可能導(dǎo)致數(shù)據(jù)的不穩(wěn)定性增加,因此在不改變數(shù)據(jù)相對關(guān)系的情況下對數(shù)據(jù)進行對數(shù)變換以提高模型的穩(wěn)定性.
對模型的擬合優(yōu)度檢驗和準(zhǔn)確性檢驗結(jié)果見表2.采用逐步回歸方法得到最終的模型,通過比較發(fā)現(xiàn),初始零模型的AIC值為293.340,最終模型的AIC值為244.210,表明最終模型的擬合優(yōu)度相比于初始模型有明顯地提高.最終,3個維度包含的11個自變量中,剔除了圓曲線、緩和曲線以及直線的長度、豎曲線半徑等4個自變量,剩余的7個自變量為:客車年平均日交通量、貨車年平均日交通量、客車平均速度、貨車平均速度、隧道數(shù)、匝道數(shù)、坡長.
表2 負(fù)二項回歸模型擬合優(yōu)度與準(zhǔn)確性檢驗結(jié)果
從表2可知,當(dāng)模型中考慮客車年平均日交通量、貨車年平均日交通量、客車平均速度、貨車平均速度、隧道數(shù)、匝道數(shù)、坡長等對交通事故起數(shù)的影響時,模型的AIC值為244.210,模型的相對誤差為0.032%,平均絕對誤差為30.437%.可見模型的擬合效果與準(zhǔn)確性良好.將路段上實際發(fā)生的交通事故數(shù)與由模型預(yù)測的交通事故數(shù)進行比較,結(jié)果如圖2所示.
圖2 交通事故起數(shù)實際值與預(yù)測值路段分布比較
本文旨在通過負(fù)二項模型分析高速公路的安全影響要素,因此采用全樣本數(shù)據(jù)庫對模型進行擬合[22].
由圖2高速公路路段交通事故起數(shù)實際值與預(yù)測值的比較可知,本文所構(gòu)建的用于研究高速公路安全影響要素的負(fù)二項回歸模型能反映高速公路交通事故發(fā)生的趨勢,綜合考慮模型的擬合優(yōu)度與準(zhǔn)確性認(rèn)為本文所構(gòu)建的負(fù)二項回歸模型能揭示廣西省桂林市境內(nèi)的G65包茂高速部分路段的交通事故及其影響要素之間的關(guān)系.
利用統(tǒng)計分析軟件R3.6.3對本文所使用的負(fù)二項回歸模型進行求解,采用逐步回歸,剔出不顯著因素,得到簡化模型.簡化模型的參數(shù)估計結(jié)果,見表3.
表3 模型逐步回歸分析結(jié)果
在0~0.001之間是非常非常顯著,通常用“***”號表示;在0.001~0.01之間是非常顯著,通常用“**”號表示;在0.01~0.05之間是比較顯著,通常用“·”號表示;在0.05~0.1之間是顯著,通常用“”號表示;在0.1~1之間是不顯著.
從表3可知,擬合優(yōu)度最好的模型包含7個變量:客車年平均日交通量、貨車年平均日交通量、客車平均速度、貨車平均速度、隧道數(shù)、匝道數(shù)、坡長.這些變量的顯著性檢驗p值均小于0.05,其他顯著性檢驗p值大于0.05的變量與交通事故起數(shù)沒有顯著相關(guān)關(guān)系,故未列入表3中.
為了進一步探索各自變量對因變量影響程度的大小,使用彈性分析方法對模型中具有顯著性的變量進行彈性分析,結(jié)果見表4.
表4 彈性分析結(jié)果
從表4可知,自變量對因變量的影響程度的排序依次為:其中除客車平均速度和匝道數(shù)以外,其他變量均呈現(xiàn)正影響.
本文采用負(fù)二項回歸模型對廣西省桂林市境內(nèi)的G65包茂高速部分路段的交通流條件、交通設(shè)施條件、道路幾何條件等安全影響要素進行了系統(tǒng)研究,模型擬合效果良好.研究結(jié)果表明,交通流條件變量、交通設(shè)施條件變量、道路幾何條件變量均在一定程度上影響高速公路的安全性,其中以交通流條件高速公路交通安全的影響最大,包括客車平均速度、貨車年平均日交通量、貨車平均速度、客車年平均日交通量,因此高速公路運營管理部門應(yīng)重點加強對高速公路交通流的監(jiān)測與管控,適時控制道路上的車流量與行車速度,以提高高速公路的安全性.此外,交通設(shè)施條件中的匝道數(shù)和隧道數(shù)兩個變量,道路幾何條件中的坡長變量也對該高速公路的交通安全具有顯著影響,但其影響程度比交通流條件變量小,建議在該類路段處設(shè)置必要的安全提示.
由于數(shù)據(jù)限制,本研究僅使用車輛碰撞護欄這一事故形態(tài)代表高速公路的安全性,且未考慮道路交通標(biāo)志的影響,后續(xù)將完善數(shù)據(jù)資源以進一步提高將負(fù)二項回歸模型用于該道路進行安全影響要素分析的擬合優(yōu)度與準(zhǔn)確性.高速公路交通安全是我國乃至全世界共同關(guān)注的熱點問題,根據(jù)不同地區(qū)高速公路的特點有針對性地研究其安全影響要素,逐步提高全國各地區(qū)高速公路的安全性,對于實現(xiàn)聯(lián)合國制定的2020年可持續(xù)發(fā)展目標(biāo)具有重要意義.