何 慶 馬社強(qiáng) 李 洋
(1.北京警察學(xué)院道路交通管理系 北京 102202;2.中國人民公安大學(xué)治安與交通管理學(xué)院 北京 100038)
隨著我國城市快速化發(fā)展、城市規(guī)模不斷擴(kuò)大、大型和特大型城市不斷涌現(xiàn)、機(jī)動(dòng)車保有量不斷增長,城市交通事故處于高發(fā)態(tài)勢,不僅帶來了人員傷亡和經(jīng)濟(jì)損失,也給城市交通運(yùn)行帶來了巨大的影響[1-2]。某些特殊事件會造成事故規(guī)模的急劇上升。如,2016年,西安一場大雪讓122事故報(bào)警增加了9.7%[3],給城市帶來了嚴(yán)重交通擁堵。傳統(tǒng)的區(qū)域交通安全評價(jià)是以年度或者月度數(shù)據(jù)為基礎(chǔ),但這限制了城市交通安全管理精細(xì)化水平。因此,準(zhǔn)確預(yù)測城市區(qū)域日度交通事故規(guī)模,并發(fā)掘各種影響因素,有助于提升交通管理部門的應(yīng)急處突水平和事故預(yù)防措施的針對性。
Kiran等[4]總結(jié)大量的研究后指出,事故預(yù)測模型中解釋變量主要有人車路基本條件、交通流特性、氣象、照明條件和交通管理措施等5個(gè)方面。由于城市人車路基本條件和照明條件在短期內(nèi)(2~3年內(nèi))變化不大、而交通管理措施難以量化,因此,對區(qū)域交通事故預(yù)測模型的解釋變量主要是從交通特性和氣象條件2個(gè)方面考慮。
道路交通流數(shù)據(jù)容易獲得,區(qū)域路網(wǎng)交通流數(shù)據(jù)不易獲得。路網(wǎng)交通流與日期性質(zhì)關(guān)系非常密切,因此可以用日期性質(zhì)代替交通流特性,作為解釋變量。其中,月份、一周內(nèi)各天、節(jié)假日等因素,影響城市路網(wǎng)交通運(yùn)行狀態(tài)[5],進(jìn)而影響著城市交通事故規(guī)模[6-9]。
氣象條件是導(dǎo)致交通事故發(fā)生的重要因素,但研究主要集中在氣象條件對事故率、事故傷害程度的影響方面。針對提升應(yīng)急救援水平和交通安全規(guī)劃,部分文獻(xiàn)研究了氣象條件對區(qū)域交通事故規(guī)模的影響。國內(nèi)在這些研究方面已取一些成果[10-14],國外也有大量此類研究[8,15-19]??v觀這些研究,總體上呈現(xiàn)3個(gè)特點(diǎn):①這些研究表明,影響交通事故的氣象條件主要是降雨量、降雪量、氣溫、能見度等因素;②各氣象因素對交通事故規(guī)模的影響,不同研究的結(jié)論也是不同的,依然存在爭議[14,19];③國外部分研究綜合考慮氣象條件、日期性質(zhì)對區(qū)域交通事故規(guī)模的影響[8,15],而國內(nèi)很少有綜合考慮這2個(gè)方面因素的研究。
基于此,筆者搜集北京市某區(qū)域的交通事故、氣象條件和日期性質(zhì)的日度數(shù)據(jù),利用負(fù)二項(xiàng)回歸模型,對該區(qū)域日度事故進(jìn)行預(yù)測,并分析氣象條件和日期性質(zhì)對區(qū)域日度交通事故的影響。
1.1.1 事故數(shù)據(jù)
中國的交通事故采用一般程序、簡易程序和當(dāng)事人協(xié)商等3種方式處理。前2種方式處理的事故,被錄入到統(tǒng)計(jì)系統(tǒng)。而當(dāng)事人協(xié)商處理的事故雖然占總體的絕大多數(shù),但未被錄入統(tǒng)計(jì)系統(tǒng),以往傳統(tǒng)研究缺少對其分析,使得部分結(jié)論不完整或不夠準(zhǔn)確[20]。但這3種方式處理的交通事故都在122報(bào)警臺中留存了記錄。因此,筆者以122報(bào)警記錄數(shù)作為區(qū)域交通事故分析基礎(chǔ),確保研究結(jié)論更加全面、準(zhǔn)確。
1.1.2 氣象數(shù)據(jù)
通過中國天氣網(wǎng),獲得日最高氣溫、日最低氣溫、相對濕度、能見度、天氣情況等5個(gè)因素的數(shù)據(jù)。由于日最高氣溫與日最低氣溫之間存在著高度線性相關(guān),因此對其處理成日平均氣溫和溫度差,日平均氣溫和溫度差之間無相關(guān)性。天氣情況包括晴、陰、霧、多云、浮塵、霾、揚(yáng)沙、小雨、小到中雨、中雨、中到大雨、大雨、雷陣雨、陣雨、小雪、小到中雪、中雪、中到大雪、大雪、雨夾雪等20種類型。以晴作為參照組,根據(jù)天氣情況,生成19個(gè)啞變量。選擇天氣情況而非降雨量或降雪量,一方面受到數(shù)據(jù)獲取渠道的限制,另一方面降雨量、降雪量對交通安全的影響具有非線性[21],將降雨量處理成分類變量,基本滿足數(shù)據(jù)精度需求。因此,所建立的模型共考慮了23個(gè)氣象方面變量。
1.1.3 日期性質(zhì)
與日期有關(guān)的變量有月份、一周內(nèi)各天、假日、節(jié)日、限行、時(shí)間長度等6個(gè)變量。
假日是1個(gè)虛擬變量,編碼時(shí)以1表示假日,0表示非假日。
全年有7個(gè)影響力較大的節(jié)日,分別是:元旦、春節(jié)、清明節(jié)、五一勞動(dòng)節(jié)、端午節(jié)、中秋節(jié)、國慶節(jié)。節(jié)日前1 d和后1 d,特別是春節(jié)前后,其交通情況可能異于其他日期。模型中需要考慮到這些情況,按照節(jié)日、節(jié)日前、節(jié)日后進(jìn)行三分類,共計(jì)生成7×3=21個(gè)啞變量,以1表示該天處于某個(gè)節(jié)日中或節(jié)日的影響日中,以0表示非該天影響范圍內(nèi)。
月份是1個(gè)有12個(gè)水平的分類變量,以1月為參照組,生成11個(gè)啞變量。
1周內(nèi)各天是1個(gè)有7個(gè)水平的分類變量,以周一為參照組,生成6個(gè)啞變量。
所統(tǒng)計(jì)的范圍處于北京限行區(qū)域內(nèi),限行是存在8個(gè)水平的分類變量。這8個(gè)水平分別是限行尾號為(1,6)、(2,7)、(3,8)、(4,9)、(5,0)等5種情況,限行尾號分別為偶數(shù)、奇數(shù)的2種情況,以及不限行這1種情況。以不限行為參照組,根據(jù)限行這一分類變量,生成7個(gè)啞變量。
為了衡量時(shí)間趨勢對事故規(guī)模的影響,以1 d為單位,設(shè)置1個(gè)時(shí)間長度的連續(xù)變量,以2012年1月1日為第1 d,開始計(jì)數(shù)。
綜上,經(jīng)過變換后,日期性質(zhì)相關(guān)的變量共計(jì)47個(gè)。
負(fù)二項(xiàng)廣義線性回歸模型是一種最常見的用于交通事故預(yù)測的模型,特別是它被用于分析非隨機(jī)的聚集性的計(jì)數(shù)資料。負(fù)二項(xiàng)分布受到μ和α這2個(gè)參數(shù)影響,μ為總體均數(shù);α為離散參數(shù),α值越小,分布的方差與均數(shù)的比值就越接近1;α值越大,分布的方差與均數(shù)的比值就越大。負(fù)二項(xiàng)分布的概率函數(shù)形式見式(1),其中Y=0,1,2,…。
對于服從負(fù)二項(xiàng)分布的離散型隨機(jī)變量,針對影響因素分析可采用負(fù)二項(xiàng)回歸。負(fù)二項(xiàng)回歸模型與Poisson回歸模型類似,是針對事件發(fā)生數(shù)λ建模:或λ=exp(β0+β1×x1+β2×x2+…+βm×xm)。模型中假設(shè)各自變量對事件數(shù)的影響是指數(shù)相乘的,則回歸系數(shù)β1的解釋為當(dāng)其他自變量不變時(shí),自變量xi改變1個(gè)單位,Y平均改變量之對數(shù)值。
選擇數(shù)據(jù)分析軟件R作為數(shù)據(jù)分析工具,采用MASS包中g(shù)lm.nb函數(shù)擬合數(shù)據(jù),而采用step函數(shù),采用向后逐步回歸的方式剔除不顯著變量,選擇赤池信息量準(zhǔn)則(AIC)信息統(tǒng)計(jì)量最小的模型作為最終模型。
2.1.1 模型擬合效果
以2012—2014年共3年的數(shù)據(jù)作為訓(xùn)練集,涉及氣象相關(guān)變量23個(gè)、日期性質(zhì)相關(guān)變量47個(gè),同時(shí)考慮1 d在星期內(nèi)分布和尾號限行之間交互效應(yīng),建立負(fù)二項(xiàng)回歸初始模型,模型的AIC值為10 236.84,采用逐步回歸剔出不顯著因素,得到簡化模型,該模型的AIC值為10 208,與原始模型相比較,AIC值小幅下降,這表明不顯著因素對模型的擬合效果影響較小。
根據(jù)擬合模型的偏差統(tǒng)計(jì)量,得到模型的偽R2值為0.645,說明模型擬合效果較好。
2.1.2 模型參數(shù)估計(jì)
簡化模型共有51個(gè)顯著參數(shù),由于模型參數(shù)過多,不列出模型的數(shù)學(xué)形式,僅展示參數(shù)估計(jì)結(jié)果,見表1。表1中最后1列為模型參數(shù)的方差膨脹因子,用來評估各個(gè)參數(shù)的共線性水平。由表1可以看出,參數(shù)的VIF值均小于4,表明各參數(shù)之間的共線性較低。
2.2.1 預(yù)測效果
以時(shí)間為橫坐標(biāo),以交通事故數(shù)為縱坐標(biāo),繪制2015年日度交通事故數(shù)的實(shí)際值和預(yù)測值,見圖1。其中,實(shí)線表示實(shí)際值,而虛線表示預(yù)測值,可見模型的預(yù)測結(jié)果與實(shí)際情況基本相同,預(yù)測效果較好。
很多文獻(xiàn)采用平均絕對誤差(MAPE)評價(jià)預(yù)測效果,但如果預(yù)測期內(nèi)出現(xiàn)異常情況,則平均絕對誤差作為評價(jià)指標(biāo)不太合理,且僅以1個(gè)平均值作為評價(jià)指標(biāo)不夠全面。因此,筆者采用預(yù)測期內(nèi)相對百分誤差的4分位數(shù)作為預(yù)測精度評價(jià)指標(biāo)。
計(jì)算絕對百分誤差見式(2)。
式中:δ表示絕對百分誤差;pred表示預(yù)測值;actu表示實(shí)際值。
將2015年每1 d的預(yù)測結(jié)果(百分誤差)以時(shí)序圖的形式繪制出來,見圖2。
統(tǒng)計(jì)未來1年的絕對百分誤差值的4分位數(shù),見表2。其中平均值就是平均絕對百分誤差(MAPE)。
2.2.2 預(yù)測效果評價(jià)
從表2可以看出,預(yù)測期內(nèi)百分誤差的中位數(shù)為17.04%,平均值為18.57%,均小于20%,第75百分位為23.87%,小于25%,這表明模型預(yù)測精度較高,基本滿足了應(yīng)用需求?,F(xiàn)有部分交通事故預(yù)測模型,預(yù)測誤差小于10%,優(yōu)于本模型,但那些模型多用于預(yù)測交通死亡事故數(shù)或死亡人數(shù),而交通死亡事故數(shù)或者死亡人數(shù)波動(dòng)較小,決定了其預(yù)測精度較高。而日度事故數(shù)波動(dòng)幅度較大,預(yù)測難度高,因此本文所提出的模型的預(yù)測精度是可以接受的。此外,需要說明的是,預(yù)測期內(nèi)百分誤差最大值為198.43%,出現(xiàn)在2015年9月3日附近。這是因?yàn)?,此時(shí)城市舉行閱兵活動(dòng),交通出行規(guī)模下降幅度較大,事故規(guī)模也隨之降低,導(dǎo)致實(shí)際值遠(yuǎn)低于預(yù)測值,出現(xiàn)特別大的誤差。
表1 模型的參數(shù)估計(jì)結(jié)果Tab.1 Estimation of the parameter in the model
圖1 對未來1年該區(qū)域內(nèi)日度事故數(shù)的預(yù)測Fig.1 Prediction for the daily number of road accident about the area in the next year
圖2 2015年1年內(nèi)各天預(yù)測效果百分誤差Fig.2 The error of the prediction in next year
表2 預(yù)測百分誤差的概括Tab.2 The summary of the error
2.3.1 日期性質(zhì)對事故規(guī)模的影響
從節(jié)假日的系數(shù)來看,節(jié)假日一般會降低交通事故規(guī)模。但影響程度由高到低依次為春節(jié)、國慶節(jié)、清明節(jié)、中秋節(jié)、端午節(jié)、五一勞動(dòng)節(jié)、元旦。春節(jié)和國慶節(jié)期間居民外出旅游較多,清明節(jié)居民外出掃墓較多,區(qū)域內(nèi)交通出行規(guī)模明顯下降,事故減少。與元旦、五一勞動(dòng)節(jié)相比,中秋節(jié)、端午節(jié)等傳統(tǒng)節(jié)日的事故規(guī)模更少。但2個(gè)節(jié)日前的交通出行規(guī)模普遍增加,交通事故增加,節(jié)日后的交通出行規(guī)模普遍下降,交通事故減少。需要注意的是,與預(yù)期相比較,春節(jié)前事故規(guī)模并未明顯下降,春節(jié)后事故規(guī)模也未立即回升。因此,春節(jié)對北京市交通事故影響還有待進(jìn)一步研究。
從模型中月份的相關(guān)系數(shù)來看,與1月相比較,2月、3月交通事故規(guī)模下降,7月、9月、10月、11月、12月交通事故規(guī)模有所增加,其他月份事故規(guī)模與一月持平。其中9月的交通事故最為突出,是預(yù)防重點(diǎn)時(shí)段。
從1周內(nèi)各天的相關(guān)系數(shù)來看,與周一相比較,周二到周六的交通事故規(guī)模都有所增加,而周日的事故規(guī)模與周一持平,事故規(guī)模較小。該結(jié)論與國內(nèi)很多相關(guān)研究指出的周一事故多、周六日事故少的觀點(diǎn)相悖。但與文獻(xiàn)[7]的結(jié)論更為接近。文獻(xiàn)[7]指出,在倫敦城區(qū)周一事故最少,然后依次增加,至周五事故最多,但周六日事故較少。對此可以解釋為,在周六區(qū)域內(nèi)居民出行規(guī)模仍然較高,而周日出行規(guī)模較低。在周一居民經(jīng)過休息后,精力更好,更加守交通秩序,事故規(guī)模少,而其他時(shí)間事故規(guī)模有所增加。特別是周五,駕駛?cè)溯^為疲憊,且整體出行規(guī)模高,事故多。
從時(shí)間長度的系數(shù)來看,系數(shù)的值為負(fù)數(shù),表明該區(qū)域的交通事故規(guī)模呈現(xiàn)緩慢下降趨勢。
從限行相關(guān)參數(shù)的系數(shù)來看,尾號限行對交通事故規(guī)模影響較大。特別是對尾號為偶數(shù)或者奇數(shù)的車輛進(jìn)行限制行駛時(shí),事故規(guī)模下降最大。但當(dāng)限行尾號為4和9時(shí),事故規(guī)模沒有下降。這與國人對4忌諱有關(guān),尾號為4和9的車輛保有量較小有關(guān)。
2.3.2 氣象條件對事故規(guī)模的影響
從模型中天氣的相關(guān)參數(shù)的系數(shù)來看,在22種天氣中,大雪、中到大雪、浮塵和揚(yáng)沙等4種天氣下事故規(guī)模與晴天持平,高于其他16種天氣下事故規(guī)模。同時(shí),在7種雨天天氣和8種雪天天氣中,隨著雨量和雪量的增加,事故規(guī)模逐步下降,但隨后又都會所上升,轉(zhuǎn)折點(diǎn)為中到大雨和中雪。
非晴朗天氣會增加事故規(guī)模,這也得到了很多研究的支持[8,13]。但也有研究表示不同觀點(diǎn),文獻(xiàn)[16]指出與歐洲多雨地區(qū)不同,少雨的雅典地區(qū)事故規(guī)模會隨著降雨的出現(xiàn)而減少。究其原因,首先,非晴朗的天氣,城市居民更傾向于選擇公共交通[22],城市整體交通量下降;其次,非晴朗天氣使得駕駛?cè)烁有⌒闹?jǐn)慎;最后,交通安全管理水平也會干預(yù)非晴朗天氣對事故的影響,如,文獻(xiàn)[17]指出在發(fā)達(dá)國家,隨著管理水平提升,降雨量對事故的負(fù)面影響逐步降低。
綜上可以認(rèn)為北京市該區(qū)域針對非晴朗天氣,采取了有效管理措施。如,通過交通安全宣傳,提示駕駛?cè)烁叨戎匾暦乔缋侍鞖獾慕煌ò踩珕栴},鼓勵(lì)居民采取公共交通出行等。但需要注意的是,浮塵、揚(yáng)沙、中到大雪、大雪等4種天氣下,事故規(guī)模與晴朗天氣相等。而中到大雨、大雨、中到大雪、大雪相對其他雨雪天氣對事故成正向影響。因此,這6種天氣值得關(guān)注。
從氣溫的相關(guān)參數(shù)的系數(shù)來看,日平均氣溫越低、溫度差越大,事故規(guī)模都會增大。這個(gè)結(jié)果與文獻(xiàn)[10]一致,而未見于其他文獻(xiàn),值得關(guān)注。究其原因,是在全年尺度上,隨著溫度下降,更容易發(fā)生降雨、降雪和結(jié)冰等情況,導(dǎo)致事故增加;而溫度差大,則是伴隨著天氣劇烈變化而產(chǎn)生,這使得人們不太適應(yīng),也會導(dǎo)致路面凍融交替以及形成冷凝水等情況的出現(xiàn),增加事故發(fā)生。文獻(xiàn)[15]指出,在旱季和雨季交替之際事故多發(fā),也從側(cè)面佐證了本文的研究結(jié)果。
在考慮氣象和日期性質(zhì)的影響下,基于負(fù)二項(xiàng)回歸技術(shù),建立了對北京市某個(gè)地區(qū)日度交通事故預(yù)測模型。從對2015年的預(yù)測效果和偽R2值來看,模型預(yù)測精度初步滿足了應(yīng)用需求。
從影響因素分析來看,限行、月份對事故規(guī)模的影響,與經(jīng)驗(yàn)認(rèn)識基本一致,但更加準(zhǔn)確。節(jié)假日會使得事故規(guī)模下降,與經(jīng)驗(yàn)認(rèn)識基本一致,但端午節(jié)、中秋節(jié)以及國慶節(jié)3個(gè)節(jié)日的前1 d事故規(guī)模上升,值得關(guān)注。受到大城市生活節(jié)奏影響,1周內(nèi),周一、周日事故規(guī)模小,而從周二到周六,事故規(guī)模逐步上升。特別是周六的交通安全形勢值得關(guān)注。與現(xiàn)有國內(nèi)研究不同,研究表明,與晴天相比較,多數(shù)非晴朗天氣事故規(guī)模更低。這表明,管理水平可以有效控制非晴朗天氣對事故規(guī)模的影響。但浮塵、揚(yáng)沙、中到大雨、大雨、中到大雪、大雪等6種天氣影響仍然會相對較高,特別值得關(guān)注。而氣溫下降以及溫度差增加,都會導(dǎo)致事故規(guī)模增加。從事故與時(shí)間長度關(guān)系來看,事故規(guī)模整體上呈現(xiàn)下降趨勢。這表明該地區(qū)的交通管理水平正在穩(wěn)步提升。