黃合來(lái),鄧 雪,許鵬鵬
(1.中南大學(xué) 交通運(yùn)輸工程學(xué)院,湖南 長(zhǎng)沙410075;2.西南交通大學(xué) 交通運(yùn)輸與物流學(xué)院,四川 成都610031)
傳統(tǒng)交通安全實(shí)踐局限于“打補(bǔ)丁式”的微觀工程措施,缺乏在交通系統(tǒng)規(guī)劃過(guò)程中的前瞻性考慮.通過(guò)在規(guī)劃階段對(duì)交通安全問(wèn)題作前瞻性的分析來(lái)提高路網(wǎng)的安全水平非常重要.當(dāng)前,新一代的交通規(guī)劃方法,即“交通安全規(guī)劃”,在發(fā)達(dá)國(guó)家尤其是美國(guó)成為一個(gè)重要研究熱點(diǎn)[1].交通規(guī)劃層面的影響因素與交通安全水平的關(guān)聯(lián)方法,即區(qū)域安全預(yù)測(cè)模型,是“交通安全規(guī)劃”理論的核心技術(shù)之一.
國(guó)外已經(jīng)做了大量定量研究[2-6]來(lái)分析不同規(guī)劃層面的影響因素與交通安全水平的關(guān)系,交通分析小區(qū)(traffic analysis zone,TAZ)是主要的空間分析單元.已有研究主要從區(qū)域人口經(jīng)濟(jì)特征[3]、土地利用特征[4]、區(qū)域 交通特征[5]和區(qū)域路 網(wǎng) 特 征[5-6]等方面進(jìn)行分析.就統(tǒng)計(jì)方法而言,主要應(yīng)用廣義線(xiàn)性模型對(duì)TAZ事故頻數(shù)與相關(guān)變量的關(guān)系進(jìn)行建模[4],假設(shè)TAZ的事故分布在空間上不相關(guān).然而,安全數(shù)據(jù)具有復(fù)雜的空間分布特征,對(duì)空間特征的忽視將大大影響安全水平估計(jì)的準(zhǔn)確性和魯棒性.為了克服廣義線(xiàn)性模型的局限性,空間統(tǒng)計(jì)方法[6]逐漸成為安全分析領(lǐng)域的一個(gè)前沿研究方向.
在國(guó)內(nèi),文獻(xiàn)[7]建議結(jié)合我國(guó)交通規(guī)劃的工作流程考慮交通安全,文獻(xiàn)[8]探討了城市總體規(guī)劃和土地規(guī)劃中影響因素的安全效應(yīng).而從區(qū)域宏觀層面反映路網(wǎng)特征、交通特征與交通安全之間關(guān)系的定量研究在我國(guó)幾乎沒(méi)有展開(kāi).
本文基于美國(guó)佛羅里達(dá)州Hillsborough縣的數(shù)據(jù)進(jìn)行區(qū)域安全建模研究.基于安全同質(zhì)性原則,將該縣重新劃分為不同數(shù)量規(guī)模的交通安全分析小區(qū)(traffic safety analysis zone,TSAZ),提取小區(qū)層面數(shù)據(jù),引入空間條件自回歸先驗(yàn)信息建立貝葉斯空間模型,分析區(qū)域安全影響因素;評(píng)價(jià)不同分區(qū)規(guī)模對(duì)安全因素效應(yīng)的影響,為交通安全規(guī)劃提供技術(shù)支撐和理論依據(jù).
區(qū)劃問(wèn)題是交通規(guī)劃中一個(gè)最為基礎(chǔ)的問(wèn)題,傳統(tǒng)交通分析小區(qū)的劃分鮮有考慮安全相關(guān)因素,而現(xiàn)存大部分區(qū)域安全研究均以交通分析小區(qū)為基本單元.TSAZ 的劃分在兼顧交通規(guī)劃層面因素的前提下,考慮事故特征的區(qū)域同質(zhì)性.本文基于Full-order-CLK 算法[9],按照嚴(yán)重事故、道路長(zhǎng)度和總出行生成的聚集程度(權(quán)重分別為0.50,0.25,0.25)獲得Hillsborough 縣的多種分區(qū)方案,并基于200,500和700個(gè)TSAZ分區(qū)方案建立事故預(yù)測(cè)模型,分區(qū)方案如圖1所示.
采用佛羅里達(dá)州Hillsborough縣所有州立道路3年的數(shù)據(jù)(2005—2007年),包括事故數(shù)據(jù)、道路特征數(shù)據(jù)、出行數(shù)據(jù)以及空間分布特征數(shù)據(jù).
事故數(shù)據(jù)從佛羅里達(dá)州運(yùn)輸部事故分析報(bào)告系統(tǒng)中獲得,其提供的最重要的信息是事故發(fā)生的小區(qū)歸屬以及傷害嚴(yán)重性等級(jí).對(duì)于事故傷害的嚴(yán)重程度,分為5個(gè)等級(jí):1為沒(méi)有受傷,2為輕傷,3為非致殘傷害,4為致殘傷害,5為交通死亡.
相關(guān)路網(wǎng)特征數(shù)據(jù)和出行數(shù)據(jù)主要來(lái)源于佛羅里達(dá)州運(yùn)輸部.基于GIS地圖小區(qū)劃分邊界對(duì)數(shù)據(jù)進(jìn)行集計(jì)處理,獲得小區(qū)層面的變量.
(1)路段總長(zhǎng)度:每個(gè)TSAZ內(nèi)道路中心線(xiàn)總里程數(shù).
(2)分類(lèi)的路段長(zhǎng)度:每個(gè)TSAZ內(nèi)路段中心線(xiàn)公里數(shù)按速度限制分類(lèi),①限速24km(15英里)的路段長(zhǎng)度;②限速40km(25英里)的路段長(zhǎng)度;③限速56km(35 英里)的路段長(zhǎng)度;④限速105km(65英里)的路段長(zhǎng)度.其中,限速40km 和56km的路段是主要類(lèi)型,分別占路段總長(zhǎng)度的76.86%和13.01%.為避免變量冗余問(wèn)題,將所有分類(lèi)歸為限速低于56km 的路段長(zhǎng)度和限速大于或等于56km的路段長(zhǎng)度2類(lèi).
(3)交叉口數(shù)量:每個(gè)TSAZ的交叉口總數(shù).
(4)總出行發(fā)生量:每個(gè)TSAZ 總的出行發(fā)生量.
(5)總出行吸引量:每個(gè)TSAZ 總的出行吸引量.
(6)基于TSAZ的出行發(fā)生量和吸引量,包括從家去工作,從家去上學(xué),從家去購(gòu)物,從家去社交活動(dòng),從家去其他,非從家去工作,非從家去其他的出行發(fā)生量和吸引量;輕型/重型卡車(chē),出租車(chē),飛機(jī)的出行發(fā)生量和吸引量;其他TSAZ到目標(biāo)TSAZ 的出行發(fā)生量和吸引量.
使用ArcGIS軟件自動(dòng)生成相鄰小區(qū)的空間鄰接矩陣.
定義嚴(yán)重性等級(jí)為4(致殘傷害)和5(交通死亡)的事故為嚴(yán)重事故,其余為非嚴(yán)重事故.分別調(diào)查與各TSAZ有關(guān)的總事故和嚴(yán)重事故,作為預(yù)測(cè)模型的響應(yīng)變量.
在因素較多且因素間存在廣泛多重共線(xiàn)性的情況下,模型解釋變量的篩選具有一定的挑戰(zhàn)性.模型的數(shù)據(jù)擬合度和簡(jiǎn)約程度是兩個(gè)重要的變量選擇標(biāo)準(zhǔn).通過(guò)數(shù)據(jù)探索性分析和對(duì)變量的逐一篩選,選定3類(lèi)重要的安全影響因素,包括路段長(zhǎng)度、交叉口數(shù)量和出行量.路段長(zhǎng)度是反映交通基礎(chǔ)設(shè)施規(guī)模的重要指標(biāo)之一;交叉口是交通事故多發(fā)點(diǎn),在控制了路段長(zhǎng)度的前提下,采用交叉口密度(小區(qū)內(nèi)交叉口總數(shù)/小區(qū)道路總長(zhǎng)度)反映交通狀況的復(fù)雜程度.此外,出行量是交通事故發(fā)生的直接機(jī)會(huì)變量,也是傳統(tǒng)交通規(guī)劃的重要數(shù)據(jù)來(lái)源.本研究選用總出行發(fā)生量和吸引量作為重要解釋變量,同時(shí),由于家庭和工作出行數(shù)據(jù)是一個(gè)重要的出行類(lèi)型,也在模型中重點(diǎn)考慮.
為了避免總出行量和工作出行量的強(qiáng)相關(guān)問(wèn)題,將其分別加入模型,即同一種分區(qū)、同一種響應(yīng)變量下,建立兩個(gè)事故預(yù)測(cè)模型,每個(gè)模型包含5個(gè)解釋變量.具體模型變量如表1所示.
2.1.1 泊松模型
由于泊松模型能夠契合道路交通事故的零散性、隨機(jī)性以及事故頻次為非負(fù)整數(shù)的特點(diǎn),被廣泛應(yīng)用于事故預(yù)測(cè)中.假定在2005—2007年3年中各分析小區(qū)內(nèi)事故頻次Yi服從泊松分布,則第i個(gè)小區(qū)發(fā)生k次事故的概率為
式中:λ為泊松分布的強(qiáng)度參數(shù),反映該小區(qū)內(nèi)某時(shí)段平均發(fā)生事故頻次.
將λ進(jìn)行對(duì)數(shù)處理,建立與解釋變量的線(xiàn)性關(guān)系,作為模型的連接函數(shù),即
式中:β0 和β為待估系數(shù);Xi為解釋變量的向量.
2.1.2 泊松-對(duì)數(shù)正態(tài)模型
泊松模型假定事故均值與方差相等.然而,事故數(shù)據(jù)往往具有過(guò)度離散性,其方差顯著大于均值[3].泊松-伽馬模型與泊松-對(duì)數(shù)正態(tài)模型通過(guò)引入模型殘差隨機(jī)項(xiàng),容許事故過(guò)度離散特征的存在,成為兩個(gè)主流的事故預(yù)測(cè)模型的基本結(jié)構(gòu),本文采用泊松-對(duì)數(shù)正態(tài)模型進(jìn)行研究.在泊松-對(duì)數(shù)正態(tài)模型中,假定第i個(gè)小區(qū)的事故頻次Yi服從泊松分布
泊松-對(duì)數(shù)正態(tài)回歸模型在基本泊松模型的連接函數(shù)中加入一個(gè)反映數(shù)據(jù)過(guò)度離散特征的殘差項(xiàng)θi,并假定其服從均值為零的正態(tài)分布,即
式中:τθ為精度參數(shù),等于方差的倒數(shù).
2.1.3 貝葉斯空間模型
空間相關(guān)廣泛地存在于相鄰的空間小區(qū)中,對(duì)影響事故頻次因素的估計(jì)效果的精確度有顯著影響.貝葉斯空間模型能有效地?cái)M合空間相關(guān)特征[3].本研究在泊松-對(duì)數(shù)正態(tài)模型的基礎(chǔ)上,引入條件自回歸模型[10]反映相鄰小區(qū)間可能的空間關(guān)聯(lián).假設(shè)Yi是第i個(gè)TSAZ的3年平均事故率,模型如下:
在貝葉斯模型估計(jì)中,為β和θi設(shè)定無(wú)信息先驗(yàn)分布φi滿(mǎn)足條件自回歸模型的先驗(yàn)分布
本研究采用貝斯特等人建立的先驗(yàn)分布形式以保證模型收斂[3].
式中:τθ和τc分別表示由空間效應(yīng)和隨機(jī)效應(yīng)導(dǎo)致的過(guò)度離散特征,其比值α能反映數(shù)據(jù)過(guò)度離散特征的結(jié)構(gòu),可由下式估計(jì):
式中:s為標(biāo)準(zhǔn)差.
采用貝葉斯偏差信息準(zhǔn)則 (deviance information criterion,DIC)對(duì)待選模型進(jìn)行科學(xué)評(píng)價(jià).DIC準(zhǔn)則綜合考慮模型擬合優(yōu)度和模型復(fù)雜性,其計(jì)算方法如下[11]:
一般地,DIC 越小,模型越優(yōu).DIC 差值大于5則表明模型之間具有顯著的差異.
采用WinBUGS軟件[12]對(duì)模型進(jìn)行參數(shù)估計(jì).使用3條鏈進(jìn)行迭代,通過(guò)查看歷史記錄檢查其收斂情況.確保所有參數(shù)收斂以后,舍去前1 000次迭代結(jié)果.為減少自相關(guān)性,在剩下的樣本中每10 個(gè)中抽取1個(gè),從1 001次開(kāi)始進(jìn)行10 000次迭代.
如圖2所示,以200個(gè)TSAZ為例,說(shuō)明佛羅里達(dá)州Hillsborough縣2005—2007年事故頻次地理分布特點(diǎn).該縣共發(fā)生57 694起事故,最低為東北部第112個(gè)TSAZ的7起,最高為東部第161個(gè)TSAZ的3 256起,事故頻率標(biāo)準(zhǔn)差為369.47,變化范圍較大;共發(fā)生4 854起嚴(yán)重事故,在TSAZ內(nèi)變化范圍從0~148起,標(biāo)準(zhǔn)差為23.14,其中第190個(gè)TSAZ嚴(yán)重事故頻次最大,第15個(gè)TSAZ內(nèi)的嚴(yán)重事故數(shù)為0.西北部地區(qū)事故相對(duì)集中,而東南部地區(qū)事故相對(duì)較少.以往研究表明,事故的空間分布與區(qū)域人口經(jīng)濟(jì)特征[3]、土地使用功能[4]等因素密切相關(guān).西北部海岸地區(qū)經(jīng)濟(jì)發(fā)展水平高,人口相對(duì)密集,事故頻次較高;而東南部地區(qū)的事故頻次較低.
圖2 佛羅里達(dá)州Hillsborough縣2005—2007年事故地理分布圖(以200個(gè)TSAZ為例)Fig.2 Crash distribution maps of Hillsborough County,F(xiàn)lorida from 2005to 2007(200TSAZ as an example)
3.2.1 DIC評(píng)價(jià)
如表2所示,泊松-對(duì)數(shù)正態(tài)模型和貝葉斯空間模型的pD值大于泊松模型而DIC 值遠(yuǎn)小于泊松模型,說(shuō)明前兩者模型結(jié)構(gòu)較為復(fù)雜,且擬合效果大大優(yōu)于泊松模型;泊松-對(duì)數(shù)正態(tài)模型與貝葉斯空間模型相比,兩者的DIC值較為接近,僅從DIC值無(wú)法得出最優(yōu)模型.從表3和表4可知,隨著分區(qū)數(shù)目增多,空間因素比例α逐漸增大且統(tǒng)計(jì)顯著,說(shuō)明貝葉斯空間模型能夠更好地?cái)M合安全水平空間相關(guān)性特征.
表2 基于DIC值的模型評(píng)價(jià)Tab.2 Model evaluation on the basis of DIC
表3 總事故模型參數(shù)估計(jì)Tab.3 Estimation for total crash models
表4 嚴(yán)重事故模型參數(shù)估計(jì)Tab.4 Estimation for severe crash models
從表2還可以看出,同一種模型,隨著分區(qū)數(shù)目增多,DIC值顯著增大,模型擬合度降低,說(shuō)明本文所采用的宏觀區(qū)域交通指標(biāo)變量在區(qū)域面積較大時(shí)對(duì)事故率的預(yù)測(cè)更為準(zhǔn)確.
3.2.2 變量分析
對(duì)于總事故,無(wú)論分區(qū)數(shù)目多少,泊松模型中的解釋變量全部顯著.而貝葉斯空間模型的顯著性解釋變量數(shù)目較少,當(dāng)TSAZ的數(shù)目為200時(shí),顯著性解釋變量只有2個(gè)(限速低于56km 的路段和限速大于等于56km 的路段長(zhǎng)度);當(dāng)TSAZ的數(shù)目分別為500和700時(shí),貝葉斯空間模型的顯著性解釋變量增多且趨于穩(wěn)定,除限速低于56km 的路段長(zhǎng)度和總的出行吸引量外,其余變量全都顯著.
對(duì)于嚴(yán)重事故,泊松模型的顯著性解釋變量數(shù)目最多.在貝葉斯空間模型中,當(dāng)TSAZ數(shù)目為200時(shí),顯著性解釋變量?jī)H有1個(gè)(限速大于等于56km的路段長(zhǎng)度);當(dāng)TSAZ 數(shù)目為500時(shí),顯著性解釋變量有2個(gè)(限速大于等于56km 的路段長(zhǎng)度和交叉口密度);當(dāng)TSAZ 數(shù)目為700時(shí),顯著性解釋變量增多且趨于穩(wěn)定,除限速低于56km 的路段長(zhǎng)度和總的出行吸引量外,其余變量全都顯著.
交叉口:在大多數(shù)模型中,交叉口密度都是顯著正相關(guān),尤其是當(dāng)分區(qū)數(shù)目足夠多時(shí).模型穩(wěn)定后,給定路段長(zhǎng)度、出行數(shù)據(jù),交叉口數(shù)目越多,事故發(fā)生的頻次越高.
路段長(zhǎng)度:限速低于56km 的路段長(zhǎng)度在貝葉斯空間模型中幾乎都不顯著,而其在泊松模型和泊松-對(duì)數(shù)正態(tài)模型中幾乎都是顯著負(fù)相關(guān);限速大于等于56km 的路段長(zhǎng)度在所有模型中都是顯著正相關(guān),且在同一模型中其系數(shù)最大,說(shuō)明高速路段長(zhǎng)度是預(yù)測(cè)道路安全水平的主要指標(biāo).
出行數(shù)據(jù):總出行吸引量在泊松-對(duì)數(shù)正態(tài)模型和貝葉斯空間模型中都不顯著;同一模型中,總出行發(fā)生量的系數(shù)總是大于總出行吸引量的系數(shù),說(shuō)明出行發(fā)生量對(duì)事故發(fā)生的預(yù)測(cè)能力更強(qiáng);同一模型中,從家里去工作的出行發(fā)生量的系數(shù)總是大于非從家里去工作的出行發(fā)生量的系數(shù),說(shuō)明以家為基準(zhǔn)的工作出行量有更好的事故預(yù)測(cè)能力;大多數(shù)出行數(shù)據(jù)的系數(shù)都為正,說(shuō)明出行量與事故發(fā)生成正比例關(guān)系.
最后,從空間因素比例α 的估計(jì)參數(shù)來(lái)看,隨著分區(qū)數(shù)目增加,空間因素比例α增加.當(dāng)分區(qū)數(shù)目足夠多時(shí),有必要考慮相鄰區(qū)域的空間相關(guān)性,而文中提出的貝葉斯空間模型能較好擬合空間相關(guān)性;同時(shí),在貝葉斯空間模型中,隨著分區(qū)數(shù)目增多,顯著變量數(shù)目也增多.然而,如前所述,在使用宏觀區(qū)域交通指標(biāo)變量預(yù)測(cè)安全水平時(shí),在區(qū)域較大的情況下數(shù)據(jù)擬合程度降低.因此,實(shí)際中分區(qū)規(guī)模要適中,以平衡擬合度和變量顯著性,既達(dá)到統(tǒng)計(jì)上的要求又保證工程應(yīng)用的可行性.
(1)對(duì)比傳統(tǒng)的泊松模型和泊松-對(duì)數(shù)正態(tài)模型,貝葉斯空間模型具有更高的數(shù)據(jù)擬合度.
(2)分區(qū)數(shù)目越多,空間因素在隨機(jī)因素中的比例越高.
(3)同一分區(qū)下,路網(wǎng)特征變量(交叉口密度、限速低于56km 的路段長(zhǎng)度和限速大于等于56km 的路段長(zhǎng)度)的安全效應(yīng)具有魯棒性.
(4)限速大于等于56km 的路段長(zhǎng)度是預(yù)測(cè)安全水平的主要指標(biāo).
本文就交通安全規(guī)劃的核心技術(shù)問(wèn)題——區(qū)域安全建模進(jìn)行了研究,基于美國(guó)佛羅里達(dá)州Hillsborough縣的數(shù)據(jù),在TSAZ 層面針對(duì)事故均值提出了能夠有效擬合事故空間相對(duì)特征的區(qū)域安全建模研究提供技術(shù)基礎(chǔ).
[1] Washington S P,Schalkwyk V I,Mitra S,et al.Incorporating safety into long-range transportation planning[R].Washington D C:Transportation Research Board,2006.
[2] Huang H,Abdel-Aty M.Multilevel data and Bayesian analysis in traffic safety[J].Accident Analysis and Prevention,2010,42(6):1556.
[3] Huang H,Abdel-Aty M,Darwiche A L.County-level crash risk analysis in Florida: Bayesian spatial modeling [J].Transportation Research Record,2010,2148,27.
[4] Guevara F L D,Washington S P,Oh J.Forecasting crashes at the planning level:simultaneous negative binomial crash model applied in Tucson,Arizona [J].Transportation Research Record,2004,1897:191.
[5] Haynes R,Jones A,Kennedy V,et al.District variations in road curvature in England and Wales and their association with roadtraffic crash[J].Environment and Planning:A,2007,39(5):1222.
[6] Hadayeghi A,Shalaby A,Persaud B.Development of planninglevel transportation safety models using full Bayesian semi parametric additive technique [J].Journal of Transportation Safety and Security,2010,2(1):45.
[7] 繆玉玲,陳小桐,李峰,等.引入交通安全對(duì)交通規(guī)劃的新思考[C]//第二屆全國(guó)公路科技創(chuàng)新高層論壇論文集.北京:當(dāng)代中國(guó)出版社,2004:58-63.MIAO Yuling,CHEN Xiaotong,LI Feng,et al.The new thinking of introducing traffic safety on transportation planning[C]//Papers of the Second National Highway Science and Technology Innovation Forum.Beijing:Contemporary China Publishing House,2004:58-63.
[8] 唐玨琳.城市規(guī)劃中的交通安全因素分析[J].公路與汽運(yùn),2007(4):47.TANG Juelin.Factor analysis of traffic safety in urban planning[J].Highways and Automotive Applications,2007(4):47.
[9] Guo D. Regionalization with dynamically constrained agglomerative clustering and partitioning (REDCAP) [J].International Journal of Geographical Information Science,2008,22(7):801.
[10] Besag J.Spatial interaction and the statistical analysis of lattice systems[J].Journal of Royal Statistical Society Series B,1974,36(2):192.
[11] Spiegelhalter D,Best N,Carlin B P,et al.Bayesian measures of model complexity and fit[J].Journal of Royal Statistical Society B,2002,64(4):583.
[12] Spiegelhalter D J,Thomas A,Best N G,et al.WinBUGS version 1.4.1 user manual[M].Cambridge:MRC Biostatistics Unit,2003.