劉堯,王穎志,王立君,張豐*,杜震洪,劉仁義
(1.浙江大學 浙江省資源與環(huán)境信息系統(tǒng)重點實驗室,浙江杭州310028;2.浙江大學地理信息科學研究所,浙江 杭州310027;3.浙江警察學院 交通管理工程系,浙江 杭州310053)
近年來,隨著我國城市化進程的加快,機動化水平不斷提高,機動車保有量和駕駛員人數(shù)不斷增加,城市的交通安全問題日益突出。我國是世界上交通事故發(fā)生最多的國家之一[1],交通安全不容樂觀,1990年交通事故成為我國意外死亡的第10大因素,2010年超過癌癥,排第4,2013上升至第3[2]。在我國,交通事故已成為威脅人身安全、造成經(jīng)濟損失的重要因素之一,采取行之有效的措施降低交通事故的發(fā)生,對社會的穩(wěn)定與發(fā)展具有重要意義。
國外學者早在20世紀70年代就開始研究交通事故的高發(fā)點,國內(nèi)的研究大致起步于20世紀90年代,但發(fā)展迅速,目前交通事故已成為公共安全領(lǐng)域的研究熱點之一,主要分析方法有數(shù)理統(tǒng)計方法[3-6]和空間統(tǒng)計方法[7-10]。例如,OKABE 等[11]系統(tǒng)闡述了Voronoi 圖、網(wǎng)絡(luò)核密度估計、網(wǎng)絡(luò)Huff模型等方法,并用來分析道路網(wǎng)絡(luò)上發(fā)生的事件;郭曉魁等[12]運用核密度估計原理和數(shù)理統(tǒng)計方法對不同時段、季節(jié)的交通事故進行了分析,得到了城郊公路交通事故的時空分布規(guī)律;朱杰等[13]用統(tǒng)計方法分析了城市交通事故在不同道路實體上的時空分布規(guī)律,采用基于網(wǎng)絡(luò)的核密度估計方法分析了事故易發(fā)點;聶可等[14]的研究表明,網(wǎng)絡(luò)核密度估計法可直觀體現(xiàn)交通事故沿城市路網(wǎng)的聚類模式,對核密度估計結(jié)果進行局部Moran’s I 統(tǒng)計,能夠鑒別交通事故的易發(fā)路段??傮w而言,現(xiàn)有的研究在交通事故的時空分析上取得了一系列成果,但將時空屬性納入統(tǒng)一分析過程的研究相對較少,因此往往無法具體把握交通事故的時空分布特征。
本研究以H市2013―2015年3 a的交通事故數(shù)據(jù)為研究對象,根據(jù)自組織神經(jīng)網(wǎng)絡(luò)、平行坐標系、時空顏色矩陣和時空網(wǎng)絡(luò)核密度估計、熱點分析法分別從行政區(qū)劃以及道路網(wǎng)絡(luò)上進行交通事故時空特征分析,以期從宏觀和微觀角度揭示交通事故的時空熱點區(qū)域,準確確定交通事故時空熱點路段的范圍與邊界,為交通事故的分析提供新的視角,也為該市的交通安全整治工作提供科學依據(jù)。
自組織神經(jīng)網(wǎng)絡(luò)[15](self-organizing map,SOM)是一種非監(jiān)督神經(jīng)網(wǎng)絡(luò)學習方法,通過自適應(yīng)的學習競爭可以進行數(shù)據(jù)的聚類劃分,由于其引入了具有拓撲關(guān)系的鄰域函數(shù),較傳統(tǒng)的K-means 等聚類算法受初值影響小[16],結(jié)果較為穩(wěn)定。自組織神經(jīng)網(wǎng)絡(luò)中每個輸入層神經(jīng)元都與所有的輸出層神經(jīng)元相連,連接的權(quán)值為wij,計算方法為:首先將權(quán)值wij隨機初始化,并令迭代次數(shù)為0,然后隨機加入輸入向量x,并計算輸入向量x與輸出層神經(jīng)元j之間的距離dj,選擇與輸入向量x距離最小的輸出層神經(jīng)元作為獲勝神經(jīng)元,最后更新獲勝神經(jīng)元及其領(lǐng)域內(nèi)其他神經(jīng)元的連接權(quán)值,完成之后增加迭代次數(shù),重復(fù)以上操作,直到達到最大迭代次數(shù)時聚類結(jié)束,其計算公式如下:
式(1)~(3)中,dj為輸入向量與輸出層神經(jīng)元j之間的距離,m為輸入層神經(jīng)元個數(shù),xi為第i個輸入向量,wij為第i個輸入層神經(jīng)元與第j個輸出層神經(jīng)元的網(wǎng)絡(luò)連接權(quán)值,t為迭代次數(shù),α(t)為學習速率。
核密度估計原理[17-18](kernel density estimation,KDE)的基本思想:認為某一點處的密度值大小與該點一定范圍內(nèi)所包含的數(shù)據(jù)點有關(guān)。時空網(wǎng)絡(luò)核密度估計原理是在核密度估計原理的基礎(chǔ)上,用網(wǎng)絡(luò)距離代替歐氏距離,基本分析單元由空間子路段拓展為時空子路段形成。如圖1所示,其搜索區(qū)域不再是以核中心為圓心,以寬窗為半徑的圓形區(qū)域(虛線圓表示),而是以核中心為起始點,以寬窗為長度極限所能到達的所有道路的線段范圍(加粗線表示),其公式為
空間統(tǒng)計方法主要有空間自相關(guān)法(Global Moran's I)[19],高/低聚類法(Getis-Ord General G)[20],聚類和異常值分析法(Anselin Local Moran's I)[21],熱點分析法(Getis-Ord Gi*)[22]等。其中熱點分析法非常適合犯罪、流行病學、投票模式、經(jīng)濟地理學、零售、交通事故分析以及人口統(tǒng)計學分析[23]。熱點分析法計算研究區(qū)域中每個要素的Getis-Ord Gi*統(tǒng)計,其原理是查看每一要素,計算每個要素及其相鄰要素的局部總和并與所有要素的總和進行比較,當局部總和與預(yù)期的局部總和差距較大,無法成為隨機產(chǎn)生的結(jié)果時,會產(chǎn)生一個具有顯著統(tǒng)計學意義的z得分。正值z得分越高,高值(熱點)的聚類就越緊密;負值z得分越低,低值(冷點)的聚類就越緊密,其計算公式為:
圖1 時空網(wǎng)絡(luò)核密度估計原理Fig.1 Principle of spatial-temporal network kernel density estimation
式(5)~(7)中,xj為要素j的屬性值,wi,j為要素i與要素j的空間權(quán)重,n為要素總數(shù),G*i為z得分。
2.1.1 研究區(qū)域概況
H市下轄8個鎮(zhèn)、4個街道,共有161個行政村、64個社區(qū)。本研究使用的數(shù)據(jù)包括交通事故數(shù)據(jù)與道路交通網(wǎng)絡(luò)數(shù)據(jù),如圖2所示。交通事故數(shù)據(jù)來自該市2013—2015年3 a的交通事故記錄,共計176 897 條。每條交通事故記錄包含6 大類屬性,分別為基本屬性、時間屬性、位置屬性、天氣屬性、道路屬性以及事故評價屬性。道路交通網(wǎng)絡(luò)數(shù)據(jù)來自經(jīng)該市行政邊界裁剪的openstreetmap(OSM)2017年的矢量路網(wǎng)數(shù)據(jù)。為了盡可能地還原真實路網(wǎng)情況,裁剪后的道路交通網(wǎng)絡(luò)數(shù)據(jù)還需根據(jù)高精度的遙感影像數(shù)據(jù)進行人工補全和細化,共計11 270 條路段。
圖2 H市交通事故數(shù)據(jù)與道路交通網(wǎng)絡(luò)數(shù)據(jù)Fig.2 Traffic accident data and traffic network data in H city
2.1.2 數(shù)據(jù)預(yù)處理
交通事故記錄是由交通安全管理部門在事故發(fā)生地記錄而來,由于人為記錄的不完善和采集儀器誤差,數(shù)據(jù)中難免出現(xiàn)空值和錯誤,因此,需要進行數(shù)據(jù)清洗,根據(jù)實際情況共刪除13 503 條包含空值的數(shù)據(jù),修正2 089 條存在錯誤的數(shù)據(jù),剩余實驗數(shù)據(jù)163 394 條。
圖3 路網(wǎng)匹配原理Fig.3 Road network matching principle
交通事故數(shù)據(jù)點的空間位置往往并不準確位于道路網(wǎng)絡(luò)上,如圖2放大區(qū)域所示,因此需要進行路網(wǎng)匹配,具體方法如圖3所示。首先對道路網(wǎng)絡(luò)建立一定寬度(h)的緩沖區(qū),如果事故點(點A)位于緩沖區(qū)以內(nèi),則將事故點投影到道路網(wǎng)絡(luò)上(點B);若事故點(點C)位于緩沖區(qū)以外,則剔除這些偏離過遠的數(shù)據(jù)。在實際操作中,通過統(tǒng)計使緩沖區(qū)包含80%的數(shù)據(jù)點,設(shè)置緩沖區(qū)寬度為44 m,將130 715條交通事故數(shù)據(jù)匹配到道路網(wǎng)絡(luò)上,刪除其余不在緩沖區(qū)內(nèi)的數(shù)據(jù)。
每起交通事故的嚴重程度不同,嚴重程度大的交通事故具有更大的危害性,在分析交通事故的時空分布規(guī)律時需考慮交通事故的嚴重程度,只有這樣才能真實反映交通事故的實際分布情況。因此,引入事故嚴重程度指數(shù)S作為權(quán)重因子,根據(jù)《道路交通事故等級劃分標準》,交通事故嚴重程度指數(shù)主要由事故經(jīng)濟損失值和人員傷亡數(shù)量來確定,其公式為
式(8)中,Si表示第i起交通事故的嚴重程度指數(shù),A1,A2和A3分別表示死亡人數(shù)、受傷人數(shù)和經(jīng)濟損失值,W1,W2和W3為權(quán)重系數(shù),分別設(shè)置為0.5,0.02和1/300 00。
在行政區(qū)劃上,本研究采用自組織神經(jīng)網(wǎng)絡(luò)對不同等級的交通事故進行聚類劃分,并結(jié)合平行坐標系和時空顏色矩陣分析結(jié)果[24]。首先采用Jenks自然間斷點分級法確定交通事故嚴重等級。Jenks自然間斷點分級法是基于數(shù)據(jù)中存在的固有自然分組對分類間隔進行識別的方法,因此可以對相似的值進行最恰當?shù)姆诸悾⑶沂垢鞣诸愔g的差異達到最大化[25]。本研究中根據(jù)交通事故嚴重程度指數(shù)將交通事故劃分為5類:輕微事故、較輕事故、一般事故、較重事故、嚴重事故。然后利用自組織神經(jīng)網(wǎng)絡(luò)進行聚類分析,輸入向量由不同時段、不同區(qū)域、不同等級的交通事故率構(gòu)成,輸入向量在時間維度上包含一天24 h,分為8個時段,在空間上包含H市12個鎮(zhèn)或街道,輸出層為8個神經(jīng)元,最大迭代次數(shù)為1 000。圖4(a)~(h)為分層設(shè)色法填充的地圖矩陣,每種顏色代表一種聚類;平行坐標系表示每種聚類在不同嚴重等級下交通事故率的聚類中心,其橫軸代表不同等級的交通事故,縱軸代表每km2的交通事故率;時空顏色矩陣具有多維圖例的作用,表示對應(yīng)時間、空間的聚類類別,通過3種方法的結(jié)合可以直觀表現(xiàn)交通事故熱點區(qū)域在時間和空間上的演變情況。
圖4 基于行政區(qū)劃的H市交通事故時空熱點圖Fig.4 Spatial-temporal hotspots map for traffic accidents based on administrative divisions in H city
從圖4的平行坐標系中可以看出,整體上看8個聚類,從聚類1到聚類8 嚴重程度依次下降,其中聚類1、聚類2、聚類3的5種交通事故率均處于較高水平;聚類4的一般及以下事故率處于較高水平,較重及以上事故率處于較低水平;聚類5的輕微事故率處于較高水平,較輕及以上事故率處于較低水平;聚類6的一般及以下事故率處于較高水平,較重及以上事故率處于較低水平,但整體上小于聚類4;聚類7、聚類8的各種交通事故率均處于較低水平,并且聚類7 略大于聚類8。結(jié)合圖4的平行坐標系和時空顏色矩陣,從地圖矩陣中可以看出,0:00―6:00 全市所有鎮(zhèn)或街道均處于聚類8,說明凌晨至黎明時段全市各類交通事故率均處于最低水平,從全天看,只有C 鎮(zhèn)和H 鎮(zhèn)一直處于聚類8,其他鎮(zhèn)或街道在6:00 以后均有不同變化,說明C 鎮(zhèn)和H 鎮(zhèn)交通情況良好,全天各類交通事故率均處于最低水平;A 鎮(zhèn)、B 鎮(zhèn)在6:00―21:00 處于聚類7,D 鎮(zhèn)、E 鎮(zhèn)在6:00―18:00 處于聚類7,說明這4個鎮(zhèn)在白天時段各類交通事故率均有所上升,D 鎮(zhèn)、E 鎮(zhèn)在進入夜晚后有所下降,而A 鎮(zhèn)、B 鎮(zhèn)會繼續(xù)持續(xù)一段時間;相較夜晚,F(xiàn) 鎮(zhèn)只在早高峰時段各類交通事故率有所上升,而G 鎮(zhèn)在早、晚高峰時段均有所上升;I 街道在6:00―18:00 處于聚類6,說明該街道白天與夜晚嚴重交通事故率變化不大,但一般及以下交通事故率有明顯上升;J 街道在6:00―15:00 處于聚類2,在15:00―18:00 處于聚類1,說明J 街道白天時段,尤其是在晚高峰時段是全市各類交通事故率最高的區(qū)域;K 街道在6:00―18:00 處于聚類4,是H市中各類交通事故率第2高區(qū)域;L 街道在6:00―19:00與15:00―18:00 處于聚類5,說明該區(qū)域在早、晚高峰時段較輕及以上事故發(fā)生率與夜晚相差不大,但輕微事故發(fā)生率卻顯著上升。整體來說,從時間上看,白天各類交通事故發(fā)生率高于夜晚,并且在早、晚高峰時段達到最高;從空間上看,4個街道各類交通事故率高于8個鎮(zhèn),并且市政府所在地J 街道是各類交通事故率最高的區(qū)域。因此,在H市交通安全整治中應(yīng)著重關(guān)注4個街道所在的城市中心區(qū)域,尤其是J 街道;各鎮(zhèn)或街道在治理過程中應(yīng)著重關(guān)注早、晚高峰時段。
在道路網(wǎng)絡(luò)上,采用時空網(wǎng)絡(luò)核密度估計方法進行交通事故的時空分析,由于交通事故是嚴格約束在道路網(wǎng)絡(luò)上的事件,采用網(wǎng)絡(luò)距離代替歐氏距離可以更好地反映核中心的真實密度,并且通過時間維度的拓展可以反映交通事故在時間維度的聚集性,因此,有助于具體把握交通事故的時空分布特征。由時空網(wǎng)絡(luò)核密度估計的原理可知,其考量標準為寬窗內(nèi)數(shù)據(jù)點的數(shù)量與距離,這樣勢必會在交通事故多發(fā)區(qū)域形成密度熱點,但由于交通事故的嚴重程度不同,因此將事故嚴重程度指數(shù)S作為權(quán)重因子,構(gòu)建一種顧及交通事故嚴重程度的時空網(wǎng)絡(luò)核密度估計方法對交通事故進行密度估計,其計算公式為:
式(9)和(10)中,λ表示顧及交通事故嚴重程度的時空網(wǎng)絡(luò)核密度估計值,K為高斯核函數(shù),其余參數(shù)同式(4)。
根據(jù)近似密度與真實密度的均方誤差最小時的寬窗為最優(yōu)寬窗的原則進行計算,得到空間寬窗h1為669.4 m,根據(jù)最優(yōu)寬窗的十分之一確定空間步長為66.94 m。按照空間步長將11 270 條路段劃分子路段,其中不足空間步長的部分單獨作為子路段,最后得到58 414 條子路段。同樣經(jīng)過計算得到時間寬窗h2為0.34 h,空間步長為0.03 h,考慮到交通事故的現(xiàn)實情況,將時間步長劃分至1 h 以下沒有現(xiàn)實意義,因此根據(jù)實際情況,設(shè)置時間寬窗h2為3 h,時間步長為1 h,最終得到58 414×24 條時空子路段。然后,分別計算每條時空子路段的核密度估計值,利用ArcScene 實現(xiàn)可視化顯示,結(jié)果如圖5所示。圖5中,道路交通網(wǎng)絡(luò)的高度代表時間維度,分為24 h,最底部為0:00―1:00的核密度,最高處為23:00―0:00的核密度。從圖5中可以直觀地看出,交通事故存在明顯的時空聚集性,但通過目視判讀的方法無法有效確定交通事故的嚴重區(qū)域,尤其是對于嚴重區(qū)域邊界的判定存在主觀臆斷性,因此需要對核密度估計的結(jié)果進行有效的鑒別。
圖5 H市交通事故時空網(wǎng)絡(luò)核密度估計圖Fig.5 Spatial-temporal network kernel density estimation map for traffic accidents in H city
統(tǒng)計所有時空子路段的核密度估計值發(fā)現(xiàn),絕大多數(shù)處于較低水平,僅有少部分處于高水平。在核密度可視化顯示中,高值要素(紅色)會引起注意,但是該要素可能不是具有顯著統(tǒng)計學意義的熱點,要成為具有顯著統(tǒng)計學意義的熱點,該要素應(yīng)該具有高值,且應(yīng)該被其他具有高值的要素包圍。本研究采用熱點分析法對核密度估計的結(jié)果進行鑒別,選取時空子路段的核密度估計值作為計算Getis-Ord Gi*統(tǒng)計的要素屬性值,選擇置信度為99%的統(tǒng)計顯著性進行空間熱點分析計算,計算結(jié)果同樣使用ArcScene 進行可視化顯示,結(jié)果如圖6所示。圖6中,采用該市行政區(qū)劃作為地理底圖,方便判斷交通事故熱點位置,交通事故熱點可視化方式不變,縱軸為時間維度,不同的是圖6中只包含置信度為99%的統(tǒng)計顯著性的交通事故熱點時空子路段,其余時空子路段不再顯示,因此可以清晰準確地判斷熱點時空子路段的時空位置與邊界。
由圖6可知,H市交通事故熱點區(qū)域在空間上呈現(xiàn)明顯的“兩帶一中心”分布,市政府所在的行政中心區(qū)域為交通事故最大熱點區(qū)域,位于H市東北部,其中心位置交通事故最為嚴重,嚴重程度由中心向四周擴散并逐漸下降;其余交通事故熱點區(qū)域主要為各鎮(zhèn)或街道的中心區(qū)域,這些熱點區(qū)域主要沿硤許線與101 省道分布,形成東西走向的帶狀區(qū)域??梢园l(fā)現(xiàn),行政中心區(qū)域由于結(jié)構(gòu)功能復(fù)雜、社會資源豐富、生產(chǎn)部門集中等,導致人員、貨物流動量大,交通繁忙,是交通事故熱點最突出的區(qū)域;此外,城市主要干道運載能力強、車速快、車流量大,導致交通事故熱點區(qū)域多發(fā)于主干道上,并且大多是主干道與行政中心區(qū)域相交的區(qū)域。
同樣由圖6可知,H市交通事故熱點區(qū)域在時間上呈現(xiàn)明顯的區(qū)域特征分布,結(jié)構(gòu)功能不同的區(qū)域,熱點時段不同,結(jié)構(gòu)功能相同的區(qū)域,熱點時段基本一致,具體為:以工業(yè)辦公區(qū)為主的區(qū)域,交通事故熱點出現(xiàn)在9:00 前后的早高峰時段,如d 區(qū)域東部、h 區(qū)域、o 區(qū)域;以生活住宅區(qū)為主的區(qū)域,交通事故熱點出現(xiàn)在17:00 前后的晚高峰時段,如d 區(qū)域西部、f 區(qū)域、i 區(qū)域;以商業(yè)消費區(qū)為主的區(qū)域,交通事故熱點出現(xiàn)在18:00―21:00的夜晚時段,如g區(qū)域、k 區(qū)域、m 區(qū)域;此外a 區(qū)域、b 區(qū)域、c 區(qū)域、e 區(qū)域、j 區(qū)域、n 區(qū)域為行政中心區(qū)域,這些區(qū)域內(nèi)包含多處住宅區(qū)、商業(yè)區(qū)、辦公區(qū)、學校等,其結(jié)構(gòu)功能復(fù)雜,在9:00和17:00 前后的早晚高峰時段均出現(xiàn)交通事故熱點。可以發(fā)現(xiàn),交通事故熱點區(qū)域多為作為“目的地”的區(qū)域,出行人員在早高峰時段集中前往工業(yè)辦公區(qū),晚高峰時段集中前往生活住宅區(qū),夜晚時段前往商業(yè)消費區(qū),加大了這些區(qū)域內(nèi)的交通流量,引起交通擁堵、人車混行等不良交通狀態(tài),更容易發(fā)生交通事故。
圖6 基于道路網(wǎng)絡(luò)的H市交通事故時空熱點圖Fig.6 Spatial-temporal hotspots map for traffic accidents based on road network in H city
針對以上分析結(jié)果,在H市交通安全整治工作中應(yīng)著重關(guān)注東北部行政中心區(qū)域以及硤許線和101 省道等主要干道,并根據(jù)區(qū)域功能特征分時段重點整治,加強交通事故熱點路段的疏導與管理,嚴格規(guī)范機動車與行人的行為,并逐步改善道路環(huán)境,完善道路設(shè)施,減少交通事故的發(fā)生。
交通事故具有明顯的時空聚集特性,準確判斷交通事故的時空熱點區(qū)域?qū)τ诮煌ò踩喂ぷ饕饬x重大。因此,本研究以H市2013―2015年3 a的交通事故數(shù)據(jù)為研究對象進行分析,結(jié)果表明,H市交通事故在空間上,街道區(qū)域熱點高于鎮(zhèn)區(qū)域熱點,并呈圍繞主要干道聚集、在行政中心區(qū)域形成熱點的模式;在時間上,早、晚高峰時段最為嚴重,夜晚較為輕微,并呈現(xiàn)與區(qū)域特征相關(guān)分布。
在方法選用上,首先結(jié)合自組織神經(jīng)網(wǎng)絡(luò)、平行坐標系、時空顏色矩陣在行政區(qū)劃上分析不同嚴重等級交通事故發(fā)生率的聚類模式,通過3種方法的結(jié)合可以直觀表示交通事故熱點區(qū)域的時空演變情況;然后構(gòu)建一種顧及交通事故嚴重程度的時空網(wǎng)絡(luò)核密度估計模型,在道路網(wǎng)絡(luò)上對交通事故進行密度估計,并對結(jié)果采用Getis-Ord Gi*統(tǒng)計,在道路網(wǎng)絡(luò)上準確鑒別了交通事故時空熱點路段的范圍與邊界。本研究將時空維度同時納入考量范圍,有助于具體把握交通事故的時空分布特征,對交通安全整治工作提供了更加準確的依據(jù)。
本研究有助于交通安全管理部門集中精力優(yōu)先解決熱點區(qū)域的交通安全問題,形成的分析方法也可應(yīng)用于其他約束在網(wǎng)絡(luò)上的事件,如零售分析、犯罪分析等。但本研究局限于分析交通事故的時空分布,下一步,將應(yīng)用其他屬性信息,定量分析影響交通事故嚴重程度的因素,以期對交通安全整治工作提供更詳細的依據(jù)。