• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于AdaBoost分類器的實(shí)時(shí)交通事故預(yù)測(cè)

      2017-04-17 05:13:30胡震波朱新山
      計(jì)算機(jī)應(yīng)用 2017年1期
      關(guān)鍵詞:交通流分類器交通事故

      張 軍,胡震波,朱新山

      (天津大學(xué) 電氣與自動(dòng)化工程學(xué)院,天津 300072)

      (*通信作者電子郵箱xszhu126@126.com)

      基于AdaBoost分類器的實(shí)時(shí)交通事故預(yù)測(cè)

      張 軍,胡震波,朱新山*

      (天津大學(xué) 電氣與自動(dòng)化工程學(xué)院,天津 300072)

      (*通信作者電子郵箱xszhu126@126.com)

      傳統(tǒng)的道路交通事故預(yù)測(cè)是對(duì)交通事故次數(shù)及其造成的損失的歷史趨勢(shì)進(jìn)行預(yù)測(cè),針對(duì)其不能反映交通事故與實(shí)時(shí)交通特性關(guān)系、不能有效地預(yù)防事故發(fā)生的問(wèn)題,提出一種基于AdaBoost分類器的交通事故實(shí)時(shí)預(yù)測(cè)的方法。首先,將交通道路劃分為正常、危險(xiǎn)兩種交通狀態(tài),利用實(shí)時(shí)采集的交通流數(shù)據(jù)作為特征變量對(duì)不同的狀態(tài)進(jìn)行表征,將事故的實(shí)時(shí)預(yù)測(cè)問(wèn)題轉(zhuǎn)化為分類問(wèn)題;然后,采用Parzen窗非參數(shù)估計(jì)的方法對(duì)兩種狀態(tài)在不同時(shí)間尺度下候選交通流特征的概率密度函數(shù)(PDF)進(jìn)行估計(jì),利用基于概率分布的可分性判據(jù)分析估計(jì)的密度函數(shù),選擇合適的特征變量及時(shí)間尺度,確定樣本數(shù)據(jù);最后,根據(jù)樣本數(shù)據(jù)訓(xùn)練AdaBoost分類器對(duì)不同的交通狀態(tài)進(jìn)行分類識(shí)別。實(shí)驗(yàn)結(jié)果表明,采用交通流特性的標(biāo)準(zhǔn)差特征對(duì)測(cè)試樣本分類的正確率比平均值特征高7.9%,更能反映不同交通狀態(tài)的差別,獲得更好的分類結(jié)果。

      智能交通;事故預(yù)測(cè);分類器;交通流特性;Parzen窗;可分性判據(jù)

      0 引言

      隨著我國(guó)經(jīng)濟(jì)與社會(huì)的快速發(fā)展,交通道路不斷擴(kuò)建,汽車保有量也在持續(xù)增長(zhǎng),導(dǎo)致道路交通事故發(fā)生頻率及傷亡情況也在增長(zhǎng)。交通事故預(yù)測(cè)是道路交通安全研究的一項(xiàng)重要內(nèi)容,它能探究道路交通事故的發(fā)生規(guī)律,幫助控制交通安全,制定合理的交通安全對(duì)策。

      國(guó)外已經(jīng)有很多學(xué)者在研究基于實(shí)時(shí)檢測(cè)數(shù)據(jù)的交通事故預(yù)測(cè)。文獻(xiàn)[1-3]最初采用了概率神經(jīng)網(wǎng)絡(luò)(Probabilistic Neural Network, PNN)模型、分類樹(shù)等方法來(lái)計(jì)算發(fā)生事故的概率,近幾年他們又采用了貝葉斯理論、logistic回歸等方法來(lái)處理高速公路上實(shí)時(shí)交通數(shù)據(jù),以此來(lái)預(yù)測(cè)事故的發(fā)生。國(guó)外相關(guān)的研究還包括Hossain等[4]采用邏輯回歸模型以及貝葉斯網(wǎng)絡(luò)對(duì)高速路進(jìn)行事故實(shí)時(shí)預(yù)測(cè);Xu等[5-6]采用K-means聚類等方法對(duì)不同交通狀態(tài)特征變量進(jìn)行研究等。

      目前國(guó)內(nèi)的研究多是對(duì)交通事故未來(lái)的形勢(shì),包括每年事故次數(shù)、傷亡人數(shù)等進(jìn)行估計(jì)和推測(cè),而針對(duì)交通事故實(shí)時(shí)預(yù)測(cè)的研究較少。林震等[7]用車速的標(biāo)準(zhǔn)差作為特征變量進(jìn)行事故預(yù)測(cè),建立了最小風(fēng)險(xiǎn)貝葉斯預(yù)測(cè)模型。秦小虎等[8]提出基于貝葉斯法則的學(xué)習(xí)算法,通過(guò)計(jì)算條件概率來(lái)計(jì)算事故發(fā)生概率。Lv等[9-10]利用基于歐氏距離的特征選擇方法選擇特征變量,采用C-means和k近鄰法對(duì)事故進(jìn)行實(shí)時(shí)預(yù)測(cè)。這些研究都由于國(guó)內(nèi)獲得交通流數(shù)據(jù)、事故數(shù)據(jù)的困難較大,采用仿真實(shí)驗(yàn)去驗(yàn)證方法的有效性,不能夠真實(shí)考慮到國(guó)內(nèi)實(shí)時(shí)采集的交通數(shù)據(jù)的特性,本文中采用北京2014年10月份的交通流數(shù)據(jù)以及交通事故數(shù)據(jù),從能夠?qū)崟r(shí)采集的交通流數(shù)據(jù)中提取合適特征,設(shè)計(jì)分類器識(shí)別危險(xiǎn)交通狀態(tài),從而預(yù)測(cè)事故的發(fā)生。

      1 道路交通事故實(shí)時(shí)預(yù)測(cè)原理

      本文將交通狀態(tài)分為3種類型:危險(xiǎn)狀態(tài)、正常狀態(tài)、過(guò)渡狀態(tài),如圖1所示。正常交通狀態(tài)(ω1)表示交通狀況穩(wěn)定,不會(huì)發(fā)生事故;危險(xiǎn)交通狀態(tài)(ω2)表示交通狀況不穩(wěn)定,并且不穩(wěn)定的程度從T-α?xí)r刻開(kāi)始逐漸增長(zhǎng),直到T時(shí)刻發(fā)生事故;過(guò)渡狀態(tài)(ω3)表示事故發(fā)生之后危險(xiǎn)交通狀態(tài)恢復(fù)到正常交通狀態(tài)前的交通狀態(tài)。

      圖1 交通狀態(tài)劃分

      文獻(xiàn)[1-3]的研究已經(jīng)證明,不同的交通狀態(tài)可以采用一定時(shí)間段內(nèi)的交通數(shù)據(jù)進(jìn)行表征,本文通過(guò)較為穩(wěn)定的道路信息以及能夠?qū)崟r(shí)采集的交通流數(shù)據(jù)對(duì)ω1以及ω2進(jìn)行表征,不同交通狀態(tài)的特征向量記作:

      xi={Ti,Li,Ci,Wi,Fi}T;i=1,2,…,N

      (1)

      其中:T表示樣本數(shù)據(jù)記錄時(shí)間;L表示樣本數(shù)據(jù)記錄地點(diǎn),本文中采用該位置的經(jīng)緯度來(lái)表示;C表示記錄時(shí)間的平均氣溫;W表示記錄時(shí)間的天氣狀況,包括晴、雨、霧等;F表示實(shí)時(shí)采集的交通流特性,包括特定時(shí)間尺度Δt內(nèi)的速度(s)、占有率(o)、車流量(v),N為樣本數(shù)量。

      這樣交通事故的實(shí)時(shí)預(yù)測(cè)轉(zhuǎn)化為對(duì)不同交通狀態(tài)的分類問(wèn)題,通過(guò)分類器h(x)對(duì)某一時(shí)刻i的特征向量xi進(jìn)行分類來(lái)實(shí)現(xiàn)對(duì)該時(shí)刻交通事故的實(shí)時(shí)預(yù)測(cè):

      (2)

      當(dāng)判定x屬于ω2即危險(xiǎn)交通狀態(tài)時(shí),則可采取合理的措施預(yù)防事故的發(fā)生。基于分類器的交通事故實(shí)時(shí)預(yù)測(cè)過(guò)程如圖2所示。

      圖2 實(shí)時(shí)交通事故預(yù)測(cè)過(guò)程

      具體步驟為:1)采集交通事故數(shù)據(jù)以及相應(yīng)的交通流數(shù)據(jù),進(jìn)行數(shù)據(jù)預(yù)處理;2)選擇合適的特征變量獲得樣本數(shù)據(jù)。3)根據(jù)樣本數(shù)據(jù)設(shè)計(jì)分類器,將分類器應(yīng)用到實(shí)際中,根據(jù)實(shí)時(shí)數(shù)據(jù)識(shí)別交通狀態(tài),從而預(yù)測(cè)事故。同時(shí),在實(shí)際應(yīng)用當(dāng)中,隨著事故數(shù)據(jù)的增多,可以動(dòng)態(tài)調(diào)整特征變量并且訓(xùn)練新的分類器以便提高預(yù)測(cè)的準(zhǔn)確性。

      2 交通數(shù)據(jù)準(zhǔn)備及處理

      對(duì)于交通狀態(tài)分類器的設(shè)計(jì),收集的數(shù)據(jù)有兩類:一類是交通流數(shù)據(jù),為了能夠在實(shí)時(shí)預(yù)測(cè)中穩(wěn)定收集數(shù)據(jù),采用固定型檢測(cè)器采集的交通流數(shù)據(jù);一類是交通事故數(shù)據(jù)。這兩類數(shù)據(jù)在預(yù)測(cè)系統(tǒng)中,起著不同的作用。在設(shè)計(jì)分類器階段,兩類數(shù)據(jù)均要用到。在應(yīng)用分類器時(shí),需要的是交通流數(shù)據(jù)。

      2.1 數(shù)據(jù)采集及預(yù)處理

      本文中采用北京二環(huán)路上2014年10月16日到10月26日的交通流數(shù)據(jù)以及該時(shí)間段內(nèi)交通事故數(shù)據(jù)進(jìn)行分類器的設(shè)計(jì)。由于環(huán)境影響、檢測(cè)設(shè)備故障等原因,這些數(shù)據(jù)存在一些問(wèn)題,例如記錄的數(shù)據(jù)丟失、數(shù)據(jù)時(shí)間點(diǎn)順序錯(cuò)誤、數(shù)據(jù)精度產(chǎn)生偏差等。

      在實(shí)際交通流數(shù)據(jù)的采集過(guò)程中,同樣會(huì)出現(xiàn)錯(cuò)誤或異常,因此在應(yīng)用交通流數(shù)據(jù)之前,需要對(duì)這些數(shù)據(jù)進(jìn)行預(yù)處理,以保證數(shù)據(jù)的準(zhǔn)確性,預(yù)處理主要包括如下。

      1)設(shè)定參數(shù)的合理范圍以及精度,對(duì)不符合條件的數(shù)據(jù)進(jìn)行修正。例如,平均速度的合理范圍一般在0和地點(diǎn)限制速度的1.3或1.5倍之間,時(shí)間占有率的合理范圍是0到100%。

      2)檢驗(yàn)每組交通流數(shù)據(jù)的記錄時(shí)間,正確數(shù)據(jù)應(yīng)當(dāng)從0到719,刪除重復(fù)數(shù)據(jù),對(duì)亂序數(shù)據(jù)重新排序修正。

      3)對(duì)缺失數(shù)據(jù)以及其他異常數(shù)據(jù)進(jìn)行填補(bǔ),如果只有個(gè)別數(shù)據(jù)存在問(wèn)題,則利用其相鄰數(shù)據(jù)平均值進(jìn)行填充,如果一段時(shí)間內(nèi)存在問(wèn)題,則利用同期的歷史數(shù)據(jù)平均值進(jìn)行填充。

      另外,由于天氣狀況數(shù)據(jù)不是數(shù)值型數(shù)據(jù),因此需要先將該數(shù)據(jù)進(jìn)行數(shù)值化,對(duì)應(yīng)處理如表1所示。

      表1 天氣狀況數(shù)值化

      2.2 交通狀態(tài)特征選擇

      特征變量對(duì)區(qū)分正常交通狀態(tài)和危險(xiǎn)交通狀態(tài)有很大的影響。特征變量如果選取合適,就比較容易對(duì)兩種交通狀態(tài)進(jìn)行分類,而且效果很好;如果選取不好,設(shè)計(jì)分類器將會(huì)很困難。時(shí)間及地點(diǎn)特征是確定包含的,特征選擇的重點(diǎn)在于交通流數(shù)據(jù)的選擇,綜合考慮已有數(shù)據(jù)及前人對(duì)交通流特性的研究,選取速度、占有率、車流量的平均值與標(biāo)準(zhǔn)差6個(gè)變量作為候選特征。另外,時(shí)間尺度Δt對(duì)于分類器設(shè)計(jì)也有影響,Δt的最優(yōu)值也應(yīng)當(dāng)使兩類交通狀態(tài)樣本差別最大。

      2.2.1 特征選擇原理

      首先要確定特征選擇的準(zhǔn)則,即特征的可分性判據(jù),從概念上是希望能夠最有利于區(qū)分兩種狀態(tài),因此利用分類器的錯(cuò)誤率作為準(zhǔn)則是最直接的想法,對(duì)于交通狀態(tài)分類問(wèn)題,分類器在分類時(shí)將決策區(qū)域分為正常交通狀態(tài)Φ1、危險(xiǎn)交通狀態(tài)Φ2兩部分,一維特征情況下,如圖3所示,Φ1為(-∞,t),Φ2為(t,+∞)。

      P(ω1)、P(ω2)為交通狀態(tài)的先驗(yàn)概率,樣本在Φ1中屬于危險(xiǎn)交通狀態(tài)的概率即第一類錯(cuò)誤率為:

      (3)

      樣本在Φ2中屬于正常交通狀態(tài)的概率即第二類錯(cuò)誤率為:

      (4)

      再考慮各自的分布就是平均錯(cuò)誤率:

      圖3 錯(cuò)誤率

      從錯(cuò)誤率計(jì)算過(guò)程可知,該準(zhǔn)則在交通事故實(shí)時(shí)預(yù)測(cè)中不太可行,因?yàn)閮深惤煌顟B(tài)樣本的概率密度函數(shù)未知,計(jì)算錯(cuò)誤率就非常困難,因此要采用一套與錯(cuò)誤率有關(guān)系但又便于計(jì)算的準(zhǔn)則。

      概率密度函數(shù)與錯(cuò)誤率關(guān)系密切,因此可采用基于概率分布的可分性判據(jù),通過(guò)分析交通狀態(tài)特征分布密度的交疊程度來(lái)分析其可分性。聯(lián)合概率密度函數(shù)未知,不能夠計(jì)算出錯(cuò)誤率,但可采用Parzen窗法對(duì)每一維候選特征的概率密度函數(shù)進(jìn)行估計(jì),然后通過(guò)分析不同類交通狀態(tài)同一特征的交疊程度來(lái)選擇特征,具體步驟如圖4所示。

      圖4 特征選擇

      2.2.2Parzen窗密度函數(shù)估計(jì)

      由于對(duì)不同類交通狀態(tài)樣本的分布沒(méi)有充分的了解,無(wú)法事先給出密度函數(shù)的形式。為了能夠利用基于概率分布的可分性判據(jù),需要先采用非參數(shù)估計(jì)方法對(duì)不同類的交通狀態(tài)每一維特征的概率密度函數(shù)進(jìn)行估計(jì)。Parzen窗法即核概率密度函數(shù)估計(jì)方法由于具有很好的效果而被廣泛使用,當(dāng)樣本數(shù)據(jù)N→∞時(shí),該方法估計(jì)的概率密度函數(shù)收斂到真實(shí)的概率分布[11]。本文采用最常用的高斯窗,一維情況下高斯窗[12]表達(dá)式為:

      (6)

      利用高斯窗對(duì)不同交通狀態(tài)6個(gè)候選特征變量分別進(jìn)行估計(jì),則可得到不同特征的概率密度函數(shù)。另外,在不同Δt下對(duì)于候選特征值計(jì)算的結(jié)果是不同的,因此對(duì)不同Δt也要重新估計(jì)其概率密度函數(shù)。最終估計(jì)得到的概率密度函數(shù)為:

      (7)

      其中:zΔt代表不同Δt下速度、占有率、車流量的標(biāo)準(zhǔn)差或平均值特征。因?yàn)槭前凑照=煌顟B(tài)ω1和危險(xiǎn)交通狀態(tài)ω2分別進(jìn)行估計(jì),最終得到的結(jié)果也可以表示為類條件密度p(z|ω1),p(z|ω2)。

      2.2.3 基于概率分布的可分性判據(jù)

      基于概率分布的可分性判據(jù)就是要根據(jù)正常交通狀態(tài)ω1和危險(xiǎn)交通狀態(tài)ω2的概率分布之間的交疊程度來(lái)分析在某一特征下兩類交通狀態(tài)的可分程度。若所有使p(z|ω2)≠0的點(diǎn)都有p(z|ω1)=0,則兩類交通狀態(tài)完全可分;若對(duì)所有特征都有p(z|ω1)=p(z|ω2),則兩類完全不可分。

      交疊程度可用p(z|ω1)、p(z|ω2)之間的距離來(lái)度量,任何距離函數(shù)如果滿足非負(fù)、兩類完全不交疊時(shí)取最大值和兩類分布密度相同時(shí)取零這幾個(gè)條件,都可以作為類分離性的概率距離度量。

      概率概率密度函數(shù)的似然比對(duì)于分類是一個(gè)重要的度量,人們?cè)谒迫槐鹊幕A(chǔ)上定義了以下的散度[13]作為度量:

      (8)

      本文采用散度度量作為概率距離的度量,JD越大,則可分性越好。利用式(8)對(duì)不同Δt下6個(gè)特征的類條件密度分別進(jìn)行計(jì)算,縱向?qū)Ρ瓤纱_定適合的時(shí)間尺度,橫向?qū)Ρ瓤纱_定哪些特征在選定Δt下更能反映不同交通狀態(tài)的差異。

      3 AdaBoost分類器設(shè)計(jì)

      特征變量選擇完成后,就確定了樣本數(shù)據(jù),就可以訓(xùn)練分類器對(duì)兩類交通狀態(tài)進(jìn)行分類。將正常交通狀態(tài)標(biāo)記為0,危險(xiǎn)交通狀態(tài)標(biāo)記為1,選擇AdaBoost分類器對(duì)交通狀態(tài)進(jìn)行分類,該方法基本思想是針對(duì)不同的訓(xùn)練集訓(xùn)練多個(gè)弱分類器,然后將這些分類器組合起來(lái),構(gòu)成一個(gè)最終的強(qiáng)分類器[14]。這種方法不需要精確了解樣本空間分布,能夠自適應(yīng)調(diào)整弱學(xué)習(xí)算法的錯(cuò)誤率。

      本文中采用的弱分類器是分類和回歸決策樹(shù)(ClassificationAndRegressionTree,CART),在訓(xùn)練弱分類器的過(guò)程中,在每次弱學(xué)習(xí)后都重新調(diào)整樣本空間分布,更新所有樣本的權(quán)重,把被正確分類的樣本權(quán)重降低,而增加被錯(cuò)誤分類的樣本權(quán)重。最終分類的結(jié)果是弱分類器的加權(quán)組合,權(quán)值代表該弱分類器的性能[15]。具體流程如下。

      1)初始化訓(xùn)練樣本的權(quán)重:

      ωi=1/N;i=1,2,…,N

      (9)

      2)對(duì)第m次迭代,利用加權(quán)后的樣本構(gòu)造弱分類器fm(x),分類并計(jì)算分類錯(cuò)誤率em,令

      cm=lb ((1-em)/em)

      (10)

      3)更新樣本的權(quán)值,令

      ωi=ωiexp[cml(yi≠fm(xi))]

      (11)

      歸一化使

      (12)

      其中:

      (13)

      4)重復(fù)執(zhí)行2)~3)步直到m達(dá)到最大迭代次數(shù)M。

      5)由M組弱分類器組合得到強(qiáng)分類器h(x),對(duì)于待分類樣本x,分類器的輸出為:

      (14)

      訓(xùn)練好分類器之后就可以對(duì)實(shí)時(shí)的樣本數(shù)據(jù)進(jìn)行分類,決策規(guī)則如式(2)所示,若某一時(shí)刻被決策為危險(xiǎn)交通狀態(tài),則可采取合適的措施預(yù)防事故的發(fā)生。

      在實(shí)際應(yīng)用中,隨著交通數(shù)據(jù)的累積,可以對(duì)最新采集的數(shù)據(jù)處理,更新分類器,實(shí)現(xiàn)動(dòng)態(tài)調(diào)整,提高分類的準(zhǔn)確性。

      4 實(shí)驗(yàn)及結(jié)果

      4.1 數(shù)據(jù)準(zhǔn)備

      本文中采用的是北京二環(huán)路上2014年10月16日到10月26日的交通流數(shù)據(jù),有118個(gè)固定檢測(cè)器,每2min記錄一次;交通事故數(shù)據(jù)包括北京全市范圍內(nèi)事故發(fā)生時(shí)間及地點(diǎn)。

      經(jīng)過(guò)數(shù)據(jù)預(yù)處理,地點(diǎn)匹配等處理后得到412組危險(xiǎn)交通狀態(tài)數(shù)據(jù)及393組正常交通狀態(tài)數(shù)據(jù),每組數(shù)據(jù)包含事故時(shí)間、地點(diǎn)、平均氣溫、天氣情況及該地點(diǎn)駛?cè)腭偝?個(gè)方向的交通流數(shù)據(jù),危險(xiǎn)交通狀態(tài)數(shù)據(jù)包括事故發(fā)生時(shí)及前20min內(nèi)(后文中確定具體的Δt)的交通流數(shù)據(jù),正常交通狀態(tài)數(shù)據(jù)是事故發(fā)生前50 min時(shí)(前人研究證明事故前50 min的交通狀態(tài)與事故關(guān)系很小)及前20 min內(nèi)的交通流數(shù)據(jù)。

      在未進(jìn)行特征選擇前,每組樣本包含時(shí)間,地點(diǎn)坐標(biāo)、平均氣溫、天氣狀況、事故地點(diǎn)四個(gè)方向上22 min內(nèi)的速度、占有率、車流量數(shù)據(jù),共137維特征。歸一化處理后,從兩類數(shù)據(jù)中分別挑選250組數(shù)據(jù)共500組數(shù)據(jù)作為訓(xùn)練樣本,剩余305組作為測(cè)試樣本。

      4.2 特征選擇

      采用Parzen窗估計(jì)方法對(duì)候選特征進(jìn)行概率條件密度估計(jì),然后通過(guò)對(duì)比不同類交通狀態(tài)特征類條件密度的散度距離來(lái)確定合適的時(shí)間尺度及特征。

      候選的交通流特征中包含駛?cè)腭偝?個(gè)方向,每個(gè)方向上包含有6個(gè)變量,另外,預(yù)選的數(shù)據(jù)中包含從2 min到22 min共10個(gè)時(shí)間尺度,對(duì)兩類交通狀態(tài)分別進(jìn)行估計(jì),共進(jìn)行480次,然后計(jì)算不同類交通狀態(tài)的散度距離,如表2所示。

      表2 不同特征最大散度距離

      通過(guò)對(duì)比得知速度、占有率、車流量的標(biāo)準(zhǔn)差特征的散度距離比平均值的更高,表明交通流數(shù)據(jù)平均值在不同交通狀態(tài)下差異性較小,并不能準(zhǔn)確反映不同交通狀態(tài)的特性,因此選擇標(biāo)準(zhǔn)差特征作為特征變量,標(biāo)準(zhǔn)差特征估計(jì)結(jié)果,如圖5所示。

      通過(guò)圖5中趨勢(shì)可知,對(duì)于時(shí)間尺度,4個(gè)方向上速度、占有率、車流量的選擇并不相同:Δt1={2,2,2},Δt2={2,8,6},Δt3={2,2,4},Δt4={2,2,2}。

      對(duì)訓(xùn)練樣本及測(cè)試樣本分別按照上述結(jié)果提取數(shù)據(jù),并計(jì)算標(biāo)準(zhǔn)差特征,使得樣本特征均為時(shí)間、經(jīng)緯度坐標(biāo)、平均氣溫、天氣狀況、4個(gè)方向上速度、占有率、車流量的標(biāo)準(zhǔn)差,共17維特征。

      圖5 不同時(shí)間尺度標(biāo)準(zhǔn)差特征散度距離

      4.3 分類結(jié)果

      訓(xùn)練AdaBoost分類器,對(duì)測(cè)試樣本進(jìn)行分類,測(cè)試樣本中ω1的樣本數(shù)量為143組,ω2樣本數(shù)量為162組,分類結(jié)果如表3所示。

      表3 本文方法的分類結(jié)果

      從表3中可知,隨著分類器最大迭代次數(shù)的變化,分類結(jié)果也不相同,對(duì)于平均值特征,當(dāng)?shù)螖?shù)為3 000時(shí)已經(jīng)收斂,而對(duì)于標(biāo)準(zhǔn)差特征,迭代到3 600時(shí)達(dá)到收斂,且分類結(jié)果較平均值特征要好一些,因此對(duì)于特征的選取是正確的。分類效果最好時(shí),危險(xiǎn)交通狀態(tài)的分類正確率為66%,而正常交通狀態(tài)的正確率為55.9%,總正確率比平均值特征的正確率高7.9%。

      國(guó)內(nèi)的相關(guān)研究中文獻(xiàn)[9]中預(yù)測(cè)精度最高,準(zhǔn)確率為70%,利用文獻(xiàn)[9]中方法對(duì)本文數(shù)據(jù)進(jìn)行處理,結(jié)果如表4所示。

      對(duì)比表3和表4可知,本文方法的分類結(jié)果要優(yōu)于文獻(xiàn)[9]中的方法,且文獻(xiàn)[9]方法用于分類時(shí)出現(xiàn)了誤警率增加而漏報(bào)率下降的情況,說(shuō)明該方法并沒(méi)有選取到合適的特征。

      訓(xùn)練數(shù)據(jù)的增加,訓(xùn)練分類器時(shí)迭代次數(shù)的增加,都會(huì)引起訓(xùn)練時(shí)間的增加,但訓(xùn)練好分類器后,單個(gè)測(cè)試樣本分類結(jié)果的輸出時(shí)間很短,實(shí)驗(yàn)中305個(gè)測(cè)試樣本的輸出時(shí)間平均為15.236s,單個(gè)樣本為49ms,因此在交通事故預(yù)測(cè)的實(shí)際應(yīng)用中,可提前利用可隨時(shí)更新的歷史數(shù)據(jù)訓(xùn)練分類器,預(yù)測(cè)時(shí)只需將計(jì)算后的實(shí)時(shí)采集的交通流等數(shù)據(jù)輸入到分類器中,就可以快速得到預(yù)測(cè)結(jié)果,從而實(shí)現(xiàn)事故的實(shí)時(shí)預(yù)測(cè)。

      表4 文獻(xiàn)[9]方法分類結(jié)果

      5 結(jié)語(yǔ)

      本文通過(guò)對(duì)北京二環(huán)上實(shí)時(shí)采集的交通流數(shù)據(jù)以及相同時(shí)間段內(nèi)記錄的交通事故數(shù)據(jù)進(jìn)行處理,利用分類的方法對(duì)實(shí)時(shí)的交通事故進(jìn)行預(yù)測(cè),重點(diǎn)分析了能夠表征不同交通狀態(tài)的交通流特性,結(jié)果表明在事故地點(diǎn)不同方向上不同時(shí)間尺度上的速度、占有率以及車流量特征對(duì)交通事故發(fā)生的影響不同,且標(biāo)準(zhǔn)差特征要比平均值特征更加能反映不同交通狀態(tài)的差異,分類的正確性也要更高。

      從實(shí)驗(yàn)結(jié)果可知,通過(guò)分類來(lái)預(yù)測(cè)事故的發(fā)生是可行的,并且特征變量的選擇至關(guān)重要,下一步將對(duì)交通狀態(tài)更多的影響因素進(jìn)行分析,將更多的特征加入到交通狀態(tài)特征變量中,更好地提高分類預(yù)測(cè)的準(zhǔn)確性。

      )

      [1]WANGL,ABDEL-ATYM.Predictingcrashesonexpresswayrampswithreal-timetrafficandweatherdata[C]//TRB2015:ProceedingsoftheTransportationResearchBoard94thAnnualMeeting.Washington,DC:TransportationResearchBoardBusinessOffice, 2015: 32-38.

      [2]WANGL,ABDEL-ATYM.Real-timecrashpredictionforexpresswayweavingsegments[J].TransportationResearchPartC, 2015, 61: 1-10.

      [3]YUR,ABDEL-ATYM.Utilizingsupportvectormachineinreal-timecrashriskevaluation[J].AccidentAnalysisandPrevention, 2013, 51: 252-259.

      [4]HOSSAINM,MUROMACHIY.ABayesiannetworkbasedframeworkforreal-timecrashpredictiononthebasicfreewaysegmentsofurbanexpressways[J].AccidentAnalysisandPrevention, 2012, 45(1): 373-381.

      [5]XUC,LIUP,WANGW,etal.Evaluationoftheimpactsoftrafficstatesoncrashrisksonfreeways[J].AccidentAnalysisandPrevention, 2012, 47: 162-171.

      [6]XUC,ANDREWPT,WANGW,etal.Predictingcrashlikelihoodandseverityonfreewayswithreal-timeloopdetectordata[J].AccidentAnalysisandPrevention, 2013, 57: 30-39.

      [7] 林震,楊浩.基于車速的交通事故貝葉斯預(yù)測(cè)[J].中國(guó)安全科學(xué)學(xué)報(bào),2003,13(2):34-36.(LINZ,YANGH.Bayesianpredictionoftrafficaccidentbasedonvehiclespeed[J].ChinaSafetyScienceJournal, 2003, 13(2): 34-36.)

      [8] 秦小虎,劉利,張穎.一種基于貝葉斯網(wǎng)絡(luò)模型的交通事故預(yù)測(cè)方法[J].計(jì)算機(jī)仿真,2005,22(11):230-232.(QINXH,LIUL,ZHANGY.AtrafficaccidentpredictionmethodbasedonBayesiannetworkmodel[J].ComputerSimulation, 2005, 22(11): 230-232.)

      [9]LVYS,TANGSM.Real-timehighwaytrafficaccidentpredictionbasedonthek-nearest neighbor method [C]// ICMTMA 2009: Proceedings of the 2009 International Conference on Measuring Technology and Mechatronics Automation.Piscataway, NJ: IEEE, 2009: 547-550.

      [10] LV Y S, TANG S M.Real-time highway accident prediction based on support vector machines [C]// CCDC’09: Proceedings of the 2009 Chinese Control and Decision Conference.Piscataway, NJ: IEEE, 2009: 4403-4407.

      [11] 賀鄧超,張宏軍,郝文寧.基于Parzen窗條件互信息計(jì)算的特征選擇方法[J].計(jì)算機(jī)應(yīng)用研究,2015,32(5):1387-1390.(HE D C, ZHANG H J, HAO W N.Feature selection based on conditional mutual information computation with Parzen window [J].Application Research of Computers, 2015, 32(5): 1387-1390.)

      [12] 張宏稷,楊健,李延.基于條件熵和Parzen窗的極化SAR艦船檢測(cè)[J].清華大學(xué)學(xué)報(bào)(自然科學(xué)版),2012,52(12):1693-1697.(ZHANG H J, YANG J, LI Y.Ship detection in polarimetric SAR images based on the conditional entropy and Parzen windows [J].Journal of Tsinghua University (Science and Technology), 2012, 52(12): 1693-1697.)

      [13] 張學(xué)工.模式識(shí)別[M].3版.北京:清華大學(xué)出版社,2010:146-150.(ZHANG X G.Pattern Recognition [M].3rd ed.Beijing: Tsinghua University Press, 2010: 146-150.)

      [14] 曹瑩,苗啟廣,劉家辰.AdaBoost算法研究進(jìn)展與展望[J].自動(dòng)化學(xué)報(bào),2013,39(6):745-758.(CAO Y, MIAO Q G, LIU J C.Advance and prospects of AdaBoost algorithm [J].Acta Automatica Sinica, 2013, 39(6): 745-758.)

      [15] 賈潤(rùn)瑩,李靜,王剛.基于AdaBoost和遺傳算法的硬盤(pán)故障預(yù)測(cè)模型優(yōu)化及選擇[J].計(jì)算機(jī)研究與發(fā)展,2014,51(增刊):148-154.(JIA R Y, LI J, WANG G.Optimization and choice of hard drive failure prediction models based on AdaBoost and genetic algorithm [J].Journal of Computer Research and Development, 2014, 51(Suppl.): 148-154.)

      ZHANG Jun, born in 1964, M.S., associate professor.His research interests include intelligent transportation, image processing.

      HU Zhenbo, born in 1992, M.S.candidate.His research interests include intelligent transportation, image processing.

      ZHU Xinshan, born in 1977, Ph.D., associate professor, His research interests include machine learning.

      Real-time traffic accident prediction based on AdaBoost classifier

      ZHANG Jun, HU Zhenbo, ZHU Xinshan*

      (SchoolofElectricalandAutomationEngineering,TianjinUniversity,Tianjin300072,China)

      The traditional road traffic accident forecast mainly uses the historical data, including the number and the loss of traffic accidents, to predict the future trend, however, the traditional method can not reflect the relationship between the traffic accident and real-time traffic characteristics, and it also can not prevent accidents effectively.In order to solve the problems above, a real-time traffic accident prediction method based on AdaBoost classifier was proposed.Firstly, the road traffic states were divided into normal conditions and dangerous conditions, and the real-time collection of traffic flow data was used as the characteristic variable to characterize the different states, so the real-time prediction problem could be converted to a classification problem.Secondly, the Probability Density Function (PDF) of traffic flow characteristics under the two conditions in different time scales were estimated by Parzen window nonparametric estimation method, and the estimated density function was analyzed by the separability criterion based on probability distribution, then the sample data with appropriate characteristic variable and time scale could be determined.Finally, the AdaBoost classifier was trained to classify different traffic conditions.The experimental results show that the correct ratio by using standard deviation of traffic flow characteristics to classify test samples is 7.9% higher than that by using average value.The former can reflect the differences of different traffic states better, and also get better classification results.

      intelligent transportation; accident prediction; classifier; traffic flow characteristic; Parzen window; separability criterion

      2016-07-20;

      2016-09-12。

      張軍(1964—),男,天津人,副教授,碩士,主要研究方向:智能交通、圖像處理; 胡震波(1992—),男,山西忻州人,碩士研究生,主要研究方向:智能交通、圖像處理; 朱新山(1977—),男,遼寧新民人,副教授,博士,主要研究方向:機(jī)器學(xué)習(xí)。

      1001-9081(2017)01-0284-05

      10.11772/j.issn.1001-9081.2017.01.0284

      TP391.4

      A

      猜你喜歡
      交通流分類器交通事故
      不同尋常的交通事故
      預(yù)防交通事故
      BP-GA光照分類器在車道線識(shí)別中的應(yīng)用
      加權(quán)空-譜與最近鄰分類器相結(jié)合的高光譜圖像分類
      結(jié)合模糊(C+P)均值聚類和SP-V-支持向量機(jī)的TSK分類器
      交通流隨機(jī)行為的研究進(jìn)展
      一起高速交通事故院前急救工作實(shí)踐與探討
      路內(nèi)停車對(duì)交通流延誤影響的定量分析
      具有負(fù)壓力的Aw-Rascle交通流的Riemann問(wèn)題
      基于LLE降維和BP_Adaboost分類器的GIS局部放電模式識(shí)別
      龙海市| 鄂伦春自治旗| 桃江县| 正宁县| 吉木萨尔县| 永寿县| 专栏| 偏关县| 普兰店市| 庐江县| 永修县| 开封县| 会泽县| 民勤县| 和田市| 环江| 牟定县| 古蔺县| 太谷县| 巴楚县| 莱阳市| 安图县| 晋州市| 尼勒克县| 平昌县| 曲阜市| 古丈县| 内江市| 黄浦区| 延安市| 大冶市| 会昌县| 玛曲县| 潍坊市| 永顺县| 惠水县| 济阳县| 楚雄市| 贵南县| 红河县| 涞水县|