• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于WOMDI-Apriori算法的高速公路交通事故風(fēng)險(xiǎn)識(shí)別

      2022-01-17 07:13:56袁振洲王印海王文成孫東冶
      交通工程 2021年6期
      關(guān)鍵詞:置信度交通事故關(guān)聯(lián)

      楊 洋, 袁振洲,王印海,王文成,孫東冶

      (1.北京航空航天大學(xué) 交通科學(xué)與工程學(xué)院,北京 100191;2.美國華盛頓大學(xué)(西雅圖)土木與環(huán)境工程學(xué)院,西雅圖 98195;3.北京交通大學(xué) 交通運(yùn)輸學(xué)院,北京 100044;4.北京市城市規(guī)劃設(shè)計(jì)研究院,北京 100045;5.中國交通通信信息中心 交通安全應(yīng)急信息技術(shù)國家工程實(shí)驗(yàn)室,北京 100011)

      0 引言

      高速公路在給人們生活生產(chǎn)帶來便捷的同時(shí),伴隨的交通事故和安全隱患等問題亦不容忽視.交通事故是由人、車、路、環(huán)境等各維度系統(tǒng)中某個(gè)或多個(gè)維度的指標(biāo)狀態(tài)在運(yùn)行過程中的作用造成,1個(gè)或多個(gè)因素的作用結(jié)果,造成了不同的事故風(fēng)險(xiǎn)與事故形態(tài);換言之,不同的事故風(fēng)險(xiǎn)和形態(tài),其發(fā)生的內(nèi)在機(jī)理各不相同[1];這造就了高速公路交通事故發(fā)生機(jī)理的內(nèi)部因素關(guān)聯(lián)錯(cuò)綜復(fù)雜.

      國內(nèi)外眾多學(xué)者圍繞高速公路安全領(lǐng)域相關(guān)的事故統(tǒng)計(jì)分析、事故頻率或嚴(yán)重程度的預(yù)測(cè)、以及交通安全提升等角度進(jìn)行了大量研究[2-4].高速公路事故致因分析工作中,傳統(tǒng)的事故樹模型以及FP-Tree算法等交通事故致因分析方法便于操作者把握事故整體特征,但無法實(shí)現(xiàn)對(duì)事故多屬性間的關(guān)聯(lián)考慮,也無法對(duì)事故原因進(jìn)行有效的定量化呈現(xiàn)和剖析[5].關(guān)聯(lián)規(guī)則分析也是針對(duì)該問題常用的數(shù)據(jù)挖掘研究方法,其中Apriori關(guān)聯(lián)規(guī)則挖掘算法則是關(guān)聯(lián)規(guī)則分析的主要方法之一[6].該算法能準(zhǔn)確有效地挖掘出2個(gè)或多個(gè)因素間的相關(guān)關(guān)系,但無法量化關(guān)聯(lián)規(guī)則中單一因素的重要度,且數(shù)據(jù)項(xiàng)較多時(shí)計(jì)算量會(huì)成倍增長,運(yùn)算效率降低[7].在傳統(tǒng)的交通事故致因分析和風(fēng)險(xiǎn)識(shí)別的關(guān)聯(lián)規(guī)則挖掘工作中,實(shí)質(zhì)上是對(duì)于各風(fēng)險(xiǎn)因素進(jìn)行了等權(quán)重處理,容易忽略需重點(diǎn)考察的因素,且造成了大量的無用運(yùn)算,影響模型計(jì)算效率.此外,由于關(guān)聯(lián)規(guī)則挖掘算法最早開發(fā)是應(yīng)用于購物籃分析,而有學(xué)者在應(yīng)用關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行交通事故分析時(shí),直接套用傳統(tǒng)的Apriori關(guān)聯(lián)規(guī)則挖掘算法研究交通安全領(lǐng)域的問題,導(dǎo)致了如圖1的結(jié)果中輸出了大量因果顛倒的無效甚至錯(cuò)誤的無序關(guān)聯(lián)規(guī)則[8].

      圖1 某應(yīng)用傳統(tǒng)Apriori算法分析交通事故研究時(shí)造成的錯(cuò)誤結(jié)果

      高速公路交通事故風(fēng)險(xiǎn)識(shí)別和致因分析是一項(xiàng)復(fù)雜的系統(tǒng)工作[9],交通事故各因素間存在錯(cuò)綜復(fù)雜的關(guān)聯(lián)關(guān)系,各因素指標(biāo)對(duì)事故影響的重要程度也各有不同,基于以上分析,為探究高速公路事故發(fā)生機(jī)理,揭露“人、車、路、環(huán)境”與“事故”各維度間以及維度內(nèi)部的關(guān)聯(lián)統(tǒng)計(jì)關(guān)系,克服傳統(tǒng)模型的缺陷和以往研究考慮的不足,本文提出了一種考慮定向約束和指標(biāo)賦權(quán)的多維度交互改進(jìn)的Apriori關(guān)聯(lián)規(guī)則挖掘算法(Weighted Orientated Multiple Dimension Interactive-Apriori WOMDI-Apriori);對(duì)選定路段行了關(guān)聯(lián)規(guī)則挖掘計(jì)算,以期充分揭示高速公路事故發(fā)生機(jī)理,挖掘多維多層事故間的潛在規(guī)律特征,發(fā)現(xiàn)各層因素間的內(nèi)在關(guān)聯(lián),為高速公路交通事故預(yù)測(cè)和風(fēng)險(xiǎn)防控提供有力的理論依據(jù).

      1 樣本結(jié)構(gòu)設(shè)計(jì)

      1.1 研究區(qū)域介紹

      基于美國華盛頓大學(xué)(西雅圖)DriveNet智能交通大數(shù)據(jù)平臺(tái),提取2016全年時(shí)段相關(guān)交通事故數(shù)據(jù),選取了里程長、事故多、安全水平提升不顯著的I-5州際高速公路里程樁號(hào)(Mile Post)的100—200路段作為研究對(duì)象,圖2給出了本文選定的研究路段區(qū)域.

      圖2 美國I-5州際高速公路西雅圖城區(qū)研究路段區(qū)位圖(I-5:MP100-200)

      1.2 原始數(shù)據(jù)集介紹

      樣本數(shù)據(jù)集原始文檔為CSV文件,全州2016年全年共301 779條事故數(shù)據(jù),原始數(shù)據(jù)集共包含481條字段屬性變量信息:事故發(fā)生時(shí)間、地點(diǎn)、碰撞形態(tài)、嚴(yán)重程度、天氣狀態(tài)、道路情況、駕駛?cè)诵畔ⅰ⑸媸萝囕v信息、保險(xiǎn)信息等.篩選后數(shù)據(jù)集I-5的100~200里程路段包含16 361條事故數(shù)據(jù).

      1.3 字段維度聚類劃分

      道路交通事故數(shù)據(jù)屬性具有多層次、多維度特點(diǎn),如果直接將所有事故屬性變量輸入到關(guān)聯(lián)規(guī)則挖掘算法中,一方面由于眾多屬性變量對(duì)算法效率的影響,會(huì)導(dǎo)致算法效率低下,另一方面由于多維數(shù)據(jù)空間的稀疏性,在不同層次的多維數(shù)據(jù)間發(fā)現(xiàn)有價(jià)值的強(qiáng)關(guān)聯(lián)規(guī)則會(huì)比較困難;鑒于此,本文提出了基于多維度交互改進(jìn)關(guān)聯(lián)規(guī)則挖掘算法.為便于利用事故樣本進(jìn)行關(guān)聯(lián)規(guī)則挖掘,結(jié)合高速公路數(shù)據(jù)集中各屬性變量的含義、分類及取值情況對(duì)高速公路交通事故屬性進(jìn)行維度劃分,具體劃分結(jié)構(gòu)如圖3所示,將以上篩選后事故數(shù)據(jù)的字段變量進(jìn)行聚類劃分為“時(shí)間、環(huán)境、人、車、路、事故”6個(gè)維度.

      圖3 高速公路事故數(shù)據(jù)集樣本結(jié)構(gòu)維度設(shè)計(jì)

      2 WOMDI-Apriori關(guān)聯(lián)規(guī)則挖掘算法

      2.1 關(guān)聯(lián)規(guī)則挖掘基本參數(shù)

      關(guān)聯(lián)規(guī)則挖掘是數(shù)據(jù)挖掘的主要技術(shù)之一,也是無指導(dǎo)學(xué)習(xí)系統(tǒng)中挖掘模式的最普通形式.關(guān)聯(lián)規(guī)則挖掘是從大量數(shù)據(jù)中挖掘出描述數(shù)據(jù)項(xiàng)之間相互聯(lián)系的有價(jià)值的知識(shí)[10].

      一條完整的關(guān)聯(lián)規(guī)則可表示為“X?Y”的蘊(yùn)含形式,X是先導(dǎo)項(xiàng),又稱為致因?qū)?,Y 是后繼項(xiàng),又稱為結(jié)果層,關(guān)聯(lián)規(guī)則“X?Y” 為研究中可視且成立的基本條件,其符合預(yù)設(shè)支持度、置信度和提升度的要求,支持度、置信度、提升度是表征關(guān)聯(lián)規(guī)則的3個(gè)重要的參數(shù),其中:

      1)支持度(Sup):數(shù)據(jù)集D中包含的項(xiàng)目集X的事務(wù)數(shù)稱為項(xiàng)目集X的支持?jǐn)?shù),表示為σx,項(xiàng)目集X的支持率(也稱支持度)記為:Support(X),即概率P(X):

      (1)

      式中,{D}為數(shù)據(jù)集D的事務(wù)數(shù),如果Support(X)符合不小于預(yù)設(shè)的最小支持度閾值(min_support),則稱X為頻繁項(xiàng)目集,否則X就為非頻繁項(xiàng)目集.

      項(xiàng)目集(X∪Y)的支持度即為關(guān)聯(lián)規(guī)則X?Y的支持率,實(shí)質(zhì)上為D中事務(wù)包含(X∪Y)的比例,即為概率P(X∪Y),(X∪Y)發(fā)生的頻率,記:Support(X?Y):

      P(X∪Y)

      (2)

      2)置信度(Conf):2個(gè)定義在I和D上如X?Y的關(guān)聯(lián)規(guī)則,其置信度表示的意義為“滿足條件X事務(wù)的同時(shí)也滿足條件Y”,X?Y的關(guān)聯(lián)規(guī)則的置信度就是在包含項(xiàng)集X的前提下,同時(shí)還包含項(xiàng)集Y的條件概率P(Y|X),記作:Confidence(X?Y).

      Confidence(X?Y)=P(Y|X)=

      (3)

      式中,X?I,Y?I,X∩Y=?.

      3)提升度:提升度用以表征先導(dǎo)項(xiàng)和后繼項(xiàng)的關(guān)聯(lián)程度,為了避免偽強(qiáng)關(guān)聯(lián)規(guī)則的干擾,防止無效關(guān)聯(lián)規(guī)則出現(xiàn)在最終結(jié)果中,特此引入提升度指標(biāo),將該指標(biāo)也作為有效關(guān)聯(lián)規(guī)則的判斷條件:

      (4)

      提升度越大表征項(xiàng)集X和項(xiàng)集Y的關(guān)聯(lián)程度越高.一般我們認(rèn)為只有Lift大于1的關(guān)聯(lián)規(guī)則,才是有效的強(qiáng)關(guān)聯(lián)規(guī)則,此時(shí)X和Y正相關(guān);若提升度Lift<1,說明X和Y沒有關(guān)聯(lián)度或?yàn)榛コ忭?xiàng)集,此類非有效關(guān)聯(lián)規(guī)則,在結(jié)果中不予考慮.

      4)最小支持度和最小置信度閾值與強(qiáng)關(guān)聯(lián)規(guī)則

      在建模過程中,用戶可指定最小支持度(記為min_support)和最小置信度(記為min_confidence),前者描述了關(guān)聯(lián)規(guī)則需滿足的最低重要程度,后者規(guī)定了關(guān)聯(lián)規(guī)則必須滿足的最低可靠性,且min_support∈(0,1],min_confidence∈(0,1].

      數(shù)據(jù)集D在項(xiàng)目集I上滿足最小支持度閾值和最小信任度閾值,同時(shí)提升度Lift大于1的關(guān)聯(lián)規(guī)則就稱為有價(jià)值的強(qiáng)關(guān)聯(lián)規(guī)則.

      2.2 主客觀聯(lián)合賦權(quán)模型

      為盡可能消除主觀賦權(quán)法和客觀賦權(quán)法在權(quán)重賦值過程中各自存在的權(quán)值偏差,采用了一種基于離差平方和的組合賦權(quán)法[11-12],將IAHP法所得主觀權(quán)重和粗糙集模型所得的客觀權(quán)重進(jìn)行集成優(yōu)化,用以計(jì)算對(duì)應(yīng)指標(biāo)的實(shí)際考慮權(quán)重:

      (5)

      步驟1:首先確定待評(píng)估對(duì)象集和與之對(duì)應(yīng)的指標(biāo)集.設(shè)X為對(duì)象集合,記為X={x1,x2,…,xn},A={a1,a2,…,an}為指標(biāo)集合,a(x)為對(duì)象x在屬性a上的值,指標(biāo)值可為離散值也可為連續(xù)值.

      步驟3:利用粗糙集原理求得客觀屬性權(quán)重.屬性集C={c1,c2,…,cn}為將步驟1中確定的評(píng)估指標(biāo)集,域U={u1,u2,u3,…,un}為對(duì)應(yīng)時(shí)間的各種可能原因的事件集合,每條事故記錄在分項(xiàng)指標(biāo)上的取值視為對(duì)象ut的1條信息,ut={c1t,c2t,…,cnt},并將其進(jìn)行離散化處理,建立離散化二維信息表,依照式(5)計(jì)算得到權(quán)重向量ω*.

      2.3 WOMDI-Apriori算法構(gòu)建

      通過對(duì)Apriori關(guān)聯(lián)規(guī)則挖掘算法的計(jì)算過程和結(jié)果輸出形式的分析,需對(duì)Apriori關(guān)聯(lián)規(guī)則挖掘算法進(jìn)行改進(jìn)和優(yōu)化,以使得算法能更好地適應(yīng)高速公路事故風(fēng)險(xiǎn)識(shí)別的問題.

      從3個(gè)角度對(duì)算法進(jìn)行了改進(jìn)優(yōu)化:①對(duì)算法進(jìn)行了有序定向的規(guī)則關(guān)聯(lián)形式約束,使面向購物籃領(lǐng)域應(yīng)用范圍的傳統(tǒng)Apriori關(guān)聯(lián)規(guī)則挖掘算法能兼容適用于高速公路事故風(fēng)險(xiǎn)識(shí)別的問題;②通過主客觀賦權(quán)模型對(duì)所有字段變量進(jìn)行指標(biāo)權(quán)重計(jì)算,并基于權(quán)重優(yōu)化結(jié)果,提出了“相對(duì)支持度”“相對(duì)置信度”“相對(duì)提升度”的概念;③打破傳統(tǒng)的“致因先導(dǎo)項(xiàng)?后果后繼項(xiàng)”的交通事故挖掘輸出方式,引入多維度交互關(guān)聯(lián)的思路,不僅考慮“致因先導(dǎo)向?后果后繼項(xiàng)”的關(guān)聯(lián)關(guān)系,更是從致因?qū)泳S度部的自相關(guān)(先導(dǎo)項(xiàng)),以及事故結(jié)果維度內(nèi)部自相關(guān)(后繼項(xiàng))的角度,探究高速公路各維度間的關(guān)聯(lián)規(guī)則.

      圖4給出了本文提出的考慮定向約束的多維度交互改進(jìn)Apriori算法模型示意,改進(jìn)模型的具體模型表達(dá)式如下:

      圖4 改進(jìn)的Apriori關(guān)聯(lián)規(guī)則挖掘算法模型

      全映射關(guān)聯(lián)規(guī)則表示為:

      {Li1,Li2,…,Lin}?{Rj1,Rj2,…,Rjm}

      (6)

      先導(dǎo)項(xiàng)自相關(guān)關(guān)聯(lián)規(guī)則表示為:

      {La1,La2,…,Lan}?{Lb1,Lb2,…,Lbm}

      (7)

      后繼項(xiàng)自相關(guān)關(guān)聯(lián)規(guī)則表示為:

      {Rc1,Rc2,…,Rcn}?{Rd1,Rd2,…,Rdm}

      (8)

      任一關(guān)聯(lián)規(guī)則的相對(duì)支持度(Relative-Support:R-Sup)表示為:

      (9)

      任一關(guān)聯(lián)規(guī)則的相對(duì)置信度(Relative-Confidence:R-Conf)表示為:

      (10)

      任一關(guān)聯(lián)規(guī)則的相對(duì)提升度(Relative-Lift:R-Lift)表示為:

      (11)

      式中,{L1,L2,…,Ln}∈X,X為所有約束鎖定在先導(dǎo)項(xiàng)(LHS)的變量集合,在本文研究中,X為交通事故的所有致因?qū)幼侄螌傩?;{R1,R2,…,Rn}∈Y,Y為所有約束鎖定在后繼項(xiàng)(RHS)的變量集合,在本文的研究中Y為交通事故的所有事故結(jié)果層字段屬性.Ak為計(jì)算結(jié)果中的任一關(guān)聯(lián)規(guī)則,ω1,ω2,…,ωn為關(guān)聯(lián)規(guī)則Ak的先導(dǎo)項(xiàng)與后繼項(xiàng)中所有的n個(gè)元素的主客觀權(quán)重系數(shù),同時(shí)且有:

      (12)

      圖5給出了考慮有序定向約束和指標(biāo)賦權(quán)的多維度交互Apriori關(guān)聯(lián)規(guī)則挖掘算法(Weighted Orientated Multiple Dimension Interactive-Apriori:WODMI-Apriori)的算法設(shè)計(jì)流程.

      圖5 WODMI-Apriori關(guān)聯(lián)規(guī)則挖掘算法設(shè)計(jì)步驟

      2.4 基于關(guān)聯(lián)規(guī)則挖掘的高速公路交通事故風(fēng)險(xiǎn)識(shí)別流程

      基于WODMI-Apriori算法的高速公路事故風(fēng)險(xiǎn)識(shí)別流程如下:

      步驟1:樣本結(jié)構(gòu)化設(shè)計(jì):按照事故屬性變量的維度與層次劃分,確定待分析的屬性變量,提取相關(guān)屬性變量數(shù)據(jù)集;

      步驟2:主客觀聯(lián)合賦權(quán)法優(yōu)化指標(biāo)權(quán)重:利用IAHP-粗糙集理論聯(lián)合的權(quán)重計(jì)算模型,計(jì)算樣本數(shù)據(jù)集中各字段變量的權(quán)值;

      步驟3:設(shè)置關(guān)聯(lián)規(guī)則挖掘中的定向約束:根據(jù)具體挖掘中考慮的維度與指向,進(jìn)行各字段變量在先導(dǎo)項(xiàng)與后繼項(xiàng)的約束集合;

      步驟4:參數(shù)設(shè)置:根據(jù)不同關(guān)聯(lián)分析背景要求以及數(shù)據(jù)形式,確定最小支持度(min-sup)、最小置信度(min-conf)、以及提升度(lift)的閾值;

      步驟5:WOMDI-Apriori關(guān)聯(lián)規(guī) 則挖掘:依照?qǐng)D5中的WOMDI-Apriori算法流程,首先求得滿足最小支持度閾值的頻繁項(xiàng)集,然后根據(jù)最小置信度閾值和提升度閾值約束條件,求得并輸出符合要求的關(guān)聯(lián)規(guī)則;

      步驟6:基于步驟3中的指標(biāo)權(quán)重優(yōu)化結(jié)果,求得各規(guī)則的相對(duì)支持度(R-Sup)、相對(duì)置信度(R-Conf)、以及相對(duì)提升度(R-Lift)的值,重新排序并篩選出有價(jià)值的強(qiáng)關(guān)聯(lián)規(guī)則;

      步驟7:關(guān)聯(lián)規(guī)則解讀,以及取得的相關(guān)成果在高速公路安全管理中的應(yīng)用.

      3 算例分析

      3.1 全映射交通事故致因關(guān)聯(lián)規(guī)則挖掘

      全映射定向關(guān)聯(lián)規(guī)則,即為鎖定先導(dǎo)項(xiàng)(LHS)和后繼項(xiàng)(RHS)的前提下,以LHS?RHS形式的定向關(guān)聯(lián)為約束條件,挖掘得到的關(guān)聯(lián)規(guī)則;其中,輸入數(shù)據(jù)庫時(shí),在該部分計(jì)算中,本文建立的模型規(guī)定LHS中有且只有致因?qū)泳S度的變量,RHS中有且只有事故層維度的變量.

      3.1.1 改進(jìn)算法的精度提升校驗(yàn)

      首先,進(jìn)行各維度數(shù)據(jù)的輸入;然后,設(shè)置初始閾值,考慮研究區(qū)域交通事故的主要特征,經(jīng)過人工調(diào)試,設(shè)置最小支持度閾值min_sup=0.25,最小置信度閾值min_conf=0.35;在設(shè)置相同參數(shù)閾值條件下,分別應(yīng)用原始Apriori關(guān)聯(lián)規(guī)則挖掘算法和WOMDI-Apriori關(guān)聯(lián)規(guī)則挖掘算法對(duì)輸入的數(shù)據(jù)集進(jìn)行關(guān)聯(lián)規(guī)則挖掘,挖掘結(jié)果匯總?cè)鐖D6.

      圖6 原始Apriori模型和改進(jìn)的Apriori模型算法結(jié)果對(duì)比

      計(jì)算結(jié)果顯示:未加載定向約束的原始Apriori關(guān)聯(lián)規(guī)則挖掘算法在研究區(qū)域路段共挖掘到21 930條關(guān)聯(lián)規(guī)則,而應(yīng)用本文提出的WOMDI-Apriori模型,挖掘結(jié)果只輸出了符合條件的3 783條關(guān)聯(lián)規(guī)則.也就是說,如果未對(duì)算法進(jìn)行優(yōu)化和改進(jìn),將至少產(chǎn)生18 147條無效的關(guān)聯(lián)規(guī)則,改進(jìn)的WOMDI-Apriori模型比傳統(tǒng)Aprori模型在本文研究路段結(jié)果中的計(jì)算精確度提高了82.7%.

      3.1.2 參數(shù)標(biāo)定

      圖7給出了挖掘結(jié)果的參數(shù)分布散點(diǎn)圖,圖中橫坐標(biāo)表征相對(duì)支持度(R-Sup),縱坐標(biāo)表征相對(duì)置信度(R-Conf),顏色深淺為相對(duì)提升度(R-Lift)大小.

      圖7 交通事故全映射關(guān)聯(lián)規(guī)則挖掘結(jié)果分布

      通過關(guān)聯(lián)規(guī)則的散點(diǎn)圖可發(fā)現(xiàn)一部分關(guān)聯(lián)規(guī)則的相對(duì)支持度介于0.2~0.7之間,另外一部分介于0.85~0.95之間,說明在所有符合閾值條件規(guī)則中高頻規(guī)則和低頻規(guī)則并存;從置信度指標(biāo)來看,大部分關(guān)聯(lián)規(guī)則的相對(duì)置信度在0.5~0.95之間,另有少數(shù)規(guī)則的相對(duì)置信度大于0.95,但低于0.8相對(duì)置信度的區(qū)域,其顏色較淺,這意味著這部分關(guān)聯(lián)規(guī)則的相對(duì)提升度不足,有可能是項(xiàng)集間關(guān)聯(lián)程度不夠甚至是無效的關(guān)聯(lián)規(guī)則,說明本次建模的初始置信度閾值設(shè)置較小,上調(diào)為0.8更有利于有效規(guī)則的篩選;同時(shí),對(duì)于提升度指標(biāo)來說,通過觀察散點(diǎn)圖中的顏色,有大約一半關(guān)聯(lián)規(guī)則的相對(duì)提升度小于1,說明有很大部分規(guī)則未能滿足提升度大于1的約束條件,即為無效的關(guān)聯(lián)規(guī)則.因此,需重新調(diào)整模型參數(shù)進(jìn)一步分析篩選有效關(guān)聯(lián)規(guī)則.基于以上討論,最小支持度保持不變,最小置信度閾值設(shè)為0.8,最終得到符合約束條件(相對(duì)支持度sup>0.25,相對(duì)置信度conf>0.8)的關(guān)聯(lián)規(guī)則共有2 351條.圖8給出了參數(shù)調(diào)整修正后的挖掘結(jié)果.

      圖8 交通事故全映射關(guān)聯(lián)規(guī)則挖掘結(jié)果分布(參數(shù)校準(zhǔn))

      3.1.3 有價(jià)值強(qiáng)關(guān)聯(lián)規(guī)則的提取

      針對(duì)關(guān)聯(lián)規(guī)則挖掘的2 351條有效關(guān)聯(lián)規(guī)則,進(jìn)行有條件排序,分別按照相對(duì)支持度(R-Sup)和相對(duì)置信度(R-Conf)由大到小進(jìn)行排序,同時(shí)順延剔除相對(duì)提升度(R-Lift)小于1的規(guī)則,提取的輸出結(jié)果如表1和表2所示.

      表1 相對(duì)支持度排序的全映射關(guān)聯(lián)規(guī)則

      表2 相對(duì)置信度排序的全映射關(guān)聯(lián)規(guī)則

      3.2 事故維度自相關(guān)關(guān)聯(lián)規(guī)則挖掘

      事故維度自相關(guān)定向關(guān)聯(lián)規(guī)則,即為鎖定先導(dǎo)項(xiàng)(LHS)和后繼項(xiàng)(RHS)都僅為事故層維度變量的前提下,以LHS?RHS形式的定向關(guān)聯(lián)為約束條件,挖掘得到的關(guān)聯(lián)規(guī)則;模型規(guī)定LHS和RHS中皆有且只有事故維度的字段變量,模型具體形式為:{車輛行駛描述(Vehicle Movement)+涉事機(jī)動(dòng)車數(shù)量(Vehicles Involved)+事故形態(tài)(Collision Type)}?{人員傷亡情況(Injury Type)+車輛損壞情況(Damage)}.模型示意圖如圖9所示.

      圖9 事故維度自相關(guān)挖掘模型

      通過各維度數(shù)據(jù)輸入、參數(shù)閾值調(diào)整過程得最終挖掘結(jié)果如圖10所示.

      圖10 事故維度自相關(guān)挖掘結(jié)果

      在此對(duì)挖掘結(jié)果進(jìn)行考慮R-sup和R-conf的雙約束篩選(即相對(duì)支持度和相對(duì)置信度都處于較高水平的關(guān)聯(lián)規(guī)則),提取3個(gè)區(qū)域類型高速公路中的有價(jià)值強(qiáng)關(guān)聯(lián)規(guī)則,將關(guān)聯(lián)規(guī)則的參數(shù)控制范圍設(shè)置為:R-sup(0.45~0.65)、R-conf(0.75~0.90),提取得表4的強(qiáng)關(guān)聯(lián)規(guī)則.

      3.3 結(jié)果分析與討論

      1)算法精度提升校驗(yàn)過程中發(fā)現(xiàn),改進(jìn)的WOMDI-Apriori模型比傳統(tǒng)Aprori模型在本文研究路段結(jié)果中的計(jì)算精確度提高了82.7%.由此可見,針對(duì)此類高速公路事故高風(fēng)險(xiǎn)識(shí)別的研究問題,直接套用傳統(tǒng)的Apriori算法,將對(duì)結(jié)果造成一定混淆,因此本文對(duì)Apriori算法進(jìn)行的優(yōu)化改進(jìn)是十分必要的.

      2)表1全映射事故致因挖掘的高相對(duì)支持度強(qiáng)關(guān)聯(lián)規(guī)則結(jié)果顯示,通過對(duì)結(jié)果中先導(dǎo)項(xiàng)的觀察,多可見道路濕滑(Roadway Surface Condition=Wet)和惡劣天氣(Weather=Raining,Roadway Surface Condition=Snow/Slush)導(dǎo)致的交通事故,即:在高速公路行車過程中,下雨道路濕滑或惡劣天氣下導(dǎo)致的事故數(shù)量比較多.

      3)表1全映射事故致因挖掘的高相對(duì)支持度強(qiáng)關(guān)聯(lián)規(guī)則結(jié)果顯示,通過觀察結(jié)果中的先導(dǎo)項(xiàng),選取路段的事故多以工作日(Week Day=Mon)、白天(Lighting Condition=Daylight)、通勤(On Duty=Yes)、小客車事故(Vehicle Style=Sedan 4 Dr)為主,且基本路段(MAINLINE)和匝道(RAMP)事故兼存,得出的該規(guī)律符合日常認(rèn)知.就事故形態(tài)而言,選定路段以側(cè)向剮蹭(Collision Type=Sideswipes LEFT side of other vehicle)和追尾事故(Collision Type=Strikes REAR END of other vehicle)為主,涉事車輛多為兩輛,可能的解釋是西雅圖城區(qū)交通流密集且車速往往較慢,而且多是通勤客流為主的時(shí)段中,高事故頻率條件下造成的結(jié)果.

      4)針對(duì)表1中的關(guān)聯(lián)規(guī)則“{Age=27~45, Gender=Male, Vehicle Style=Sedan 4 Dr}?{Damage=No}”,其相對(duì)支持度為0.874 4,相對(duì)置信度0.955 6,相對(duì)提升度為1.175 4,說明該條規(guī)則相比于其他關(guān)聯(lián)規(guī)則而言,其規(guī)則可信程度和項(xiàng)集間的相關(guān)性都比較高,也符合日常認(rèn)知,即:27~45歲開小轎車的男性駕駛員造成了很多交通事故,同時(shí)這些事故多數(shù)并未造成車輛嚴(yán)重?fù)p壞.

      5)表2全映射事故致因挖掘的高相對(duì)置信度強(qiáng)關(guān)聯(lián)規(guī)則結(jié)果顯示,在選定的高速公路路段中,位于高相對(duì)置信度(R-Conf)前3的關(guān)聯(lián)規(guī)則中未發(fā)現(xiàn)有工作日早晚高峰的事故,雖然基于常識(shí),該時(shí)間段的交通事故頻率會(huì)相對(duì)比較高的,但并不能說明其發(fā)生的條件概率(相對(duì)置信度)就一定處于較高的水平.

      6)雖然數(shù)據(jù)顯示位于HOV車道的事故發(fā)生頻率相對(duì)較低,但高相對(duì)置信度輸出結(jié)果中的第一條關(guān)聯(lián)規(guī)則顯示,在HOV車道上,一旦有車輛非法停車(Stopped in Traffic-Legally Standing),且駕駛員年齡相對(duì)較大時(shí)(Age>45),即使是在白天,也將會(huì)大概率發(fā)生較為嚴(yán)重的交通事故(Damage=Yes, Airbag Status=Not Ejected, Injury Type=Serious Injury),對(duì)于此類交情況應(yīng)格外注意.

      7)基于表3中事故維度自相關(guān)挖掘結(jié)果中提取的強(qiáng)關(guān)聯(lián)規(guī)則可知,選定高速公路區(qū)域路段的事故涉事機(jī)動(dòng)車(Vehicles Involved)多以2車及以上為主,多見追尾(Strikes REAR END of other vehicle)和側(cè)向剮蹭(Was struck on LEFT side at angle by other vehicle)事故形態(tài),并偶有發(fā)生(相對(duì)支持度處于較低水平)車輛起火(Non-Collision FIRE)的單車事故,且該選定的城區(qū)路段事故發(fā)生頻率較高(高相對(duì)支持度),但事故后果相對(duì)較輕.

      表3 事故維度自相關(guān)挖掘結(jié)果有價(jià)值強(qiáng)關(guān)聯(lián)規(guī)則提取結(jié)果

      3.4 基于關(guān)聯(lián)規(guī)則挖掘結(jié)果的高速公路交通安全提升建議

      輸出結(jié)果中,高相對(duì)支持度關(guān)聯(lián)規(guī)則表征該類關(guān)聯(lián)規(guī)則發(fā)生的頻率較高,高相對(duì)置信度關(guān)聯(lián)規(guī)則表征該類關(guān)聯(lián)規(guī)則,一旦先導(dǎo)項(xiàng)事件發(fā)生,有大概率導(dǎo)致后繼項(xiàng)事故發(fā)生(條件概率高).針對(duì)不同類別的關(guān)聯(lián)規(guī)則挖掘,應(yīng)從不同的角度進(jìn)行分析研究,并予以不同的處置方法.

      在風(fēng)險(xiǎn)防控過程中,對(duì)于高相對(duì)支持度的關(guān)聯(lián)規(guī)則,應(yīng)著眼于先導(dǎo)項(xiàng)中的信息,采取必要措施盡可能限制或避免先導(dǎo)項(xiàng)的發(fā)生;而對(duì)于高相對(duì)置信度的關(guān)聯(lián)規(guī)則中描述的情況,一旦發(fā)現(xiàn)其先導(dǎo)項(xiàng)發(fā)生,應(yīng)著重注意,并盡可能控制并預(yù)防后繼項(xiàng)事故的發(fā)生.

      4 結(jié)論

      高速公路事故發(fā)生機(jī)理中的各因素關(guān)聯(lián)錯(cuò)綜復(fù)雜,為了能識(shí)別高速公路的事故征兆風(fēng)險(xiǎn)因子,克服傳統(tǒng)方法在研究此類問題時(shí)的缺陷,針對(duì)性地對(duì)高速公路交通事故預(yù)測(cè)以及安全管理提供可靠的理論依據(jù),本文選取了穿越西雅圖城區(qū)I-5州際高速公路作為研究路段,提出了一種考慮定向約束和指標(biāo)賦權(quán)的多維度交互改進(jìn)的Apriori關(guān)聯(lián)規(guī)則挖掘算法(WODMI-Apriori),應(yīng)用該算法對(duì)選取的路段進(jìn)行了全映射事故致因角度和事故維度自相關(guān)角度的關(guān)聯(lián)規(guī)則挖掘,基于計(jì)算結(jié)果,進(jìn)行了關(guān)聯(lián)規(guī)則解讀并提出了相應(yīng)的風(fēng)險(xiǎn)控制措施,主要結(jié)論如下:

      1)基于關(guān)聯(lián)規(guī)則挖掘算法的高速公路交通事故風(fēng)險(xiǎn)識(shí)別方法,可較為準(zhǔn)確地識(shí)別高速公路運(yùn)行過程中的事故征兆風(fēng)險(xiǎn)因子、分析高速公路交通事故致因;同時(shí),改進(jìn)的WOMDI-Apriori算法還可獲取維度交互角度和事故維度自相關(guān)角度的關(guān)聯(lián)規(guī)則,進(jìn)而揭示更多的潛在高速公路交通事故發(fā)生內(nèi)在機(jī)理.

      2)通過關(guān)聯(lián)規(guī)則挖掘算法識(shí)別到的高速公路事故征兆風(fēng)險(xiǎn)因子,可做為諸如交通事故預(yù)警預(yù)測(cè)或風(fēng)險(xiǎn)防控等后續(xù)研究工作的理論基礎(chǔ).

      3)提出的WOMDI-Apriori算法在對(duì)選定區(qū)域的高速公路進(jìn)行交通事故關(guān)聯(lián)規(guī)則挖掘時(shí),其計(jì)算結(jié)果相較于未加載定向約束的傳統(tǒng)Apriori算法的精度提高了82.7%.這表明對(duì)算法的改進(jìn)十分必要,且本文提出的改進(jìn)算法能更好地適應(yīng)高速公路交通事故風(fēng)險(xiǎn)識(shí)別的研究.

      4)在進(jìn)行高速公路行車安全提升工作時(shí),針對(duì)挖掘結(jié)果中不同類型的強(qiáng)關(guān)聯(lián)規(guī)則,應(yīng)當(dāng)采取不同的應(yīng)對(duì)策略,可取得較好的交通事故風(fēng)險(xiǎn)防控效果.

      猜你喜歡
      置信度交通事故關(guān)聯(lián)
      硼鋁復(fù)合材料硼含量置信度臨界安全分析研究
      不同尋常的交通事故
      預(yù)防交通事故
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      正負(fù)關(guān)聯(lián)規(guī)則兩級(jí)置信度閾值設(shè)置方法
      奇趣搭配
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      一起高速交通事故院前急救工作實(shí)踐與探討
      置信度條件下軸承壽命的可靠度分析
      軸承(2015年2期)2015-07-25 03:51:04
      多假設(shè)用于同一結(jié)論時(shí)綜合置信度計(jì)算的新方法?
      三门县| 松江区| 白朗县| 北川| 易门县| 望奎县| 平泉县| 石首市| 阿图什市| 海盐县| 尖扎县| 永修县| 洱源县| 广水市| 丘北县| 保亭| 康定县| 德州市| 富源县| 乳山市| 平罗县| 苏尼特左旗| 通道| 延津县| 米脂县| 望奎县| 牙克石市| 勃利县| 茂名市| 梓潼县| 武清区| 许昌县| 潮州市| 富顺县| 湾仔区| 凌源市| 郧西县| 延寿县| 大竹县| 水城县| 莲花县|