孫 倩, 郭忠印
(同濟(jì)大學(xué) 道路與交通工程教育部重點(diǎn)實(shí)驗(yàn)室, 上海 201804)
交通事件包括的內(nèi)容很多,如交通事故、故障停車、道路施工和天氣情況等,它將直接導(dǎo)致某段道路通行能力減弱,從而引起交通擁堵等現(xiàn)象.據(jù)統(tǒng)計(jì),在美國(guó)交通事件引起的擁堵占城市快速路總擁堵事件的50%~75%[1].FHWA(Federal Highway Administration)的報(bào)告指出,由交通事故、故障停車等交通事件引起的公路延誤占交通擁堵總延誤的1/3[2].
目前已有很多自動(dòng)交通事件檢測(cè)(AID)算法.隨著智能交通系統(tǒng)的發(fā)展,城市內(nèi)間斷交通流環(huán)境道路漸漸能夠?qū)崿F(xiàn)攝像頭全覆蓋,因此本文主要關(guān)注高速公路和城市快速路等連續(xù)交通流環(huán)境道路的AID算法.
早期開(kāi)發(fā)的AID算法主要有標(biāo)準(zhǔn)偏差算法[3]、加利福尼亞(Ca)算法[4]和基于突變理論的McMaster算法[5]等.隨著交通流理論和機(jī)器學(xué)習(xí)的發(fā)展,越來(lái)越多的算法涌現(xiàn)出來(lái),這些算法主要分為2個(gè)方向:一個(gè)方向是基于機(jī)器學(xué)習(xí),通過(guò)輸入不同參數(shù)訓(xùn)練分類模型以評(píng)價(jià)是否發(fā)生交通事件,如神經(jīng)網(wǎng)絡(luò)模型[6-7]、二分類支持向量機(jī)模型[8-9]、多分類支持向量機(jī)模型[10]、決策樹(shù)模型[11]、貝葉斯模型[12]和核極限學(xué)習(xí)機(jī)模型[13]等;另一個(gè)方向是預(yù)測(cè)法,即通過(guò)已有數(shù)據(jù)對(duì)未來(lái)狀態(tài)進(jìn)行預(yù)測(cè)并與實(shí)測(cè)數(shù)據(jù)進(jìn)行比較,以判斷是否發(fā)生交通事件,如基于突變理論的交通事故離群挖掘算法[14]、事件影響指數(shù)檢測(cè)算法[15]和交通狀態(tài)變異指數(shù)法[16]等.此外,不同的AID算法對(duì)不同條件的適應(yīng)性不同,因此一些算法的組合和集成類模型被提出,如以因子分析與聚類分析為手段的基于多個(gè)AID算法的決策級(jí)融合方法[17]、基于時(shí)間序列方法和機(jī)器學(xué)習(xí)方法的組合AID算法[18]和多個(gè)樸素貝葉斯分類器的AID算法[19]等.現(xiàn)有算法普遍存在計(jì)算復(fù)雜、泛化能力不強(qiáng)、容易出現(xiàn)過(guò)擬合等問(wèn)題,其表現(xiàn)方式?jīng)]有傳統(tǒng)算法直觀,并且需要具體路段大量事件與非事件歷史數(shù)據(jù)的支持,影響了模型的推廣及應(yīng)用.
信號(hào)處理技術(shù)中互相關(guān)常常應(yīng)用于時(shí)延估計(jì)[20]和定位[21],其原理為利用聲波在空氣中直線傳播和遇到障礙物反射抵達(dá)接收端的時(shí)間差進(jìn)行時(shí)延估計(jì)和障礙物定位.通過(guò)計(jì)算2次聲音抵達(dá)接收端獲得的信號(hào)互相關(guān)系數(shù)能夠分析2組信號(hào)不同相位條件下的相似程度,相關(guān)性最高點(diǎn)對(duì)應(yīng)的相位即為2次聲音抵達(dá)接收端的時(shí)差.交通流有與聲波類似的性質(zhì).本文以此為基礎(chǔ),論證了將上、下游采集到的交通信息等價(jià)為2組離散時(shí)間信號(hào)的合理性.通過(guò)計(jì)算互相關(guān)系數(shù)分析交通流變化,并據(jù)此提出基于離散數(shù)字信號(hào)相關(guān)性的AID算法.通過(guò)仿真模擬不同交通流條件下的事件場(chǎng)景,與加利福尼亞算法進(jìn)行對(duì)比評(píng)價(jià).
離散信號(hào)是離散自變量的函數(shù),當(dāng)自變量為時(shí)間n時(shí),叫做離散時(shí)間信號(hào),它表現(xiàn)為在時(shí)間上按一定次序排列的不連續(xù)的一組數(shù)的集合,故也稱為時(shí)域離散信號(hào),用x(n)表示.
相關(guān)是研究2個(gè)信號(hào)之間,或一個(gè)信號(hào)和其位移后的相關(guān)性,前者叫做信號(hào)互相關(guān),后者叫做信號(hào)自相關(guān),本文主要討論的是信號(hào)互相關(guān).離散時(shí)間信號(hào)x(n)和y(n)的互相關(guān)函數(shù)
Rxy(τ)=∑x(n)y(n+τ)
(1)
根據(jù)廣義瑞利公式和互能譜定義推導(dǎo)可知,互相關(guān)函數(shù)Rxy(τ)和互能譜Wxy(k)是一對(duì)傅里葉變換.因此,在計(jì)算Rxy(τ)時(shí),通過(guò)對(duì)離散時(shí)間信號(hào)x(n)和y(n)進(jìn)行離散傅里葉變換得到頻譜密度X(k)和Y(k),計(jì)算公式如下所示:
式中:N為信號(hào)長(zhǎng)度.
對(duì)互能譜進(jìn)行傅里葉變換得到互相關(guān)函數(shù)Rxy(τ),如下所示:
Wxy(k)=X(k)Y*(k)
Rxy(τ)=f(Wxy(k))
式中:*表示共軛轉(zhuǎn)置運(yùn)算;f表示傅里葉變換運(yùn)算.最終得到互相關(guān)系數(shù)
互相關(guān)系數(shù)ρxy(τ)為一個(gè)0~1的序列,它表示2個(gè)離散時(shí)間信號(hào)相位差為τ時(shí)的相關(guān)性,越接近1表示越相關(guān).
將上、下游采集到的交通信息數(shù)據(jù)轉(zhuǎn)化為離散時(shí)間信號(hào),交通信息數(shù)據(jù)為通過(guò)采集區(qū)的車輛速度.轉(zhuǎn)化為離散時(shí)間信號(hào)的方法是:選取固定周期,當(dāng)周期內(nèi)有一個(gè)數(shù)據(jù),該數(shù)據(jù)的值即為離散時(shí)間信號(hào)該時(shí)間位置上的幅值;當(dāng)周期內(nèi)有2個(gè)或以上數(shù)據(jù),該數(shù)據(jù)的平均值即為離散時(shí)間信號(hào)該時(shí)間位置上的幅值;當(dāng)周期內(nèi)沒(méi)有數(shù)據(jù),幅值為零.現(xiàn)選取G109某兩相鄰截面的調(diào)研數(shù)據(jù),該數(shù)據(jù)采集時(shí)間內(nèi)未發(fā)生交通事件,兩截面距離約800 m.由于交通量較少,周期取70 s.離散時(shí)間信號(hào)分布如圖1所示.橫坐標(biāo)時(shí)間序列代表第n個(gè)周期,縱坐標(biāo)代表第n個(gè)周期內(nèi)的速度平均值,可見(jiàn)兩截面的離散時(shí)間信號(hào)分布圖存在一定的相似性,但截面2的幅值普遍比截面1低.
a 截面1
b 截面2圖1 離散時(shí)間信號(hào)分布Fig.1 Distribution of discrete time signal
根據(jù)第1.1節(jié)的離散時(shí)間信號(hào)相關(guān)性理論,分別計(jì)算1組離散時(shí)間信號(hào)的自相關(guān)系數(shù)和2組離散時(shí)間信號(hào)的互相關(guān)系數(shù),如圖2所示.橫坐標(biāo)為2段離散事件信號(hào)的相位差,縱坐標(biāo)為該相位差下信號(hào)的相關(guān)系數(shù).從圖2可以看到非常明顯的峰值.圖2a中,離散時(shí)間序列相位差τ=0時(shí)自相關(guān)系數(shù)為1,代表信號(hào)完全相同;圖2b中,離散時(shí)間信號(hào)相位差τ=1時(shí)2組信號(hào)存在最大相似性,其所對(duì)應(yīng)的數(shù)據(jù)為同一組交通流,根據(jù)截面距離和交通流速可知結(jié)果可信.
a 截面1自相關(guān)系數(shù)
b 兩截面互相關(guān)系數(shù)圖2 相關(guān)系數(shù)分布Fig.2 Distribution of correlation coefficient
由此可見(jiàn),將交通信息數(shù)據(jù)轉(zhuǎn)化為離散時(shí)間信號(hào)并進(jìn)行相關(guān)性計(jì)算,可以有效定位同一組交通流并計(jì)算其相似性.
取圖2b中的峰值為互相關(guān)系數(shù)F,根據(jù)信號(hào)處理理論,互相關(guān)系數(shù)F越接近1表示上、下游交通流越相似,即交通流在該路段越穩(wěn)定,但是該系數(shù)本身沒(méi)有實(shí)際物理意義.隨著時(shí)間的發(fā)展,交通流相似性會(huì)越來(lái)越低,互相關(guān)系數(shù)F也會(huì)越來(lái)越小,最終成為背景噪聲,因此本節(jié)研究互相關(guān)系數(shù)F的主要影響因素.
將不同的上、下游截面距離L和離散時(shí)間信號(hào)重疊長(zhǎng)度N0繪制成多條信號(hào)長(zhǎng)度和互相關(guān)系數(shù)的關(guān)系線,如圖3所示.可以發(fā)現(xiàn),當(dāng)L和N0一定時(shí),互相關(guān)系數(shù)F與離散時(shí)間信號(hào)長(zhǎng)度N的倒數(shù)成線性相關(guān),且通過(guò)橫軸同一點(diǎn),可用下式表示:
F=k(1/N-a)
式中:k為斜率,其大小與L和N0有關(guān);a為待定參數(shù).
當(dāng)互相關(guān)系數(shù)F過(guò)小時(shí)會(huì)成為背景噪聲,因此互相關(guān)系數(shù)F的大值端更受關(guān)注,即斜率k與L和N0的關(guān)系更受關(guān)注.取不同的截面距離和重疊信號(hào)長(zhǎng)度繪制斜率的等值線圖(見(jiàn)圖4),發(fā)現(xiàn)截面距離和重疊信號(hào)長(zhǎng)度可以互補(bǔ),以使斜率達(dá)到足夠大,但并不是沒(méi)有極限.重疊信號(hào)長(zhǎng)度不可能大于信號(hào)總長(zhǎng)度,即當(dāng)上、下游截面距離固定,重疊信號(hào)長(zhǎng)度等于信號(hào)總長(zhǎng)度時(shí),互相關(guān)系數(shù)F達(dá)到最大.根據(jù)這個(gè)性質(zhì),以保證檢測(cè)效果為目的,可以確定上、下游截面容許距離.
圖3 信號(hào)長(zhǎng)度與互相關(guān)系數(shù)關(guān)系Fig.3 Relationship between signal length and correlation coefficient
圖4 斜率等值線Fig.4 Contour map of slop
由于事件條件難以在實(shí)際交通環(huán)境下采集到,并且難以在完全相同交通環(huán)境下采集不同事件的交通狀態(tài),因此為便于比較,采用了仿真手段獲取交通數(shù)據(jù).利用Vissim進(jìn)行仿真,時(shí)長(zhǎng)6 h,設(shè)定交通事件發(fā)生在第4 h內(nèi).交通事件將導(dǎo)致部分路段通行能力下降.事件持續(xù)時(shí)間分別為1 h、30 min、10 min和0 min(非事件條件),采集點(diǎn)上、下游距離1 km,根據(jù)第2.1節(jié)的分析結(jié)果可以通過(guò)控制N0避免互相關(guān)系數(shù)F過(guò)小,保證檢測(cè)效果.
以事件持續(xù)時(shí)間30 min為例,繪制整小時(shí)內(nèi)上、下游交通離散時(shí)間信號(hào)的分布(見(jiàn)圖5).從圖5可以看到,在4 h時(shí)間段上信號(hào)互相關(guān)系數(shù)峰值明顯小于其他時(shí)間段,即該時(shí)間范圍內(nèi)交通流出現(xiàn)比較大的擾動(dòng),發(fā)生了交通事件.
從圖5可知,1 h檢測(cè)顯然過(guò)于粗糙,難以及時(shí)反映數(shù)據(jù)變化,因此采用持續(xù)更新的方式監(jiān)測(cè)離散時(shí)間信號(hào)最大互相關(guān)系數(shù).當(dāng)交通流出現(xiàn)擾動(dòng)時(shí),互相關(guān)系數(shù)F所在的時(shí)間序列相位差可能出現(xiàn)擾動(dòng),因此同時(shí)監(jiān)測(cè)最大互相關(guān)系數(shù)所在的時(shí)間序列相位差變化,具體流程如圖6所示.根據(jù)流程繪制事件持續(xù)時(shí)間分別為1 h、30 min、10 min和0 min的相關(guān)性發(fā)展圖和擾動(dòng)發(fā)展圖(見(jiàn)圖7、8).相關(guān)性發(fā)展圖代表離散時(shí)間信號(hào)互相關(guān)系數(shù)隨時(shí)間的波動(dòng)情況,擾動(dòng)發(fā)展圖代表互相關(guān)系數(shù)最高點(diǎn)對(duì)應(yīng)的時(shí)間序列相位差隨時(shí)間的波動(dòng)情況.從圖7、8可以非常明顯地看到,發(fā)生交通事件后相關(guān)性迅速下降,時(shí)間序列相位差也發(fā)生擾動(dòng),并且事件持續(xù)時(shí)間越久,相關(guān)性發(fā)展得越低.因此,當(dāng)前期平穩(wěn)狀態(tài)下相關(guān)性開(kāi)始持續(xù)走低或時(shí)間序列相位差產(chǎn)生明顯變化時(shí),判斷交通事件發(fā)生.
圖5 6 h相關(guān)系數(shù)分布Fig.5 Distribution of correlation coefficient in 6 h
圖6 自動(dòng)交通事件檢測(cè)流程Fig.6 Flow chart of AID
圖7 相關(guān)性發(fā)展圖Fig.7 Development of correlation
圖8 擾動(dòng)發(fā)展圖Fig.8 Development of disturbance
AID算法性能的評(píng)價(jià)指標(biāo)包括交通事件檢測(cè)率(DR)、誤報(bào)率(FAR)和平均檢測(cè)時(shí)間(MTTR).檢測(cè)率和誤報(bào)率用于評(píng)價(jià)AID算法的檢測(cè)性能,平均檢測(cè)時(shí)間能夠評(píng)價(jià)算法的檢測(cè)效率.3個(gè)指標(biāo)存在互相制約的關(guān)系.
首先利用Vissim分別模擬單向兩車道低飽和交通(500 veh·h-1)、中飽和交通(2 500 veh·h-1)和高飽和交通(3 500 veh·h-1)環(huán)境下非交通事件50次,以此作為基準(zhǔn),確定判別事件發(fā)生的互相關(guān)系數(shù)及相位差閾值.閾值決定了檢測(cè)率和誤報(bào)率,交通事件檢測(cè)率越高,誤報(bào)率也越高(見(jiàn)圖9).高飽和交通環(huán)境下交通事件容易造成堵車或連環(huán)交通事故,因此取較高的檢測(cè)率犧牲了較低的誤報(bào)率;反之,低飽和交通環(huán)境下取相對(duì)較低的檢測(cè)率獲得較低的誤報(bào)率,節(jié)約人力.經(jīng)過(guò)對(duì)比,3種環(huán)境下的互相關(guān)系數(shù)和相位差閾值分別確定為(0.36, 0)、(0.57, -10)和(0.68, -22).
圖9 誤報(bào)率和檢測(cè)率關(guān)系Fig.9 Relationship between FAR and DR
分別模擬3種交通環(huán)境下交通事件條件和非交通事件條件各100次,分別采用加利福尼亞算法和基于離散時(shí)間信號(hào)相關(guān)性檢測(cè)算法進(jìn)行評(píng)價(jià),評(píng)價(jià)結(jié)果如表1所示.
在低飽和交通環(huán)境下,本文算法檢測(cè)率達(dá)97.1%,而加利福尼亞算法僅84.1%;在中飽和交通環(huán)境下,本文算法檢測(cè)率略微下降(96.5%),而加利福尼亞算法升至92.7%;在高飽和交通環(huán)境下,2種算法檢測(cè)率基本持平,在96.0%左右.綜合來(lái)看,本文算法略高于加利福尼亞算法,由此可以判斷,本文算法比加利福尼亞算法具有更加良好的環(huán)境適應(yīng)性.在平均檢測(cè)時(shí)間方面,隨著交通飽和度的上升,采集數(shù)據(jù)量的增加能夠縮短時(shí)間步長(zhǎng),從而相關(guān)性發(fā)展圖和擾動(dòng)發(fā)展圖更新速率提高,本文算法的檢測(cè)效率也持續(xù)提升.
表1 加利福尼亞算法和本文算法的檢測(cè)效果Tab.1 Performance of Ca algorithm and the proposed algorithm
從表1可以看到,本文提出的算法在低飽和交通環(huán)境下性能遠(yuǎn)好于加利福尼亞算法.隨機(jī)抽取一個(gè)低飽和交通環(huán)境下發(fā)生交通事件的樣本,為方便比較,將數(shù)據(jù)歸一化處理,如圖10所示.由圖10可知:由于加利福尼亞算法過(guò)度依賴上、下游交通占有率,當(dāng)交通飽和度很低時(shí)發(fā)生交通事件,即便降低了路段的通行能力,但較小的交通量并不足以造成占有率發(fā)生非常明顯的變化;本文算法主要依賴于上、下游交通流分布形式,發(fā)生交通事件會(huì)導(dǎo)致?lián)Q車道等行為比例升高,相當(dāng)于使交通流重新分布,從而導(dǎo)致相關(guān)性急劇下降,交通流的相位差發(fā)生波動(dòng).
圖10 低飽和交通環(huán)境下參數(shù)變化Fig.10 Variation of parameters under low saturated traffic environment
以同樣方法繪制交通接近飽和時(shí)參數(shù)對(duì)比圖,如圖11所示.從圖11可以看到,加利福尼亞算法在交通量較大的情況下明顯比小交通量環(huán)境下表現(xiàn)好,說(shuō)明交通事件引起的通行能力降低影響到了上、下游占有率的分布.車輛受到空間限制,即使重分布,高飽和交通環(huán)境交通流分布形式也較低飽和交通環(huán)境時(shí)選擇性小,因此相關(guān)性發(fā)展圖沒(méi)有低飽和交通環(huán)境時(shí)明顯,但在時(shí)間序列上仍然有非常明顯的差異,相位差的波動(dòng)性則表現(xiàn)更加穩(wěn)健.
圖11 高飽和交通環(huán)境下參數(shù)變化Fig.11 Variation of parameters under high saturated traffic environment
根據(jù)信號(hào)處理理論,提出了基于離散時(shí)間信號(hào)相關(guān)性的AID算法.將交通信息數(shù)據(jù)轉(zhuǎn)化為離散時(shí)間信號(hào)并進(jìn)行相關(guān)性計(jì)算,可以有效定位同一組交通流并計(jì)算其相似性.通過(guò)對(duì)照分析解釋了互相關(guān)系數(shù)的特征,并采用仿真數(shù)據(jù)進(jìn)行性能驗(yàn)證.結(jié)果表明,采用基于離散時(shí)間信號(hào)相關(guān)性的AID算法在低飽和交通環(huán)境下表現(xiàn)依然穩(wěn)健,具有可視性且易于理解.在未來(lái)研究中將采集實(shí)際高速公路的交通事件條件數(shù)據(jù)對(duì)算法性能進(jìn)行進(jìn)一步驗(yàn)證.