蘇麗娜,李凡,潘秀,田子立,趙建東
(1.中電建冀交高速公路投資發(fā)展有限公司,石家莊 050000;2.河北省交通規(guī)劃設計研究院有限公司,石家莊 050011;3.北京交通大學 交通運輸學院,北京 100044)
車輛行駛過程中,換道是一種常見交通行為,在很大程度上影響著道路交通安全.相關研究表明,在所有因換道引起的交通事故中,換道決策判斷失誤占據(jù)其中的75%[1].由此可見車輛換道的安全性、可靠性和高效性與交通安全問題有著緊密的關系,對車輛換道行為進行識別已經(jīng)成為微觀交通流領域的重要研究內(nèi)容之一.
當前,針對換道行為的研究大部分是基于視頻數(shù)據(jù)和GPS 數(shù)據(jù)開展的.龍學軍等[2]利用視頻數(shù)據(jù),提出了一種基于視覺的高速道路車輛換道行為預測方法,消除了多個傳感間的數(shù)據(jù)依賴影響.房哲哲[3]基于GPS 數(shù)據(jù),提出一種基于深度學習的換道模型,充分挖掘歷史換道數(shù)據(jù)中存在的信息,進而對換道決策與換道過程進行預測、模擬與分析.Gonzalez等[4]基于歷史GPS 交通數(shù)據(jù),提出了一種求最短路徑的算法并將其應用于大規(guī)模路網(wǎng)中,獲取了精度較好的車輛軌跡.近年來隨著智能交通發(fā)展,毫米波雷達被廣泛應用于交通領域,它在速度檢測、換道輔助、自動駕駛以及多傳感器數(shù)據(jù)融合等應用中逐步發(fā)揮重要作用.雷達檢測器已在國內(nèi)高速公路逐漸安裝應用,其采集的數(shù)據(jù)為換道行為識別提供了數(shù)據(jù)支撐.Mekker等[5]使用激光雷達和聯(lián)網(wǎng)的車輛數(shù)據(jù)來識別擁堵狀態(tài)和排隊時間,然后評估道路對齊對高速公路交通運營的影響,并識別不符合規(guī)范的路段.Serafin等[6]設計了一種基于雷達數(shù)據(jù)的檢測算法,該算法能夠判斷出高速公路上車輛停車和駐車的行為,并提前向其他司機發(fā)出謹慎駕駛、減速慢行的警告.
在換道行為識別模型方面,國內(nèi)外研究人員的研究已經(jīng)有了一定的進展,相關學者從各個角度對換道行為識別進行了建模與分析.劉昀曉等[7]研究了車輛軌跡的關聯(lián)算法,利用K 近鄰聯(lián)合概率將車輛檢測點進行關聯(lián),提高了軌跡跟蹤的精度.戢曉峰等[8]建立了基于支持向量機的貨車移動遮斷下小客車駕駛行為識別模型,對小客車地跟馳、換道和超車這3 種駕駛行為類別進行識別.Gindele等[9]構(gòu)建了動態(tài)貝葉斯網(wǎng)絡濾波模型,識別預測駕駛員的行為軌跡.Dogan等[10]基于駕駛模擬試驗數(shù)據(jù),分別構(gòu)建了前饋神經(jīng)網(wǎng)絡、遞歸神經(jīng)網(wǎng)絡和支持向量機3 種換道識別模型,通過對比分析發(fā)現(xiàn)支持向量機識別效果更理想.為提升模型的識別精度,近年來研究學者逐漸對模型進行改進,袁偉等[11]利用遺傳算法確定懲罰參數(shù)C和核函數(shù)g的最優(yōu)組合,建立了支持向量機識別模型.Zhang等[12]建立了基于BP 神經(jīng)網(wǎng)絡尋優(yōu)的支持向量機回歸自動駕駛決策識別模型.陳亮等[13]設計了一種基于多分類支持向量機的車輛換道識別模型,研究證明該模型能夠很好地識別車輛在換道過程中的行為狀態(tài),為車輛換道階段的研究提供支持.
綜上所述,在高速公路換道行為識別方面,基于雷達數(shù)據(jù)開展研究的成果較少,識別模型也逐漸由單一模型轉(zhuǎn)變?yōu)榻M合模型.因此,基于實際路段的雷達數(shù)據(jù),解決原始數(shù)據(jù)中存在的異常值、軌跡不連續(xù)等問題,結(jié)合粒子群算法以及支持向量機算法構(gòu)建車輛換道行為識別模型實現(xiàn)高速公路車輛的軌跡跟蹤及換道行為識別,使路側(cè)雷達數(shù)據(jù)得到更好的挖掘應用,為智慧高速的交通管理提供技術支撐.
雷達檢測器固定于高速公路龍門架上,能夠檢測雙向六車道及應急車道的車輛運行數(shù)據(jù),檢測路段總長268.92 m,道路示例如圖1 所示.
圖1 車道、坐標及車型的數(shù)據(jù)示例Fig.1 Data example of lane,coordinates and vehicle types
采集的原始數(shù)據(jù)包括時間、目標車輛ID 即檢測到的不同車輛的唯一編號、車輛坐標及速度等字段,X、Y方向分別代表道路的橫向與縱向,其中X=0代表道路中心線,即可以通過X的正負區(qū)分車輛的行駛方向;vx代表橫向速度;vy代表縱向速度;檢測范圍中車道號2、3、4 為左側(cè)道路,車道號5、6、7 為右側(cè)道路,車道號0、1、8、9 代表實線外區(qū)域;車型中1 表示小車,2 表示大車.其中采集到的2019 年12 月18 日的部分數(shù)據(jù)如表1 所示.
表1 雷達數(shù)據(jù)樣例Tab.1 Example of radar data
雷達檢測的是目標物體在某一時刻的位置及運動狀態(tài),并通過檢測算法識別出目標車輛的車型等信息.將不同時刻檢測到的同一車輛串連在一起,這個過程即軌跡的生成,共有3 個步驟.
步驟1:從采集到的數(shù)據(jù)中的第一條開始,記錄下目標車輛ID 以及X、Y坐標,軌跡序列初始化為集合A1.
步驟2:遍歷下一時刻數(shù)據(jù),若找到目標車輛ID相同的一條數(shù)據(jù)則進行下一步,否則重復步驟2.
步驟3:對時間相鄰兩點的位置進行判定,設定條件為
式中:xk為目標車輛在檢測點k的X坐標;yk為目標車輛在檢測點k的Y坐標.
若滿足條件,則運動方向為正向,且不會跨越物理間隔,則認為兩點為同一軌跡,軌跡序列擴充為A1,A2,…,Ak+1;若不滿足條件,則該條軌跡結(jié)束,并從步驟1 重復以上過程,直到數(shù)據(jù)遍歷完,即可初步生成所有車輛軌跡.
軌跡初步生成后存在連接錯誤、位移不符合實際、短軌跡數(shù)量多等問題,因此分別加入空間約束、動力約束、長度約束[14]對無效軌跡進行剔除,并對錯誤軌跡進行分解重構(gòu).
1)空間約束.
首先基于空間限制排除異常,即車輛行駛不可能跨過中央分隔帶,即滿足
2)動力約束.
動力約束指軌跡點的匹配應滿足速度、加速度等現(xiàn)實條件,根據(jù)時間相鄰兩軌跡點的坐標求得速度,根據(jù)3 點求得加速度,檢驗速度和加速度是否小于高速公路環(huán)境下車輛的最大動力條件,即滿足
式中:vk、tk、ak分別為目標車輛在檢測點k的速度、時間、加速度.
3)長度約束.
長度約束主要用于處理短軌跡.正常的一條軌跡是從進入檢測范圍到駛出檢測范圍的一段完整記錄,但從檢測結(jié)果來看,存在很多檢測點少、長度短的異常軌跡.因此為剔除異常軌跡的影響,加入
式中:n為軌跡檢測點數(shù)量;N為判定短軌跡的閾值,根據(jù)統(tǒng)計結(jié)果取N為50.
經(jīng)過3 種約束的處理,異常軌跡得到有效剔除,最終有效軌跡共1 009 條,分別用不同顏色的線條進行表示,處理前后的軌跡對比如圖2 所示.
由圖2 可知,異常軌跡多分布在道路外側(cè),且短軌跡具有明顯的空間特征,主要分布在靠近檢測器的道路外側(cè).這是由于這部分位置與檢測器幾乎平行,雷達角度過大,數(shù)據(jù)精度低,且本身外側(cè)車道的大車比例較多,檢測器易將大車識別為兩輛小汽車,因此會產(chǎn)生較多的異常軌跡.
圖2 處理前后軌跡對比Fig.2 Comparison of trajectories before and after treatment
基于檢測點的軌跡生成算法能夠?qū)囕v目標進行穩(wěn)定地跟蹤,得到較好的運動軌跡,但是并不是所有的軌跡都足夠平滑,在有些場景下由于天氣、檢測結(jié)點不穩(wěn)定等原因,導致原始軌跡平滑性較差、噪聲多,因此采用Savitzky-Golay 濾波器[15]對軌跡進行平滑處理,通過五點三次平滑,每4 個監(jiān)測點取一點構(gòu)成軌跡.平滑效果示例見圖3.
由圖3 可知,車輛正在換道,相比于直線行駛,換道行駛的車輛運動更加復雜,檢測波動性更大,1/4 點軌跡已經(jīng)消除了原始軌跡中鋸齒形的特征,軌跡更加平直,有效減小了位移的波動,但仍然有軌跡不穩(wěn)的趨勢,呈曲率較小的波浪形;而經(jīng)過五點三次平滑處理后,軌跡在換道部分形態(tài)平直,完全消除了波動,更加符合實際場景下的軌跡特征.由整段軌跡的速度方差可知,對軌跡進行平滑處理后,其橫向速度方差降低了58.8%、縱向速度方差降低了31.9%;與實測速度相比,橫向速度方差從4.4 倍縮小至1.81 倍,縱向速度方差從14.4 倍縮小至9.8 倍.由處理結(jié)果可知,車輛速度的異常波動減弱并趨于平穩(wěn),更接近于實際檢測的速度數(shù)據(jù).
圖3 平滑效果示例Fig.3 Schematic diagram of smoothing effect
另外,在雷達監(jiān)測中,常出現(xiàn)將一輛車識別成兩輛車的情況,從而形成了異常短軌跡.為了對異常短軌跡進行匹配,首先對所有生成的軌跡做檢測點個數(shù)的頻數(shù)統(tǒng)計,軌跡檢測點個數(shù)以50 為界,分為短軌跡和長軌跡,需要進行匹配的軌跡即為檢測點少于50 的短軌跡.軌跡的匹配流程分為4 個步驟.
步驟1:輸入異常軌跡.
步驟2:在異常軌跡的第一個檢測點即t0時刻搜索同時出現(xiàn)的軌跡集合.
步驟3:取異常軌跡與各正常軌跡同時存在的時間點集合ts1,ts2,…,tsn.
步驟4:取該時間段內(nèi)的縱坐標向量,通過某種檢驗方法,異常軌跡會與每條備選匹配軌跡都得到一個評價值,在認為具有相似性的條件下,取評價值最優(yōu)的一條軌跡作為異常軌跡的匹配軌跡.
在步驟4 中,檢驗方法分別采用相關系數(shù)、符號秩檢驗(其評價值為p值)和弗雷歇距離,其中前兩種方法的檢驗對象采用縱坐標y和縱向速度vy分別進行軌跡的匹配,結(jié)果如表2 所示.
表2 各種檢驗方法的匹配效果Tab.2 Matching effects of various detection methods
由表2 可知,選取弗雷歇距離的軌跡匹配算法準確率最高,其次是符號秩檢驗,相關系數(shù)的匹配算法匹配率最低.對于檢測對象的選取不同,使用相關系數(shù)評判相似性時,縱坐標的匹配效果更好;而使用符號秩檢驗時采用縱向速度的匹配效果更好.進一步分析兩條關聯(lián)軌跡,大多數(shù)情況下處于勻速狀態(tài),速度波動小,較小波動就會對相關系數(shù)結(jié)果影響很大,因此該方法并不適合用于軌跡的匹配.
弗雷歇距離是對相同時刻兩點坐標的歐式距離進行研究,但雷達檢測的數(shù)據(jù)中,還有一個關鍵的信息是速度,并且速度的精度要高于坐標的精度,因此利用速度信息來改進弗雷歇距離[16],將改進算法應用于軌跡匹配并進行檢驗,軌跡匹配的準確率達到了99.4%,能夠?qū)⒋蟛糠值漠惓6誊壽E匹配到正常軌跡上.通過該軌跡匹配算法,能夠找到異常軌跡出現(xiàn)的原因,且可以輔助修復正常軌跡中坐標、車型等信息,提高了雷達檢測數(shù)據(jù)的可靠性.
由于雷達檢測長度有限,難以檢測到完整的換道過程,且數(shù)據(jù)精度較低,位置波動性大,難以提取轉(zhuǎn)向角度的特征,因此需要對換道軌跡進行特征分析.圖4 是一段典型的換道軌跡和非換道軌跡的檢測數(shù)據(jù),包括橫坐標x、橫向速度vx、縱向速度vy隨時間的變化.
圖4 軌跡特征Fig.4 Trajectory characteristics
由圖4 可知,整段軌跡中換道過程中數(shù)據(jù)產(chǎn)生了較大的變化,主要體現(xiàn)在vx的增大,而其他時刻與正常軌跡無異.為研究整段軌跡中的換道過程,定義換道區(qū)間為:在一段檢測的換道軌跡中,設vx的閾值為vxp,將vx>vxp的時間區(qū)間作為該換道軌跡中的換道區(qū)間.
為提高識別效率并適應數(shù)據(jù)特點,提取換道區(qū)間的算法為:輸入vx的時間序列,從時間的正向和逆向分別搜索到第一個橫向速度超過換道閾值的時刻,將這兩時刻分別記錄為ts、te,其中s、e表示數(shù)據(jù)點的位置,[ts,te]即為換道區(qū)間.
重點挖掘偏向宏觀的軌跡特征,分別從整段軌跡和換道區(qū)間中提取特征,借助換道區(qū)間,分別從角度、速度、位移和持續(xù)時間中提取出5 個特征[17],分別為偏移角度、平均換道橫向速度、平均換道縱向速度、橫向偏移量、換道時長,簡稱為特征1~特征5.
式中:An 為偏移角度;Δx為軌跡在橫向的移動距離;Δy為軌跡在縱向的移動距離;vxc為平均換道橫向速度;vxi為目標車輛在數(shù)據(jù)點i處的橫向速度;vyc為平均換道縱向速度;vyi為目標車輛在數(shù)據(jù)點i處的縱向速度;Δxc為橫向偏移量;xe為目標車輛在數(shù)據(jù)點e處的橫坐標;xs為目標車輛在數(shù)據(jù)點s處的橫坐標;Δtc為換道時長.
對選取的5 個特征值進行頻率分析,將樣本分為正類(換道軌跡)和負類(非換道軌跡),圖5 分別是特征1~特征5 的頻率直方圖和擬合的密度曲線.
由圖5 可知,特征1、2、4、5 的共性在于負類樣本密度最大的點在0 附近,并隨著特征值增大密度逐漸衰減,原因在于非換道軌跡中幾乎不存在換道區(qū)間,而換道軌跡的這幾項特征值均值更大且較為集中,概率密度接近于正態(tài)分布.其中特征1、4、5 的區(qū)分度更高,兩類樣本的重合度小.特征值數(shù)據(jù)如表3 所示.
表3 特征值數(shù)據(jù)Tab.3 Characteristic value data
圖5 特征頻率直方圖Fig.5 Histogram of characteristic frequency
考慮到特征方差較小但數(shù)值較大,為消除各特征值之間量綱的影響,減小各特征值的樣本差異,對樣本的所有特征值歸一化,從而增強特征之間的可比性,以換道時長Δtc為例,對樣本作歸一化處理
支持向量機是一種二分類模型[18],適用于小樣本分類模型.徑向基核函數(shù)(Radial Basis Function,RBF)[19]是SVM 中應用最多的一種核函數(shù),RBF 需要確定2 個參數(shù)γ以及C,本文先選擇網(wǎng)格搜索法和交叉驗證對參數(shù)進行選優(yōu),并分別訓練30 次以消除正類樣本小對結(jié)果的影響[20].考慮到網(wǎng)格搜索法需要遍歷網(wǎng)格中所有的點來尋找最優(yōu)參數(shù),其搜索時間較長.而粒子群算法[21]屬于啟發(fā)式算法,不必遍歷區(qū)間內(nèi)所有的參數(shù)組也能找到全局最優(yōu)解,其優(yōu)勢在于不涉及多參數(shù)調(diào)節(jié).因此,本文又利用粒子群算法構(gòu)建了基于SVM-PSO 的換道行為識別模型,對參數(shù)進一步尋優(yōu).網(wǎng)格搜索法與PSO 算法尋優(yōu)后的參數(shù)γ、C分別設置為(12,0.75)、(16,0.46).
在處理后的1 009 條有效軌跡中,換道軌跡34條,非換道軌跡975 條.由于換道軌跡樣本占比小、樣本分布不均衡,因此采用合成少數(shù)類過采樣技術(Synthetic Minority Oversampling Technique,SMOTE)將換道軌跡數(shù)據(jù)從34條補齊為975條[22].分別以6∶4、7∶3、8∶2 的比例劃分訓練集和測試集,即分別采用1 170 條數(shù)據(jù)、1 364 條數(shù)據(jù)、1 560 條數(shù)據(jù)(其中換道數(shù)據(jù)與非換道數(shù)據(jù)占比為1∶1)對所構(gòu)建的模型進行訓練,并采用剩下的780 條數(shù)據(jù)、586 條數(shù)據(jù)、390 條數(shù)據(jù)對模型進行測試,通過實例驗證對比分析不同的劃分比例對模型預測精度的影響,最終選取訓練集和測試集的劃分比例為8∶2[8],即1 560 條訓練數(shù)據(jù),其中換道數(shù)據(jù)與非換道數(shù)據(jù)均為780 條;390 條測試數(shù)據(jù),其中換道數(shù)據(jù)與非換道數(shù)據(jù)均為195 條.
為評價SVM模型的效果,引入E1、E2、E33 個指標
式中:E1為召回率,代表正確預測為正類的數(shù)量占實際為正類的數(shù)量的比例;E2為精確率,代表正確預測為正類的數(shù)量占預測為正類的數(shù)量的比例;E3為準確率,代表正確預測的數(shù)量占所有樣本總數(shù)(包括正確的正類和負類)的比例;TP 為實際為正類且預測為正類的樣本數(shù);FN 為實際為正類但預測為負類的樣本數(shù);FP 為實際為負類但預測為正類的樣本數(shù);TN 為實際為負類且預測為負類的樣本數(shù).
為驗證所提方法的有效性,選取DBN 模型和LSTM 模型進行對比,其中,DBN 模型的網(wǎng)絡結(jié)構(gòu)設置為5-5-5-2(輸入層神經(jīng)元數(shù)量為5,2 個隱藏層神經(jīng)元數(shù)量均為5,輸出層神經(jīng)元數(shù)量為2),學習率為0.001,迭代次數(shù)為100;LSTM 模型的結(jié)構(gòu)設置為5-7-4-2(輸入層包含5 個神經(jīng)元,第1 隱藏層包含7 個神經(jīng)元,第2 隱藏層包含3 個神經(jīng)元,輸出層包含2 個神經(jīng)元),學習率為0.001,時間步time_step 為20,批量大小batch_size 為40.各模型識別的結(jié)果評價見表4.
表4 訓練結(jié)果對比Tab.4 Comparison of training results %
由表4 可知,5 個特征都能夠用于區(qū)分換道軌跡和非換道軌跡,SVM+網(wǎng)格搜索模型和SVM-PSO模型識別效果較好,DBN 模型和LSTM 模型識別精度較差,說明了SVM 在處理小樣本量數(shù)據(jù)時學習能力強、模型泛化性能好,不易陷入局部最優(yōu).SVM-PSO 模型的準確率和精確率都較高,分別達到了93.59%和97.75%,但召回率較低,原因在于非換道軌跡易于識別,換道軌跡難以識別.實驗結(jié)果也進一步證明了在車輛換道時,有較大的概率會提速或保持高速換道的狀態(tài),推測這種駕駛行為的產(chǎn)生是為了通過換道超越前車,也可能是為了縮短換道時間以減少換道行為對交通流及車輛安全性的影響.
1)根據(jù)車輛運行狀態(tài)初步生成軌跡,并通過多重條件約束對軌跡清洗重構(gòu),采用Savitzky-Golay濾波器對軌跡平滑處理,通過五點三次平滑,橫向速度的方差從4.4 倍縮小至1.81 倍,縱向速度方差從14.4 倍縮小至9.8 倍,車輛速度相較優(yōu)化前更為平穩(wěn),實現(xiàn)了對多車軌跡的跟蹤.
2)針對異常短軌跡,研究了軌跡相似性度量的方法,并提出了一種基于弗雷歇距離的改進軌跡匹配算法,將異常短軌跡與正常軌跡匹配,匹配率達到了99.4%,使軌跡數(shù)據(jù)得到進一步修復.
3)提取軌跡的偏移角度、換道時長、平均換道縱向速度、平均換道橫向速度和橫向位移5個特征,分別利用DBN模型、LSTM模型、SVM模型以及SVM-PSO 模型對換道軌跡進行識別,發(fā)現(xiàn)SVMPSO 模型識別效果最好,準確率達到93.59%,精確率達到97.75%.