楊磊
摘 要:【目的】為了能準(zhǔn)確識(shí)別出他車的切入意圖,同時(shí)解決由爆發(fā)性增長(zhǎng)的無(wú)標(biāo)簽行車數(shù)據(jù)所引起的識(shí)別模型落地難的問(wèn)題?!痉椒ā勘狙芯刻岢鲆环N雙層無(wú)監(jiān)督的車輛切入意圖識(shí)別模型,該模型由聚類模塊及意圖識(shí)別模塊組成。聚類模塊采用高斯混合模型對(duì)基于NGSIM構(gòu)造的無(wú)標(biāo)簽數(shù)據(jù)集進(jìn)行聚類分析,并挖掘其內(nèi)在的數(shù)據(jù)關(guān)系,從而獲取切入時(shí)不同駕駛行為對(duì)應(yīng)的特征標(biāo)簽。意圖識(shí)別模塊用于識(shí)別車輛切入意圖,該模塊是基于LSTM搭建的。該模塊先結(jié)合聚類模塊來(lái)獲取特征標(biāo)簽及無(wú)標(biāo)簽數(shù)據(jù)集,構(gòu)造新的有標(biāo)簽訓(xùn)練集及測(cè)試集,然后將其輸入到神經(jīng)網(wǎng)絡(luò)中進(jìn)行訓(xùn)練與測(cè)試?!窘Y(jié)果】該模型在基于真實(shí)路況的NGSIM數(shù)據(jù)集上表現(xiàn)較好,對(duì)駕駛意圖的識(shí)別準(zhǔn)確率達(dá)到97%,精度較高。【結(jié)論】該模型在無(wú)標(biāo)簽數(shù)據(jù)上具有較好的識(shí)別能力。
關(guān)鍵詞:自動(dòng)駕駛;意圖識(shí)別;高斯混合模型;長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
中圖分類號(hào):U463? ? ? ? ? ? ? ? ? ? ? 文獻(xiàn)標(biāo)志碼:A? ? ? ? ? ? ? ? ?文章編號(hào):1003-5168(2023)06-0028-05
DOI:10.19968/j.cnki.hnkj.1003-5168.2023.06.005
Research on Vehicle Entry Intent Recognition Based on GMM-LSTM
YANG Lei
(School of Mechatronics and Vehicle Engineering, Chongqing Jiaotong University,Chongqing 400074,China)
Abstract: [Purposes] In order to accurately identify the cut-in intention of other vehicles and solve the problem of difficult implementing of identification model caused by the explosive growth of unlabeled driving data. [Methods] This study proposes a two-layer unsupervised vehicle cut-in intention recognition model, which consists of a clustering module and an intention recognition module. The clustering module uses the Gaussian mixture model to cluster the unlabeled data set based on NGSIM, and excavates its internal data relationship to obtain the feature labels corresponding to different driving behaviors. The intention recognition module is used to identify the vehicle entry intention, which is based on LSTM. The module first combines the clustering module to obtain feature labels and unlabeled data sets, constructs new labeled training sets and test sets, and then inputs them into the neural network for training and testing. [Findings] The model performed well on the NGSIM dataset based on real road conditions, and the recognition accuracy of driving intention reached 97 %. [Conclusions] The model has good recognition ability on unlabeled data.
Keywords: automatic drive; intent identification; Gaussian mixture models; LSTM
0 引言
他車切入是一種常見(jiàn)的駕駛行為,其對(duì)自車的行駛狀態(tài)會(huì)產(chǎn)生影響,尤其是在人機(jī)混駕的場(chǎng)景中,自動(dòng)駕駛汽車能否精準(zhǔn)高效地識(shí)別出他車的切入意圖,是自動(dòng)駕駛汽車能否實(shí)現(xiàn)安全行駛的關(guān)鍵,也是當(dāng)前自動(dòng)駕駛汽車研究的熱點(diǎn)之一[1]。
目前,國(guó)內(nèi)外對(duì)駕駛意圖的識(shí)別可大致分為兩類。第一類是通過(guò)建立運(yùn)動(dòng)學(xué)或動(dòng)力學(xué)模型來(lái)對(duì)車輛的駕駛意圖進(jìn)行識(shí)別[2-4]。該類模型對(duì)短時(shí)駕駛意圖的識(shí)別有較高的準(zhǔn)確率,而車輛運(yùn)動(dòng)是復(fù)雜的非線性過(guò)程,高度簡(jiǎn)化的運(yùn)動(dòng)學(xué)或動(dòng)力學(xué)模型在識(shí)別長(zhǎng)時(shí)駕駛意圖時(shí),其準(zhǔn)確率較低,精度較差。第二類是基于數(shù)據(jù)驅(qū)動(dòng)的駕駛意圖識(shí)別,通常采用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法來(lái)識(shí)別駕駛意圖。劉興亮等[5]提出一種基于支持向量機(jī)的駕駛意圖識(shí)別模型,其在高速公路場(chǎng)景中對(duì)目標(biāo)車輛駕駛意圖識(shí)別的準(zhǔn)確率較高。劉志強(qiáng)等[6]提出一種基于馬爾科夫及支持向量機(jī)的雙層識(shí)別模型,在相同場(chǎng)景中,其識(shí)別的準(zhǔn)確率要優(yōu)于單層模型。張海倫等[7]提出一種基于雙層連續(xù)隱馬爾可夫模型及貝葉斯分類器的識(shí)別模型,能在他車切入的前期階段準(zhǔn)確識(shí)別出其駕駛意圖。上述的傳統(tǒng)機(jī)器學(xué)習(xí)模型因其具有較高的準(zhǔn)確率、較好的實(shí)時(shí)性,從而得到研究者的廣泛關(guān)注,但傳統(tǒng)的機(jī)器學(xué)習(xí)模型同樣存在高維度場(chǎng)景表現(xiàn)不佳、時(shí)序捕捉能力較差、訓(xùn)練參數(shù)難以確定等問(wèn)題。為了解決上述問(wèn)題,研究者將目光投向基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型,如長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)等。
車輛行駛是一連串行為的集合,通常表現(xiàn)為與時(shí)間相關(guān)的數(shù)據(jù)序列,而長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)能很好地捕捉該類型數(shù)據(jù)內(nèi)部之間的復(fù)雜特征關(guān)系,能精確提取出連續(xù)駕駛行為的時(shí)間關(guān)系。因此,其在對(duì)他車駕駛意圖識(shí)別領(lǐng)域中得到較為廣泛的應(yīng)用。季學(xué)武等[8]、梁凡[9]、閆偉等[10]使用長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)來(lái)識(shí)別其他車輛的駕駛意圖,在不同場(chǎng)景和條件下,對(duì)他車駕駛意圖有較高的識(shí)別準(zhǔn)確率。同時(shí),考慮到人工標(biāo)注的困難及對(duì)數(shù)據(jù)錯(cuò)標(biāo)帶來(lái)的誤差,以聚類算法為代表的無(wú)監(jiān)督學(xué)習(xí)方法在駕駛意圖識(shí)別中的應(yīng)用得到重視[11-13]。因此,本研究結(jié)合無(wú)監(jiān)督學(xué)習(xí)的高斯混合模型(GMM)及長(zhǎng)短記憶神經(jīng)網(wǎng)絡(luò)(LSTM),建立一種基于NGSIM數(shù)據(jù)集的無(wú)監(jiān)督駕駛意圖識(shí)模型,從而實(shí)現(xiàn)快速高效地識(shí)別出他車的切入意圖。
1 數(shù)據(jù)預(yù)處理及參數(shù)提取
車輛在直線道路上行駛時(shí),通常有車道保持和車輛切入兩類行為,如圖1所示。在圖1中,R為自車,T為自車的左前車,S為自車的右前車。當(dāng)車輛正常直線行駛時(shí),其橫向運(yùn)動(dòng)只會(huì)發(fā)生較小的變化,沒(méi)有太大的行為波動(dòng)。而在車輛切入他道的過(guò)程中,其橫向運(yùn)動(dòng)會(huì)出現(xiàn)較為明顯的變化趨勢(shì)。因此,為了區(qū)分車輛行為是直線行駛、左切入、右切入這三種行為的哪一種,用其橫向上的運(yùn)動(dòng)變化趨勢(shì)進(jìn)行表征,可用其橫向運(yùn)動(dòng)變化的相關(guān)物理量的波動(dòng)來(lái)表示駕駛行為的變化。
車輛的切入意圖是一連串駕駛行為的集合。一次完整的切入意圖是由大量的軌跡數(shù)據(jù)點(diǎn)構(gòu)成的,而選擇合理的數(shù)據(jù)點(diǎn)特征決定了模型的準(zhǔn)確率??紤]到橫向物理量的多樣性,本研究選擇具有特征變化明顯的側(cè)向速度和側(cè)向位移作為對(duì)應(yīng)軌跡點(diǎn)的特征參數(shù)。因此,先從NGSIM數(shù)據(jù)集中提取以這兩種參數(shù)為特征參數(shù)構(gòu)成的軌跡簇。NGSIM數(shù)據(jù)集是由美國(guó)FHWA搜集的高速公路行車數(shù)據(jù),包含US101、I-80等道路上的所有車輛在一個(gè)時(shí)間段內(nèi)的車輛行駛狀況,其對(duì)應(yīng)的路段如圖2所示。
由于該數(shù)據(jù)集包含的數(shù)據(jù)量龐大、參數(shù)較多,因此要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。先從數(shù)據(jù)集中的單條換道軌跡中提取出一條完整軌跡,由于一次完整的車輛切入行為通常是在5 s內(nèi)完成的,因此提取目標(biāo)為車輛在20 s內(nèi)的完整行駛軌跡,然后利用滑動(dòng)時(shí)窗將行駛軌跡切分成以5 s為基本單位的行為序列集合。
對(duì)數(shù)據(jù)集中的單條切入軌跡,要提取切入起始點(diǎn)及該時(shí)刻對(duì)應(yīng)的特征參數(shù)。為了避免車輛橫向位移的細(xì)微變化對(duì)切入起始點(diǎn)的干擾,以側(cè)向位移和行駛軌跡的曲率作為車輛是否切入的判斷標(biāo)準(zhǔn)。對(duì)單次完整的切入過(guò)程,其切入的起點(diǎn)、終點(diǎn)處的橫向位移和軌跡曲率的計(jì)算見(jiàn)式(1)。
式中:y(n)為車輛切入起點(diǎn)處的橫向位置;y(n+t)為車輛切入終點(diǎn)處的橫向位置,二者之差即為車輛在切入過(guò)程中的側(cè)向位移,結(jié)合真實(shí)的切入過(guò)程,本研究以側(cè)向位移等于車道寬作為切入結(jié)束的衡量標(biāo)準(zhǔn)之一;t為切入時(shí)間;L為車道寬度,在NGSIM數(shù)據(jù)集中,車道寬為3.75 m;w為補(bǔ)償值,考慮到測(cè)量誤差等多種因素的影響,可能出現(xiàn)軌跡曲率皆為0的情況,側(cè)向位移偏離車道寬的情況,進(jìn)而影響數(shù)據(jù)的抓取,此時(shí)要對(duì)側(cè)向位移進(jìn)行補(bǔ)償;θ(n)為車輛位于切入起點(diǎn)時(shí)車輛的行駛軌跡曲率;θ(n+t)為車輛位于切入終點(diǎn)時(shí)車輛的行駛軌跡曲率。當(dāng)起點(diǎn)與終點(diǎn)的行駛軌跡曲率相等時(shí),可認(rèn)為車輛停止切入,并進(jìn)入目標(biāo)車道,開(kāi)始直線行駛,二者是否都為0也是切入結(jié)束與否的衡量標(biāo)準(zhǔn)之一。
通過(guò)公式(1)可限制切入過(guò)程中起始點(diǎn)、終止點(diǎn)處的橫向位移和軌跡曲率,并根據(jù)限制對(duì)軌跡數(shù)據(jù)進(jìn)行分類,左右切入序列的始末位置是根據(jù)橫向坐標(biāo)來(lái)確定的。本研究從NGSIM數(shù)據(jù)集中共提取到左切入軌跡101條、右切入軌跡288條、直線行駛軌跡437條。
在獲取到行駛軌跡簇后,考慮到數(shù)據(jù)樣本序列過(guò)長(zhǎng)會(huì)導(dǎo)致模型的訓(xùn)練難度加大,因此要對(duì)20 s的完整行駛軌跡進(jìn)行切分,最終完成數(shù)據(jù)集的構(gòu)建,并按7:3的比例將數(shù)據(jù)集劃分成訓(xùn)練集及測(cè)試集,從而完成數(shù)據(jù)集的構(gòu)建準(zhǔn)備工作,并開(kāi)始下一步的模型搭建工作。
2 切入意圖識(shí)別模型
2.1 高斯混合模型的搭建
高斯混合模型是一種無(wú)監(jiān)督的聚類模型,其能很好地捕捉到數(shù)據(jù)隱藏的關(guān)聯(lián)性,可將無(wú)標(biāo)簽的數(shù)據(jù)根據(jù)其內(nèi)在的相互關(guān)聯(lián)特征劃分為不同的類別簇。
由于行駛軌跡是由連續(xù)的軌跡點(diǎn)構(gòu)成的,因此高斯混合模型聚類的對(duì)象是行駛軌跡中的一系列軌跡點(diǎn)。在聚類前,先對(duì)數(shù)據(jù)集中的相關(guān)軌跡點(diǎn)進(jìn)行可視化處理,如圖3所示。
由圖3可知,三種行駛軌跡存在軌跡點(diǎn)重疊的情況。采用高斯混合模型,一方面是為了給無(wú)監(jiān)督數(shù)據(jù)添加標(biāo)簽,另一方面也是為了識(shí)別這些重疊的軌跡點(diǎn)屬于哪種行駛狀態(tài),從而降低人工標(biāo)注的成本,提高數(shù)據(jù)的準(zhǔn)確率。
在使用高斯混合模型對(duì)數(shù)據(jù)進(jìn)行聚類前,先要選取高斯混合模型對(duì)應(yīng)的k值數(shù),即高斯模型的個(gè)數(shù),k的取值將直接影響最終的聚類效果。為了保證模型的精確性,本研究采用貝葉斯信息準(zhǔn)則來(lái)確定k值的大小。
貝葉斯信息準(zhǔn)則是統(tǒng)計(jì)學(xué)中常用的模型選擇方法,其能在有限的階數(shù)范圍內(nèi)找出相對(duì)最優(yōu)的擬合模型,貝葉斯信息判據(jù)值隨高斯混合數(shù)目的變化情況如圖4所示。由圖4可知,當(dāng)k=3或4時(shí),高斯混合模型的貝葉斯信息判據(jù)值處于兩個(gè)較為明顯的區(qū)分范圍。所以,本研究GMM的模型數(shù)初步選擇為3或4,而具體的模型選取數(shù)要根據(jù)實(shí)際的識(shí)別效果來(lái)確定。
先選取k=3,對(duì)數(shù)據(jù)進(jìn)行聚類,效果如圖5所示。
由圖5可知,當(dāng)k=3時(shí),高斯混合模型能很好地將軌跡點(diǎn)聚類到各個(gè)數(shù)據(jù)簇中,聚類結(jié)果能很好地符合對(duì)數(shù)據(jù)集中三種行駛軌跡數(shù)據(jù)特性的認(rèn)知。因此,本研究選取k=3作為高斯混合模型中高斯模型的個(gè)數(shù),其對(duì)應(yīng)的聚類結(jié)果作為下一步識(shí)別模型的標(biāo)簽與數(shù)據(jù)集,一起輸入到有監(jiān)督學(xué)習(xí)的LSTM模型中,從而實(shí)現(xiàn)對(duì)切入意圖的識(shí)別。
2.2 LSTM參數(shù)的選取及訓(xùn)練
LSTM是一種處理時(shí)序數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò),其能很好地捕捉數(shù)據(jù)在時(shí)間上的內(nèi)在關(guān)系,因此其在以時(shí)序數(shù)據(jù)為主的行駛軌跡數(shù)據(jù)中具有較好的特征捕捉能力,可用來(lái)識(shí)別他車的切入意圖,常見(jiàn)的LSTM模型如圖6所示。
在圖6中,xt為t時(shí)刻輸入模型的數(shù)據(jù)向量。LSTM模型在接收到該數(shù)據(jù)后,結(jié)合上一時(shí)刻的細(xì)胞狀態(tài)Ct-1及上一時(shí)刻的輸出ht-1,對(duì)神經(jīng)網(wǎng)絡(luò)參數(shù)進(jìn)行更新,然后輸出當(dāng)前時(shí)刻的細(xì)胞狀態(tài)Ct及當(dāng)前網(wǎng)絡(luò)的輸出ht,該輸出通過(guò)激活函數(shù)可計(jì)算得到與xt對(duì)應(yīng)的輸出yt。而Ct、ht下一刻的輸入xt+1將被輸入到模型中,從而獲取下一時(shí)刻的參數(shù),以此類推,循環(huán)計(jì)算,從而完成對(duì)時(shí)序關(guān)系的捕捉。
在本研究所采用的LSTM網(wǎng)絡(luò)包含隱藏層、輸入層、輸出層,隱藏層單元數(shù)設(shè)置為100,丟失率設(shè)置為0.5,最大迭代次數(shù)為50,每次樣本輸入50批數(shù)據(jù),初始學(xué)習(xí)率設(shè)置為0.01。部分訓(xùn)練過(guò)程如圖7所示。
由圖7可知,LSTM模型在訓(xùn)練過(guò)程中的損失率在3%左右,準(zhǔn)確率維持在97%上下,這說(shuō)明LSTM模型在該訓(xùn)練集上的表現(xiàn)較好。而為了驗(yàn)證LSTM模型能否對(duì)未見(jiàn)過(guò)的數(shù)據(jù)進(jìn)行識(shí)別,可用訓(xùn)練好的模型去識(shí)別測(cè)試集中的數(shù)據(jù),識(shí)別結(jié)果的混淆矩陣如圖8所示。
由圖8可知,LSTM模型在測(cè)試集上的性能也較為優(yōu)異,在識(shí)別左切入(標(biāo)簽1)時(shí),能準(zhǔn)確辨識(shí)出1 154組數(shù)據(jù),準(zhǔn)確率達(dá)96.0%。在識(shí)別右切入(標(biāo)簽2)時(shí),能準(zhǔn)確辨識(shí)出1 450組數(shù)據(jù),準(zhǔn)確率達(dá)97.1%。在識(shí)別直線行駛(標(biāo)簽3)時(shí),能準(zhǔn)確辨識(shí)出3 714組數(shù)據(jù),準(zhǔn)確率達(dá)98.1%。在對(duì)測(cè)試集數(shù)據(jù)進(jìn)行識(shí)別時(shí),能準(zhǔn)確識(shí)別出6 318組數(shù)據(jù)(總數(shù)組為6 480組),總體識(shí)別準(zhǔn)確率為97.5%。這說(shuō)明該模型的總體表現(xiàn)符合本研究的預(yù)期。
3 結(jié)論
為了能準(zhǔn)確認(rèn)別他車切入意圖,本研究提出高斯混合與長(zhǎng)短時(shí)神經(jīng)網(wǎng)絡(luò)的雙層模型,其在基于真實(shí)路況的NGSIM數(shù)據(jù)集上具有較為優(yōu)秀的表現(xiàn),模型識(shí)別的準(zhǔn)確率較高,能有效識(shí)別出他車的切入意圖,為自動(dòng)駕駛汽車的行為決策提供參考。
參考文獻(xiàn):
[1]WANG X S,YANG M M.Cut-in behavior analyses based on naturalistic driving data[J].Journal of Tongji University(Natural ence),2018(8):1057-1063.
[2]WISSING C,NATTERMANN T,GLANDER K H,et al.Lane change prediction by combining movement and situation based probabilities[J].Ifac Papersonline,2017(1):3554-3559.
[3]XIAO W,ZHANG L J,MENG D J.Vehicle Trajectory prediction based on motion model and maneuver model fusion with interactive multiple models[J].SAE International Journal of Advances and Current Practices in Mobility,2020(6):3060-3071.
[4]沈航先.車輛換道意圖識(shí)別和軌跡預(yù)測(cè)模型研究[D].哈爾濱:東北林業(yè)大學(xué),2021.
[5]劉興亮,朱西產(chǎn),李霖,等.基于支持向量機(jī)的駕駛意圖識(shí)別[C]//Infats Proceedings of the 12th International Forum of Automotive Traffic Safety,2015:157-163.
[6]劉志強(qiáng),吳雪剛,倪捷,等.基于HMM和SVM級(jí)聯(lián)算法的駕駛意圖識(shí)別[J].汽車工程,2018(7):858-864.
[7]張海倫,付銳.高速場(chǎng)景相鄰前車駕駛行為識(shí)別及意圖預(yù)測(cè)[J].交通運(yùn)輸系統(tǒng)工程與信息,2020(1):40-46.
[8]季學(xué)武, 費(fèi)聰, 何祥坤,等.基于LSTM網(wǎng)絡(luò)的駕駛意圖識(shí)別及車輛軌跡預(yù)測(cè)[J].中國(guó)公路學(xué)報(bào), 2019(6):34-42.
[9]梁凡.基于LSTM網(wǎng)絡(luò)的自動(dòng)駕駛意圖識(shí)別研究[D].烏魯木齊:新疆大學(xué),2020.
[10]閆偉,胥凌志,李嘉頎,等.基于大數(shù)據(jù)的汽車駕駛員駕駛意圖識(shí)別分析[J].農(nóng)業(yè)裝備與車輛工程,2022(8):1-5.
[11]嚴(yán)利鑫,賀宜,糜子越,等.考慮生理特性的駕駛行為險(xiǎn)態(tài)辨識(shí)研究[J].交通信息與安全,2019(3):12-19,27.
[12]劉思源,喻偉,劉潔瑩,等.考慮駕駛風(fēng)格的車輛換道行為及預(yù)測(cè)模型[J].長(zhǎng)沙理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2019(1):28-35.
[13]李儲(chǔ)巖.基于K-means算法的駕駛行為分析研究[D].哈爾濱:哈爾濱工程大學(xué),2020.