張效宇 趙祥磊 楊科
摘 要:行為決策系統(tǒng)在很大程度上反映了自動(dòng)駕駛汽車的智能化水平,作為自動(dòng)駕駛汽車的大腦,行為決策系統(tǒng)決定了自動(dòng)駕駛車輛的可行性和安全性。文章基于行車效率與行車安全對(duì)高速自動(dòng)駕駛汽車的智能決策進(jìn)行了研究。通過引入能效函數(shù)與動(dòng)態(tài)子區(qū)域監(jiān)測系統(tǒng),實(shí)時(shí)計(jì)算本車道與相鄰車道的行車能效值以及本車與周邊車輛的碰撞風(fēng)險(xiǎn),并基于此確定最優(yōu)駕駛策略,一定程度上提升了自動(dòng)駕駛車輛的行車效率與安全。
關(guān)鍵詞:智能駕駛;決策;安全;效率
Abstract: The Principal objective of this work is to study intelligent decision for highway automated driving. The Proposed framework develops, implements and tests a framework for intelligent decision based on efficiency and safety. It considers the vehicle-around situation based on a state space with eight subareas, which makes the real-time assessment for current traffic situation possible and efficiency. Based on the proposed framework, realistic simulation has also been carried out and presented. Results show that the intelligent decision based on the proposed framework is feasible and effective.
前言
作為自動(dòng)駕駛車輛智能化水平的重要體現(xiàn),智能決策系統(tǒng)在自動(dòng)駕駛中起著至關(guān)重要的作用。近年來,隨著人工智能及環(huán)境感知技術(shù)的快速發(fā)展,智能駕駛的相關(guān)研究也取得了長足進(jìn)步。但是在面對(duì)真實(shí)復(fù)雜的駕駛環(huán)境及多樣的交通狀況時(shí),人們對(duì)汽車自動(dòng)駕駛的安全性要求仍在不斷提高,這些對(duì)智能駕駛的決策提出了更大的挑戰(zhàn)。本文的研究重點(diǎn)則是基于現(xiàn)有的車輛感知信息及實(shí)際的道路狀況,考慮基于行車安全和行車效率的智能駕駛決策。
本質(zhì)上講,智能決策的好壞很大程度體現(xiàn)為對(duì)本車周圍目標(biāo)信息的準(zhǔn)確判斷上,其具體的實(shí)施可以從兩方面來考慮,即戰(zhàn)略和戰(zhàn)術(shù)。戰(zhàn)略層面更多的是基于規(guī)則去判斷該怎么走或走哪條道,而戰(zhàn)術(shù)層面則更多的是考慮車流交通等實(shí)時(shí)信息,從而更高效更安全的完成任務(wù)。換句話說,戰(zhàn)略層面更多的是結(jié)合已有的固定信息,如導(dǎo)航軌跡,高精度地圖的車道信息等對(duì)車輛進(jìn)行運(yùn)動(dòng)軌跡的約束,而戰(zhàn)術(shù)層面則更多的考慮本車周圍的實(shí)時(shí)交通流信息,實(shí)時(shí)的進(jìn)行車輛決策控制,因此其在實(shí)際應(yīng)用時(shí)具有更強(qiáng)的靈活性,這也是本文研究的重點(diǎn)。
1 決策模型的建立
智能決策中一個(gè)很重要的問題就是安全問題,即避免車輛在運(yùn)行過程中與其它車輛發(fā)生碰撞風(fēng)險(xiǎn)。碰撞風(fēng)險(xiǎn)主要從兩個(gè)維度去考慮[1]:
一是本車與前車距離,即主要考慮兩車之間的時(shí)間距離與理想時(shí)間距離tHW的比值:
式中:XTrgt,VTrgt分別表示目標(biāo)車輛與本車的距離以及目標(biāo)車輛的絕對(duì)速度。VEgo表示本車速度。tRatio本質(zhì)上反映了本車與目標(biāo)車的距離的接近程度。
二是本車為避免與目標(biāo)車碰撞時(shí)所需的減速程度,即本車所需的減速度與其所能接受的最大減速度之比(參見式(2))。 當(dāng)避免碰撞所需的最大減速度超過了所設(shè)定的臨界閾值時(shí)即認(rèn)為有碰撞風(fēng)險(xiǎn)。BRatio本質(zhì)上反映了碰撞的危險(xiǎn)程度,其中Bd max表示本車所能接受的最大減速度。
通過對(duì)這兩個(gè)特征參數(shù)的實(shí)時(shí)監(jiān)控,可知道本車與周邊車輛的實(shí)時(shí)碰撞風(fēng)險(xiǎn)并在決策中加以防范。
除了上述提及的駕駛安全風(fēng)險(xiǎn),實(shí)際的決策過程還應(yīng)考慮如下幾方面的決策屬性:即行車效率和駕駛舒適性。行車效率主要考慮本車當(dāng)前速度與駕駛員期望速度的偏差,研究表明,駕駛員在行車途中,總是期望以最快的速度到達(dá)預(yù)期的終點(diǎn)[2]。駕駛舒適性則主要考慮車輛在跟隨軌跡過程中可能產(chǎn)生的側(cè)向加速度及橫擺角速度等變量,此部分主要在路徑規(guī)劃時(shí)考慮,本文基于決策的角度暫不考慮駕駛舒適性指標(biāo)的影響。 鑒于此,本文主要考慮以下幾個(gè)方面的決策屬性:
(1)智能駕駛車輛距離本車道內(nèi)前方最近車輛的距離X0;
(2)智能駕駛車輛與道路左側(cè)車道內(nèi)障礙物的距離X1;
(3)智能駕駛車輛與道路右側(cè)車道內(nèi)障礙物的距離X2;
(4)目標(biāo)車道的最高限速Vmax;
(5)駕駛員設(shè)定速度與本車當(dāng)前車速的偏差。
為了能夠?qū)崟r(shí)比較不同車道的車流信息并進(jìn)行基于安全和效率的決策判斷,本文引入了如下的“能效函數(shù)”,其中U1反映了系統(tǒng)的行車效率,U2和U3則從安全性角度進(jìn)行考量。通過對(duì)安全和效率兩指標(biāo)的定量分析,可實(shí)現(xiàn)對(duì)車道行車信息的實(shí)時(shí)比較,假定:
式(7)反映了碰撞的危險(xiǎn)程度,但其未考慮制動(dòng)減速度的限制,若進(jìn)一步考慮制動(dòng)減速度的要求,可用式(2)替換。
至此,基于效率和安全的能效函數(shù)構(gòu)建完畢,考慮如上所述的能效函數(shù)U1,U2和U3并進(jìn)行權(quán)重分析,引入權(quán)重系數(shù)ωi得到總的能效函數(shù)U。
此能效值反應(yīng)了當(dāng)前時(shí)刻本車道的評(píng)判情況,通過比較不同車道的能效值,可實(shí)時(shí)判斷出當(dāng)前的最優(yōu)駕駛決策。
為能更客觀的比較,能效函數(shù)還應(yīng)考慮未來時(shí)刻及歷史時(shí)刻的值,以保證決策的連續(xù)性[3]。未來能效函數(shù)的計(jì)算取決于傳感器本身對(duì)本車當(dāng)前周邊環(huán)境的感知信息(包括障礙物距離,速度等)并進(jìn)行推測,假定某一時(shí)刻車輛感知所得的周邊系統(tǒng)狀態(tài)信息為Xk,則下一時(shí)刻車輛的周邊系統(tǒng)狀態(tài)信息可表述為:
其中Pk表示預(yù)測的車輛運(yùn)動(dòng)狀態(tài),如車輛在駛出高速匝道口時(shí),可以提前預(yù)測其在下一時(shí)刻會(huì)進(jìn)入匝道旁邊相鄰的車道上。
再考慮歷史時(shí)刻的能效值,本車在當(dāng)前車道的變道能效函數(shù)可用式(10)表示,式中Wk表示權(quán)重系數(shù)。 權(quán)重系數(shù)的引入可實(shí)現(xiàn)能效值對(duì)歷史和未來的權(quán)重調(diào)節(jié)。需要注意的是,能效函數(shù)對(duì)歷史值的平均可使決策的變化變得平緩,但另一方面也會(huì)引入一定的遲滯,因此式(10)中人為引入了控制因子δk,通過設(shè)定δk為0,可重置系統(tǒng)的記憶。此外,式中引入1-Uk-n, past表示系統(tǒng)的不滿意度,即如果當(dāng)前的能效函數(shù)不是最優(yōu)的,且在一定時(shí)間內(nèi)沒有改變,系統(tǒng)的能效值會(huì)逐漸降低至零,當(dāng)不滿意度累積到一定程度時(shí),系統(tǒng)決策便會(huì)基于周邊的交通流做出相應(yīng)的改變[4]。
2 碰撞風(fēng)險(xiǎn)的概率評(píng)估
實(shí)際中由于傳感器本身特性的限制以及駕駛環(huán)境的復(fù)雜性,上述特征參數(shù)所涉及的變量未必能準(zhǔn)確反映實(shí)際情況(比如傳感器檢測的目標(biāo)車輛速度并不一定是實(shí)際的速度,而是帶有一定噪聲信號(hào)的隨機(jī)信號(hào),另外由于融合算法導(dǎo)致的測量不準(zhǔn)確性在實(shí)際測量中也時(shí)常會(huì)有體現(xiàn)),因此可引入隨機(jī)變量并進(jìn)行碰撞風(fēng)險(xiǎn)的概率估計(jì)[1][3][5]。
上述兩式可對(duì)實(shí)際道路上任意兩車的碰撞概率進(jìn)行評(píng)估。需要注意的是,實(shí)際計(jì)算時(shí)需對(duì)上式概率形式進(jìn)行離散化處理,通過比較累積概率,決策會(huì)選擇安全性相對(duì)較高的駕駛策略并執(zhí)行。
3 決策算法實(shí)現(xiàn)的架構(gòu)流程
圖1給出了能效函數(shù)的總體算法框架,即系統(tǒng)首先根據(jù)車身傳感器等外部信息進(jìn)行能效函數(shù)的計(jì)算并對(duì)比確定各車道能效值的高低,此能效值的高低反映了理想狀況下的車流信息,實(shí)際應(yīng)用時(shí)還需考慮車道邊界及車道線虛實(shí)等限制條件,因此基于效率和安全的能效值還需進(jìn)一步經(jīng)過規(guī)則約束模塊做進(jìn)一步的判斷直至最終輸出。 例如系統(tǒng)經(jīng)過能效計(jì)算確定左側(cè)車道能效最高,但是此刻車道線為實(shí)線,則左側(cè)車道的能效值將被直接賦0。
以上基于安全和效率的能效函數(shù)在一定程度上實(shí)現(xiàn)了全自動(dòng)駕駛的車道智能選擇,在實(shí)際執(zhí)行時(shí),除了考慮以上所描述的部分,本車還得實(shí)時(shí)監(jiān)控周邊的交通流信息(如左右側(cè)盲區(qū)內(nèi)是否有危險(xiǎn)車輛),以免發(fā)生碰撞風(fēng)險(xiǎn)。因此,決策模塊有必要對(duì)本車周圍的車輛信息做進(jìn)一步評(píng)估。文獻(xiàn)[6]中給出了一種基于勢場的連續(xù)狀態(tài)空間產(chǎn)生法并基于此狀態(tài)空間進(jìn)行車輛的行駛決策,然而此法由于實(shí)時(shí)性較差,并不適合用于實(shí)際的測試。
文獻(xiàn)[3]給出了一種相對(duì)簡單的方法,即全狀態(tài)空間法。該方法將車身周邊劃分成8個(gè)子區(qū)域,然后分別對(duì)每個(gè)子區(qū)域進(jìn)行實(shí)時(shí)監(jiān)控并給出相關(guān)信息以供決策參考。
如圖2所示,本車周邊的8個(gè)子區(qū)域分別為1-前方,2-左前方,3-右前方,4-左側(cè),5-右側(cè),6-左后方,7-后方,8-右后方。其中 1,2,3,7為固定區(qū)域,其橫向?qū)挾鹊倪x取主要考慮實(shí)際車道的寬度。4,5,6,8為動(dòng)態(tài)區(qū)域,其區(qū)域長度與實(shí)際的車速相關(guān)。
實(shí)際運(yùn)行時(shí),車輛周邊的8個(gè)子區(qū)域會(huì)實(shí)時(shí)監(jiān)控本區(qū)域的車輛狀況,當(dāng)有車輛在本區(qū)域出現(xiàn)且該車輛與本車有碰撞風(fēng)險(xiǎn)時(shí),本區(qū)域會(huì)給出標(biāo)志位1,反之則為0。對(duì)應(yīng)的8個(gè)標(biāo)志位會(huì)被存入一個(gè)8維數(shù)組以供決策使用。
綜上,基于安全和效率的智能決策大體流程如下:
(1)首先基于導(dǎo)航,高精度地圖等信息,系統(tǒng)進(jìn)行大類決策,即判斷當(dāng)前可行駛車道;
(2)如果基于導(dǎo)航和高精度地圖判斷當(dāng)前可沿本車道行駛,則系統(tǒng)會(huì)基于效率和安全自動(dòng)比較當(dāng)前車流狀況以及左右兩側(cè)可行使車道情況并判斷是否需要變道干預(yù);
(3)若基于智能決策判斷需要變道,則系統(tǒng)會(huì)自動(dòng)進(jìn)行變道環(huán)境檢測。整個(gè)決策流程可參見圖3。
4? 決策模型的測試驗(yàn)證
圖4給出了一組基于上述方法的實(shí)測數(shù)據(jù)分析圖,圖中,棕色車輛表示本車,其余顏色的車輛表示環(huán)境感知模塊識(shí)別的周圍車輛。本車當(dāng)前車速為9.3 m/s,以本車前保中心為坐標(biāo)原點(diǎn),前向?yàn)檎?圖示各目標(biāo)車輛的中心點(diǎn)距離及速度分別為ID1(38.4m,10.4m/s),ID2(23.9m,8.4m/s),ID3(-18m,9.1m/s),ID4(3.3m,10.4m/s),ID5(17.8m,10.24m/s)。
基于當(dāng)前信息,可計(jì)算出此刻本車與左側(cè)車輛ID4有碰撞風(fēng)險(xiǎn),因此決策層會(huì)給出禁止向左變道的提示。 從圖右側(cè)基于模型計(jì)算出來的危險(xiǎn)評(píng)估列表來看,模型的危險(xiǎn)分析與實(shí)際情況一致。另一方面,基于安全和效率的能效函數(shù)會(huì)計(jì)算出此刻右側(cè)車道的行車效率大于本車車道,因此系統(tǒng)會(huì)給出建議右轉(zhuǎn)的智能決策,查子區(qū)域風(fēng)險(xiǎn)表得右轉(zhuǎn)風(fēng)險(xiǎn)為0,進(jìn)而給出車輛右轉(zhuǎn)的決策。
當(dāng)本車變道或是彎道行駛時(shí),情況會(huì)變得相對(duì)復(fù)雜,此時(shí)需要進(jìn)行空間坐標(biāo)變換或是借助高精度地圖、V2X等獲得更多的信息以用于決策。
5 結(jié)論
本文基于行車效率和行車安全兩方面對(duì)自動(dòng)駕駛的智能決策進(jìn)行了研究,通過實(shí)時(shí)對(duì)比交通流的信息,智能選擇最適合本車的行駛車道,有效的提升了自動(dòng)駕駛車輛的行車效率與安全。在實(shí)際的交通流環(huán)境中,還需進(jìn)一步考慮本車在變道過程中可能面臨的復(fù)雜場景,例如,智能決策判斷當(dāng)前應(yīng)該向左側(cè)變道且變道無風(fēng)險(xiǎn),于是本車開始執(zhí)行變道,但是變道還未完成時(shí),軌跡道路上突然出現(xiàn)風(fēng)險(xiǎn)車輛,此時(shí)智能決策則需要重新決策去規(guī)避風(fēng)險(xiǎn),這也是本文下一步要進(jìn)行的工作。
參考文獻(xiàn)
[1] Niehaus,Stengel. Rule-Based Guidance for Vehicle Highway Driving in the Presence of Uncertainty[C]. American Control Conference. IEEE,2009.
[2] 陳佳佳.城市環(huán)境下無人駕駛車輛決策系統(tǒng)研究[D].中國科學(xué)技術(shù)大學(xué), 2014.
[3] Ardelt M, Coester C, Kaempchen N. Highly Automated Driving on Freeways in Real Traffic Using a Probabilistic Framework[J]. IEEE Transactions on Intelligent Transportation Systems, 2012, 13(4): 1576-1585.
[4] Ardelt M, Waldmann P, Homm F, et al. Strategic Decision-Making Process in Advanced Driver Assistance Systems[C]. Advances in Automotive Control. 2010:566-571.
[5] Ulbrich S, Maurer M. Probabilistic online POMDP decision making for lane changes in fully automated driving[C]. International IEEE Conference on Intelligent Transportation Systems. IEEE, 2013.
[6] Reichardt D. Kontinuierliche Verhaltenssteuerung eines autonomen Fahrzeugs in dynamischer Umgebung[D].Universit?t Kaiserslautern, 1996.