王 哲,韓銀輝,蔣明智,袁 征,張 琳
(北京郵電大學(xué) 人工智能學(xué)院,北京 100876)
自動駕駛技術(shù)能夠有效提升交通安全和交通效率,近年來受到了廣泛關(guān)注。然而,由于復(fù)雜的交通系統(tǒng)和仍不完善的地方法律法規(guī)的限制,未來很長一段時間,自動駕駛車輛和手動駕駛車輛并存的混合交通場景會在高速公路中占據(jù)主要地位[1]。為了解決自動駕駛車輛算法面對實時動態(tài)變化真實交通場景失效的問題,尋找一種有效可靠的方法預(yù)測手動駕駛車輛的軌跡變化成為如今學(xué)者們亟待解決的問題[2]。早期研究應(yīng)用理論和數(shù)學(xué)公式開發(fā)了微觀車輛軌跡變化模型,用于在各種復(fù)雜交通場景下預(yù)測自動駕駛車輛的軌跡[3],然而,此類模型無法在所有的車流量密度場景中取得很好的效果。Lin等人[4]使用模擬技術(shù)來估算車輛軌跡。該方法并沒有在實際場景中進(jìn)行測試,由于模擬環(huán)境中的車道變換頻率與過程與實際交通場景情況不同,因此結(jié)果并不準(zhǔn)確。袁娜等人[5]計算了車輛在車道變化的軌跡中引發(fā)的車身震動和周圍車流量變化,使用一種改進(jìn)的人工魚群模型分析了車輛變道對交通安全的影響。然而,該研究并未充分考慮車道變化前后的微觀交通參數(shù),沒有同時考慮碰撞風(fēng)險和道路流量的影響。此外,許多研究只進(jìn)行了目標(biāo)車道上的車輛軌跡預(yù)測,而忽略了周圍其他車道上車輛的影響[6]。
5G車聯(lián)網(wǎng)和邊緣計算技術(shù)的出現(xiàn),車聯(lián)網(wǎng)和傳感器的快速發(fā)展為車車協(xié)同、車路協(xié)同系統(tǒng)提供了保障[7]。例如,龍銀江等人[8]使用一種基于網(wǎng)絡(luò)切片的聯(lián)合資源分配算法實現(xiàn)了車聯(lián)網(wǎng)場景下的低時延通信。車聯(lián)網(wǎng)的發(fā)展使得學(xué)者們嘗試分析并使用車車協(xié)同、車路協(xié)同系統(tǒng)中的關(guān)鍵技術(shù)優(yōu)化城市中車輛通行安全和效率低下的問題[9],并且證明了多智能體集群學(xué)習(xí)能夠更快速可靠地實現(xiàn)車聯(lián)網(wǎng)場景下的深度學(xué)習(xí)任務(wù)。Jiang等人[10]在車聯(lián)網(wǎng)場景中,基于邊霧云架構(gòu),提出了一種多交叉口協(xié)同控制算法提升車輛通行效率。然而,現(xiàn)有車聯(lián)網(wǎng)中多智能體研究并沒有考慮車輛隱私數(shù)據(jù)保護(hù),通信技術(shù)的不恰當(dāng)使用極有可能造成電信詐騙等用戶財產(chǎn)損失問題[11]。因此對于用戶數(shù)據(jù)的保護(hù)也開始得到工業(yè)界和學(xué)術(shù)界的關(guān)注。學(xué)者們嘗試使用聯(lián)邦學(xué)習(xí)和區(qū)塊鏈技術(shù)解決這一問題[12-13],基于聯(lián)邦學(xué)習(xí)和區(qū)塊鏈技術(shù),Warnat等人提出了去中心化的集群智能學(xué)習(xí)框架Swarm Learning(SL)框架[14],并在醫(yī)療領(lǐng)域取得了卓越的效果。集群智能學(xué)習(xí)框架無需中央服務(wù)器,通過區(qū)塊鏈網(wǎng)絡(luò)共享參數(shù),并在各個站點的私有數(shù)據(jù)上獨立構(gòu)建模型。然而,上述工作只在醫(yī)療影響場景下進(jìn)行了測試,并沒有在車聯(lián)網(wǎng)中進(jìn)行嘗試與應(yīng)用,同時,集群智能算法沒有考慮車聯(lián)網(wǎng)場景下車輛的移動性、不可靠的通信連接以及動態(tài)變化的駕駛環(huán)境。這些因素將給車聯(lián)網(wǎng)場景下的模型訓(xùn)練帶來一些新的挑戰(zhàn)。本文中的混合交通下基于車聯(lián)網(wǎng)的集群智能軌跡預(yù)測算法主要貢獻(xiàn)點如下:
(1) 提出一種車聯(lián)網(wǎng)場景下的集群智能軌跡預(yù)測(Swarm Learning-based Trajectory Prediction,SLTP)算法。使用去中心化的集群智能通信框架保障用戶隱私數(shù)據(jù)的同時,獲取周圍手動駕駛車輛的歷史軌跡信息并預(yù)測周圍手動駕駛車輛的軌跡變化。
(2) 設(shè)計了基于Beta概率函數(shù)的權(quán)重預(yù)測策略并應(yīng)用于集群學(xué)習(xí)的模型融合過程,解決車聯(lián)網(wǎng)場景中因傳輸冗余數(shù)據(jù)導(dǎo)致的模型預(yù)測精度不高的問題。
(3) 使用美國高速公路行車數(shù)據(jù)集NGSIM (Next Generation Simulation)驗證SLTP算法的有效性,與現(xiàn)有的基于長短時記憶(Long Short-Term Memory,LSTM)網(wǎng)絡(luò)的軌跡預(yù)測方法相比較,驗證SLTP算法的有效性。
假設(shè)在混合交通場景如圖1所示,場景中存在編號個數(shù)為N的自動駕駛車輛。
圖1 混合交通場景Fig.1 Mixed traffic scenario
由于車載GPS、雷達(dá)、攝像頭和其他車載傳感器可以獲得環(huán)境周邊手動駕駛車輛實時車輛軌跡數(shù)據(jù),每輛自動駕駛車輛都可以建模為三維數(shù)組G=(V,P,E),其中:
(1)V={vi∣i∈{1,2,…}}表示所有車輛,vi表示道路上的編號為i的自動駕駛車輛。N=|V|表示道路上的所有自動駕駛車輛數(shù)目。
(2)P={pi∣vi∈V} 表示每輛自動駕駛車輛的軌跡數(shù)據(jù),通過車載傳感器獲得,包括速度、加速度、方向和位置。
(3)E={ei∣vi∈V}表示環(huán)境矩陣,用于存儲車輛周圍的道路環(huán)境信息,即前后左右四個方向的車輛信息。道路環(huán)境矩陣中車輛vi的信息ei定義為:
(1)
式中,d(vi,vj)表示車輛vi和vj之間的歐式距離;R表示每輛車的可視范圍。深度神經(jīng)網(wǎng)絡(luò)模型中的損失函數(shù)量化了算法對訓(xùn)練數(shù)據(jù)的建模效果是機器學(xué)習(xí)需要解決的根本問題。訓(xùn)練的目標(biāo)是找到使損失函數(shù)最小化的最佳模型參數(shù)。機器學(xué)習(xí)中的損失函數(shù)大致可分為分類損失和回歸損失。其中包括對數(shù)損失、聚焦損失、Kullback-Leibler散度、指數(shù)損失、鉸鏈損失等,實驗中使用均方誤差作為車載模型的損失函數(shù)。車輛vi的損失函數(shù)fi(w)的表達(dá)式如下:
(2)
(3)
式中,Rm(i)是第i輛車的車載模型參數(shù);Lm(k)是第k輛車的模型參數(shù);γ是模型權(quán)重。集群學(xué)習(xí)過程中全局模型的損失函數(shù)被作為整個算法的目標(biāo)函數(shù):
(4)
編號為i的自動駕駛車輛本地模型的可信值Ci,為了表示模型的有效性,使用編號為i-1的車輛節(jié)點傳輸模型作為參考模型計算當(dāng)前車載模型的有效性預(yù)測P(ei)。車輛i根據(jù)模型有效性觀測結(jié)果B計算和預(yù)測模型的有效性P(ei∣B),可推導(dǎo)為:
(5)
為了便于有效性值的表達(dá)和更新,使用Beta分布表示每個車載模型的有效性的概率,定義如下:
(6)
式中,p>0,q>0,p和q分別表示接收模型優(yōu)于車載模型的次數(shù)和車載模型優(yōu)于接收模型的次數(shù),Γ(x)是伽馬函數(shù),其表達(dá)式為:
(7)
例如,假設(shè)ai和bi代表當(dāng)前的積極和消極行為,而p和q代表初始的積極和消極行為。要更新可信度,相當(dāng)于更新兩個參數(shù)p和q,如下:
(8)
在沒有先驗知識的情況下初始化節(jié)點時,節(jié)點的可信度可以表示為(0,1)上的均勻分布,定義為:
P(x)=uni(0,1)=Beta(1,1)。
(9)
通過比較接收模型和車載模型的有效性,每輛自動駕駛車輛可以將接收到模型的有效性進(jìn)行評估,即轉(zhuǎn)化為有效模型次數(shù)和無效模型次數(shù)。假設(shè)在n輪通信中,每輛自動駕駛車輛進(jìn)行模型訓(xùn)練和融合(p+q)次。通過比較模型的有效性,這些相互作用被描述為p次積極行為和q次消極行為。有了這些信息,每輛車可以在預(yù)測下一次模型融合時接收到模型的有效性。模型的有效概率定義為:
(10)
通過歸一化接受模型和本地模型的權(quán)重系數(shù),編號為i的自動駕駛車輛模型融合過程的權(quán)重定義為:
λ1∶λ2=Ce∶1。
(11)
模型聚合過程中使用去中心化的集群學(xué)習(xí)框架保障用戶數(shù)據(jù)安全。路側(cè)單元作為模型聚合過程的參與者,均勻分布在道路兩側(cè)用于模型緩存。通過以下三個步驟的循環(huán),多輛自動駕駛車輛協(xié)同通信,進(jìn)行模型訓(xùn)練任務(wù):
(1) 每輛自動駕駛車輛通過V2V通信以及傳感器感知的方式收集周邊環(huán)境中手動駕駛車輛的軌跡數(shù)據(jù)(如地理位置、速度、方向角等)并進(jìn)行軌跡預(yù)測訓(xùn)練任務(wù)訓(xùn)練車載模型。
(2) 行駛過程中,彼此接近的自動駕駛車輛通過區(qū)塊鏈技術(shù)通信,傳遞模型參數(shù),預(yù)測接收模型和車載訓(xùn)練模型的權(quán)重系數(shù),并進(jìn)行模型聚合。
(3) 模型聚合后,頭節(jié)點車輛將模型參數(shù)發(fā)送到路側(cè)單元進(jìn)行緩存處理。
一般來說,由于道路上車輛的快速流動性和駕駛目的的不確定性,不同自動駕駛車輛收集的周邊手動駕駛車輛軌跡數(shù)據(jù)截然不同。通過評估并比較接收模型和車載模型的有效性,計算融合權(quán)重可以提升聚合模型效果,消除冗余用戶數(shù)據(jù)造成的模型過擬合問題。算法1給出了基于集群學(xué)習(xí)的模型訓(xùn)練的全過程。
本節(jié)將介紹模擬設(shè)置,使用基于LSTM網(wǎng)絡(luò)的軌跡預(yù)測方法作為基線方案[15]進(jìn)行對比,對模型的預(yù)測效果,模型收斂速度進(jìn)行比較。使用32 GB內(nèi)存,i7-10700的CPU硬件測試平臺,測試環(huán)境基于PyTorch3.9框架構(gòu)建并在Ubuntu18.04系統(tǒng)中部署。自動駕駛車輛中的車載LSTM網(wǎng)絡(luò)模型能夠預(yù)測周圍環(huán)境中手動駕駛車輛在5 s內(nèi)的軌跡。完整的模型參數(shù)如表1所示。LSTM網(wǎng)絡(luò)訓(xùn)練過程中時間步長設(shè)置為10。使用Adam優(yōu)化器作為神經(jīng)網(wǎng)絡(luò)優(yōu)化器。實驗涉及的算法源碼,以及相關(guān)訓(xùn)練和測試數(shù)據(jù)文件已經(jīng)開源至GitHub平臺。
表1 算法和環(huán)境參數(shù)
對于車聯(lián)網(wǎng)中的集群學(xué)習(xí),實驗?zāi)M定義了兩種交通流密度:高交通流密度和低交通流密度。自動駕駛車輛數(shù)為16輛和5輛。使用NGSIM數(shù)據(jù)集驗證SLTP算法的有效性。美國聯(lián)邦公路管理局使用視頻中目標(biāo)檢測的方式捕捉真實世界的交通信息制作NGSIM數(shù)據(jù)集,包括車輛速度、位置、加速度、車道等。作為高分辨率的真實世界車輛軌跡數(shù)據(jù),NGSIM廣泛用于探索軌跡預(yù)測過程的特征,并校準(zhǔn)和驗證軌跡預(yù)測模型[16]。
目前還沒有集群學(xué)習(xí)框架在車聯(lián)網(wǎng)場景中的應(yīng)用,對比方案使用基于LSTM網(wǎng)絡(luò)對車輛進(jìn)行軌跡預(yù)測的方法[15],以更好地評估SLTP算法的性能,實驗中的軌跡預(yù)測誤差結(jié)果和模型Loss函數(shù)下降曲線如圖2和圖3所示。
圖2 軌跡預(yù)測誤差Fig.2 Trajectory Prediction Error
圖3 模型Loss函數(shù)下降曲線Fig.3 Descending curve of Model Loss function
為了驗證軌跡預(yù)測的準(zhǔn)確性,實驗設(shè)置了智能體數(shù)量為5,16的2種情況,來展示集群軌跡預(yù)測算法在不同智能體數(shù)目情況下的性能,為了進(jìn)行相互比較,開展了2組對照訓(xùn)練實驗。圖2是訓(xùn)練過程中軌跡預(yù)測誤差值情況,具體的實驗數(shù)據(jù)如表2所示。從實驗結(jié)果來看,隨著智能體數(shù)量增加,SLTP算法可以表現(xiàn)出更好的性能,而LSTM網(wǎng)絡(luò)的軌跡預(yù)測方法隨著自動駕駛車輛數(shù)目的增加面對的大量冗余數(shù)據(jù),模型收斂速度較慢,出現(xiàn)預(yù)測結(jié)果精度不高的情況。綜上,體現(xiàn)了SLTP算法在軌跡預(yù)測準(zhǔn)確性方面更具有優(yōu)越性。
對于模型的收斂速度,實驗同樣使用上述兩種交通流密度進(jìn)行試驗,以展示集群軌跡預(yù)測算法在不同智能體數(shù)目的情況下模型的收斂速度,圖3展示的Loss值的變化情況,具體的實驗數(shù)據(jù)如表2所示。從實驗結(jié)果來看,隨著智能體數(shù)量增加,SLTP算法可以有更快的收斂速度,這是因為通過文中提出的基于Beta概率函數(shù)的權(quán)重預(yù)測算法,對于效果不好的模型在集群模型聚合過程中給予更小的權(quán)重以抵消冗余經(jīng)驗數(shù)據(jù)的影響,從而實現(xiàn)同樣計算開銷情況下模型更快地收斂。綜上,體現(xiàn)了SLTP算法在模型收斂速度上更具有優(yōu)越性。
表2 綜合預(yù)測性能數(shù)據(jù)
本文基于LSTM網(wǎng)絡(luò)針對城市道路的混合交通場景提出了一種SLTP算法。自動駕駛車輛之間通過去中心化的集群學(xué)習(xí)保障用戶數(shù)據(jù)安全。此外,為了解決車聯(lián)網(wǎng)場景中的高移動性和數(shù)據(jù)冗余的問題,設(shè)計了模型聚合過程中的可信度權(quán)重預(yù)測算法,使得LSTM模型能夠更快收斂。仿真結(jié)果表明,與基于LSTM網(wǎng)絡(luò)對軌跡預(yù)測的方法相比,SLTP算法在同樣的訓(xùn)練時間和通信開銷內(nèi)能夠擁有更高的模型預(yù)測準(zhǔn)確性和魯棒性。未來的工作中將擴大集群學(xué)習(xí)實驗規(guī)模,驗證所提出算法在車聯(lián)網(wǎng)場景中存在蓄意攻擊車輛的情況下如何保護(hù)車輛隱私數(shù)據(jù)。