陳漸偉,于傳強(qiáng),劉志浩,唐圣金,張志浩,舒洪斌
(火箭軍工程大學(xué),陜西 西安 710025)
多軸特種車輛通常行駛在惡劣的工況下,加上車輛自身結(jié)構(gòu)復(fù)雜,因此多軸特種車輛的模型具有較強(qiáng)的非線性特征,難以準(zhǔn)確建模。然而,準(zhǔn)確的車輛動(dòng)力學(xué)模型在車輛控制、狀態(tài)估計(jì)以及決策規(guī)劃中都具有極其重要的意義[1-4]。面向車輛動(dòng)力學(xué)建模是一個(gè)將車輛的動(dòng)力學(xué)表現(xiàn)抽象為數(shù)學(xué)方程的過(guò)程。按照認(rèn)知車輛動(dòng)力學(xué)角度的不同,模型可以劃分為物理模型和數(shù)據(jù)模型。
大多數(shù)車輛建模是基于第一性原理的物理建模方法。車輛動(dòng)力學(xué)的特征行為被統(tǒng)一建立在牛頓力學(xué)體系中,模型的高保真度依賴動(dòng)力學(xué)方程以及物理參數(shù)的準(zhǔn)確程度。然而,完整的車輛動(dòng)力學(xué)系統(tǒng)是一個(gè)復(fù)雜的強(qiáng)非線性系統(tǒng)。例如在對(duì)車輛輪胎建模時(shí),模型的準(zhǔn)確性更加依賴經(jīng)驗(yàn)?zāi)P椭械膶?shí)驗(yàn)參數(shù),這一過(guò)程需要專有的實(shí)驗(yàn)平臺(tái)在特定的實(shí)驗(yàn)工況下進(jìn)行測(cè)試[5-8]。因此,在對(duì)車輛進(jìn)行物理建模時(shí),研究人員想獲取關(guān)于車輛完備的參數(shù)非常困難且成本高昂。基于物理模型的車輛動(dòng)力學(xué)建模不得不根據(jù)應(yīng)用需求和已知模型參數(shù)的限制,對(duì)車輛動(dòng)力學(xué)模型做簡(jiǎn)化處理[9-10],進(jìn)行不同程度的線性化假設(shè),使得物理模型難以準(zhǔn)確反饋出真實(shí)的車輛動(dòng)力學(xué)。
近年來(lái)深度學(xué)習(xí)發(fā)展迅速,神經(jīng)網(wǎng)絡(luò)通過(guò)離線訓(xùn)練,可以從數(shù)據(jù)中挖掘潛在的自然規(guī)律[11-13]。車輛在行駛過(guò)程中,車載傳感器能夠提供豐富的車輛狀態(tài)信息,為建立車輛動(dòng)力學(xué)神經(jīng)網(wǎng)絡(luò)模型提供了可學(xué)習(xí)的數(shù)據(jù)集,因此一些學(xué)者開始采用神經(jīng)網(wǎng)絡(luò)對(duì)車輛動(dòng)力學(xué)建模。
Pan 等[14]采用神經(jīng)網(wǎng)絡(luò)建立車輛縱向動(dòng)力學(xué)模型,網(wǎng)絡(luò)輸入為車輛縱向速度和前輪扭矩,輸出為車輛剎車距離。通過(guò)與Carsim 仿真測(cè)試的結(jié)果相比較,仿真結(jié)果顯示網(wǎng)絡(luò)模型能夠準(zhǔn)確預(yù)測(cè)車輛縱向速度和行駛距離,模型能夠應(yīng)用于車輛實(shí)時(shí)仿真和控制。DA LIO 等[15]提出一種結(jié)構(gòu)化網(wǎng)絡(luò)模型對(duì)車輛縱向動(dòng)力學(xué)進(jìn)行了建模。網(wǎng)絡(luò)輸入為縱向速度、質(zhì)心高度、油門踏板和擋位,依據(jù)車輛縱向力的組成結(jié)構(gòu)對(duì)輸入信息進(jìn)行分類,構(gòu)建出結(jié)構(gòu)化網(wǎng)絡(luò),仿真結(jié)果顯示采用結(jié)構(gòu)化網(wǎng)絡(luò)模型具有更好的泛化性,提高了數(shù)據(jù)建模的保真度。Rutherford 等[16]采用神經(jīng)網(wǎng)絡(luò)建立車輛動(dòng)力學(xué)模型,并詳細(xì)分析了網(wǎng)絡(luò)初始化權(quán)值與網(wǎng)絡(luò)大小對(duì)網(wǎng)絡(luò)模型泛化能力的影響,研究發(fā)現(xiàn)網(wǎng)絡(luò)權(quán)重初始化影響網(wǎng)絡(luò)訓(xùn)練的最終結(jié)果,隨著網(wǎng)絡(luò)尺度增大,有助于提高網(wǎng)絡(luò)收斂水平。Cao 等[17]構(gòu)建了一種分層網(wǎng)絡(luò)用于建立車輛橫向動(dòng)力學(xué)模型。網(wǎng)絡(luò)模型分為兩個(gè)網(wǎng)絡(luò),第1 層用于預(yù)測(cè)車輛橫擺角速度,第2 層結(jié)合第1 層的結(jié)果預(yù)測(cè)質(zhì)心側(cè)偏角。然而,由于網(wǎng)絡(luò)整體呈開環(huán)結(jié)構(gòu),模型需要輸入轉(zhuǎn)向指令、縱向加速度、速度和歷史橫擺角速度等。對(duì)于網(wǎng)絡(luò)預(yù)測(cè)的狀態(tài)信息,同時(shí)也要求實(shí)測(cè)過(guò)程可以采集到,否則網(wǎng)絡(luò)無(wú)法被驅(qū)動(dòng)。
為減少網(wǎng)絡(luò)的輸入數(shù)據(jù)需求,使網(wǎng)絡(luò)模型能夠遞歸更新,Hermansdorffer 等[18]在測(cè)試過(guò)程中利用網(wǎng)絡(luò)的輸出不斷更新輸入,使得網(wǎng)絡(luò)模型可以像物理模型一樣驅(qū)動(dòng)。雖然網(wǎng)絡(luò)模型在測(cè)試過(guò)程中實(shí)現(xiàn)了閉環(huán)結(jié)構(gòu),但是在訓(xùn)練網(wǎng)絡(luò)時(shí)仍然是基于開環(huán)的網(wǎng)絡(luò)結(jié)構(gòu),網(wǎng)絡(luò)的輸入全部采用采集的數(shù)據(jù)?;陂_環(huán)結(jié)構(gòu)訓(xùn)練得到的網(wǎng)絡(luò)參數(shù),雖然能夠部署在網(wǎng)絡(luò)模塊中并用于閉環(huán)測(cè)試,但是由于網(wǎng)絡(luò)結(jié)構(gòu)和輸入數(shù)據(jù)的來(lái)源發(fā)生了變化,模型在測(cè)試過(guò)程中的保真度較低。
為提高車輛動(dòng)力學(xué)數(shù)據(jù)建模的保真度,本文針對(duì)某型特種五軸車輛的橫向動(dòng)力學(xué)行為,基于閉環(huán)結(jié)構(gòu)的網(wǎng)絡(luò)模型進(jìn)行數(shù)據(jù)建模;構(gòu)建了一種在閉環(huán)條件下的網(wǎng)絡(luò)訓(xùn)練方法,提高了閉環(huán)網(wǎng)絡(luò)模型的預(yù)測(cè)準(zhǔn)確度。
單軌模型是一種常用的簡(jiǎn)化車輛動(dòng)力學(xué)模型,如圖1 所示。圖1 中,F(xiàn)i為第i 軸(i=1~5) 的輪胎橫向力,vx、vy分別為車輛的縱向速度和橫向速度,γ 為車輛橫擺角速度,Li為軸心至質(zhì)心的縱向距離,δi為第i 軸的輪胎轉(zhuǎn)向角。
圖1 單軌模型Fig.1 Single track model
在對(duì)車輛進(jìn)行受力分析后,建立車輛橫向動(dòng)力學(xué)模型如式(1) 和式(2) 所示:
式中:m 為整車質(zhì)量;Iz為轉(zhuǎn)動(dòng)慣量。
對(duì)輪胎模型進(jìn)行線性化處理,在側(cè)偏角較小的時(shí)候,輪胎模型與側(cè)偏角近似線性的關(guān)系如式(3)所示:
式中:Ci為第i 軸的輪胎側(cè)向剛度。在計(jì)算各個(gè)輪胎的轉(zhuǎn)向角時(shí),通常認(rèn)為車輛轉(zhuǎn)彎時(shí)各個(gè)輪胎轉(zhuǎn)向角符合阿克曼轉(zhuǎn)向關(guān)系,各個(gè)車輪僅有一個(gè)轉(zhuǎn)向中心,當(dāng)轉(zhuǎn)彎角度較小時(shí),可對(duì)計(jì)算過(guò)程做線性化處理。計(jì)算結(jié)果如式(6)~式(10) 所示。車輛第三車軸通過(guò)機(jī)械鎖死,三軸車輪轉(zhuǎn)向角始終為0°,其余輪胎均可自由轉(zhuǎn)向,方向盤轉(zhuǎn)角δ 與一軸車輪轉(zhuǎn)角的傳動(dòng)比為η。車輛行駛過(guò)程中各個(gè)車輪的轉(zhuǎn)向角為
因此單軌模型中,車輪各個(gè)轉(zhuǎn)向角均可以用方向盤轉(zhuǎn)角δ 計(jì)算。將式(3)~式(10) 代入式(1) 和式(2) 中,進(jìn)行歐拉前向展開,可得離散化的橫向動(dòng)力學(xué)模型,結(jié)構(gòu)如式(11) 所示(詳細(xì)參數(shù)見(jiàn)附錄A) :
式中:X 為車輛狀態(tài)變量;A、B 分別為狀態(tài)方程的參數(shù)矩陣;U 為控制變量。
通過(guò)式(11) 可以發(fā)現(xiàn)物理模型是遞歸模型,遞歸過(guò)程如圖2 所示,通過(guò)初始化模型預(yù)測(cè)變量,向模型輸入控制信號(hào)和必要的系統(tǒng)變量,模型能夠不斷更新預(yù)測(cè)車輛的狀態(tài)變量。在橫向動(dòng)力學(xué)模型中,方向盤轉(zhuǎn)角δ 和縱向速度vx是輸入到模型的控制信號(hào)和系統(tǒng)狀態(tài)變量,橫向速度vy和橫擺角速度γ是模型可預(yù)測(cè)的狀態(tài)變量。
圖2 物理模型更新過(guò)程Fig.2 Update process of the physical model
為實(shí)現(xiàn)物理模型中遞歸更新的功能,搭建了圖3 所示閉環(huán)結(jié)構(gòu)網(wǎng)絡(luò)模型,以映射車輛的橫向動(dòng)力學(xué)行為。在閉環(huán)網(wǎng)絡(luò)模型中,模型結(jié)構(gòu)首尾相連,網(wǎng)絡(luò)輸出的狀態(tài)信息分別是橫向速度vy和橫擺角速度γ,同時(shí)也作為網(wǎng)絡(luò)的輸入信息與車輛方向盤轉(zhuǎn)角δ 和縱向速度vx信息一起組成新的輸入序列x,以驅(qū)動(dòng)網(wǎng)絡(luò)模塊對(duì)下一時(shí)刻的車輛狀態(tài)信息進(jìn)行預(yù)測(cè)。圖3 中,h0表示GRU 模塊的初始狀態(tài),通常設(shè)置為一組為0 的序列。
圖3 閉環(huán)網(wǎng)絡(luò)模型Fig.3 Closed-loop network model
為便于對(duì)比分析訓(xùn)練方法對(duì)閉環(huán)網(wǎng)絡(luò)模型準(zhǔn)確性的影響,參照文獻(xiàn)[18]設(shè)置閉環(huán)網(wǎng)絡(luò)模塊由一個(gè)遞歸網(wǎng)絡(luò)GRU 和一個(gè)前饋網(wǎng)絡(luò)FNN 組成。網(wǎng)絡(luò)模塊的主要參數(shù)如表1 和表2 所示。
表1 GRU 模塊參數(shù)Table 1 GRU module parameters
表2 FNN 模塊參數(shù)Table 2 FNN module parameters
數(shù)據(jù)建模依賴于大數(shù)據(jù)集,然而實(shí)驗(yàn)獲取數(shù)據(jù)的成本較為高昂,因此通過(guò)Trucksim 搭建目標(biāo)車輛的仿真模型以生成數(shù)據(jù)集。Trucksim 是一種參數(shù)化的車輛建模軟件,通過(guò)導(dǎo)入輪胎模型等關(guān)鍵實(shí)驗(yàn)數(shù)據(jù),實(shí)現(xiàn)精細(xì)化的車輛建模。為測(cè)試仿真模型的準(zhǔn)確性,采用一段實(shí)車轉(zhuǎn)彎工況進(jìn)行驗(yàn)證,實(shí)驗(yàn)平臺(tái)如圖4 所示。方向盤轉(zhuǎn)角傳感器采用UX-2D 型號(hào)轉(zhuǎn)向盤轉(zhuǎn)動(dòng)量轉(zhuǎn)矩檢測(cè)儀;Speedbox-mini 用于采集車輛行駛過(guò)程縱向車速、縱向加速度、橫向加速度等信息;GPS、INS 用來(lái)測(cè)量車輛姿態(tài)角和角速度等信息。傳感器信號(hào)通過(guò)CAN 總線輸出至數(shù)據(jù)采集系統(tǒng),并使用Race Technology 和DEWEsoft-X3 對(duì)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行后處理。
圖4 實(shí)驗(yàn)平臺(tái)Fig.4 Experimental platform
實(shí)驗(yàn)路徑如圖5 所示,車輛行駛速度為20~40 km/h 之間變化。在可采集的狀態(tài)信息中,選擇側(cè)向加速度和橫擺角速度作為驗(yàn)證Trucksim 模型準(zhǔn)確性的指標(biāo)。驗(yàn)證方法為將圖6 和圖7 所示的車輛縱向速度信息和方向盤轉(zhuǎn)角信息輸入Trucksim中。將側(cè)向加速度、橫擺角速度仿真結(jié)果與實(shí)驗(yàn)數(shù)據(jù)進(jìn)行比較,對(duì)比結(jié)果如圖8 和圖9 所示,可見(jiàn)實(shí)驗(yàn)數(shù)據(jù)與仿真數(shù)據(jù)基本吻合。
圖5 實(shí)驗(yàn)路徑Fig.5 Experimental path
圖6 實(shí)驗(yàn)縱向速度Fig.6 Experimental longitudinal velocity
圖7 實(shí)驗(yàn)方向盤轉(zhuǎn)角Fig.7 The experimental steering wheel angle
圖8 側(cè)向加速度驗(yàn)證Fig.8 Lateral acceleration verification
對(duì)圖8 和圖9 的對(duì)比結(jié)果做進(jìn)一步分析。實(shí)驗(yàn)測(cè)試數(shù)據(jù)與Trucksim 模型輸出數(shù)據(jù)誤差對(duì)比結(jié)果如表3 所示,側(cè)向加速度均方根誤差為0.002 3,最大誤差為0.073 5 g。橫擺角速度的均方根誤差為0.035 9,最大誤差為0.360 6 °/s。由此可見(jiàn),仿真數(shù)據(jù)與實(shí)驗(yàn)數(shù)據(jù)基本一致,驗(yàn)證了Trucksim 中搭建的仿真模型在反映車輛橫向動(dòng)力學(xué)特征時(shí)具有較好的保真度,仿真模型的主要物理參數(shù)如表4 所示。
表3 Trucksim 模型誤差Table 3 Trucksim model error
表4 Trucksim 仿真車輛參數(shù)Table 4 Trucksim simulated vehicle parameters
圖9 橫擺角速度驗(yàn)證Fig.9 Yaw rate verification
訓(xùn)練集被用于離線訓(xùn)練網(wǎng)絡(luò)模型,網(wǎng)絡(luò)模型的泛化能力和模型準(zhǔn)確性與數(shù)據(jù)集密切相關(guān)。在制作數(shù)據(jù)集時(shí),設(shè)置了一段隨機(jī)的行駛路線,如圖10 所示。車輛初始位置為圖10 中黑色原點(diǎn)位置,沿曲線伸展方向前進(jìn),車輛縱向速度在30~40 km/h 間變化,縱向速度曲線如圖11 所示。將數(shù)據(jù)集拆分為兩部分,其中藍(lán)色路徑用于制作訓(xùn)練集,紅色部分用于制作測(cè)試集。數(shù)據(jù)信息包含車輛縱向速度、方向盤轉(zhuǎn)角、橫擺角速度以及車輛橫向速度,采樣頻率設(shè)置為100 Hz。
圖10 數(shù)據(jù)集行駛路線Fig.10 Driving path in dataset
圖11 數(shù)據(jù)集行駛速度Fig.11 Longitudinal velocity in Dataset
在深度學(xué)習(xí)中對(duì)訓(xùn)練數(shù)據(jù)進(jìn)行歸一化處理,可以提高訓(xùn)練的收斂速度和模型精度,使網(wǎng)絡(luò)在訓(xùn)練過(guò)程中避免梯度爆炸,同時(shí)有利于確保每個(gè)輸入信息對(duì)于網(wǎng)絡(luò)最終輸出結(jié)果的影響是相等的[19]。常用的歸一化方法有Max-Min 歸一化等。為減少訓(xùn)練集與測(cè)試集中最大值、最小值差異帶來(lái)的影響,在對(duì)數(shù)據(jù)預(yù)處理時(shí)采用Standard 歸一化。針對(duì)網(wǎng)絡(luò)的每一類輸入數(shù)據(jù),分別計(jì)算其訓(xùn)練集中的樣本均值μ和樣本標(biāo)準(zhǔn)差S,再依據(jù)式(12) 進(jìn)行轉(zhuǎn)換。由于網(wǎng)絡(luò)在訓(xùn)練過(guò)程中對(duì)數(shù)據(jù)進(jìn)行了歸一化處理,在與仿真數(shù)據(jù)對(duì)比時(shí),網(wǎng)絡(luò)輸出的數(shù)據(jù)需要再經(jīng)過(guò)式(13)進(jìn)行逆歸一化,以映射出實(shí)際的狀態(tài)信息。
損失函數(shù)是度量網(wǎng)絡(luò)模型泛化能力的標(biāo)準(zhǔn)。為避免網(wǎng)絡(luò)模型在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合導(dǎo)致模型泛化能力降低的現(xiàn)象,在損失函數(shù)中增加網(wǎng)絡(luò)權(quán)重正則化函數(shù)是一種常用的避免過(guò)擬合技術(shù)。在訓(xùn)練網(wǎng)絡(luò)時(shí),采用均方誤差作為度量網(wǎng)絡(luò)輸出與實(shí)際標(biāo)簽之間差異的損失函數(shù),并添加L2 正則化函數(shù)以限制權(quán)重保持在小數(shù)值范圍,通過(guò)調(diào)節(jié)超參數(shù)λ 的大小可以改變正則化項(xiàng)對(duì)網(wǎng)絡(luò)的影響,使得網(wǎng)絡(luò)具有更好的泛化能力[20],整個(gè)網(wǎng)絡(luò)的損失函數(shù)如式(14)所示:
式中:J 表示網(wǎng)絡(luò)損失函數(shù);m 為單次輸入網(wǎng)絡(luò)中的樣本數(shù)據(jù)個(gè)數(shù);為網(wǎng)絡(luò)模型的輸出;Y為網(wǎng)絡(luò)輸出的標(biāo)簽值;λ 為正則化項(xiàng)的懲罰系數(shù)為0.001;W 表示網(wǎng)絡(luò)權(quán)重。
在網(wǎng)絡(luò)反向傳播過(guò)程,采用RMSprop 自適應(yīng)優(yōu)化器用于計(jì)算更新模型參數(shù),參數(shù)更新流程如圖12[21]所示。首先初對(duì)參數(shù)進(jìn)行初始化,如全局學(xué)習(xí)率ε、衰減率ρ 和小常數(shù)ξ,其中小常數(shù)ξ 的作用是在計(jì)算Δθn時(shí),避免累計(jì)平方梯度為0 導(dǎo)致參數(shù)更新過(guò)程發(fā)散。RMSprop 作為一種自適應(yīng)優(yōu)化器,在計(jì)算梯度時(shí)采用超參數(shù)衰減率ρ 以弱化累計(jì)梯度的影響,使得參數(shù)更新過(guò)程時(shí)不因?yàn)檠h(huán)次數(shù)的增大而減小,通過(guò)設(shè)置合理的超參數(shù)ρ 可以避免網(wǎng)絡(luò)訓(xùn)練過(guò)程中出現(xiàn)梯度消失的情況。
圖12 RMSprop 優(yōu)化器更新策略Fig.12 RMSprop optimizer update strategy
隨著訓(xùn)練循環(huán)次數(shù)的增加,不斷縮減全局學(xué)習(xí)率可以使得網(wǎng)絡(luò)達(dá)到更好的訓(xùn)練效果。因此在RMSprop 的基礎(chǔ)上,對(duì)于全局學(xué)習(xí)率采用動(dòng)態(tài)調(diào)整的策略,網(wǎng)絡(luò)每訓(xùn)練100 個(gè)循環(huán)全局學(xué)習(xí)率縮減為原來(lái)0.6 倍,全局學(xué)習(xí)率動(dòng)態(tài)更新的偽代碼如圖13 所示。
對(duì)照組患者采用傳統(tǒng)的護(hù)理干預(yù),主要為患者入院后,協(xié)助其進(jìn)行常規(guī)檢查,并對(duì)臨床治療方式進(jìn)行講解,同時(shí)對(duì)病情進(jìn)行觀察。研究組患者采用以人為本的護(hù)理理念進(jìn)行干預(yù),主要包括改善護(hù)理理念、打造人性化護(hù)理環(huán)境、加大臨床服務(wù)意識(shí)、人性化心理干預(yù)等。
圖13 全局學(xué)習(xí)率動(dòng)態(tài)更新策略Fig.13 Dynamic update strategy of global learning rate
通常網(wǎng)絡(luò)訓(xùn)練流程以及網(wǎng)絡(luò)模型的結(jié)構(gòu)呈開環(huán)結(jié)構(gòu),網(wǎng)絡(luò)輸入與輸出無(wú)閉環(huán)連接,輸入數(shù)據(jù)均來(lái)自于采集的樣本數(shù)據(jù)。訓(xùn)練過(guò)程如圖14 藍(lán)色部分所示,此時(shí)網(wǎng)絡(luò)模型呈開環(huán)結(jié)構(gòu)。
圖14 閉環(huán)訓(xùn)練Fig.14 Training in closed structure
為減少數(shù)據(jù)建模過(guò)程中模型對(duì)于輸入數(shù)據(jù)的需求,使數(shù)據(jù)模型能夠像物理模型一樣驅(qū)動(dòng),需要建立閉環(huán)結(jié)構(gòu)的網(wǎng)絡(luò)模型,以實(shí)現(xiàn)數(shù)據(jù)模型遞歸更新的能力。然而,如果仍然按照開環(huán)的方式訓(xùn)練模型參數(shù),就必須破壞網(wǎng)絡(luò)結(jié)構(gòu),使得網(wǎng)絡(luò)呈開環(huán)條件下進(jìn)行訓(xùn)練。
為構(gòu)建適應(yīng)于閉環(huán)網(wǎng)絡(luò)的訓(xùn)練方法,在網(wǎng)絡(luò)的輸入過(guò)程中不再提供狀態(tài)變量橫向速度和橫擺角速度的數(shù)據(jù)信息,而是在訓(xùn)練網(wǎng)絡(luò)模型中引入中間狀態(tài)進(jìn)行替代。在網(wǎng)絡(luò)迭代之前,對(duì)中間狀態(tài)變量橫向速度和橫擺角速度進(jìn)行0 值初始化,聯(lián)合采集的縱向速度和方向盤轉(zhuǎn)角信息一起輸入至網(wǎng)絡(luò)中,數(shù)據(jù)標(biāo)簽為采集的橫擺角速度和橫向速度。當(dāng)開始訓(xùn)練時(shí),再依次經(jīng)過(guò)前向傳播,損失函數(shù)計(jì)算和反向更新參數(shù),同時(shí)將網(wǎng)絡(luò)前向傳播預(yù)測(cè)的狀態(tài)信息用于更新中間狀態(tài)變量,再聯(lián)合數(shù)據(jù)集中的縱向速度和方向轉(zhuǎn)角信息作為新的輸入序列,用于下一時(shí)刻的預(yù)測(cè)。
與文獻(xiàn)[18]開環(huán)訓(xùn)練方法相對(duì)比,兩組訓(xùn)練方法下?lián)p失函數(shù)數(shù)值變化趨勢(shì)如圖15 所示。在500 次循環(huán)訓(xùn)練后,兩組方法均能使得網(wǎng)絡(luò)收斂至平穩(wěn)水平。在開環(huán)訓(xùn)練條件下,損失函數(shù)最終收斂至0.000 53。相比于閉環(huán)條件下,損失函數(shù)收斂至更低的水平。
圖15 損失函數(shù)變化對(duì)比Fig.15 Comparison of loss function changes
在模型泛化性對(duì)比分析中,對(duì)比對(duì)象分別選擇基于開環(huán)訓(xùn)練方法得到的閉環(huán)網(wǎng)絡(luò)模型和無(wú)精確先驗(yàn)信息下的線性化橫向模型,并以Trucksim 仿真數(shù)據(jù)作為標(biāo)準(zhǔn)參考值。
橫向速度的預(yù)測(cè)結(jié)果如圖16 所示,3 組模型預(yù)測(cè)結(jié)果的變化趨勢(shì)基本一致。通過(guò)輸出預(yù)測(cè)結(jié)果的絕對(duì)值誤差曲線,線性化橫向模型的誤差曲線顯著高于網(wǎng)絡(luò)模型,結(jié)果如圖17 所示。為進(jìn)一步分析模型之間的相對(duì)誤差,對(duì)橫向速度的絕對(duì)值誤差曲線進(jìn)行統(tǒng)計(jì)分析,分別計(jì)算標(biāo)準(zhǔn)差、最大值和平均值3 個(gè)統(tǒng)計(jì)量,結(jié)果如表5 所示,不同模型之間的相對(duì)誤差如圖18 所示。在3 組橫向速度的誤差統(tǒng)計(jì)分析中,線性化物理模型的誤差最大,誤差統(tǒng)計(jì)結(jié)果分別為0.035、0.233 km/h 和0.061 km/h。對(duì)比圖18中的統(tǒng)計(jì)量的變化趨勢(shì),結(jié)果證明模型誤差按照線性化橫向模型、開環(huán)訓(xùn)練模型和閉環(huán)訓(xùn)練模型的順序遞減。其中,閉環(huán)訓(xùn)練模型誤差的最大值為0.079 km/h,平均值為0.006 km/h,標(biāo)準(zhǔn)差為0.007,相比于開環(huán)訓(xùn)練結(jié)果降低了58.40%、64.71%和41.67%。閉環(huán)訓(xùn)練結(jié)果顯著提高了橫向速度預(yù)測(cè)的精度。
圖16 橫向速度預(yù)測(cè)結(jié)果對(duì)比Fig.16 Comparison of lateral velocity prediction results
圖17 橫向速度絕對(duì)值誤差Fig.17 Absolute value error of lateral velocity
表5 橫向速度誤差統(tǒng)計(jì)分析Table 5 Statistical analysis of lateral velocity
圖18 橫向速度相對(duì)誤差分析Fig.18 Relative error analysis of lateral velocity
圖19 橫擺角速度預(yù)測(cè)結(jié)果對(duì)比Fig.19 Comparison of lateral velocity prediction results
圖20 橫擺角速度絕對(duì)值誤差Fig.20 Absolute value error of lateral velocity
圖21 橫擺角速度誤差對(duì)比分析圖Fig.21 Relative error analysis of yaw rate
表6 橫擺角速度誤差統(tǒng)計(jì)分析Table 6 Statistical analysis of yaw rate error
通過(guò)對(duì)測(cè)試集中橫向速度和橫擺角速度的預(yù)測(cè)誤差進(jìn)行分析可知:相對(duì)數(shù)據(jù)建模,線性化橫向模型保真度較低;對(duì)于閉環(huán)網(wǎng)絡(luò)模型,采用閉環(huán)訓(xùn)練能夠使得網(wǎng)絡(luò)具有更高的保真度。盡管在網(wǎng)絡(luò)訓(xùn)練階段,文獻(xiàn)[18]中的開環(huán)訓(xùn)練方法能夠使得損失函數(shù)降至更低的水平,這是因?yàn)榫W(wǎng)絡(luò)在訓(xùn)練過(guò)程呈開環(huán)的結(jié)構(gòu),網(wǎng)絡(luò)的輸入全部來(lái)自于采集的數(shù)據(jù),輸入信息貼近系統(tǒng)真實(shí)狀態(tài)。然而,在測(cè)試階段為實(shí)現(xiàn)網(wǎng)絡(luò)遞歸更新的能力,直接將網(wǎng)絡(luò)輸出數(shù)據(jù)用于下一時(shí)刻的輸入。由于模型結(jié)構(gòu)發(fā)生了變化,網(wǎng)絡(luò)輸入數(shù)據(jù)的來(lái)源與訓(xùn)練階段不一致。當(dāng)預(yù)測(cè)的結(jié)果與實(shí)際狀態(tài)不一致時(shí),再聯(lián)合采集的數(shù)據(jù)輸入至網(wǎng)絡(luò)就等同于向網(wǎng)絡(luò)輸入了錯(cuò)誤的數(shù)據(jù),因此使得模型保真度降低。
閉環(huán)訓(xùn)練方法,通過(guò)引入中間狀態(tài)變量,使得網(wǎng)絡(luò)在訓(xùn)練時(shí)仍然呈閉環(huán)結(jié)構(gòu),網(wǎng)絡(luò)能夠在僅輸入縱向速度和方向盤轉(zhuǎn)角的條件下進(jìn)行訓(xùn)練。保證了閉環(huán)網(wǎng)絡(luò)模型在訓(xùn)練階段和測(cè)試階段模型結(jié)構(gòu)與輸入數(shù)據(jù)來(lái)源的一致性。因此,閉環(huán)訓(xùn)練能夠使得閉環(huán)網(wǎng)絡(luò)具有更好的保真度。
本文在無(wú)先驗(yàn)物理參數(shù)信息和車輛動(dòng)力學(xué)函數(shù)關(guān)系條件下,針對(duì)某型五軸特種車輛的橫向動(dòng)力學(xué)行為特性,基于數(shù)據(jù)建模的方法搭建了閉環(huán)結(jié)構(gòu)的網(wǎng)絡(luò)模型以表征車輛橫向動(dòng)力學(xué),并設(shè)計(jì)了一種閉環(huán)的訓(xùn)練方法。通過(guò)對(duì)比分析得出以下主要結(jié)論:
1) 在無(wú)精確物理參數(shù)信息和動(dòng)力學(xué)函數(shù)關(guān)系條件下,簡(jiǎn)化的物理模型難以準(zhǔn)確預(yù)測(cè)車輛的運(yùn)動(dòng)狀態(tài),數(shù)據(jù)模型具有更好的保真度。在物理模型遞歸特性的啟發(fā)下,搭建的閉環(huán)網(wǎng)絡(luò)模型減少了輸入數(shù)據(jù)的需求,網(wǎng)絡(luò)輸入數(shù)據(jù)僅需縱向速度和方向盤轉(zhuǎn)角即可預(yù)測(cè)車輛橫向動(dòng)力學(xué)運(yùn)動(dòng)狀態(tài),網(wǎng)絡(luò)模型可以像物理模型一樣驅(qū)動(dòng)。
2) 在訓(xùn)練閉環(huán)結(jié)構(gòu)的網(wǎng)絡(luò)模型時(shí),設(shè)計(jì)了一種閉環(huán)的訓(xùn)練方法。網(wǎng)絡(luò)在訓(xùn)練過(guò)程中不斷迭代更新中間狀態(tài)變量,使得模型在訓(xùn)練過(guò)程時(shí),網(wǎng)絡(luò)的輸入信息僅包含縱向速度和方向盤轉(zhuǎn)角,模型始終保持閉環(huán)的結(jié)構(gòu)。相比于開環(huán)訓(xùn)練的方法,閉環(huán)訓(xùn)練有效提高了網(wǎng)絡(luò)模型的精度。在相同的網(wǎng)絡(luò)模塊下,橫向速度和橫擺角速度的預(yù)測(cè)誤差最大值降低了58.40% 和49.48%,平均值降低了64.71%和61.11%,標(biāo)準(zhǔn)差降低了41.67%和43.83%。
3) 相比物理建模,閉環(huán)網(wǎng)絡(luò)模型無(wú)需額外的輸入數(shù)據(jù),模型只需利用車輛狀態(tài)信息即可訓(xùn)練出高保真度的動(dòng)力學(xué)模型。因此,閉環(huán)結(jié)構(gòu)模型可以較好地應(yīng)用在自動(dòng)駕駛車輛模擬測(cè)試、軌跡規(guī)劃和控制領(lǐng)域。
附錄
A 離散化橫向動(dòng)力學(xué)模型
五軸特種車輛的離散橫向動(dòng)力學(xué)模型如式(A-1) 至式(A-5) 所示:
式中:vy(k) 和γ(k) 為k 時(shí)刻動(dòng)力模型預(yù)測(cè)的橫向速度和橫擺角速度;vx(k) 為k 時(shí)刻采集的車輛縱向速度;δ(k) 為k 時(shí)刻控制信號(hào)方向盤轉(zhuǎn)角;Ci,lat表示第i 軸輪胎的側(cè)偏剛度;Li表示第i 軸到質(zhì)心的距離;m 表示整車質(zhì)量;Iz表示轉(zhuǎn)動(dòng)慣量;η 表示方向盤轉(zhuǎn)角與一軸輪胎轉(zhuǎn)向角的傳動(dòng)比;T 表示離散時(shí)間間隔。模型參數(shù)如表A-1 所示。