唐 杰,王 凱,盧國華
(上汽通用五菱汽車股份有限公司,廣西 柳州 545000)
汽車自動變速器擋位決策系統(tǒng)對汽車的動力性和經(jīng)濟性有著至關(guān)重要的影響。傳統(tǒng)的擋位決策系統(tǒng)只對汽車行駛狀態(tài)產(chǎn)生影響,未能充分考慮駕駛員及環(huán)境因素的影響。隨著汽車進一步智能化,人機交互越來越重要,因此近年來汽車自動變速器智能擋位決策系統(tǒng)的研究非?;馃?。陳清洪等[1]研究發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡(luò)可以學(xué)習(xí)并預(yù)測車輛動態(tài)狀況、道路狀況及駕駛員特性的變化,提出了一種基于神經(jīng)網(wǎng)絡(luò)的三參數(shù)換擋策略;Elnashar[2]利用模糊理論和神經(jīng)網(wǎng)絡(luò)建立了汽車自動變速器擋位決策系統(tǒng),并對其進行了計算機仿真;Jantos等[3]在乘用車上開發(fā)和測試了機械式自動變速器,實驗結(jié)果表明,該變速器能夠有效提高車輛的經(jīng)濟性和駕駛性能;陰曉峰等[4]基于神經(jīng)網(wǎng)絡(luò)模型提出了車輛動態(tài)性能和經(jīng)濟性最優(yōu)的換擋策略;戴群亮等[5]提出了一種基于人工神經(jīng)網(wǎng)絡(luò)的自動變速器換擋策略;曾家謙[6]利用神經(jīng)網(wǎng)絡(luò)和貝葉斯融合決策對駕駛風格進行識別。
本文提出了一種基于深度殘差網(wǎng)絡(luò)的智能換擋控制策略。該策略首先將采集到的實車節(jié)氣門開度、車速及加速度等3個參數(shù)輸入自編碼器進行無監(jiān)督學(xué)習(xí),得到神經(jīng)網(wǎng)絡(luò)的初始權(quán)重,然后對自編碼器進行重組并添加殘差連接以建立起深度殘差網(wǎng)絡(luò),利用實車數(shù)據(jù)對深度殘差網(wǎng)絡(luò)進行監(jiān)督訓(xùn)練,對初始權(quán)重進行微調(diào),最終得到基于深度殘差網(wǎng)絡(luò)的智能換擋控制策略?;趯嵻嚁?shù)據(jù),與傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的方法進行了對比,實驗結(jié)果表明,本文提出的方法擋位識別精度更高,可以更好地理解駕駛員的換擋意圖,使得人機交互體驗得以提升。
本文提出的基于深度殘差網(wǎng)絡(luò)的智能換擋控制策略模型示意圖如圖1所示。駕駛員通過加速踏板對發(fā)動機進行控制,并將加速踏板的操縱信號輸入神經(jīng)網(wǎng)絡(luò)控制器。自動變速器將動力傳輸至車輪,同時將車速和加速度信號輸入神經(jīng)網(wǎng)絡(luò)控制器,控制器對擋位進行決策并向自動變速器發(fā)出換擋信號。本文使用的整車模型和深度殘差網(wǎng)絡(luò)控制器模型均運用MATLAB/Simulink建立,深度殘差網(wǎng)絡(luò)控制器模型如圖2所示。
圖1 智能換擋控制策略模型
圖2 深度殘差網(wǎng)絡(luò)控制器模型
人工神經(jīng)網(wǎng)絡(luò)是一種典型的深度學(xué)習(xí)模型,它將多個不同的函數(shù)組合在一起,可以對足夠復(fù)雜的數(shù)據(jù)進行分類或擬合回歸。人工神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)包括輸入層、隱藏層及輸出層。某神經(jīng)網(wǎng)絡(luò)的隱藏層計算過程如下:
(1)
(2)
對于單個樣本(x(i),y(i)),神經(jīng)網(wǎng)絡(luò)的代價函數(shù)J(W,b;x(i),y(i))如下:
(3)
神經(jīng)網(wǎng)絡(luò)的優(yōu)化過程即利用反向傳播算法[7]求最小代價函數(shù)的過程。
自編碼器是一種無監(jiān)督預(yù)訓(xùn)練神經(jīng)網(wǎng)絡(luò)[8],其功能是將輸入信息作為學(xué)習(xí)目標,并對輸入信息進行表征學(xué)習(xí),自編碼器包括編碼器和解碼器。自編碼器結(jié)構(gòu)如圖3所示。
圖3 自編碼器
自編碼器與神經(jīng)網(wǎng)絡(luò)的代價函數(shù)不同。神經(jīng)網(wǎng)絡(luò)的優(yōu)化目標是得到預(yù)測標簽值,而自編碼器的優(yōu)化目標是得到與輸入盡可能相同的預(yù)測值,因此基于神經(jīng)網(wǎng)絡(luò)代價函數(shù)得到自編碼器的代價函數(shù),如式(4)所示:
(4)
若自編碼器的編碼維度大于輸入數(shù)據(jù)的維度,則該自編碼器為過完備自編碼器。過完備自編碼器在訓(xùn)練過程中易出現(xiàn)對輸入的簡單復(fù)制而無法學(xué)習(xí)到數(shù)據(jù)有效特征的情況,從而導(dǎo)致自編碼器訓(xùn)練失敗,因此需要在其代價函數(shù)中加入稀疏懲罰,此時自編碼的代價函數(shù)改寫為:
(5)
(6)
在深度學(xué)習(xí)領(lǐng)域,隨著模型深度的增加,模型的容量也在增加。但是當模型的深度達到一定的程度時模型會退化,即訓(xùn)練誤差越來越大。而殘差網(wǎng)絡(luò)通過一種殘差連接(short-cut)解決了這個問題[9],并減少了模型的訓(xùn)練時間。short-cut是指在標準前饋神經(jīng)網(wǎng)絡(luò)的基礎(chǔ)上加入一個跳躍連接以直接跳過某些層。標準前饋神經(jīng)網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)的對比如圖4所示。
圖4 標準前饋神經(jīng)網(wǎng)絡(luò)與殘差網(wǎng)絡(luò)對比
經(jīng)過兩層前饋神經(jīng)網(wǎng)絡(luò)預(yù)測的預(yù)測值H(x)計算過程如下:
f(x)=ReLU(b1+xin·w1)
(7)
H(x)=ReLU(b2+f(x)·w2)
(8)
式中:xin為網(wǎng)絡(luò)的輸入;w1,w2分別為第一、二層神經(jīng)層的權(quán)重;b1,b2分別為第一、二層神經(jīng)層的偏置;ReLU為激活函數(shù)。
而殘差網(wǎng)絡(luò)中預(yù)測值H(x)與x之間存在函數(shù)關(guān)系,假設(shè)兩者之間的函數(shù)關(guān)系滿足H(x)=2x,則殘差網(wǎng)絡(luò)的預(yù)測值H(x)如下:
H(x)=ReLU(b2+f(x)·w2)+xin
(9)
殘差網(wǎng)絡(luò)通過添加了一個short-cut連接,在輸入與輸出之間形成兩個通道,同時由于short-cut連接將輸入直接連接到輸出,因此很好地解決了梯度消失/爆炸的問題,使得網(wǎng)絡(luò)可訓(xùn)練性提高。
以自編碼器及殘差網(wǎng)絡(luò)為基礎(chǔ),建立基于深度殘差網(wǎng)絡(luò)的智能換擋控制策略模型,模型的訓(xùn)練流程如圖5所示。
圖5 基于深度殘差網(wǎng)絡(luò)的智能換擋控制策略模型訓(xùn)練流程
首先從實車數(shù)據(jù)中提取節(jié)氣門開度、車速及加速度作為特征輸入,分別進行6個自編碼器的無監(jiān)督預(yù)訓(xùn)練,每個自編碼器神經(jīng)元個數(shù)為10;然后重組自編碼器隱藏層,構(gòu)建包含6個隱藏層的神經(jīng)網(wǎng)絡(luò),并添加short-cut連接建立深度殘差網(wǎng)絡(luò);最后利用實車數(shù)據(jù)對深度殘差網(wǎng)絡(luò)的權(quán)重進行微調(diào),得到基于深度殘差網(wǎng)絡(luò)的智能換擋控制策略模型。
在自動變速器中,基本的換擋規(guī)則已在控制器中預(yù)設(shè),車輛只能在不同的駕駛環(huán)境下根據(jù)固定的換擋控制策略來換擋,因此在實際駕駛過程中,決策的擋位并非最優(yōu)。本文采集了5種路況下駕駛員在實際駕駛過程中手動換擋的相關(guān)數(shù)據(jù),主要包括擋位、節(jié)氣門開度、車速和加速度等信息,采集的實車數(shù)據(jù)量見表1。對二參數(shù)的深度殘差網(wǎng)絡(luò)進行訓(xùn)練時,輸入特征為節(jié)氣門開度和車速,標簽值為擋位;對三參數(shù)的深度殘差網(wǎng)絡(luò)進行訓(xùn)練時,輸入特征為節(jié)氣門開度、車速和加速度,標簽值為擋位。
表1 采集的實車數(shù)據(jù)量
不同參數(shù)量下基于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)和深度殘差網(wǎng)絡(luò)的智能換擋策略對比結(jié)果分別如圖6、圖7所示。
圖6 基于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的智能換擋策略對比結(jié)果
圖7 基于深度殘差網(wǎng)絡(luò)的智能換擋策略對比結(jié)果
仿真結(jié)果表明,不同工況下,由于三參數(shù)換擋策略比二參數(shù)換擋策略多了一個輸入特征——汽車加速度,因此三參數(shù)換擋策略包含了更多的換擋信息,相比二參數(shù)智能換擋策略的精度更高,故本文采用三參數(shù)換擋策略。
在確定了換擋策略參數(shù)量后,利用實車數(shù)據(jù)對基于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)與深度殘差網(wǎng)絡(luò)的智能換擋策略進行對比實驗,實驗結(jié)果如圖8所示,由圖可知,兩種策略在擋位穩(wěn)定時的識別率均較好,但汽車在加速及減速時基于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的策略不能充分領(lǐng)會駕駛員的駕駛意圖,升、降擋會出現(xiàn)延遲或提前,在換擋時甚至出現(xiàn)循環(huán)跳擋的情況。
圖8 智能換擋策略對比試驗
擋位識別率對比見表2。由實驗結(jié)果可知,在不同路況下,基于傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的智能換擋策略的擋位識別率均達到98%以上,平均識別率為98.6%,而基于深度殘差網(wǎng)絡(luò)的智能換擋策略擋位識別率更高,不同路況下的擋位識別率均在99%以上,平均識別率為99.4%。因此本文提出的方法可以更好地理解駕駛員換擋意圖,使得人機交互體驗得以提升。
表2 不同智能換擋策略擋位識別率對比 %
本文針對傳統(tǒng)換擋策略中人機交互體驗較差的問題,提出了基于深度殘差網(wǎng)絡(luò)的智能換擋策略。首先將采集得到的不同路況下駕駛員手動換擋數(shù)據(jù)輸入自編碼器進行預(yù)訓(xùn)練,然后將自編碼器重組,并加入殘差連接(short-cut),建立起深度殘差網(wǎng)絡(luò)。根據(jù)智能換擋策略參數(shù)對比實驗確定了三參數(shù)換擋策略,將實車數(shù)據(jù)中節(jié)氣門開度、車速及加速度作為深度殘差網(wǎng)絡(luò)的輸入,擋位為標簽值,對傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)及深度殘差網(wǎng)絡(luò)進行訓(xùn)練及測試。實驗結(jié)果表明,基于深度殘差網(wǎng)絡(luò)的智能換擋策略的擋位識別率較高,平均值為99.4%,比傳統(tǒng)人工神經(jīng)網(wǎng)絡(luò)的擋位識別率提高了近1%,因此本文提出的方法可以更好地理解駕駛員的換擋意圖,使得人機交互體驗得以提升。