文繼澤,張 曼,,林 楠,施樹明
(1.西安工業(yè)大學機電工程學院,西安 710021;2.吉林大學交通學院,長春 130022)
長途貨運占有交通運輸行業(yè)很大的市場份額,重型汽車作為長途公路運輸?shù)闹饕ぞ撸啾扔谳p型汽車,不但具有較大比例的燃油消耗量,也是污染物的來源。當前,為提高車輛效率和減少環(huán)境污染,車輛智能化的發(fā)展產(chǎn)生了許多可供選擇的新技術(shù)。例如,多種替代燃料、節(jié)能動力系統(tǒng)等被嵌入重型汽車中,并逐漸提高了重型汽車的市場滲透率。其中,燃油消耗和污染物排放的評價,以及采用新技術(shù)的重型汽車整車開發(fā)與測試環(huán)節(jié)等均需要構(gòu)建車輛運行工況。然而,不同于常行駛于城市和郊區(qū)道路環(huán)境的輕型汽車,用于長途載貨運輸?shù)闹匦推嚦P旭傆诟咚俟翻h(huán)境,車輛行駛速度高,且行駛環(huán)境往往涵蓋平原、丘陵、山地、高原等道路條件??紤]到道路坡度對評價和測試的影響不能忽略,很有必要構(gòu)建滿足工況質(zhì)量條件且具有高生成效率的重型汽車多參數(shù)運行工況。這將有利于提高測試和評價的有效性和準確性,為一系列重型汽車新技術(shù)的發(fā)展打下基礎(chǔ)。
BHATTI等和TOPI?等基于馬爾可夫鏈蒙特卡羅方法,將多參數(shù)的行駛工況狀態(tài)離散化,馬爾可夫鏈狀態(tài)包括車輛速度、車輛加速度和道路坡度。利用隨機生成方法,分別設(shè)計了城市公交車和電動車在坡道上的行駛工況,生成工況不僅反映出隨機駕駛特性,而且達到與原始數(shù)據(jù)庫很高的一致性。然而,高速坡路工況不同于城市坡路工況,多參數(shù)工況的離散狀態(tài)相對較多,利用馬爾可夫的隨機性,一般多次隨機生成也較難實現(xiàn)工況特征指標閾值要求。岳柄劍等和ZHAO Bolin等研究了面向重型汽車高速坡道行駛的工況構(gòu)建,基于包含道路坡度信息的行駛數(shù)據(jù),采用單純的馬爾可夫鏈方法計算速度、加速度和道路坡度的狀態(tài)轉(zhuǎn)移矩陣,發(fā)現(xiàn)工況狀態(tài)空間巨大,即使經(jīng)過長時間的隨機生成,有些工況特征指標仍不令人滿意。這說明工況狀態(tài)個數(shù)、有限工況時間長度、工況質(zhì)量設(shè)計要求等均影響該方法的設(shè)計效率。CUI Yuepeng等和YUAN Mengfei等利用HM與馬爾可夫鏈結(jié)合的方法,構(gòu)建了城市坡道典型行駛工況。但是,高速公路行駛工況片段長,離散行駛工況狀態(tài)的連接處仍要按照行駛狀態(tài)轉(zhuǎn)移規(guī)則連接,然而純啟發(fā)式方法常隨機地施加到工況狀態(tài)序列上,導致被作用后的工況狀態(tài)序列出現(xiàn)異常跳躍的速度和加速度。最后獲得滿足代表性質(zhì)量要求的工況序列概率極低,生成效率變低。
對此,為了構(gòu)建滿足工況質(zhì)量目標條件且具有高生成效率的重型汽車多參數(shù)運行工況,針對現(xiàn)有純隨機的HM會破壞工況行駛特征,從而出現(xiàn)生成效率低的問題,本文通過描述代表性行駛工況生成問題,提出改進的多個HM,并結(jié)合當下的學習方法——蒙特卡洛樹搜索選擇更合適的HM,進一步提高工況生成效率。
由于期望的工況序列要求滿足與原始數(shù)據(jù)庫行駛特征一致,所以選擇包含速度類[怠速時間比例,p/%;平均速度,/(m·s);平均行駛速度,/(m·s);行 駛 速 度 標 準 差,/(m·s)]、加速度類[加速時間比例,/%;勻速時間比例,/%;減速時間比例,/%]、動力學類[單位距離上的正加速動能,PKE/(m·s);速度和加速度聯(lián)合概率分布相關(guān)系數(shù),/%]、坡度類[平均爬坡度,%;平均下坡度,%]等共11個評價指標,以此表征行駛工況特征。
工況質(zhì)量要求,即將工況構(gòu)建目標看成是工況序列要滿足與原始數(shù)據(jù)庫指定評價指標的相對偏差閾值約束,具體表達為式為:
式中:為生成工況,s;為原始行駛數(shù)據(jù)評價指標值;為生成工況的評價指標值;為允許偏差;為評價指標個數(shù)。
為將多目標函數(shù)轉(zhuǎn)化為單目標函數(shù),將式(1)歸一化為式(2);并使用滿意準則函數(shù),具體為式(3),最終獲得單目標函數(shù),如式(4)所示。
式中:為滿意準則輔助函數(shù);為工況狀態(tài);為工況狀態(tài)空間;為生成工況的目標函數(shù)。例如,當設(shè)置相對偏差目標閾值Δ為0.1時,對應目標函數(shù)值為0.1的工況即為最優(yōu)工況。最終將求解期望運行工況問題轉(zhuǎn)化為有限時間長度的工況序列滿足指定評價指標相對偏差值閾值約束的優(yōu)化問題。
HM是求解期望工況優(yōu)化問題的常用方法,但基于純隨機性的HM會破壞工況狀態(tài)特性,需要改進HM,同時進一步提高收斂到期望工況的效率,本文提出基于MCTS-HM的多參數(shù)行駛工況構(gòu)建方法框架,如圖1所示,具體為利用傳統(tǒng)馬爾可夫鏈隨機模擬方法生成有限時間長度多參數(shù)行駛工況序列的種群;通過改進的多個HM被作用后的工況序列仍滿足行駛工況動態(tài)轉(zhuǎn)移特性,以此更新工況狀態(tài)序列;采用MCTS來決定在一個迭代過程選擇哪些HM用于改進當前工況序列,并使用指數(shù)蒙特卡羅作為接受準則,判斷是否接受應用HM后的工況序列。反復迭代更新工況種群,直至輸出最優(yōu)工況序列。
圖1 基于MCTS-HM的多參數(shù)行駛工況構(gòu)建方法框架
為了盡可能地通過多種方式使工況序列更快接近目標工況,需要設(shè)計滿足行駛工況動態(tài)轉(zhuǎn)移特性的HM。
本文試圖通過擾動當前的工況序列提高工況質(zhì)量。借鑒交叉思想,交換一定長度的不同工況片段設(shè)計HM,交換點處要求滿足多參數(shù)工況狀態(tài)轉(zhuǎn)移特性,具體如下。
設(shè)為當前工況序列,為隨機運行工況序列,如式(5)和式(6)所示。
式中:,∈(1,2,…,N);N為工況序列長度;為工況狀態(tài);P為當前迭代次數(shù)下的工況種群;為種群大小,初始工況序列種群通過馬爾可夫鏈模擬方法得到。
基于交叉思想的啟發(fā)式方法設(shè)計如下:
首先,設(shè)定有限工況片段長度;其次,將中任意長度的工況片段替換中任意長度的工況片段;最后,生成新工況序列X,如:
同時滿足以下約束條件:
為了進一步提高工況質(zhì)量,需要尋找作用到工況序列上合適的HM,運用MCTS方法進行智能決策,將HM的搜索空間建模為1個樹,搜索樹的每個結(jié)點代表1個啟發(fā)式,搜索樹表示啟發(fā)式搜索空間。因此,MCTS的4個步驟具體如下。
(1)選擇:從根結(jié)點開始,運用上限置信區(qū)間(Upper Confidence Bound,UCB)選擇要添加到當前樹路徑的HM。在當前迭代次數(shù)下,父結(jié)點有個子結(jié)點,根據(jù)UCB值按如下式(7)選擇最合適的啟發(fā)式。
式中:為比例因子;n為當前迭代次數(shù)下第個子結(jié)點的啟發(fā)式被選用的次數(shù);q為當前迭代次數(shù)下第個子結(jié)點的經(jīng)驗評估值,即累積評估值,如式(8)所示。
式中:((-)/)·100為第個子結(jié)點將該啟發(fā)式施加到當前工況序列后工況函數(shù)值的變化;為當前工況的函數(shù)值;為當前工況應用該啟發(fā)式后的函數(shù)值,迭代選擇最佳子結(jié)點直至達到葉子結(jié)點,即未選用過的啟發(fā)式結(jié)點。此過程輸出為啟發(fā)式序列。
(2)擴展:為了探索啟發(fā)式空間的新區(qū)域,隨機選擇1個未探索的結(jié)點(一個不包含在當前的部分樹路徑中的啟發(fā)式),并將其添加到當前的部分樹路徑中。
(3)模擬:從生成樹路徑的葉子結(jié)點開始,將結(jié)點的啟發(fā)式施加到給定工況序列中,根據(jù)工況序列函數(shù)值的改進,采用指數(shù)蒙特卡洛(Exponential Monte Carlo,EMC)作為接受準則,判斷是否接受該工況序列,依次操作直到根結(jié)點。
(4)更新:使用式(8)更新從葉子結(jié)點到根結(jié)點路徑中每個結(jié)點的經(jīng)驗評估值和選用次數(shù)。
在啟發(fā)式對工況序列進行改進的同時,工況序列種群要更新。具體來說,在每次迭代中,從工況種群中隨機選擇一條工況,將蒙特卡洛樹路徑識別的最優(yōu)啟發(fā)式序列依次應用于該工況,并根據(jù)以下方式更新工況種群,采取3種隨機更新規(guī)則。
(1)如果新的工況序列質(zhì)量優(yōu)于工況種群中最差的工況序列,可用它取代最差的工況。
(2)無論新的工況序列質(zhì)量是否變優(yōu),均將取代工況種群中最差的工況序列。
(3)無論新的工況序列質(zhì)量是否變優(yōu),新的工況序列將被工況種群外隨機生成的工況序列所取代。
前兩種規(guī)則重點優(yōu)化工況種群,第3種規(guī)則重在促進工況多樣性,并防止陷入局部解。
試驗數(shù)據(jù)來源于某用戶駕駛某型號重型牽引車在坡道頻繁的山區(qū)高速公路上行駛的數(shù)據(jù),其行駛路線如圖2所示。車輛從中國長春市空載行駛至磐石(標識1到標識2路段),并裝載貨物;然后載貨行駛到河北省雄縣(標識3)卸貨;再空載至保定市曲陽(標識4和標識5)重新裝載貨物,行駛經(jīng)過安新縣(標識6);最后行駛至延吉到達吉林市(標識7)卸貨。
圖2 試驗路線
車輛裝載產(chǎn)自奧地利的模塊化同步數(shù)據(jù)采集設(shè)備DEWE-M4S,該設(shè)備可同步獲取奧地利設(shè)備VGPS的信號(道路經(jīng)緯度和車速信息)、CAN總線信號以及加速傳感器信號。數(shù)據(jù)采集頻率為10 Hz,采集參數(shù)包括速度、加速度、高程等。提取高速公路行駛數(shù)據(jù),并經(jīng)過去噪和濾波處理,再采用坡度估計方法離線計算得到已知行駛路徑時域上的道路坡度,最終得到2 980 km高速公路的有效行駛數(shù)據(jù)。
考慮到工況序列是利用馬爾科夫鏈隨機模擬生成,因此需要將工況的多個行駛參數(shù)離散化。具體如下:
行駛狀態(tài)參數(shù)設(shè)定:速度、加速度和坡度步長分別為0.5 m/s,0.1 m/s,1%;怠速狀態(tài)對應的速度區(qū)間為0~0.1 m/s,加速度區(qū)間為-0.02~0.02 m/s,坡度區(qū)間為-0.2~0.2%。速度范圍0~35 m/s劃分成71個狀態(tài),加速度范圍-2~2 m/s劃分成41個狀態(tài),坡度范圍-10%~10%劃分成21個狀態(tài)。將實際采集數(shù)據(jù)的三維空間狀態(tài)轉(zhuǎn)化到一維空間中,最終根據(jù)參考文獻[7]計算3個參數(shù)的狀態(tài)轉(zhuǎn)移矩陣,其二維投影圖如圖3所示。生成的多參數(shù)工況序列狀態(tài)要滿足該狀態(tài)轉(zhuǎn)移特性。工況序列長度設(shè)置為常見的1 800 s,工況序列種群大小為15。
圖3 三個參數(shù)的狀態(tài)轉(zhuǎn)移矩陣的二維平面投影
MCTS-HM方法的參數(shù)設(shè)置如下:由于工況片段長度是任意的,所以會對應大量的啟發(fā)式。本文按照交換工況片段長度將HM分成4組??山粨Q工況片段區(qū)間為[1,100]、[100,200]、[200,1 800]和[1 800]四類啟發(fā)式。搜索樹寬度為算子個數(shù)4,搜索樹深度設(shè)置為3,比例因子為10。工況指標相對偏差閾值設(shè)置為10%,即最優(yōu)工況的函數(shù)值為0.1。在處理器型號為Intel(R)Core(TM)i7-9700K CPU,主頻為3.6 GHz,內(nèi)存為32 GB配置的計算機上,利用Matlab2017a執(zhí)行該方法直至輸出最優(yōu)工況序列。
基于隨機初始工況種群以及設(shè)定的初始參數(shù),運行MCTS-HM方法5次,直至輸出最優(yōu)工況,即工況函數(shù)值為0.1時達到停止條件。期望高速公路運行工況時間序列,如圖4所示。從時間序列上觀察發(fā)現(xiàn),當車輛處于爬坡時,速度會有所降低;當車輛下坡時,速度會增加,加速度處于小范圍波動狀態(tài);平路上,車輛常保持勻速狀態(tài)。以上特征較符合期望的重型汽車高速運行狀況。
圖4 MCTS-HM運行5次的最優(yōu)工況序列
此外,分析了期望工況的狀態(tài)轉(zhuǎn)移特征是否異常,如圖5所示,期望工況的狀態(tài)特征均在原始行駛工況動態(tài)轉(zhuǎn)移特征范圍內(nèi),說明期望工況均滿足原始行駛狀態(tài)轉(zhuǎn)移特征,同時驗證了提出方法的有效性。
圖5 期望工況的狀態(tài)轉(zhuǎn)移特征
多參數(shù)期望運行工況與原始數(shù)據(jù)庫的指標對比以及相對偏差絕對值,見表1和表2。該方法輸出的期望工況評價指標與原始采集數(shù)據(jù)相近,且所有評價指標的相對偏差絕對值都保持在設(shè)定閾值10%以內(nèi),速度和加速度聯(lián)合概率分布相關(guān)系數(shù)全部達到90%以上。采用MCTS-HM方法獲得的運行工況均滿足工況質(zhì)量要求,以此生成的多參數(shù)工況具有代表性,可直接應用于車輛性能測試與評估。
表1 MCTS-HM方法的期望工況與原始采集數(shù)據(jù)庫的評價指標
表2 MCTS-HM方法的期望工況與原始采集數(shù)據(jù)庫的評價指標相對偏差絕對值
為分析提出方法生成最優(yōu)工況的效率,在相同的行駛數(shù)據(jù)和設(shè)計目標下,本文統(tǒng)計隨機運行MCTS-HM方法5次直至輸出最優(yōu)工況的CPU運行時間,見表3,MCTS-HM方法的CPU運行時間均值在1 100 s左右,實際用時更短,而且該用時在實際工況設(shè)計過程中是完全可接受的。然而,由于隨機性會破壞行駛工況的狀態(tài)轉(zhuǎn)移特征,致使設(shè)計效率低,所以相比于純隨機HM,提出方法不僅性能好,而且效率高。
表3 隨機運行MCTS-HM方法的CPU用時
本文提出了一種蒙特卡洛樹搜索和啟發(fā)式方法的重型汽車多參數(shù)運行工況設(shè)計方法,并利用實際采集數(shù)據(jù)進行了分析驗證,與純隨機啟發(fā)式方法相比,可以得到以下結(jié)論:
(1)由多次試驗結(jié)果分析可知,該方法獲得的多參數(shù)運行工況符合重型汽車坡道高速運行狀況特征,與原始數(shù)據(jù)庫的特征指標相對偏差均滿足所設(shè)定的閾值范圍,滿足了工況質(zhì)量要求。
(2)生成工況均滿足原始采集數(shù)據(jù)的狀態(tài)轉(zhuǎn)移特征。
(3)在設(shè)定參數(shù)條件下,該方法的CPU運行時間均值為1 100 s,提出方法不僅性能好,而且效率高。
在下一步研究中,將期望工況應用于重型汽車動力性能和經(jīng)濟性能評估和測試,以及動力系統(tǒng)參數(shù)優(yōu)化等。此外,MCTS-HM的參數(shù)適用范圍取決于MCTS-HM參數(shù)對設(shè)計效果的影響,可繼續(xù)探討分析MCTS-HM各類參數(shù)對工況設(shè)計質(zhì)量以及效率的影響,為實際工況設(shè)計提供參考。