董康生, 黃長強, 黃漢橋, 曹林平, 唐傳林
(空軍工程大學(xué) 航空航天工程學(xué)院, 陜西 西安 710038)
?
基于混合策略的UCAV攻擊軌跡在線規(guī)劃方法
董康生, 黃長強, 黃漢橋, 曹林平, 唐傳林
(空軍工程大學(xué) 航空航天工程學(xué)院, 陜西 西安710038)
摘要:針對無人作戰(zhàn)飛機(unmanned combat aerial vehicle,UCAV)在線軌跡規(guī)劃問題,提出了一種基于混合策略的方法。首先,針對動態(tài)不確定環(huán)境,設(shè)計了基于事件觸發(fā)的軌跡滾動規(guī)劃方案;其次,基于UCAV飛行性能約束對數(shù)字地形進行平滑處理,生成安全可飛行曲面;再次,提出了利用函數(shù)表征重規(guī)劃段軌跡的方法,分析了軌跡函數(shù)特性和端點約束處理方法,進而將軌跡規(guī)劃問題轉(zhuǎn)化為軌跡函數(shù)尋優(yōu)問題,減少了軌跡尋優(yōu)參數(shù)數(shù)量;最后,引入平均速度和FUCH混沌映射對粒子群算法進行改進,并利用其對軌跡函數(shù)進行尋優(yōu)。數(shù)字仿真結(jié)果表明,利用該方法完成一次軌跡在線重規(guī)劃只需0.2 s,表明了該方法具有較好的實時性,能滿足軌跡在線規(guī)劃要求。
關(guān)鍵詞:UCAV;軌跡在線規(guī)劃;滾動優(yōu)化;軌跡函數(shù)尋優(yōu);混沌粒子群算法
無人作戰(zhàn)飛機自主攻擊技術(shù)是未來發(fā)展的必然趨勢和迫切需要,而攻擊軌跡在線實時重規(guī)劃技術(shù)是實現(xiàn)自主攻擊的關(guān)鍵。國內(nèi)外學(xué)者對軌跡規(guī)劃問題進行了大量研究并形成了很多方法[1-3],這些方法可分為2類:①最優(yōu)控制法:將軌跡規(guī)劃問題轉(zhuǎn)化為包含微分方程、代數(shù)方程和不等式約束求解泛函極值的開環(huán)最優(yōu)控制問題,再利用解最優(yōu)控制的方法來解算最優(yōu)攻擊軌跡,文獻[1]采用了這類方法。②可以概括為空間直接法:利用特定算法(A*算法、粒子群算法、進化算法、概率路圖法、隨機決策樹法等)直接在軌跡規(guī)劃空間搜索最優(yōu)攻擊軌跡點,然后將這些軌跡點連接起來構(gòu)成攻擊軌跡,文獻[2-3]采用了這類方法。
最優(yōu)控制法能考慮復(fù)雜的飛行約束和環(huán)境約束、解算參數(shù)全、精度高,但耗時長,難以滿足在線規(guī)劃的要求;空間直接法源于機器人路徑規(guī)劃思想,直接在軌跡規(guī)劃空間進行最優(yōu)軌跡的搜索,算法簡潔、解算速度快,但解算精度不高,且若將其直接應(yīng)用到三維空間的攻擊軌跡尋優(yōu)會存在求解參數(shù)多而導(dǎo)致的計算量非常大的問題,難以滿足實時性要求。對數(shù)字地形進行平滑化處理使其滿足飛行器性能約束要求,從而生成安全可飛行曲面[3],然后在該曲面上進行軌跡規(guī)劃,由于該曲面上的軌跡與它的平面投影一一對應(yīng),因而可將UCAV三維軌跡規(guī)劃問題轉(zhuǎn)化為二維平面軌跡規(guī)劃問題。同時,滾動時域優(yōu)化方法以其突出的應(yīng)對動態(tài)不確定性的優(yōu)勢,得到了廣泛應(yīng)用[4],是解決實時規(guī)劃問題的重要途徑。
基于以上分析,本文設(shè)計了一種基于混合策略的軌跡在線規(guī)劃方法,論文的主要內(nèi)容包括:(1)在線軌跡規(guī)劃問題分析與建模;(2)設(shè)計攻擊軌跡滾動規(guī)劃策略和方法,使UCAV能有效應(yīng)對動態(tài)不確定環(huán)境;(3)提出一種新的軌跡表示方法,并將軌跡規(guī)劃問題轉(zhuǎn)化為軌跡函數(shù)尋優(yōu)問題;(4)設(shè)計一種的改進混沌粒子群算法并利用其對軌跡函數(shù)參數(shù)進行尋優(yōu),生成最優(yōu)攻擊軌跡。
1在線軌跡規(guī)劃問題分析與建模
1.1動態(tài)環(huán)境因素分析
UCAV在執(zhí)行任務(wù)飛行過程中會遇到很多動態(tài)變化因素,這些變化因素主要包括:
1) 戰(zhàn)場環(huán)境的不確定性,詳細的環(huán)境參數(shù)信息很難預(yù)先準(zhǔn)確獲知,如天氣變化、地理條件等;
2) 情報信息的不準(zhǔn)確性,情報的獲取、編譯和傳遞過程會出現(xiàn)誤差以及受到復(fù)雜電磁環(huán)境的干擾;
3) 威脅的機動和敵方探測系統(tǒng)的機動,甚至還有作戰(zhàn)任務(wù)的變更;
4) 敵方戰(zhàn)略、戰(zhàn)術(shù)意圖的變更。
因為有這些動態(tài)不確定因素,為確保任務(wù)的有效完成,UCAV必須要具有軌跡實時重規(guī)劃的能力。
1.2UCAV數(shù)學(xué)模型
軌跡規(guī)劃只需要軌跡點的空間位置即可,為此采用UCAV三自由度模型[4]。
UCAV在慣性坐標(biāo)系下的質(zhì)點運動方程為:
(1)
UCAV在航跡坐標(biāo)系下的質(zhì)點動力學(xué)方程為:
(2)
1.3動態(tài)威脅模型
1.3.1地面威脅建模
地面威脅主要有防空武器和防空雷達威脅。通用做法是將防空武器(雷達)等效為一個半球形殺傷區(qū)(威脅區(qū)),半徑大小與武器威脅程度或雷達探測能力成正比。
地面威脅模型函數(shù):
式中:x0、y0、h0為武器(雷達)坐標(biāo)位置,R為武器殺傷(雷達探測)半徑。令x0=20km,y0=20km,h0=0km,R=10km得到地面威脅模型,如圖1所示。
圖1 地面威脅模型
1.3.2禁飛區(qū)模型
UCAV飛行中可能會遇到有惡劣氣象環(huán)境的區(qū)域或者政治、軍事敏感區(qū),這些區(qū)域是禁止飛行的區(qū)域,即禁飛區(qū),UCAV不能從其上方飛行,因而可將禁飛區(qū)簡化為高度很大的圓柱形。以半徑r=10 km為例,建立禁飛區(qū)模型如圖2所示。
圖2 禁飛區(qū)模型
1.4數(shù)字高程模型
采用由美國太空總署(NASA)和國防部國家測繪局(NIMA)聯(lián)合測量的SRTM數(shù)據(jù),選取精度為90m 、編號為N33E069的數(shù)字地形,如圖3所示。
圖3 DEM數(shù)字地形
1.5軌跡在線重規(guī)劃問題優(yōu)化目標(biāo)函數(shù)
首先,在軌跡規(guī)劃中我們總是希望UCAV的總航程最短,以節(jié)省油耗和時間,占據(jù)有利態(tài)勢。構(gòu)建航程代價:
其次,鑒于UCAV自衛(wèi)能力較差,不能進入威脅區(qū)或禁飛區(qū),對進入威脅區(qū)或禁飛區(qū)的軌跡給予一個很大的懲罰值。即:
(3)
式中,下標(biāo)“Thr,i”表示第“i”個地面威脅,下標(biāo)“Forb,j”表示第“j”個禁飛區(qū)。“M”是一個值很大的正常數(shù)。
最后,構(gòu)建總目標(biāo)函數(shù)為:
(4)
式中,α∈[0,1]為權(quán)系數(shù)。
2UCAV軌跡在線滾動規(guī)劃方法
2.1安全可飛行曲面生成技術(shù)
根據(jù)UCAV最大爬升角約束、飛行速度約束以及過載約束來確定地形的坡度約束和曲率約束,進而利用這些約束來修正高程,達到平滑地形的效果。地形平滑處理結(jié)果如圖4所示。
圖4 平滑處理后的數(shù)字地形
2.2滾動時域優(yōu)化策略
滾動時域優(yōu)化方法源于預(yù)測控制優(yōu)化原理,把整個任務(wù)過程分為一個個相互重疊且不斷向前推進的優(yōu)化區(qū)間(這個優(yōu)化區(qū)間也稱為滾動窗口),用在線滾動進行的有限時段局部優(yōu)化取代一成不變?nèi)謨?yōu)化。
軌跡重規(guī)劃只會在遇到突發(fā)威脅、目標(biāo)機動或任務(wù)變更等情況時才會進行,即是由事件觸發(fā)的,因而本文采用事件觸發(fā)式滾動機制。
首先,定義軌跡滾動規(guī)劃觸發(fā)事件:
1) 在飛行軌跡周邊出現(xiàn)突發(fā)威脅,且按原軌跡飛行會有較大安全威脅;
2) 出現(xiàn)新的更高價值目標(biāo);
3) 先驗的戰(zhàn)場環(huán)境信息出錯或者作戰(zhàn)區(qū)域戰(zhàn)場環(huán)境發(fā)生較大變化,預(yù)先精細規(guī)劃的軌跡不能執(zhí)行;
4) 目標(biāo)進行了大機動,預(yù)先規(guī)劃軌跡終點偏離目標(biāo)較遠;
5) 任務(wù)取消或更改為執(zhí)行其他更加緊迫的任務(wù)。
其次,設(shè)計重規(guī)劃區(qū)域大小、軌跡起點位置、終點位置和終點進入角確定方法。軌跡滾動規(guī)劃過程示意圖如圖5所示。
圖5 軌跡滾動規(guī)劃過程示意圖
1) 重規(guī)劃區(qū)域大小定義方法。UCAV根據(jù)作戰(zhàn)任務(wù)、計算能力和存儲能力的不同選擇合適的梯度類型,例如定義梯度Δd=10 km,則區(qū)域大小為d1=10 km,d2=20 km,d3=30 km,d4=40 km;
2) 重規(guī)劃區(qū)域大小選擇方法。假設(shè)威脅點位置為w0,威脅作用半徑大小為r0;軌跡滾動優(yōu)化觸發(fā)時UCAV所在位置為x0,飛行速度為v0,軌跡重規(guī)劃解算時間為τ。則重規(guī)劃區(qū)域長度di由(5)式確定:
(5)
式中,Δd為安全距離。
3) 重規(guī)劃軌跡起點位置s0和終點位置sf的確定。
如果x0+v0·τ≤w0-di/2,則s0=w0-di/2,
sf=s0+di;
如果x0+v0·τ>w0-di/2,則s0=x0+v0·τ,
sf=s0+di。
4) 確定終點進入角。軌跡終點進入角則由軌跡終點所在位置的曲率決定。記終點所在位置的曲率為ρ=f′(x,y),則軌跡終點進入角λ=tan-1ρ。
軌跡在線滾動規(guī)劃詳細過程:
step1UCAV實時綜合傳感器探測信息和數(shù)據(jù)鏈信息,判斷觸發(fā)事件是否發(fā)生,如果發(fā)生,則執(zhí)行軌跡重規(guī)劃程序,轉(zhuǎn)入step2;否則,重復(fù)step1;
step2UCAV根據(jù)其飛行性能、突發(fā)威脅的大小特征或目標(biāo)位置變動情況,快速確定重規(guī)劃區(qū)域長度、軌跡起點位置、終點位置和終點進入角,轉(zhuǎn)入step3;
step3進行重規(guī)劃軌跡的快速解算,轉(zhuǎn)入step4;
step4UCAV按照重規(guī)劃軌跡飛行,若到達目標(biāo)攻擊位置,則終止優(yōu)化,否則返回step1。
2.3軌跡函數(shù)特性及端點約束處理
2.3.1軌跡函數(shù)特性研究
軌跡實時重規(guī)劃是因為突發(fā)威脅的出現(xiàn)而對受到威脅的軌跡段進行重新規(guī)劃,因而軌跡實時重規(guī)劃是小范圍的軌跡規(guī)劃問題,一般為10~30 km。
考察多項式函數(shù):
(6)
由該多項式函數(shù)易知,a0決定了軌跡的起始位置,a1決定了軌跡的起始斜率。
2.3.2軌跡端點約束處理
軌跡重規(guī)劃修正的起點和終點由威脅特性、滾動策略和UCAV自身性能決定。規(guī)劃出的軌跡必需能滿足起點、終點位置約束和終點進入角約束,也就是說軌跡函數(shù)必須要滿足起點、終點位置約束和終點的斜率約束。
以n=4為例進行分析,由軌跡起點、終點位置和終點進入角約束易得:
(7)
式中,下標(biāo)“f”表示末端位置參量,下標(biāo)“0”表示起點位置參量,l為末端進入角(斜率)。
以a3、a4為自變量,a1、a2為因變量,解(7)式方程得:
(8)
由(8)式知,只要給出軌跡的初始和終端約束條件y0、yf、l,軌跡曲線就可由a3、a4共同確定。
由此,復(fù)雜的軌跡優(yōu)化問題就轉(zhuǎn)化為了尋找2個最優(yōu)參數(shù)的問題,問題得到了極大簡化。下文將設(shè)計一種改進的粒子群算法對該參數(shù)進行尋優(yōu)。
2.4改進的混沌粒子群優(yōu)化算法
2.4.1基本粒子群算法
粒子群優(yōu)化算法(PSO,particle swarm optimization) 由Kenney和Eberhart于1995年提出,是一種模擬鳥類捕食行為的群智能全局優(yōu)化算法[5]。群體中的粒子在每次迭代搜索過程中,通過跟蹤2個極值:粒子本身找到的個體最優(yōu)解Pbest和群體找到的全體最優(yōu)解Gbest來調(diào)整自己速度和位置,完成對問題的尋優(yōu)。
每個粒子的速度和位置按如下公式進行更新:
(9)
式中:d∈[1,D],i∈[1,N],c1、c2為學(xué)習(xí)因子,通常c1=c2=2,rand1、rand2為[0,1]之間的隨機數(shù),0 基本PSO算法容易早熟而不能有效找到最優(yōu)解,為此將利用混沌映射對PSO算法進行改進,構(gòu)建混沌粒子群算法(CPSO)。 2.4.2Fuch混沌映射特性分析 混沌是非線性系統(tǒng)中的一種普遍現(xiàn)象,混沌現(xiàn)象行為復(fù)雜且類似隨機,但存在精致的內(nèi)在規(guī)律性和遍歷性。混沌搜索已經(jīng)成為一種新穎的全局優(yōu)化技術(shù)[6]。傳統(tǒng)混沌映射主要有Logistic映射、Tent映射和Chebyshev映射。傅文淵等[7]提出了一種新的無線折疊混沌映射——Fuch映射,Fuch映射具有很多特殊的優(yōu)點。 Fuch映射方程: (10) 式中,x≠0。 2.4.3改進的混沌粒子群算法 利用Fuch混沌序列進行粒子的初始化,加強粒子對其鄰域快速搜優(yōu),改善了算法的隨機性,有助于提高尋優(yōu)效率和精度。并以Fuch混沌序列代替隨機數(shù)對粒子的速度、位置進行更新。粒子群搜索的中后期進行粒子停滯判斷與粒子變異操作。線性變化權(quán)重不能反映粒子的收斂性,為此引入平均速度對自適應(yīng)權(quán)重進行改進。具體方法如下: 1) 自適應(yīng)權(quán)重的改進 定義平均速度: (11) Vip(k)為第i個粒子的p維速度。 粒子搜索的早期是全局搜索期,平均速度很大,是活躍階段;隨著搜索次數(shù)的增加粒子趨于最優(yōu),粒子進入局部搜索階段,平均速度很小,最終速度趨于零。因而,平均速度是粒子活躍性或者算法收斂性的特征之一。通過平均速度重新定義自適應(yīng)慣性權(quán)重。慣性權(quán)重 (12) 粒子搜索早期,全局最優(yōu)并不是真的最優(yōu),個體最優(yōu)則扮演者更加重要的角色;粒子收斂后期,全局最優(yōu)的作用應(yīng)該突出,個體最優(yōu)減弱。因而,c1應(yīng)該先大后小,c2應(yīng)該先小后大。結(jié)合平均速度的概念重新定義c1、c2如下: (13) 式中,C為常數(shù)。 2) 停滯判斷與粒子變異方法 平均速度的應(yīng)用能夠改善算法的收斂性,減少總迭代次數(shù),但也會使粒子更易陷入局部最優(yōu),因而需要對陷入局部最優(yōu)的粒子進行判斷和干預(yù),使其跳出局部最優(yōu),從而加強算法的全局最優(yōu)性。 改進的CPSO算法具體流程見圖6所示。 圖6 改進的CPSO算法流程圖 3仿真與分析 3.1UCAV三維軌跡預(yù)先精細規(guī)劃 在第2節(jié)生成的安全可飛行曲面上疊加等效為地形高程的地面防空威脅和禁飛區(qū),進而生成綜合威脅的安全可飛行曲面,然后利用HP自適應(yīng)偽譜法進行攻擊軌跡預(yù)先精細規(guī)劃。仿真條件:計算機配置為1.99 GHz,內(nèi)存4G,CPU為Inter Core2雙核;UCAV起點坐標(biāo)(0,0,3.5),終點坐標(biāo)(95,95,3),地形威脅主要有雷達威脅、防空火力威脅、禁飛區(qū)約束以及動態(tài)威脅,其中機動防空火力單元的當(dāng)前坐標(biāo)為(40,50,2.6)。為凸顯地形特征,在圖形的顯示上對高程進行了壓縮,具體分布及軌跡規(guī)劃結(jié)果如圖7、圖8所示。 圖7 軌跡三維視圖 圖8 軌跡等高線圖 仿真結(jié)果表明HP自適應(yīng)偽譜法能精確的規(guī)劃出滿足約束條件的攻擊軌跡,但仿真用時3 min,難以滿足在線實時規(guī)劃的要求。 3.2突發(fā)威脅下軌跡在線實時重規(guī)劃 UCAV按照預(yù)先規(guī)劃的精細軌跡飛行,并根據(jù)設(shè)計的滾動規(guī)劃策略進行軌跡實時在線重規(guī)劃。UCAV在坐標(biāo)(30,33,5.3)處綜合探測信息判斷機動防空火力單元正向東以100 m/s速度機動,并在坐標(biāo)(60,40,2.5)和坐標(biāo)(90,80,2.7)出現(xiàn)殺傷半徑為8 km的突發(fā)威脅,預(yù)先規(guī)劃軌跡受到威脅,啟動軌跡滾動重規(guī)劃程序。 將威脅條件代入滾動規(guī)劃程序解算得到重規(guī)劃區(qū)域大小di=30,起點坐標(biāo)為(41,40,2.8),終點坐標(biāo)為(71,57,3.6),終點進入角λ=40°。 利用改進的CPSO算法進行軌跡實時在線重規(guī)劃。仿真比較了標(biāo)準(zhǔn)PSO算法與改進的CPSO算法的解算結(jié)果,仿真結(jié)果如圖9、圖10所示。 圖9 在線軌跡三維視圖 圖10 在線軌跡等高線圖 3.3仿真結(jié)果分析 利用改進的CPSO算法進行軌跡在線重規(guī)劃所需時間不到0.2 s,而標(biāo)準(zhǔn)PSO算法需要0.8 s左右,表明算法具有很好的實時性。從規(guī)劃結(jié)果來看,重規(guī)劃軌跡有效躲避了突發(fā)威脅,軌跡平滑且很好地與預(yù)先規(guī)劃軌跡在端點平滑銜接,易于飛行控制。綜上表明,該算法能快速實時規(guī)劃出UCAV三維可飛行軌跡。 4結(jié)論 針對軌跡在線實時重規(guī)劃問題,提出了一種基于滾動策略的軌跡規(guī)劃方法。設(shè)計了軌跡滾動規(guī)劃策略和詳細方案,使UCAV有效應(yīng)對動態(tài)變化環(huán)境,并結(jié)合安全可飛行曲面生成技術(shù),將三維軌跡規(guī)劃問題轉(zhuǎn)換為二維軌跡規(guī)劃問題,大大減小了問題的復(fù)雜度;創(chuàng)新性地提出了多項式函數(shù)表示軌跡的方法,將軌跡規(guī)劃問題轉(zhuǎn)化為軌跡函數(shù)尋優(yōu)問題,減少了優(yōu)化參數(shù)數(shù)量,并研究了軌跡函數(shù)特性和端點處理方法,研究表明軌跡函數(shù)能很好地處理端點約束問題;通過引入平均速度和FUCH混沌映射對粒子群算法慣性權(quán)重與停滯粒子進行改進,提高了算法的收斂性和全局最優(yōu)性,并利用其對軌跡函數(shù)進行尋優(yōu)。仿真結(jié)果表明,用該方法完成一次軌跡在線重規(guī)劃只需0.2 s,表明了該算法具有很好的實時性和實用性。 參考文獻: [1]Darby C L, Hager W, Rao A V. Direct Trajectory Optimization Using a Variable Low-Order Adaptive Pseudospectral Method[J]. Journal of Spacecraft and Rockets, 2011, 48(3): 433-445 [2]Li Pei, Duan Haibin. Path Planning of Unmanned Aerial Vehicle Based on Improved Gravitational Search Algorithm[J]. Science China Technological Sciences, 2012, 55(10): 2712-2719 [3]唐強, 張新國, 劉錫成. 一種用于低空飛行的在線航跡重規(guī)劃方法[J]. 西北工業(yè)大學(xué)學(xué)報, 2005,23(2): 271-275 Tang Qiang, Zhang Xinguo, Liu Xicheng. Exploring an Online Method of Vehicle Route Re-Planning for Low Altitude Flight[J]. Journal of Northwestern Polytechnical University, 2005, 2005,23(2): 271-275 (in Chinese) [4]Carole G Prevost, Olivier Theriault, Andre Desbiens. Receding Horizon Model-Based Predictive Control for Dynamic Target Tracking: a Comparative Study[R]. AIAA-2009-62681 [5]Xiao Hongfeng, Tan Guanzheng. A Novel Particle Swarm Optimizer without Velocity: Simplex-PSO[J]. Journal of Cent South Univ Technol, 2010, 17: 349-356 [6]Lu Huijuan, Zhang Huoming, Ma Longhua. A New Optimization Algorithm Based on Chaos[J]. Journal of Zhejiang University Scienace A, 2006, 7(4): 539-542 [7]傅文淵, 凌朝東. 自適應(yīng)折疊混沌優(yōu)化方法[J]. 西安交通大學(xué)學(xué)報, 2013,47(2):33-38 Fu Wenyuan, Ling Chaodong. Adaptive Iterative Chaos Optimization Method[J]. Journal of Xi′an Jiaotong University, 2013, 47(2): 33-38 (in Chinese) Online Planning Method for UCAV Attack Trajectory Using Multi-Strategies Dong Kangsheng, Huang Changqiang, Huang Hanqiao, Cao Linping, Tang Chuanlin (Aeronautics and Astronautics Engineering College, Air Force Engineering University, Xi′an 710038, China) Abstract:A trajectory online planning method using multi-strategies is proposed for UCAV. Firstly, to copy with dynamic and changeable environment, we design an event triggered trajectory rolling planning program. Secondly, according to UCAV flying bounds, a safe and flyable curve generating method is designed by smoothing on digital geographical map. Thirdly, make use of function to replace with re-planning trajectory, analyze trajectory function speciality and terminal point handling methods, translating trajectory planning problem to trajectory function optimal problem; this reduces the number of optimal parameters. Lastly, we improve particle swarm optimization on its inertia weight and stagnant particles by introducing average speed and FUCH chaos mapping; this improves its convergence and global optimality; then we make use of the improved method to search for optimal trajectory function. Results of simulation show that the method proposed by us accomplishes an online trajectory re-planning in only 0.2s; clearly our method meets the requirements of trajectory online re-planning with its good real-time ability. Keywords:UCAV, trajectory online planning, rolling planning, trajectory function optimization, chaotic PSO 中圖分類號:V279 文獻標(biāo)志碼:A 文章編號:1000-2758(2016)01-0159-07 作者簡介:董康生(1988—),空軍工程大學(xué)博士研究生,主要從事無人作戰(zhàn)飛機自主空戰(zhàn)、軌跡優(yōu)化的研究。 基金項目:國家自然科學(xué)基金(71501184)資助 收稿日期:2015-04-24