黃 榮,崔乃剛,韋常柱,王勁博,黃盤興
(1. 哈爾濱工業(yè)大學 航天學院,哈爾濱 150001;2. 航天科技集團 運載火箭研究院,北京 100076)
基于RRT-GPM兩階策略的導彈編隊協(xié)同突防最優(yōu)軌跡快速設計
黃 榮1,2,崔乃剛1,韋常柱1,王勁博1,黃盤興1
(1. 哈爾濱工業(yè)大學 航天學院,哈爾濱 150001;2. 航天科技集團 運載火箭研究院,北京 100076)
為了提高導彈編隊的自主飛行能力,在考慮彈間協(xié)同相對運動關(guān)系(通信、避碰、探測)和突防硬/軟約束的情況下,對彈群的多約束快速軌跡優(yōu)化問題進行了研究。針對高斯偽譜法初值確定困難和快速搜索隨機樹法結(jié)果曲折不尋優(yōu)難以滿足動力學約束的不足,通過對高斯偽譜法快速性的分析和初值選取方法的研究,提出了快速搜索隨機樹+高斯偽譜法兩階快速軌跡優(yōu)化策略,充分利用快速搜索隨機樹法的全空間搜索能力為高斯偽譜法提供尋優(yōu)初始值,同時利用高斯偽譜法的快速性和最優(yōu)性對快速搜索隨機樹法的結(jié)果進行平滑和進一步尋優(yōu),從而快速獲得最優(yōu)的彈群飛行軌跡。領(lǐng)-從彈編隊飛行模式下的仿真結(jié)果表明,兩階策略能夠快速獲得滿足各種約束的彈群最優(yōu)飛行軌跡,優(yōu)化時間約為單獨高斯偽譜法所需時間的20%左右,很大程度上提高了軌跡優(yōu)化的快速性和準確性,并且證明了不同約束條件對優(yōu)化速度和優(yōu)化結(jié)果的影響。
導彈編隊;快速軌跡優(yōu)化;高斯偽譜法;快速搜索隨機樹;兩階優(yōu)化策略
未來戰(zhàn)爭將是體系與體系的對抗,尤其是以精確制導武器為主的攻擊體系與以地/空、艦/空導彈為主的防御體系之間的對抗[1]。面對現(xiàn)代防御系統(tǒng)的威脅,導彈編隊協(xié)同作戰(zhàn)是一種提高突防能力的有效措施。在戰(zhàn)場環(huán)境快速變化、敵方機動防空火力臨時部署和各種干擾條件下,快速軌跡優(yōu)化技術(shù)可使彈群自主地維持并優(yōu)化其使命功能,是提高導彈編隊作戰(zhàn)效能的有效手段。相對無人機和衛(wèi)星編隊,導彈編隊協(xié)同突防飛行速度快,約束要求嚴格,戰(zhàn)場環(huán)境復雜多變,給快速軌跡優(yōu)化技術(shù)帶來了新的要求和挑戰(zhàn)。
目前,針對導彈編隊的軌跡優(yōu)化設計往往采用比較成熟的路標圖法、快速搜索隨機樹、A*搜索法、人工勢場法、遺傳算法、蟻群算法及粒子群算法等[2-7],這些算法或者只能獲得飛行器的航線/航路,而非嚴格意義上的飛行軌跡[8],或者計算量較大,計算時間較長,不能滿足戰(zhàn)場環(huán)境快速變化的要求。軌跡優(yōu)化算法(如直接打靶法、高斯偽譜法等)直接從飛行器的飛行性能模型出發(fā),在充分考慮速度、過載變化等微分約束以及航向、俯仰角等姿態(tài)約束的條件下生成飛行軌跡的控制指令序列,其規(guī)劃結(jié)果更具有可飛性[9]。
在快速軌跡優(yōu)化領(lǐng)域,高斯偽譜法作為最具發(fā)展?jié)摿Φ囊环N優(yōu)化算法獲得了廣泛的研究[10-15]?,F(xiàn)有的基于高斯偽譜法的快速軌跡優(yōu)化研究主要是針對算法本身開展的,研究對象也僅局限于單個飛行器。但實際上,優(yōu)化初值選取問題往往關(guān)系到優(yōu)化算法的效率甚至成敗。目前,從初值選取的角度提高優(yōu)化速度的研究在國內(nèi)外還相對較少[16-17]。本文研究的導彈編隊協(xié)同突防軌跡優(yōu)化問題更為復雜,其運動模型非線性、彈群成員相對運動關(guān)系耦合,即使經(jīng)過簡化,仍是具有較多變量的高維問題[18],并且需要考慮動力學和突防避障的約束,優(yōu)化問題的可行域可能是十分狹窄的非凸區(qū)域,因此如何獲得一個可行甚至次優(yōu)的初值尤為關(guān)鍵。
針對以上問題,本文提出了基于快速搜索隨機樹+高斯偽譜法的兩階快速軌跡優(yōu)化方法。首先基于“領(lǐng)彈+從彈”的作戰(zhàn)模式,給出了一種可行的導彈編隊協(xié)同突防策略。然后提出了硬威脅約束和軟威脅約束的概念,建立了導彈編隊協(xié)同突防問題的相關(guān)模型。接著從插值代替積分和約束雅克比矩陣稀疏性兩個方面對高斯偽譜法的快速性進行了分析討論,總結(jié)了軌跡優(yōu)化的初值選取的主流方法,進而提出了RRT+GPM兩階快速軌跡優(yōu)化方法。最后分別采用單獨GPM和RRT+GPM兩階方法,對問題模型進行了優(yōu)化仿真分析,驗證了兩階方法對提升優(yōu)化速度的有效性,以及不同約束條件對優(yōu)化速度和結(jié)果的影響。
1.1導彈編隊運動模型
本文以亞音速巡航導彈為背景,建立基于過載控制導彈的三自由度運動模型[19],具體形式如下:
其中,n為導彈編隊的成員數(shù),其它變量的具體含義可見參考文獻[19]。
1.2戰(zhàn)場想定與彈群協(xié)同策略
本文以“領(lǐng)彈+從彈”的協(xié)同作戰(zhàn)模式為研究背景,協(xié)同約束為導彈時間和功能上的協(xié)同。如圖1和圖2所示,想定由三枚巡航導彈組成的彈群(其中一枚為領(lǐng)彈,兩枚為從彈)對敵方某戰(zhàn)略要地N進行打擊(圖1),根據(jù)戰(zhàn)場的變化(如威脅區(qū)域)需要對飛行軌跡進行快速優(yōu)化(圖2)。圖2中C為彈群出發(fā)點,Q為打擊前的集結(jié)點。
從彈與領(lǐng)彈的氣動外形、尺寸、動力均相同,但其器件配置和載荷不同,如根據(jù)任務需求不同,可對從彈配置不同體制的探測器和戰(zhàn)斗部。通過靈活地配置從彈成員,可增強整個彈群對不同威脅進行突防,對不同目標進行打擊的任務魯棒性,達到“1+1>2”的突防和打擊效果。
圖1 戰(zhàn)場想定樣式示意圖(未考慮威脅)Fig.1 Schematic of battlefield scenario (without considering threat)
根據(jù)上述的協(xié)同策略,建立彈群成員相對運動的約束關(guān)系模型:
圖2 優(yōu)化軌跡示意圖(考慮威脅)Fig.2 Schematic of optimal trajectory (considering threat)
其中,RLead-Follow為領(lǐng)彈與從彈的距離,Ri,j為任意兩枚彈之間的距離,RDateLink為有效數(shù)據(jù)鏈通信質(zhì)量下的最大距離,Rimpact為彈間避碰的距離約束,RDetect-i-j為有效協(xié)同探測質(zhì)量下的彈間距離約束。
1.3防空火力威脅建模
防空火力威脅的建模主要有以下兩種方式:一是將其建模為問題的約束,即設定一定區(qū)域的“禁飛區(qū)”,彈群不允許進入此區(qū)域;二是將其建模為性能指標,即允許彈群成員進入上述所謂“禁飛區(qū)”,但要根據(jù)導彈與防空火力部署的相對位置確定其所受到的威脅程度,將威脅程度作為優(yōu)化中性能指標的一部分。本文將第一種方式稱為“硬約束”,第二種稱為“軟約束”。
采用硬約束模型時,模型簡單,并可保證彈群的絕對安全。然而這種模型對彈群的飛行約束較強,這可能會導致優(yōu)化過程中無法找到可行解或可行域過于狹窄。硬約束模型具體為
式中:m為防空火力威脅陣地個數(shù),Rmissile_i,threat_j為第i枚導彈與第j個防空陣地的距離,hardR為防空火力最大威脅范圍。
采用軟約束模型時,防空火力對彈群的威脅可用概率來表示,對彈群的飛行路徑約束較弱,優(yōu)化問題的可行域相對硬約束范圍較寬。當對其他的性能指標有較高要求時,甚至可能出現(xiàn)導彈與防空陣地十分接近的情況。同時,軟約束模型相對比較復雜,涉及的變量多,使得約束雅克比矩陣維數(shù)變大,依賴變量增多,進而導致優(yōu)化問題的求解相對緩慢。軟約束模型具體為
其中,Pdanger,i為第i枚導彈在戰(zhàn)場中受到的威脅概率,1-Rmissile_i,threat_jRhard為第i枚導彈受到第j個防空陣地威脅的概率。顯然相對距離越近,威脅程度越高。另外,本文假設理想情況下防空火力對巡航導彈的殺傷概率為0.9。
2.1快速搜索隨機樹法
快速搜索隨機樹法是由Steven M. LaValle于1998年首次提出的[20]??焖偎阉麟S機樹算法由于采用隨機采樣的規(guī)劃方法,不需要預處理,搜索速度快,在高維空間中速度優(yōu)勢尤為明顯,因此該算法得到了很多研究者的青睞[21]。雖然快速搜索隨機樹算法在搜索速度、隨機性、約束完整性等方面得到了一定的改進[5,22-23],使其更易于處理地理形狀的威脅障礙以及處理動態(tài)威脅信息,易與飛行器的運動學約束條件相結(jié)合,但其結(jié)果仍然很難完全滿足動力學約束和最優(yōu)性,往往只能作為參考航線,而不能直接作為飛行軌跡。
2.2高斯偽譜法的快速性分析
收斂效率通常是衡量一種優(yōu)化算法好壞的重要標準。高斯偽譜法得到廣泛研究和應用的一個重要原因就是其解算的高速性[24],歸納其原因主要有兩點,一是利用插值代替積分,二是獨特離散方式帶來的雅克比矩陣的高度稀疏特性。
高斯偽譜法在離散過程中,對狀態(tài)變量在一系列的勒讓德-高斯(LG)點上進行插值,對插值結(jié)果進行微分,并在LG點上進行配置,這就以代數(shù)方程取代了微分方程。高斯偽譜法同時離散狀態(tài)變量和控制變量,對于非線性規(guī)劃問題(NLP)的每一步迭代求解,都能直接得到更新的狀態(tài)和控制變量,進而可以直接計算約束和約束的雅克比矩陣,也就省去了數(shù)值積分的過程。
經(jīng)高斯偽譜法離散得到的非線性規(guī)劃問題可由序列二次規(guī)劃算法(SQP)進行求解,其實質(zhì)上是對拉格朗日函數(shù)施行擬牛頓法,將擬牛頓法推廣到有約束的最優(yōu)化問題。約束雅克比矩陣(xk)的稀疏性對SQP計算效率的提高有很大幫助。由于對離散點的設置,高斯偽譜法生成的約束雅克比矩陣是極為稀疏的,其具體形式如圖3所示。
可以看出,所有的動力學約束對所有的狀態(tài)變量的雅克比矩陣只有在對角線上子塊為滿陣,其余皆為對角陣或零陣,并且即使?jié)M陣也只有在上對角線上的元素是隨著迭代變化的,其他元素均為常數(shù)。而系統(tǒng)動力學約束對控制變量的雅克比矩陣以及路徑約束和邊界條件對狀態(tài)和控制變量的雅克比矩陣皆為對角陣、上對角陣或零陣。因此,高斯偽譜法生成的約束雅克比矩陣是極為稀疏的,這就大大提高了NLP問題的求解速度。
圖3 雅克比矩陣稀疏結(jié)構(gòu)示意圖Fig.3 Schematic of Jacobian matrix sparse structure
利用插值代替積分和雅克比矩陣的高度稀疏特性,是由高斯偽譜法離散結(jié)構(gòu)產(chǎn)生的快速性優(yōu)勢。這種快速特性,正是本文所希望達到的快速軌跡優(yōu)化能力的基礎。
2.3高斯偽譜法的初值選取問題
對于類似高斯偽譜法這樣的軌跡優(yōu)化直接法,需要選擇優(yōu)化量的初始值以啟動優(yōu)化迭代過程。初值選取的恰當與否關(guān)系到優(yōu)化的效率甚至成敗,一個好的初值對于減小迭代步數(shù)進而減少NLP計算時間是十分重要的。
由于可使用較少的離散點得到高精度的解,高斯偽譜法被廣泛認為最具潛力發(fā)展為一種實時優(yōu)化算法。若能為高斯偽譜法提供一個可行的初值,顯然會使其進一步向?qū)崟r優(yōu)化能力靠近。對于初始選取方法,可歸納為工程經(jīng)驗法、網(wǎng)格重構(gòu)法、“熱啟動”法、同倫法等幾種。
目前大多數(shù)初值算法或者構(gòu)造求解困難,如同倫法、解析法,或者求解速度慢,如經(jīng)驗法、遺傳算法等智能算法。本文采用編隊航跡規(guī)劃領(lǐng)域相對比較成熟的RRT作為GPM的初值確定方法,充分利用了其全空間搜索能力、搜索速度快和對威脅障礙的處理能力。
2.4RRT+GPM兩階軌跡優(yōu)化策略
對于可行域相對狹窄的優(yōu)化問題,優(yōu)化初值的選取對于優(yōu)化速度和結(jié)果都有非常大的影響。如果初值選取不合理,會使優(yōu)化過程陷入對可行解的費力尋找,影響求解速度;當初值偏離可行域較遠時,可能會因為找不到可行解而導致優(yōu)化失敗。在處理對實時性有要求或?qū)r間敏感的問題時,這種緩慢的解算顯然是無法滿足需求的。
理論上,快速搜索隨機樹法和高斯偽譜法都可單獨對導彈編隊協(xié)同突防問題的軌跡做出規(guī)劃/優(yōu)化。然而,RRT結(jié)果曲折不尋優(yōu),難以滿足飛行動力學約束,GPM希望初值可行,兩種方法都有一些固有的缺陷,使得在針對很多感興趣的對象進行規(guī)劃/優(yōu)化時難以得到令人滿意的結(jié)果或計算性能。
圖4 RRT+GPM兩階優(yōu)化策略流程圖Fig.4 Flowchart of two-stage optimization strategy of RRT+GMP
在導彈編隊飛行問題中,其微分約束有兩種,即動力學約束和運動學約束。運動學約束關(guān)注的是導彈在空間的位形,而不涉及引起運動的力和力矩作用。本文提出的基于RRT+GPM的兩階軌跡規(guī)劃方法,充分利用兩種算法的優(yōu)點以彌補各自的不足。其基本思想是利用快速搜索隨機樹方法對原問題進行運動學規(guī)劃,即暫不考慮飛行器的動力學約束和性能指標,僅根據(jù)其運動學規(guī)律和對避障的要求,對飛行器進行航線規(guī)劃(Planning),迅速找出一條滿足路徑和終端約束的可行解。接著從可行解中挑選一定個數(shù)的值作為優(yōu)化問題的運動學初值,再利用GMP對原問題進行優(yōu)化求解。此時,在優(yōu)化問題的前幾次迭代中,通過對微分方程的約束就可使運動學與動力學狀態(tài)量全部處于可行域內(nèi),進而迅速得到最優(yōu)解。針對導彈編隊協(xié)同突防問題,RRT+GPM兩階優(yōu)化策略流程如圖4所示。
高斯偽譜法的快速性和最優(yōu)性是兩階優(yōu)化策略的基礎,快速搜索隨機樹法的快速性和全空間搜索能力是兩階優(yōu)化策略的關(guān)鍵。為了進一步提高算法的收斂性和快速性,在兩階優(yōu)化策略中采用文獻[23]提出的改進雙邊RRT算法以有效處理任務環(huán)境中的突防威脅,采用文獻[12]提出的改進的hp自適應高斯偽譜法以處理偽譜法插值和數(shù)值積分得到的狀態(tài)量和約束的偏差問題。值得注意的一點是,本文強調(diào)的是RRT為GPM提供可行初值這一思路,反過來,也可以將GPM的優(yōu)化計算看作是對RRT計算結(jié)果的平滑和進一步尋優(yōu)。
3.1優(yōu)化模型建立
考慮“軟威脅約束”,導彈編隊協(xié)同突防問題優(yōu)化模型的性能指標函數(shù)為
其中,Rangei為第i枚彈的航程,iη為第i枚彈的航程在優(yōu)化性能指標中所占的權(quán)重,Dangerj為第j枚彈在飛行過程中受到的威脅程度,jρ為第j枚彈在飛行過程中受到的威脅程度在優(yōu)化性能指標中所占的權(quán)重。優(yōu)化問題的微分約束和協(xié)同相對運動約束分別為公式(1)和(2)。
在此,為保證數(shù)量級一致,以及加強對領(lǐng)彈的保護,領(lǐng)彈的1η取為1/10000,1ρ取為3;從彈的2η和3η取為1/10000,2ρ和3ρ取為2.5。在此模型中,彈群的總航程和受威脅度都在性能指標中,即要求在減少航程減少油耗的同時受到盡可能小的威脅。
不同仿真環(huán)境下程序運行速度不同,本文仿真環(huán)境為帶有Intel Core i5處理器Lenovo E47筆記本電腦。
3.2基于猜值的GPM優(yōu)化
在仿真算例中,所有的初值選取為兩個點,即初始點和終點,在每個離散點上的初值則為這兩個點插值的結(jié)果。
飛行路徑中設置三個防空火力威脅區(qū),在55000m ×5000m×55000m的空間內(nèi)進行優(yōu)化搜索。在第1節(jié)中提到的C點中,領(lǐng)彈位于[0, 500, 0],從彈1位于[300, 500, 0],從彈2位于[0, 500, 300]。威脅1位于[25000, 0, 25000],其“硬”防御范圍為7000,取“軟”威脅約束時防御范圍為10000;威脅2位于[40000, 0, 35000],其“硬”防御范圍為5000,取“軟”威脅約束時防御范圍為7000;威脅3位于[10000, 0, 15000],其“硬”防御范圍設為3000,取“軟”威脅約束時防御范圍為5000。在Q點中,領(lǐng)彈、從彈1、2的部署位置分別為[50000, 500, 50000]、[50300, 500, 50000]、[50000, 500, 50300]。
圖5 硬約束時GPM優(yōu)化的編隊飛行平面軌跡Fig.5 Plane trajectory of formation flight optimized by GPM with hard constraints
圖6 軟約束時GPM優(yōu)化的編隊飛行平面軌跡Fig.6 Plane trajectory of formation flight optimized by GPM with soft constraints
采用高斯偽譜法進行優(yōu)化解算,取硬約束時的優(yōu)化計算時間為156 s,取軟約束時的優(yōu)化計算時間為279 s,優(yōu)化結(jié)果分別如圖5和圖6所示。
由仿真結(jié)果可以看出,當把威脅模型作為優(yōu)化指標時,優(yōu)化的求解速度明顯減慢,這是因為性能泛函對狀態(tài)變量的依賴程度大幅度增加,需要對其進行大量的偏導計算,導致優(yōu)化時間較長。
由圖5可看出:“硬約束”情況下領(lǐng)彈和從彈都完全避開了威脅區(qū);領(lǐng)彈和從彈2從威脅的一側(cè)經(jīng)過,從彈1由另一側(cè)經(jīng)過,這是由初始和終端狀態(tài)不同引起的。由圖6可看出:由于領(lǐng)彈的威脅度指標的權(quán)重要高于從彈,領(lǐng)彈和從彈2在彈群總的威脅度中占絕大比例,再結(jié)合減小航程的要求,領(lǐng)彈和從彈2基本上完全避開了威脅區(qū),而從彈1的彈道通過了威脅區(qū)域,結(jié)果與前面的分析一致。
3.3RRT+GPM兩階優(yōu)化
使用RRT+GPM兩階軌跡優(yōu)化策略對上述導彈編隊協(xié)同突防問題進行求解。第一階改進RRT計算結(jié)果如圖7所示,其中左下角綠色圓點為彈群的起點,右上角紅色圓點為終點,黑色區(qū)域為避障“禁飛區(qū)”。在RRT規(guī)劃中,只考慮硬威脅約束,規(guī)劃結(jié)果也可作為軟威脅約束優(yōu)化的初值。
圖7 RRT規(guī)劃得到的編隊飛行平面軌跡Fig.7 Plane trajectory of formation flight planned by RRT
從仿真結(jié)果可以看出,通過RRT規(guī)劃出的彈群飛行軌跡完全避開了威脅區(qū)域,但是其軌跡并不光滑,而且也明顯不是最優(yōu)的。
使用RRT生成的軌跡作為初值再進行GPM優(yōu)化,所得結(jié)果與3.2中的基本一致,此處就不再贅述。表1總結(jié)了使用不同策略進行優(yōu)化時的計算用時。
由以上仿真結(jié)果可明顯看出,使用RRT+GPM兩階優(yōu)化策略時所用的計算時間僅為使用猜測初值GPM所用時間的20%左右,說明通過RRT為GPM提供初值的兩階優(yōu)化策略大大提高了導彈編隊協(xié)同突防的軌跡優(yōu)化速度。
表1 不同優(yōu)化策略的用時對比Tab.1 Comparison on times consumed by different optimization strategies
針對“硬約束”和“軟約束”兩種避障模式下的導彈編隊協(xié)同突防最優(yōu)軌跡快速設計問題,以高斯偽譜法的快速性分析和初值選取問題為切入點,提出了快速搜索隨機樹+高斯偽譜法的兩階快速軌跡優(yōu)化策略。該策略首先利用了快速搜索隨機樹法的全空間搜索能力獲得滿足運動學和避障約束的彈群航線,再利用高斯偽譜法的快速性和最優(yōu)性獲得滿足全部約束和性能最優(yōu)的彈群飛行軌跡,解決了高斯偽譜法初值確定困難和快速搜索隨機樹法結(jié)果曲折不尋優(yōu)、難以滿足飛行動力學約束的問題。
仿真結(jié)果表明,快速搜索隨機樹+高斯偽譜法的兩階快速軌跡優(yōu)化策略大大提升了優(yōu)化的速度,是導彈編隊協(xié)同突防最優(yōu)軌跡快速設計的一種有效手段,為在線軌跡優(yōu)化和實時最優(yōu)控制的實現(xiàn)提供一種有價值的思路和手段。仿真結(jié)果同時證明了不同約束條件對優(yōu)化速度和優(yōu)化結(jié)果的影響。
(References):
[1] 肖志斌, 何冉, 趙超, 等. 導彈協(xié)同編隊作戰(zhàn)的概念及其關(guān)鍵技術(shù)[J]. 航天電子對抗, 2013, 29(1): 1-3.
Xiao Zhi-bin, He Ran, Zhao Chao, et al. Cooperative combat of missile formation: concepts and key technologies[J]. Aerospace Electronic Warfare, 2013, 29(2): 1-3.
[2] 李紅亮, 宋貴寶, 李高春, 等. 反艦導彈協(xié)同攻擊航路規(guī)劃與重規(guī)劃[J]. 電光與控制, 2012, 19(12): 18-22.
Li Hong-ling, Song Gui-bao, Li Gao-chun, et al. Route planning and re-planning of anti-ship missiles in coordinated operation[J]. Electronics Optics and Control, 2012, 19(12): 18-22.
[3] Eva B P, Luis T, Jesus M, et al. Evolutionary trajectory planner for multiple UAVs in realistic scenarios[J]. IEEE Trans. On Robotics, 2010, 26(4): 619-634.
[4] 馬蓓蓓, 紀軍, 范作娥, 等. 考慮戰(zhàn)場環(huán)境約束的多導彈協(xié)同任務規(guī)劃[J]. 電光與控制, 2010, 17(8): 5-10.
Ma Bei-bei, Ji Jun, Fan Zuo-e, et al. Cooperative mission planning of multi-missile with battlefield environment constraint[J]. Electronics Optics and Control, 2010, 17(8):5-10.
[5] 潘廣貞, 秦帆, 張文斌, 等. 動態(tài)自適應快速擴展樹航跡規(guī)劃算法研究[J]. 微電子學與計算機, 2013, 30(1): 49-52.
Pan Guang-zhen, Qin Fan, Zhang Wen-bin, et al. Dynamic adaptive RRT path planning algorithm[J]. Microelectronics and Computer, 2013, 30(1): 49-52.
[6] Campbell S, Naeem W, Irwin W. A review on improving the autonomy of unmanned surface vehicles through intelligent collision avoidance manoeuvres[J]. Annual Reviews in Control, 2012, 36(9): 167-283.
[7] 肖支才, 程春華. 基于改進遺傳算法的反艦導彈協(xié)同任務規(guī)劃[J]. 計算機與數(shù)字工程, 2010, 38(5): 22-24.
Xiao Zhi-cai, Cheng Chun-hua. Cooperative Missions Planning of Anti-ship Missile Based on Improved Genetic Algorithms[J]. Computer and Digital Engineering, 2010, 38(5): 22-24.
[8] 關(guān)世義. 關(guān)于飛行任務規(guī)劃若干名詞術(shù)語的討論[J].飛航導彈, 2008 (8): 23-25.
Guan Shi-yi. Discussion on several terms of the flight mission planning[J]. Aerodynamic Missile Journal, 2008(8): 23-25.
[9] 沈林成, 陳璟, 王楠, 等. 飛行器任務規(guī)劃技術(shù)綜述[J].航空學報, 2014, 35(3): 593-606.
Shen Lin-cheng, Chen Jin, Wang Nan, et al. Overview of air vehicle mission planning techniques[J]. Aerodynamic Missile Journal, 2014, 35(3): 593-606.
[10] Huntington G T, Benson D, Rao A V, et al. A comparison of accuracy and computational efficiency of three pseudospectral methods[C]//AIAA Guidance, Navigation and Control Conference and Exhibit. Hilton Head, South Carolina, August 20-23, 2007.
[11] Darby C L, Hager W, Rao A V, et al. An hp-adaptive pseudospectral method for solving optimal control problems[J]. Optimal Control Application and Methods, 2011, 32(4): 476-502.
[12] 孫勇. 基于改進Gauss偽譜法的高超聲速飛行器軌跡優(yōu)化與制導[D]. 哈爾濱: 哈爾濱工業(yè)大學航天學院, 2012.
Sun Yong. Trajectory optimization and guidance of hypersonic vehicle based on improved Gauss pseudospectral method[D]. Harbin: School of Astronautics, Harbin Institute of Technology, 2012.
[13] Bittner M, Fisch F, Holzapfel F, et al. A multi-model gauss pseudospectral optimization method for aircraft trajectories[C]//Atmospheric Flight Mechanics Conference. Minneapolis, Minnesota, August 13-16, 2012.
[14] Hong H H, William W H, Anil V R, et al. Convergence of a Gauss pseudospectral method for optimal control[C]// Atmospheric Flight Mechanics Conference. Minneapolis, Minnesota, August 13-16, 2012.
[15] Patterson M A, Rao A V. Exploiting sparsity in direct collocation pseudospectral methods for solving optimal control problems[J]. Journal of Spacecraft and Rockets, 2012, 49(2): 354-377.
[16] Aoude G S, How J P, Miller D W, et al. Reconfiguration maneuver experiments using the SPHERES tested onboard the ISS[C]//3rd International Symposium on Formation Flying, Missions and Technologies. Noordwijk, Netherlands, 2008: 577-591.
[17] Aoude G S, How J P, Garcia I M, et al. Two-stage path planning approach for solving multiple spacecraft reconfiguration maneuvers[J]. Journal of Astronautical Sciences, 2009, 61(3): 435-456.
[18] 韋常柱, 郭繼鋒, 崔乃剛, 等. 導彈協(xié)同作戰(zhàn)編隊隊形最優(yōu)保持控制器設計[J]. 宇航學報, 2010, 31(4): 1043-1050.
Wei Chang-zhu, Guo Ji-feng, Cui Nai-gang, et al. Research on the missile formation keeping optimal control for cooperative engagement[J]. Journal of Astronautics, 2010, 31(4): 1043-1050.
[19] Lavalle S M. Rapidly-exploring random trees: a new tool for path planning[R]. Report No. 98-11, Dept. of Computer Science, Iowa State University, 1998.
[20] Daniel L, Brandon L, Jonathan P H, et al. Information-rich path planning with general constraints using rapidly-exploring random trees[C]//AIAA Infotech@ Aerospace 2010. Atlanta, Georgia, April 20-22, 2010.
[21] 秦帆, 潘廣貞, 楊劍, 等. 改進RRT無人機航跡規(guī)劃算法[J]. 微電子學與計算機, 2012, 29(2): 70-73.
Qin Fan, Pan Guang-zhen, Yang Jian, et al. Improved RRT algorithm of UAV path planning[J]. Microelectronics and Computer, 2012, 29(2): 70-73.
[22] 夏紅偉, 李莉, 曲耀斌, 等. 衛(wèi)星編隊構(gòu)型設計與軌道機動算法優(yōu)化[J]. 中國慣性技術(shù)學報, 2013, 21(2): 186-191.
Xia Hong-wei, Li Li, Qu Yao-bin, et al. Satellites formation configuration design and orbit maneuver algorithm optimization[J]. Journal of Chinese Inertial Technology, 2013, 21(2): 186-191.
[23] Huntington G T. Advancement and analysis of a Gauss pseudospectral transcription for optimal control problems [D]. Department of Aeronautics and Astronautics, Massachusetts Institute of Technology, June 2007.
Rapid trajectory optimization for cooperative penetration of missile formation based on two-stage RRT-GMP strategy
HUANG Rong1,2, CUI Nai-gang1, WEI Chang-zhu1, WANG Jin-bo1, HUANG Pan-xing1
(1. School of Astronautics, Harbin Institute of Technology, Harbin 150001, China; 2. China Academy of Launch Vehicle Technology, China Aerospace Science and Technology Corporation, Beijing 100076, China)
In order to improve the autonomous flight capability of a missile formation, this paper studies the rapid optimization of a missile formation’s trajectory with multi-constraints by considering the cooperative relative motion relationship between missiles and the hard/soft constraints in penetration. In view that the Gauss pseudospectral method (GPM) has difficulties in selecting initial values, and the rapidly-exploring random tree (RRT) obtains flectional and non-optimal results which are difficult to meet the dynamic constraints, a two-stage optimization strategy of RRT and GPM is proposed based on the analyses of GPM’s rapidity and initial value selection. The two-stage strategy takes advantage of the whole-space-search ability of RRT to provide initial values for GPM. Meanwhile, the rapidity and optimality of GPM is used to further smooth and optimize the results of RRT. Then several simulations for the flight mode of the “l(fā)eader-follower” are conducted to demonstrate the effectiveness of the strategy and the effects of different constraints. The simulation results show that the two-stage strategy can rapidly obtain a missile formation’s optimal flight trajectory to meet various constraints, and the optimization time by the two-stage strategy is only about 20% of that by GPM alone.
missile formation; rapid trajectory optimization; Gauss pseudospectral method; rapidly-exploring random tree; two-stage optimization strategy
V448.2
A
1005-6734(2015)03-0356-07
10.13695/j.cnki.12-1222/o3.2015.03.014
2015-01-04;
2015-05-08
國家自然科學基金項目(61403100);中央高?;究蒲袠I(yè)務費專項基金項目(HIT.NSRIF.2015037)
黃榮(1986—),男,博士生,研究方向為飛行器總體設計、軌跡優(yōu)化與制導控制。E-mail:I_amhuangrong@163.com