薛光偉,辛萬青,傅 瑜
(1. 北京宇航系統(tǒng)工程研究所,北京 100076;2. 中國運載火箭技術研究院,北京 100076)
升力式再入飛行器是一種可以利用氣動升力在大氣層內進行無動力飛行的飛行器[1-2],是近年來各國學者的研究熱點。升力式飛行器在飛行過程中面臨著諸多干擾,包括參數、環(huán)境的不確定性,以及可能存在的沖突對抗,需要不斷進行軌跡調整與恢復,過程中需要消耗能量;很多場景中,多個飛行器需要集結起來完成一些協(xié)同任務,而集結的過程同樣需要調整軌跡,消耗能量。升力式飛行器無動力的特性決定了其可利用的機械能總量在飛行過程中無法增加,因此適應干擾的能力與集結飛行的任務之間存在矛盾。
對于升力式飛行器的集結軌跡規(guī)劃問題,文獻[3]利用神經網絡生成傾側角翻轉控制指令,實現了升力式飛行器的時間協(xié)同;文獻[4]推導了滑翔段高度、速度、航程等的高精度解析解,在此基礎上引入粒子群算法和強化學習,實現了時間協(xié)同軌跡的在線優(yōu)化求解。文獻[3-4]設計的集結軌跡規(guī)劃算法通過智能算法估計剩余時間,求解速度快,但其結果具有一定不可解釋性。文獻[5]根據預測能量和期望能量的關系,實時調整飛行攻角和升阻比,進而控制到達時間。文獻[6]通過傾側角幅值控制到達時間,通過攻角控制攻擊角度,實現了多升力式飛行器的協(xié)同攻擊。文獻[7]把攻角固定為速度的線性函數,剩余時間通過軌跡仿真獲得,迭代求解滿足時間約束的攻角。文獻[8]通過分析軌跡長度與到達時間之間的關系,設計了公共參考軌跡并利用線性二次型調節(jié)器進行跟蹤,實現了升力式飛行器的多陣位協(xié)同再入。文獻[5-8]所提出的集結軌跡模式中,飛行器需要在大部分航程中為實現協(xié)同而調整軌跡,這會帶來較大的能量消耗,影響飛行器對于未知干擾的適應能力?;趥巫V法的軌跡優(yōu)化方法是近年來的研究熱點,理論上能夠求出最優(yōu)的集結軌跡。文獻[9]提出了一種再入軌跡優(yōu)化方法,通過自適應樽海鞘群算法改善偽譜法的全局尋優(yōu)性能。文獻[10]通過優(yōu)化控制量變化率約束的處理方法,大幅提升偽譜法求解軌跡優(yōu)化問題的計算效率。但遠距離集結軌跡的規(guī)劃問題更加復雜,狀態(tài)空間更為龐大,應用偽譜法求解的實時性依然存在一定問題。
為提高飛行器應對未知干擾的能力,本文提出一種升力式飛行器集結軌跡規(guī)劃方法。建立以能量為自變量的飛行器模型,分析了在平衡滑翔條件下升力式飛行器的最快到達軌跡模式與最慢到達軌跡模式,并提出最速能量調整軌跡的快速迭代計算方法。通過實時求解多個飛行器的可達時間范圍,動態(tài)調整最終的集結時間,構建了多飛行器集結軌跡規(guī)劃方法。
考慮地球自轉的影響,建立飛行器在極坐標系中的數學模型[11]:
(1)
式中:V飛行器為相對地球的速度,γ為飛行路徑角,ψ為航向角,r為從地心到飛行器質心的距離,θ為經度,φ為地心緯度,m為飛行器質量,gr為引力加速度沿地心矢徑方向的分量,gωe為引力加速度沿地球自轉角速度方向的分量,ωe為地球自轉角速度,D為氣動阻力,L為氣動升力,σ為傾側角。
氣動阻力和升力的計算公式如下[9]:
(2)
式中:Sref為飛行器參考面積,Cd,Cl為氣動阻力系數和氣動升力系數,ρ為大氣密度。
以無窮遠處為勢能零點,定義飛行器單位質量的機械能E:
(3)
式中:μ為地球引力常數,Re為地球半徑。
將能量對時間微分,可得:
(4)
由于升力式飛行器不帶動力,只依靠最初的能量在大氣層內飛行,且受到氣動阻力影響,E在飛行過程中是不斷衰減的,即dE/dt始終小于零。
為了實現飛行器的集結,需要確定每個飛行器的可達時間范圍,即飛行器抵達目標點的最晚到達飛行時間和最早到達飛行時間。
(5)
當剩余航程相同時,到達時間的上下界分別對應于平均速度的上下界。升力式飛行器的能量基本由速度決定[12],因此平均速度的上下界與平均能量的上下界相對應。
考慮能量航程剖面上的五條曲線,如圖1所示。其中,曲線A與曲線E對應飛行器按照最大升阻比攻角飛行的軌跡,其中曲線A的終點為目標點,曲線E的起點為當前點。根據文獻[13-14]可知,升力式飛行器按照最大升阻比攻角飛行時,航程最遠,能量隨航程衰減最慢。因此,最終能夠抵達目標點的所有軌跡,不可能出現低于曲線A的點,否則將無法抵達目標點;而從當前點出發(fā)的所有軌跡,能量衰減速度不可能慢于曲線E,因此不可能出現高于曲線E的點。
圖1 能量航程剖面軌跡示意圖Fig.1 Trajectories in energy-range plane
曲線B、C、D分別對應三條從當前點到目標點的可行軌跡。曲線B代表的軌跡從當前點開始,以最大能力消耗能量,直到與曲線A相交,之后按照最大升阻比攻角飛行,軌跡與A重合。曲線D代表的軌跡前期與曲線E重合,在最后階段以最大能力消耗能量,直到抵達目標點。曲線B和D其實就是從當前點到目標點所有可行軌跡的上下界,曲線C代表的就是B和D構成的可行域范圍內任意一條可行軌跡。
結合圖1易知,曲線B和D分別對應了平均能量的最小值和最大值,也就是最晚到達飛行時間和最早到達飛行時間。
定義在滿足平衡滑翔條件(飛行路徑角基本保持不變[15])的前提下,以最短航程完成能量調整任務的軌跡為最速能量調整軌跡。曲線B和曲線D所代表的兩條軌跡均由一段最速能量調整軌跡和一段最大升阻比軌跡結合而成。
以曲線B中的最速能量調整軌跡為例,假設軌跡終點能量為Eshift,速度為Vshift,軌跡長度微元dS可通過下式計算:
(6)
聯(lián)立模型(1)、式(4)和式(6),可得飛行軌跡長度S相對于飛行器單位質量能量E的微分:
(7)
將式(7)積分:
(8)
在平衡滑翔條件下,可近似認為高度是能量的線性函數[16],即H=kE+a,其中k和a可通過初末狀態(tài)求出,則有
(9)
由式(9)可知,軌跡長度S主要取決于阻力加速度系數Cd,Cd越大,S越小。
當高度差相同時,S越小,水平航程越短。水平航程可進一步分解為縱向航程和橫向航程。為了便于分析,不妨假設飛行器沿赤道向東飛行,目標點在其正東方,則經度的變化為縱向航程,緯度的變化為橫向航程,期望的偏航角ψ為90°,則能量管理段的縱向航程為
(10)
傾側角取值對于阻力的變化影響并不明顯,主要通過飛行路徑角、偏航角影響縱向航程。如果要使能量管理段的縱向航程最短,則應使得γ0盡可能小,偏航角ψ盡可能偏離90°,而這都要求傾側角幅值盡可能大,翻轉次數盡可能少。為了同時滿足能量管理段結束時的橫向航程誤差約束和偏航角誤差約束,至少需要設置兩次翻轉進行規(guī)劃[11]。
綜合以上分析,為了實現最短縱向航程的能量管理,Cd和傾側角幅值應取允許范圍內的最大值,且設置兩次傾側角符號的翻轉。
(11)
集結軌跡實時規(guī)劃包含兩部分內容,一是根據各飛行器狀態(tài)實時確定集結時刻,這需要對各飛行器的可達時間范圍的進行求解;二是根據集結時刻調整各飛行器的軌跡。
最慢到達軌跡對應于圖1中的曲線B,由一段最速能量調整軌跡與一段最大升阻比軌跡構成。
最大升阻比軌跡以目標點為終點,可以預先確定。最速能量調整軌跡則需迭代求解。
4)迭代次數z=z+1,判斷若超出最大迭代次數,則計算結束;未超出則執(zhí)行下一步。
(12)
式中:kS為調整系數,可控制迭代的速度,在0到1之間取值,越大則航程收斂越快,可根據航程與誤差需求選取適當的值。
(13)
根據平衡滑翔條件[15]可知,飛行路徑角隨時間變化率等于零,則傾側角幅值可通過下式計算:
(14)
傾側角翻轉位置以及最速能量調整軌跡航程的求解方法與最慢到達軌跡相同,此處不再贅述。
(15)
式中:Tf0即為最初確定的集結時間。
飛行過程中的集結軌跡實時規(guī)劃共分為兩個階段。其中第一階段的任務是確定最終的集結時間,第二階段是各飛行器按照集結時間調整自身軌跡。
(16)
進入第二階段后,飛行器j需要轉入曲線B代表的最慢到達軌跡模式,消耗多余能量,降低速度,否則將無法與飛行器i的集結。能量調整段結束后,飛行器j必須沿能量最優(yōu)軌跡飛行,不再具備多余能量。飛行器若在此階段遭遇敵對干擾,需要根據實際情況與預先設定的規(guī)則,在機動與集結之間進行取舍,因為進行機動將導致其到達時間延后,抵達集結點的速度也將低于集結要求。
飛行器i則繼續(xù)沿曲線D代表的最快到達軌跡飛行,保持快速飛行,但必須將多余能量集中在最后的能量調整段消耗,在此之前不可再做額外機動;此時如果再次遭遇干擾,雖然仍有多余能量,額外的機動不一定影響其終端速度,但會導致抵達時間延后,錯過預定的集結時間。
其他飛行器則以此集結時刻Tf為目標,當最早到達飛行時間大于Tf時,停止額外機動,沿最快到達軌跡飛行;當最晚到達飛行時間小于Tf時,轉入最慢到達軌跡。
最終,所有飛行器將在Tf時刻抵達集結位置。整個集結飛行的流程如圖2所示。
圖2 集結軌跡實時規(guī)劃流程圖Fig.2 Flow chart of gathering trajectory planning algorithm
為了驗證本文提出的集結軌跡規(guī)劃方法,考慮三架升力式飛行器CAV-H[18]進行集結的場景。飛行器分別從不同位置出發(fā),需要在相同的時間點抵達各自的集結點完成集結任務。
為了便于觀察軌跡規(guī)劃方法的效果,不妨假設3架飛行器從初始點出發(fā)和抵達各自集結點時的高度、速度、飛行路徑角、航向角均相同,但是縱向與橫向的航程不同。各飛行器的初始狀態(tài)與目標狀態(tài)如表1所示。仿真中涉及的所有時間、高度、速度、航程已無量綱化處理。不同的是飛行器A會在飛行過程中遭遇三次未知干擾,飛行器B則不會。
表1 各飛行器的初始狀態(tài)與集結狀態(tài)Table 1 The initial state and terminal gathering state of each vehicle
按照本文所提出的方法,計算三個飛行器在起滑初始時刻的最早到達時間為:0.666,0.635,0.607。
因此,將三個飛行器的發(fā)射時間分別調整為0,0.031,0.059,此時三者的最快與最慢到達軌跡如圖3所示。
圖3 初始時刻的最快到達軌跡與最慢到達軌跡Fig.3 The fastest and slowest trajectories at beginning
所有飛行器在飛行過程中都會實時解算自身的可達時間范圍。通過仿真發(fā)現,單次解算耗時不超過5 s,因此可以設置溝通規(guī)劃集結時間的周期為10 s。
在飛行過程中,飛行器可能遭遇敵對飛行器的干擾,飛行器采用S機動策略進行應對。機動期間,飛行器攻角取最大值20°,傾側角幅值取60°,傾側角符號按固定頻率翻轉,使得飛行器在射面左右搖擺機動。在本文的仿真場景中,假設飛行器A未遇到干擾,飛行器B于0.375(無量綱化時間)遭遇一次干擾,飛行器C則于0.25、0.35、0.425和0.45遭遇了四次干擾,如圖4所示。
圖4 飛行器機動期間的攻角與航向角Fig.4 Angle of attack and heading angle of vehicles during maneuvering
這些干擾使得B、C的軌跡逐漸偏離了初始時刻的最快到達軌跡,能量也越來越偏離初始能量最優(yōu)軌跡,因此最早到達時間漸次增大。同時,飛行器A一直按照最快到達軌跡飛行,其最晚到達飛行時間逐漸減小。最終在0.525,飛行器A的最晚到達時間早于飛行器C的最早到達時間,集結時間確定為0.686,集結軌跡規(guī)劃第一階段完成,各飛行器轉入第二階段飛行。
在第二階段中,飛行器A切換到最慢到達軌跡,飛行器C繼續(xù)按照最快達到軌跡飛行,不再執(zhí)行額外機動動作。飛行器B繼續(xù)保持能量最優(yōu)軌跡飛行,直到0.545時,其最晚到達時間也小于0.686,轉入最慢到達軌跡。最終,三架飛行器基本同時到達集結位置,完成集結,如圖5所示。
圖5 飛行器的實際集結軌跡Fig.5 The actual gathering trajectories of vehicles
通過圖5(b)的能量曲線可以看出,本文設計的集結軌跡規(guī)劃方法使得飛行器B與飛行器C的富余能量充分應用在了應對突發(fā)干擾的機動中,整個飛行器集群始終保持能量最優(yōu)的態(tài)勢飛行,直到集群狀態(tài)抵達可實現集結的邊界,在整個集群尺度上實現了能量的優(yōu)化分配。
圖6展示了整個集結過程中的路徑約束滿足情況,可以看到所有飛行器的熱流、動壓、過載均未超出約束(約束上限均為1)。這是由于飛行器全程采用擬平衡滑翔模式,軌跡變化一直比較平緩,最可能超出約束的是末段的能量調整段。一旦超過約束,則需要通過改變能量調整段的攻角,減緩能量調整的速度,實現路徑約束的滿足。
圖6 熱流、動壓、過載曲線(無量綱)Fig.6 The heat, dynamic pressure and load curve
本文針對升力式飛行器的集結問題,提出了一種能夠提高飛行器干擾適應能力的實時軌跡規(guī)劃方法,并通過仿真驗證了算法的有效性。
1)本文提出了一種集結軌跡規(guī)劃方法,通過實時求解可達時間范圍協(xié)調多個升力式飛行器的集結時間。通過仿真分析,證實這種軌跡規(guī)劃方法能夠實現升力式飛行器面對嚴重干擾時的集結飛行,提升飛行器執(zhí)行任務的適應性。
2)本文分析了在平衡滑翔條件下升力式飛行器的最快到達軌跡模式與最慢到達軌跡模式,提出了最速能量調整軌跡的快速迭代計算方法,構建了多飛行器集結軌跡規(guī)劃方法,通過仿真驗證了方法的可行性。