李俊賢, 范軍芳
(北京信息科技大學(xué)高動(dòng)態(tài)導(dǎo)航技術(shù)北京市重點(diǎn)實(shí)驗(yàn)室,北京 100000)
近年來的局部沖突、城市巷戰(zhàn)及2020年納卡沖突等實(shí)踐均表明,攻防各方的信息化與智能化水平顯著提升,攻擊彈藥、目標(biāo)以及目標(biāo)發(fā)射的防衛(wèi)彈藥在攻防對抗中符合智能體的內(nèi)涵。局部環(huán)境中導(dǎo)彈與目標(biāo)之間、防御彈和攻擊彈之間的博弈研究具有重要的理論與實(shí)際價(jià)值。
文獻(xiàn)[1]應(yīng)用強(qiáng)化學(xué)習(xí)的方法求解微分對策的問題;文獻(xiàn)[2]基于單神經(jīng)網(wǎng)絡(luò)的策略迭代算法實(shí)現(xiàn)了對微小衛(wèi)星微分博弈均衡策略的逼近,但該算法計(jì)算復(fù)雜度高;文獻(xiàn)[3]針對目標(biāo)可以對攻擊彈進(jìn)行主動(dòng)防御的問題,設(shè)計(jì)了攻擊彈攔截主動(dòng)防御目標(biāo)的微分對策制導(dǎo)律;文獻(xiàn)[4]針對飛行器逃避攔截器追蹤的問題,提出了基于最優(yōu)控制的目標(biāo)和防御彈協(xié)同躲避和追擊的策略,但是該制導(dǎo)律的實(shí)施需要已知來襲攻擊彈的制導(dǎo)律,不符合實(shí)際情況;文獻(xiàn)[5]針對攻防雙方分別設(shè)計(jì)了最優(yōu)規(guī)避策略和突防策略;文獻(xiàn)[6-7]考慮了交戰(zhàn)模型中的非線性情況,但是各方的控制方式較簡單,未考慮到速度變化的情況;文獻(xiàn)[8]針對目標(biāo)不機(jī)動(dòng)時(shí),防御彈與目標(biāo)進(jìn)行非合作博弈,基于A-CLOS設(shè)計(jì)制導(dǎo)律;文獻(xiàn)[9]針對無人機(jī)和無人車的追逃微分對策問題,考慮了對局中障礙物的影響,確定了其分界界柵。
文獻(xiàn)[10]針對控制能量作為制導(dǎo)性能指標(biāo),設(shè)計(jì)了飛機(jī)-導(dǎo)彈的雙方追逃模型,并采用梯度迭代法求解;文獻(xiàn)[11]針對視線傾角和視線偏角作為控制量,推導(dǎo)出了關(guān)于防御-攔截雙方的末制導(dǎo)律;文獻(xiàn)[12]針對三維空間三體追逃博弈問題,采用模糊評(píng)估的方法設(shè)計(jì)了目標(biāo)函數(shù)并推導(dǎo)出了相應(yīng)的控制策略;文獻(xiàn)[13-16]針對多彈協(xié)同攔截單一目標(biāo)進(jìn)行制導(dǎo)律的設(shè)計(jì),但是模型假設(shè)條件過于理想化,很難與實(shí)際情況相匹配;文獻(xiàn)[17]針對攔截彈、防衛(wèi)彈和攻擊彈的三體博弈問題,分析了攔截彈贏得博弈的不同情況;文獻(xiàn)[18]針對傳統(tǒng)最優(yōu)制導(dǎo)律的不足設(shè)計(jì)了最優(yōu)邊界制導(dǎo)律(OSBGL),使得攻擊彈可以逃脫防御彈并攻擊飛行器;文獻(xiàn)[19]針對高階線性化攔截彈制導(dǎo)系統(tǒng),研究了目標(biāo)最優(yōu)機(jī)動(dòng)突防策略問題。
以上關(guān)于微分對策制導(dǎo)的研究大多數(shù)只關(guān)注末制導(dǎo)階段,但是末制導(dǎo)階段由于存在飛行器速度過快、對抗時(shí)間短等問題,難以體現(xiàn)出微分對策制導(dǎo)的優(yōu)勢。
本文針對攻擊彈如何有效打擊地面目標(biāo)的問題,建立了三體攻防博弈模型,提出了一種基于微分對策的制導(dǎo)策略,并且,該制導(dǎo)律在中制導(dǎo)階段就可以體現(xiàn)出其優(yōu)勢,在防御彈以三點(diǎn)法制導(dǎo)攔截的前提下,對比分析了攻擊彈分別以比例導(dǎo)引和微分對策制導(dǎo)的仿真結(jié)果,驗(yàn)證了微分對策制導(dǎo)相比于傳統(tǒng)制導(dǎo)策略的有效性。
本文考慮的是攻擊彈A如何有效打擊地面目標(biāo)T,并且可以躲避以三點(diǎn)法制導(dǎo)的防御彈D三者間的攻防博弈問題。3個(gè)參與者在三維空間內(nèi)的地面坐標(biāo)系中的幾何交戰(zhàn)關(guān)系如圖 1所示,假設(shè)地球?yàn)槠矫媲襶軸垂直向上為正,目標(biāo)為靜止?fàn)顟B(tài)。
圖1 交戰(zhàn)三體幾何關(guān)系Fig.1 Three-body engagement geometry
將地面目標(biāo)、防御彈和攻擊彈在地面坐標(biāo)系中的坐標(biāo)分別設(shè)為(xT,yT,zT),(xD,yD,zD)和(xA,yA,zA)。速度矢量分別設(shè)為uT=[uxT,uyT,uzT],uD=[uxD,uyD,uzD]和uA=[uxA,uyA,uzA];加速度矢量分別設(shè)為aT=[axT,ayT,azT],aD=[axD,ayD,azD],aA=[axA,ayA,azA];飛行器間的相對位置矢量為ri j=[xi j,yi j,zi j];相對速度矢量為ui j=[uxij,uyij,uzij];相對加速度矢量為ai j=[axij,ayij,azij]。
根據(jù)圖1中定義的運(yùn)動(dòng)學(xué)變量,交戰(zhàn)三體在地面坐標(biāo)系下的相對運(yùn)動(dòng)學(xué)方程可為
(1)
設(shè)狀態(tài)變量X=[ri j,ui j]T,因?yàn)槟繕?biāo)為靜止?fàn)顟B(tài),所以狀態(tài)方程僅表示攻擊彈與防御彈之間的關(guān)系,則式(1)可寫為
(2)
在構(gòu)建微分對策制導(dǎo)回路的問題時(shí),分別采取了如下假設(shè)。
1) 系統(tǒng)獲取飛行器狀態(tài)是準(zhǔn)確的,即不考慮系統(tǒng)狀態(tài)估計(jì)誤差的情況。
2) 自動(dòng)駕駛儀為一階滯后環(huán)節(jié)[20],即
(3)
針對上述問題及假設(shè)條件設(shè)計(jì)如圖2所示的制導(dǎo)框圖。
圖2 制導(dǎo)框圖Fig.2 Block diagram of the guidance
在防御彈與攻擊彈的攻防對抗中,防御彈總是力圖使其與攻擊彈的脫靶量達(dá)到最小值,而攻擊彈則力圖使其與防御彈的脫靶量達(dá)到最大,所以兩者的攻防問題是一種零和博弈問題,而對于攻擊彈和目標(biāo)的零和博弈問題,由于目標(biāo)靜止兩者間的問題就變成了攻擊彈單方的追擊問題,綜合這兩種情況可以得出防御彈以及攻擊彈的制導(dǎo)策略。本文選擇以最終的脫靶量和飛行器的需求過載作為綜合性能指標(biāo),設(shè)計(jì)了如下目標(biāo)函數(shù)
(4)
式中:t,t0,tend分別為當(dāng)前時(shí)刻、初始時(shí)刻和終止時(shí)刻;N∈R4×4,為半正定的終端性能加權(quán)矩陣;Q∈R4×4,為半正定的當(dāng)前狀態(tài)性能加權(quán)矩陣;RD∈R6×6,RA∈R6×6,均為飛行器控制性能正定矩陣。
(5)
式中,λ∈R6×1,為協(xié)態(tài)變量。
根據(jù)微分對策問題解得最優(yōu)解的必要條件并結(jié)合式(5)可得[21]
(6)
式中:X0,X(t0),X(tf)分別為狀態(tài)變量初值、起始時(shí)刻與終止時(shí)刻值;λ(tf)為協(xié)態(tài)變量終值。
對哈密頓函數(shù)求導(dǎo)使其等于零,可以得出三體追逃博弈中防御彈和攻擊彈各自的制導(dǎo)律如下
(7)
假定協(xié)態(tài)方程為
λ=PX
(8)
式中,P∈R6×6,是黎卡提微分方程的解。結(jié)合式(7)、式(8)可得
(9)
將式(6)代入式(2)可得黎卡提微分方程為
(10)
通過對黎卡提微分方程求解即可得到加速度控制指令的數(shù)值解,這里不對求解過程進(jìn)行具體推導(dǎo)。本文為了體現(xiàn)微分對策制導(dǎo)的特點(diǎn)做了如下簡化:
1) 在攻防對抗的過程中,重點(diǎn)只關(guān)注制導(dǎo)終端時(shí)的狀態(tài),所以可令當(dāng)前狀態(tài)性能指標(biāo)矩陣Q=0;
2) 由于終端性能指標(biāo)只表示終端時(shí)刻tend的性能,所以令終端性能指標(biāo)矩陣N為常數(shù)矩陣。
仿真中需要的初始數(shù)據(jù)如表1所示,試驗(yàn)中地面目標(biāo)保持靜止?fàn)顟B(tài)。
表1 初始仿真參數(shù)Table 1 Initial simulation parameters
由于導(dǎo)彈在實(shí)際飛行的過程中,彈體上的各種儀器所能承受的載荷有限,以及彈體本身的氣動(dòng)布局,操縱機(jī)構(gòu)所能產(chǎn)生的舵偏角有限等因素,彈體上的過載往往達(dá)不到理想的設(shè)定值,因而對攻擊彈的過載進(jìn)行約束。
為了說明本文設(shè)計(jì)的制導(dǎo)律的有效性,可使防御彈以一個(gè)較大的過載值飛行,目的是為了使防御彈有更強(qiáng)的機(jī)動(dòng)性追蹤攻擊彈,以此來驗(yàn)證攻擊彈是否能在躲避防御彈的同時(shí)對目標(biāo)進(jìn)行攔截,因此不對防御彈的過載進(jìn)行約束。
防御彈采用三點(diǎn)法導(dǎo)引,加速度控制指令為
(11)
式中:ηy,ηz分別為導(dǎo)彈控制指令與法相、側(cè)向控制力的關(guān)系;qA,qD分別為攻擊彈與防御彈的視線角;εA,εD分別為攻擊彈與防御彈的方位角。
當(dāng)攻擊彈采用比例導(dǎo)引時(shí),加速度控制指令為
(12)
(13)
式中:ωAD為防御彈與攻擊彈之間的相對視線旋轉(zhuǎn)角速率矢量;K=diag(0,Ky,Kz),Ky,Kz為導(dǎo)航比。
圖3所示為攻擊彈在采取比例導(dǎo)引的運(yùn)動(dòng)軌跡。
圖3 xoz和xoy平面運(yùn)動(dòng)軌跡(比例導(dǎo)引)Fig.3 The trajectory in xoz and xoy plane(proportional guidance)
從圖3中可看出,防御彈和攻擊彈在偏航方向上的軌跡變化不大,而從縱向平面的變化曲線可以看出,防御彈與攻擊彈的距離過近。
比例導(dǎo)引情況下的過載變化曲線如圖4所示。
圖4 z向和y向的過載變化曲線(比例導(dǎo)引)Fig.4 Acceleration variation in z and y direction(proportional guidance)
仿真結(jié)果表明,在攻擊彈采用比例導(dǎo)引時(shí),由于不涉及逃避防御彈的策略,攻擊彈和防御彈的過載值都較為平穩(wěn)。
攻擊彈采取比例導(dǎo)引時(shí),其三維空間示意圖見圖5。
圖5 比例導(dǎo)引的三維示意圖Fig.5 Three-dimensional schematic diagram of proportional guidance
當(dāng)攻擊彈采用如式(6)所示的加速度控制指令時(shí),其運(yùn)動(dòng)軌跡如圖6所示。
圖6 xoz和xoy平面運(yùn)動(dòng)軌跡(微分對策制導(dǎo))Fig.6 The trajectory in xoz and xoy plane(differential game guidance)
仿真結(jié)果表明,xoz平面的軌跡變化較小,xoy平面軌跡變化與比例導(dǎo)引時(shí)有明顯差異。
微分對策導(dǎo)引情況下的過載變化如圖7所示。
圖7 z向和y向的過載變化曲線(微分對策制導(dǎo))Fig.7 Acceleration variation in z and y direction(differential game guidance)
仿真結(jié)果表明,攻擊彈為了躲避防御彈的攔截,過載值會(huì)有較大的變化,而防御彈為了攔截攻擊彈,自身的過載也增大,這體現(xiàn)了微分對策制導(dǎo)的優(yōu)勢,既延長兩者相對距離,又增大了防御彈的能量消耗。
圖8為攻擊彈采用微分對策制導(dǎo)時(shí)的三維空間示意圖。
圖8 微分對策三維空間示意圖Fig.8 Three-dimensional schematic diagram of differential game
當(dāng)攻擊彈分別采用比例導(dǎo)引和微分對策制導(dǎo)時(shí),防御彈與攻擊彈的最小彈目距離,以及攻擊彈的最終脫靶量如表2所示。
表2 彈目距離與脫靶量仿真結(jié)果Table 2 Simulation results of missile-target distance and miss distance m
由表2中的仿真數(shù)據(jù)可以看出:若攻擊彈采取比例導(dǎo)引制導(dǎo)時(shí),雖可打擊目標(biāo),但攻擊彈與防御彈之間的最小彈目距離較小,導(dǎo)致了在攻擊彈打擊目標(biāo)之前就可能被防御彈攔截;而當(dāng)攻擊彈采取微分對策制導(dǎo)時(shí),不僅可以減少與目標(biāo)間脫靶量,并且延長了攻擊彈和防御彈之間的最小彈目距離,使得攻擊彈能在逃脫防御彈的同時(shí)對目標(biāo)進(jìn)行打擊,展現(xiàn)了微分對策制導(dǎo)的優(yōu)勢。
本文針對攻擊彈如何有效打擊地面目標(biāo)的問題,提出了一種在三方對抗博弈場景下的微分對策制導(dǎo)律,并且將其作為攻擊彈的制導(dǎo)方式,考慮了交戰(zhàn)參與者的理想情況及實(shí)際運(yùn)動(dòng)情況,對參戰(zhàn)三方的運(yùn)動(dòng)軌跡和過載變化進(jìn)行了數(shù)值仿真,由仿真結(jié)果可得出,攻擊彈采取微分對策制導(dǎo)時(shí)與傳統(tǒng)的比例導(dǎo)引制導(dǎo)方法對比有明顯的優(yōu)勢,因此仿真結(jié)果具有一定的有效性和實(shí)際性。