摘 要:""""" 三體對抗場景下, 對來襲導(dǎo)彈制導(dǎo)律的準(zhǔn)確識(shí)別可以為其軌跡預(yù)測提供有力支持。 針對此場景中來襲導(dǎo)彈運(yùn)動(dòng)與目標(biāo)運(yùn)動(dòng)呈現(xiàn)半合作特征的特點(diǎn), 在收集導(dǎo)彈軌跡數(shù)據(jù)時(shí)加入不同目標(biāo)機(jī)動(dòng), 使數(shù)據(jù)更加貼合實(shí)際。 提出了一種基于長短期記憶(Long Short-Term Memory, LSTM)神經(jīng)網(wǎng)絡(luò)的制導(dǎo)律識(shí)別方法, 對來襲導(dǎo)彈制導(dǎo)律的類型進(jìn)行識(shí)別。 設(shè)計(jì)了一種加入注意力機(jī)制的LSTM神經(jīng)網(wǎng)絡(luò), 提高了網(wǎng)絡(luò)模型的自適應(yīng)能力以及泛化能力, 使識(shí)別準(zhǔn)確率及識(shí)別精度大幅度提高。 實(shí)驗(yàn)結(jié)果證明, 此方法識(shí)別準(zhǔn)確率較高, 且識(shí)別所需時(shí)間小, 可以滿足彈上使用需求。
關(guān)鍵詞:"""" 神經(jīng)網(wǎng)絡(luò); 制導(dǎo)律識(shí)別; LSTM; 三體對抗; 注意力機(jī)制
中圖分類號:"""" TJ765; V249
文獻(xiàn)標(biāo)識(shí)碼:""" A
文章編號:"""" 1673-5048(2024)06-0057-07
DOI: 10.12132/ISSN.1673-5048.2024.0100
0 引" 言
隨著現(xiàn)代化武器技術(shù)的不斷發(fā)展, 空戰(zhàn)攻防場景的復(fù)雜度不斷提高, 傳統(tǒng)的一對一攻防場景有時(shí)無法滿足戰(zhàn)場需求。 同時(shí), 隨著來襲導(dǎo)彈多模導(dǎo)引和復(fù)合制導(dǎo)方式的普遍采用以及機(jī)動(dòng)能力的不斷提升, 傳統(tǒng)的被動(dòng)對抗手段越來越難以奏效。 因此, 由主動(dòng)防御引發(fā)的三體對抗問題成為研究熱點(diǎn)[1-2]。 典型的三體對抗場景一般存在我方載機(jī)(T)、 來襲導(dǎo)彈(A)、 我方攔截彈(D)三種飛行器, 三體對抗模型如圖1所示。 這種作戰(zhàn)場景與傳統(tǒng)的追逃模式不同, 具有更強(qiáng)的復(fù)雜度, 也為戰(zhàn)場博弈提供了更多的可能性[3]。 在三體對抗場景下, 來襲導(dǎo)彈以攻擊我方載機(jī)為目標(biāo), 其運(yùn)動(dòng)軌跡與我方載機(jī)的運(yùn)動(dòng)強(qiáng)相關(guān), 呈現(xiàn)較強(qiáng)合作特性, 且目前國內(nèi)外的空空/面空導(dǎo)彈的制導(dǎo)律大多是以比例導(dǎo)引為基礎(chǔ), 這為來襲導(dǎo)彈類半合作目標(biāo)的軌跡預(yù)測帶來了可能性。
然而, 由于環(huán)境的不確定性、 模型泛化能力有限及訓(xùn)練數(shù)據(jù)的局限性等原因, 隨著預(yù)測時(shí)間的延長, 軌跡預(yù)測的誤差會(huì)逐步積累, 導(dǎo)致長時(shí)間預(yù)測準(zhǔn)確率迅速下降, 這種誤差積累效應(yīng)在導(dǎo)彈軌跡預(yù)測這種復(fù)雜、 非線性軌跡預(yù)測任務(wù)中尤為明顯。 如果能預(yù)測出來襲導(dǎo)彈的制導(dǎo)規(guī)律, 通過彈道仿真, 就能夠獲得來襲導(dǎo)彈未來的航跡信息。 這樣不僅可以擺脫對數(shù)據(jù)的依賴性, 還能降低各種不確定因素對預(yù)測的影響, 使長時(shí)間軌跡預(yù)測更加精準(zhǔn)。 在三體對抗場景下, 來襲導(dǎo)彈在交戰(zhàn)中測量自身與其目標(biāo)的相對運(yùn)動(dòng)信息, 按照預(yù)定的制導(dǎo)律控制自身的航跡變化從而實(shí)現(xiàn)對其目標(biāo)的精確制導(dǎo)。 不同的制導(dǎo)律及其參數(shù)對來襲導(dǎo)彈軌跡的影響主要體現(xiàn)在導(dǎo)彈的彎曲程度上, 制導(dǎo)律識(shí)別解決來襲導(dǎo)彈采用何種典型制導(dǎo)律及其制導(dǎo)參數(shù), 進(jìn)而基于三體對抗場景, 改善軌跡
精度。 因此, 本文對來襲導(dǎo)彈的制導(dǎo)律識(shí)別進(jìn)行研究。
因來襲導(dǎo)彈的運(yùn)動(dòng)軌跡與目標(biāo)的運(yùn)動(dòng)呈現(xiàn)半合作特征, 需要對目標(biāo)機(jī)動(dòng)進(jìn)行研究。 從20世紀(jì)開始, 學(xué)者們就開始研究戰(zhàn)斗機(jī)的機(jī)動(dòng)方法, 以此來規(guī)避導(dǎo)彈的攻擊。 隨著多年的研究和發(fā)展, 對機(jī)動(dòng)方法的研究取得了顯著進(jìn)展。 杜瑾等[4]運(yùn)用數(shù)字仿真技術(shù)構(gòu)建了飛機(jī)機(jī)動(dòng)庫, 用較少參數(shù)刻畫不同機(jī)動(dòng)動(dòng)作。 吳家湖[5]給出了非常規(guī)機(jī)動(dòng)運(yùn)動(dòng)的非線性數(shù)學(xué)模型, 并總結(jié)了常規(guī)機(jī)動(dòng)與非常規(guī)機(jī)動(dòng)共10種機(jī)動(dòng)。 李昭銳等[6]重點(diǎn)對滾筒機(jī)動(dòng)進(jìn)行建模仿真, 分析了滾筒機(jī)動(dòng)規(guī)避導(dǎo)彈的效果。 蘇光旭等[7]在機(jī)動(dòng)動(dòng)作仿真時(shí)加入氣動(dòng)數(shù)據(jù), 建立了典型戰(zhàn)術(shù)機(jī)動(dòng)庫, 并對機(jī)動(dòng)動(dòng)作進(jìn)行可視化研究, 可以更直觀地得到飛行參數(shù)。
目前關(guān)于制導(dǎo)律識(shí)別的工作研究較少, 大部分都是基于多模型自適應(yīng)的方法。 Fonod等[8]設(shè)置多個(gè)卡爾曼濾波器并行運(yùn)行, 每個(gè)濾波器代表一種對方可能使用的攔截彈制導(dǎo)律, 采用非線性多模型自適應(yīng)的制導(dǎo)律辨識(shí)方法對來襲彈制導(dǎo)律進(jìn)行辨識(shí)。 杜潤樂等[9]采用一種通用的隱式制導(dǎo)函數(shù)對制導(dǎo)行為進(jìn)行統(tǒng)一描述, 并將低通濾波與卡爾曼濾波相結(jié)合, 對制導(dǎo)律進(jìn)行分析辨識(shí)。 蔡遠(yuǎn)利等[10]基于三體對抗場景, 建立了多模型自適應(yīng)濾波算法來辨識(shí)攔截彈的的制導(dǎo)律。 然而, 在可查的參考文獻(xiàn)中, 基于多模型自適應(yīng)的方法一般需要2 s甚至更長時(shí)間才能識(shí)別出來襲導(dǎo)彈的制導(dǎo)律[10-11], 但是在真正的戰(zhàn)場中往往需要更快的識(shí)別速度以獲得戰(zhàn)場中的優(yōu)勢。 神經(jīng)網(wǎng)絡(luò)擁有高度優(yōu)化的結(jié)構(gòu)和可以并行處理的特點(diǎn), 可以做到在短時(shí)間內(nèi)快速而準(zhǔn)確地進(jìn)行識(shí)別。 因此, 使用神經(jīng)網(wǎng)絡(luò)進(jìn)行制導(dǎo)律識(shí)別的方法也開始被關(guān)注和研究。 王因翰等[12]發(fā)明了一種基于GRU的制導(dǎo)律快速辨識(shí)方法, 來識(shí)別比例導(dǎo)引制導(dǎo)律或增強(qiáng)比例導(dǎo)引制導(dǎo)律。 王江等[13]使用神經(jīng)網(wǎng)絡(luò)對協(xié)同制導(dǎo)律進(jìn)行快速回歸辨識(shí)。 Wang等[14]假設(shè)采用比例導(dǎo)航制導(dǎo)律的導(dǎo)彈對空中目標(biāo)進(jìn)行攻擊, 建立了基于GRU神經(jīng)網(wǎng)絡(luò)的參數(shù)辨識(shí)模型, 并提出一種改進(jìn)的多模型機(jī)制輸出處理方法。 目前, 使用神經(jīng)網(wǎng)絡(luò)方法對制導(dǎo)律進(jìn)行辨識(shí)的文獻(xiàn)較少, 還需要學(xué)者和專家們的進(jìn)一步研究。
本文選用基于神經(jīng)網(wǎng)絡(luò)的制導(dǎo)律識(shí)別方法。 首先, 運(yùn)用仿真軟件模擬導(dǎo)彈和目標(biāo)的軌跡, 獲取神經(jīng)網(wǎng)絡(luò)訓(xùn)練所需的數(shù)據(jù); 考慮來襲導(dǎo)彈3種不同的制導(dǎo)律形式以及載機(jī)8種不同的機(jī)動(dòng)動(dòng)作生成仿真軌跡數(shù)據(jù), 將使用同一種制導(dǎo)律的導(dǎo)彈軌跡劃分為一類, 再用LSTM神經(jīng)網(wǎng)絡(luò)對不同類別的制導(dǎo)律進(jìn)行識(shí)別; 提出一種基于注意力機(jī)制的LSTM神經(jīng)網(wǎng)絡(luò), 提高了網(wǎng)絡(luò)的整體性能。 經(jīng)過仿真實(shí)驗(yàn)驗(yàn)證, 基于LSTM神經(jīng)網(wǎng)絡(luò)的制導(dǎo)律識(shí)別方法能夠確保識(shí)別率, 且大幅度減少識(shí)別所需時(shí)間。
1 模型建立
本文收集的數(shù)據(jù)需要在普通彈道的基礎(chǔ)上加入不同的目標(biāo)機(jī)動(dòng), 從而獲得不同目標(biāo)機(jī)動(dòng)下的導(dǎo)彈軌跡。 因此, 模型的建立包括彈目相對模型以及目標(biāo)機(jī)動(dòng)模型兩部分。
1.1 三維比例導(dǎo)引模型
來襲導(dǎo)彈與載機(jī)的相對運(yùn)動(dòng)模型如圖2所示。
圖中, OXYZ為地面坐標(biāo)系, OXLYLZL為視線坐標(biāo)系; θm, ψm分別為導(dǎo)彈的彈道傾角和彈道偏角; ψt為目標(biāo)的彈道偏角; θl, ψl為目標(biāo)視線的傾角和偏角。
傳統(tǒng)的比例導(dǎo)引法接近目標(biāo)時(shí)的需用法向過載有較大波動(dòng), 這會(huì)影響導(dǎo)彈的穩(wěn)定性和命中精度。 因此根據(jù)文獻(xiàn)[15]對其進(jìn)行改進(jìn)得到:
ny=K1|R·|θ·l+ω1(1)
nz=K2|R·|ψ·l+ω2(2)
式中: ny, nz為彈道坐標(biāo)系內(nèi)的俯仰通道過載和偏航通道過載; K1, K2為比例系數(shù); ω1, ω2為附加增量。 對ω1, ω2進(jìn)行合理取值, 可以補(bǔ)償引起目標(biāo)線轉(zhuǎn)動(dòng)的幾個(gè)因素, 減小需用法向過載的波動(dòng)。 彈目相對運(yùn)動(dòng)模型為
R·=vtcosθlcos(ψl-ψt)-[cosvmcosθlcos(ψl-ψm)+sinθmsinθl]vm(3)
Rθ·l=-vtsinθlcos(ψl-ψt)-[sinθmcosθl-sinθlcosθm·
cos(ψl-ψm)]vm-Rcosθlψl=-vtsin(ψl-ψt)-
vmcosθmsin(ψl-ψm)(4)
又有
ny=vmθ·m/g+cosθm(5)
nz=-vmcosθmψ·m/g(6)
則由式(1)~(2)、 式(5)~(6)可得
θ·m=g(ny-cosθm)/vm(7)
ψ·m=-gnz/(vmcosθm)(8)
先將式(4)求導(dǎo), 再將式(3)代入式(4)可得
Rθ¨l+2R·θ·l=vtψ·lsinθlcos(ψl-ψt)-[cosθmcosθlθ·m+sin(ψl-ψm)(ψ·l-ψ·m)sinθlcosθm]vm(9)
使導(dǎo)彈的切向加速度以及重力引起的彈道需要過載在命中點(diǎn)處的影響為零, 即可通過式(7)~(9)求解出ω1和ω2。
本文在比例導(dǎo)引的基礎(chǔ)上進(jìn)行改進(jìn), 得到改進(jìn)比例導(dǎo)引律以及變結(jié)構(gòu)比例導(dǎo)引律。 根據(jù)文獻(xiàn)[16]得到有落角約束的變系數(shù)改進(jìn)比例導(dǎo)引律:
ny=K1Vθ·l/g+cosθm(10)
nz=K2Vψ·l/g(11)
K1的自適應(yīng)更新方程為
K·1=kVsinθ(K1-N)/h(12)
式中: N=(θq-θm)/(θq-θl), θq為期望彈道傾角, 當(dāng)Ngt;2時(shí)K1=N, 當(dāng)N≤2時(shí)K1=0.8; V為導(dǎo)彈速度; h為導(dǎo)彈高度; k為增益系數(shù), 且kgt;0。
根據(jù)文獻(xiàn)[17]得出變結(jié)構(gòu)導(dǎo)引律:
ny=(N1+1)R·θ·l+ξ1(θ·l/R)/|θ·l|+δ1(13)
nz=-(N2+1)R·1ψ·l+ξ2(ψ·l/R1)/|ψ·l|+δ2(14)
式中: R1=Rcosθl; N1, N2為大于零的常數(shù); δ1, δ2為常數(shù); ξ1, ξ2為變結(jié)構(gòu)增益。
1.2 目標(biāo)機(jī)動(dòng)庫構(gòu)建
除典型機(jī)動(dòng)外, 本文目標(biāo)機(jī)動(dòng)庫加入組合兩種典型機(jī)動(dòng)的擴(kuò)充機(jī)動(dòng), 更加貼近實(shí)際。 目標(biāo)機(jī)動(dòng)庫共有8種機(jī)動(dòng), 包括平飛機(jī)動(dòng)、 盤旋機(jī)動(dòng)、 筋斗機(jī)動(dòng)、 蛇形機(jī)動(dòng)、 滾筒機(jī)動(dòng)、 螺旋上升機(jī)動(dòng)6種典型機(jī)動(dòng), 以及破S機(jī)動(dòng)和殷麥曼機(jī)動(dòng)2種擴(kuò)充機(jī)動(dòng)。" 目標(biāo)機(jī)動(dòng)庫模型覆蓋了典型的攻防對戰(zhàn)場景。
以蛇形機(jī)動(dòng)為例對目標(biāo)機(jī)動(dòng)庫中的機(jī)動(dòng)進(jìn)行介紹。 蛇形機(jī)動(dòng)在XOY平面內(nèi), 目標(biāo)沿X軸前進(jìn), 同時(shí)沿Z軸正弦運(yùn)動(dòng)。 蛇形機(jī)動(dòng)軌跡如圖3所示, 軌跡可描述為
x=x0+v3xt(15)
y=y0(16)
z=z0-a3ω2cos(ωt+ω0)(17)
式中: a3為加速度; v3x為X軸初速度; ω, ω0分別為機(jī)動(dòng)頻率和初相位。
2 基于LSTM神經(jīng)網(wǎng)絡(luò)的來襲導(dǎo)彈制導(dǎo)律識(shí)別
2.1 LSTM 神經(jīng)網(wǎng)絡(luò)
長短期記憶(Long Short-Term Memory, LSTM)[18]是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network, RNN), 與 RNN重復(fù)模塊中只包含單一的層不同, LSTM 通過在重復(fù)模塊中加入4個(gè)交互的層來避免長期依賴問題的出現(xiàn), 解決了循環(huán)神經(jīng)網(wǎng)絡(luò)長序列訓(xùn)練過程中的梯度消失和梯度爆炸問題。
由于LSTM神經(jīng)網(wǎng)絡(luò)具有記憶單元, 能夠捕捉長期依賴關(guān)系, 非常適合處理具有長期依賴關(guān)系的序列數(shù)據(jù), 在時(shí)間序列預(yù)測等領(lǐng)域被廣泛應(yīng)用[19-21]。 本文的數(shù)據(jù)屬于序列數(shù)據(jù), 所以選擇使用LSTM神經(jīng)網(wǎng)絡(luò)來訓(xùn)練數(shù)據(jù)。 LSTM 模型的結(jié)構(gòu)示意圖如圖4所示。
基礎(chǔ)LSTM 網(wǎng)絡(luò)模型由輸入層、 LSTM層、 全連接層、 激活函數(shù)層以及分類輸出層5層構(gòu)成, 其網(wǎng)絡(luò)結(jié)構(gòu)如圖5所示。
2.2 基于注意力機(jī)制的LSTM神經(jīng)網(wǎng)絡(luò)
注意力機(jī)制(Attention Mechanism)是一種模仿人類注意力機(jī)制的計(jì)算機(jī)科學(xué)原理, 主要用于提高神經(jīng)網(wǎng)絡(luò)在處理序列數(shù)據(jù)時(shí)的性能[22]。 在深度學(xué)習(xí)中, 注意力機(jī)制被廣泛應(yīng)用于各種任務(wù), 如自然語言處理、 計(jì)算機(jī)視覺和強(qiáng)化學(xué)習(xí)等領(lǐng)域[23-25]。 引入注意力機(jī)制后, 根據(jù)輸入數(shù)據(jù)的重要性, 模型可以對其分配不同的權(quán)重, 這樣能夠用更多注意力去處理重要的數(shù)據(jù), 提高模型的性能和泛化能力。
本文的數(shù)據(jù)是導(dǎo)彈軌跡數(shù)據(jù), 軌跡按照導(dǎo)彈每一步長的位置變換形成, 設(shè)置的步長為0.01, 步長較小, 導(dǎo)彈數(shù)據(jù)的變化很細(xì)微, 導(dǎo)致一些軌跡在某些時(shí)刻的變化甚至是數(shù)值可能是相同的。 然而, 一條軌跡數(shù)據(jù)的不同區(qū)域?qū)θ蝿?wù)貢獻(xiàn)的重要程度是截然不同的。 空間注意力就是尋找數(shù)據(jù)中最重要的部分進(jìn)行處理, 提升關(guān)鍵區(qū)域的特征表達(dá), 同時(shí)弱化不相關(guān)的背景區(qū)域。
根據(jù)本文數(shù)據(jù)特性, 設(shè)計(jì)了一個(gè)加入空間注意力機(jī)制的神經(jīng)網(wǎng)絡(luò), 其結(jié)構(gòu)如圖6所示。 在該神經(jīng)網(wǎng)絡(luò)中, SigmoidLayer層的輸出得到了每個(gè)位置的注意力權(quán)重; 通過MultiplicationLayer層將注意力權(quán)重應(yīng)用到數(shù)據(jù)中, 以增強(qiáng)或抑制特定位置的特征表示, 數(shù)據(jù)的每個(gè)位置就有了相應(yīng)權(quán)重; 再用LSTM神經(jīng)網(wǎng)絡(luò)按照相應(yīng)權(quán)重進(jìn)行訓(xùn)練, 使得模型可以自動(dòng)關(guān)注輸入序列中最重要的部分, 從而提高模型的性能和泛化能力。
2.3 網(wǎng)絡(luò)訓(xùn)練
2.3.1 數(shù)據(jù)集制作
通過查閱大量國內(nèi)外文獻(xiàn), 來襲空空/面空導(dǎo)彈制導(dǎo)律一般采用比例導(dǎo)引或在比例導(dǎo)引基礎(chǔ)上改進(jìn)的導(dǎo)引律[26]。 當(dāng)前在役導(dǎo)彈如AIM-9響尾蛇空空導(dǎo)彈、 AIM-120先進(jìn)中程空空導(dǎo)彈、 AIM-7麻雀、 FIM-92防空導(dǎo)彈等皆采用比例導(dǎo)引或以比例導(dǎo)引為基礎(chǔ)的導(dǎo)引律。 此外, 基于對P73和P27等紅外類空空導(dǎo)彈的分析, 被動(dòng)制導(dǎo)導(dǎo)彈廣泛采用了比例導(dǎo)引制導(dǎo)律[27-28]。 因此, 對比例制導(dǎo)律、 改進(jìn)比例制導(dǎo)律和變結(jié)構(gòu)比例制導(dǎo)律三種制導(dǎo)律進(jìn)行識(shí)別。 將目標(biāo)機(jī)動(dòng)代入不同制導(dǎo)律中, 得到目標(biāo)做不同機(jī)動(dòng)時(shí)的導(dǎo)彈軌跡, 再對機(jī)動(dòng)參數(shù)進(jìn)行遍歷得到導(dǎo)彈軌跡數(shù)據(jù)簇(忽略目標(biāo)軌跡), 如圖7所示。 將12 000條導(dǎo)彈軌跡進(jìn)行整合, 進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練。
將所有數(shù)據(jù)進(jìn)行整合后, 需要對數(shù)據(jù)進(jìn)行預(yù)處理。 數(shù)據(jù)預(yù)處理是構(gòu)建高性能神經(jīng)網(wǎng)絡(luò)的關(guān)鍵步驟之一, 能夠提高模型穩(wěn)健性和訓(xùn)練效果。 本文數(shù)據(jù)預(yù)處理分為三個(gè)部分, 分別為: 野值剔除、 數(shù)據(jù)歸一化和劃分?jǐn)?shù)據(jù)集。 野值剔除是指在實(shí)驗(yàn)前將測量數(shù)據(jù)中的異常值剔除, 這樣不僅可以提高數(shù)據(jù)準(zhǔn)確性, 還可以減少實(shí)驗(yàn)成本。 數(shù)據(jù)歸一化對實(shí)驗(yàn)中所用到的數(shù)值比較大的實(shí)測數(shù)據(jù)進(jìn)行歸一化處理," 通過特定公式將數(shù)據(jù)中的數(shù)值規(guī)定在[-1, 1]之間, 這樣可以減少數(shù)據(jù)中極大值和極小值對識(shí)別的影響, 同時(shí)提高神經(jīng)網(wǎng)絡(luò)的運(yùn)算速度。 本文使用歸一化公式為
xnormalization=x-xminxmax-xmin(18)
式中: x為樣本值; xmin為樣本值最小值; xmax為樣本值最大值; xnormalization為歸一化之后的樣本值。 劃分?jǐn)?shù)據(jù)集是按照一定的比例將全部數(shù)據(jù)劃分成訓(xùn)練集和測試集, 本文數(shù)據(jù)共12 000條, 將其中75%劃分為訓(xùn)練集, 25%劃分為測試集。
2.3.2 神經(jīng)網(wǎng)絡(luò)訓(xùn)練
確定好網(wǎng)絡(luò)結(jié)構(gòu)后開始對網(wǎng)絡(luò)進(jìn)行訓(xùn)練。 針對所提出的網(wǎng)絡(luò), 采用以下設(shè)置進(jìn)行訓(xùn)練, 詳細(xì)訓(xùn)練參數(shù)如表1所示。 LSTM神經(jīng)網(wǎng)絡(luò)與基于注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)參數(shù)相同。
3 仿真結(jié)果
訓(xùn)練集進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練后, 將神經(jīng)網(wǎng)絡(luò)測試集輸出與原測試數(shù)據(jù)集的標(biāo)簽進(jìn)行對比, 可得到準(zhǔn)確率以及精確率。 將傳統(tǒng)LSTM神經(jīng)網(wǎng)絡(luò)與改進(jìn)后的LSTM神經(jīng)網(wǎng)絡(luò)的準(zhǔn)確率與訓(xùn)練誤差進(jìn)行對比, 每50次訓(xùn)練記一點(diǎn), 如圖8所示。 改進(jìn)后的網(wǎng)絡(luò)性能有大幅度提升, 兩種網(wǎng)絡(luò)的詳細(xì)訓(xùn)練結(jié)果對比如表2~3所示。
基于注意力機(jī)制的LSTM神經(jīng)網(wǎng)絡(luò)的混淆矩陣以及精度柱狀圖如圖9所示。
除準(zhǔn)確率外, 預(yù)測時(shí)間也是神經(jīng)網(wǎng)絡(luò)預(yù)測的優(yōu)勢之一。 經(jīng)實(shí)驗(yàn)驗(yàn)證, 使用多模型自適應(yīng)的方法進(jìn)行制導(dǎo)律識(shí)別, 根據(jù)識(shí)別制導(dǎo)律的不同, 所需時(shí)間為2 s左右[10-11]。 本文測試集數(shù)據(jù)共3 000條, 從圖10的識(shí)別時(shí)間分布可以看出, 基本可以做到實(shí)時(shí)識(shí)別, 識(shí)別所需時(shí)間大幅度降低。
4 結(jié)" 論
本文主要研究了三體對抗場景下來襲導(dǎo)彈制導(dǎo)律識(shí)別的問題。 對比例制導(dǎo)律、 最優(yōu)比例制導(dǎo)律和變結(jié)構(gòu)比例制導(dǎo)律三種制導(dǎo)律進(jìn)行識(shí)別。 在數(shù)據(jù)集收集階段, 加入不同的目標(biāo)機(jī)動(dòng), 得到不同目標(biāo)機(jī)動(dòng)下的來襲導(dǎo)彈軌跡, 解決了三體對抗場景下來襲導(dǎo)彈運(yùn)動(dòng)軌跡與目標(biāo)軌跡強(qiáng)相關(guān)的問題; 設(shè)計(jì)了一種基于注意力機(jī)制的LSTM神經(jīng)網(wǎng)絡(luò), 提高了網(wǎng)絡(luò)性能, 使識(shí)別準(zhǔn)確率及識(shí)別精度大幅度提升。 從實(shí)驗(yàn)結(jié)果可以看出, 所提出的制導(dǎo)律識(shí)別方法有效可行, 可以在保證識(shí)別準(zhǔn)確率的同時(shí)大幅度降低識(shí)別時(shí)間。
參考文獻(xiàn):
[1] 張浩, 張奕群, 張鵬飛. 三體對抗中的制導(dǎo)控制研究方法綜述[J]. 戰(zhàn)術(shù)導(dǎo)彈技術(shù), 2021(1): 67-73.
Zhang Hao, Zhang Yiqun, Zhang Pengfei. A Survey of Guidance Law Design in Active Target Defense Scenario[J]. Tactical Missile Technology, 2021(1): 67-73.(in Chinese)
[2] Weintraub I E, Pachter M, Garcia E. An Introduction to Pursuit-Evasion Differential Games[C]∥American Control Conference (ACC), 2020.
[3] 龔曉鵬, 陳萬春, 陳中原. 基于深度強(qiáng)化學(xué)習(xí)的三體對抗博弈策略研究[J]. 戰(zhàn)術(shù)導(dǎo)彈技術(shù), 2022(4): 178-186.
Gong Xiaopeng, Chen Wanchun, Chen Zhongyuan. Three-Body Adversarial Game Strategies Based on Deep Reinforcement Learning[J]. Tactical Missile Technology, 2022(4): 178-186.(in Chinese)
[4] 杜瑾, 鄒坤, 張義飛. 近距空戰(zhàn)中目標(biāo)飛機(jī)戰(zhàn)術(shù)機(jī)動(dòng)數(shù)學(xué)模型建模與仿真[J]. 現(xiàn)代電子技術(shù), 2024, 47(5): 29-34.
Du Jin, Zou Kun, Zhang Yifei. Mathematical Modeling and Simulation of Tactical Maneuvers of Target Aircraft in Close-Range Air Combat[J]. Modern Electronics Technique, 2024, 47(5): 29-34.(in Chinese)
[5] 吳家湖. 基于深度學(xué)習(xí)的空中目標(biāo)機(jī)動(dòng)類型識(shí)別研究[D]. 廣州: 廣東工業(yè)大學(xué), 2020.
Wu Jiahu. Research on Maneuver Type Recognition of Aerial Targets Based on Deep Learning[D].Guangzhou: Guangdong University of Technology, 2020. (in Chinese)
[6] 李昭銳, 戢治洪, 李高春, 等. 基于建模仿真的飛機(jī)桶滾機(jī)動(dòng)規(guī)避空空導(dǎo)彈效果及原因分析[J]. 海軍航空大學(xué)學(xué)報(bào), 2023, 38(1): 145-150.
Li Zhaorui, Ji Zhihong, Li Gaochun, et al. Effect and Reason Analysis for Aircraft Barrel Roll Avoiding Air-to-Air Missile Based on Modeling Simulations[J]. Journal of Naval Aviation University, 2023, 38(1): 145-150.(in Chinese)
[7] 蘇光旭, 張登成, 魏金鵬, 等. 三維重建的飛機(jī)機(jī)動(dòng)動(dòng)作庫設(shè)計(jì)與可視化[J]. 北京航空航天大學(xué)學(xué)報(bào), 2021, 47(6): 1277-1287.
Su Guangxu, Zhang Dengcheng, Wei Jinpeng, et al. Design and Visualization of 3D Reconstruction of Aircraft Maneuver Movements Library[J]. Journal of Beijing University of Aeronautics and Astronautics, 2021, 47(6): 1277-1287.(in Chinese)
[8] Fonod R, Shima T. Multiple Model Adaptive Evasion Against a Homing Missile[J]. Journal of Guidance, Control, and Dynamics, 2016, 39(7): 1578-1592.
[9] 杜潤樂, 劉佳琪, 李志峰, 等. 低通濾波與卡爾曼濾波相結(jié)合的制導(dǎo)律識(shí)別[J]. 哈爾濱工業(yè)大學(xué)學(xué)報(bào), 2017, 49(4): 66-72.
Du Runle, Liu Jiaqi, Li Zhifeng, et al. A LPF Enhanced Adaptive Kalman Filter for Guidance Law Recognition[J]. Journal of Harbin Institute of Technology, 2017, 49(4): 66-72.(in Chinese)
[10] 蔡遠(yuǎn)利,胡翌瑋,方峰.基于多模型自適應(yīng)濾波的攔截彈制導(dǎo)律辨識(shí)方法[C]∥第20屆中國系統(tǒng)仿真技術(shù)及其應(yīng)用學(xué)術(shù)年會(huì), 2019: 125-128.
Cai Yuanli, Hu Yiwei, Fang Feng. Intercept Guidance Law Identification Based on Multiple-Model Adaptive Estimator [C]∥ 20th Chinese Annual Conference on System Simulation Technology and Its Application, 2019: 125-128. (in Chinese)
[11] Fonod R, Shima T. Multiple Model Adaptive Evasion Against a Homing Missile[J]. Journal of Guidance, Control, and Dyna-mics, 2016, 39(7): 1578-1592.
[12] 王因翰, 范世鵬, 吳廣, 等. 基于GRU的敵方攔截彈制導(dǎo)律快速辨識(shí)方法[J]. 航空學(xué)報(bào), 2022, 43(2): 325024.
Wang Yinhan, Fan Shipeng, Wu Guang, et al. Fast Guidance Law Identification Approach for Incoming Missile Based on GRU Network[J]. Acta Aeronautica et Astronautica Sinica, 2022, 43(2): 325024.(in Chinese)
[13] 王江, 王因翰, 范世鵬, 等. 基于人工智能的飛行器協(xié)同制導(dǎo)律快速回歸辨識(shí)方法: CN116224801A [P]. 2023-06-06.
Wang Jiang, Wang Yinhan, Fan Shipeng, et al. Fast Regression Identification Method of Aircraft Cooperative Guidance Law Based on Artificial Intelligence : CN116224801A [P]. 2023-06-06. (in Chinese)
[14] Wang Y H, Wang J, Fan S P, et al. Parameter Identification of a PN-Guided Incoming Missile Using an Improved Multiple-Model Mechanism[J]. IEEE Transactions on Aerospace and Electronic Systems, 2023, 59(5):" 5888-5899.
[15] 黃漢橋, 周軍, 郭建國. 具有角度和時(shí)間約束的導(dǎo)彈最優(yōu)全彈道設(shè)計(jì)[J]. 西北工業(yè)大學(xué)學(xué)報(bào), 2010, 28(2): 165-170.
Huang Hanqiao, Zhou Jun, Guo Jianguo. Design and Simulation of an Optimal Missile Trajectory with Constraints of Impact Time and Impact Angle[J]. Journal of Northwestern Polytechnical University, 2010, 28(2): 165-170.(in Chinese)
[16] 李炯良, 劉懷勛, 王航, 等. 制導(dǎo)炸彈自適應(yīng)比例末制導(dǎo)律研究[J]. 彈箭與制導(dǎo)學(xué)報(bào), 2014, 34(6): 54-56.
Li Jiongliang, Liu Huaixun, Wang Hang, et al. Terminal Adaptive Proportional Guidance Law for Guided Bomb[J]. Journal of Projectiles, Rockets, Missiles and Guidance, 2014, 34(6): 54-56.(in Chinese)
[17] 周德云, 楊振, 張堃. 基于模糊RBF網(wǎng)絡(luò)的自適應(yīng)變結(jié)構(gòu)制導(dǎo)律設(shè)計(jì)[J]. 飛行力學(xué), 2016, 34(4): 54-58.
Zhou Deyun, Yang Zhen, Zhang Kun. Design of Adaptive Variable Structure Guidance Law Based on Fuzzy RBFNN[J]. Flight Dynamics, 2016, 34(4): 54-58.(in Chinese)
[18] Yu Y, Si X S, Hu C H, et al. A Review of Recurrent Neural Networks: LSTM Cells and Network Architectures[J]. Neural Computation, 2019, 31(7): 1235-1270.
[19] 李青勇, 何兵, 張顯煬, 等. 基于LSTM的Encoder-Decoder多步軌跡預(yù)測技術(shù)[J]. 航空兵器, 2021, 28(2): 49-54.
Li Qingyong, He Bing, Zhang Xianyang, et al. Encoder-Decoder Multi-Step Trajectory Prediction Technology Based on LSTM[J]. Aero Weaponry, 2021, 28(2): 49-54.(in Chinese)
[20] 宋波濤, 許廣亮. 基于LSTM與1DCNN的導(dǎo)彈軌跡預(yù)測方法[J]. 系統(tǒng)工程與電子技術(shù), 2023, 45(2): 504-512.
Song Botao, Xu Guangliang. Missile Trajectory Prediction Method Based on LSTM and 1DCNN[J]. Systems Engineering and Electronics, 2023, 45(2): 504-512.(in Chinese)
[21] 張露, 蘇雨, 張科, 等. 基于LSTM的導(dǎo)彈攔截點(diǎn)預(yù)測研究[J]. 航空兵器, 2022, 29(3): 21-27.
Zhang Lu, Su Yu, Zhang Ke, et al. Research on Missile Interception Point Prediction Based on LSTM Network[J]. Aero Weaponry, 2022, 29(3): 21-27.(in Chinese)
[22] 任洪葦, 周志峰, 李汶潔, 等. 基于空間注意力機(jī)制的脊柱側(cè)彎自動(dòng)診斷方法[J/OL]. 激光與光電子學(xué)進(jìn)展, doi: 10.3788/LOP240979.
Ren Hongwei, Zhou Zhifeng, Li Wenjie, et al. Automatic Diagnosis of Scoliosis Based on Spatial Attention Mechanism[J/OL]. Laser amp; Optoelectronics Progress, doi: 10.3788/LOP240979.(in Chinese)
[23] 徐富元, 蔣明, 王志印, 等. 基于注意力機(jī)制與CNN-GRU模型的飛機(jī)航跡預(yù)測研究[J]. 航天電子對抗, 2022, 38(6): 25-30.
Xu Fuyuan, Jiang Ming, Wang Zhiyin, et al. Trajectory Prediction of Aircraft Based on Attention Mechanism and CNN-GRU Model[J]. Aerospace Electronic Warfare, 2022, 38(6): 25-30.(in Chinese)
[24] 李航宇, 玄祖興, 周建平, 等. 信息蒸餾與異構(gòu)上采樣的眼底圖像超分辨重建[J]. 計(jì)算機(jī)工程與應(yīng)用, 2022, 58(23): 238-244.
Li Hangyu, Xuan Zuxing, Zhou Jianping, et al. Super-Resolution of Fundus Images by Information Distillation and Heterogeneous Up-Sampling[J]. Computer Engineering and Applications, 2022, 58(23): 238-244.(in Chinese)
[25] 丁正凱, 傅啟明, 陳建平, 等. 結(jié)合注意力機(jī)制與深度強(qiáng)化學(xué)習(xí)的超短期光伏功率預(yù)測[J]. 計(jì)算機(jī)應(yīng)用, 2023, 43(5): 1647-1654.
Ding Zhengkai, Fu Qiming, Chen Jianping, et al. Ultra-Short-Term Photovoltaic Power Prediction by Deep Reinforcement Learning Based on Attention Mechanism[J]. Journal of Computer Applications, 2023, 43(5): 1647-1654.(in Chinese)
[26] 魏明英. 遠(yuǎn)程防空導(dǎo)彈飛行控制方法研究[M]. 北京: 中國宇航出版社, 2022.
Wei Mingying. Research on Flight Control Method of Long-Range Air Defense Missile[M]. Beijing: China Astronautic Publishing House, 2022.(in Chinese)
[27] 李斌, 劉琪, 徐琰珂. 美國未來空空導(dǎo)彈發(fā)展與能力[J]. 航空兵器, 2023, 30(2): 83-90.
Li Bin, Liu Qi, Xu Yanke. Development and Capability of American Air-to-Air Missile in the Future[J]. Aero Weaponry, 2023, 30(2): 83-90.(in Chinese)
[28] 楊軍, 朱學(xué)平, 賈曉洪, 等. 空空導(dǎo)彈制導(dǎo)控制總體技術(shù)[M]. 西安: 西北工業(yè)大學(xué)出版社, 2022.
Yang Jun, Zhu Xueping, Jia Xiaohong, et al. Guidance and Control of Air-to-Air Missiles[M]. Xi’an: Northwestern Polytechnical University Press, 2022.(in Chinese)
Research on Guidance Law Recognition Method of Incoming
Missile Based on LSTM Neural Network
Yuan Zehua1*, Cui Hao1, 2, Xu Yanke1, Wang Long1, Zhou Taopin1
(1. China Airborne Missile Academy, Luoyang 471009, China;
2. National Key Laboratory of Air-based Information Perception and Fusion, Luoyang 471009, China)
Abstract: In the three-body confrontation scenario, the accurate recognition of the guidance law of incoming missile can provide strong support for its trajectory prediction. In view of the semi-cooperative characteristics of incoming missile movement and target movement in this scenario, different target maneuvers are added when collecting missile trajectory data to make the data more realistic. A guidance law recognition method based on long short-term memory (LSTM) neural network is proposed to identify the type of guidance law for incoming missile. A LSTM neural network with attention mechanism is designed to improve the adaptive ability and generalization ability of the network model, and the recognition accuracy and precision are greatly improved. The experimental results show that this method has high recognition accuracy and short recognition time, which can meet the needs of on-board use.
Key words: neural network; guidance law identification; LSTM; three-body confrontation; attention mechanism