劉慶利,喬晨昊,楊國強,張振亞
(大連大學(xué)通信與網(wǎng)絡(luò)重點實驗室 遼寧 大連 116000)
超機動作戰(zhàn)是高性能戰(zhàn)機的必備技術(shù),而飛行員所需要的是如何在空戰(zhàn)的博弈中作出相對正確的機動決策。機動決策是根據(jù)敵方飛機的飛行態(tài)勢作出有利的機動變化,來躲避敵方導(dǎo)彈和置于有利位置發(fā)射導(dǎo)彈的過程。機動決策的目的是獲取利于我方攻擊的位置,發(fā)射導(dǎo)彈擊傷、擊落甚至擊毀敵機來獲取制空權(quán)。隨著近些年軍工技術(shù)的大力發(fā)展,三代機、四代機已經(jīng)逐漸成為空軍的主要作戰(zhàn)力量,面對高性能的戰(zhàn)斗機,如何進行高效的決策成為飛行員的一大困難。在敵我雙方空戰(zhàn)態(tài)勢復(fù)雜的情況下,迅速、精準地進行空戰(zhàn)機動決策,充分發(fā)揮戰(zhàn)斗機地高機動特性,已經(jīng)成為空戰(zhàn)決策中急需解決地問題之一。
近幾十年來,對于空戰(zhàn)機動決策的智能算法有專家系統(tǒng)、滾動時域控制法、神經(jīng)網(wǎng)絡(luò)算法、支持向量回歸算法、遺傳算法等優(yōu)化算法等[1]。文獻[2]中基于的粒子群算法(particular swarm optimization,PSO),提出了粒子群神經(jīng)網(wǎng)絡(luò)(particular swarm optimization network,PSON),改善了神經(jīng)網(wǎng)絡(luò)的局部最優(yōu)的缺點,但粒子群算法在收斂速度上遠遠不能適應(yīng)當代空戰(zhàn)機動決策的速度要求。文獻[3]將心理學(xué)中的前景理論引入到?jīng)Q策中,構(gòu)建了針對空戰(zhàn)問題的模型,但模型過于單一,無法考慮真實作戰(zhàn)中的復(fù)雜問題,需要結(jié)合目前興起的人工智能技術(shù)。文獻[4]采用了目前興起的人工智能,基于神經(jīng)網(wǎng)絡(luò)的作戰(zhàn)決策模型。雖然可以訓(xùn)練出較好的模型,優(yōu)化速度慢、準確性低。文獻[5]是基于遺傳算法(genetic algorithm,GA),提出了遺傳神經(jīng)網(wǎng)絡(luò)(genetic algorithm network,GAN)將遺傳算法的特性用于解決神經(jīng)網(wǎng)絡(luò)收斂速度慢的問題,優(yōu)化了神經(jīng)網(wǎng)絡(luò)的參數(shù),并較好地解決了神經(jīng)網(wǎng)絡(luò)的速度過慢的問題,但對于作戰(zhàn)而言,遺傳神經(jīng)網(wǎng)絡(luò)的速度遠遠不夠,較多地是早熟問題。文獻[6]提出了滾動時域控制法是一種近似、分解方法,本質(zhì)是使用一系列隨機重復(fù)的小型優(yōu)化解決方案過程來代替靜態(tài)的大規(guī)模優(yōu)化解決方案過程,以達到減少,計算和縮放數(shù)量的目的,以適應(yīng)優(yōu)化假設(shè)下的不確定變化。滾動時域控制是一種實時有效解決時域優(yōu)化有限或領(lǐng)域目標函數(shù)無窮問題的有效控制策略。文獻[8]將變權(quán)重引入到遺傳算法中,解決了一定程度上遺傳算法局部最優(yōu)的缺點,并將遺傳算法進行宏觀并行微觀串行的迭代,但局部問題還是存在。文獻[9]根據(jù)決策中出現(xiàn)的交互性與精確性的問題,將矩陣博弈法引入其中,強化了遺傳算法的性能,也在一定程度上解決了遺傳算法的局部最優(yōu)問題,作者在文中建立了機動模型,并根據(jù)模型以及空戰(zhàn)態(tài)勢函數(shù)構(gòu)建了最終的決策方法。利用改進的矩陣策略獲得無人機的最優(yōu)近似范圍,然后再利用遺傳算法在該范圍內(nèi)迭代出最優(yōu)值,但遺傳算法處理非線性問題過于復(fù)雜,會使決策的效率無法滿足要求。
針對以上問題,本文提出了強化麻雀搜索神經(jīng)網(wǎng)絡(luò)(intensify sparrow search neural network,ISSN)的決策方法,該方法考慮角度、高度和距離等因素建立相應(yīng)的態(tài)勢函數(shù),在此基礎(chǔ)上建立態(tài)勢評估函數(shù)作為空戰(zhàn)機動決策的依據(jù),同時將態(tài)勢函數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入,態(tài)勢評估函數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸出,利用神經(jīng)網(wǎng)絡(luò)的自適應(yīng)能力去優(yōu)化態(tài)勢函數(shù),同時利用混沌初始化和小孔成像反向?qū)W習(xí)策略去優(yōu)化麻雀搜索算法(sparrow search algorithm,SSA),并利用其性能優(yōu)化神經(jīng)網(wǎng)絡(luò)的必要參數(shù),使神經(jīng)網(wǎng)絡(luò)產(chǎn)生更快的速度和精度,從而實現(xiàn)更加準確、快速進行決策的目的。
空戰(zhàn)的目的是奪取制空權(quán),有效打擊敵機甚至摧毀成為空戰(zhàn)中最重要的部分,所以戰(zhàn)機的機動變化成了空戰(zhàn)機動決策中最重要的部分,空戰(zhàn)機動決策是根據(jù)角度、高度、距離等態(tài)勢進行機動變換,如何進行快速、有效變換是機動決策中最重要的問題,因此,采用了4 種態(tài)勢函數(shù)和態(tài)勢評估函數(shù)[4],再根據(jù)態(tài)勢函數(shù)和評估函數(shù)建立對應(yīng)的博弈論模型作為空戰(zhàn)勝負的判斷條件。
1.1.1 態(tài)勢函數(shù)
1)俯仰角態(tài)勢函數(shù)
空戰(zhàn)中最重要的是射擊,其次是各種戰(zhàn)術(shù)機動,最后是飛行性能。不管是用近距離的機炮格斗還是用空對空導(dǎo)彈來攻擊敵人,都必須找到最佳攻擊的位置。最佳的攻擊位置需要滿足角度的要求。因此,空戰(zhàn)中戰(zhàn)斗機的角度是最重要的態(tài)勢。因此,俯仰角態(tài)勢函數(shù)可定義為:
2)偏航角態(tài)勢函數(shù)
偏航角決定了飛機的航向,即飛行方向,變換偏航角有利于躲避敵人的雷達鎖定和導(dǎo)彈攻擊,偏航角的態(tài)勢函數(shù)定義為:
3)距離態(tài)勢函數(shù)
空戰(zhàn)的最終目標是發(fā)射導(dǎo)彈摧毀敵方飛機,導(dǎo)彈的射程就決定了距離態(tài)勢函數(shù),因此,定義為:
其中,gD是為導(dǎo)彈的標準射程;σ2是戰(zhàn)斗機攻擊距離的方差;g 為敵我雙方之間的距離。當敵機處于導(dǎo)彈攻擊范圍內(nèi)時,其值恒定為1。當敵機在原理導(dǎo)彈的有效射程時,距離態(tài)勢函數(shù)值隨距離的增大而減小。
4)高度態(tài)勢函數(shù)
飛機的實時高度也很重要,因為如果高度過低,就有可能發(fā)生飛機墜毀,飛機在合適的高度來進行空中格斗,一般來說飛機高度高于敵方,會更有利于發(fā)射導(dǎo)彈。因此,高度態(tài)勢函數(shù)可定義為:
式中,hop表示飛機對目標的最優(yōu)攻擊高度差;Δz 為飛機與目標的實時高度差;σh為最優(yōu)攻擊高度標準差。
1.1.2 態(tài)勢評估函數(shù)
空戰(zhàn)描述需要客觀性,根據(jù)以上4 種態(tài)勢函數(shù)定義了態(tài)勢評估函數(shù)。一般來說,將態(tài)勢評估函數(shù)值最高的機動視為最佳的空戰(zhàn)機動。根據(jù)以上態(tài)勢信息,定義評估函數(shù):
空戰(zhàn)的目的是發(fā)射導(dǎo)彈摧毀敵機,需要滿足導(dǎo)彈的發(fā)射條件。因此,空戰(zhàn)的勝敗判斷可以構(gòu)建為:
其中,gfire是最有利于發(fā)射導(dǎo)彈的攻擊距離;和需要滿足對應(yīng)的條件;Sa和Sb分別為我機和敵機的態(tài)勢評估函數(shù)(本文簡稱為態(tài)勢值)。在實際空戰(zhàn)中,我機需要滿足式(6)中的4 個條件,進而發(fā)射導(dǎo)彈,獲得空戰(zhàn)勝利,反之亦然。
此時的S'稱為博弈態(tài)勢值。
為了對態(tài)勢函數(shù)的權(quán)重進行快速、準確的計算以及對評估函數(shù)的預(yù)測,本文提出了強化麻雀搜索算法(intensify sparrow search algorithm,ISSA)優(yōu)化神經(jīng)網(wǎng)絡(luò)的方法,利用神經(jīng)網(wǎng)絡(luò)的預(yù)測功能對機動決策進行學(xué)習(xí)預(yù)測,訓(xùn)練出一個很好的模型。
本文將態(tài)勢函數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入,將博弈態(tài)勢值作為神經(jīng)網(wǎng)絡(luò)的輸出,并將其作為機動決策的依據(jù),利用強化麻雀搜索算法對神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進行優(yōu)化,麻雀種群數(shù)量作為參與優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)值的數(shù)量,優(yōu)化維度表示參與優(yōu)化的麻雀的搜索空間,其與神經(jīng)網(wǎng)絡(luò)的3 層節(jié)點相關(guān),麻雀的適應(yīng)度函數(shù)與神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值建立直接的映射關(guān)系。
用于空戰(zhàn)機動決策的最常見的3 層網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
圖1 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Neural network structure diagram
神經(jīng)網(wǎng)絡(luò)各層的具體功能如下:輸入層是影響決策的模塊,輸入層接收作戰(zhàn)決策數(shù)據(jù)。訓(xùn)練樣本數(shù)據(jù)可以表示為Xj=(x1,x2,…,xn),隱藏層對輸入層傳輸?shù)臍w一化數(shù)據(jù)信息進行組織,并按照特動規(guī)則進行學(xué)習(xí),通過變換函數(shù)映射完成非線性問題的解。S 型函數(shù)的一般方法如下:
該模型可以對空戰(zhàn)機動決策數(shù)據(jù)進行處理,為其提供理論依據(jù)。將神經(jīng)網(wǎng)絡(luò)應(yīng)用于機動決策建模具有以下優(yōu)點:1)作戰(zhàn)系統(tǒng)通常是具有多個關(guān)聯(lián)輸入問題的動態(tài)非線性系統(tǒng),不利于數(shù)學(xué)模型的建立,利用神經(jīng)網(wǎng)絡(luò)固有的強泛化能力和近似任意復(fù)雜非線性系統(tǒng)的能力,不再需要建立數(shù)學(xué)模型。2)將收集到的數(shù)據(jù)輸入到網(wǎng)絡(luò)中,網(wǎng)絡(luò)通過訓(xùn)練建立模型,找出數(shù)據(jù)潛在的規(guī)律性;在決策過程中,采集的大量數(shù)據(jù)中往往存在較多的噪聲,而神經(jīng)網(wǎng)絡(luò)算法比其他評價方法更能消除噪聲干擾,獲得更理想的評價結(jié)果。
強化麻雀搜索算法與神經(jīng)網(wǎng)絡(luò)的結(jié)合充分利用了兩者的優(yōu)點,使機動決策模型既具有神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)功能,又具有強化麻雀搜索算法的優(yōu)化能力,這就是強化麻雀搜索神經(jīng)網(wǎng)絡(luò)。
麻雀搜索算法的基本算法如下[10],其中發(fā)現(xiàn)者的位置更新情況如下:其中,t 和itermax分別表示當前和最大的迭代次數(shù)。Xti,j是第i 個麻雀在第j 維中的空間位置。α 是一個[0,1]的隨機數(shù)。R2表示警戒值,ST 則表示安全值,取值分別為0 到1 和0.5 到1。L 是一個元素均為1的1×d 的矩陣。當R2<ST 時,發(fā)現(xiàn)者可以在更大的范圍內(nèi)去進行搜索操作。當R2≥ST,表示此時的環(huán)境已不適合覓食,所有麻雀需要快速前往安全區(qū)。
在尋找食物的過程中,發(fā)現(xiàn)者的周圍會有很多的跟隨者,它們會時刻注視發(fā)現(xiàn)者的位置,如果沒有搶到食物,它們會跟隨其他發(fā)現(xiàn)者以便于搜索。加入者的位置更新情況如下:
其中,Xp是當前發(fā)現(xiàn)者所處的最佳位置;Xworst則表示種群中的麻雀目前所處最劣勢的位置。A 是一個值為-1 或1 的1×d 的矩陣,當i>n/2 時,這表明,第i 個加入者適應(yīng)度值較低并未獲取食物,此時需要飛往其他區(qū)域?qū)ふ沂澄铩?/p>
預(yù)警的麻雀是處于種群邊緣的,它們占種群數(shù)量的10%~20%,預(yù)警的麻雀位置更新描述如下:
其中,Xbest是當前麻雀進行覓食的最佳解。β 是服從于標準正態(tài)分布的隨機數(shù),代表當前麻雀的行動步長。K 是范圍[-1,1]的隨機數(shù),代表目前位置麻雀移動的量化步長,是第i 個麻雀的適應(yīng)度值。fg是當前麻雀最好的適應(yīng)度分配值,fw則是當前麻雀最差的適應(yīng)度分配值,ε 是避免分母為0 的常數(shù)。當fi>fg表示此時的麻雀正在進行預(yù)警,它們會時刻提防著捕食者。當fi=fg時,此時預(yù)警的麻雀開始警報,并移動自己的位置逃離捕食者。
由于麻雀搜索算法初始化時存在隨機性等不確定性因素會導(dǎo)致總麻雀數(shù)量分布不夠均勻,以及各類麻雀數(shù)量的比例不均衡,進而導(dǎo)致種群多樣性的質(zhì)量偏低,嚴重的會影響到算法的性能,主要是收斂的速度以及早熟等現(xiàn)象。因此,采用反向?qū)W習(xí)和混沌初始化來進行優(yōu)化麻雀搜索算法。
2.3.1 混沌初始化
混沌初始化麻雀的種群,其數(shù)學(xué)表達式為:
2.3.2 強化反向?qū)W習(xí)策略
在混沌初始化以后,開始迭代發(fā)現(xiàn)者的位置時,當R2<ST 時,麻雀的數(shù)量以及多樣性會逐步減少,這意味著算法會隨著麻雀數(shù)量的減少而陷入局部最優(yōu)。因此,利用類似小孔成像的方式,將反向原理運用到學(xué)習(xí)策略中去優(yōu)化麻雀搜索算法的問題。
圖2 小孔成像反向?qū)W習(xí)原理圖Fig.2 Schematic diagram of small hole imaging reverse learning principles
當k=1 時,小孔成像反向?qū)W習(xí)就退化為基本的反向?qū)W習(xí)策略,此時解為固定解,而小孔成像的策略可以通過比例系數(shù)k 來調(diào)整解的空間,得到更完全的解。
本文利用改進后的反向?qū)W習(xí)策略更新發(fā)現(xiàn)者的位置,通過式(14)映射到空間中得到最優(yōu)解,將原本發(fā)現(xiàn)者位置的適應(yīng)度與改進后的適應(yīng)度值進行比較,保留最優(yōu)的適應(yīng)度值。將小孔成像反向?qū)W習(xí)策略可以大幅增加發(fā)現(xiàn)者的尋優(yōu)方向,使每只麻雀可以在不固定的區(qū)域?qū)ふ易顑?yōu)位置,該策略大大增加了種群的多樣性,并增強了麻雀搜索全局搜索的能力,減少局部收斂的概率。
該算法由神經(jīng)網(wǎng)絡(luò)訓(xùn)練、博弈論模型和確定網(wǎng)絡(luò)權(quán)值的強化麻雀搜索算法3 部分組成。算法如下:
1)確定神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)和參數(shù)。影響決策的因素指標有俯仰角態(tài)勢、偏航角態(tài)勢、高度態(tài)勢和距離態(tài)勢,將其作為神經(jīng)網(wǎng)絡(luò)的輸入建立模型。
2)確定各個影響因素的權(quán)重。生成一組隨機分布作為態(tài)勢函數(shù)的權(quán)重,并確定神經(jīng)網(wǎng)絡(luò)的隱藏節(jié)點的數(shù)目。
3)強化麻雀搜索算法參數(shù)的初始化。對所有的麻雀種群進行混沌初始化的操作,生成一個混沌變量的麻雀種群序列。
4)對數(shù)據(jù)進行預(yù)處理。按照訓(xùn)練集、測試集和驗證集的方式劃分。
5)利用強化麻雀搜索算法修改模型權(quán)重。首先,根據(jù)神經(jīng)網(wǎng)絡(luò)的誤差函數(shù),為每只麻雀尋找最佳位置,進而確定最好的適應(yīng)度函數(shù)。其次,確定初始種群的適應(yīng)度并將其排序進而選擇出當前最優(yōu)值和最劣值。然后,更新發(fā)現(xiàn)者的位置、加入者的位置以及意識到危險的麻雀的位置,再者,利用小孔成像反向?qū)W習(xí)策略繼續(xù)更新發(fā)現(xiàn)者的位置,比較出兩者最優(yōu)值并保留,并與上一次迭代的結(jié)果比較是否最優(yōu),將兩者的最優(yōu)值保留下來并繼續(xù)進行迭代操作直到滿足條件為止,然后對博弈論模型進行受約束的線性求解得到一個收益值,再加上最優(yōu)值得到博弈態(tài)勢值,即得到全局最優(yōu)值和最佳適應(yīng)度值。
6)得到一個強化麻雀搜索神經(jīng)網(wǎng)絡(luò)的模型。利用強化麻雀搜索算法計算出的優(yōu)化值作為神經(jīng)網(wǎng)絡(luò)的權(quán)值,進行多次訓(xùn)練,不斷優(yōu)化權(quán)值,直到滿足預(yù)定的精度。
7)模型驗證。對決策模型的輸入數(shù)據(jù)集進行測試,不滿足預(yù)先設(shè)定的誤差要求,則繼續(xù)訓(xùn)練;否則,模型構(gòu)建就完成了,流程圖如下頁圖3 所示。
圖3 ISSN 學(xué)習(xí)過程流程圖Fig.3 ISSN flow chart of learning process
本文將強化麻雀搜索算法用于優(yōu)化神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值,提出了強化麻雀搜索算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)方法,從收斂性、誤差方面對方法進行分析,并與PSO、SSA 和GA 優(yōu)化的神經(jīng)網(wǎng)絡(luò)算法進行對比。設(shè)置強化麻雀搜索算法和神經(jīng)網(wǎng)絡(luò)的參數(shù),如表1、表2 所示。
表1 ISSA 參數(shù)表Table 1 ISSA parameter list
表2 神經(jīng)網(wǎng)絡(luò)參數(shù)表Table 2 Neural network parameter list
神經(jīng)網(wǎng)絡(luò)的權(quán)值優(yōu)化是通過強化麻雀搜索算法完成的,麻雀的適應(yīng)度函數(shù)和神經(jīng)網(wǎng)絡(luò)的權(quán)值建立了直接的映射關(guān)系,4 種算法的適應(yīng)度曲線如圖4 所示,當?shù)螖?shù)不斷的增加后,ISSA、SSA、GA、PSO 的適應(yīng)度曲線呈下降趨勢,由于本文算法采用了混沌初始化,所以在初始階段ISSA 的適應(yīng)度值相比SSA、GA 和PSO 有明顯的優(yōu)勢,同時迭代開始后ISSA 的收斂速度是遠大于SSA、PSO 和GA 算法的。
圖4 ISSA、SSA、GA、PSO 的適應(yīng)度曲線Fig.4 Fitness curve of SSA、SSA、GA、PSO
神經(jīng)網(wǎng)絡(luò)開始訓(xùn)練時,權(quán)值的更新是被誤差迭代更新而驅(qū)動的,當誤差達到初始化設(shè)置的數(shù)值或達到迭代次數(shù)時,神經(jīng)網(wǎng)絡(luò)的訓(xùn)練停止。ISSN 的誤差曲線如圖5 所示,誤差曲線呈下降趨勢,在經(jīng)過32次迭代時,誤差達到最小值,最小誤差約為0.009 8。用同樣的方法對SSN、GAN 和PSON 進行仿真得到的結(jié)果如表3 所示,SSN、GAN 和PSON 的誤差分別為0.028、0.065 和0.042??梢则炞C:在相同的條件下,ISSN 的誤差遠小于SSN、GAN 和PSON。
圖5 ISSN 的誤差曲線Fig.5 Error curve of ISSN
表3 ISSN、SSN、GAN、PSON 的誤差Table 3 Error of ISSN、SSN、GAN、PSON
根據(jù)以上分析,強化麻雀算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)應(yīng)用于指揮決策是切實可行的,可以解決實際空戰(zhàn)機動決策的一些復(fù)雜問題。
首先設(shè)置空戰(zhàn)的參數(shù),如下頁表4 所示。將博弈論模型引入到對抗實驗中,仿真實驗共分為兩種策略的對抗試驗:第1 種策略是敵機采用GAN 策略,第2 種策略是敵機采用PSON 策略,兩種條件下我機均采用本文提出的ISSN 策略來進行對抗。
表4 空戰(zhàn)參數(shù)Table 4 Air combat parameters
3.2.1 敵機采用GAN 策略
圖6 是策略1 兩機的對抗軌跡圖,我機采用ISSN 策略敵機采用GAN 策略,在初始化階段,雙方態(tài)勢值相當,我機采用的是螺旋上升策略帶動敵機追蹤,通過大角度的機動變換,占據(jù)了戰(zhàn)場態(tài)勢的主動,態(tài)勢值不斷增加,為贏得空戰(zhàn)奠定了優(yōu)勢,在20 s 的時候贏得了空戰(zhàn)的勝利。圖7、圖8 分別為機動變換過程中兩機的博弈態(tài)勢值變化圖和偏航角變化圖。
圖6 策略1 兩機對抗運動軌跡圖Fig.6 Strategy I Motion track diagram of two aircraft confrontation
圖7 策略1 博弈態(tài)勢值圖Fig.7 Strategy I Game Situation Value Chart
圖8 策略1 偏航角變化圖Fig.8 Strategy I Yaw angle variation diagram
3.2.2 敵機采用PSON 策略
圖9 是策略2 兩機的對抗軌跡圖,我機采用ISSN 策略對抗敵機的PSON 策略。在起飛后的階段,我機采用常規(guī)戰(zhàn)術(shù)與敵機抗衡,在相持階段突然增大偏航角,此時占據(jù)了戰(zhàn)場的上風(fēng),此后便牢牢占據(jù)著戰(zhàn)場的主動,敵機始終處于不利態(tài)勢,最終在17 s 我機贏得了空戰(zhàn)。圖10 和下頁圖11 為機動變換過程中兩機的博弈態(tài)勢值和偏航角變化圖。
圖9 策略2 兩機對抗運動軌跡圖Fig.9 Strategy II Motion track diagram of two aircraft confrontation
圖10 策略2 博弈態(tài)勢值圖Fig.10 Strategy II Game situation value chart
圖11 策略2 偏航角變化圖Fig.11 Strategy II Yaw angle variation diagram
通過上述兩種不同策略的仿真可以得出:ISSN算法的預(yù)測效果遠比GAN 和PSON 要好,證明麻雀搜索神經(jīng)網(wǎng)絡(luò)用于空戰(zhàn)機動決策是可行的。
本文針對空戰(zhàn)中機動決策速度慢、準確性低的問題,提出了強化麻雀搜索神經(jīng)網(wǎng)絡(luò)的機動決策方法,利用混沌初始化和小孔成像反向?qū)W習(xí)策略強化麻雀搜索算法的性能,再利用其優(yōu)化神經(jīng)網(wǎng)絡(luò),提高神經(jīng)網(wǎng)絡(luò)的速度和準確性,基于角度、高度、距離等因素構(gòu)造了態(tài)勢函數(shù),并根據(jù)態(tài)勢函數(shù)和態(tài)勢評估函數(shù)作為神經(jīng)網(wǎng)絡(luò)的輸入和輸出,來進行空戰(zhàn)機動決策。仿真表明,本文研究的模型算法簡單且易于實現(xiàn),加入博弈論后可以直接應(yīng)用于空戰(zhàn)機動決策,使用了該算法的戰(zhàn)機決策速度快,準確性高,在空戰(zhàn)中可以取得巨大的優(yōu)勢,從而贏得空戰(zhàn)的勝利。