孫豐礎(chǔ),甘旭升
(空軍工程大學(xué) 空管領(lǐng)航學(xué)院,陜西 西安 710051)
空戰(zhàn)對(duì)抗是現(xiàn)代作戰(zhàn)中奪取制空權(quán)的主要作戰(zhàn)樣式,對(duì)掌控空中態(tài)勢(shì)發(fā)展,達(dá)成戰(zhàn)術(shù)意圖具有重要意義。近年來(lái),無(wú)人機(jī)技術(shù)雖得到快速發(fā)展,軍事裝備的無(wú)人化程度越來(lái)越高,但空戰(zhàn)對(duì)抗領(lǐng)域仍是有人機(jī)的舞臺(tái),無(wú)人機(jī)還遠(yuǎn)無(wú)法達(dá)到空戰(zhàn)對(duì)抗的性能要求??諔?zhàn)戰(zhàn)術(shù)決策是空戰(zhàn)過(guò)程中的關(guān)鍵核心[1]。由于無(wú)人機(jī)自主決策能力的不足,對(duì)于復(fù)雜的空中態(tài)勢(shì)認(rèn)知能力欠缺,使得其在空戰(zhàn)對(duì)抗中往往只能落入下風(fēng),難以達(dá)成戰(zhàn)術(shù)目的。但無(wú)人機(jī)替代有人機(jī)執(zhí)行空戰(zhàn)任務(wù)是未來(lái)必然趨勢(shì),將極大豐富空中作戰(zhàn)樣式,顛覆空戰(zhàn)場(chǎng)面貌。早在2016年6 月,人工智能ALPHA 就在空戰(zhàn)模擬實(shí)驗(yàn)室中以100% 的概率戰(zhàn)勝了空戰(zhàn)專家、美軍退役上校Gene Leep[2]。雖然還只是模擬試驗(yàn),但已足夠驗(yàn)證算法的有效性,離試飛驗(yàn)證和實(shí)戰(zhàn)檢驗(yàn)相差不遠(yuǎn)。
國(guó)內(nèi)外對(duì)無(wú)人機(jī)空戰(zhàn)問(wèn)題展開(kāi)了大量研究,基于 智 能 算 法[3-4]、神 經(jīng) 網(wǎng) 絡(luò)[5-6]、專 家 系 統(tǒng)[7]、博 弈論[8-9]、貝葉斯網(wǎng)絡(luò)理論[10-11]等算法是當(dāng)前實(shí)現(xiàn)無(wú)人機(jī)自主機(jī)動(dòng)決策的主要方法。文獻(xiàn)[5]提出一種基于深度神經(jīng)網(wǎng)絡(luò)的強(qiáng)化學(xué)習(xí)方法,通過(guò)對(duì)敵方距離、速度、角度的態(tài)勢(shì)判斷決定我方采取的機(jī)動(dòng)方式。文獻(xiàn)[6]通過(guò)啟發(fā)式因子對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行改進(jìn),通過(guò)對(duì)空戰(zhàn)機(jī)動(dòng)的學(xué)習(xí)訓(xùn)練實(shí)現(xiàn)對(duì)抗中的機(jī)動(dòng)。但基于神經(jīng)網(wǎng)絡(luò)或其改進(jìn)型的算法都需要借助于訓(xùn)練庫(kù),訓(xùn)練庫(kù)的獲取和質(zhì)量會(huì)影響算法的效果。文獻(xiàn)[12]提出一種BAS-TIMS 算法,可在一對(duì)一對(duì)抗中形成一定態(tài)勢(shì)優(yōu)勢(shì)。文獻(xiàn)[13]則是引入了博弈論的思想,通過(guò)敵方可能采取的機(jī)動(dòng)動(dòng)作計(jì)算己方最佳的機(jī)動(dòng)策略,以毀傷概率最大化的原則作為機(jī)動(dòng)選擇依據(jù)。使用專家系統(tǒng)和貝葉斯網(wǎng)絡(luò)理論能夠?qū)崿F(xiàn)空戰(zhàn)決策機(jī)動(dòng),但存在決策效率不夠高的問(wèn)題。文獻(xiàn)[14]則是將遺傳算法和強(qiáng)化學(xué)習(xí)算法相結(jié)合,可實(shí)現(xiàn)無(wú)人機(jī)一對(duì)一對(duì)抗下的機(jī)動(dòng)決策。上述的各類文獻(xiàn)中,大多是單機(jī)空戰(zhàn)對(duì)抗,不涉及態(tài)勢(shì)的判斷和目標(biāo)分配的問(wèn)題,使用會(huì)存在一定的局限性。文獻(xiàn)[15]對(duì)多機(jī)空戰(zhàn)進(jìn)行了研究,可實(shí)現(xiàn)二對(duì)一對(duì)抗中的協(xié)同決策,但主要對(duì)抗領(lǐng)域?yàn)榻鄬?duì)抗,未考慮敵電子干擾作用。
雙機(jī)編隊(duì)是空中作戰(zhàn)最基本的作戰(zhàn)單元,大量攻防戰(zhàn)術(shù)均可通過(guò)長(zhǎng)僚機(jī)之間的配合實(shí)現(xiàn),更是大規(guī)模集群作戰(zhàn)的基礎(chǔ),而對(duì)抗空戰(zhàn)則是奪取局部制空權(quán)的主要作戰(zhàn)樣式。因此,研究無(wú)人機(jī)二對(duì)二模式下的對(duì)抗空戰(zhàn)技術(shù)具有較強(qiáng)的現(xiàn)實(shí)意義。本文主要對(duì)無(wú)人機(jī)中距對(duì)抗下的二對(duì)二對(duì)抗環(huán)境進(jìn)行研究,基于A-star 算法設(shè)計(jì)無(wú)人機(jī)側(cè)向機(jī)動(dòng)“咬尾”路徑,規(guī)避敵機(jī)火控雷達(dá)鎖定和干擾吊艙干擾,在機(jī)動(dòng)途中按照優(yōu)先形成對(duì)抗優(yōu)勢(shì)的原則展開(kāi)雙機(jī)協(xié)同和目標(biāo)分配,盡早構(gòu)成武器發(fā)射條件。
無(wú)人機(jī)在于敵機(jī)對(duì)抗過(guò)程中可能受到兩方面的威脅,一是火控雷達(dá)的鎖定,二是電子干擾吊艙的干擾。無(wú)人機(jī)一旦被火控雷達(dá)鎖定就會(huì)陷入及其被動(dòng)的狀況,需要立即采取大載荷機(jī)動(dòng)動(dòng)作,逃出火控雷達(dá)的照射范圍。火控雷達(dá)的照射范圍一般在機(jī)身前向一定角度范圍內(nèi)。無(wú)人機(jī)進(jìn)入敵機(jī)電子干擾范圍內(nèi)時(shí),自身的雷達(dá)信號(hào)接收將會(huì)受到影響,會(huì)出現(xiàn)目標(biāo)丟失、多目標(biāo)閃現(xiàn)、位置漂移、假信號(hào)等現(xiàn)象。因此,無(wú)人機(jī)在電子干擾范圍內(nèi)時(shí),難以進(jìn)行正確的態(tài)勢(shì)判斷,空空導(dǎo)彈的命中率也會(huì)顯著下降。論文在進(jìn)行無(wú)人機(jī)的側(cè)向機(jī)動(dòng)決策算法設(shè)計(jì)時(shí)充分考慮了敵機(jī)的火控雷達(dá)和電子干擾吊艙作用范圍,如圖1 所示。
圖1 敵機(jī)威脅態(tài)勢(shì)圖Fig.1 Enemy threat situation map
無(wú)人機(jī)是否進(jìn)入敵機(jī)的威脅范圍內(nèi)主要通過(guò)相對(duì)角度和距離判斷,火控雷達(dá)威脅判斷如式(1)所示:
式中:heh為敵機(jī)航向向量;heu為敵機(jī)與我方無(wú)人機(jī)連線,方向指向我方無(wú)人機(jī);αef為敵機(jī)火控雷達(dá)輻射角度的一半;lue為無(wú)人機(jī)到敵機(jī)的距離;lef為敵機(jī)火控雷達(dá)的作用距離。同理,電子干擾威脅判斷如式(2)所示:
式中:αee1和αee2為電子干擾吊艙的輻射角度范圍;lee為電子干擾的作用距離,且通常條件下電子干擾的作用距離會(huì)大于火控雷達(dá)的輻射距離以實(shí)現(xiàn)防衛(wèi)的目的。
在中距空戰(zhàn)對(duì)抗中,航空器使用的武器主要指空空導(dǎo)彈,其必須達(dá)成2 個(gè)條件才能發(fā)射,一是敵機(jī)被機(jī)載火控雷達(dá)鎖定,二是在空空導(dǎo)彈的最大發(fā)射距離之內(nèi)。因此,無(wú)人機(jī)在機(jī)動(dòng)過(guò)程中,除避開(kāi)敵機(jī)武器威脅外,還需要積極達(dá)成武器發(fā)射條件。從圖1 中可以看出,在我火控雷達(dá)作用距離小于敵機(jī)火控雷達(dá)和電子干擾作用距離的情況下,攻擊敵機(jī)的最佳方法為實(shí)施尾后攻擊。而事實(shí)上,無(wú)人機(jī)由于機(jī)體較小,載荷能力受限,其攜帶的火控雷達(dá)工作距離往往會(huì)小于有人機(jī)的火控雷達(dá),以對(duì)頭或側(cè)方位的進(jìn)入方式都不能構(gòu)成有利態(tài)勢(shì),最佳的攻擊方位便是實(shí)施尾后攻擊。無(wú)人機(jī)武器發(fā)射應(yīng)當(dāng)滿足:
式中:huh為無(wú)人機(jī)的航向向量;hue為無(wú)人機(jī)到敵機(jī)的方向向量;αuf為無(wú)人機(jī)火控雷達(dá)輻射角度的一半;lef為無(wú)人機(jī)火控雷達(dá)的工作距離。
A-star 算法是一種較為經(jīng)典的啟發(fā)式搜索算法,該 算 法 于1968 年 由P.E.Hart 等 提 出[16]。A-star 算法將Dijkstra 算法和BFS 算法的搜索策略結(jié)合了起來(lái)。Dijkstra 算法以起始點(diǎn)為中心依次外推,以尋找距目標(biāo)點(diǎn)最短的路徑。BFS 算法是一種啟發(fā)式的搜索策略,具有搜索快速的特點(diǎn),它先對(duì)當(dāng)前點(diǎn)與目標(biāo)點(diǎn)之間的路徑距離進(jìn)行估算,并選擇與目標(biāo)點(diǎn)距離最近的待選節(jié)點(diǎn)作為下一節(jié)點(diǎn)。但BFS 存在明顯的缺陷,不能保證找到最優(yōu)解[17]。
A-star 算法將2 種算法的優(yōu)勢(shì)相結(jié)合,既加入了啟發(fā)式信息函數(shù)以提高搜索速度,又考慮了當(dāng)前節(jié)點(diǎn)的歷史代價(jià)信息,具有路徑尋優(yōu)能力強(qiáng)、規(guī)劃速度快的特點(diǎn)。相對(duì)于蟻群算法[18]和遺傳算法[14],Astar 算法的全局規(guī)劃能力稍弱,但具有更快的規(guī)劃速度,其每一步的決策主要是基于歷史信息和局部信息,使其規(guī)劃速度也顯著提升,可以滿足空戰(zhàn)對(duì)抗中態(tài)勢(shì)更迭迅速的決策需求。其不依賴全局信息的特性也使其可以應(yīng)對(duì)更大的規(guī)劃空間。算法的代價(jià)函數(shù)為
式中:g(m)為當(dāng)前節(jié)點(diǎn)m的歷史代價(jià)信息;h(m)為節(jié)點(diǎn)m未來(lái)的代價(jià)估計(jì)。根據(jù)路徑點(diǎn)狀態(tài)轉(zhuǎn)移規(guī)則的不同,需要制定open 表和close 表。算法從起始點(diǎn)開(kāi)始計(jì)算open 表中的節(jié)點(diǎn)相應(yīng)的代價(jià)值并選擇最優(yōu)的節(jié)點(diǎn)作為下一節(jié)點(diǎn)進(jìn)行狀態(tài)轉(zhuǎn)移。狀態(tài)轉(zhuǎn)移之后需要更新open 表和close 表,同時(shí)將待選節(jié)點(diǎn)的父節(jié)點(diǎn)記為當(dāng)前節(jié)點(diǎn),依次類推直至達(dá)到終點(diǎn)。當(dāng)遇到待選節(jié)點(diǎn)為空的情況時(shí),需要將當(dāng)前節(jié)點(diǎn)放入close 表中,并將狀態(tài)回退至父節(jié)點(diǎn)進(jìn)行重新計(jì)算下一節(jié)點(diǎn)。到達(dá)終點(diǎn)后,根據(jù)各個(gè)節(jié)點(diǎn)記錄的父節(jié)點(diǎn)信息進(jìn)行回溯即可完成路徑的規(guī)劃,算法流程如圖2 所示。
圖2 A-star 算法流程圖Fig.2 A-star algorithm flow chart
A-star 算法對(duì)路徑的規(guī)劃需要有離散化的規(guī)劃空間,通常采取的措施是按照地理環(huán)境或空間構(gòu)設(shè)一個(gè)靜態(tài)柵格環(huán)境。靜態(tài)柵格環(huán)境可以較好地滿足目標(biāo)偵察、低空突防、轉(zhuǎn)場(chǎng)飛行等任務(wù)的規(guī)劃,但對(duì)空戰(zhàn)對(duì)抗任務(wù)而言,態(tài)勢(shì)以敵我相對(duì)位置為判斷依據(jù),因此需要建立動(dòng)態(tài)的柵格規(guī)劃空間。本文采取以敵我相對(duì)位置來(lái)確定柵格規(guī)劃環(huán)境的方法,根據(jù)變化的敵我態(tài)勢(shì)調(diào)整柵格環(huán)境,如圖3 所示。
圖3 動(dòng)態(tài)柵格環(huán)境圖Fig.3 Dynamic grid environment map
柵格環(huán)境相對(duì)敵我飛機(jī)而言始終固定,但相對(duì)大地坐標(biāo)而言在不停地旋轉(zhuǎn),其單位步長(zhǎng)的尺寸也在拓展或收縮。柵格坐標(biāo)的旋轉(zhuǎn)變換公式為
式中:(x,y)為柵格坐標(biāo)系坐標(biāo);(x′,y′)為大地坐標(biāo)系坐標(biāo);α為柵格坐標(biāo)與大地坐標(biāo)所成的角度;β為無(wú)人機(jī)在柵格坐標(biāo)中的位置向量與x軸形成的夾角,規(guī)定逆時(shí)針旋轉(zhuǎn)為正。采用動(dòng)態(tài)柵格環(huán)境規(guī)劃路徑可以使規(guī)劃空間保持不變,始終維持規(guī)劃速度的品質(zhì)。
在柵格環(huán)境內(nèi),無(wú)人機(jī)位置狀態(tài)的轉(zhuǎn)移會(huì)有一定的規(guī)則限制,從而滿足航空器轉(zhuǎn)彎率的最大限制。無(wú)人機(jī)以敵機(jī)當(dāng)前位置為規(guī)劃終點(diǎn)前進(jìn),單次狀態(tài)轉(zhuǎn)移過(guò)程中只考察臨近符合轉(zhuǎn)彎率限制的節(jié)點(diǎn),計(jì)算其代價(jià)值。設(shè)置的狀態(tài)轉(zhuǎn)移規(guī)則如圖4所示。
圖4 無(wú)人機(jī)側(cè)向機(jī)動(dòng)狀態(tài)轉(zhuǎn)移規(guī)則Fig.4 UAV lateral maneuvering state transfer rules
無(wú)人機(jī)當(dāng)前節(jié)點(diǎn)的上一節(jié)點(diǎn)為父節(jié)點(diǎn),鄰近節(jié)點(diǎn)中符合轉(zhuǎn)彎率的節(jié)點(diǎn)為待選節(jié)點(diǎn)。對(duì)待選節(jié)點(diǎn)進(jìn)行依次計(jì)算,得出最優(yōu)的節(jié)點(diǎn)。由于缺乏適當(dāng)?shù)膯l(fā)式因子,傳統(tǒng)的A-star 算法并不能很好地進(jìn)行“咬尾”機(jī)動(dòng),只能在向目標(biāo)點(diǎn)突進(jìn)的過(guò)程中進(jìn)行威脅規(guī)避,這樣會(huì)影響空戰(zhàn)機(jī)動(dòng)的效率,因此本文加入了一個(gè)啟發(fā)式因子,作為“咬尾”路徑的引導(dǎo),如圖5 所示。
圖5 無(wú)人機(jī)路徑引導(dǎo)點(diǎn)示意圖Fig.5 Schematic diagram of UAV path guidance points
p1至p4分別為無(wú)人機(jī)在各個(gè)階段的路徑規(guī)劃引導(dǎo)點(diǎn)。無(wú)人機(jī)在接近敵機(jī)的過(guò)程中隨著距離的接近不斷變化引導(dǎo)點(diǎn),可以使無(wú)人機(jī)更好地從尾后實(shí)施攻擊。狀態(tài)轉(zhuǎn)移中的代價(jià)函數(shù)為
式中:g(n)為代價(jià)函數(shù)中的歷史信息,計(jì)算路徑中在敵機(jī)火控雷達(dá)和電子干擾區(qū)內(nèi)的路徑長(zhǎng)度;Cf為火控雷達(dá)的威脅系數(shù);Ce為電子干擾威脅系數(shù);l為節(jié)點(diǎn)n至敵機(jī)的距離,顯然,距離越近,威脅對(duì)無(wú)人機(jī)的作用更強(qiáng);h(n)為代價(jià)函數(shù)中的期望信息;Cd為距離代價(jià)系數(shù);l*為節(jié)點(diǎn)n至引導(dǎo)點(diǎn)的距離,具體計(jì)算方法為
其中,l1~l4分別為無(wú)人機(jī)至點(diǎn)p1~p4的距離;θ為敵機(jī)航向向量heh與無(wú)人機(jī)至敵機(jī)的方向向量hue之間的夾角;θ1為敵機(jī)航向與威脅區(qū)域邊界所成夾角(如圖5 中所示)。
無(wú)人機(jī)的速度規(guī)劃需要根據(jù)任務(wù)實(shí)施階段區(qū)別對(duì)待。無(wú)人機(jī)中距空戰(zhàn)分為2 個(gè)階段,分別為前出接敵階段和戰(zhàn)術(shù)機(jī)動(dòng)階段。在前出接敵過(guò)程中,無(wú)人機(jī)根據(jù)體系雷達(dá)信息靠近敵機(jī)鄰近空域,在該階段中主要以巡航速度飛行。在戰(zhàn)術(shù)機(jī)動(dòng)階段,無(wú)人機(jī)需要通過(guò)快速的機(jī)動(dòng)盡快搶占有利態(tài)勢(shì),在敵機(jī)威脅區(qū)域內(nèi)時(shí)則需要加速擺脫威脅。
本文對(duì)速度的規(guī)劃建立在規(guī)劃的路徑基礎(chǔ)之上,通過(guò)對(duì)每一個(gè)路徑節(jié)點(diǎn)規(guī)劃加速度值的方式規(guī)劃每一段路徑內(nèi)的速度變化方式。由于受發(fā)動(dòng)機(jī)推力和機(jī)體氣動(dòng)性能限制,無(wú)人機(jī)的加速度同樣有上下限,通過(guò)將加速度值進(jìn)行離散化的方式計(jì)算每一個(gè)路徑節(jié)點(diǎn)的最優(yōu)速度控制方案。但以這樣的方式仍無(wú)法滿足空戰(zhàn)對(duì)抗中快速的速度變化要求,因此論文在態(tài)勢(shì)更新后的路徑重規(guī)劃中同時(shí)進(jìn)行速度重規(guī)劃,更新的的頻率越高,路徑和速度的變化越平滑,越能貼近實(shí)際的需求。速度規(guī)劃目標(biāo)函數(shù)如式(8)~(12)所示:
式中:am為離散化的加速度;L(n)為第n段路徑的長(zhǎng)度;V(am)為節(jié)點(diǎn)m規(guī)劃的速度;Cvf,Cve,Cvl,Cvc,Cva,Cvmax,Cvmin均為常數(shù);Vc為無(wú)人機(jī)的最佳巡航速度;Csmax和Csmin為無(wú)人機(jī)的最大、最小速度代價(jià)值,當(dāng)無(wú)人機(jī)持續(xù)使用最大或最小速度時(shí)該代價(jià)值會(huì)累積增大;Vuavmax和Vuavmin為無(wú)人機(jī)的最大最小速度。
本文重點(diǎn)研究的是二對(duì)二中距空戰(zhàn)。我方無(wú)人機(jī)前出接敵過(guò)程中面臨的敵機(jī)編隊(duì)有可能以2 種方式應(yīng)對(duì)我機(jī),一種是雙機(jī)協(xié)作先合力擊落我1 架無(wú)人機(jī)實(shí)現(xiàn)空中力量?jī)?yōu)勢(shì);另一種是雙機(jī)各自分離,從不同方位對(duì)我構(gòu)成攻擊態(tài)勢(shì),力爭(zhēng)盡早能夠從一個(gè)方向上達(dá)成攻擊條件。我方雙機(jī)則需要根據(jù)敵機(jī)態(tài)勢(shì)采取應(yīng)對(duì)措施,對(duì)于第1 種情況則由1架無(wú)人機(jī)進(jìn)行逃逸機(jī)動(dòng),避免被擊落,另1 架則積極進(jìn)攻,力爭(zhēng)奪得空中力量?jī)?yōu)勢(shì);對(duì)于第2 種情況則采取編隊(duì)分離,以“鉗形”攻擊戰(zhàn)術(shù)與敵機(jī)搶占空中優(yōu)勢(shì),盡早構(gòu)成武器發(fā)射條件,戰(zhàn)術(shù)決策流程如圖6所示。
圖6 無(wú)人機(jī)空戰(zhàn)對(duì)抗戰(zhàn)術(shù)決策流程Fig.6 UAV air combat tactical decision process
相對(duì)于一對(duì)一[12]或二對(duì)一[15]的空戰(zhàn)對(duì)抗機(jī)動(dòng)決策,在二對(duì)二的空戰(zhàn)對(duì)抗中還需要進(jìn)行目標(biāo)分配以實(shí)現(xiàn)更好地協(xié)同。為盡早達(dá)成二對(duì)一的優(yōu)勢(shì)態(tài)勢(shì),需要無(wú)人機(jī)分別規(guī)劃對(duì)敵機(jī)的攻擊路徑后進(jìn)行信息交互,選擇出最優(yōu)的攻擊方案,目標(biāo)分配流程如圖7 所示。
圖7 無(wú)人機(jī)目標(biāo)分配協(xié)同決策流程Fig.7 Collaborative decision-making process for drone target allocation
無(wú)人機(jī)的單次決策是基于當(dāng)前態(tài)勢(shì)的機(jī)動(dòng)策略,隨著敵我態(tài)勢(shì)的轉(zhuǎn)變,原有決策方案很快就會(huì)失效,因此需要根據(jù)變換的態(tài)勢(shì)進(jìn)行決策更新。在路徑規(guī)劃中,無(wú)人機(jī)首先對(duì)敵機(jī)態(tài)勢(shì)進(jìn)行一次更新,而后根據(jù)最新的態(tài)勢(shì)規(guī)劃?rùn)C(jī)動(dòng)方案。規(guī)劃完畢后與編組無(wú)人機(jī)進(jìn)行信息交互,計(jì)算最優(yōu)的協(xié)同方案并完成協(xié)同決策。而后,在接下去的Δt時(shí)間內(nèi)執(zhí)行機(jī)動(dòng)決策方案并展開(kāi)新一輪的規(guī)劃。由于算法設(shè)計(jì)中,對(duì)路徑和速度的規(guī)劃中對(duì)規(guī)劃空間都進(jìn)行了離散化處理,并不符合實(shí)際飛行的決策需求,因此需要加快迭代更新頻率,提升決策方案的有效性。空戰(zhàn)機(jī)動(dòng)決策的總體流程如圖8 所示。
圖8 無(wú)人機(jī)雙機(jī)對(duì)抗決策更新流程Fig.8 UAV dual-aircraft confrontation decision update process
論文基于Matlab 構(gòu)建無(wú)人機(jī)空戰(zhàn)對(duì)抗仿真運(yùn)行平臺(tái),首先進(jìn)行單機(jī)對(duì)抗的路徑規(guī)劃試驗(yàn),運(yùn)行參數(shù)如表1 所示。
表1 無(wú)人機(jī)空戰(zhàn)仿真參數(shù)設(shè)置Table 1 UAV air combat simulation parameter setting
無(wú)人機(jī)的空戰(zhàn)路徑仿真如圖9 所示;圖9(a)中速度規(guī)劃曲線如圖10 所示,無(wú)人機(jī)決策時(shí)間變化曲線如圖11所示;無(wú)人機(jī)加速度變化曲線如圖12所示。
圖10 無(wú)人機(jī)速度變化曲線Fig.10 UAV speed curve
圖11 無(wú)人機(jī)機(jī)動(dòng)決策耗時(shí)曲線Fig.11 UAV maneuvering decision time-consuming curve
圖12 無(wú)人機(jī)加速度變化曲線Fig.12 UAV acceleration change curve
從單機(jī)驗(yàn)證結(jié)果來(lái)看,無(wú)人機(jī)可以進(jìn)行較好地機(jī)動(dòng)并進(jìn)行“咬尾”攻擊。無(wú)人機(jī)的速度規(guī)劃可分為3 個(gè)階段進(jìn)行:第一階段為前出接敵階段,在該階段內(nèi)無(wú)人機(jī)與敵機(jī)距離較遠(yuǎn),既無(wú)法鎖定敵機(jī),也不會(huì)被敵機(jī)鎖定,因此沒(méi)有做大速度機(jī)動(dòng)的必要,只需要以巡航速度接近敵機(jī)即可;第二階段,無(wú)人機(jī)可能進(jìn)入敵機(jī)的火控雷達(dá)照射范圍內(nèi),且需要盡快鎖定敵機(jī),應(yīng)進(jìn)行大速度的機(jī)動(dòng),在避開(kāi)敵機(jī)的同時(shí)形成咬尾態(tài)勢(shì);第三階段為咬尾鎖定階段,當(dāng)無(wú)人機(jī)形成優(yōu)勢(shì)態(tài)勢(shì)之后,應(yīng)當(dāng)與敵機(jī)保持相對(duì)穩(wěn)定的空中態(tài)勢(shì),以便于導(dǎo)彈能夠進(jìn)一步鎖定敵機(jī),因此速度又會(huì)再次回調(diào)。結(jié)合圖9 b)的態(tài)勢(shì)圖可知,無(wú)人機(jī)的速度規(guī)劃具備根據(jù)空中態(tài)勢(shì)進(jìn)行自適應(yīng)調(diào)整的能力,算法設(shè)計(jì)有效。在決策時(shí)間方面,論文無(wú)人機(jī)決策的平均時(shí)間為0.015 7 s,人最快的視覺(jué)反應(yīng)時(shí)間為0.15~0.20 s,隨著態(tài)勢(shì)的復(fù)雜度上升或生理狀態(tài)的下降,人的反映時(shí)間會(huì)進(jìn)一步加長(zhǎng)。而航空器控制回路的反應(yīng)時(shí)間可假設(shè)有人機(jī)與無(wú)人機(jī)相同。由此可見(jiàn),相較于有人機(jī)的空戰(zhàn)決策速度,無(wú)人機(jī)的決策效率顯著提升,能夠滿足現(xiàn)有的空戰(zhàn)對(duì)抗需求,算法同樣有效。
圖9 無(wú)人機(jī)單機(jī)空戰(zhàn)航跡Fig.9 Single drone air combat track
再對(duì)雙機(jī)空戰(zhàn)對(duì)抗機(jī)動(dòng)效果進(jìn)行仿真驗(yàn)證,如圖13 所示。
圖13 無(wú)人機(jī)雙機(jī)空戰(zhàn)對(duì)抗航跡Fig.13 UAV dual-aircraft combat confrontation track
從雙機(jī)對(duì)抗的仿真結(jié)果中可以看出,對(duì)于來(lái)自于不同方向的敵機(jī),無(wú)人機(jī)能夠進(jìn)行較好地側(cè)向機(jī)動(dòng),其中無(wú)人機(jī)航跡2 率先對(duì)敵機(jī)2 形成尾后攻擊態(tài)勢(shì),若命中目標(biāo),則可形成二對(duì)一空戰(zhàn)優(yōu)勢(shì),鎖定勝局。無(wú)人機(jī)航跡1 則繼續(xù)追擊敵機(jī)航跡1。
本文基于A-star 算法設(shè)計(jì)了無(wú)人機(jī)中距空戰(zhàn)對(duì)抗中側(cè)向機(jī)動(dòng)“咬尾”攻擊的決策方法,在路徑搜索過(guò)程中,通過(guò)加入引導(dǎo)式的啟發(fā)式因子,可使無(wú)人機(jī)在威脅規(guī)避的同時(shí)機(jī)動(dòng)至敵機(jī)尾后實(shí)施攻擊。從航跡決策時(shí)間和速度控制效果來(lái)看均達(dá)到了預(yù)期。在雙機(jī)對(duì)抗中,通過(guò)內(nèi)部決策的協(xié)同,按照盡快實(shí)現(xiàn)空中力量?jī)?yōu)勢(shì)的原則分配對(duì)抗目標(biāo),能夠完成雙機(jī)協(xié)同下的側(cè)向機(jī)動(dòng)攻擊。下一步將根據(jù)更多的空中態(tài)勢(shì)和更復(fù)雜的情景,展開(kāi)對(duì)應(yīng)的機(jī)動(dòng)方式的研究,豐富無(wú)人機(jī)的空戰(zhàn)對(duì)抗決策庫(kù)。