車競,錢煒祺,和爭春
(中國空氣動力研究與發(fā)展中心 計算空氣動力學(xué)研究所,四川 綿陽621000)
空戰(zhàn)決策是指在空戰(zhàn)過程中作戰(zhàn)雙方如何根據(jù)作戰(zhàn)態(tài)勢以及作戰(zhàn)環(huán)境選擇戰(zhàn)勝對方和保存自己的攻防策略選擇方法,其中比較有影響力的方法包括:微分對策法、專家系統(tǒng)法、矩陣博弈法、智能微分對策法及神經(jīng)網(wǎng)絡(luò)法等[1]。
矩陣博弈法是空戰(zhàn)對策研究中提出較早、技術(shù)最成熟的方法之一,實質(zhì)是微分對策的離散化。其基本思路是:首先列舉空戰(zhàn)對抗中雙方可采取的典型機(jī)動飛行方式,然后把各種機(jī)動方式組合成不同的對抗模式,得到對抗模式矩陣(支付矩陣),最后根據(jù)希望達(dá)到的戰(zhàn)術(shù)目的,對矩陣中每一種對抗模式計算相應(yīng)的支付函數(shù)值進(jìn)行量化打分。根據(jù)計算出的各模式組合的得分總數(shù),選出得分最高者作為飛行軌跡[2]。
空戰(zhàn)對抗中的傳統(tǒng)矩陣博弈方法是尋找鞍點的過程,即紅藍(lán)雙方分別利用最小-最大策略選擇支付矩陣中的支付函數(shù)值,得到各自的飛行模式。當(dāng)支付矩陣可分時,鞍點存在,此時雙方的支付函數(shù)值相同,且均能獲得最保守的最大利益[3]。但由于該方法不考慮空戰(zhàn)雙方的機(jī)動策略,而且鞍點也往往不存在,因此應(yīng)用上有一定局限性。本文對傳統(tǒng)的矩陣博弈進(jìn)行了擴(kuò)展,將飛機(jī)的機(jī)動分為攻擊和逃避兩大策略,根據(jù)策略不同選擇不同的支付函數(shù)計算公式;其次是摒棄了鞍點概念,紅藍(lán)雙方各自建立自己的支付矩陣,并各自根據(jù)最小-最大策略選擇支付矩陣中的支付函數(shù)值,得到各自的飛行模式;最后通過示例進(jìn)行了仿真驗證。
矩陣博弈建立在支付矩陣的基礎(chǔ)上,而支付矩陣則是在雙方完成某一特定機(jī)動動作后由支付函數(shù)計算得到,因此必須為雙方建立合適的機(jī)動動作庫。
文獻(xiàn)[3]提出較為常用的7種空戰(zhàn)機(jī)動方式:(1)定常平飛;(2)最大加速平飛;(3)最大減速平飛;(4)最大負(fù)載爬升;(5)最大負(fù)載下降;(6)最大載荷右轉(zhuǎn);(7)最大載荷左轉(zhuǎn)。文獻(xiàn)[4-6]分別提出16,25,22種機(jī)動動作,例如:(1)直線飛行;(2)定常盤旋;(3)前置跟蹤;(4)俯沖增速;(5)斜拉起;(6)急拉起;(7)純跟蹤;(8)半斤斗;(9)躍升半滾;(10)高過載上滾;(11)高過載下滾;(12)規(guī)避轉(zhuǎn)彎;(13)急規(guī)避;(14)增速轉(zhuǎn)彎;(15)蛇形機(jī)動;(16)筒滾;(17)急盤降;(18)大坡度外轉(zhuǎn);(19)回轉(zhuǎn);(20)急上升轉(zhuǎn)彎;(21)下降急轉(zhuǎn);(22)下滑倒轉(zhuǎn);(23)半滾倒轉(zhuǎn);(24)高速 Yo-Yo;(25)低速 Yo-Yo等。
本文以7種空戰(zhàn)機(jī)動方式為例,空戰(zhàn)雙方會形成49種對抗模式,從而可建立雙方各自立場上的支付矩陣。紅方的支付矩陣如表1所示。
表1 紅方支付矩陣Table 1 Score matrix of red plane
表中,fij(t)表示藍(lán)方和紅方分別采用i和j機(jī)動策略對抗結(jié)局的評分,分值越大,代表紅方優(yōu)勢越大。傳統(tǒng)矩陣博弈中,紅方總是選擇分?jǐn)?shù)最大的機(jī)動方式,而藍(lán)方正相反,選擇的結(jié)果是達(dá)到了博弈論中的平衡點,即“鞍點”。本文則針對紅方和藍(lán)方分別建立各自的支付矩陣,并根據(jù)最小-最大原則各自選擇分?jǐn)?shù)最大的機(jī)動方式。
支付矩陣中,分?jǐn)?shù)值由支付函數(shù)計算。支付函數(shù)實際上是對完成相應(yīng)機(jī)動動作后雙方態(tài)勢、攻擊優(yōu)勢的估計,通常是相對方位、相對距離、速度和地形等自變量的函數(shù)。例如,文獻(xiàn)[7]中給出的一種形式為:
式中:s為總得分?jǐn)?shù);s1為與相對方位角有關(guān)的分?jǐn)?shù);s2為與相對距離有關(guān)的分?jǐn)?shù);s3為加速度的得分?jǐn)?shù)。
(1)方位貢獻(xiàn)
圖1為紅藍(lán)雙方相對位置關(guān)系。站在紅方立場,由圖1可知,當(dāng)紅方(R)進(jìn)攻時,其方位角貢獻(xiàn)為:
當(dāng)紅方逃避時,其方位角貢獻(xiàn)為:
藍(lán)方(B)的方位角貢獻(xiàn)計算方法與紅方相同。(2)距離貢獻(xiàn)
當(dāng)紅方攻擊時,希望雙方距離越來越近。此時,距離貢獻(xiàn)為:
當(dāng)紅方逃避時,希望雙方的距離越來越遠(yuǎn)。此時,距離貢獻(xiàn)為:
式中:r為雙方距離;rm為攻擊方導(dǎo)彈射程。藍(lán)方的距離貢獻(xiàn)計算方法與紅方相同。
(3)總的貢獻(xiàn)
當(dāng)優(yōu)先改變距離因素時,s=s2;當(dāng)優(yōu)先改變方向因素時,s=s1;當(dāng)同時考慮距離改變和方向改變時,s=s1s2。
圖1 紅藍(lán)雙方相對位置關(guān)系Fig.1 Relative position of red and blue planes
考慮7種基本機(jī)動動作組成動作庫,分別是:
(1)定直對稱平飛:在水平面內(nèi)勻速飛行,傾側(cè)角γv=0°,保持高度穩(wěn)定,推力由阻力平衡確定。
(2)最大加速平飛:水平面內(nèi)最大加速飛行,γv=0°,保持高度穩(wěn)定,推力開到“加力”狀態(tài)。
(3)最大減速平飛:水平面內(nèi)最大減速飛行,γv=0°,保持高度穩(wěn)定,推力開到“怠速”狀態(tài)。
(4)最大過載爬升:分為三個階段,首先以最大法向過載拉起,γv=0°,推力開到“加力”狀態(tài),直到傾角達(dá)到指定傾角;然后保持該傾角加速爬升,直到爬升高度達(dá)到指定高度;最后改出成水平定直飛行狀態(tài)(1)。
(5)最大過載俯沖:分為三個階段,首先以最大過載下壓,飛機(jī)翻轉(zhuǎn)γv=180°,推力開到“加力”狀態(tài),直到傾角達(dá)到指定傾角;然后飛機(jī)翻轉(zhuǎn)γv=0°,維持當(dāng)前傾角俯沖,直至俯沖高度達(dá)到設(shè)定值;最后改出成水平定直飛行狀態(tài)(1)。
(6)最大過載右轉(zhuǎn):分為兩個階段,首先在保持高度的情況下以最大法向過載、最大傾側(cè)角右轉(zhuǎn),推力開到“加力”狀態(tài),直至達(dá)到指定速度偏角;然后γv=0°,改出成水平定直對稱飛行狀態(tài)(1)。
(7)最大過載左轉(zhuǎn):分為兩個階段,首先在保持高度的情況下以最大法向過載、最大傾側(cè)角左轉(zhuǎn),推力開到“加力”狀態(tài),直至達(dá)到指定速度偏角;然后γv=0°,改出成水平定直對稱飛行狀態(tài)(1)。
以兩架F-16戰(zhàn)斗機(jī)掛載空空導(dǎo)彈為例進(jìn)行空戰(zhàn)仿真驗證。設(shè)置藍(lán)方在重量、推力以及機(jī)動性方面稍弱于紅方。假設(shè):當(dāng)一方進(jìn)入對方的雷達(dá)掃描范圍和距離時便被發(fā)現(xiàn);當(dāng)一方同時也進(jìn)入對方導(dǎo)彈的發(fā)射角范圍和射程時,定義為被鎖定,此時仿真結(jié)束。
設(shè)置紅方初始位置坐標(biāo)為(0,11,0)km,初始速度為 235.8 m/s,初始航跡傾角和偏角為(0°,0°),質(zhì)量為7 000 kg,發(fā)動機(jī)加力系數(shù)為1.62。藍(lán)方初始位置坐標(biāo)為(20,13,3)km,初始速度為235.8 m/s,初 始航跡傾角和偏角為(0°,-15°),質(zhì)量為9 000 kg,發(fā)動機(jī)加力系數(shù)為1.42。
設(shè)置雙方機(jī)動原則為:未被對方發(fā)現(xiàn)時采取“攻擊”原則,被對方發(fā)現(xiàn)時采取“逃避”原則;當(dāng)雙方互相發(fā)現(xiàn)時,由于紅方參數(shù)占優(yōu),故紅方依然“攻擊”,藍(lán)方“逃避”。
紅方支付函數(shù)采取同時考慮方向和距離改變的方式,藍(lán)方“逃避”時采取“優(yōu)先改變方向”模式。設(shè)置仿真時長為500 s,每個機(jī)動動作為20 s,仿真積分步長0.2 s。
雙方飛行過程中的機(jī)動動作如表2所示,空戰(zhàn)航跡如圖2和圖3所示。
表2 紅藍(lán)雙方追逃仿真示例1的機(jī)動動作與狀態(tài)Table 2 Tactical actions and stations in the first simulation for red and blue planes
圖2 仿真示例1的x-z航跡Fig.2 x-z flight path of the first simulation
圖3 仿真示例1的t-y航跡Fig.3 t-y flight path of the first simulation
由仿真過程可以看出:在初始條件下,紅方處于有利地位首先發(fā)現(xiàn)并攻擊藍(lán)方,但藍(lán)方通過快速改變方向迅速擺脫了紅方,并且逐漸地取得有利地位,期間雙方數(shù)次發(fā)現(xiàn)并攻擊對方。由于藍(lán)方“逃避”時采用“優(yōu)先改變方向”的策略,因此最終取得制勝位置,鎖定了紅方。
將紅方“逃避”時的策略設(shè)置為“優(yōu)先改變方向”,其余設(shè)置與示例1相同。雙方空戰(zhàn)航跡如圖4和圖5所示,飛行過程中的機(jī)動動作如表3所示。
圖4 仿真示例2的x-z航跡Fig.4 x-z flight path of the second simulation
圖5 仿真示例2的t-y航跡Fig.5 t-y flight path of the second simulation
表3 紅藍(lán)雙方追逃仿真示例2的機(jī)動動作與狀態(tài)Table 3 Tactical actions and stations in the second simulation for red and blue planes
從仿真過程可以看出:由于紅方在“逃避”時采取“優(yōu)先改變方向”策略,因此在仿真181.8 s被藍(lán)方發(fā)現(xiàn)時紅方采用第一種機(jī)動動作而不是示例1中的第二種機(jī)動動作,從而在飛行323.2 s時提前鎖定藍(lán)方,獲得制勝位置。
本文建立了基于7種機(jī)動動作庫的矩陣博弈空戰(zhàn)仿真模型。在該模型中,改變了傳統(tǒng)矩陣博弈雙方基于同一支付矩陣求鞍點的模式,分別建立對策雙方各自的支付矩陣,根據(jù)各自“攻擊”還是“逃避”策略選擇支付函數(shù)的形式,并采用最小-最大原則選擇機(jī)動動作,完成了兩例戰(zhàn)機(jī)的空戰(zhàn)數(shù)值仿真驗證。仿真結(jié)果表明,當(dāng)戰(zhàn)機(jī)處于劣勢時,大機(jī)動改變兩機(jī)相對方位角關(guān)系是盡快獲得有利位置的重要手段。
[1] 于梅祥,李一波.無人戰(zhàn)斗機(jī)空戰(zhàn)對策研究綜述[J].沈陽航空工業(yè)學(xué)院學(xué)報,2009,26(1):23-25.
[2] 王義寧,姜玉憲.空戰(zhàn)對策的發(fā)展現(xiàn)狀與未來[J].電光與控制,2000,7(2):13-17.
[3] Fred Austin,Giro Carbone,Michael Falco,et al.Automated maneuvering for air-to-air combat[R].AIAA-87-2393,1987.
[4] 朱寶鎏.作戰(zhàn)飛機(jī)效能評估[M].第2版.北京:航空工業(yè)出版社,2006:165.
[5] 胡秉科.殲擊機(jī)一對一空戰(zhàn)模擬系統(tǒng)及其應(yīng)用[J].航空系統(tǒng)工程,1992(5):17-25.
[6] 梁學(xué)政.雙機(jī)空戰(zhàn)的仿真與分析[J].火力與指揮控制,1994,19(4):8-15.
[7] 吳云潔,宋立國,姜玉憲.飛行綜合控制系統(tǒng)空戰(zhàn)決策方法[J].北京航空航天大學(xué)學(xué)報,1999,25(3):272-274.