郭 昊, 周德云, 張 堃
(西北工業(yè)大學(xué),西安 710072)
目前,無(wú)人機(jī)已成為航空技術(shù)的重要發(fā)展方向,無(wú)人作戰(zhàn)飛機(jī)更是處于研究的前沿。隨著航電火控技術(shù)、通信與導(dǎo)航技術(shù)和先進(jìn)制導(dǎo)武器的發(fā)展,無(wú)人作戰(zhàn)飛機(jī)將逐步承擔(dān)起包括綜合打擊、對(duì)地火力壓制等作戰(zhàn)任務(wù),甚至參與制空權(quán)的奪取。能夠在復(fù)雜的空戰(zhàn)環(huán)境下進(jìn)行自主空戰(zhàn)決策是無(wú)人作戰(zhàn)飛機(jī)進(jìn)行空戰(zhàn)的關(guān)鍵技術(shù)之一。在空戰(zhàn)最為激烈的機(jī)動(dòng)攻擊階段,無(wú)人作戰(zhàn)飛機(jī)應(yīng)根據(jù)空戰(zhàn)態(tài)勢(shì)及時(shí)搶占并保持有利位置,尋機(jī)殲敵,保全自己。自主機(jī)動(dòng)決策是自主空戰(zhàn)決策的核心內(nèi)容。在空戰(zhàn)過程中,交戰(zhàn)雙方是一個(gè)動(dòng)態(tài)的對(duì)抗過程,機(jī)動(dòng)策略的選擇具有主動(dòng)性、目的性和風(fēng)險(xiǎn)性[1]。目前,對(duì)機(jī)動(dòng)策略的研究常用的方法有微分對(duì)策法、矩陣對(duì)策法、人工智能法等[2],但這些方法都未考慮決策過程的風(fēng)險(xiǎn)性。本文以對(duì)策論為基礎(chǔ),研究基于風(fēng)險(xiǎn)型決策的空戰(zhàn)自主機(jī)動(dòng)策略,并對(duì)不同條件下的實(shí)例進(jìn)行仿真。
在一對(duì)一空戰(zhàn)機(jī)動(dòng)攻擊階段,交戰(zhàn)雙方的對(duì)抗過程可以看作是一個(gè)有限二人零和對(duì)策過程。根據(jù)對(duì)策論的知識(shí),構(gòu)建空戰(zhàn)機(jī)動(dòng)攻擊階段的對(duì)策模型。模型包括局中人、策略集和支付等3個(gè)要素。
局中人為我方攻擊機(jī)和敵方目標(biāo)機(jī)。策略集以常用空戰(zhàn)操縱方式為基礎(chǔ),進(jìn)而設(shè)計(jì)提出的7種基本機(jī)動(dòng)方式[3-4],包括最大加速、最大減速、最大過載爬升、最大過載俯沖、最大過載右轉(zhuǎn)、最大過載左轉(zhuǎn)、保持穩(wěn)定飛行。通過實(shí)時(shí)進(jìn)行機(jī)動(dòng)選擇,可由此7種機(jī)動(dòng)方式組合出多種機(jī)動(dòng)動(dòng)作。在交戰(zhàn)雙方策略集選定以后,就可構(gòu)造出我方攻擊機(jī)的支付矩陣:
Sij為針對(duì)目標(biāo)機(jī)執(zhí)行第j種機(jī)動(dòng)策略,攻擊機(jī)選擇第i種機(jī)動(dòng)策略與之進(jìn)行對(duì)抗時(shí),攻擊機(jī)的贏得值。贏得值越大,表示攻擊機(jī)優(yōu)勢(shì)越大,損失越小,目標(biāo)機(jī)優(yōu)勢(shì)越小,損失越大。
支付矩陣中的贏得值是以空戰(zhàn)態(tài)勢(shì)為依據(jù),通過依次分別預(yù)測(cè)一段時(shí)間后,交戰(zhàn)雙方執(zhí)行7種機(jī)動(dòng)方式所達(dá)到的狀態(tài),并計(jì)算各狀態(tài)的評(píng)估函數(shù)來(lái)實(shí)現(xiàn)[5]。本文采用的空戰(zhàn)態(tài)勢(shì)評(píng)估函數(shù)主要由交戰(zhàn)雙方的角度、距離、接近速度、相對(duì)高度及武器性能等因素決定。
角度跟蹤優(yōu)勢(shì)函數(shù)為
式中:qR為攻擊機(jī)R速度矢量與目標(biāo)線夾角;qB為目標(biāo)機(jī)B速度矢量與目標(biāo)線夾角。
接近速度優(yōu)勢(shì)函數(shù)為
式中:Vc為攻擊機(jī)R與目標(biāo)機(jī)B的接近速度。
高度優(yōu)勢(shì)函數(shù)為
式中:h為攻擊機(jī)與目標(biāo)機(jī)的相對(duì)高度差;hX為門限高度差,其值隨空戰(zhàn)形式的不同而變化,可由決策者根據(jù)經(jīng)驗(yàn)設(shè)定;σhX=1.2hX。
現(xiàn)代空戰(zhàn)武器主要以各型空空導(dǎo)彈為主,對(duì)于全向空空導(dǎo)彈來(lái)講,在目標(biāo)周圍存在一可攻擊區(qū),只有攻擊機(jī)進(jìn)入該區(qū)內(nèi),且目標(biāo)機(jī)處于攻擊機(jī)有效截獲區(qū)時(shí)方可進(jìn)行攻擊[6],即攻擊機(jī)應(yīng)滿足:
式中:νR為目標(biāo)方位角;μR為目標(biāo)俯仰角;Δφs為攻擊機(jī)雷達(dá)水平掃描范圍;Δφc為攻擊機(jī)雷達(dá)垂直掃描范圍;Rmin,Rmax為導(dǎo)彈最小允許發(fā)射距離和最大允許發(fā)射距離;Dmin,Dmax為雷達(dá)最小截獲距離和最大截獲距離。一般總有Rmax<Dmax,Rmin>Dmin,因而只需滿足式(5)的前兩式即可。當(dāng)相對(duì)距離r>>Rmax時(shí),攻擊機(jī)R遠(yuǎn)離目標(biāo)機(jī)B的攻擊區(qū),可以認(rèn)為距離優(yōu)勢(shì)很小;當(dāng)r逐漸減小,從而靠近 Rmax時(shí),距離優(yōu)勢(shì)隨之增大;當(dāng)Rmin≤r≤Rmax時(shí),R機(jī)處于B機(jī)的可攻擊區(qū)內(nèi),可認(rèn)為距離優(yōu)勢(shì)很大;當(dāng)r進(jìn)一步減小,使得r<Rmin時(shí),R機(jī)出了B機(jī)的可攻擊區(qū),距離優(yōu)勢(shì)減小。因此,構(gòu)造距離優(yōu)勢(shì)函數(shù):
式中:R0=(Rmax+Rmin)/2;σr=2(Rmax-Rmin)。
同理可構(gòu)造截獲優(yōu)勢(shì)函數(shù):
式中:σs=2.5Δφs;σc=2.5Δφc。從而,可定義攻擊優(yōu)勢(shì)函數(shù):
空戰(zhàn)態(tài)勢(shì)評(píng)估函數(shù)是決策者選擇機(jī)動(dòng)策略的依據(jù),不同的空戰(zhàn)形式,影響空戰(zhàn)態(tài)勢(shì)的因素有所不同。在近距格斗中,空戰(zhàn)雙方對(duì)抗激烈,機(jī)動(dòng)轉(zhuǎn)換迅速,機(jī)動(dòng)目的以擺脫敵方瞄準(zhǔn)跟蹤、搶占有利攻擊位置為主,決策者應(yīng)綜合考慮角度、距離、接近速度、高度及武器性能等對(duì)空戰(zhàn)態(tài)勢(shì)的影響。與近距格斗相比,在超視距空戰(zhàn)中,交戰(zhàn)雙方大都在彼此的前半球進(jìn)行對(duì)射攻擊,機(jī)動(dòng)目的以保持對(duì)敵方的瞄準(zhǔn)跟蹤、調(diào)整姿態(tài)滿足武器發(fā)射條件為主,這在一定程度上限制了彼此的角度優(yōu)勢(shì)的大小,因此決策者需著重考慮距離、高度和武器性能的影響。綜合考慮交戰(zhàn)雙方的角度、距離、接近速度、相對(duì)高度、武器性能以及空戰(zhàn)形式等因素,則攻擊機(jī)和目標(biāo)機(jī)分別采取第i種機(jī)動(dòng)和第j種機(jī)動(dòng)進(jìn)行對(duì)抗后的總的空戰(zhàn)態(tài)勢(shì)評(píng)估函數(shù),即攻擊機(jī)的贏得值為
式中:w1,w2,w3為各優(yōu)勢(shì)函數(shù)的權(quán)重,其值可根據(jù)當(dāng)前空戰(zhàn)形式以及決策者的經(jīng)驗(yàn)、偏好確定。計(jì)算得到贏得值后,就可構(gòu)造攻擊機(jī)支付矩陣S。
空戰(zhàn)是一種在沖突環(huán)境下的激烈對(duì)抗過程,機(jī)動(dòng)策略的選擇通常采用對(duì)策論方法,以找出“穩(wěn)定解”或“平衡解”。這樣的結(jié)果比較保守,本文將沖突局勢(shì)下的雙邊對(duì)策問題,轉(zhuǎn)變?yōu)閱芜咃L(fēng)險(xiǎn)決策問題,并通過模糊決策方法對(duì)其進(jìn)行分析求解,找出最優(yōu)對(duì)抗策略。
風(fēng)險(xiǎn)型決策是指決策者在決策環(huán)境不是完全確定,但對(duì)各個(gè)狀態(tài)發(fā)生的概率已知的情況下所作出的決策[7]。能否準(zhǔn)確預(yù)測(cè)當(dāng)前時(shí)刻交戰(zhàn)雙方執(zhí)行各種機(jī)動(dòng)策略的概率是影響機(jī)動(dòng)決策有效性的關(guān)鍵因素之一。本文通過在每一決策時(shí)刻依次分別預(yù)測(cè)一段時(shí)間后交戰(zhàn)雙方執(zhí)行7種機(jī)動(dòng)策略所達(dá)到的狀態(tài),確定當(dāng)前時(shí)刻交戰(zhàn)雙方執(zhí)行各種機(jī)動(dòng)策略的概率。
設(shè) ΓR=(r1,r2,…,r7)為攻擊機(jī)R 的機(jī)動(dòng)策略集,ΓB=(b1,b2,…,b7)為目標(biāo)機(jī) B 的機(jī)動(dòng)策略集,根據(jù)第1、第2節(jié)的分析,可確定攻擊機(jī)R對(duì)目標(biāo)機(jī)B的機(jī)動(dòng)對(duì)策矩陣 S=(sij)7×7。
設(shè)Y=(y1,y2,…,y7)為攻擊機(jī)R采取7種機(jī)動(dòng)策略的概率向量,則有:
式中:i=1,2,…,7。
同理,設(shè)X=(x1,x2,…,x7)為目標(biāo)機(jī) B采取7種機(jī)動(dòng)策略的概率向量,則有:
式中:j=1,2,…,7。
根據(jù){S,Y},可建立攻擊機(jī)R對(duì)目標(biāo)機(jī)B的風(fēng)險(xiǎn)型機(jī)動(dòng)決策矩陣[8]:
式中:yisij,i,j=1,2,…,7 為針對(duì)目標(biāo)機(jī)執(zhí)行第 j種機(jī)動(dòng)策略,攻擊機(jī)選擇第i種機(jī)動(dòng)策略與之進(jìn)行對(duì)抗時(shí),攻擊機(jī)所得的風(fēng)險(xiǎn)收益。
在建立攻擊機(jī)R對(duì)目標(biāo)機(jī)B的風(fēng)險(xiǎn)型機(jī)動(dòng)決策矩陣 A=(aij)7×7的基礎(chǔ)上,令:
式中:j=1,2,…,7。定義相對(duì)偏差為
于是得到由相對(duì)偏差值構(gòu)成的模糊決策矩陣Δ=(μij)7×7,采用最大隸屬度偏差法[9]可確定攻擊機(jī) R 執(zhí)行各種機(jī)動(dòng)策略的相對(duì)風(fēng)險(xiǎn)收益值為
式中:bj=(μij)。攻擊機(jī) R 的最優(yōu)機(jī)動(dòng)策略應(yīng)滿足:
則攻擊機(jī)R的最優(yōu)機(jī)動(dòng)策略為ri*。
決策時(shí)機(jī)的確定是能否有效進(jìn)行機(jī)動(dòng)決策的關(guān)鍵因素之一。為了提高機(jī)動(dòng)決策的快速性及有效性,決策觸發(fā)器采用決策觸發(fā)機(jī)制,決策時(shí)機(jī)根據(jù)空戰(zhàn)實(shí)際情況確定。在決策觸發(fā)器中設(shè)置一些條件,在每個(gè)采樣周期都對(duì)這些條件進(jìn)行判斷,若有條件滿足則觸發(fā)一次決策[10],決策觸發(fā)條件如下所述。
1)初始決策時(shí)刻。在空戰(zhàn)開始時(shí)刻,即t=t0時(shí),應(yīng)觸發(fā)第一次決策。
2)戰(zhàn)術(shù)終止時(shí)刻。每次決策都對(duì)未來(lái)一段時(shí)間內(nèi)的空戰(zhàn)過程進(jìn)行預(yù)測(cè),以此為基礎(chǔ)進(jìn)行機(jī)動(dòng)決策。因此,一次決策的有效期就是其最優(yōu)空戰(zhàn)過程的時(shí)間跨度。若實(shí)際的空戰(zhàn)過程與上一次決策時(shí)預(yù)測(cè)的最優(yōu)過程基本一致,則應(yīng)在該最優(yōu)過程的終止時(shí)刻t=tk時(shí)觸發(fā)新的一次決策,tk=tk-1+ ΔT。其中:tk-1為上一次決策時(shí)刻;ΔT為最優(yōu)空戰(zhàn)過程的時(shí)間跨度,即空戰(zhàn)過程預(yù)測(cè)時(shí)間。ΔT=KΔtf,Δtf為空戰(zhàn)積分步長(zhǎng),K為預(yù)測(cè)時(shí)間間隔數(shù)。根據(jù)專家經(jīng)驗(yàn),K主要依賴于攻擊機(jī)速度矢量與目標(biāo)線的夾角ω以及攻擊機(jī)與目標(biāo)機(jī)距離r的變化而確定[11-12],三者之間關(guān)系如圖1所示,圖中,Kc為K 的上限,ωd=0.2ωc,ωc決定曲線 K(ω)的拐點(diǎn),其值可按曲線ωc(r/Rm)確定,Rm為武器作用范圍,ωe的值可由經(jīng)驗(yàn)確定。
圖1 預(yù)測(cè)時(shí)間間隔數(shù)K示意圖Fig.1 Time predicting interval K
3)本方局勢(shì)危急或決策失誤。若空戰(zhàn)過程中本機(jī)高度過低、速度過低、空戰(zhàn)狀態(tài)非常不利,或?qū)嶋H空戰(zhàn)態(tài)勢(shì)與最近一次決策的預(yù)測(cè)結(jié)果發(fā)生顯著偏差,則此時(shí)不能再采用上一次的決策結(jié)果,應(yīng)觸發(fā)新一次決策以便及時(shí)改出。在t時(shí)刻,若滿足以下條件之一則觸發(fā)決策:
式中:S(t)為空戰(zhàn)態(tài)勢(shì)評(píng)估函數(shù)值;Hmin,Vmin及Smin為高度、速度和S(t)的閾值;S^(t)為最近一次決策中對(duì)S(t)的預(yù)測(cè)值,ΔS為閾值。
決策觸發(fā)機(jī)制充分考慮了空戰(zhàn)態(tài)勢(shì)變化的快速性及不可預(yù)見性,能夠根據(jù)空戰(zhàn)實(shí)際情況靈活選擇決策時(shí)機(jī),提高了機(jī)動(dòng)決策的快速性及有效性。
設(shè)攻擊機(jī)為A,目標(biāo)機(jī)為T,A,T機(jī)最大可用過載均為7g。仿真采用北-天-東坐標(biāo)系。
1)近距(WVR)決策仿真。A機(jī)初始位置(單位:m):(1 000,5 200,2 000)。T 機(jī)初始位置(單位:m):(6 700,4 500,5 300)。A 機(jī)初始速度 VA=280 m/s,初始航跡俯仰角θA=0°,初始航跡偏轉(zhuǎn)角φA=0°。T機(jī)初始速度VT=310 m/s,初始航跡俯仰角θT=9°,初始航跡偏轉(zhuǎn)角φT=45°。
雙方在120 s中的機(jī)動(dòng)對(duì)抗情況如圖2、圖3所示。
圖2 A,T機(jī)近距對(duì)抗軌跡Fig.2 The trajectory of aircrafts in WVR combat
圖3 A,T機(jī)近距對(duì)抗機(jī)動(dòng)決策結(jié)果Fig.3 The maneuvering decision-making of aircrafts in WVR combat
2)超視距(BVR)決策仿真。A機(jī)初始位置(單位:m):(1 000,2 500,2 000)。T機(jī)初始位置(單位:m):(36 000,4 500,34 300)。A 機(jī)初始速度 VA=450 m/s,初始航跡俯仰角 θA=0°,初始航跡偏轉(zhuǎn)角φA=0°。T機(jī)初始速度VT=420 m/s,初始航跡俯仰角θT=0°,初始航跡偏轉(zhuǎn)角 φT=270°。
雙方在25 s中的機(jī)動(dòng)對(duì)抗情況如圖4、圖5所示。
圖4 A,T機(jī)超視距對(duì)抗軌跡Fig.4 The trajectory of aircrafts in BVR combat
圖5 A,T機(jī)超視距對(duì)抗機(jī)動(dòng)決策結(jié)果Fig.5 The maneuvering decision-making of aircrafts in BVR combat
3)仿真結(jié)果分析。圖2描述了近距對(duì)抗過程中A,T機(jī)的飛行軌跡,圖3中的縱坐標(biāo)表示A,T機(jī)的機(jī)動(dòng)策略號(hào),其值依次對(duì)應(yīng)于第1節(jié)中的7種基本機(jī)動(dòng)方式,它分別描述了近距對(duì)抗過程中A,T機(jī)在每一時(shí)刻所執(zhí)行的機(jī)動(dòng)策略。由圖2、圖3可以看出,在空戰(zhàn)初始時(shí)刻,A機(jī)在速度上并不占優(yōu)。在空戰(zhàn)的前10 s,A機(jī)不斷調(diào)整速度以增大本機(jī)總體優(yōu)勢(shì),T機(jī)由于A機(jī)的機(jī)動(dòng)對(duì)其現(xiàn)有的優(yōu)勢(shì)影響不大,因此保持向左盤旋上升以增大角度及高度優(yōu)勢(shì)。在第11 s時(shí),由于A機(jī)相對(duì)于T機(jī)的角度優(yōu)勢(shì)降低,因此A機(jī)采取水平向右盤旋以擺脫T機(jī)的跟蹤瞄準(zhǔn),T機(jī)則相應(yīng)地采取向右盤旋上升,試圖進(jìn)入A機(jī)尾后上方區(qū)域,以獲得有利的攻擊位置。在第43 s時(shí),A機(jī)加速躍升以降低T機(jī)的高度優(yōu)勢(shì),T機(jī)則繼續(xù)向右盤旋上升,以保持對(duì)A機(jī)的跟蹤。由此可以看出,在近距情況下,交戰(zhàn)雙方對(duì)空戰(zhàn)態(tài)勢(shì)變化敏感,能夠及時(shí)根據(jù)空戰(zhàn)態(tài)勢(shì)及敵方機(jī)動(dòng)動(dòng)作的轉(zhuǎn)換,相應(yīng)地改變機(jī)動(dòng)策略,以擺脫敵方的跟蹤瞄準(zhǔn),并搶占有利的攻擊位置。
圖4描述了超視距對(duì)抗過程中A,T機(jī)的飛行軌跡,圖5分別描述了超視距對(duì)抗過程中A,T機(jī)在每一時(shí)刻所執(zhí)行的機(jī)動(dòng)策略。由圖4、圖5可以看出,在空戰(zhàn)的前15 s,A機(jī)向右轉(zhuǎn)彎,加速躍升,在保持對(duì)T機(jī)截獲跟蹤的情況下,增大高度優(yōu)勢(shì);T機(jī)則水平右轉(zhuǎn)盤旋以實(shí)現(xiàn)對(duì)A機(jī)的截獲跟蹤。在15~25 s,T機(jī)不斷調(diào)整方位角,以保持對(duì)A機(jī)的跟蹤;A機(jī)則不斷調(diào)整本機(jī)的速度、姿態(tài),完成對(duì)T機(jī)的跟蹤瞄準(zhǔn)。由此可以看出,與近距格斗相比,在超視距情況下,交戰(zhàn)雙方相距較遠(yuǎn),空戰(zhàn)方式以迎頭對(duì)攻為主,空戰(zhàn)態(tài)勢(shì)變化平緩,交戰(zhàn)雙方對(duì)敵方機(jī)動(dòng)動(dòng)作的敏感程度降低,機(jī)動(dòng)動(dòng)作的轉(zhuǎn)換主要以滿足中距武器發(fā)射條件為主。
空戰(zhàn)機(jī)動(dòng)對(duì)抗是一個(gè)復(fù)雜的、動(dòng)態(tài)的過程,影響機(jī)動(dòng)動(dòng)作選擇的因素很多。本文通過對(duì)空戰(zhàn)機(jī)動(dòng)方式的分析,以對(duì)策論為基礎(chǔ),將空戰(zhàn)態(tài)勢(shì)作為預(yù)測(cè)機(jī)動(dòng)策略概率的依據(jù),提出了一種基于風(fēng)險(xiǎn)型決策的空戰(zhàn)自主機(jī)動(dòng)決策算法,并在不同的條件下,對(duì)空戰(zhàn)機(jī)動(dòng)攻擊階段的自主機(jī)動(dòng)決策進(jìn)行了仿真。仿真結(jié)果符合空戰(zhàn)實(shí)際情況,較好地體現(xiàn)了空戰(zhàn)過程的對(duì)抗性,機(jī)動(dòng)決策的主動(dòng)性、目的性和風(fēng)險(xiǎn)性。對(duì)無(wú)人機(jī)空戰(zhàn)自主機(jī)動(dòng)決策具有一定參考價(jià)值。
[1]劉昌云,劉進(jìn)忙,陳長(zhǎng)興.基于風(fēng)險(xiǎn)型決策的目標(biāo)機(jī)動(dòng)策略研究[J].系統(tǒng)工程理論與實(shí)踐,2003(10):99-102.
[2]董彥非,郭基聯(lián),張恒喜.空戰(zhàn)機(jī)動(dòng)決策方法研究[J].火力與指揮控制,2002,27(2):75-78.
[3]鐘友武,柳嘉潤(rùn),楊凌宇,等.自主近距空戰(zhàn)中機(jī)動(dòng)動(dòng)作庫(kù)及其綜合控制系統(tǒng)[J].航空學(xué)報(bào),2008,29(增):114-121.
[4]HERBST W B.Dynamics of air combat[J].Aircraft,1982,20(7):594-598.
[5]吳云潔,宋立國(guó),姜玉憲.飛行綜合控制系統(tǒng)空戰(zhàn)決策方法[J].北京航空航天大學(xué)學(xué)報(bào),1999,25(3):272-274.
[6]周德云,李鋒,蒲小勃,等.基于遺傳算法的飛機(jī)戰(zhàn)術(shù)飛行動(dòng)作決策[J].西北工業(yè)大學(xué)學(xué)報(bào),2002,20(1):109-112.
[7]運(yùn)籌學(xué)教材編寫組.運(yùn)籌學(xué)[M].3版.北京:清華大學(xué)出版社,2005.
[8]羅小明.C3I系統(tǒng)攻防對(duì)抗作戰(zhàn)決策的建模及仿真研究[J].指揮技術(shù)學(xué)院學(xué)報(bào),2001(1):54-56.
[9]李登峰.模糊多目標(biāo)多人決策與對(duì)策[M].北京:國(guó)防工業(yè)出版社,2003.
[10]柳嘉潤(rùn),鐘友武,張磊,等.自主空戰(zhàn)決策的試探機(jī)動(dòng)方法及仿真研究[J].系統(tǒng)仿真學(xué)報(bào),2008,20(5):1238-1242.
[11]王芳,姜長(zhǎng)生.基于風(fēng)險(xiǎn)型決策的多目標(biāo)空戰(zhàn)機(jī)動(dòng)策略研究[J].電光與控制,2008,15(12):21-26.
[12]AUSTIN F,CARBONE G,F(xiàn)ALCO M,et al.Game theory for automated maneuvering during air-to-air combat[J].J Guidance,1990,13(6):1143-1149.