孟光磊,張慧敏,樸海音,周銘哲
(1.沈陽(yáng)航空航天大學(xué)自動(dòng)化學(xué)院,沈陽(yáng) 110136;2.航空工業(yè)沈陽(yáng)飛機(jī)設(shè)計(jì)研究所,沈陽(yáng) 110135)
在現(xiàn)代空戰(zhàn)中,多機(jī)協(xié)同空戰(zhàn)與單機(jī)空戰(zhàn)相比,具備更高的作戰(zhàn)能力和作戰(zhàn)效率,已成為空戰(zhàn)的主要形式。超視距(beyond-visual-range,BVR)空戰(zhàn)亦稱中遠(yuǎn)距空戰(zhàn),是指交戰(zhàn)雙方飛行員在目視觀察范圍以外使用中遠(yuǎn)距攔截導(dǎo)彈進(jìn)行的空戰(zhàn)。隨著空戰(zhàn)技術(shù)的不斷發(fā)展,飛機(jī)性能越來(lái)越強(qiáng),空空導(dǎo)彈的射程越來(lái)越遠(yuǎn),空戰(zhàn)交戰(zhàn)區(qū)域的范圍也越來(lái)越大,超視距空戰(zhàn)在未來(lái)空戰(zhàn)中占有主導(dǎo)地位[1]。超視距多機(jī)協(xié)同空戰(zhàn)的主要核心是以雙機(jī)編隊(duì)為基礎(chǔ)進(jìn)行協(xié)同戰(zhàn)術(shù)指派,其中,二對(duì)一空戰(zhàn)作為主要作戰(zhàn)模式扮演著重要的角色。但在實(shí)際戰(zhàn)場(chǎng)環(huán)境下,由于傳感器性能的局限及敵方實(shí)施干擾、欺騙等原因,通常會(huì)出現(xiàn)采樣信息不完備的情況,如何基于獲取的不確定性戰(zhàn)場(chǎng)態(tài)勢(shì)信息實(shí)時(shí)、準(zhǔn)確地識(shí)別敵機(jī)編隊(duì)協(xié)同戰(zhàn)術(shù),從而為己方提供可靠的決策依據(jù),是取得空戰(zhàn)勝利的關(guān)鍵[2]。因此,非完備信息下的敵方雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別問(wèn)題具有重要的研究?jī)r(jià)值和意義。
雙機(jī)編隊(duì)協(xié)同戰(zhàn)術(shù)識(shí)別結(jié)果反映了飛行員的作戰(zhàn)意圖。目前,國(guó)內(nèi)外從不同方面對(duì)戰(zhàn)術(shù)識(shí)別和意圖推理問(wèn)題進(jìn)行了研究,運(yùn)用的方法主要包括多實(shí)體貝葉斯網(wǎng)絡(luò)(multi-entity Bayesian network,MEBN)[3]、區(qū)間灰關(guān)聯(lián)度[4-5]、信息熵[6-7]、神經(jīng)網(wǎng)絡(luò)[8-9]和深度學(xué)習(xí)[10-11]等。鄧海軍等[3]提出了基于MEBN的戰(zhàn)術(shù)意圖識(shí)別方法,基于專家經(jīng)驗(yàn)構(gòu)建MEBN 模型,采用一階網(wǎng)絡(luò)來(lái)表示意圖影響因素,克服了傳統(tǒng)貝葉斯網(wǎng)絡(luò)方法對(duì)復(fù)雜問(wèn)題缺乏表示能力的問(wèn)題,但是沒(méi)有給出大樣本條件下模型識(shí)別準(zhǔn)確率的實(shí)驗(yàn)結(jié)論。Zhao 和Yang[4]提出了一種基于灰關(guān)聯(lián)度的群體沖突決策圖模型,通過(guò)計(jì)算目標(biāo)特征區(qū)間值,進(jìn)行目標(biāo)戰(zhàn)術(shù)意圖推理。Zhou 等[6]結(jié)合長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)和決策樹(shù)的優(yōu)點(diǎn),提出了一種基于信息熵的目標(biāo)意圖預(yù)測(cè)方法,但該方法由先驗(yàn)知識(shí)提取規(guī)則,具有較強(qiáng)的主觀性。周旺旺等[9]提出了基于神經(jīng)網(wǎng)絡(luò)的目標(biāo)意圖識(shí)別方法,可以在領(lǐng)域?qū)<蚁闰?yàn)知識(shí)不足的情況下較好地解決目標(biāo)意圖識(shí)別問(wèn)題。歐微等[11]提出了一種基于棧式自編碼器的意圖識(shí)別深度學(xué)習(xí)模型,將戰(zhàn)場(chǎng)環(huán)境信息、目標(biāo)屬性和目標(biāo)實(shí)時(shí)狀態(tài)信息作為輸入,識(shí)別作戰(zhàn)意圖,該方法能有效識(shí)別目標(biāo)作戰(zhàn)意圖,但模型輸入包含多個(gè)時(shí)刻目標(biāo)狀態(tài)信息,在模型訓(xùn)練時(shí)會(huì)產(chǎn)生累積誤差,影響識(shí)別效果。上述方法可以概括為2 類:①根據(jù)領(lǐng)域?qū)<抑饔^經(jīng)驗(yàn)建立識(shí)別模型,提高模型構(gòu)建的合理性和效率,但不具備環(huán)境適應(yīng)性的能力;②采用大量樣本數(shù)據(jù)訓(xùn)練的方式,修正模型參數(shù),提高模型識(shí)別準(zhǔn)確率,但缺少了非完備信息下的敵方協(xié)同戰(zhàn)術(shù)識(shí)別與意圖推理。
目前,貝葉斯網(wǎng)絡(luò)作為數(shù)據(jù)處理和分析工具被廣泛應(yīng)用,特別是用于解決不確定性環(huán)境下的問(wèn)題[12],采用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)(dynam ic Bayesian network,DBN)既可以根據(jù)專家經(jīng)驗(yàn)建立決策模型,又能夠基于樣本數(shù)據(jù)進(jìn)行模型訓(xùn)練[13-17]。為滿足非完備信息下超視距協(xié)同空戰(zhàn)環(huán)境中對(duì)雙機(jī)編隊(duì)協(xié)同戰(zhàn)術(shù)的識(shí)別需求,本文提出了基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法。對(duì)雙機(jī)編隊(duì)協(xié)同戰(zhàn)術(shù)中的長(zhǎng)/僚機(jī)空間占位和機(jī)動(dòng)特征進(jìn)行了分析,根據(jù)領(lǐng)域?qū)<医?jīng)驗(yàn)構(gòu)建了雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別網(wǎng)絡(luò)模型,通過(guò)樣本數(shù)據(jù)學(xué)習(xí)優(yōu)化了網(wǎng)絡(luò)參數(shù),采用AR(p)模型對(duì)缺失目標(biāo)信息進(jìn)行修補(bǔ),提出非完備信息下的雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別推理算法。實(shí)驗(yàn)結(jié)果表明,非完備信息下的超視距空戰(zhàn)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法具有較高的識(shí)別概率和良好的實(shí)時(shí)性,具備較好的工程應(yīng)用價(jià)值。
動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)具有對(duì)跟隨時(shí)間演化的過(guò)程進(jìn)行表示的能力,適合用于構(gòu)建受毗鄰時(shí)間參數(shù)變化關(guān)系影響的決策模型[18]。在空戰(zhàn)對(duì)抗過(guò)程中,戰(zhàn)機(jī)的飛行參數(shù)不斷發(fā)生變化,采用動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)構(gòu)建協(xié)同戰(zhàn)術(shù)識(shí)別模型能夠?qū)崟r(shí)監(jiān)測(cè)雙機(jī)編隊(duì)內(nèi)各戰(zhàn)機(jī)的飛行參數(shù)信息,通過(guò)前后關(guān)聯(lián)時(shí)刻的節(jié)點(diǎn)信息傳遞,實(shí)現(xiàn)根據(jù)累積證據(jù)信息的因果推理,進(jìn)而在線識(shí)別和預(yù)測(cè)目標(biāo)雙機(jī)編隊(duì)一段時(shí)間內(nèi)的協(xié)同戰(zhàn)術(shù)。另外,根據(jù)當(dāng)前空戰(zhàn)態(tài)勢(shì)特征,推理目標(biāo)編隊(duì)未來(lái)一段時(shí)間內(nèi)執(zhí)行的協(xié)同戰(zhàn)術(shù)屬于不確定性推理問(wèn)題,動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)通過(guò)概率理論和圖論的結(jié)合,可以根據(jù)觀測(cè)節(jié)點(diǎn)概率推理出其他節(jié)點(diǎn)的概率,能夠?yàn)榫哂胁淮_定性的問(wèn)題提供定量化的解決方案。因此,動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)適用于解決雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別問(wèn)題。
超視距協(xié)同空戰(zhàn)條件下,以長(zhǎng)/僚機(jī)空間占位、機(jī)動(dòng)動(dòng)作和運(yùn)動(dòng)趨勢(shì)作為雙機(jī)戰(zhàn)術(shù)意圖特征,基于典型協(xié)同戰(zhàn)術(shù)隊(duì)形衍生出7 種雙機(jī)編隊(duì)協(xié)同戰(zhàn)術(shù)。綜合分析長(zhǎng)/僚機(jī)在不同戰(zhàn)術(shù)下的飛行特征,整理得到長(zhǎng)機(jī)和僚機(jī)在各戰(zhàn)術(shù)中的特征信息描述分別如表1 和表2 所示。
表1 典型戰(zhàn)術(shù)下的長(zhǎng)機(jī)特征信息描述Table 1 Description of leader characteristics information under typical tactics
表2 典型戰(zhàn)術(shù)下的僚機(jī)特征信息描述Tab le 2 Description of w ingman characteristics inform ation under typical tactics
通過(guò)1.1 節(jié)的分析,選用目標(biāo)相對(duì)高度、雙機(jī)方位角、進(jìn)入角及機(jī)動(dòng)特征信息作為網(wǎng)絡(luò)的觀測(cè)節(jié)點(diǎn)。綜合分析觀測(cè)信息與雙機(jī)協(xié)同戰(zhàn)術(shù)間的因果關(guān)系,進(jìn)而確定網(wǎng)絡(luò)中間節(jié)點(diǎn)。網(wǎng)絡(luò)根節(jié)點(diǎn)為協(xié)同戰(zhàn)術(shù)識(shí)別結(jié)果,包括表1 中的7 種協(xié)同戰(zhàn)術(shù)。最終得到基于動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別模型,如圖1 所示。
圖1 雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別網(wǎng)絡(luò)模型Fig.1 Dual-aircraft cooperative tactical recognition network model
該識(shí)別網(wǎng)絡(luò)模型共3 層,底層根據(jù)目標(biāo)相對(duì)高度推理得出高度保持類協(xié)同戰(zhàn)術(shù)和具有高度差類協(xié)同戰(zhàn)術(shù);第2 層加入目標(biāo)編隊(duì)?wèi)?zhàn)機(jī)的方位角和進(jìn)入角信息,將上一層的高度保持類協(xié)同戰(zhàn)術(shù)細(xì)分為尾后攻擊戰(zhàn)術(shù)、前方高度保持類協(xié)同戰(zhàn)術(shù)和側(cè)方高度保持類協(xié)同戰(zhàn)術(shù),同時(shí)識(shí)別出具有高度差的垂直疏開(kāi)戰(zhàn)術(shù)和組合疏開(kāi)戰(zhàn)術(shù);第3 層結(jié)合目標(biāo)的機(jī)動(dòng)動(dòng)作信息,對(duì)前2 層未能識(shí)別出的協(xié)同戰(zhàn)術(shù)進(jìn)行推理確認(rèn),最終得到典型雙機(jī)協(xié)同戰(zhàn)術(shù)的識(shí)別概率,其中“其他戰(zhàn)術(shù)”的概率結(jié)果表示了不屬于表1 中7 種戰(zhàn)術(shù)的可能性。
網(wǎng)絡(luò)中各節(jié)點(diǎn)含義及狀態(tài)集說(shuō)明如表3 所示。其中,目標(biāo)相對(duì)高度、目標(biāo)方位角和目標(biāo)進(jìn)入角可根據(jù)目標(biāo)探測(cè)信息經(jīng)離散化處理后獲得,目標(biāo)機(jī)動(dòng)動(dòng)作識(shí)別網(wǎng)絡(luò)參照文獻(xiàn)[19]中的方法構(gòu)建。根據(jù)空戰(zhàn)態(tài)勢(shì)特征,實(shí)時(shí)計(jì)算目標(biāo)機(jī)動(dòng)動(dòng)作的分布概率,作為目標(biāo)機(jī)動(dòng)動(dòng)作觀測(cè)節(jié)點(diǎn)的信息輸入。
表3 節(jié)點(diǎn)含義及狀態(tài)集說(shuō)明Table 3 Description of node meaning and state set
針對(duì)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別網(wǎng)絡(luò)模型,根據(jù)動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)的知識(shí)表達(dá)與推理預(yù)測(cè)能力,可以有效計(jì)算不同戰(zhàn)場(chǎng)態(tài)勢(shì)環(huán)境下各種典型協(xié)同戰(zhàn)術(shù)的概率分布,模型訓(xùn)練與推理的技術(shù)路線如圖2 所示。
圖2 模型訓(xùn)練與推理技術(shù)路線Fig.2 Technical route of model training and reasoning
針對(duì)模型訓(xùn)練部分,采用期望最大(EM)算法,根據(jù)雙機(jī)協(xié)同空戰(zhàn)數(shù)據(jù)樣本對(duì)初始網(wǎng)絡(luò)參數(shù)進(jìn)行學(xué)習(xí),得到優(yōu)化的網(wǎng)絡(luò)參數(shù)。推理計(jì)算部分按照動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)模型推理算法,計(jì)算根節(jié)點(diǎn)各狀態(tài)的概率分布,進(jìn)而得到雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別結(jié)果。
參數(shù)訓(xùn)練是在給定貝葉斯網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的情況下,利用客觀數(shù)據(jù)對(duì)鏈路的條件概率進(jìn)行學(xué)習(xí)修正的過(guò)程[20-22]。目前,關(guān)于貝葉斯網(wǎng)絡(luò)參數(shù)學(xué)習(xí)的算法主要有最大似然估計(jì)法、梯度下降法和EM 算法等。由于雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別網(wǎng)絡(luò)模型的結(jié)構(gòu)已知,考慮到空戰(zhàn)過(guò)程中獲取的觀測(cè)數(shù)據(jù)可能存在不完整的情況,采用可以處理缺失樣本數(shù)據(jù)的EM 算法對(duì)該識(shí)別網(wǎng)絡(luò)模型進(jìn)行參數(shù)學(xué)習(xí)。
學(xué)習(xí)樣本數(shù)據(jù)可以從實(shí)際空戰(zhàn)訓(xùn)練和空戰(zhàn)仿真系統(tǒng)中提取,將戰(zhàn)場(chǎng)數(shù)據(jù)進(jìn)行離散化處理后作為學(xué)習(xí)算法輸入,具體參數(shù)學(xué)習(xí)過(guò)程說(shuō)明如下:
1)數(shù)據(jù)離散化處理。通過(guò)對(duì)相關(guān)戰(zhàn)術(shù)的特征進(jìn)行分析,將各節(jié)點(diǎn)變量的離散狀態(tài)按照表3 的分類規(guī)則進(jìn)行狀態(tài)劃分,得到動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)可進(jìn)行處理的離散數(shù)據(jù)。
2)條件概率分布學(xué)習(xí)。首先,根據(jù)專家經(jīng)驗(yàn)進(jìn)行網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)概率分布的初始化,然后,通過(guò)對(duì)客觀訓(xùn)練數(shù)據(jù)歸納整理,得到各節(jié)點(diǎn)的輸入狀態(tài)信息,進(jìn)而采用EM 算法將初始概率分布修正到更為優(yōu)化的狀態(tài)。
EM 算法的求解過(guò)程主要分為以下步驟:
1)期望(E)步:計(jì)算貝葉斯網(wǎng)絡(luò)參數(shù) θ基于樣本數(shù)據(jù) ?的期望對(duì)數(shù)似然函數(shù),即
式中: ?=(D1,D2,···,Dm)為關(guān)于貝葉斯網(wǎng)絡(luò)的一組數(shù)據(jù)樣本集,對(duì)其中任一樣本Dl,其包含表2 中變量的狀態(tài)信息; ?xl為xl所有可能取值的集合;Xl為Dl中缺值變量的集合; θ代表圖1 所示模型中所有節(jié)點(diǎn)間條件概率參數(shù)組成的向量; θt為 θ的當(dāng)前估計(jì)。
2)最大化(M)步:求當(dāng)E 步的期望似然函數(shù)值最大時(shí) θ的取值,即
3)收 斂 判 斷。設(shè) 定 收 斂 閾 值 δ ,當(dāng)Q(θ|θt+1)?Q(θ|θt)<δ時(shí),判定算法收斂,執(zhí)行步驟4,否則返回步驟1 進(jìn)行迭代計(jì)算。
4)輸出參數(shù)學(xué)習(xí)結(jié)果 θt+1。
動(dòng)態(tài)貝葉斯網(wǎng)絡(luò)推理就是通過(guò)各節(jié)點(diǎn)連成的鏈路進(jìn)行證據(jù)信息的傳遞,并加入時(shí)間片概念,即結(jié)合上一時(shí)刻的推理結(jié)果與當(dāng)前時(shí)刻觀測(cè)節(jié)點(diǎn)的特征信息,推理得到目標(biāo)節(jié)點(diǎn)的狀態(tài)信息。
雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別推理算法流程主要包括以下5 個(gè)步驟:
步驟 1缺失樣本數(shù)據(jù)修補(bǔ)。由于實(shí)際空戰(zhàn)環(huán)境下存在無(wú)法準(zhǔn)確獲取目標(biāo)信息的情況,對(duì)缺失樣本數(shù)據(jù)進(jìn)行修補(bǔ)處理。
在空戰(zhàn)過(guò)程中,目標(biāo)的觀測(cè)數(shù)據(jù)是通過(guò)傳感器在時(shí)間序列等間隔采樣獲取的,數(shù)據(jù)之間存在一定的依附關(guān)系。采用 AR(p)模 型對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)。AR(p)模型定義為
式中:Xt為 第t時(shí)刻的觀測(cè)數(shù)據(jù);a=[a1,a2,···,ap]T為自回歸參數(shù)向量,其計(jì)算過(guò)程采用最小二乘法進(jìn)行估計(jì);ut為 白噪聲,其階數(shù)為p,基于貝葉斯信息準(zhǔn)則(Bayesian information criterion,BIC)確定[23-24]。
步驟 2計(jì)算當(dāng)前時(shí)刻的協(xié)同戰(zhàn)術(shù)識(shí)別概率。由當(dāng)前時(shí)刻觀測(cè)節(jié)點(diǎn)的特征提取結(jié)果和各條鏈路的條件概率完成各觀測(cè)節(jié)點(diǎn)到根節(jié)點(diǎn)的推理,再將所有鏈路推理結(jié)果相乘得到當(dāng)前時(shí)刻的識(shí)別概率分布。
步驟 3根據(jù)上一時(shí)刻推理結(jié)果,更新協(xié)同戰(zhàn)術(shù)識(shí)別概率。由于當(dāng)前時(shí)刻的最終識(shí)別結(jié)果受上一時(shí)刻的識(shí)別結(jié)果影響,根據(jù)貝葉斯公式,可求解條件概率分布。
根據(jù)上述計(jì)算結(jié)果,可求解各戰(zhàn)術(shù)在綜合歷史證據(jù)信息下的識(shí)別概率。
步驟 4判斷收斂性。當(dāng)某協(xié)同戰(zhàn)術(shù)的識(shí)別概率達(dá)到90%,且觀測(cè)節(jié)點(diǎn)特征提取結(jié)果不變時(shí),判斷網(wǎng)絡(luò)處于收斂狀態(tài)。
步驟 5輸出戰(zhàn)術(shù)識(shí)別結(jié)果。若網(wǎng)絡(luò)未收斂且未達(dá)到最大迭代次數(shù),則返回步驟1 繼續(xù)進(jìn)行推理。否則,輸出識(shí)別結(jié)果,最終得到的識(shí)別結(jié)果為推理概率最大值對(duì)應(yīng)的雙機(jī)協(xié)同戰(zhàn)術(shù)。
為了驗(yàn)證雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法對(duì)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別的準(zhǔn)確性,先開(kāi)展了典型二對(duì)一空戰(zhàn)環(huán)境下的仿真實(shí)驗(yàn),對(duì)不完備信息下敵方目標(biāo)進(jìn)行雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別,再基于大量訓(xùn)練樣本數(shù)據(jù)進(jìn)行了統(tǒng)計(jì)性實(shí)驗(yàn),得到該方法對(duì)于雙機(jī)協(xié)同戰(zhàn)術(shù)的識(shí)別概率。開(kāi)展實(shí)驗(yàn)之前,先進(jìn)行參數(shù)學(xué)習(xí),得到參數(shù)優(yōu)化的識(shí)別網(wǎng)絡(luò)模型。
針對(duì)1.2 節(jié)構(gòu)建的雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別網(wǎng)絡(luò)模型,根據(jù)專家經(jīng)驗(yàn)對(duì)各網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行初始概率分布設(shè)定。由于參數(shù)較多此處不做詳述,以高度分類參數(shù)設(shè)置為例,初始概率分布設(shè)置如表4 所示。
表4 初始概率分布設(shè)置Table 4 Initial probability distribution setting
針對(duì)表1 中的7 種典型雙機(jī)協(xié)同戰(zhàn)術(shù),分別進(jìn)行100 次空戰(zhàn)對(duì)抗仿真,共得到700 組仿真樣本作為訓(xùn)練數(shù)據(jù)。對(duì)訓(xùn)練樣本數(shù)據(jù)進(jìn)行預(yù)處理,將目標(biāo)方位角、目標(biāo)進(jìn)入角和目標(biāo)相對(duì)高度數(shù)據(jù)按照表2中的節(jié)點(diǎn)狀態(tài)集離散化為對(duì)應(yīng)取值。采用2.1 節(jié)中所述EM 算法進(jìn)行參數(shù)學(xué)習(xí),設(shè)定收斂閾值 δ =0.01,不斷迭代對(duì)網(wǎng)絡(luò)參數(shù)概率分布進(jìn)行修正。以高度分類參數(shù)概率分布為例,學(xué)習(xí)后的取值如表5 所示,參數(shù)學(xué)習(xí)后的各狀態(tài)條件概率值均有變化,降低了完全根據(jù)主觀經(jīng)驗(yàn)確定網(wǎng)絡(luò)參數(shù)帶來(lái)的不確定性影響,達(dá)到了參數(shù)修正效果。
表5 最終概率分布設(shè)置Table 5 Final probability distribution setting
以典型二對(duì)一協(xié)同空戰(zhàn)為例進(jìn)行仿真實(shí)驗(yàn),空戰(zhàn)對(duì)抗中紅藍(lán)雙方的初始空間占位參數(shù)如表6 所示。設(shè)定識(shí)別網(wǎng)絡(luò)模型推理周期為50ms,最大迭代次數(shù)為20。在仿真對(duì)抗過(guò)程中,藍(lán)方雙機(jī)編隊(duì)采用協(xié)同戰(zhàn)術(shù)對(duì)紅機(jī)進(jìn)行攻擊,二對(duì)一協(xié)同空戰(zhàn)飛行對(duì)抗仿真軌跡如圖3 所示。
表6 空間占位初始參數(shù)設(shè)置Table 6 Initial parameter setting of space occupancy
圖3 二對(duì)一協(xié)同空戰(zhàn)飛行仿真軌跡Fig.3 Flight simulation trajectory of two-to-one cooperative air combat
3.2.1 空間占位特征提取
在實(shí)際空戰(zhàn)仿真過(guò)程中,存在目標(biāo)樣本數(shù)據(jù)缺失的情況,對(duì)370~371s 時(shí)間段內(nèi),每5 0ms 為一周期進(jìn)行等間隔采樣,以目標(biāo)高度和目標(biāo)方位角數(shù)據(jù)樣本為例,如表7 和表8 所示。
表7 高度數(shù)據(jù)樣本信息Table 7 Height data sam p le inform ation
表8 目標(biāo)方位角數(shù)據(jù)樣本信息Table 8 Target azim uth data sam p le inform ation
對(duì)飛行過(guò)程中藍(lán)方雙機(jī)飛行參數(shù)進(jìn)行特征提取,若當(dāng)前時(shí)刻觀測(cè)節(jié)點(diǎn)數(shù)據(jù)缺失,則進(jìn)行觀測(cè)節(jié)點(diǎn)數(shù)據(jù)預(yù)測(cè)。根據(jù)BIC 準(zhǔn)則,確定模型階數(shù),利用最小二乘法進(jìn)行參數(shù)估計(jì),得到目標(biāo)雙機(jī)方位角、高度的預(yù)測(cè)模型參數(shù),如表9 所示。
表9 目標(biāo)雙機(jī)方位角、高度的預(yù)測(cè)模型參數(shù)Table 9 Parameters of azimuth and altitude prediction model for dual aircraft
根據(jù)目標(biāo)觀測(cè)數(shù)據(jù)預(yù)測(cè)模型進(jìn)行數(shù)據(jù)修補(bǔ),修補(bǔ)數(shù)據(jù)前后的雙機(jī)方位角、進(jìn)入角和高度特征提取結(jié)果具體如圖4 和圖5 所示。
圖4 未進(jìn)行數(shù)據(jù)修補(bǔ)的藍(lán)方雙機(jī)空間占位特征Fig.4 Space occupying feature of blue dual aircrafts without data patching
圖5 數(shù)據(jù)修補(bǔ)后藍(lán)方雙機(jī)空間占位特征Fig.5 Space occupying feature of blue dual aircraft after data patching
經(jīng)過(guò)數(shù)據(jù)修補(bǔ)后分析可知,藍(lán)方1 號(hào)機(jī)的方位角特征提取結(jié)果按時(shí)間依次為前方、右方、后方和前方;藍(lán)方2 號(hào)機(jī)的方位角特征提取結(jié)果依次為前方、左方和后方。針對(duì)目標(biāo)雙機(jī)的進(jìn)入角特征,提取得到藍(lán)方1 號(hào)機(jī)進(jìn)入角特征起初為飛向我機(jī),后變?yōu)轱w離我機(jī);藍(lán)方2 號(hào)機(jī)的進(jìn)入角特征始終為飛向我機(jī)。藍(lán)方1 號(hào)機(jī)的高度特征提取結(jié)果由基準(zhǔn)面變?yōu)榈陀谖覚C(jī);藍(lán)方2 號(hào)機(jī)的高度特征提取結(jié)果由基準(zhǔn)面變?yōu)楦哂谖覚C(jī)。
3.2.2 機(jī)動(dòng)動(dòng)作特征提取
利用戰(zhàn)機(jī)機(jī)動(dòng)動(dòng)作識(shí)別算法對(duì)此空戰(zhàn)仿真實(shí)驗(yàn)中的藍(lán)方雙機(jī)飛行軌跡進(jìn)行機(jī)動(dòng)動(dòng)作識(shí)別[19]。在藍(lán)方雙機(jī)機(jī)動(dòng)動(dòng)作識(shí)別收斂處對(duì)識(shí)別結(jié)果進(jìn)行取樣,得到藍(lán)方雙機(jī)機(jī)動(dòng)動(dòng)作識(shí)別概率如圖6 所示。
圖6 藍(lán)方雙機(jī)機(jī)動(dòng)動(dòng)作識(shí)別概率Fig.6 Probability of maneuver recognition for dual aircraft in blue side
由識(shí)別結(jié)果可知,在整個(gè)飛行對(duì)抗仿真階段,藍(lán)方1 號(hào)機(jī)依次進(jìn)行左盤旋、右盤旋、水平直線飛行和俯沖機(jī)動(dòng);藍(lán)方2 號(hào)機(jī)依次進(jìn)行右盤旋、左上戰(zhàn)斗轉(zhuǎn)彎、水平直線飛行和躍升機(jī)動(dòng)。
3.2.3 網(wǎng)絡(luò)推理
將圖4 和圖5 提取得到的空間占位信息和目標(biāo)機(jī)動(dòng)動(dòng)作信息輸入識(shí)別網(wǎng)絡(luò)模型,按照2.2 節(jié)模型推理的算法步驟進(jìn)行協(xié)同戰(zhàn)術(shù)識(shí)別。最終得到藍(lán)方雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別概率如圖7 所示,其中紅色線段標(biāo)記出了識(shí)別結(jié)果收斂的部分。為便于觀察被識(shí)別機(jī)動(dòng)動(dòng)作的切換變化過(guò)程,采樣時(shí)間坐標(biāo)軸的單位長(zhǎng)度設(shè)定為1 s(20 個(gè)程序周期),并對(duì)識(shí)別結(jié)果收斂后保持時(shí)間較長(zhǎng)的部分進(jìn)行了省略化表示。
圖7 參數(shù)學(xué)習(xí)后識(shí)別概率分布Fig.7 Probability distribution of recognizing after parameter learning
分析可知,輸入的觀測(cè)節(jié)點(diǎn)狀態(tài)特征改變后,網(wǎng)絡(luò)推理得到的概率分布結(jié)果也迅速隨之改變。在2.80 s 處,模型推理首次達(dá)到收斂狀態(tài),得到水平疏開(kāi)戰(zhàn)術(shù)識(shí)別結(jié)果。之后,網(wǎng)絡(luò)模型根據(jù)證據(jù)信息的變化重新進(jìn)行推理,在82.85 s 處再次收斂,識(shí)別得到組合疏開(kāi)戰(zhàn)術(shù)。同理,在192.75s 和283.30s處,模型收斂,對(duì)應(yīng)的識(shí)別結(jié)果分別為尾后攻擊戰(zhàn)術(shù)和垂直疏開(kāi)戰(zhàn)術(shù)。
此外,推理結(jié)果以各戰(zhàn)術(shù)識(shí)別概率值的形式呈現(xiàn),當(dāng)敵機(jī)編隊(duì)已經(jīng)開(kāi)始執(zhí)行某種戰(zhàn)術(shù),但該戰(zhàn)術(shù)并未執(zhí)行完畢時(shí),識(shí)別算法將具有最大概率的識(shí)別結(jié)果判斷為當(dāng)前時(shí)刻敵機(jī)編隊(duì)采用的協(xié)同戰(zhàn)術(shù)。以組合疏開(kāi)戰(zhàn)術(shù)為例,在80.05 s 時(shí)目標(biāo)雙機(jī)的高度特征提取結(jié)果發(fā)生改變,識(shí)別算法在2.80 s 后模型收斂識(shí)別出該協(xié)同戰(zhàn)術(shù),此時(shí)目標(biāo)雙機(jī)的空間位置與協(xié)同戰(zhàn)術(shù)形態(tài)未發(fā)生明顯改變,依據(jù)主觀經(jīng)驗(yàn)難以判別。綜上分析,基于貝葉斯網(wǎng)絡(luò)的非完備信息下雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法可以在目標(biāo)雙機(jī)切換戰(zhàn)術(shù)特征出現(xiàn)的較短時(shí)間內(nèi)識(shí)別出協(xié)同戰(zhàn)術(shù),具有較好的實(shí)時(shí)性與準(zhǔn)確性。因此,基于貝葉斯網(wǎng)絡(luò)的非完備信息下雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法能夠提前預(yù)判敵機(jī)意圖,具備戰(zhàn)術(shù)預(yù)測(cè)功能,可為己方做出正確決策提供依據(jù)。
3.2.4 實(shí)時(shí)性對(duì)比
在相同實(shí)驗(yàn)條件下,當(dāng)識(shí)別網(wǎng)絡(luò)中的先驗(yàn)概率及狀態(tài)轉(zhuǎn)移概率分布根據(jù)先驗(yàn)知識(shí)確定,即不進(jìn)行參數(shù)學(xué)習(xí)時(shí),具體識(shí)別過(guò)程中的概率分布如圖8 所示。分析可知,未進(jìn)行參數(shù)學(xué)習(xí)時(shí),識(shí)別網(wǎng)絡(luò)模型在3.85s、83.75s、193.70s 和284.25s 處推理完成,網(wǎng)絡(luò)收斂。
圖8 參數(shù)學(xué)習(xí)前識(shí)別概率分布Fig.8 Probability distribution of recognizing before parameter learning
將3.2.3 節(jié)參數(shù)學(xué)習(xí)后的網(wǎng)絡(luò)模型識(shí)別結(jié)果同參數(shù)學(xué)習(xí)前的識(shí)別結(jié)果進(jìn)行對(duì)比,每一種協(xié)同戰(zhàn)術(shù)的具體識(shí)別時(shí)間如圖9 所示。參數(shù)學(xué)習(xí)使得網(wǎng)絡(luò)參數(shù)更加擬合客觀數(shù)據(jù)規(guī)律,因此對(duì)于相同的仿真實(shí)驗(yàn)輸入數(shù)據(jù),識(shí)別結(jié)果的推理時(shí)間縮短。根據(jù)學(xué)習(xí)前后識(shí)別時(shí)間對(duì)比,可以得出學(xué)習(xí)后的平均識(shí)別時(shí)間較之前提高了26.5%。
圖9 協(xié)同戰(zhàn)術(shù)識(shí)別實(shí)時(shí)性對(duì)比Fig.9 Real-time comparison of cooperative tactical recognition
為了驗(yàn)證超視距空戰(zhàn)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法的有效性,開(kāi)展了迎頭態(tài)勢(shì)、側(cè)方態(tài)勢(shì)、尾后態(tài)勢(shì)等不同空戰(zhàn)態(tài)勢(shì)下的仿真實(shí)驗(yàn),并對(duì)不同態(tài)勢(shì)下算法的識(shí)別概率和實(shí)時(shí)性進(jìn)行了分析。
3.3.1 迎頭態(tài)勢(shì)下的藍(lán)方協(xié)同戰(zhàn)術(shù)識(shí)別
迎頭態(tài)勢(shì)下,空戰(zhàn)對(duì)抗中紅藍(lán)雙方的初始空間占位參數(shù)如表10 所示,紅藍(lán)雙方飛行軌跡如圖10 所示。
圖10 迎頭態(tài)勢(shì)下雙方飛行軌跡Fig.10 Flight path of both sides in face-on situation
表10 迎頭態(tài)勢(shì)下空間占位初始參數(shù)設(shè)置Table 10 Initial param eter setting of space occupancy in face-on situation
采用基于貝葉斯網(wǎng)絡(luò)的雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法對(duì)藍(lán)方雙機(jī)進(jìn)行協(xié)同戰(zhàn)術(shù)識(shí)別,得到藍(lán)方雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別概率如圖11 所示。分析可知,識(shí)別網(wǎng)絡(luò)模型在2.65s 和75.50s 處推理完成,網(wǎng)絡(luò)收斂,識(shí)別結(jié)果為對(duì)頭攻擊戰(zhàn)術(shù)與鉗形攻擊戰(zhàn)術(shù)。
圖11 迎頭態(tài)勢(shì)下協(xié)同戰(zhàn)術(shù)識(shí)別概率分布Fig.11 Probability distribution of cooperative tactical identification in face-on situation
3.3.2 側(cè)方態(tài)勢(shì)下的藍(lán)方協(xié)同戰(zhàn)術(shù)識(shí)別
側(cè)方態(tài)勢(shì)下,空戰(zhàn)對(duì)抗中紅藍(lán)雙方的初始空間占位參數(shù)如表11 所示,紅藍(lán)雙方飛行軌跡如圖12所示。
圖12 側(cè)方態(tài)勢(shì)下雙方飛行軌跡Fig.12 Flight trajectory of both sides in lateral situation
表11 側(cè)方態(tài)勢(shì)下空間占位初始參數(shù)設(shè)置Table 11 Initial parameter setting of space occupancy in lateral situation
采用基于貝葉斯網(wǎng)絡(luò)的雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法對(duì)藍(lán)方雙機(jī)進(jìn)行協(xié)同戰(zhàn)術(shù)識(shí)別,得到藍(lán)方雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別概率如圖13 所示。分析可知,識(shí)別網(wǎng)絡(luò)模型在3.25s 和120.05s 處推理完成,網(wǎng)絡(luò)收斂,識(shí)別結(jié)果為側(cè)方攻擊戰(zhàn)術(shù)與垂直疏開(kāi)攻擊戰(zhàn)術(shù)。
圖13 側(cè)方態(tài)勢(shì)下協(xié)同戰(zhàn)術(shù)識(shí)別概率分布Fig.13 Probability distribution of cooperative tactical identification in lateral situation
3.3.3 尾后態(tài)勢(shì)下的藍(lán)方協(xié)同戰(zhàn)術(shù)識(shí)別
尾后態(tài)勢(shì)下,空戰(zhàn)對(duì)抗中紅藍(lán)雙方的初始空間占位參數(shù)如表12 所示,紅藍(lán)雙方飛行軌跡如圖14所示。
圖14 尾后態(tài)勢(shì)下雙方飛行軌跡Fig.14 Flight trajectory of both sides in rear situation
表12 尾后態(tài)勢(shì)下空間占位初始參數(shù)設(shè)置Table 12 Initial param eter setting of space occupancy in rear situation
采用基于貝葉斯網(wǎng)絡(luò)的雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法對(duì)藍(lán)方雙機(jī)進(jìn)行協(xié)同戰(zhàn)術(shù)識(shí)別,得到藍(lán)方雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別概率如圖15 所示。分析可知,識(shí)別網(wǎng)絡(luò)模型在3.75s 和152.65s 處推理完成,網(wǎng)絡(luò)收斂,識(shí)別結(jié)果為組合疏開(kāi)攻擊戰(zhàn)術(shù)與尾后攻擊戰(zhàn)術(shù)。
圖15 尾后態(tài)勢(shì)下協(xié)同戰(zhàn)術(shù)識(shí)別概率分布Fig.15 Probability distribution of cooperative tactical identification in rear situation
從以上實(shí)驗(yàn)結(jié)果的分析可以看出,非完備信息下的超視距空戰(zhàn)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法能夠準(zhǔn)確地識(shí)別迎頭、側(cè)方、尾后態(tài)勢(shì)下的藍(lán)方典型雙機(jī)協(xié)同戰(zhàn)術(shù),并且能夠在協(xié)同戰(zhàn)術(shù)特征出現(xiàn)后快速得到識(shí)別結(jié)果,具有較高的實(shí)時(shí)性。
為了驗(yàn)證雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法對(duì)于非完備信息下雙機(jī)編隊(duì)協(xié)同戰(zhàn)術(shù)識(shí)別的準(zhǔn)確性,開(kāi)展了相同環(huán)境下的實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)分析。合適的高度環(huán)境是保證各協(xié)同戰(zhàn)術(shù)成功執(zhí)行的重要因素,將戰(zhàn)場(chǎng)環(huán)境劃分為高空層、中間層和低空層3 種類型。根據(jù)7 種雙機(jī)協(xié)同戰(zhàn)術(shù)的長(zhǎng)僚機(jī)飛行特性,得到不同飛行高度下的執(zhí)行可行性,每種戰(zhàn)場(chǎng)環(huán)境下的具體可選擇雙機(jī)協(xié)同戰(zhàn)術(shù)如表13 所示。
表13 戰(zhàn)場(chǎng)環(huán)境與戰(zhàn)術(shù)合理性選擇Table 13 Rational selection of battlefield environm ent and tactics
依據(jù)表13 設(shè)定的戰(zhàn)術(shù)選擇規(guī)則,同時(shí)考慮各雙機(jī)協(xié)同戰(zhàn)術(shù)的銜接合理性,根據(jù)飛行過(guò)程中的高度變化,利用構(gòu)建的空戰(zhàn)仿真系統(tǒng)開(kāi)展蒙特卡羅模擬實(shí)驗(yàn)[25-26],對(duì)當(dāng)前戰(zhàn)場(chǎng)中可執(zhí)行的雙機(jī)協(xié)同戰(zhàn)術(shù)進(jìn)行隨機(jī)調(diào)用。在相同實(shí)驗(yàn)樣本與相同實(shí)驗(yàn)環(huán)境下,隨機(jī)設(shè)置缺失數(shù)據(jù)樣本,其數(shù)據(jù)量占總樣本數(shù)據(jù)量的15.8%,使用文獻(xiàn)[9]中基于深度神經(jīng)網(wǎng)絡(luò)的空中目標(biāo)作戰(zhàn)意圖識(shí)別方法與基于貝葉斯網(wǎng)絡(luò)的非完備信息下雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法進(jìn)行8 000 組實(shí)驗(yàn)。采用文獻(xiàn)[9]中基于深度神經(jīng)網(wǎng)絡(luò)的空中目標(biāo)作戰(zhàn)意圖識(shí)別方法構(gòu)建的雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別神經(jīng)網(wǎng)絡(luò)的訓(xùn)練樣本規(guī)模為30000 組典型協(xié)同戰(zhàn)術(shù)樣本數(shù)據(jù),隨機(jī)抽取90%數(shù)據(jù)構(gòu)成訓(xùn)練數(shù)據(jù)庫(kù),剩余10%構(gòu)成測(cè)試數(shù)據(jù)庫(kù),神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)率為0.01,超參數(shù)為0.9、0.999,平滑項(xiàng)10?8,其算法用于上述案例的核心步驟如下:
步驟 1從各類傳感器中提取目標(biāo)特征數(shù)據(jù),包括目標(biāo)飛行速度、目標(biāo)飛行高度、目標(biāo)雷達(dá)狀態(tài)以及目標(biāo)機(jī)動(dòng)類型等信息,并根據(jù)實(shí)際作戰(zhàn)結(jié)果和領(lǐng)域?qū)<遗袛鄬?duì)其標(biāo)記戰(zhàn)術(shù)標(biāo)簽。
步驟 2調(diào)整網(wǎng)絡(luò)結(jié)構(gòu),根據(jù)數(shù)據(jù)維數(shù)和分類數(shù)確定隱藏層數(shù)和節(jié)點(diǎn)數(shù)。
步驟 3將訓(xùn)練數(shù)據(jù)庫(kù)中所有數(shù)據(jù)輸入到構(gòu)建好的深度神經(jīng)網(wǎng)絡(luò)中,采用梯度下降法更新深度神經(jīng)網(wǎng)絡(luò)節(jié)點(diǎn)網(wǎng)絡(luò)權(quán)值,將輸出的戰(zhàn)術(shù)識(shí)別結(jié)果與標(biāo)簽對(duì)比,計(jì)算識(shí)別概率。
步驟 4將驗(yàn)證數(shù)據(jù)庫(kù)中的數(shù)據(jù)輸入到訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)中,計(jì)算識(shí)別概率。
步驟 5將測(cè)試數(shù)據(jù)庫(kù)中的目標(biāo)特征數(shù)據(jù)輸入到訓(xùn)練好的深度神經(jīng)網(wǎng)絡(luò)中,計(jì)算識(shí)別概率,判定模型識(shí)別效果。
步驟 6將待識(shí)別戰(zhàn)術(shù)的目標(biāo)特征數(shù)據(jù)輸入模型,識(shí)別出其協(xié)同戰(zhàn)術(shù)。
通過(guò)實(shí)驗(yàn)得到2 種不同的方法對(duì)表1 中7 種雙機(jī)協(xié)同戰(zhàn)術(shù)的識(shí)別概率如圖16 所示。其中,基于貝葉斯網(wǎng)絡(luò)的非完備信息下雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法的平均識(shí)別概率為98.34%,文獻(xiàn)[9]的平均識(shí)別概率為97.17%??梢园l(fā)現(xiàn),基于貝葉斯網(wǎng)絡(luò)的非完備信息下雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法對(duì)各典型雙機(jī)協(xié)同戰(zhàn)術(shù)均具有較高的識(shí)別概率。
圖16 協(xié)同戰(zhàn)術(shù)識(shí)別概率Fig.16 Recognition accuracy of cooperative tactics
針對(duì)非完備信息下的雙機(jī)協(xié)同空戰(zhàn)戰(zhàn)術(shù)識(shí)別問(wèn)題,做了深入分析與研究,仿真實(shí)驗(yàn)結(jié)果表明,非完備信息下的超視距空戰(zhàn)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法對(duì)敵方雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別概率高、實(shí)時(shí)性好,具備較好的工程應(yīng)用價(jià)值。
1)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法對(duì)非完備信息下的雙機(jī)協(xié)同戰(zhàn)術(shù)具有較高的識(shí)別概率。在實(shí)驗(yàn)測(cè)試中,對(duì)協(xié)同戰(zhàn)術(shù)的識(shí)別概率均達(dá)到95%以上。
2)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別網(wǎng)絡(luò)模型通過(guò)參數(shù)學(xué)習(xí)后,在典型協(xié)同戰(zhàn)術(shù)仿真實(shí)驗(yàn)中使平均識(shí)別速率提高了26.5%,可在較短的時(shí)間內(nèi)識(shí)別出協(xié)同戰(zhàn)術(shù),具有較好的實(shí)時(shí)性。
3)雙機(jī)協(xié)同戰(zhàn)術(shù)識(shí)別方法以戰(zhàn)場(chǎng)中可以直接在線獲取到的信息為推理依據(jù),具備戰(zhàn)術(shù)預(yù)測(cè)功能,在空戰(zhàn)決策領(lǐng)域中可為威脅評(píng)估和目標(biāo)作戰(zhàn)意圖推理提供支撐。