張 健,李 強(qiáng)
(中北大學(xué) 機(jī)電工程學(xué)院, 太原 030051)
隨著高新技術(shù)的日益發(fā)展,當(dāng)今戰(zhàn)爭(zhēng)已經(jīng)進(jìn)入了大數(shù)據(jù)時(shí)代,戰(zhàn)場(chǎng)態(tài)勢(shì)中隱藏著多種不確定信息和復(fù)雜因素,大規(guī)模電子偵察手段的應(yīng)用提高了武器系統(tǒng)對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)的感知能力,但同時(shí)造成了戰(zhàn)場(chǎng)態(tài)勢(shì)大數(shù)據(jù)難以有效處理的問(wèn)題[1-2]。面對(duì)復(fù)雜多變的戰(zhàn)場(chǎng)態(tài)勢(shì),提高武器系統(tǒng)的快速反應(yīng)能力以及復(fù)雜數(shù)據(jù)處理能力已經(jīng)成為了未來(lái)無(wú)人裝備發(fā)展的重要方向[3-4]。目前,國(guó)外無(wú)人平臺(tái)上智能武器站已經(jīng)初現(xiàn)雛形,國(guó)內(nèi)雖然開展了相關(guān)研究工作,但至今沒(méi)有成型產(chǎn)品列裝部隊(duì)。因此,開展面向復(fù)雜戰(zhàn)場(chǎng)態(tài)勢(shì)與多種不確定因素的武器系統(tǒng)作戰(zhàn)決策技術(shù)研究,不僅對(duì)分析當(dāng)前戰(zhàn)場(chǎng)態(tài)勢(shì)有益,還對(duì)今后提高武器系統(tǒng)自主作戰(zhàn)能力以及智能化水平具有重要意義[5]。
目前,使用防空武器站作戰(zhàn)大多依賴指揮員根據(jù)作戰(zhàn)經(jīng)驗(yàn)進(jìn)行武器決策,其智能化水平不足,過(guò)度依賴人工經(jīng)驗(yàn),缺乏對(duì)數(shù)據(jù)的深度挖掘,面對(duì)大樣本數(shù)據(jù)無(wú)法有效處理。而深度神經(jīng)網(wǎng)絡(luò)模型則具有非線性處理能力和自學(xué)能力,可以充分逼近任意復(fù)雜的非線性關(guān)系,為突破復(fù)雜戰(zhàn)場(chǎng)形勢(shì),實(shí)現(xiàn)武器站智能化決策創(chuàng)造了寶貴的契機(jī)。深度神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的權(quán)值與偏置是從數(shù)據(jù)集中學(xué)習(xí)獲得的,軍事指揮員和專家的決策研究也能夠應(yīng)用于樣本的標(biāo)簽中,并完全嵌入神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)中。
針對(duì)上述問(wèn)題,提出了一種基于全連接殘差網(wǎng)絡(luò)的武器站自主決策方法。深入研究了彈炮結(jié)合武器站的特點(diǎn)及影響武器站決策的主要因素,分析了全連接網(wǎng)絡(luò)、丟棄層、殘差網(wǎng)絡(luò)的結(jié)構(gòu),以全連接神經(jīng)網(wǎng)絡(luò)為基礎(chǔ),結(jié)合批量歸一化算法加快了網(wǎng)絡(luò)的收斂速度,加入丟棄層增強(qiáng)了模型的泛化能力,避免了過(guò)擬合的出現(xiàn),運(yùn)用殘差網(wǎng)絡(luò)結(jié)構(gòu)提高了模型的自學(xué)能力,構(gòu)建了基于全連接殘差網(wǎng)絡(luò)的武器站決策模型。最后,利用深度學(xué)習(xí)框架Tensorflow驗(yàn)證了該方法的可行性。
全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示,由輸入層、隱藏層和輸出層組成。上一層的輸出即為下一層的輸入。
(1)
式(1)中括號(hào)內(nèi)部分表示了不同層之間的線性關(guān)系,激活函數(shù)f又為2層之間添加了非線性關(guān)系,在網(wǎng)絡(luò)訓(xùn)練過(guò)程中,層與層之間的參數(shù)不斷調(diào)整,進(jìn)而實(shí)現(xiàn)從數(shù)據(jù)中學(xué)習(xí)樣本的非線性分布[6]。
圖1 全連接神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
對(duì)于包含很多隱藏層的復(fù)雜網(wǎng)絡(luò),梯度下降會(huì)導(dǎo)致所有參數(shù)不斷發(fā)生變化,所以每個(gè)隱藏層都會(huì)面臨協(xié)變量移位(Covariate Shift)的問(wèn)題:神經(jīng)元參數(shù)的變化導(dǎo)致輸出的不穩(wěn)定[7]。為解決這一問(wèn)題,模型訓(xùn)練中可以將數(shù)據(jù)批量標(biāo)準(zhǔn)化然后再訓(xùn)練,批量標(biāo)準(zhǔn)化算法就是對(duì)每一層的輸入進(jìn)行歸一化操作,使其輸入形成均值為0、方差為1的正態(tài)分布。但是,在加快模型收斂速度的同時(shí),該算法也會(huì)衰減網(wǎng)絡(luò)的表達(dá)能力,所以加入了式(3),給每個(gè)神經(jīng)元加入2個(gè)參數(shù)γ(k)和β(k),在模型訓(xùn)練的同時(shí),這2個(gè)參數(shù)也在不斷調(diào)整,以此來(lái)提高網(wǎng)絡(luò)的表達(dá)能力。批量標(biāo)準(zhǔn)化算法加快了模型的收斂速度,可以以較大的學(xué)習(xí)率開始模型訓(xùn)練,簡(jiǎn)化了調(diào)參過(guò)程[8-10]。
(2)
(3)
在神經(jīng)網(wǎng)絡(luò)訓(xùn)練中,如果參數(shù)過(guò)多,而訓(xùn)練樣本又太少,模型很容易發(fā)生過(guò)擬合現(xiàn)象。過(guò)擬合具體表現(xiàn)在:模型在訓(xùn)練數(shù)據(jù)上損失函數(shù)較小,預(yù)測(cè)準(zhǔn)確率較高;而在測(cè)試數(shù)據(jù)上損失函數(shù)較大,預(yù)測(cè)準(zhǔn)確率較低。丟棄層原理如圖2所示,在前向傳播過(guò)程中,讓某個(gè)神經(jīng)元以一定的概率P(伯努利分布)停止工作,使模型的泛化性更強(qiáng),不過(guò)分依賴某些局部特征,緩解過(guò)擬合的發(fā)生,可以達(dá)到正則化效果[11]。
圖2 丟棄層原理
深度學(xué)習(xí)實(shí)質(zhì)上是通過(guò)多層神經(jīng)網(wǎng)絡(luò)的非線性層堆疊,無(wú)限接近需要擬合的映射關(guān)系F(x),但直接擬合很困難,當(dāng)網(wǎng)絡(luò)不斷疊加的同時(shí),超深層網(wǎng)絡(luò)可能發(fā)生梯度消失甚至梯度爆炸的問(wèn)題,網(wǎng)絡(luò)難以繼續(xù)優(yōu)化,甚至發(fā)生退化。殘差網(wǎng)絡(luò)是一種跳躍結(jié)構(gòu),先學(xué)習(xí)殘差H(x),再計(jì)算F(x)=H(x)+x,普通網(wǎng)絡(luò)結(jié)構(gòu)和殘差網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。殘差網(wǎng)絡(luò)避免了梯度消失和梯度爆炸的問(wèn)題,可以提升模型的學(xué)習(xí)能力[12-15]。
圖3 普通網(wǎng)絡(luò)結(jié)構(gòu)和殘差網(wǎng)絡(luò)結(jié)構(gòu)
武器站決策模型的構(gòu)建包括輸入特征的選擇以及網(wǎng)絡(luò)模型的構(gòu)建。假設(shè)一彈炮結(jié)合防空武器站裝備有30 mm高射炮以及小型防空導(dǎo)彈,依次將其量化為0、1,其射程分別為5、15 km,最大作戰(zhàn)高度分別為3、10 km。針對(duì)該武器站進(jìn)行決策模型構(gòu)建。
彈炮結(jié)合武器站是將分置的導(dǎo)彈和高炮2種火力有機(jī)地集成在一套平臺(tái)上,實(shí)現(xiàn)目標(biāo)探測(cè)、跟蹤、指揮和控制系統(tǒng)的資源共享,是近程、低空、超低空防御的有效武器,具有防御空域廣、毀傷概率高、獨(dú)立作戰(zhàn)、快速機(jī)動(dòng)能力強(qiáng)等特點(diǎn)[16]。
1) 作戰(zhàn)空域大,可實(shí)施多次攔截。一般來(lái)說(shuō),導(dǎo)彈的最大作戰(zhàn)距離比高炮遠(yuǎn)。當(dāng)目標(biāo)距離較遠(yuǎn)時(shí),首先使用導(dǎo)彈進(jìn)行攔截;當(dāng)目標(biāo)距離臨近進(jìn)入高炮作戰(zhàn)空域時(shí),還可用高炮進(jìn)行攻擊。實(shí)施多次火力攔截,有助于提高全空域殺傷概率;對(duì)不具備全向攻擊的紅外尋的導(dǎo)彈來(lái)說(shuō),由于有高炮的配合,彌補(bǔ)了攻擊空域的盲區(qū),提高了武器的總體作戰(zhàn)效能。
2) 高炮和導(dǎo)彈取長(zhǎng)補(bǔ)短,提高作戰(zhàn)效果。高炮射擊準(zhǔn)備時(shí)間短、反應(yīng)快、彈丸初速大、射速高、能連續(xù)射擊,臨界殺傷概率高,其缺點(diǎn)是射程近、殺傷概率隨射程增加而下降;而防空導(dǎo)彈射程遠(yuǎn),單發(fā)命中概率高,殺傷概率隨射程變化小。其缺點(diǎn)是臨界死區(qū)大、系統(tǒng)較復(fù)雜、成本高、反應(yīng)時(shí)間通常比高炮長(zhǎng)。因此彈炮結(jié)合可以取長(zhǎng)補(bǔ)短,充分發(fā)揮各自的優(yōu)勢(shì)。
3) 導(dǎo)彈與多型高炮彈藥相互配合,能抗擊多種目標(biāo)。能夠適應(yīng)未來(lái)戰(zhàn)爭(zhēng)中空襲兵器多樣化和作戰(zhàn)任務(wù)多元化的需求。例如:在掩護(hù)機(jī)械化部隊(duì)時(shí),因防空導(dǎo)彈擴(kuò)大了防空區(qū)域,能夠有效抗擊固定翼飛機(jī)和武裝直升機(jī);高炮配備的多束定向預(yù)制破片彈可有效抗擊巡航導(dǎo)彈和無(wú)人機(jī)等小目標(biāo);多用途榴彈對(duì)武裝直升機(jī)有很好的作戰(zhàn)效能;在攔截戰(zhàn)術(shù)無(wú)人機(jī)等低成本的空中小目標(biāo),使用高炮作戰(zhàn)有更好的效費(fèi)比。
4) 機(jī)動(dòng)性能好,對(duì)陣地要求低。由于現(xiàn)代防空作戰(zhàn)縱深大、范圍廣、突然性強(qiáng),沒(méi)有明顯的前后方界限,被掩護(hù)目標(biāo)多、戰(zhàn)場(chǎng)節(jié)奏加快、流動(dòng)性增大、任務(wù)變換頻繁,因此,以機(jī)動(dòng)求生存、求主動(dòng)、求戰(zhàn)機(jī)的“動(dòng)態(tài)防空”將是今后陸軍防空作戰(zhàn)的必然選擇,符合我軍機(jī)械化、信息化復(fù)合發(fā)展方向,適應(yīng)未來(lái)陸軍由“區(qū)域防衛(wèi)型”向“全域機(jī)動(dòng)型”轉(zhuǎn)變的發(fā)展要求。
5) 作戰(zhàn)指揮與后勤保障相對(duì)容易。未來(lái)防空作戰(zhàn)既需要導(dǎo)彈,也需要高炮。彈炮結(jié)合武器站內(nèi)置程序自動(dòng)選擇使用導(dǎo)彈或高炮作戰(zhàn),其作戰(zhàn)準(zhǔn)備、指揮和操作簡(jiǎn)潔;與導(dǎo)彈部隊(duì)和高炮部隊(duì)混編相比,獨(dú)立作戰(zhàn)能力更強(qiáng),后勤保障方便。
6) 導(dǎo)彈和高炮公用平臺(tái)資源,作戰(zhàn)使用效益高。一般來(lái)說(shuō),彈炮結(jié)合武器站的導(dǎo)彈和高炮的共用設(shè)備的成本約占總費(fèi)用的80%以上。其對(duì)空探測(cè)設(shè)備既適用于防空導(dǎo)彈攻擊距離較遠(yuǎn)、雷達(dá)反射截面(RCS)較大的空襲兵器平臺(tái),也適用于高炮攔截距離較近、RCS較小的空襲小目標(biāo),因此使用效益高。
武器決策是在明確打擊目標(biāo)后,作戰(zhàn)人員根據(jù)長(zhǎng)期戰(zhàn)場(chǎng)經(jīng)驗(yàn),對(duì)應(yīng)使用何種武器做出決策。武器的選用是指揮員長(zhǎng)期的戰(zhàn)場(chǎng)經(jīng)驗(yàn)總結(jié),其影響因素通??紤]為作戰(zhàn)任務(wù)、目標(biāo)特性、天氣條件、打擊費(fèi)用等。考慮指揮員在決策時(shí)所關(guān)注的主要因素,對(duì)于彈炮結(jié)合防空武器站,其作戰(zhàn)任務(wù)為低空防御,而使用高炮進(jìn)行一次點(diǎn)射以及使用小型防空導(dǎo)彈進(jìn)行一次攻擊的打擊費(fèi)用是確定的,不作為變量輸入。因此將目標(biāo)特征與天氣條件作為影響武器作戰(zhàn)效能的主要因素,選取以下6個(gè)特征,由武器站的觀瞄探測(cè)單元(雷達(dá)、電視圖像、紅外圖像、激光測(cè)距等)及環(huán)境感知器件獲得各影響因素的特征值[17-18]。
1) 目標(biāo)距離。目標(biāo)距離反應(yīng)了目標(biāo)的威脅程度,需要與不同武器的射程進(jìn)行比較,基本可以確定是否使用該武器進(jìn)行打擊。當(dāng)目標(biāo)距離超越高炮射程時(shí),此時(shí)武器站使用防空導(dǎo)彈進(jìn)行攻擊。
2) 目標(biāo)高度。目標(biāo)高度越高,攻擊難度越大。目標(biāo)高度需要與武器作戰(zhàn)高度進(jìn)行對(duì)比,當(dāng)目標(biāo)高度超越高炮作戰(zhàn)高度時(shí),此時(shí)武器站使用防空導(dǎo)彈進(jìn)行攻擊。
3) 目標(biāo)速度。目標(biāo)速度越快意味著到達(dá)我方的時(shí)間越短,同時(shí)會(huì)提升武器攻擊難度。當(dāng)目標(biāo)速度較慢時(shí),高炮可以對(duì)目標(biāo)實(shí)現(xiàn)跟蹤,此時(shí)使用高炮進(jìn)行攻擊。而當(dāng)目標(biāo)速度過(guò)快,進(jìn)入火炮跟蹤死界,則必須使用導(dǎo)彈進(jìn)行攻擊。將該指標(biāo)按照較慢、慢、快、較快依次量化為2、4、6、8。
4) 目標(biāo)類型。目標(biāo)類型是目標(biāo)的整體特征,體現(xiàn)了目標(biāo)的價(jià)值、防護(hù)程度、機(jī)動(dòng)性,可作為數(shù)武器決策的關(guān)鍵參數(shù)。當(dāng)目標(biāo)為固定翼飛機(jī)等大型目標(biāo)時(shí),防空導(dǎo)彈可以有效抗擊;而高炮發(fā)射預(yù)制破片彈可有效抗擊巡航導(dǎo)彈和無(wú)人機(jī)等小目標(biāo);不同目標(biāo)配置不同武器,以最大化武器站作戰(zhàn)效費(fèi)比。將目標(biāo)類型按照無(wú)人機(jī)、小型目標(biāo)(導(dǎo)彈等)、中型目標(biāo)(戰(zhàn)斗機(jī)等)、大型目標(biāo)(運(yùn)輸機(jī)等)依次量化為2、4、6、8。
5) 目標(biāo)防護(hù)能力。目標(biāo)的防護(hù)程度越高,武器攻擊效果越差,應(yīng)選擇殺傷能力更強(qiáng)的武器實(shí)施打擊。將按照無(wú)防護(hù)、輕型裝甲防護(hù)、中型裝甲防護(hù)、重型裝甲防護(hù)將目標(biāo)防護(hù)能力依次量化為2、4、6、8。
6) 天氣條件。天氣條件是作戰(zhàn)環(huán)境中的一項(xiàng)動(dòng)態(tài)變化因素,會(huì)直接或間接影響武器裝備的性能。在夜間射擊或白天能見度不高時(shí)高炮等直瞄武器的命中精度必然下降,而對(duì)于導(dǎo)彈,即使可以使用紅外引導(dǎo),其作用效果也會(huì)顯著下降。因此天氣條件也是影響武器決策的一項(xiàng)關(guān)鍵因素。將天氣條件按照天氣狀況良好、天氣狀況惡劣依次量化為0、1。
針對(duì)上述影響因素,結(jié)合專家及指揮員經(jīng)驗(yàn)得到訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù),最終選取了100組數(shù)據(jù),其中70組數(shù)據(jù)作為訓(xùn)練樣本,30組數(shù)據(jù)作為測(cè)試樣本,部分樣本數(shù)據(jù)如表1所示。
表1 部分樣本數(shù)據(jù)
續(xù)表(表1)
本文中提出的全連接殘差網(wǎng)絡(luò)模型融合了批量歸一化算法、丟棄層和殘差網(wǎng)絡(luò)模塊。其核心思想為:將樣本數(shù)據(jù)信息映射到多維空間中,通過(guò)優(yōu)化器(Adam)訓(xùn)練網(wǎng)絡(luò)確定參數(shù),由所有參數(shù)共同擬合出數(shù)據(jù)的非線性分布規(guī)律。全連接網(wǎng)絡(luò)作為基礎(chǔ)結(jié)構(gòu),將樣本數(shù)據(jù)空間映射到樣本標(biāo)簽空間,在整個(gè)模型中發(fā)揮著分類器的作用,丟棄層(神經(jīng)元以20%的概率隨機(jī)失活)可以有效防止過(guò)擬合的發(fā)生,提高了模型的泛化能力,批量標(biāo)準(zhǔn)化算法提高了模型的收斂速度,而殘差網(wǎng)絡(luò)可以在全連接層趨于飽和時(shí),進(jìn)一步提升模型性能,避免了網(wǎng)絡(luò)退化的問(wèn)題。網(wǎng)絡(luò)模型結(jié)構(gòu)如表2所示,網(wǎng)絡(luò)模型共有8個(gè)全連接層,4個(gè)殘差模塊,6個(gè)丟棄層,使用批量標(biāo)準(zhǔn)化優(yōu)化算法處理所有全連接層的輸出。
將影響武器站決策的6個(gè)關(guān)鍵因素作為模型的輸入,經(jīng)過(guò)模型處理,輸出使用相應(yīng)武器的概率預(yù)測(cè)。由于ReLu激活函數(shù)計(jì)算簡(jiǎn)便,在模型優(yōu)化時(shí)更有效,可避免梯度消失和梯度爆炸等問(wèn)題,因此,使用ReLU激活函數(shù)作為全連接層的激活函數(shù)(不含輸出層)。輸出層通過(guò)激活函數(shù)Softmax(指數(shù)函數(shù)),將模型的輸出對(duì)應(yīng)相應(yīng)武器的使用概率,更直觀的顯示武器決策結(jié)果。將模型的輸出和樣本標(biāo)簽的交叉熵作為損失函數(shù),如式(4)所示,訓(xùn)練過(guò)程中以最小化損失函數(shù)為目標(biāo)運(yùn)用反向傳播算法計(jì)算梯度[19],通過(guò)反復(fù)調(diào)整各個(gè)神經(jīng)元處參數(shù),實(shí)現(xiàn)模型優(yōu)化。武器站決策模型算法流程如圖4所示,基于武器站決策數(shù)據(jù),在模型訓(xùn)練和測(cè)試中,通過(guò)分析模型精度判斷網(wǎng)絡(luò)的性能,對(duì)與網(wǎng)絡(luò)相關(guān)的超參數(shù)進(jìn)行完善。
(4)
圖4 武器站決策模型算法流程框圖
使用Anaconda3編譯器,利用深度學(xué)習(xí)框架Tensorflow 2.10 GPU版進(jìn)行模型驗(yàn)證與仿真,將數(shù)據(jù)隨機(jī)分配為訓(xùn)練樣本和測(cè)試樣本,訓(xùn)練樣本共有70組,測(cè)試樣本共有30組。將一批次數(shù)據(jù)(Batch size)設(shè)置為10組進(jìn)行模型訓(xùn)練,每次訓(xùn)練將相應(yīng)的準(zhǔn)確率和損失率記錄下來(lái),表3為部分測(cè)試結(jié)果。
表3 部分測(cè)試數(shù)據(jù)
模型訓(xùn)練完成后得出訓(xùn)練結(jié)果,圖5、圖6展示了訓(xùn)練樣本為70組時(shí),模型訓(xùn)練的準(zhǔn)確率和損失的變化情況,圖7、圖8展示了以70組數(shù)據(jù)為訓(xùn)練樣本時(shí)模型測(cè)試的準(zhǔn)確率和損失變化情況??梢?當(dāng)訓(xùn)練樣本為70組時(shí),模型可以達(dá)到很高的準(zhǔn)確率,且損失相對(duì)較少,表明了模型所擬合出的非線性規(guī)律與數(shù)據(jù)樣本之間的規(guī)律非常近似。
圖5 訓(xùn)練過(guò)程準(zhǔn)確率變化(70組樣本)
圖6 訓(xùn)練過(guò)程損失變化(70組樣本)
圖7 測(cè)試過(guò)程準(zhǔn)確率變化(70組樣本)
圖8 測(cè)試過(guò)程損失變化(70組樣本)
減少訓(xùn)練樣本,分別使用30組、50組數(shù)據(jù)訓(xùn)練模型。訓(xùn)練準(zhǔn)確率和損失變化情況如圖9—圖12所示,當(dāng)模型訓(xùn)練樣本為小數(shù)據(jù)集時(shí),訓(xùn)練初期的準(zhǔn)確率和損失率波動(dòng)很大,說(shuō)明了模型的收斂速度非常快。圖13、圖14表示了訓(xùn)練樣本為30組、50組、70組3種訓(xùn)練條件下的模型在同一測(cè)試集上的準(zhǔn)確率和損失變化情況的對(duì)比結(jié)果,經(jīng)計(jì)算,3種不同訓(xùn)練條件下的模型測(cè)試平均準(zhǔn)確率分別為89.51%、91.82%、92.28%。當(dāng)模型訓(xùn)練樣本只有30組時(shí),模型的測(cè)試平均準(zhǔn)確率仍高達(dá)89.51%。
圖9 訓(xùn)練過(guò)程準(zhǔn)確率變化(50組樣本)
圖10 訓(xùn)練過(guò)程損失變化(50組樣本)
圖11 訓(xùn)練過(guò)程準(zhǔn)確率變化(30組樣本)
圖12 訓(xùn)練過(guò)程損失變化(30組樣本)
圖13 測(cè)試過(guò)程準(zhǔn)確率變化對(duì)比
圖14 測(cè)試過(guò)程損失變化對(duì)比
由表3的測(cè)試數(shù)據(jù)可得,目標(biāo)1類型為無(wú)人機(jī),其速度較慢,防護(hù)等級(jí)較低,距離與高度均在高炮作戰(zhàn)范圍內(nèi),在天氣條件良好時(shí),使用高炮作戰(zhàn)效能最大;目標(biāo)2類型為大型目標(biāo)(運(yùn)輸機(jī)等),其速度較快,防護(hù)等級(jí)較高,且距離與高度均超出了高炮作戰(zhàn)范圍,在天氣條件較差時(shí),使用導(dǎo)彈進(jìn)行攻擊作戰(zhàn)效能最大;目標(biāo)3類型為小型目標(biāo)(導(dǎo)彈等),其速度較快,防護(hù)等級(jí)較低,且距離與高度均在高炮作戰(zhàn)范圍內(nèi),在天氣狀況良好時(shí),應(yīng)當(dāng)使用高炮武器使得作戰(zhàn)效能最大化。而模型所給出的武器決策結(jié)果依次為高炮、導(dǎo)彈、高炮,符合真實(shí)作戰(zhàn)邏輯。使用模型進(jìn)行1 000次決策并計(jì)算其平均決策時(shí)間為0.022 8 s,對(duì)于300 m/s的目標(biāo)來(lái)說(shuō),在一次決策時(shí)間內(nèi)所飛行的距離為6.84 m,對(duì)于整個(gè)防空作戰(zhàn)大背景來(lái)說(shuō),基本可以忽略不記。
仿真結(jié)果表明:本文中所提出的模型具備非??斓氖諗克俣?證明了其具有很強(qiáng)的自學(xué)能力,可以迅速?gòu)母黝愐?guī)模的數(shù)據(jù)中擬合出非線性規(guī)律,同時(shí)在測(cè)試集上的精度表明該模型避免了過(guò)擬合的發(fā)生。而隨著訓(xùn)練樣本的增加,模型在測(cè)試集上的精度逐步增高,說(shuō)明模型面對(duì)大樣本態(tài)勢(shì)數(shù)據(jù)依然具備良好的處理能力。武器決策結(jié)果說(shuō)明模型的決策符合真實(shí)作戰(zhàn)邏輯,同時(shí)決策時(shí)間也滿足實(shí)時(shí)性要求。
本文中分析了全連接神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)以及批量標(biāo)準(zhǔn)化算法、丟棄層、殘差網(wǎng)絡(luò)3種優(yōu)化算法的原理,總結(jié)了彈炮結(jié)合武器站作戰(zhàn)特點(diǎn)以及影響武器站決策的主要因素,構(gòu)建了全連接殘差網(wǎng)絡(luò)武器站決策模型,得出以下結(jié)論:
1) 本文中所提出的全連接殘差網(wǎng)絡(luò)模型具備快速收斂能力以及很強(qiáng)的自學(xué)能力;模型具備對(duì)數(shù)據(jù)的深入挖掘和處理能力,面對(duì)大樣本數(shù)據(jù)依然可以有效處理;其決策結(jié)果符合真實(shí)作戰(zhàn)邏輯并滿足實(shí)時(shí)性要求。為武器站自主決策提供了新的方法。
2) 本文中的方法只適用于彈炮結(jié)合防空武器站決策,輸入特征只考慮了目標(biāo)特性、天氣狀況的變化對(duì)武器作戰(zhàn)效能的影響,具有一定的局限性。真實(shí)作戰(zhàn)環(huán)境更加復(fù)雜多變,需要進(jìn)一步分析戰(zhàn)場(chǎng)態(tài)勢(shì),增加輸入特征,擴(kuò)展數(shù)據(jù)庫(kù),增強(qiáng)模型對(duì)復(fù)雜戰(zhàn)場(chǎng)環(huán)境的適用性。
3) 武器站自主決策是武器站邁向智能化的重要一步,其面臨諸多困難,例如敵方來(lái)襲目標(biāo)作戰(zhàn)意圖和行為的不確定性;環(huán)境感知技術(shù)的不足;目標(biāo)檢測(cè)、跟蹤識(shí)別技術(shù)不完善性;抗干擾信息傳輸技術(shù)的不足等,自主決策不僅是技術(shù)層面的問(wèn)題,更是軍事思想,戰(zhàn)略戰(zhàn)術(shù)等更深層次的問(wèn)題,而實(shí)現(xiàn)自主決策需要從基礎(chǔ)開始研究,從靜默期開始探索,這是一個(gè)艱巨的系統(tǒng)工程,需要作出不懈努力。