基于智能對抗進(jìn)化的聯(lián)合火力打擊任務(wù)規(guī)劃方法

2019-08-06 01:49:58劉昊張策丁文韜

兵工學(xué)報 2019年6期

劉昊，張策，丁文韜

(1.國防大學(xué) 聯(lián)合作戰(zhàn)學(xué)院, 河北石家莊 050000; 2.國防大學(xué) 研究生院, 北京 100091)

0 引言

聯(lián)合火力打擊任務(wù)規(guī)劃是根據(jù)聯(lián)合火力打擊任務(wù)等約束條件，運(yùn)用輔助決策工具對聯(lián)合火力打擊行動進(jìn)行籌劃計算，包括計算兵力彈藥滿意度、輔助制定聯(lián)合火力打擊計劃、評估火力打擊效果等[1]。其核心問題是解決聯(lián)合作戰(zhàn)中的動態(tài)火力分配問題，即根據(jù)戰(zhàn)場態(tài)勢和敵我動態(tài)博弈情況實(shí)時生成目標(biāo)打擊清單，動態(tài)分配火力打擊力量和打擊目標(biāo)，以實(shí)現(xiàn)聯(lián)合火力打擊效能的最大化[2]。其難點(diǎn)在于火力打擊任務(wù)規(guī)劃不僅計算我方火力分配的效能最大化，還必須考慮敵方火力打擊對我方造成的影響，這是因為敵我初始火力分配的微小差別將導(dǎo)致最終打擊效果的千差萬別，極大地增加任務(wù)分配推演計算和算法實(shí)現(xiàn)的復(fù)雜度。

國內(nèi)外研究人員已經(jīng)針對任務(wù)規(guī)劃問題探索了多種解決方法，其中：特征評估法[3-5]通過算法公式計算影響戰(zhàn)果的評估指標(biāo)，效率高但推廣性差；改進(jìn)遺傳算法[6-9]利用生物進(jìn)化思想尋找當(dāng)前狀態(tài)下的全局最優(yōu)解，構(gòu)造簡單但環(huán)境依賴性大；動態(tài)博弈法[10-13]通過博弈論形成敵我雙方之間的納什均衡，動態(tài)適應(yīng)性強(qiáng)但計算復(fù)雜性劇增；神經(jīng)網(wǎng)絡(luò)法[14-16]模擬智能體的自學(xué)習(xí)能力，依靠經(jīng)驗解決問題，理論完美但訓(xùn)練數(shù)據(jù)來源受限。上述方法存在的普遍問題是：關(guān)注靜態(tài)條件下對我方火力打擊效能的評估，未考慮將敵我雙方納入網(wǎng)絡(luò)體系實(shí)施對抗推演，使火力打擊計劃片面化、簡單化；關(guān)注評估指標(biāo)的理論計算，未考慮對抗推演中的有效性檢驗，使火力打擊計劃偏離戰(zhàn)場實(shí)際；關(guān)注當(dāng)前態(tài)勢下的最優(yōu)分配結(jié)果，未考慮敵我雙方態(tài)勢變化的可能性，使火力打擊計劃更脆弱。

本文在總結(jié)前人方法的基礎(chǔ)上，借鑒自然界物種間的對抗進(jìn)化機(jī)理，在遺傳算法基礎(chǔ)上設(shè)計對抗進(jìn)化算法，實(shí)現(xiàn)敵我雙方任務(wù)規(guī)劃的無上限對抗進(jìn)化，產(chǎn)生出在當(dāng)前態(tài)勢及未來可能態(tài)勢下解決任務(wù)規(guī)劃問題的最優(yōu)個體，并通過仿真實(shí)驗驗證了該方法產(chǎn)生的最優(yōu)個體自我學(xué)習(xí)能力以及在解決聯(lián)合火力打擊任務(wù)規(guī)劃問題上的智能性。

1 問題描述

(1)

(2)

(3)

(4)

(5)

(6)

(7)

(8)

并保證我方彈藥消耗比例do約束條件如下：

(9)

(10)

問題的難點(diǎn)在于：1)各節(jié)點(diǎn)的發(fā)現(xiàn)概率決定了目標(biāo)打擊清單，目標(biāo)打擊清單決定了各波次打擊任務(wù)的火力分配結(jié)果，火力分配差異影響最終評估結(jié)果，如何從不確定的發(fā)現(xiàn)概率中找到確定性的最優(yōu)化火力分配，是任務(wù)規(guī)劃問題的難點(diǎn)[17]；2)敵我雙方均在尋找最優(yōu)化評估結(jié)果，且雙方火力分配的微小調(diào)整均對各自最終評估結(jié)果產(chǎn)生重要影響，如何實(shí)現(xiàn)敵我雙方的對抗推演評估也是算法難點(diǎn)。本文試圖構(gòu)造敵我雙方多波次的火力打擊對抗評估模型，通過對抗推演統(tǒng)計敵我雙方的評估函數(shù)分值，以此判斷勝負(fù)結(jié)果并找到最佳火力分配方法。

2 算法構(gòu)建

針對聯(lián)合火力打擊動態(tài)分配問題難點(diǎn)，智能對抗進(jìn)化算法設(shè)計目標(biāo)包括：1)實(shí)現(xiàn)由不確定的發(fā)現(xiàn)概率得到確定性的評估結(jié)果；2)建立敵我雙方互為評估條件的對抗評估機(jī)制。智能對抗進(jìn)化算法以遺傳算法為基礎(chǔ)，引入雙種群對抗評估機(jī)制，在設(shè)置初始個體的基礎(chǔ)上實(shí)現(xiàn)敵我雙方種群間的對抗進(jìn)化，在眾多代繁衍后產(chǎn)生能夠解決聯(lián)合火力打擊任務(wù)規(guī)劃問題的最優(yōu)個體。算法流程圖如圖1所示。

圖1 智能對抗進(jìn)化算法流程圖Fig.1 Flow chart of intelligent confrontation evolution algorithm

2.1 生成敵我超網(wǎng)絡(luò)

超網(wǎng)絡(luò)概念是美國科學(xué)家Sheffi[18]在處理交織網(wǎng)絡(luò)時提出的，特指高于而又超于現(xiàn)存網(wǎng)絡(luò)的網(wǎng)絡(luò)，體現(xiàn)出超越一般網(wǎng)絡(luò)的復(fù)雜性和涌現(xiàn)性。為了確定敵我火力分配任務(wù)的打擊排序，本文將敵我雙方節(jié)點(diǎn)區(qū)分為觀察單元、判斷決策單元、信息傳輸單元、行動單元、其他單元5類；按照各目標(biāo)的信息通聯(lián)屬性，構(gòu)建出偵察情報網(wǎng)、指揮控制網(wǎng)、信息傳輸網(wǎng)、火力打擊網(wǎng)，并在各子網(wǎng)基礎(chǔ)上構(gòu)建作戰(zhàn)超網(wǎng)絡(luò)。圖2為以敵方戰(zhàn)場態(tài)勢信息構(gòu)建的超網(wǎng)絡(luò)示例。

2.2 生成敵我雙種群

本文中的個體特指具備一定智能程度的任務(wù)規(guī)劃對象，即給定當(dāng)前狀態(tài)的目標(biāo)打擊清單，能夠唯一地輸出聯(lián)合火力打擊任務(wù)規(guī)劃的智能體。對于一個固定的目標(biāo)打擊清單，個體必能產(chǎn)生唯一對應(yīng)的火力打擊任務(wù)分配表。本文對DNA定義為：由隨機(jī)整數(shù)組成的二維動態(tài)數(shù)組，整數(shù)值、組內(nèi)個數(shù)均不固定，用以模擬生物DNA隨機(jī)變異、由簡單向復(fù)雜進(jìn)化的自然特性。個體數(shù)據(jù)結(jié)構(gòu)如表1所示(敵我雙方雙種群內(nèi)的個體結(jié)構(gòu)相同)。

圖2 敵方作戰(zhàn)超網(wǎng)絡(luò)示例Fig.2 Example of a friend-foe operation super-network

表1 個體數(shù)據(jù)結(jié)構(gòu)

繁殖變異用于產(chǎn)生新生個體，以優(yōu)秀個體作為父代，通過1/1 000的隨機(jī)變異操作產(chǎn)生不同于父代的子個體。繁殖變異算法流程圖如圖3所示。

圖3 繁殖變異算法流程圖Fig.3 Flow chart of reproductive mutation algorithm

設(shè)種群內(nèi)個體上限數(shù)目為1 000. 其中，輸入壓縮種群階段，種群中個體數(shù)目小于1 000；選中父個體階段，在種群中選取最高評分且遺傳次數(shù)最少的個體作為父個體，若存在多個個體，則采用輪盤法確定父個體；復(fù)制新個體階段，將父個體完整復(fù)制產(chǎn)生新個體；變異操作階段，通過千分之一的隨機(jī)變異操作修改新個體的DNA動態(tài)數(shù)組信息；算法輸出規(guī)模為1 000的擴(kuò)充種群。

2.3 更新目標(biāo)清單

由于敵我雙方處于信息不透明狀態(tài)，在初始目標(biāo)清單基礎(chǔ)上，火力打擊方必然會使己方處于觀察- 判斷- 決策- 打擊(OODA)循環(huán)中的節(jié)點(diǎn)發(fā)現(xiàn)概率增大，當(dāng)發(fā)現(xiàn)概率到達(dá)發(fā)現(xiàn)閾值時即被對方偵察，目標(biāo)清單上即顯示該節(jié)點(diǎn)，因此每波次火力打擊后敵我雙方的目標(biāo)清單均需更新，用于剔除已消滅目標(biāo)并引入新發(fā)現(xiàn)目標(biāo)。更新目標(biāo)清單算法流程圖如圖4所示。

圖4 更新目標(biāo)清單算法流程圖Fig.4 Flow chart of target list updating algorithm

(11)

刪除已消滅節(jié)點(diǎn)階段，刪除毀傷程度超過80%的節(jié)點(diǎn)；添加新發(fā)現(xiàn)節(jié)點(diǎn)階段，將發(fā)現(xiàn)概率超過80%的節(jié)點(diǎn)加入目標(biāo)清單。

2.4 個體轉(zhuǎn)錄

轉(zhuǎn)錄是指以DNA為基礎(chǔ)產(chǎn)生蛋白質(zhì)酶以控制生物體性狀的過程，本文中特指在輸入目標(biāo)打擊清單后，個體DNA數(shù)組通過內(nèi)部算法，產(chǎn)生唯一對應(yīng)的火力打擊任務(wù)分配表的過程。具體算法步驟如下：

步驟1窮舉所有可能的火力分配任務(wù)。每個火力分配任務(wù)包含“打擊目標(biāo)編號、使用部隊編號、火力打擊起止時刻”。

步驟2數(shù)據(jù)非線性推演。為每個火力分配任務(wù)和DNA數(shù)組，對應(yīng)計算f(zi)函數(shù)并留存計算結(jié)果。設(shè)火力分配任務(wù)輸入值為目標(biāo)重要程度zi，DNA數(shù)組初始維數(shù)為10，對應(yīng)數(shù)組值為d，推演公式如下：

(12)

若為首段輸入，則輸入打擊目標(biāo)的重要程度；若為第i段輸入，則以zi=f(zi-1-1)代入f(zi)函數(shù)進(jìn)行計算。

步驟3判定是否實(shí)施該火力分配任務(wù)。若結(jié)果f(zi)<50，則不實(shí)施；反之則實(shí)施；按f(zi)的分值由大到小排序，選取前10的火力分配任務(wù)。

步驟4去冗余操作。去除超程任務(wù)；去除彈藥不足任務(wù)；去除兵力不足任務(wù)；去除執(zhí)行沖突任務(wù)；輸出最終的火力分配表如表2所示。

表2 個體對應(yīng)火力分配表示例

注：T為戰(zhàn)斗發(fā)起時刻。

2.5 計算火力打擊排序

根據(jù)OODA循環(huán)理論，火力打擊過程可抽象為“觀察(Observe)-判斷(Orient)-決策(Decide)-打擊(Act)”4種行動的不斷循環(huán)，則勝利的關(guān)鍵在于通過加快己方的OODA循環(huán)，在敵人對己方前次行動作出反應(yīng)之前發(fā)起新的行動，從而遲滯或打破敵人的OODA循環(huán)，以達(dá)成制勝的目的。OODA循環(huán)理論可以解決敵我雙方火力打擊任務(wù)的排序問題。在敵我作戰(zhàn)超網(wǎng)絡(luò)中，偵察情報網(wǎng)對應(yīng)“觀察”環(huán)節(jié)，指揮控制網(wǎng)對應(yīng)“判斷”和“決策”環(huán)節(jié)，火力打擊網(wǎng)對應(yīng)“打擊”環(huán)節(jié)，則可通過超網(wǎng)絡(luò)中各節(jié)點(diǎn)的通聯(lián)效率作為評判OODA循環(huán)效率的依據(jù)。

本文設(shè)置敵我雙方各火力打擊任務(wù)的排序規(guī)則如下：1)超網(wǎng)絡(luò)中觀察單元、判斷決策單元、行動單元之間的循環(huán)越短，該行動單元的OODA循環(huán)效率越高；2)超網(wǎng)絡(luò)中的各子網(wǎng)越健全，網(wǎng)絡(luò)中行動單元的OODA循環(huán)效率越高；3)行動單元的OODA循環(huán)效率越高，火力打擊排序越靠前。設(shè)超網(wǎng)絡(luò)中第i個單元的易毀傷程度為hi；與第t個行動單元相連接的觀察單元數(shù)目為m，判斷決策單元數(shù)目為n，信息傳遞單元數(shù)目為k，分別對應(yīng)的單元編號為im、in、ik. 定義第t個行動單元的觀察效率為Gt：與其相接的觀察單元重要程度越高，機(jī)動能力越強(qiáng)，越難以毀傷，則觀察效率越高。Gt的計算公式如下：

(13)

式中：him、zim、dim分別表示易毀傷程度、重要程度、機(jī)動能力指標(biāo)。

定義判斷決策效率Ct：與其相連接的判斷決策單元重要程度越高，越難以毀傷，固定位置時間越長，則判斷決策效率越高。Ct的計算公式如下：

(14)

式中：hin、zin、din分別表示易毀傷程度、重要程度、機(jī)動能力指標(biāo)。

定義信息傳輸效率St：與其相連接的信息傳輸單元重要程度越高，越難以毀傷，固定位置時間越長，則信息傳輸效率越高。St的計算公式如下：

(15)

式中：hik、zik、dik分別表示易毀傷程度、重要程度、機(jī)動能力指標(biāo)。

定義OODA評估指標(biāo)Pt，其計算公式如下：

Pt=lg(max{Gt,1})×lg(max{Ct,1})×

lg(max{St,1}).

(16)

按Pt排序?qū)嵤┗鹆Υ驌?，更新打擊目?biāo)方的毀傷程度，更新實(shí)施打擊方的彈藥消耗和發(fā)現(xiàn)概率。設(shè)某個作戰(zhàn)單元在第p波次火力打擊中的易毀傷程度為hp，參與火力打擊的部隊毀傷能力為kp，兵力消耗比例為bp，更新各節(jié)點(diǎn)毀傷程度的計算公式為

(17)

更新發(fā)現(xiàn)概率的計算公式為

fp=fp-1+rand{Gt,Ct,St}×
rand{10,…,30}.

(18)

此外，每波打擊中隨機(jī)對一個目標(biāo)發(fā)現(xiàn)概率賦值100.

2.6 計算敵我雙方對抗結(jié)果

敵我雙方對抗評估用于在火力打擊結(jié)束后，通過敵我雙方兵力、彈藥損耗，計算出敵我雙方綜合評分的過程。對抗評估算法流程圖如圖5所示。

圖5 對抗評估算法流程圖Fig.5 Flow chart of confrontation evaluation algorithm

(19)

(20)

計算對抗評估參數(shù)階段，用T1描述在固定火力打擊次數(shù)情況下對更重要的節(jié)點(diǎn)實(shí)施火力打擊；用T2描述實(shí)際火力打擊次數(shù)和規(guī)定火力打擊次數(shù)的差異率；用T3描述各節(jié)點(diǎn)的平均毀傷程度。設(shè)第is個行動單元的火力打擊次數(shù)為ris，重要程度為zis，對抗評估參數(shù)T1、T2、T3的計算公式如下：

(21)

(22)

(23)

計算綜合評分階段，使用熵權(quán)法將對抗評估參數(shù)降維為單一評估指標(biāo)。設(shè)敵我雙種群共進(jìn)行了v次對抗推演，則在第q次對抗推演中，第p項評估指標(biāo)對應(yīng)評估參數(shù)矩陣T中的子集為tpq. 首先對評估參數(shù)矩陣T做歸一化處理，得到歸一化矩陣P，其中子集ppq的計算公式如下：

(24)

然后計算每次對抗推演中每項評估參數(shù)對應(yīng)的熵值ep為

(25)

式中：當(dāng)ppq=0時，ep=0.

計算每次對抗推演中每項評估參數(shù)對應(yīng)的權(quán)重tp為

(26)

最后計算并輸出本次對抗推演的綜合評分Mq為

(27)

對敵我雙方計算綜合評分，判斷評分高的一方為勝利方。

2.7 雙種群優(yōu)勝劣汰

優(yōu)勝劣汰用于構(gòu)造敵我雙方動態(tài)博弈環(huán)境，在博弈中勝者留存并繁衍后代，敗者淘汰以釋放資源。優(yōu)勝劣汰算法流程圖如圖6所示。

圖6 優(yōu)勝劣汰算法流程圖Fig.6 Flow chart of fittest algorithm

圖6中，結(jié)束條件設(shè)置為：當(dāng)我方種群中個體的勝利次數(shù)和敵方種群中個體的勝利次數(shù)比例超過某一閾值時，可判定結(jié)束。

3 仿真分析

為了驗證智能對抗進(jìn)化算法在聯(lián)合火力打擊任務(wù)規(guī)劃的優(yōu)越性，采用文獻(xiàn)[7]提供的改進(jìn)遺傳算法作為對比算法。仿真實(shí)驗計算機(jī)配置如下：聯(lián)想筆記本電腦運(yùn)行MFC程序；Intel酷睿雙核處理器T7300 2.0 GHz；3 GB內(nèi)存；32位Windows7操作系統(tǒng)；vc6.0編程環(huán)境。敵我雙方目標(biāo)態(tài)勢特征屬性如表3所示，各類目標(biāo)的網(wǎng)絡(luò)關(guān)聯(lián)情況示例如表4所示，火力打擊兵器毀傷屬性如表5所示。

表3 敵我雙方目標(biāo)態(tài)勢表示例

表4 營指揮所的目標(biāo)關(guān)聯(lián)表示例

表5 火力打擊兵器毀傷屬性表示例

表4為以營指揮所為中心的各目標(biāo)類型與其關(guān)聯(lián)情況。

表6為以炮兵陣地為火力打擊力量對各目標(biāo)類型實(shí)施火力打擊，能夠達(dá)成規(guī)定毀傷程度所需的打擊次數(shù)。運(yùn)用該算法設(shè)計制作“智能聯(lián)合火力打擊任務(wù)規(guī)劃軟件”以服務(wù)于作戰(zhàn)籌劃實(shí)踐。軟件操作界面如圖7所示。

表6 炮兵陣地的火力毀傷能力表示例

圖7 軟件操作界面Fig.7 Software operation interface

3.1 參數(shù)有效性分析

本文實(shí)驗參數(shù)求取過程如下：隨機(jī)枚舉500個敵方火力打擊任務(wù)規(guī)劃，在調(diào)節(jié)我方各參數(shù)適用范圍基礎(chǔ)上計算個體的適應(yīng)度值，以500次仿真計算結(jié)果的平均值作為參數(shù)優(yōu)選參考依據(jù)。所用參數(shù)如表7所示。

3.2 各代最優(yōu)個體適應(yīng)度分析

為了檢驗算法的適應(yīng)度變化情況，以敵我雙方雙種群為基礎(chǔ)實(shí)施自由對抗，每次對抗記為1代，并記錄我方個體對抗中的適應(yīng)度分值；同時引入文獻(xiàn)[7]中的改進(jìn)遺傳算法作為對比實(shí)驗，以敵方初始種群作為對抗環(huán)境代入改進(jìn)遺傳算法中計算各代最優(yōu)個體的適應(yīng)度分值。經(jīng)過500代迭代進(jìn)化的適應(yīng)度變化情況如圖8所示。

表7 參數(shù)取值范圍表

圖8 各代最優(yōu)個體適應(yīng)度分值統(tǒng)計Fig.8 Optimal individual fitness scores for each generation

實(shí)驗結(jié)果表明：智能對抗進(jìn)化算法相比于改進(jìn)遺傳算法的適應(yīng)度結(jié)果，適應(yīng)度分值呈現(xiàn)階段性收斂和陡降狀態(tài)，改進(jìn)遺傳算法由于敵方環(huán)境固定不變，適應(yīng)度分值收斂于固定分值，而后的進(jìn)化計算由于結(jié)果不變而導(dǎo)致進(jìn)化停滯；智能對抗進(jìn)化算法則處于敵我雙方動態(tài)變化過程中，敵方環(huán)境的動態(tài)變化導(dǎo)致我方最優(yōu)個體結(jié)構(gòu)做出動態(tài)調(diào)整以應(yīng)對敵方環(huán)境變化，調(diào)整必然導(dǎo)致適應(yīng)度分值產(chǎn)生陡降，而每次陡降過程中產(chǎn)生的個體結(jié)構(gòu)有后代個體繼承并作為DNA傳遞，因此智能對抗進(jìn)化算法相比于改進(jìn)遺傳算法的環(huán)境適應(yīng)能力更強(qiáng)。

3.3 最優(yōu)個體對抗結(jié)果分析

為了驗證算法的自我學(xué)習(xí)能力和對抗優(yōu)越性，取智能對抗進(jìn)化算法中的敵方各代最優(yōu)個體作為對抗環(huán)境，取改進(jìn)遺傳算法經(jīng)過500代進(jìn)化獲得的最優(yōu)個體作為對比實(shí)驗個體，通過智能對抗產(chǎn)生我方最優(yōu)個體，每次對抗記為1代，共推演400 000代，分析我方和對比實(shí)驗與敵方最優(yōu)個體對抗的勝敗比率，以此判斷智能對抗進(jìn)化算法是否具備優(yōu)于遺傳算法的自我學(xué)習(xí)進(jìn)化能力。我方勝利次數(shù)統(tǒng)計如圖9所示。

圖9 各代最優(yōu)個體勝利次數(shù)統(tǒng)計Fig.9 Statistics of the victories of best individuals in each generation

實(shí)驗結(jié)果表明：隨著對抗進(jìn)化迭代次數(shù)的增加，敵方最優(yōu)個體不斷改進(jìn)自身結(jié)構(gòu)，改進(jìn)遺傳算法的最優(yōu)個體初期可獲勝，隨后被敵方最優(yōu)個體壓制，并在總體進(jìn)化進(jìn)程中無翻盤可能；智能對抗進(jìn)化算法中的我方最優(yōu)個體可通過改造自身結(jié)構(gòu)積累獲勝經(jīng)驗，具備隨時翻盤的可能。

為了驗證智能對抗進(jìn)化算法獲得最優(yōu)個體的任務(wù)規(guī)劃能力優(yōu)越性，實(shí)驗設(shè)計從敵方種群中隨機(jī)抽取1 000個個體作為對抗環(huán)境，以改進(jìn)遺傳算法獲得的最優(yōu)個體作為對比實(shí)驗個體，使敵我雙方個體逐一對抗并記錄勝負(fù)，以此判斷智能對抗進(jìn)化算法在任務(wù)規(guī)劃能力上的優(yōu)越性。最優(yōu)個體勝利情況統(tǒng)計如圖10所示。

圖10 最優(yōu)個體隨機(jī)對抗勝利次數(shù)統(tǒng)計Fig.10 Statistics of optimal individual random confrontation wins

實(shí)驗結(jié)果表明，智能對抗進(jìn)化算法獲取的最優(yōu)個體在勝率上明顯優(yōu)于改進(jìn)遺傳算法，相比于智能對抗進(jìn)化產(chǎn)生的最優(yōu)個體，改進(jìn)遺傳算法獲取的最優(yōu)個體由于嚴(yán)重依賴固定的敵方環(huán)境而產(chǎn)生了過擬合，導(dǎo)致其在敵方環(huán)境變化上的適應(yīng)度分值明顯下降，并促使勝率低于智能對抗進(jìn)化的最優(yōu)個體。

3.4 算法時空消耗分析

為了驗證算法對個體結(jié)構(gòu)改善情況，實(shí)驗抽取對抗過程中產(chǎn)生的最優(yōu)個體并統(tǒng)計其存儲容量，以改進(jìn)遺傳算法的各代最優(yōu)個體存儲容量作為對比實(shí)驗個體，結(jié)果如圖11所示。

圖11 最優(yōu)個體存儲容量統(tǒng)計Fig.11 Optimal individual storage capacity statistics

實(shí)驗結(jié)果表明：隨著進(jìn)化代數(shù)的增加，改進(jìn)遺傳算法獲取的最優(yōu)個體存儲容量趨近收斂，并在多代進(jìn)化后陷入進(jìn)化停滯，個體結(jié)構(gòu)不再改變；智能對抗進(jìn)化獲取的最優(yōu)個體隨著對抗進(jìn)化代數(shù)的增加，個體數(shù)據(jù)結(jié)構(gòu)呈線性增長，伴隨著結(jié)構(gòu)復(fù)雜性的提升，個體對敵方動態(tài)環(huán)境的適應(yīng)性相應(yīng)增強(qiáng)。

為了檢驗算法的計算效率，取各代最優(yōu)個體實(shí)施對抗并統(tǒng)計時間消耗，以改進(jìn)遺傳算法的最優(yōu)個體作為對比實(shí)驗個體，以隨機(jī)抽取的100個敵方個體作為對抗環(huán)境，取100次對抗平均時間作為評估指標(biāo)，結(jié)果如圖12所示。

圖12 最優(yōu)個體對抗時間消耗統(tǒng)計Fig.12 Optimal individual vs. time consumption

實(shí)驗結(jié)果表明，相比于改進(jìn)遺傳算法最優(yōu)個體，智能對抗進(jìn)化算法的最優(yōu)個體由于自身結(jié)構(gòu)復(fù)雜度提升，對抗時間消耗也相應(yīng)增大，但考慮到戰(zhàn)場中只使用智能對抗進(jìn)化的多代最優(yōu)個體，因此時間消耗在可承受范圍內(nèi)。

3.5 任務(wù)規(guī)劃結(jié)果顯示

聯(lián)合火力打擊任務(wù)規(guī)劃的最終結(jié)果是生成輔助決心建議，因此將多代進(jìn)化的最優(yōu)個體和敵方當(dāng)前態(tài)勢獲取的實(shí)時個體進(jìn)行對抗，并生成對抗結(jié)果，轉(zhuǎn)化為輔助決心建議格式如下：依據(jù)當(dāng)前敵我態(tài)勢以及目標(biāo)打擊清單，我火力打擊綜合勝率為XX%，不能完成火力打擊任務(wù)，建議補(bǔ)充兵力彈藥或能夠完成火力打擊任務(wù)；建議使用X號個體作為火力打擊任務(wù)分配算法，其綜合勝率達(dá)XX%；預(yù)計執(zhí)行完火力打擊任務(wù)時，我火力打擊部隊兵力剩余XX%，彈藥剩余XX%.

4 結(jié)論

本文基于對抗進(jìn)化思想，在遺傳算法基礎(chǔ)上構(gòu)造出敵我雙方的對抗進(jìn)化機(jī)制，通過多代的優(yōu)勝劣汰和遺傳變異，積累應(yīng)對各種情況的遺傳因子，獲取能夠應(yīng)對各種情況的最優(yōu)個體，進(jìn)而實(shí)現(xiàn)聯(lián)合火力打擊任務(wù)規(guī)劃的自我進(jìn)化和迭代，產(chǎn)生了符合作戰(zhàn)實(shí)際需求的任務(wù)規(guī)劃。仿真實(shí)驗結(jié)果表明，該算法相比于標(biāo)準(zhǔn)遺傳算法具有更大的靈活性，能夠動態(tài)匹配目標(biāo)打擊清單和敵我雙方作戰(zhàn)態(tài)勢，具備解決特定問題的人工智能算法基礎(chǔ)。