劉昊, 張策, 丁文韜
(1.國防大學(xué) 聯(lián)合作戰(zhàn)學(xué)院, 河北 石家莊 050000; 2.國防大學(xué) 研究生院, 北京 100091)
聯(lián)合火力打擊任務(wù)規(guī)劃是根據(jù)聯(lián)合火力打擊任務(wù)等約束條件,運(yùn)用輔助決策工具對聯(lián)合火力打擊行動進(jìn)行籌劃計算,包括計算兵力彈藥滿意度、輔助制定聯(lián)合火力打擊計劃、評估火力打擊效果等[1]。其核心問題是解決聯(lián)合作戰(zhàn)中的動態(tài)火力分配問題,即根據(jù)戰(zhàn)場態(tài)勢和敵我動態(tài)博弈情況實(shí)時生成目標(biāo)打擊清單,動態(tài)分配火力打擊力量和打擊目標(biāo),以實(shí)現(xiàn)聯(lián)合火力打擊效能的最大化[2]。其難點(diǎn)在于火力打擊任務(wù)規(guī)劃不僅計算我方火力分配的效能最大化,還必須考慮敵方火力打擊對我方造成的影響,這是因為敵我初始火力分配的微小差別將導(dǎo)致最終打擊效果的千差萬別,極大地增加任務(wù)分配推演計算和算法實(shí)現(xiàn)的復(fù)雜度。
國內(nèi)外研究人員已經(jīng)針對任務(wù)規(guī)劃問題探索了多種解決方法,其中:特征評估法[3-5]通過算法公式計算影響戰(zhàn)果的評估指標(biāo),效率高但推廣性差;改進(jìn)遺傳算法[6-9]利用生物進(jìn)化思想尋找當(dāng)前狀態(tài)下的全局最優(yōu)解,構(gòu)造簡單但環(huán)境依賴性大;動態(tài)博弈法[10-13]通過博弈論形成敵我雙方之間的納什均衡,動態(tài)適應(yīng)性強(qiáng)但計算復(fù)雜性劇增;神經(jīng)網(wǎng)絡(luò)法[14-16]模擬智能體的自學(xué)習(xí)能力,依靠經(jīng)驗解決問題,理論完美但訓(xùn)練數(shù)據(jù)來源受限。上述方法存在的普遍問題是:關(guān)注靜態(tài)條件下對我方火力打擊效能的評估,未考慮將敵我雙方納入網(wǎng)絡(luò)體系實(shí)施對抗推演,使火力打擊計劃片面化、簡單化;關(guān)注評估指標(biāo)的理論計算,未考慮對抗推演中的有效性檢驗,使火力打擊計劃偏離戰(zhàn)場實(shí)際;關(guān)注當(dāng)前態(tài)勢下的最優(yōu)分配結(jié)果,未考慮敵我雙方態(tài)勢變化的可能性,使火力打擊計劃更脆弱。
本文在總結(jié)前人方法的基礎(chǔ)上,借鑒自然界物種間的對抗進(jìn)化機(jī)理,在遺傳算法基礎(chǔ)上設(shè)計對抗進(jìn)化算法,實(shí)現(xiàn)敵我雙方任務(wù)規(guī)劃的無上限對抗進(jìn)化,產(chǎn)生出在當(dāng)前態(tài)勢及未來可能態(tài)勢下解決任務(wù)規(guī)劃問題的最優(yōu)個體,并通過仿真實(shí)驗驗證了該方法產(chǎn)生的最優(yōu)個體自我學(xué)習(xí)能力以及在解決聯(lián)合火力打擊任務(wù)規(guī)劃問題上的智能性。
(1)
(2)
(3)
(4)
(5)
(6)
(7)
(8)
并保證我方彈藥消耗比例do約束條件如下:
(9)
(10)
問題的難點(diǎn)在于:1)各節(jié)點(diǎn)的發(fā)現(xiàn)概率決定了目標(biāo)打擊清單,目標(biāo)打擊清單決定了各波次打擊任務(wù)的火力分配結(jié)果,火力分配差異影響最終評估結(jié)果,如何從不確定的發(fā)現(xiàn)概率中找到確定性的最優(yōu)化火力分配,是任務(wù)規(guī)劃問題的難點(diǎn)[17];2)敵我雙方均在尋找最優(yōu)化評估結(jié)果,且雙方火力分配的微小調(diào)整均對各自最終評估結(jié)果產(chǎn)生重要影響,如何實(shí)現(xiàn)敵我雙方的對抗推演評估也是算法難點(diǎn)。本文試圖構(gòu)造敵我雙方多波次的火力打擊對抗評估模型,通過對抗推演統(tǒng)計敵我雙方的評估函數(shù)分值,以此判斷勝負(fù)結(jié)果并找到最佳火力分配方法。
針對聯(lián)合火力打擊動態(tài)分配問題難點(diǎn),智能對抗進(jìn)化算法設(shè)計目標(biāo)包括:1)實(shí)現(xiàn)由不確定的發(fā)現(xiàn)概率得到確定性的評估結(jié)果;2)建立敵我雙方互為評估條件的對抗評估機(jī)制。智能對抗進(jìn)化算法以遺傳算法為基礎(chǔ),引入雙種群對抗評估機(jī)制,在設(shè)置初始個體的基礎(chǔ)上實(shí)現(xiàn)敵我雙方種群間的對抗進(jìn)化,在眾多代繁衍后產(chǎn)生能夠解決聯(lián)合火力打擊任務(wù)規(guī)劃問題的最優(yōu)個體。算法流程圖如圖1所示。
圖1 智能對抗進(jìn)化算法流程圖Fig.1 Flow chart of intelligent confrontation evolution algorithm
超網(wǎng)絡(luò)概念是美國科學(xué)家Sheffi[18]在處理交織網(wǎng)絡(luò)時提出的,特指高于而又超于現(xiàn)存網(wǎng)絡(luò)的網(wǎng)絡(luò),體現(xiàn)出超越一般網(wǎng)絡(luò)的復(fù)雜性和涌現(xiàn)性。為了確定敵我火力分配任務(wù)的打擊排序,本文將敵我雙方節(jié)點(diǎn)區(qū)分為觀察單元、判斷決策單元、信息傳輸單元、行動單元、其他單元5類;按照各目標(biāo)的信息通聯(lián)屬性,構(gòu)建出偵察情報網(wǎng)、指揮控制網(wǎng)、信息傳輸網(wǎng)、火力打擊網(wǎng),并在各子網(wǎng)基礎(chǔ)上構(gòu)建作戰(zhàn)超網(wǎng)絡(luò)。圖2為以敵方戰(zhàn)場態(tài)勢信息構(gòu)建的超網(wǎng)絡(luò)示例。
本文中的個體特指具備一定智能程度的任務(wù)規(guī)劃對象,即給定當(dāng)前狀態(tài)的目標(biāo)打擊清單,能夠唯一地輸出聯(lián)合火力打擊任務(wù)規(guī)劃的智能體。對于一個固定的目標(biāo)打擊清單,個體必能產(chǎn)生唯一對應(yīng)的火力打擊任務(wù)分配表。本文對DNA定義為:由隨機(jī)整數(shù)組成的二維動態(tài)數(shù)組,整數(shù)值、組內(nèi)個數(shù)均不固定,用以模擬生物DNA隨機(jī)變異、由簡單向復(fù)雜進(jìn)化的自然特性。個體數(shù)據(jù)結(jié)構(gòu)如表1所示(敵我雙方雙種群內(nèi)的個體結(jié)構(gòu)相同)。
圖2 敵方作戰(zhàn)超網(wǎng)絡(luò)示例Fig.2 Example of a friend-foe operation super-network
表1 個體數(shù)據(jù)結(jié)構(gòu)
繁殖變異用于產(chǎn)生新生個體,以優(yōu)秀個體作為父代,通過1/1 000的隨機(jī)變異操作產(chǎn)生不同于父代的子個體。繁殖變異算法流程圖如圖3所示。
圖3 繁殖變異算法流程圖Fig.3 Flow chart of reproductive mutation algorithm
設(shè)種群內(nèi)個體上限數(shù)目為1 000. 其中,輸入壓縮種群階段,種群中個體數(shù)目小于1 000;選中父個體階段,在種群中選取最高評分且遺傳次數(shù)最少的個體作為父個體,若存在多個個體,則采用輪盤法確定父個體;復(fù)制新個體階段,將父個體完整復(fù)制產(chǎn)生新個體;變異操作階段,通過千分之一的隨機(jī)變異操作修改新個體的DNA動態(tài)數(shù)組信息;算法輸出規(guī)模為1 000的擴(kuò)充種群。
由于敵我雙方處于信息不透明狀態(tài),在初始目標(biāo)清單基礎(chǔ)上,火力打擊方必然會使己方處于觀察- 判斷- 決策- 打擊(OODA)循環(huán)中的節(jié)點(diǎn)發(fā)現(xiàn)概率增大,當(dāng)發(fā)現(xiàn)概率到達(dá)發(fā)現(xiàn)閾值時即被對方偵察,目標(biāo)清單上即顯示該節(jié)點(diǎn),因此每波次火力打擊后敵我雙方的目標(biāo)清單均需更新,用于剔除已消滅目標(biāo)并引入新發(fā)現(xiàn)目標(biāo)。更新目標(biāo)清單算法流程圖如圖4所示。
圖4 更新目標(biāo)清單算法流程圖Fig.4 Flow chart of target list updating algorithm
(11)
刪除已消滅節(jié)點(diǎn)階段,刪除毀傷程度超過80%的節(jié)點(diǎn);添加新發(fā)現(xiàn)節(jié)點(diǎn)階段,將發(fā)現(xiàn)概率超過80%的節(jié)點(diǎn)加入目標(biāo)清單。
轉(zhuǎn)錄是指以DNA為基礎(chǔ)產(chǎn)生蛋白質(zhì)酶以控制生物體性狀的過程,本文中特指在輸入目標(biāo)打擊清單后,個體DNA數(shù)組通過內(nèi)部算法,產(chǎn)生唯一對應(yīng)的火力打擊任務(wù)分配表的過程。具體算法步驟如下:
步驟1窮舉所有可能的火力分配任務(wù)。每個火力分配任務(wù)包含“打擊目標(biāo)編號、使用部隊編號、火力打擊起止時刻”。
步驟2數(shù)據(jù)非線性推演。為每個火力分配任務(wù)和DNA數(shù)組,對應(yīng)計算f(zi)函數(shù)并留存計算結(jié)果。設(shè)火力分配任務(wù)輸入值為目標(biāo)重要程度zi,DNA數(shù)組初始維數(shù)為10,對應(yīng)數(shù)組值為d,推演公式如下:
(12)
若為首段輸入,則輸入打擊目標(biāo)的重要程度;若為第i段輸入,則以zi=f(zi-1-1)代入f(zi)函數(shù)進(jìn)行計算。
步驟3判定是否實(shí)施該火力分配任務(wù)。若結(jié)果f(zi)<50,則不實(shí)施;反之則實(shí)施;按f(zi)的分值由大到小排序,選取前10的火力分配任務(wù)。
步驟4去冗余操作。去除超程任務(wù);去除彈藥不足任務(wù);去除兵力不足任務(wù);去除執(zhí)行沖突任務(wù);輸出最終的火力分配表如表2所示。
表2 個體對應(yīng)火力分配表示例
注:T為戰(zhàn)斗發(fā)起時刻。
根據(jù)OODA循環(huán)理論,火力打擊過程可抽象為“觀察(Observe)-判斷(Orient)-決策(Decide)-打擊(Act)”4種行動的不斷循環(huán),則勝利的關(guān)鍵在于通過加快己方的OODA循環(huán),在敵人對己方前次行動作出反應(yīng)之前發(fā)起新的行動,從而遲滯或打破敵人的OODA循環(huán),以達(dá)成制勝的目的。OODA循環(huán)理論可以解決敵我雙方火力打擊任務(wù)的排序問題。在敵我作戰(zhàn)超網(wǎng)絡(luò)中,偵察情報網(wǎng)對應(yīng)“觀察”環(huán)節(jié),指揮控制網(wǎng)對應(yīng)“判斷”和“決策”環(huán)節(jié),火力打擊網(wǎng)對應(yīng)“打擊”環(huán)節(jié),則可通過超網(wǎng)絡(luò)中各節(jié)點(diǎn)的通聯(lián)效率作為評判OODA循環(huán)效率的依據(jù)。
本文設(shè)置敵我雙方各火力打擊任務(wù)的排序規(guī)則如下:1)超網(wǎng)絡(luò)中觀察單元、判斷決策單元、行動單元之間的循環(huán)越短,該行動單元的OODA循環(huán)效率越高;2)超網(wǎng)絡(luò)中的各子網(wǎng)越健全,網(wǎng)絡(luò)中行動單元的OODA循環(huán)效率越高;3)行動單元的OODA循環(huán)效率越高,火力打擊排序越靠前。設(shè)超網(wǎng)絡(luò)中第i個單元的易毀傷程度為hi;與第t個行動單元相連接的觀察單元數(shù)目為m,判斷決策單元數(shù)目為n,信息傳遞單元數(shù)目為k,分別對應(yīng)的單元編號為im、in、ik. 定義第t個行動單元的觀察效率為Gt:與其相接的觀察單元重要程度越高,機(jī)動能力越強(qiáng),越難以毀傷,則觀察效率越高。Gt的計算公式如下:
(13)
式中:him、zim、dim分別表示易毀傷程度、重要程度、機(jī)動能力指標(biāo)。
定義判斷決策效率Ct:與其相連接的判斷決策單元重要程度越高,越難以毀傷,固定位置時間越長,則判斷決策效率越高。Ct的計算公式如下:
(14)
式中:hin、zin、din分別表示易毀傷程度、重要程度、機(jī)動能力指標(biāo)。
定義信息傳輸效率St:與其相連接的信息傳輸單元重要程度越高,越難以毀傷,固定位置時間越長,則信息傳輸效率越高。St的計算公式如下:
(15)
式中:hik、zik、dik分別表示易毀傷程度、重要程度、機(jī)動能力指標(biāo)。
定義OODA評估指標(biāo)Pt,其計算公式如下:
Pt=lg(max{Gt,1})×lg(max{Ct,1})×
lg(max{St,1}).
(16)
按Pt排序?qū)嵤┗鹆Υ驌?,更新打擊目?biāo)方的毀傷程度,更新實(shí)施打擊方的彈藥消耗和發(fā)現(xiàn)概率。設(shè)某個作戰(zhàn)單元在第p波次火力打擊中的易毀傷程度為hp,參與火力打擊的部隊毀傷能力為kp,兵力消耗比例為bp,更新各節(jié)點(diǎn)毀傷程度的計算公式為
(17)
更新發(fā)現(xiàn)概率的計算公式為
fp=fp-1+rand{Gt,Ct,St}×
rand{10,…,30}.
(18)
此外,每波打擊中隨機(jī)對一個目標(biāo)發(fā)現(xiàn)概率賦值100.
敵我雙方對抗評估用于在火力打擊結(jié)束后,通過敵我雙方兵力、彈藥損耗,計算出敵我雙方綜合評分的過程。對抗評估算法流程圖如圖5所示。
圖5 對抗評估算法流程圖Fig.5 Flow chart of confrontation evaluation algorithm
(19)
(20)
計算對抗評估參數(shù)階段,用T1描述在固定火力打擊次數(shù)情況下對更重要的節(jié)點(diǎn)實(shí)施火力打擊;用T2描述實(shí)際火力打擊次數(shù)和規(guī)定火力打擊次數(shù)的差異率;用T3描述各節(jié)點(diǎn)的平均毀傷程度。設(shè)第is個行動單元的火力打擊次數(shù)為ris,重要程度為zis,對抗評估參數(shù)T1、T2、T3的計算公式如下:
(21)
(22)
(23)
計算綜合評分階段,使用熵權(quán)法將對抗評估參數(shù)降維為單一評估指標(biāo)。設(shè)敵我雙種群共進(jìn)行了v次對抗推演,則在第q次對抗推演中,第p項評估指標(biāo)對應(yīng)評估參數(shù)矩陣T中的子集為tpq. 首先對評估參數(shù)矩陣T做歸一化處理,得到歸一化矩陣P,其中子集ppq的計算公式如下:
(24)
然后計算每次對抗推演中每項評估參數(shù)對應(yīng)的熵值ep為
(25)
式中:當(dāng)ppq=0時,ep=0.
計算每次對抗推演中每項評估參數(shù)對應(yīng)的權(quán)重tp為
(26)
最后計算并輸出本次對抗推演的綜合評分Mq為
(27)
對敵我雙方計算綜合評分,判斷評分高的一方為勝利方。
優(yōu)勝劣汰用于構(gòu)造敵我雙方動態(tài)博弈環(huán)境,在博弈中勝者留存并繁衍后代,敗者淘汰以釋放資源。優(yōu)勝劣汰算法流程圖如圖6所示。
圖6 優(yōu)勝劣汰算法流程圖Fig.6 Flow chart of fittest algorithm
圖6中,結(jié)束條件設(shè)置為:當(dāng)我方種群中個體的勝利次數(shù)和敵方種群中個體的勝利次數(shù)比例超過某一閾值時,可判定結(jié)束。
為了驗證智能對抗進(jìn)化算法在聯(lián)合火力打擊任務(wù)規(guī)劃的優(yōu)越性,采用文獻(xiàn)[7]提供的改進(jìn)遺傳算法作為對比算法。仿真實(shí)驗計算機(jī)配置如下:聯(lián)想筆記本電腦運(yùn)行MFC程序;Intel酷睿雙核處理器T7300 2.0 GHz;3 GB內(nèi)存;32位Windows7操作系統(tǒng);vc6.0編程環(huán)境。敵我雙方目標(biāo)態(tài)勢特征屬性如表3所示,各類目標(biāo)的網(wǎng)絡(luò)關(guān)聯(lián)情況示例如表4所示,火力打擊兵器毀傷屬性如表5所示。
表3 敵我雙方目標(biāo)態(tài)勢表示例
表4 營指揮所的目標(biāo)關(guān)聯(lián)表示例
表5 火力打擊兵器毀傷屬性表示例
表4為以營指揮所為中心的各目標(biāo)類型與其關(guān)聯(lián)情況。
表6為以炮兵陣地為火力打擊力量對各目標(biāo)類型實(shí)施火力打擊,能夠達(dá)成規(guī)定毀傷程度所需的打擊次數(shù)。運(yùn)用該算法設(shè)計制作“智能聯(lián)合火力打擊任務(wù)規(guī)劃軟件”以服務(wù)于作戰(zhàn)籌劃實(shí)踐。軟件操作界面如圖7所示。
表6 炮兵陣地的火力毀傷能力表示例
圖7 軟件操作界面Fig.7 Software operation interface
本文實(shí)驗參數(shù)求取過程如下:隨機(jī)枚舉500個敵方火力打擊任務(wù)規(guī)劃,在調(diào)節(jié)我方各參數(shù)適用范圍基礎(chǔ)上計算個體的適應(yīng)度值,以500次仿真計算結(jié)果的平均值作為參數(shù)優(yōu)選參考依據(jù)。所用參數(shù)如表7所示。
為了檢驗算法的適應(yīng)度變化情況,以敵我雙方雙種群為基礎(chǔ)實(shí)施自由對抗,每次對抗記為1代,并記錄我方個體對抗中的適應(yīng)度分值;同時引入文獻(xiàn)[7]中的改進(jìn)遺傳算法作為對比實(shí)驗,以敵方初始種群作為對抗環(huán)境代入改進(jìn)遺傳算法中計算各代最優(yōu)個體的適應(yīng)度分值。經(jīng)過500代迭代進(jìn)化的適應(yīng)度變化情況如圖8所示。
表7 參數(shù)取值范圍表
圖8 各代最優(yōu)個體適應(yīng)度分值統(tǒng)計Fig.8 Optimal individual fitness scores for each generation
實(shí)驗結(jié)果表明:智能對抗進(jìn)化算法相比于改進(jìn)遺傳算法的適應(yīng)度結(jié)果,適應(yīng)度分值呈現(xiàn)階段性收斂和陡降狀態(tài),改進(jìn)遺傳算法由于敵方環(huán)境固定不變,適應(yīng)度分值收斂于固定分值,而后的進(jìn)化計算由于結(jié)果不變而導(dǎo)致進(jìn)化停滯;智能對抗進(jìn)化算法則處于敵我雙方動態(tài)變化過程中,敵方環(huán)境的動態(tài)變化導(dǎo)致我方最優(yōu)個體結(jié)構(gòu)做出動態(tài)調(diào)整以應(yīng)對敵方環(huán)境變化,調(diào)整必然導(dǎo)致適應(yīng)度分值產(chǎn)生陡降,而每次陡降過程中產(chǎn)生的個體結(jié)構(gòu)有后代個體繼承并作為DNA傳遞,因此智能對抗進(jìn)化算法相比于改進(jìn)遺傳算法的環(huán)境適應(yīng)能力更強(qiáng)。
為了驗證算法的自我學(xué)習(xí)能力和對抗優(yōu)越性,取智能對抗進(jìn)化算法中的敵方各代最優(yōu)個體作為對抗環(huán)境,取改進(jìn)遺傳算法經(jīng)過500代進(jìn)化獲得的最優(yōu)個體作為對比實(shí)驗個體,通過智能對抗產(chǎn)生我方最優(yōu)個體,每次對抗記為1代,共推演400 000代,分析我方和對比實(shí)驗與敵方最優(yōu)個體對抗的勝敗比率,以此判斷智能對抗進(jìn)化算法是否具備優(yōu)于遺傳算法的自我學(xué)習(xí)進(jìn)化能力。我方勝利次數(shù)統(tǒng)計如圖9所示。
圖9 各代最優(yōu)個體勝利次數(shù)統(tǒng)計Fig.9 Statistics of the victories of best individuals in each generation
實(shí)驗結(jié)果表明:隨著對抗進(jìn)化迭代次數(shù)的增加,敵方最優(yōu)個體不斷改進(jìn)自身結(jié)構(gòu),改進(jìn)遺傳算法的最優(yōu)個體初期可獲勝,隨后被敵方最優(yōu)個體壓制,并在總體進(jìn)化進(jìn)程中無翻盤可能;智能對抗進(jìn)化算法中的我方最優(yōu)個體可通過改造自身結(jié)構(gòu)積累獲勝經(jīng)驗,具備隨時翻盤的可能。
為了驗證智能對抗進(jìn)化算法獲得最優(yōu)個體的任務(wù)規(guī)劃能力優(yōu)越性,實(shí)驗設(shè)計從敵方種群中隨機(jī)抽取1 000個個體作為對抗環(huán)境,以改進(jìn)遺傳算法獲得的最優(yōu)個體作為對比實(shí)驗個體,使敵我雙方個體逐一對抗并記錄勝負(fù),以此判斷智能對抗進(jìn)化算法在任務(wù)規(guī)劃能力上的優(yōu)越性。最優(yōu)個體勝利情況統(tǒng)計如圖10所示。
圖10 最優(yōu)個體隨機(jī)對抗勝利次數(shù)統(tǒng)計Fig.10 Statistics of optimal individual random confrontation wins
實(shí)驗結(jié)果表明,智能對抗進(jìn)化算法獲取的最優(yōu)個體在勝率上明顯優(yōu)于改進(jìn)遺傳算法,相比于智能對抗進(jìn)化產(chǎn)生的最優(yōu)個體,改進(jìn)遺傳算法獲取的最優(yōu)個體由于嚴(yán)重依賴固定的敵方環(huán)境而產(chǎn)生了過擬合,導(dǎo)致其在敵方環(huán)境變化上的適應(yīng)度分值明顯下降,并促使勝率低于智能對抗進(jìn)化的最優(yōu)個體。
為了驗證算法對個體結(jié)構(gòu)改善情況,實(shí)驗抽取對抗過程中產(chǎn)生的最優(yōu)個體并統(tǒng)計其存儲容量,以改進(jìn)遺傳算法的各代最優(yōu)個體存儲容量作為對比實(shí)驗個體,結(jié)果如圖11所示。
圖11 最優(yōu)個體存儲容量統(tǒng)計Fig.11 Optimal individual storage capacity statistics
實(shí)驗結(jié)果表明:隨著進(jìn)化代數(shù)的增加,改進(jìn)遺傳算法獲取的最優(yōu)個體存儲容量趨近收斂,并在多代進(jìn)化后陷入進(jìn)化停滯,個體結(jié)構(gòu)不再改變;智能對抗進(jìn)化獲取的最優(yōu)個體隨著對抗進(jìn)化代數(shù)的增加,個體數(shù)據(jù)結(jié)構(gòu)呈線性增長,伴隨著結(jié)構(gòu)復(fù)雜性的提升,個體對敵方動態(tài)環(huán)境的適應(yīng)性相應(yīng)增強(qiáng)。
為了檢驗算法的計算效率,取各代最優(yōu)個體實(shí)施對抗并統(tǒng)計時間消耗,以改進(jìn)遺傳算法的最優(yōu)個體作為對比實(shí)驗個體,以隨機(jī)抽取的100個敵方個體作為對抗環(huán)境,取100次對抗平均時間作為評估指標(biāo),結(jié)果如圖12所示。
圖12 最優(yōu)個體對抗時間消耗統(tǒng)計Fig.12 Optimal individual vs. time consumption
實(shí)驗結(jié)果表明,相比于改進(jìn)遺傳算法最優(yōu)個體,智能對抗進(jìn)化算法的最優(yōu)個體由于自身結(jié)構(gòu)復(fù)雜度提升,對抗時間消耗也相應(yīng)增大,但考慮到戰(zhàn)場中只使用智能對抗進(jìn)化的多代最優(yōu)個體,因此時間消耗在可承受范圍內(nèi)。
聯(lián)合火力打擊任務(wù)規(guī)劃的最終結(jié)果是生成輔助決心建議,因此將多代進(jìn)化的最優(yōu)個體和敵方當(dāng)前態(tài)勢獲取的實(shí)時個體進(jìn)行對抗,并生成對抗結(jié)果,轉(zhuǎn)化為輔助決心建議格式如下:依據(jù)當(dāng)前敵我態(tài)勢以及目標(biāo)打擊清單,我火力打擊綜合勝率為XX%,不能完成火力打擊任務(wù),建議補(bǔ)充兵力彈藥或能夠完成火力打擊任務(wù);建議使用X號個體作為火力打擊任務(wù)分配算法,其綜合勝率達(dá)XX%;預(yù)計執(zhí)行完火力打擊任務(wù)時,我火力打擊部隊兵力剩余XX%,彈藥剩余XX%.
本文基于對抗進(jìn)化思想,在遺傳算法基礎(chǔ)上構(gòu)造出敵我雙方的對抗進(jìn)化機(jī)制,通過多代的優(yōu)勝劣汰和遺傳變異,積累應(yīng)對各種情況的遺傳因子,獲取能夠應(yīng)對各種情況的最優(yōu)個體,進(jìn)而實(shí)現(xiàn)聯(lián)合火力打擊任務(wù)規(guī)劃的自我進(jìn)化和迭代,產(chǎn)生了符合作戰(zhàn)實(shí)際需求的任務(wù)規(guī)劃。仿真實(shí)驗結(jié)果表明,該算法相比于標(biāo)準(zhǔn)遺傳算法具有更大的靈活性,能夠動態(tài)匹配目標(biāo)打擊清單和敵我雙方作戰(zhàn)態(tài)勢,具備解決特定問題的人工智能算法基礎(chǔ)。