唐傳林,杜海文,吳文超,翁興偉
(空軍工程大學(xué)工程學(xué)院,西安 710038)
隨著UCAV各項(xiàng)關(guān)鍵技術(shù)的迅速發(fā)展,UCAV協(xié)同作戰(zhàn)將是未來(lái)戰(zhàn)爭(zhēng)的必然發(fā)展趨勢(shì)[1]。在未來(lái)無(wú)人作戰(zhàn)飛機(jī)偵察/打擊一體化戰(zhàn)爭(zhēng)中,多UCAV協(xié)同作戰(zhàn)不僅彌補(bǔ)了單架UCAV作戰(zhàn)力量單薄等缺點(diǎn),還能夠?qū)Πl(fā)現(xiàn)的多個(gè)目標(biāo)同時(shí)進(jìn)行打擊。同時(shí),對(duì)目標(biāo)進(jìn)行合理的分配能夠最大程度消滅敵人、保存自己、充分發(fā)揮我方武器作戰(zhàn)效能。目前研究目標(biāo)分配所用的方法很多,如網(wǎng)絡(luò)優(yōu)化算法[2]、基于市場(chǎng)拍賣算法[3]、貝葉斯優(yōu)化算法[4]、整數(shù)線性規(guī)劃法[5]、基于滿意度決策方法[6]、模糊算法[7]、遺傳算法[8-9]和免疫算法[10]等。整數(shù)線性規(guī)劃定性算法適用于小規(guī)模問(wèn)題;遺傳算法等啟發(fā)式算法能夠快速形成次優(yōu)解,但交叉和變異操作會(huì)使計(jì)算性能較低。以上算法大都沒(méi)有考慮到敵我雙方的博弈對(duì)目標(biāo)分配的影響,因此有必要對(duì)這個(gè)問(wèn)題探索其他的算法。本文提出的算法是在目標(biāo)分配時(shí)引入博弈思想,我方目標(biāo)分配是根據(jù)對(duì)敵方行動(dòng)進(jìn)行預(yù)測(cè)后作出;使飛機(jī)對(duì)各個(gè)目標(biāo)攻擊更具有針對(duì)性,能夠充分發(fā)揮武器效能。本文為所提算法給出了相應(yīng)的仿真實(shí)例。
無(wú)人作戰(zhàn)飛機(jī)偵察/打擊一體化典型的作戰(zhàn)模式是UCAV飛到作戰(zhàn)區(qū)域進(jìn)行偵察巡邏,偵察到目標(biāo)之后,由其機(jī)載武器摧毀地面目標(biāo);一旦條件改變失去目標(biāo),UCAV則恢復(fù)巡邏狀態(tài),繼續(xù)進(jìn)行偵察,然后攻擊進(jìn)行摧毀。在完成任務(wù)之后,UCAV退出作戰(zhàn)區(qū),返回基地。其任務(wù)剖面圖如圖1所示。
本文討論UCAV在到達(dá)作戰(zhàn)區(qū)域上空后,對(duì)該區(qū)域進(jìn)行偵察后確定攻擊目標(biāo)時(shí)的目標(biāo)分配問(wèn)題進(jìn)行研究,并做以下設(shè)定:各架UCAV級(jí)別相同;各機(jī)利用自身的傳感器獲取的戰(zhàn)場(chǎng)信息上傳指揮控制站,由控制站對(duì)所獲取的戰(zhàn)場(chǎng)信息進(jìn)行處理,并將處理結(jié)果下傳至各機(jī)。在作戰(zhàn)區(qū)域執(zhí)行偵察打擊任務(wù)時(shí),各架UCAV所掛載武器、在作戰(zhàn)區(qū)域空間所處的位置以及自身運(yùn)動(dòng)狀態(tài)等方面存在差別,導(dǎo)致各架飛機(jī)攻擊同一目標(biāo)時(shí),對(duì)目標(biāo)造成的毀傷效果和付出的代價(jià)不完全相同。在偵察中搜索到的目標(biāo)所具有的個(gè)體屬性價(jià)值和社會(huì)屬性價(jià)值也是不盡相同的。個(gè)體屬性價(jià)值是指用人力、物力、財(cái)力等修建這個(gè)目標(biāo)所需要的成本,社會(huì)屬性價(jià)值是指將目標(biāo)擊毀所產(chǎn)生的政治、經(jīng)濟(jì)、軍事、外交等方面的影響所隱含的價(jià)值。
圖1 UCAV作戰(zhàn)剖面圖Fig.1 UCAV combat profile
作戰(zhàn)體系結(jié)構(gòu)采用集中式體系結(jié)構(gòu)。集中式體系結(jié)構(gòu)對(duì)UCAV的智能化程度要求相對(duì)較低。如圖2所示,地面控制中心接受各UCAV傳來(lái)的戰(zhàn)場(chǎng)信息和自主決策信息,結(jié)合軍用偵察衛(wèi)星等平臺(tái)提供的相關(guān)信息,對(duì)戰(zhàn)場(chǎng)態(tài)勢(shì)進(jìn)行評(píng)估,根據(jù)所選擇的評(píng)估指標(biāo),在各機(jī)自主決策基礎(chǔ)上進(jìn)行協(xié)同目標(biāo)分配決策,分別給各UCAV分配目標(biāo),再由UCAV對(duì)目標(biāo)進(jìn)行打擊。
圖2 UCAV集中式體系結(jié)構(gòu)Fig.2 Centralized system structure of UCAV
2.2.1 自主決策函數(shù)
在UCAV對(duì)地作戰(zhàn)中,各架UCAV根據(jù)掛載的武器類型的不同,要確定自主決策函數(shù)。無(wú)人作戰(zhàn)飛機(jī)在對(duì)目標(biāo)進(jìn)行偵察后,在沒(méi)有地面指揮控制中心及其他信息共享平臺(tái)信息支援的條件下,UCAV依靠自身傳感器所獲得的態(tài)勢(shì)數(shù)據(jù)按照優(yōu)先準(zhǔn)則構(gòu)造自主決策函數(shù)。
假設(shè)一個(gè)編隊(duì)有m架無(wú)人機(jī),經(jīng)偵察后發(fā)現(xiàn)有n個(gè)不同類型的目標(biāo),控制中心對(duì)各個(gè)目標(biāo)的個(gè)體屬性和社會(huì)屬性價(jià)值綜合進(jìn)行歸一化評(píng)估。設(shè)vj為第j個(gè)目標(biāo)的價(jià)值歸一化值,0≤vj≤1,j=1,2,3,…,n;設(shè)第 i架無(wú)人機(jī)對(duì)第 j個(gè)目標(biāo)的毀傷概率為 pi,j,其中 i=1,2,3,…,m;j=1,2,3,…,n,則第 i架飛機(jī)對(duì)第 j個(gè)目標(biāo)的毀傷期望為
第i架無(wú)人機(jī)對(duì)各目標(biāo)的毀傷期望函數(shù)為
2.2.2 協(xié)同決策函數(shù)
設(shè)各架UCAV歸一化的綜合屬性價(jià)值權(quán)重為si,0≤si≤1,i=1,2,3,…,m;qi,j表示第 i架無(wú)人機(jī)被第 j個(gè)目標(biāo)毀傷的概率,i=1,2,3,…,m;j=1,2,3,…,n;則第i架無(wú)人機(jī)被第j個(gè)目標(biāo)的毀傷期望為
則第i架無(wú)人機(jī)被各目標(biāo)反擊所付出的代價(jià)函數(shù)為
由式(2)推出:
式中,e*為UCAV的自主決策函數(shù)。由式(4)推出:
式中,w*為UCAV的代價(jià)函數(shù)。
在無(wú)人機(jī)自主決策函數(shù)和代價(jià)函數(shù)基礎(chǔ)上構(gòu)造協(xié)同決策函數(shù)y(e*,w*)為
基于協(xié)同決策函數(shù) y(e*,w*),構(gòu)造由 di,j構(gòu)成的價(jià)值 /代價(jià)矩陣 D=(di,j)m×n,di,j為第 i架 UCAV 對(duì)第 j個(gè)目標(biāo)的價(jià)值/代價(jià)的比值,其中:i=1,2,3,…,m;j=1,2,3,…,n。
以價(jià)值/代價(jià)比最優(yōu)、避免目標(biāo)重復(fù)分配為原則構(gòu)造指標(biāo)函數(shù):
文獻(xiàn)[11]介紹了基于改進(jìn)矩陣法的目標(biāo)分配算法,但是該方法只考慮了我方的對(duì)策,沒(méi)有考慮敵方對(duì)我方的行動(dòng)可能會(huì)采取的對(duì)策。本文提出一種基于博弈論的目標(biāo)分配算法。該算法的基本思想是:首先建立UCAV攻擊地面目標(biāo)的價(jià)值/代價(jià)矩陣,然后根據(jù)選取規(guī)則,搜索符合條件的元素,并將該元素所對(duì)應(yīng)的目標(biāo)分配至編隊(duì)中相應(yīng)的飛機(jī)。其具體分配步驟描述如下。
1)建立價(jià)值/代價(jià)矩陣。
di,j為第i架UCAV對(duì)第j個(gè)目標(biāo)的價(jià)值/代價(jià)的比值。
2)確定第一架飛機(jī)攻擊對(duì)象。以尋求最大或最重要目標(biāo)優(yōu)先被毀傷為原則,首先搜索全局矩陣,得到最大的元素 di,j,記下腳標(biāo) i,j;將第 i架 UCAV 與第 j個(gè)目標(biāo)配對(duì),即飛機(jī) Ui攻擊目標(biāo) Mj,記為:Ui→Mj。
3)調(diào)整價(jià)值/代價(jià)矩陣,確定攻擊Ui的目標(biāo)。根據(jù)博弈的過(guò)程,在我方確定首要攻擊目標(biāo)后,敵方會(huì)出動(dòng)防御系統(tǒng)進(jìn)行攔截,以我方出動(dòng)飛機(jī)Ui為例,則敵方會(huì)在其所有的防御系統(tǒng)中選取對(duì)Ui毀傷價(jià)值/代價(jià)最大(在矩陣D中為最小)的武器進(jìn)行攔截,因此先將元素 di,j乘以系數(shù) β,β 是價(jià)值/代價(jià)下降系數(shù),取值[0,1),β=0表示目標(biāo)被選為攻擊對(duì)象,被完全毀傷等情況。然后在第i行尋找最小的非零元素,得到元素di,a,a=1,2,3,…,n;a≠j,即敵方會(huì)出動(dòng)目標(biāo) Ma攔截Ui,記為:。
4)再次調(diào)整價(jià)值/代價(jià)矩陣,確定攻擊目標(biāo)Ma的UCAV。本著消滅敵人、保存自己的原則,我方在除Ui以外的UCAV中選取對(duì)目標(biāo)Ma價(jià)值/代價(jià)最大的UCAV去攻擊目標(biāo)Ma。因此先將矩陣D的元素di,a乘以系數(shù)β,然后在矩陣D第a列中搜索最大的元素,得到元素 dc,a,記下腳標(biāo) c,a;即飛機(jī) Uc攻擊目標(biāo) Ma,記為:。
5)判斷目標(biāo)是否完全分配完成。若未完成,則重復(fù)3)~4)的過(guò)程為其他飛機(jī)分配目標(biāo),直至完成全部目標(biāo)分配。
6)分配結(jié)果提取規(guī)則:以價(jià)值/代價(jià)最優(yōu)、避免目標(biāo)重復(fù)分配為規(guī)則,優(yōu)化目標(biāo)分配結(jié)果。
基于博弈論的目標(biāo)分配算法流程圖如圖3所示。
圖3 基于博弈論的目標(biāo)分配算法流程Fig.3 Simulation flow chart of target assignment based on game theory
本節(jié)對(duì)上一節(jié)提出的基于博弈論的目標(biāo)分配算法進(jìn)行了仿真分析。
假定編隊(duì)中,UCAV數(shù)m=10,通過(guò)偵察獲得目標(biāo)數(shù)n=7,目標(biāo)的價(jià)值歸一化值 V=[0.2161,0.2403,0.0337,0.2423,0.1678,0.0259,0.0739]。各 UCAV 對(duì)目標(biāo)的毀傷概率如表1所示,UCAV的價(jià)值歸一化值S=[0.0854,0.1495,0.1507,0.0246,0.1516,0.1494,0.0758,0.125,0.0222,0.0658],UCAV 被目標(biāo)擊毀的概率如表2所示,表中值是服從高斯分布的隨機(jī)數(shù)。由式(7)得到無(wú)人作戰(zhàn)飛機(jī)的價(jià)值/代價(jià)矩陣D,見(jiàn)表3。根據(jù)式(8)、式(9),運(yùn)用基于博弈論的目標(biāo)分配算法,價(jià)值/代價(jià)下降系數(shù)β設(shè)置為0,取=n,通過(guò)Matlab 編程仿真,得到最優(yōu)化結(jié)果如表4所示。表中0值表示飛機(jī)沒(méi)有分配到目標(biāo)。
表1 10架UCAV對(duì)7個(gè)目標(biāo)的毀傷概率Table 1 Kill probability of 10 UCAVs to 7 targets
表2 10架UCAV被7個(gè)目標(biāo)毀傷的概率函數(shù)Table 2 Kill probability of 7 targets to 10 UCAVs
表3 10架UCAV對(duì)7個(gè)目標(biāo)毀傷的價(jià)值/代價(jià)函數(shù)Table 3 Value/cost ratio of 10 UCAVs to 7 targets
表4 10架UCAV對(duì)7個(gè)目標(biāo)的分配結(jié)果Table 4 Target assignment result of 10 UCAVs to 7 targets
由表4的結(jié)果可以看出,本文根據(jù)價(jià)值/代價(jià)最優(yōu)、避免重復(fù)分配的原則建立的指標(biāo)函數(shù),運(yùn)用基于博弈論的目標(biāo)分配算法,可以獲得合理可行的目標(biāo)分配組合。
本文就無(wú)人作戰(zhàn)飛機(jī)察/打擊一體化背景下,針對(duì)集中式體系結(jié)構(gòu)下的無(wú)人作戰(zhàn)飛機(jī)協(xié)同對(duì)地攻擊目標(biāo)分配問(wèn)題進(jìn)行了研究,建立了UCAV對(duì)地攻擊目標(biāo)分配模型。構(gòu)建了自主決策函數(shù)和協(xié)同決策函數(shù),提出了一種基于價(jià)值/代價(jià)比最優(yōu)的效率指標(biāo)函數(shù),根據(jù)所建立的模型,提出了基于博弈論的目標(biāo)分配方法。仿真結(jié)果表明,該算法是可行和有效的。
[1]U.S.Office of the Secretary of Defense.Unmanned aircraft system roadmap 2005-2030[R].A572734,2005.
[2]CHANDLER P R,PATCHER M,NYGARD K E,et al.Cooperative control for target classification[M].Cooperative Control and Optimization,Kluwer Academic Publishers,2002.
[3]TIERNO J E.Distributed autonomous control of concurrent combat tasks[C]//Proceeding of the American Control Conference,Arlington,VA,June 25-27,2001:37-42.
[4]張安,史志富,劉海燕,等.基于貝葉斯優(yōu)化算法的UCAV編隊(duì)對(duì)地攻擊協(xié)同任務(wù)分配[J].電光與控制,2009,16(1):1-5.
[5]GRIGGS B J,PARNELL G S.An air mission planning algorithm using decision analysis and mixed integer programming[J].Operations Research,1997,45(5):662-676.
[6]葉媛媛,閔春平,沈林成,等.基于滿意決策的多UAV協(xié)同目標(biāo)分配方法[J].國(guó)防科技大學(xué)學(xué)報(bào),2005,27(4):116-120.
[7]GARAGIC D,CRUZ J B.Target allocation using a binary integer programming with fuzzy objective[Z].OSU Workshop for DARPA MICA Program,2002.
[8]CHEN G S,CRUZ J B.Genetic algorithm for task allocation in UAV cooperative control[C]//AIAA Guidance,Navigation,and Control Conference and Exhibit,11-14 August 2003,Austin,Texas,AIAA 2003,5582:11-14.
[9]羅紅英,劉進(jìn)忙.遺傳算法在目標(biāo)優(yōu)化分配中的應(yīng)用[J].電光與控制,2008,15(3):18-20.
[10]周燾,于雷,任波.基于免疫算法的空戰(zhàn)目標(biāo)分配[J].電光與控制,2007,14(5):24-27.
[11]楊濤,周德云,杜昌平,等.改進(jìn)的無(wú)人機(jī)編隊(duì)內(nèi)目標(biāo)分配算法研究[J].計(jì)算機(jī)測(cè)量與控制,2008,16(11):1641-1643.
[12]孫永芹,馬響玲,葉文,等.超視距多機(jī)協(xié)同多目標(biāo)攻擊系統(tǒng)研究[J].系統(tǒng)仿真學(xué)報(bào),2008,20(8):2161-2164.
[13]付超,楊善林.基于博弈論的多無(wú)人機(jī)協(xié)同作戰(zhàn)仿真系統(tǒng)[J].系統(tǒng)仿真學(xué)報(bào),2009,21(9):2591-2594.