摘" 要: 多無人機(jī)任務(wù)分配問題是一種多約束組合優(yōu)化問題,為獲得問題的最佳收益,建立一種符合戰(zhàn)場(chǎng)環(huán)境的任務(wù)分配模型,并同步完成無人機(jī)與目標(biāo)之間的航跡規(guī)劃,以實(shí)際飛行距離替代直線距離,實(shí)現(xiàn)任務(wù)分配與航跡規(guī)劃的緊耦合。為更好地求解任務(wù)分配模型,首先提出一種改進(jìn)海洋捕食者算法(LGMPA),通過使用對(duì)數(shù)螺旋策略和高斯分布估計(jì)策略來提升算法的開發(fā)和探索能力;然后將改進(jìn)算法離散化處理,應(yīng)用于求解多無人機(jī)任務(wù)分配模型。仿真結(jié)果表明:在考慮實(shí)際地形和各類威脅下,使用實(shí)際飛行距離替代直線距離能夠規(guī)劃出更合理的任務(wù)執(zhí)行順序,得到更好的作戰(zhàn)收益;且改進(jìn)算法能夠穩(wěn)定有效地求解模型,具有較好的求解精度和更快的收斂速度。
關(guān)鍵詞: 多無人機(jī); 協(xié)同任務(wù)分配; 航跡規(guī)劃; 飛行距離; 改進(jìn)海洋捕食者算法(LGMPA); 性能測(cè)試
中圖分類號(hào): TN919?34; TP301.6" " " " " " " " " 文獻(xiàn)標(biāo)識(shí)碼: A" " " " " " " " " " "文章編號(hào): 1004?373X(2025)04?0109?10
Method of multiple UAV cooperative task allocation based on LGMPA algorithm
ZHANG Zhuoran1, CHENG Hua2, HAN Bo3, XIE Lei2, TANG Andi2
(1. Unit 93184 of the PLA, Beijing 100076, China; 2. Air Force Engineering University, Xi’an 710038, China;
3. Science and Technology on Complex Aviation Systems Simulation Laboratory, Beijing 100076, China)
Abstract: The multi?UAV task allocation problem is a multi?constrained combined optimization problem. In order to obtain the best benefit of the problem, a task allocation model that matches the battlefield environment is established. The path planning between UAV (unmanned aerial vehicle) and target is completed simultaneously. The real flight distance is used to replace the straight?line distance, so as to realize the tight coupling between task allocation and path planning. A marine predator algorithm with logarithmic spiral strategy and the Gaussian distribution estimation strategy (LGMPA) is proposed to better solve the task allocation model. The exploitation and exploration ability of the algorithm is enhanced by means of the logarithmic spiral strategy and the Gaussian distribution estimation strategy. The LGMPA is discretized and applied to solve the multi?UAV task allocation model. The simulation results show that the use of the real flight distance instead of the straight?line distance can plan a more reasonable task execution sequence and get better combat profit under the consideration of the real terrain and various types of threats. The LGMPA can solve the model stably and effectively, with better solution accuracy and faster convergence speed.
Keywords: unmanned aerial vehicle; cooperative task allocation; path planning; flight distance; LGMPA; performance testing
0" 引" 言
隨著無人機(jī)在現(xiàn)代戰(zhàn)場(chǎng)上的不斷成功運(yùn)用,其面臨的戰(zhàn)場(chǎng)環(huán)境變得日趨復(fù)雜,承擔(dān)的作戰(zhàn)任務(wù)更加多樣,對(duì)于它的要求也越來越高,單無人機(jī)逐漸難以完成任務(wù),因此多無人機(jī)協(xié)同作戰(zhàn)成為新的發(fā)展方向。其中,多無人機(jī)任務(wù)分配技術(shù)是無人機(jī)任務(wù)規(guī)劃中的關(guān)鍵技術(shù),是指在復(fù)雜戰(zhàn)場(chǎng)環(huán)境中為己方無人機(jī)合理分配有序任務(wù),使得總體作戰(zhàn)效能達(dá)到最大[1]。多無人機(jī)任務(wù)分配問題本質(zhì)上是一個(gè)多約束組合優(yōu)化問題,是一種典型的“NP?hard”問題[2],其核心主要包括任務(wù)分配模型建立和模型求解算法兩方面。
對(duì)于任務(wù)分配模型來說,國內(nèi)外常用的任務(wù)分配模型有:車輛路徑問題模型[3]、多旅行商問題模型[4?5]、合同網(wǎng)拍賣模型[6]、混合整數(shù)線性規(guī)劃模型[7?8]等。文獻(xiàn)[9]提出通信約束下的混合整數(shù)線性規(guī)劃模型來處理無人機(jī)的任務(wù)分配問題。文獻(xiàn)[10]提出一種考慮目標(biāo)和無人機(jī)之間約束的合同網(wǎng)拍賣模型。文獻(xiàn)[11]基于UCAV飛行特性和戰(zhàn)場(chǎng)環(huán)境的約束條件,建立了無人機(jī)任務(wù)分配模型。
求解模型的算法通常分為兩類:一類是傳統(tǒng)的優(yōu)化方法,例如動(dòng)態(tài)規(guī)劃[12]、混合整數(shù)線性規(guī)劃[13];另一類則是智能優(yōu)化算法,例如鯨魚優(yōu)化算法[14]、粒子群優(yōu)化算法[15]、遺傳算法[16]。隨著問題復(fù)雜度不斷增加,傳統(tǒng)的優(yōu)化方法難以在合理的時(shí)間內(nèi)獲得優(yōu)質(zhì)解,而群智能算法不依賴問題模型,不需要梯度信息,具有搜索能力強(qiáng)及適用范圍廣等優(yōu)點(diǎn),因此被廣泛用于求解無人機(jī)任務(wù)規(guī)劃問題。
海洋捕食者算法(Marine Predator Algorithm, MPA)是由文獻(xiàn)[17]提出的一種新穎的基于種群的自然啟發(fā)式優(yōu)化算法,其靈感主要來源于海洋捕食者不同的覓食策略以及捕食者和獵物之間的最佳遭遇率策略。研究結(jié)果表明,與GA、PSO、GSA、CS、SSA和CMA?ES相比,MPA具有較好的性能,因此已被廣泛用于處理許多實(shí)際的工程問題,例如:光伏領(lǐng)域[18]、電力系統(tǒng)[19]、任務(wù)調(diào)度[20]。然而MPA也存在一些不足,如該方法在進(jìn)行種群位置更新時(shí),主要是在最優(yōu)個(gè)體附近進(jìn)行搜索,而沒有利用更多個(gè)體的有效信息,這容易導(dǎo)致種群多樣性降低,易于陷入局部最優(yōu)。此外,MPA常用于連續(xù)優(yōu)化問題,對(duì)于離散問題難以解決。
現(xiàn)有的任務(wù)分配模型在考慮無人機(jī)和目標(biāo)之間的距離時(shí),通常使用它們之間的直線距離,但是在實(shí)際作戰(zhàn)過程中,由于需要躲避偵察和威脅,以及跟隨地形飛行,無人機(jī)的實(shí)際路徑不會(huì)是一條直線,而是一條曲線,曲線相較于直線增加了距離,這可能會(huì)導(dǎo)致無法獲得實(shí)際作戰(zhàn)效能最大的任務(wù)分配結(jié)果;同時(shí)大多數(shù)任務(wù)分配模型由于只考慮直線距離,因此只能給出目標(biāo)打擊順序,無法規(guī)劃出具體飛行路徑。另一方面,由無免費(fèi)午餐理論[21]可知,沒有任何一種算法能夠解決所有優(yōu)化問題,這促使研究者們需要不斷提出新算法或改進(jìn)已有算法,從而更好地求解優(yōu)化問題。
針對(duì)以上問題,本文將無人機(jī)和目標(biāo)、目標(biāo)和目標(biāo)之間的距離用實(shí)際飛行距離表示,提出考慮實(shí)際飛行航跡的多無人機(jī)任務(wù)分配模型,實(shí)現(xiàn)任務(wù)分配和航跡規(guī)劃的緊耦合,從而同時(shí)分配打擊目標(biāo)和規(guī)劃路徑,并且由于引入實(shí)際飛行距離,目標(biāo)分配結(jié)果相比使用直線距離會(huì)更加真實(shí)有效。另一方面,為了克服基本海洋捕食者算法的不足,使用對(duì)數(shù)螺旋策略使每個(gè)個(gè)體能夠更好地搜索個(gè)體周圍空間,增強(qiáng)種群多樣性;同時(shí)提出一種考慮優(yōu)勢(shì)群體、最優(yōu)個(gè)體和自身信息的自適應(yīng)高斯分布估計(jì)策略,較好地平衡了算法的開發(fā)和探索能力,增強(qiáng)了算法的尋優(yōu)性能。此外,提出一種基于實(shí)數(shù)向量的編碼方式,將MPA成功應(yīng)用于求解混合整數(shù)規(guī)劃問題。
1" 多無人機(jī)任務(wù)分配模型
假定多架無人機(jī)在已知空域執(zhí)行攻擊任務(wù),需對(duì)任務(wù)區(qū)域內(nèi)的目標(biāo)進(jìn)行打擊。設(shè)無人機(jī)集合為[U={U1,U2,…,UNU}],[NU]為無人機(jī)數(shù)量;任務(wù)目標(biāo)集合為[T={T1,T2,…,TNT}],[NT]為目標(biāo)數(shù)量。無人機(jī)的作戰(zhàn)原則是盡快消滅高威脅目標(biāo),因此目標(biāo)的威脅程度和攻擊航程是任務(wù)分配研究需要考慮的兩方面因素?;诖?,建立如下任務(wù)分配模型。
1.1" 收益函數(shù)
第[i]架無人機(jī)攻擊第[j]個(gè)目標(biāo)的收益[Ji]與該目標(biāo)的威脅值[Tj]和執(zhí)行該任務(wù)的航跡代價(jià)相關(guān)?;诖耍瑯?gòu)造激光攻擊無人機(jī)整體打擊收益函數(shù)為:
[R=i=1NUηIi(1)DUTi,Ii(1)+k=2IiηIi(k)DTTIi(k-1),Ii(k)] (1)
式中:[Ii]表示第[i]架無人機(jī)分配的攻擊目標(biāo)序列;[η(Ii(k))]表示第[Ii(k)]個(gè)目標(biāo)的威脅值;[DUTi,Ii(1)]表示當(dāng)前無人機(jī)與第一個(gè)攻擊目標(biāo)的實(shí)際飛行距離;[DTTIi(k-1),Ii(k)]表示第[k-1]個(gè)目標(biāo)與第[k]個(gè)目標(biāo)的實(shí)際飛行距離;[D]表示歸一化的距離。由該式可見,分配攻擊目標(biāo)的時(shí)序不同會(huì)導(dǎo)致需要的攻擊距離不同,最終影響整體的攻擊收益。
1.2" 飛行距離
大多數(shù)任務(wù)分配模型中,無人機(jī)與目標(biāo)、目標(biāo)與目標(biāo)之間的距離都是使用歐氏距離。但在實(shí)際作戰(zhàn)過程中,由于地形、威脅等因素,無人機(jī)實(shí)際飛行路徑不一定都是直線,會(huì)由于低空貼地飛行和躲避威脅進(jìn)行曲線運(yùn)動(dòng),因此使用歐氏距離作為任務(wù)分配模型中的飛行距離不夠貼合實(shí)際。為充分考慮三維地形信息和威脅因素,本文使用文獻(xiàn)[22]中提出的無人機(jī)三維航跡規(guī)劃模型作為飛行距離輸入;同時(shí)為了避免在優(yōu)化過程中重復(fù)計(jì)算,構(gòu)建距離矩陣來存儲(chǔ)UAV與目標(biāo)、攻擊目標(biāo)和攻擊目標(biāo)的飛行距離。距離矩陣D公式如下:
[D=DUT1,1…DUT1,NT???DUTNU,1…DUTNU,NTDTT1,1…DTT1,NT???DTTNU,1…DTTNU,NT] (2)
[D=DDmax] (3)
1.3" 約束條件
1.3.1" 目標(biāo)分配約束
目標(biāo)分配結(jié)果需要保證每一個(gè)目標(biāo)都要分配有對(duì)應(yīng)的激光無人機(jī)進(jìn)行打擊,同時(shí)每架無人機(jī)的最大攻擊能力滿足武器載荷約束。該約束條件為:
[gA=maxsgni=1NUxij-1,maxIi-Imax≤0, ? i∈1,2,…,NU, j∈1,2,…,NT] (4)
式中:[xij]表示第[j]個(gè)目標(biāo)對(duì)第[i]架無人機(jī)的分配結(jié)果,取值為1表示有分配,取值為0表示無分配;[Imax]為無人機(jī)執(zhí)行打擊目標(biāo)數(shù)量的最大值。該式表示每個(gè)目標(biāo)只能分配給一架無人機(jī),且所有目標(biāo)都完成分配;同時(shí)考慮機(jī)載武器的限制,每架無人機(jī)被分配的目標(biāo)數(shù)不可超出其最大可執(zhí)行任務(wù)數(shù)。
1.3.2" 通信距離約束
為了能夠獲得精確的目標(biāo)態(tài)勢(shì)信息,激光無人機(jī)需在地面指控系統(tǒng)通信覆蓋范圍內(nèi)執(zhí)行任務(wù),因此構(gòu)造通信距離約束為:
[gC=maxDUCi-DCmaxlt;0, i∈{1,2,…,NU}] (5)
式中:[DUCi]表示第i架無人機(jī)與地面指控系統(tǒng)的距離;[DCmax]表示地面指控系統(tǒng)最大通信半徑。
1.3.3" 單機(jī)總航程約束
第[i]架無人機(jī)執(zhí)行所分配的全部打擊任務(wù)的總航程[Di]可表示為:
[Di=DUTi,Ii(1)+k=2IiDTTIi(k-1),Ii(k)] (6)
式中:[Ii]為第[i]架無人機(jī)的打擊目標(biāo)序列;[Ii]為第[i]架無人機(jī)分配的攻擊目標(biāo)總數(shù)。
總航程約束要求每架無人機(jī)實(shí)施攻擊需要的總航程滿足設(shè)計(jì)要求,即:
[gD=maxDi-Dmaxlt;0 , ?i∈{1,2,…,NU}] (7)
式中[Dmax]為無人機(jī)的最大航程。
1.3.4" 目標(biāo)函數(shù)
考慮以上收益函數(shù)和約束條件,采用懲罰函數(shù)法將多約束優(yōu)化問題轉(zhuǎn)化為無約束優(yōu)化問題,構(gòu)造目標(biāo)函數(shù)為:
[J=R-λ·gA+gC+gD] (8)
式中[λ]為懲罰因子,取值為105。[J]越大,表明任務(wù)分配結(jié)果收益越好。
2" 改進(jìn)海洋捕食者算法
2.1" 基本海洋捕食者算法
海洋捕食者算法是一種基于種群的智能優(yōu)化算法,為了保證搜索質(zhì)量,初始解盡可能均勻分布在搜索空間中。
[X1=Xmin+rand(1,dim)·(Xmax-Xmin)] (9)
式中:[Xmax]和[Xmin]分別表示搜索空間的上下邊界;[dim]表示種群的維度。
MPA主要分為三個(gè)階段:探索階段、平衡階段和開發(fā)階段,分別在尋優(yōu)過程的前、中、后期進(jìn)行。
1) 探索階段:該階段通常發(fā)生在迭代初期,為了搜索到更多的空間,捕食者的行動(dòng)主要服從布朗運(yùn)動(dòng),布朗運(yùn)動(dòng)的大步長(zhǎng)有利于發(fā)揮算法的探索能力。探索階段的數(shù)學(xué)模型如下所示:
[iterlt;13itermax]
[Stepsizei=RB×(Elite-RB×Preyi)," "i=1,2,…,n] (10)
[Preyi=Preyi+P?R×Stepsizei] (11)
式中:[iter]表示當(dāng)前迭代數(shù);[itermax]表示最大迭代次數(shù);[RB]是一個(gè)服從基于布朗運(yùn)動(dòng)的正態(tài)分布的隨機(jī)向量;[Preyi]表示第[i]個(gè)個(gè)體的位置信息;[Elite]是全局最優(yōu)個(gè)體位置信息;[P]是一個(gè)取值為0.5的常數(shù);[R∈(0,1)]是一個(gè)均勻分布的隨機(jī)向量。
2) 平衡階段:在這個(gè)階段,捕食者要兼顧對(duì)搜索空間的探索和開發(fā),因此將種群分為兩部分,一部分依靠布朗運(yùn)動(dòng)的大步長(zhǎng)進(jìn)行大范圍搜索,另一部分則利用Lévy分布的較小步長(zhǎng)進(jìn)行深入搜索。該階段數(shù)學(xué)模型描述如下:
[13itermax≤iterlt;23itermax]
對(duì)于第一部分種群,主要進(jìn)行開發(fā)行為:
[Stepsizei=RL×(Elite-RL×Preyi)," "i=1,2,…,n] (12)
[Preyi=Preyi+P?R?Stepsizei] (13)
式中[RL]是一個(gè)服從萊維分布的隨機(jī)向量。
對(duì)于第二部分種群,主要進(jìn)行探索行為:
[Stepsizei=RB×(RB×Elite-Preyi)," "i=1,2,…,n] (14)
[Preyi=Elite+P?CF×Stepsizei] (15)
[CF=1-iteritermax2iteritermax] (16)
式中[CF]是控制捕食者步長(zhǎng)的自適應(yīng)參數(shù)。
3) 開發(fā)階段:在搜索的最后階段,捕食者對(duì)搜索空間進(jìn)行局部開發(fā),該階段數(shù)學(xué)模型如下:
[itergt;23itermax]
[Stepsizei=RL×(RL×Elite-Preyi)] (17)
[Preyi=Elite+P?CF×Stepsizei] (18)
此外,魚類聚集設(shè)備(Fish Aggregating Devices, FADs)容易被捕食者作為食物,從而丟失真正的獵物。因此為了躲避FADs,使用更大的步長(zhǎng)進(jìn)行移動(dòng)。該行為數(shù)學(xué)模型描述如下:
[Preyi=Preyi+CF?[Xmin+R×(Xmax-Xmin)]×U, rand≤FPreyi+[F?(1-r)+r](Preyr1-Preyr2)," " " " " randgt;F] (19)
式中:F為FADs,[F=0.2],表示受到FADs影響的概率;[U]是一個(gè)包括0或1的二元向量,當(dāng)生成一個(gè)0~1的隨機(jī)向量且小于0.2時(shí),將向量元素均改為0,反之,則改為1;[Preyr1]和[Preyr2]為隨機(jī)選擇的兩個(gè)個(gè)體。
2.2" 改進(jìn)策略
分析基本MPA可知,MPA主要依靠全局最優(yōu)個(gè)體進(jìn)行開發(fā)和探索,沒有充分利用其余個(gè)體的有效信息,導(dǎo)致種群多樣性降低,從而陷入局部最優(yōu)。為了增強(qiáng)種群多樣性、提高算法性能,本文提出融合對(duì)數(shù)螺旋策略和高斯分布估計(jì)策略的改進(jìn)海洋捕食者算法(LGMPA)。首先利用對(duì)數(shù)螺旋策略改進(jìn)算法的探索行為擴(kuò)大搜索范圍;其次利用高斯分布估計(jì)策略來采樣優(yōu)勢(shì)種群信息,引導(dǎo)種群進(jìn)化。
2.2.1" 對(duì)數(shù)螺旋策略
文獻(xiàn)[23]提出的鯨魚優(yōu)化算法通過形成氣泡網(wǎng)進(jìn)行捕食,其螺旋包圍的策略有利于搜索個(gè)體周圍空間,增強(qiáng)種群多樣性。而MPA在進(jìn)行探索時(shí),忽略了對(duì)個(gè)體附近空間的搜尋,因此本文通過引入對(duì)數(shù)螺旋策略來調(diào)整探索行為。具體數(shù)學(xué)模型描述如下:
[Preyi=Preyi+ebl?cos(2πl(wèi))?Stepsizei] (20)
[Preyi=Elite+ebl?cos(2πl(wèi))?Stepsizei] (21)
[l=2?(1-iteritermax)-1] (22)
式中[b]為一個(gè)取值為1的常數(shù),用于控制螺旋線的形狀。通過使用對(duì)數(shù)螺旋策略,能夠更好地搜索每個(gè)個(gè)體的附近空間,從而增強(qiáng)種群多樣性。
2.2.2" 高斯分布估計(jì)策略
高斯分布估計(jì)策略通過概率模型來表示個(gè)體間關(guān)系,它利用當(dāng)前優(yōu)勢(shì)群體計(jì)算概率分布模型,并根據(jù)概率分布模型采樣生成新的子代種群,以此不斷迭代,最終得到最優(yōu)解。本文利用加權(quán)最大似然估計(jì)方法估計(jì)分布模型,取表現(xiàn)較好的前[12]種群作為優(yōu)勢(shì)種群,該算法數(shù)學(xué)模型描述如下:
[Prey=i=1NP2ωi×Preyi] (23)
[ωi=ln(NP2+0.5)-ln(i)i=1NP2(ln(NP2+0.5)-ln(i))] (24)
[Cov(i)=1NP2i=1NP2(Preyi-Prey)?(Preyi-Prey)T] (25)
[Preyi=Mean+y," y~N(0,Cov)] (26)
[Mean=0.7(w1?Prey+w2?Elite)+0.3?Preyi] (27)
[w1=(1-iteritermax)1-tan(π?(rand-0.5)itermax)] (28)
[w2=1-w1] (29)
式中:[Prey]表示優(yōu)勢(shì)種群加權(quán)均值;[NP]為種群數(shù)量;[ωi]表示優(yōu)勢(shì)種群中按適應(yīng)度值降序排列的權(quán)重系數(shù);[Cov]為優(yōu)勢(shì)種群的加權(quán)協(xié)方差矩陣;[w1]和[w2]分別表示加權(quán)均值和全局最優(yōu)個(gè)體的影響權(quán)重。在優(yōu)化前期,要盡可能大范圍探索,因此加權(quán)均值影響權(quán)重更大;而在后期要盡可能進(jìn)行局部開發(fā),因此最優(yōu)個(gè)體影響權(quán)重更大。在引入社會(huì)信息之外,本文還引入個(gè)體信息,避免個(gè)體信息的浪費(fèi)。因此在加權(quán)均值、最優(yōu)個(gè)體和自身三方面作用下,個(gè)體能夠在前期更多考慮種群進(jìn)化趨勢(shì)和自身信息,而在后期更多考慮最優(yōu)個(gè)體和自身信息,從而平衡算法的開發(fā)和探索,而這是智能優(yōu)化算法提升性能的關(guān)鍵所在。
綜上所述,LGMPA的偽代碼如下。
算法1:LGMPA算法
初始化種群數(shù)NP,最大迭代次數(shù)itermax,維數(shù)dim、上下邊界lb和ub,生成初始種群X1計(jì)算適應(yīng)度值;
While(iterlt;itermax)do
根據(jù)式(16)更新CF;
根據(jù)式(25)計(jì)算協(xié)方差Cov;
if randlt;0.5
根據(jù)式(26)更新種群位置;
else
If iter lt;[13]itermax
根據(jù)式(20)更新種群位置;
Else if [13]itermaxlt; iter lt;[23]itermax
If rand lt;0.5
根據(jù)式(21)更新種群位置;
else
根據(jù)式(13)更新種群位置;
end
else
根據(jù)式(18)更新種群位置;
End
End
根據(jù)式(19)更新種群位置;
End while
輸出最優(yōu)個(gè)體適應(yīng)度值和位置。
2.3" 任務(wù)分配編碼方式
LGMPA算法適用于求解連續(xù)優(yōu)化問題,但任務(wù)分配問題為典型的混合整數(shù)線性規(guī)劃問題,決策變量是離散的,因此,必須定義合適的編碼方式使個(gè)體位置映射到任務(wù)分配結(jié)果。采用基于實(shí)數(shù)向量的編碼方式建立個(gè)體位置與任務(wù)分配結(jié)果的映射關(guān)系,定義如下:
1) 問題的維度為所需要進(jìn)行打擊的目標(biāo)數(shù),個(gè)體的維度編號(hào)對(duì)應(yīng)目標(biāo)編號(hào);
2) 解的搜索空間范圍為[1,NU+1];
3) 個(gè)體位置整數(shù)部分對(duì)應(yīng)UAV的編號(hào),小數(shù)部分按升序?qū)?yīng)同一架UAV執(zhí)行任務(wù)的順序。為更清晰地描述映射關(guān)系,以3架UAV攻擊7個(gè)目標(biāo)為例進(jìn)行說明。此時(shí)問題維度為7,粒子尋優(yōu)空間搜索范圍為[1,4],粒子編碼如表1所示,任務(wù)解碼如表2所示。
3" 仿真實(shí)驗(yàn)與結(jié)果分析
為驗(yàn)證本文方法的有效性,將進(jìn)行以下兩方面測(cè)試。首先測(cè)試LGMPA算法解決單目標(biāo)測(cè)試函數(shù)的性能,其次驗(yàn)證引入實(shí)際飛行距離的必要性以及任務(wù)分配模型的可行性。
3.1" LGMPA性能測(cè)試
為驗(yàn)證LGMPA算法在求解優(yōu)化問題上的良好性能,本文使用CEC2020單目標(biāo)測(cè)試函數(shù)對(duì)算法進(jìn)行性能測(cè)試。測(cè)試集共包含10個(gè)測(cè)試函數(shù),最優(yōu)值和函數(shù)類型如表3所示。
選取HSES[24]、ELSHADE?SPACMA[25]、EBO with CMAR[26]、UMOEAsⅡ[27]算法進(jìn)行對(duì)比,這4個(gè)對(duì)比算法在CEC2018單目標(biāo)優(yōu)化大賽中取得了前5名的成績(jī),因此可用于對(duì)比驗(yàn)證LGMPA的性能。所有算法D=20,MaxFES=106,實(shí)驗(yàn)平臺(tái)為AMD R74800U(1.80 GHz)處理器,程序使用Matlab R2016b編寫并運(yùn)行,算法獨(dú)立運(yùn)行30次,實(shí)驗(yàn)結(jié)果統(tǒng)計(jì)如表4所示。
分析表4可知:5個(gè)算法均能在F1中穩(wěn)定取得最優(yōu)值;對(duì)于F2~F4,LGMPA表現(xiàn)較差,僅優(yōu)于HSES,但LGMPA能在F4上求得最佳解;對(duì)于F5~F7,LGMPA排在第2,僅次于UMOEAsⅡ,并且能在F5上獲得滿意的答案;對(duì)于F8~F10,LGMPA表現(xiàn)最好,并在F8和F10上取得更好的值,在F9也并列第2位。總的來說,LGMPA在5個(gè)算法中平均排名第2,僅次于UMOEAsⅡ,說明LGMPA具有較好的性能。
此外,為了說明LGMPA與各算法在統(tǒng)計(jì)學(xué)上的差異,在顯著性水平[α=0.05]的情況下,使用Wilcoxon秩和檢驗(yàn)[28],結(jié)果如表5所示。可以看出4種算法同LGMPA比較的p值均大于[α],說明5個(gè)算法之間沒有顯著差異,這也說明LGMPA具有和4個(gè)對(duì)比算法相近的性能。
綜上,本文提出的LGMPA在求解單目標(biāo)函數(shù)優(yōu)化問題時(shí)具有較好的性能。
3.2" 任務(wù)分配模型可行性測(cè)試
3.2.1" 仿真環(huán)境設(shè)置
設(shè)置戰(zhàn)場(chǎng)空間為[100 km×100 km],作戰(zhàn)任務(wù)為3架無人機(jī)打擊9個(gè)敵方目標(biāo),單架無人機(jī)最多分配4個(gè)目標(biāo),雙方初始狀態(tài)如表6所示。
3.2.2" 不同距離模型對(duì)比仿真
大多數(shù)任務(wù)分配模型在計(jì)算距離時(shí)都是使用兩點(diǎn)間的直線距離,忽略了地形因素的影響,從而導(dǎo)致分配結(jié)果不符合實(shí)際。本文提出使用預(yù)先規(guī)劃的飛行距離作為任務(wù)分配模型距離輸入,為說明這一改進(jìn)的必要性,在3.2.1節(jié)的仿真環(huán)境中進(jìn)行實(shí)驗(yàn)。為說明使用直線距離的不合理性,本次實(shí)驗(yàn)不考慮威脅因素,僅將地形因素考慮在內(nèi),分別以直線距離(方法一)、只考慮距離代價(jià)的飛行距離(方法二)、考慮距離代價(jià)和高度代價(jià)的飛行距離(方法三)三種距離輸入方式進(jìn)行求解,統(tǒng)計(jì)各自距離矩陣,結(jié)果如表7~表9所示。
從表7~表9距離矩陣可以得知:方法一的距離矩陣中的距離是三種方法中最小的;方法二的距離矩陣則比方法一略大,這是因?yàn)榉椒ǘ豢紤]高度代價(jià),僅在計(jì)算距離代價(jià)時(shí)使用了高度信息;而考慮距離代價(jià)和高度代價(jià)的方法三的距離是最大的,這是由于無人機(jī)為了滿足低空飛行的要求,在使得飛行代價(jià)最小的前提下會(huì)選擇轉(zhuǎn)彎,避免爬升飛行地勢(shì)較高處,因此導(dǎo)致無人機(jī)的飛行距離相比方法一和方法二都要大。
表10給出了三種方法的最佳任務(wù)分配結(jié)果,最后一列是三種分配方式在方法三中的任務(wù)分配收益值。其中方法一和方法二的最佳分配方式是一樣的,這從兩種方法的距離矩陣比較相似就可以得知;而方法三的最佳分配方式和前兩種方法不一樣,這是因?yàn)樵诳紤]實(shí)際地形因素之后,無人機(jī)不可能總以直線飛行,因此存在執(zhí)行某些任務(wù)時(shí)實(shí)際飛行距離遠(yuǎn)大于直線距離,這也就導(dǎo)致這種任務(wù)分配情況不是最優(yōu),需要重新規(guī)劃。從表中也可以得知,使用方法一和方法二得到的任務(wù)分配方法并不能得到最好的作戰(zhàn)收益值,因此使用考慮地形因素的實(shí)際飛行距離作為輸入是必要的。同理,也可以得到考慮威脅因素也是必要的,因?yàn)闊o人機(jī)為了躲避威脅,需要轉(zhuǎn)彎飛行,這必然導(dǎo)致飛機(jī)距離的增加。綜上,在無人機(jī)任務(wù)分配模型中引入實(shí)際飛行距離是必要的,這有利于規(guī)劃出更好的作戰(zhàn)分配結(jié)果。
3.2.3" 任務(wù)分配模型可行性仿真
本節(jié)使用MPA、WOA、GEDGWO[29]、和LGMPA對(duì)提出的任務(wù)分配模型進(jìn)行求解,實(shí)驗(yàn)參數(shù)設(shè)置同3.2.1節(jié),[itermax]=300,[NP=50],每種算法獨(dú)立運(yùn)行10次,表11給出了4種算法的統(tǒng)計(jì)結(jié)果。
從表11可以得知,MPA、GEDGWO和LGMPA都能取得最佳的分配方式,而WOA無法取得最好的結(jié)果。LGMPA無論是平均值還是標(biāo)準(zhǔn)差,均優(yōu)于所有對(duì)比算法,表明LGMPA的性能優(yōu)于比較算法。由于篇幅限制,僅給出各算法具有最高收益值的任務(wù)執(zhí)行順序,如表12所示,其中MPA、GEDGWO和LGMPA是相同的。
此外,為進(jìn)一步驗(yàn)證引入威脅源因素的必要性,計(jì)算方法一和方法三的任務(wù)分配方式的收益值,分別為17.21和18.97,均小于19.47,這說明不考慮實(shí)際威脅做出的規(guī)劃不利于作戰(zhàn)取得更好的收益值,因此有必要在進(jìn)行任務(wù)分配時(shí)考慮威脅影響。為進(jìn)一步驗(yàn)證LGMPA在求解大規(guī)模多無人機(jī)任務(wù)分配問題時(shí)的性能,在3架無人機(jī)打擊9個(gè)目標(biāo)的基礎(chǔ)上擴(kuò)充到4架無人機(jī)打擊16個(gè)目標(biāo),部分無人機(jī)和目標(biāo)信息擴(kuò)充如表13所示。選取平均收益值更好的MPA和LGMPA進(jìn)行求解,分別運(yùn)行10次,統(tǒng)計(jì)結(jié)果如表14所示。
從表14可知,LGMPA的平均值、最大值都大于MPA,且標(biāo)準(zhǔn)差小于MPA,這說明在處理高維任務(wù)分配問題時(shí),LGMPA性能更好,能穩(wěn)定地給出收益更好的任務(wù)分配方案。表15給出兩種算法最好收益值的詳細(xì)分配方案。
為直觀地顯示任務(wù)分配結(jié)果,圖1給出了各算法具有最好收益值的任務(wù)執(zhí)行軌跡圖。
圖2給出了兩種方法運(yùn)行10次的平均收益值的收斂曲線。
圖2結(jié)果表明,LGMPA具有更快的收斂速度和較好的收斂精度,說明其具有更好的尋優(yōu)性能。為了分析兩種算法所求結(jié)果的分布特性,圖3列出了兩種算法的箱式圖,可以看出LGMPA獲得的結(jié)果分布更加密集,并且解的質(zhì)量更好。
4" 結(jié)" 語
針對(duì)多無人機(jī)協(xié)同離線任務(wù)分配問題,本文提出使用實(shí)際航線距離替代直線距離,實(shí)現(xiàn)任務(wù)分配與航跡規(guī)劃緊耦合,以便獲得更好的分配結(jié)果。為更好地求解任務(wù)分配模型,提出了使用對(duì)數(shù)螺旋策略和高斯分布估計(jì)策略的改進(jìn)海洋捕食者算法,保持算法的種群多樣性,提升了算法的開發(fā)和探索能力,避免陷入局部最優(yōu)。仿真實(shí)驗(yàn)結(jié)果表明:本文提出的改進(jìn)算法相比目前性能較好的CEC2020參賽算法仍具有競(jìng)爭(zhēng)力;引入實(shí)際飛行航跡距離替代直線距離對(duì)于更好的分配目標(biāo)是有必要的;改進(jìn)算法相比原始算法,能夠穩(wěn)定地獲得更好的任務(wù)分配結(jié)果。
注:本文通訊作者為程華。
參考文獻(xiàn)
[1] ZHAO Y, ZHENG Z, LIU Y. Survey on computation?al?intelligence?based UAV path planning [J]. Knowledge?based systems, 2018, 158: 54?64.
[2] EDISON E, SHIMA T. Integrated task assignment and path optimization for cooperating uninhabited aerial vehicles using genetic algorithms [J]. Computers amp; operations research, 2011, 38(1): 340?356.
[3] ARSIE A, SAVLA K, FRAZZOLI E. Efficient routing algorithms for multiple vehicles with no explicit communications [J]. IEEE transactions on automatic control, 2009, 54(10): 2302?2317.
[4] AL?FURHUD, AHMED Z H. Experimental study of a hybrid genetic algorithm for the multiple travelling salesman problem [J]. Mathematical problems in engineering, 2020(6): 13.
[5] AL?FURHUD, HUSSAIN Z. Genetic algorithms for the multiple travelling salesman problem [J]. International journal of advanced computer science and applications, 2020, 11(7): 553?560.
[6] ELGIBREEN H, YOUCEF?TOUMI K. Dynamic task allocation in an uncertain environment with heterogeneous multi?agents [J]. Autonomous robots, 2019(2): 1?26.
[7] OMER J, FARGES J L. Hybridization of nonlinear and mixed?integer linear programming for aircraft separation with trajectory recovery [J]. IEEE transactions on intelligent transportation systems, 2013, 14(3): 1218?1230.
[8] LUITPOLD B. Coordinated target assignment and UAV path planning with timing constraints [J]. Journal of intelligent amp; robotic systems, 2019, 3(4): 857?869.
[9] TLI E I, JOHANSEN T A. Path planning for UAVs under communication constraints using SPLAT! and MILP [J]. Journal of intelligent amp; robotic systems, 2012, 65(1): 265?282.
[10] 嚴(yán)飛,祝小平,周洲,等.考慮同時(shí)攻擊約束的多異構(gòu)無人機(jī)實(shí)時(shí)任務(wù)分配[J].中國科學(xué):信息科學(xué),2019,49(5):555?569.
[11] HUANG H, ZHUO T. Multi?model cooperative task assign?ment and path planning of multiple UCAV formation [J]. Multimedia tools and applications, 2019, 78(1): 415?436.
[12] KUO R J, CHENG W C. Hybrid meta?heuristic algorithm for job shop scheduling with due date time window and release time [J]. International journal of advanced manufacturing technology, 2013, 67(1/4): 59?71.
[13] SCHUMACHER C, CHANDLER P R, PACHTER M, et al. Optimization of air vehicles operations using mixed?integer linear programming [J]. Journal of the operational research society, 2007, 58(4): 516?527.
[14] LI Y, HAN T, ZHAO H, et al. An adaptive whale optimization algorithm using Gaussian distribution strategies and its application in heterogeneous UCAVs task allocation [J]. IEEE access, 2019(7): 110138?110158.
[15] DE A, KUMAR S K, GUNASEKARAN A, et al. Sustainable maritime inventory routing problem with time window constraints [J]. Engineering applications of artificial intelligence, 2017, 61: 77?95.
[16] 陳志旺,夏順,李建雄,等.考慮分配次序的無人機(jī)協(xié)同目標(biāo)分配建模與遺傳算法求解[J].控制理論與應(yīng)用,2019,36(7):1072?1082.
[17] FARAMARZI A, HEIDARINEJAD M, MIRJALILI S, et al. Marine predators algorithm: a nature?inspired metaheuristic [J]. Expert systems with applications, 2020, 152: 113377.
[18] RIDHA H M. Parameters extraction of single and double diodes photovoltaic models using marine predators algorithm and lambert W function [J]. Solar energy, 2020, 209: 674?693.
[19] SHAHEEN M, YOUSRI D, HASANIEN H M, et al. A novel application of improved marine predators algorithm and particle swarm optimization for solving the ORPD problem [J]. Energies, 2020, 13(21): 1?23.
[20] ABDEL B M, MOHAMED R, ELHOSENY M, et al. Energy?aware marine predators algorithm for task scheduling in IoT?based fog computing applications [J]. IEEE transactions on industrial informatics, 2020, 17(7): 5068?5076.
[21] WOLPERT D H, MACREADY W G. No free lunch theorems for optimization [J]. IEEE transactions on evolutionary computation, 1997, 1(1): 67?82.
[22] 湯安迪,韓統(tǒng),徐登武,等.混沌多精英鯨魚優(yōu)化算法[J].北京航空航天大學(xué)學(xué)報(bào),2021,47(7):1481?1494.
[23] MIRJALILI S, LEWIS A. The whale optimization algorithm [J]. Advances in engineering software, 2016, 95: 51?67.
[24] ZHANG G, SHI Y. Hybrid sampling evolution strategy for solving single objective bound constrained problems [C]// 2018 IEEE Congress on Evolutionary Computation. Rio de Janeiro, Brazil: IEEE, 2018: 1?7.
[25] MOHAMED A W, HADI A A, FATTOUH A M, et al. Lshade with semi?parameter adaptation hybrid with CMA?ES for solving CEC 2017 benchmark problems [C]// 2017 IEEE Congress on Evolutionary Computation (CEC). [S.l.]:IEEE, 2017: 145?152.
[26] KUMAR A. Improving the local search capability of effective butterfly optimizer using covariance matrix adapted retreat phase [C]// 2017 IEEE Congress on Evolutionary Computation (CEC). [S.l.]: IEEE, 2017: 145?147.
[27] SALLAM K M, ELSAYED S M, SARKER R A, et al. Improved united multi?operator algorithm for solving optimization problems [C]// IEEE World Congress on Computational Intelligence. Rio de Janeiro, Brazil: IEEE, 2018: 1?8.
[28] KOCHENGIN A E, CHRYSOSTOMOU G, SHIKHIN V A. Performance of nonparametric Wilcoxon test with reference to the samples with singularities [C]// 2019 III International Conference on Control in Technical Systems (CTS). St. Petersburg, Russial: IEEE, 2019: 265?268.
[29] WANG X F, ZHAO H, HAN T, et al. A grey wolf optimizer using Gaussian estimation of distribution and its application in the multi?UAV multi?target urban tracking problem [J]. Applied soft computing, 2019, 78: 240?260.
作者簡(jiǎn)介:張卓然(1990—),男,安徽舒城人,博士研究生,工程師,研究方向?yàn)闊o人飛行器作戰(zhàn)系統(tǒng)與技術(shù)。
程" 華(1980—),女,山西臨汾人,碩士研究生,講師,研究方向?yàn)楸骺茖W(xué)與技術(shù)。
韓" 博(1990—),男,陜西西安人,博士研究生,工程師,研究方向?yàn)闊o人飛行器作戰(zhàn)系統(tǒng)與技術(shù)。
謝" 磊(1997—),男,江蘇常州人,博士研究生,研究方向?yàn)闊o人作戰(zhàn)飛行機(jī)機(jī)動(dòng)決策、意圖識(shí)別、任務(wù)分配。
湯安迪(1996—),男,重慶永川人,碩士研究生,工程師,研究方向?yàn)槎酂o人機(jī)目標(biāo)分配、路徑規(guī)劃。