王 寧, 李 哲,*, 梁曉龍, 王玉冰, 侯岳奇
(1. 空軍工程大學(xué)空管領(lǐng)航學(xué)院, 陜西 西安 710051; 2. 陜西省電子信息系統(tǒng)綜合集成重點實驗室,陜西 西安 710051; 3. 中國人民解放軍95899部隊, 北京 100089)
無人機(unmanned aerial vehicle, UAV)在現(xiàn)代空戰(zhàn)中發(fā)揮著日益重要的作用,運用UAV集群執(zhí)行協(xié)同搜索、跟蹤、打擊、評估等作戰(zhàn)任務(wù)正日益成為UAV集群作戰(zhàn)應(yīng)用領(lǐng)域的研究熱點。UAV集群協(xié)同搜索任務(wù)是指利用UAV機載傳感器偵察任務(wù)區(qū)域,通過機間和地空通信網(wǎng)絡(luò)共享環(huán)境感知信息,最終完成對目標(biāo)的捕獲任務(wù)。UAV集群協(xié)同搜索任務(wù)能夠為后續(xù)干擾、跟蹤、攻擊、評估等行動的決策提供有效信息支撐,是集群作戰(zhàn)的重要環(huán)節(jié)。
針對UAV集群搜索航跡規(guī)劃問題,國內(nèi)外已有諸多學(xué)者進(jìn)行了廣泛研究,主要成果大致可以分為靜態(tài)規(guī)劃方法與動態(tài)規(guī)劃方法。在靜態(tài)規(guī)劃方面,主要包括Voronoi圖、格雷厄姆法、Dubins路徑規(guī)劃等區(qū)域處理和路徑規(guī)劃方法。其中,文獻(xiàn)[8]根據(jù)集群規(guī)模對任務(wù)區(qū)域進(jìn)行等面積劃分,通過建立人工勢場實現(xiàn)UAV避障,有效解決了任意形狀區(qū)域的任務(wù)分配和航跡規(guī)劃問題。文獻(xiàn)[9]采用凹點處凸分解的方法對非凸多邊形區(qū)域進(jìn)行劃分,通過“Z”型路徑及Dubins轉(zhuǎn)彎路徑模型對子區(qū)域內(nèi)覆蓋搜索路徑進(jìn)行規(guī)劃,建立了區(qū)域劃分與路徑規(guī)劃的整體調(diào)用框架,實現(xiàn)了任務(wù)區(qū)域的快速劃分和子區(qū)域內(nèi)搜索路徑的快速生成。文獻(xiàn)[10]根據(jù)UAV性能及環(huán)境區(qū)域?qū)挾冗M(jìn)行任務(wù)區(qū)域劃分,以UAV總轉(zhuǎn)彎次數(shù)最少為目標(biāo)函數(shù)進(jìn)行子區(qū)域內(nèi)的UAV路徑規(guī)劃,實現(xiàn)了UAV集群覆蓋搜索路徑的規(guī)劃。上述工作運用分治思想,首先對任務(wù)區(qū)域進(jìn)行分割,進(jìn)而確定子區(qū)域內(nèi)的UAV個體最優(yōu)搜索航跡,有效解決了靜態(tài)戰(zhàn)場環(huán)境中UAV集群協(xié)同效率低的問題,但難以應(yīng)對動態(tài)戰(zhàn)場環(huán)境中UAV被擊毀、故障等突發(fā)情況,具有一定的局限性。
針對動態(tài)戰(zhàn)場環(huán)境中的協(xié)同搜索問題,目前公開的研究成果主要包括信息素地圖、目標(biāo)概率地圖等地圖構(gòu)建方法與分布式模型預(yù)測控制(distributed model predictive control, DMPC)、滾動時域優(yōu)化(receding horizon optimization, RHO)等優(yōu)化求解方法。其中,文獻(xiàn)[11]通過定制環(huán)境更新算子,實現(xiàn)了不規(guī)則任務(wù)區(qū)域中的協(xié)同搜索。文獻(xiàn)[19]基于信息素地圖對環(huán)境進(jìn)行描述,建立了不同場景下的搜索回報函數(shù),采用DMPC方法進(jìn)行決策求解,有效完成了UAV集群的多任務(wù)協(xié)同。文獻(xiàn)[20]基于不確定性地圖和信息素地圖對環(huán)境進(jìn)行描述,建立了含目標(biāo)運動模型的搜索回報函數(shù),通過改進(jìn)鴿群算法完成了對運動目標(biāo)的集群協(xié)同搜索。文獻(xiàn)[21]建立了包含4種動目標(biāo)運動模型的環(huán)境概率地圖,通過改進(jìn)蟻群算法實現(xiàn)了UAV的實時動態(tài)決策。文獻(xiàn)[22]提出了一種帶障礙約束的離散最優(yōu)航跡節(jié)點求解算法,通過建立分辨率可變的環(huán)境地圖,提供了一種適用于不同運算性能條件下的UAV動態(tài)路徑規(guī)劃方法。文獻(xiàn)[3]基于目標(biāo)概率地圖和環(huán)境不確定地圖對環(huán)境進(jìn)行描述,建立了基于環(huán)境不確定圖更新的回訪機制,實現(xiàn)了UAV集群對動目標(biāo)的回訪搜索。
上述研究使UAV集群在動態(tài)戰(zhàn)場環(huán)境中具備了一定程度的協(xié)同搜索能力,但仍存在以下不足:
(1) 對集群協(xié)同搜索過程中的通信距離影響未予以考慮;
(2) 以覆蓋率作為衡量搜索效率的唯一指標(biāo),未同時考慮覆蓋搜索任務(wù)中對動目標(biāo)的搜索需求;
(3) 未考慮集群規(guī)模對協(xié)同搜索效率的影響。
針對上述問題,本文做了以下工作:
(1) 依據(jù)有效通信距離定義了協(xié)同搜索任務(wù)中3種典型通信場景,并設(shè)計了相應(yīng)的協(xié)同機制;
(2) 考慮協(xié)同搜索任務(wù)中對動目標(biāo)的搜索需求,引入了包含動目標(biāo)位置分布先驗信息的目標(biāo)概率圖,兼顧了覆蓋搜索任務(wù)中的動目標(biāo)搜索效率;
(3) 給出了通信距離受限條件下集群規(guī)模對協(xié)同搜索效率影響的定性分析。
運用幾何圖方法對任務(wù)區(qū)域進(jìn)行柵格化,并為每個柵格賦予能夠描述環(huán)境不確定度的數(shù)值,在UAV集群搜索過程中對環(huán)境不確定度進(jìn)行持續(xù)更新,如圖1所示。
圖1 任務(wù)區(qū)域柵格化Fig.1 Task area rasterization
用(,,)表示時刻柵格(,)的不確定度。(,,)=1表示時刻UAV對該柵格完全不了解;(,,)=0表示時刻UAV對該柵格已完全了解。(,,)的動態(tài)取值與柵格(,)被搜索的次數(shù)有關(guān),根據(jù)任務(wù)先驗信息對環(huán)境不確定度進(jìn)行初始化,定義其更新方式為
(,,+1)=(1-)·(,,)
(1)
式中:∈(0,1]為衰減因子,表示相應(yīng)柵格經(jīng)一次搜索后不確定度的消減量,當(dāng)=1時,表示相應(yīng)柵格中的靜態(tài)信息經(jīng)一次搜索即可完全獲取;為時刻柵格(,)被搜索的累積架次且滿足∈。
(,,0)=
(2)
式中:表示正態(tài)分布的離散程度;表示預(yù)估目標(biāo)存在位置的概率峰值,即先驗信息的可信度。
隨著搜索任務(wù)的不斷進(jìn)行,UAV對環(huán)境信息持續(xù)更新,考慮到UAV傳感器對目標(biāo)的判別水平,定義環(huán)境中的目標(biāo)存在概率更新公式為
(3)
式中:為UAV傳感器對目標(biāo)的探測概率;為傳感器對目標(biāo)的虛警概率,二者共同反映了UAV傳感器針對特定目標(biāo)的探測性能;(,,)∈{0,1}為時刻柵格(,)的實際情況,(,,)=1表示時刻柵格(,)存在目標(biāo),(,,)=0表示時刻柵格(,)不存在目標(biāo)。
自然界中存在著廣泛的生物集群協(xié)同行為,其中螞蟻等動物能夠通過分泌信息素實現(xiàn)集群運動過程中的信息傳遞與行為協(xié)同。為實現(xiàn)UAV在長時間搜索過程中對已搜索區(qū)域的有效回訪,本文定義了與任務(wù)時間相關(guān)聯(lián)的吸引信息素,用于引導(dǎo)UAV回訪相關(guān)區(qū)域,及時跟進(jìn)戰(zhàn)場態(tài)勢。
定義時刻柵格(,)處的信息素濃度為(,,),0時刻所有柵格都無需回訪,從而有(,,0)=0。定義柵格(,)的信息素濃度更新公式為
(,+1)=(1-)· [(1-)((,,)+1+1-(,)(,,+1))]
(4)
式中:表示信息素的揮發(fā)系數(shù);表示吸引信息素的傳播系數(shù);∈(0,1)為調(diào)節(jié)因子;(,,)為柵格(,)在時刻釋放的信息素值;(,)為柵格(,)上次被訪問的時間。
假設(shè)UAV集群能夠保持在同一高度飛行,則UAV運動模型可以近似為二維空間中以一定速度和方向運動的質(zhì)點。
設(shè)UAV集群為集合{|=1,2,…,},記在時刻的狀態(tài)向量為
(5)
為簡化協(xié)同搜索決策的解空間,以偏航角改變量()作為時刻的決策輸入,僅考慮UAV的平動運動。假設(shè)UAV只能向當(dāng)前柵格的臨近柵格移動,UAV在每個時刻有8種可飛方向,如圖2所示。決策集為
()∈{0,1,2,3,4,5,6,7}
(6)
圖2 UAV飛行決策集Fig.2 UAV flight decision set
則+1時刻的飛行方向為
(7)
式中:mod(·)表示取模運算。
以最大化UAV集群搜索效率為性能指標(biāo),建立包含以下內(nèi)容的搜索回報函數(shù)。
(1) 環(huán)境搜索收益
環(huán)境搜索收益是指UAV集群搜索過程中環(huán)境信息不確定度下降的度量,用于引導(dǎo)UAV集群完成對地靜目標(biāo)的搜索。借鑒采用信息熵描述信息不確定度的方法,根據(jù)先驗信息初始化0時刻的環(huán)境不確定地圖為
(,,0)=-(,,0)log(,,0)
(8)
式中:(,,0)為靜目標(biāo)分布的先驗信息。在UAV協(xié)同搜索過程中,環(huán)境不確定度隨著UAV對環(huán)境感知范圍不斷增加而下降。因此,定義柵格(,)和整個區(qū)域的搜索環(huán)境增益公式如下:
(,,)=-(,,)+(,,-1)=(,,)·[1-(1-)]
(9)
(10)
式中:∈(0,1]為環(huán)境不確定度衰減因子,一般取1,表示UAV集群對相應(yīng)柵格進(jìn)行一次搜索即可確定該柵格靜目標(biāo)分布情況。
(2) 目標(biāo)存在概率收益
目標(biāo)存在概率收益是指UAV完成對動目標(biāo)搜索過程中所獲取的概率收益,用于引導(dǎo)UAV在搜索過程中選擇目標(biāo)存在概率高的區(qū)域,采用UAV搜索過程中能夠探測到的目標(biāo)存在概率之和衡量目標(biāo)存在概率收益,即
(11)
式中:(,,)表示時刻UAV對柵格(,)處是否存在目標(biāo)的判別結(jié)果,(,,)=1表示時刻柵格(,)中存在目標(biāo),(,,)=0表示時刻柵格(,)中不存在目標(biāo),有:
(12)
式中:∈[05,1]為目標(biāo)存在概率閾值。
(3) 信息素收益
信息素收益是指UAV搜索過程中,對于長時間沒有關(guān)注的區(qū)域進(jìn)行搜索時所獲得的收益,該收益隨搜索間隔的增加以指數(shù)形式增長。用于引導(dǎo)UAV關(guān)注搜索時間間隔較長的區(qū)域:
()=·(,,)
(13)
式中:∈(1,15]為平衡因子,表示隨著任務(wù)時間的增加,環(huán)境不確定度下降的同時,UAV更加關(guān)注對長時間未回訪的柵格的搜索。
文獻(xiàn)[14]早在2001年提出了基于認(rèn)知地圖的UAV協(xié)同搜索框架,其主要內(nèi)容如下。
(1) UAV集群共用一個認(rèn)知地圖,根據(jù)自身傳感器的信息動態(tài)更新認(rèn)知地圖。
(2) 集群成員根據(jù)認(rèn)知地圖及其他信息,在合理的搜索策略指導(dǎo)下,在線決策UAV的飛行路徑。
這種協(xié)同搜索框架為協(xié)同搜索路徑規(guī)劃問題提供了有效思路,在此框架下已有不少研究成果。但這種框架并未對集群協(xié)同搜索過程中的通信問題予以充分考慮,具有一定的局限性。
針對通信距離受限的戰(zhàn)場環(huán)境,對上述框架進(jìn)行改進(jìn),改進(jìn)后的搜索框架主要包含以下內(nèi)容:
(1) UAV集群中每個成員在初始時刻攜帶一個認(rèn)知地圖,在搜索過程中根據(jù)傳感器信息實時更新自身認(rèn)知地圖,并產(chǎn)生預(yù)決策信息。
(2) 當(dāng)UAV之間的距離滿足通信條件時,UAV通過信息交互機制將自身認(rèn)知地圖與其他成員的認(rèn)知地圖進(jìn)行融合,獲取其他成員的預(yù)決策信息,在此基礎(chǔ)上進(jìn)一步?jīng)Q策產(chǎn)生輸入控制量。
(3) 當(dāng)UAV之間的距離不滿足通信條件時,UAV將預(yù)決策信息作為自身決策信息進(jìn)行動態(tài)航跡規(guī)劃。
在搜索回報函數(shù)的引導(dǎo)下,UAV集群中每個成員首先根據(jù)當(dāng)前自身環(huán)境認(rèn)知地圖進(jìn)行預(yù)決策,其次根據(jù)預(yù)決策結(jié)果更新環(huán)境認(rèn)知地圖,即產(chǎn)生預(yù)測環(huán)境認(rèn)知地圖,然后將預(yù)測環(huán)境認(rèn)知地圖與集群其他成員進(jìn)行交互融合,最后在完成信息交互的基礎(chǔ)上決策,實現(xiàn)動態(tài)航跡規(guī)劃。
集群中每架UAV根據(jù)搜索回報函數(shù)進(jìn)行預(yù)決策,此時引導(dǎo)UAV進(jìn)行預(yù)決策的搜索回報函數(shù)為
=·()+·()+·()
(14)
(15)
面向不同通信干擾強度下的戰(zhàn)場環(huán)境,本節(jié)依據(jù)機間有效通信距離,首先給出3種典型通信場景的定義,進(jìn)而提出相應(yīng)的UAV集群信息交互機制,分述如下。
給出時刻表征UAV集群內(nèi)通信連通性的二值鄰接矩陣():
(16)
式中:()代表集群成員與之間的通信連通性,若時刻與之間可以進(jìn)行有效通信,則()為1,否則為0。令:
(17)
若
(18)
則表示時刻UAV集群機間通信拓?fù)錇槿B通狀態(tài),即通信完全有效。若
(19)
則表示時刻UAV集群機間通信拓?fù)錇椴糠诌B通狀態(tài),即通信部分有效。若
()=0
(20)
則表示時刻UAV集群機間通信拓?fù)錇闊o連通狀態(tài),即通信完全失效。
進(jìn)而給出3種場景下的信息交互方法如下。
(1) 通信完全有效
當(dāng)UAV集群通信完全有效時,集群中任意成員可與其他所有成員實現(xiàn)通信,此時集群中各成員之間的信息交互方式如圖3所示,相當(dāng)于每名成員均可視為中央節(jié)點,能夠有效獲取集群中所有其他成員的預(yù)測環(huán)境認(rèn)知地圖。
圖3 通信完全有效時的信息交互Fig.3 Information interaction under completely valid communication conditions
在獲取集群中其他成員預(yù)測環(huán)境認(rèn)知地圖后,通過環(huán)境認(rèn)知地圖融合運算,可以得到包含環(huán)境不確定圖()、目標(biāo)概率圖()和環(huán)境信息素圖()的決策環(huán)境認(rèn)知地圖,進(jìn)而完成自身航跡決策。決策環(huán)境認(rèn)知地圖可根據(jù)集群其他成員的預(yù)測環(huán)境認(rèn)知地圖得出:
(21)
(22)
(23)
(2) 通信局部有效
當(dāng)UAV集群通信局部有效時,集群中任意成員可與部分其他成員實現(xiàn)通信,此時集群中各成員之間的信息交互方式如圖4所示。
圖4 通信部分有效時的信息交互Fig.4 Information interaction under partly valid communication conditions
對于集群中任意成員,當(dāng)集群中有其他成員位于通信范圍內(nèi)時,定義兩者環(huán)境認(rèn)知地圖的信息交互方法如下:
(24)
(25)
(26)
時刻能夠與保持通信的UAV成員滿足如下條件:
∈{|=1,=1,2,…,,≠}
(27)
(3) 通信完全失效
當(dāng)UAV集群通信完全失效時,集群中任意成員無法與其他成員進(jìn)行通信,此時集群中各成員之間不進(jìn)行信息交互,將自身預(yù)決策量作為控制輸入的決策量完成搜索航跡規(guī)劃,并更新自身環(huán)境認(rèn)知地圖,如圖5所示。
圖5 通信完全失效時的信息交互Fig.5 Information interaction under the condition of complete communication failure
此外,防相撞是UAV集群執(zhí)行搜索任務(wù)過程中不容忽視的重要問題,文獻(xiàn)[24-25]基于人工勢場法,通過構(gòu)建UAV勢場實現(xiàn)了集群協(xié)同搜索過程中的機間防相撞,借鑒這一思想,本文提出了信息交互機制下的防相撞措施。首先給出如下合理假設(shè)。
強對抗環(huán)境中的UAV機間有效通信距離仍大于其 機間安全距離。
UAV機間通信延遲所帶來的飛行距離可忽略不計。
此時將搜索回報函數(shù)增加以下內(nèi)容:
(28)
式中:為時刻位于通信范圍內(nèi)的UAV集合,有:
={|()=1,≠}
(29)
進(jìn)一步得出實際決策的搜索回報函數(shù)為
()=·()+·()+·()+·()
(30)
借鑒模型預(yù)測控制理論中的滾動時域決策方法,在UAV集群完成信息交互后獲得決策環(huán)境認(rèn)知地圖的基礎(chǔ)上,根據(jù)系統(tǒng)狀態(tài)空間模型、決策集和決策搜索回報函數(shù),本文進(jìn)一步建立了UAV集群協(xié)同搜索滾動時域優(yōu)化求解模型,具體表述如下。
(31)
(32)
綜上,交互決策機制驅(qū)動的協(xié)同搜索方案(interactive decision-making mechanism driven cooperative search planning, IDMD-CSP)算法流程如圖6所示。
圖6 IDMD-CSP算法流程Fig.6 Process of IDMD-CSP algorithm
本節(jié)面向典型的通信受限條件下的不同協(xié)同搜索任務(wù)想定,開展數(shù)值仿真研究。首先,對同時包含動目標(biāo)和靜目標(biāo)環(huán)境中的協(xié)同搜索航跡規(guī)劃進(jìn)行仿真,在驗證本文算法有效性的基礎(chǔ)上對提出的3種屬性的認(rèn)知地圖在協(xié)同搜索任務(wù)中的作用進(jìn)行分析。其次,分別對不同通信距離和集群規(guī)模條件下的UAV集群協(xié)同搜索任務(wù)效能進(jìn)行仿真,驗證了本文算法對復(fù)雜任務(wù)環(huán)境的適應(yīng)性。然后,對通信中斷條件下的UAV協(xié)同搜索航跡進(jìn)行仿真,驗證了本文算法在通信中斷環(huán)境中的魯棒性以及通過信息交互提高集群搜索效能的有效性。最后,與當(dāng)前主流協(xié)同搜索算法對比,驗證了引入目標(biāo)概率圖及動目標(biāo)分布先驗信息后對動目標(biāo)搜索效能提高的有效性。仿真硬件環(huán)境為Inter Core i5-9 300HQ 2.5 GHz。
仿真任務(wù)區(qū)域為40 km×30 km的矩形區(qū)域,將任務(wù)區(qū)域劃分為40×30的正四邊形網(wǎng)絡(luò),將每個面積為1 km×1 km的柵格映射到環(huán)境認(rèn)知矩陣中。假定任務(wù)區(qū)域中分布有12個動目標(biāo),根據(jù)先驗信息可以獲取坐標(biāo)依次為(5,5),(20,25),(30,20),(25,15),(5,10),(15,18),(10,15),(36,23),(20,18),(25,25),(34,20),(28,10),其他各參數(shù)設(shè)置如表1~表4所示,初始目標(biāo)概率分布地圖與環(huán)境信息素地圖分別如圖7和圖8所示。設(shè)定總仿真時間為6 000 s,將仿真時間離散為間隔為10 s的600個規(guī)劃步,同時設(shè)定決策的滾動優(yōu)化步長為30 s。
表1 UAV初始狀態(tài)信息與性能約束
表2 傳感器性能參數(shù)
表3 環(huán)境認(rèn)知地圖參數(shù)
表4 IDMD-CSP算法參數(shù)
圖7 目標(biāo)概率初始分布Fig.7 Initial distribution of target probabilities
圖8 環(huán)境不確定性地圖初始分布Fig.8 Initial distribution of environmental uncertainty maps
針對通信距離受限條件下的UAV集群協(xié)同搜索任務(wù),分別以覆蓋率和動目標(biāo)捕獲個數(shù)作為對靜目標(biāo)和動目標(biāo)搜索效能的評價指標(biāo),仿真結(jié)果如圖9~圖11所示,分別為=1 200 s、=3 600 s、=6 000 s時的UAV集群協(xié)同搜索航跡規(guī)劃結(jié)果。從圖9(a)可以看出,初始時刻位于(15,18)km、(20,18)km柵格處的目標(biāo)被捕獲,此外發(fā)現(xiàn)在(30,20)km、(28,10)km處存在目標(biāo)的概率較大,說明在UAV完成覆蓋搜索時,通過引入目標(biāo)先驗位置信息,能夠引導(dǎo)UAV首先對動目標(biāo)存在概率高的區(qū)域展開搜索,提高了對搜索任務(wù)中對動目標(biāo)的發(fā)現(xiàn)概率。從圖9(c)和圖10(c)可以看出,UAV集群快速對任務(wù)區(qū)域進(jìn)行覆蓋式搜索,有效獲取環(huán)境中的靜目標(biāo)信息,說明不確定性圖能夠有效引導(dǎo)UAV集群完成覆蓋式搜索。從圖9(d)可以看出,當(dāng)UAV1和UAV3分別第一次發(fā)現(xiàn)位于(15,18)km和(20,18)km柵格處的目標(biāo)后,通過信息交互引導(dǎo)其他UAV來此柵格附近進(jìn)行搜索,進(jìn)而確認(rèn)目標(biāo)位置,說明UAV集群中各UAV之間可以通過信息交互機制提高對動目標(biāo)的發(fā)現(xiàn)概率。從圖9(b)、圖10(b)和圖11(b)可以看出,隨著搜索時間的增加,環(huán)境柵格中的信息素含量不斷增加,引導(dǎo)UAV對搜索間隔較長的區(qū)域進(jìn)行回訪搜索。同時,從圖10(c)和圖11(c)可以看出,當(dāng)UAV集群通過覆蓋式搜索確認(rèn)靜目標(biāo)信息后,不確定性地圖在集群協(xié)同搜索決策中的比重下降,更加注重對可能存在動目標(biāo)的區(qū)域的回訪搜索。仿真結(jié)果表明,本文所提UAV集群協(xié)同搜索方法在引導(dǎo)UAV集群完成對任務(wù)區(qū)域覆蓋式搜索的基礎(chǔ)上,通過引入動目標(biāo)分布先驗信息和建立UAV集群信息交互機制,能夠有效兼顧對動目標(biāo)的搜索需求及長時間搜索任務(wù)中的回訪需求。
圖9 搜索規(guī)劃結(jié)果(t=1 200 s)Fig.9 Search planning results (t=1 200 s)
圖10 搜索規(guī)劃結(jié)果(t=3 600 s)Fig.10 Search planning results (t=3 600 s)
圖11 搜索規(guī)劃結(jié)果(t=6 000 s)Fig.11 Search planning results (t=6 000 s)
在完成UAV集群協(xié)同搜索航跡規(guī)劃仿真的基礎(chǔ)上,采用控制變量法對不同通信距離下的搜索效率進(jìn)行分析。設(shè)定仿真時間為1 200 s,動目標(biāo)數(shù)量為12個,在未知目標(biāo)分布先驗信息的情況下,設(shè)定每個目標(biāo)的信息需由至少3架UAV捕獲才可完全獲取。采用6架UAV進(jìn)行協(xié)同搜索,以0.5 km為通信距離步長進(jìn)行50次蒙特卡羅仿真,仿真結(jié)果如圖12所示。
圖12 通信距離對搜索效率的影響Fig.12 Effect of communication distance on search efficiency
由仿真結(jié)果可知,在機間有效通信距離的增加后,UAV集群協(xié)同搜索過程中的信息交互次數(shù)隨之增加,搜索效率隨之提高。然而,當(dāng)通信距離超過2.5 km后,信息交互次數(shù)的增加并不能帶來捕獲目標(biāo)的有效增長。因此,在強對抗環(huán)境中,UAV集群一般存在最小機間通信距離可以保證協(xié)同搜索任務(wù)中保持較高的搜索效率,在實際應(yīng)用時可以通過仿真初步確定UAV集群應(yīng)保證的通信功率。
在分析通信距離對集群協(xié)同搜索效能影響的基礎(chǔ)上,對不同規(guī)模的UAV集群對任務(wù)區(qū)域的搜索效率進(jìn)行仿真分析。UAV集群規(guī)模分別為4架、8架、12架和16架,設(shè)定機間有效通信距離均為2.5 km,針對每種規(guī)模的UAV集群分別進(jìn)行50次蒙特卡羅仿真,仿真時間為1 200 s,仿真結(jié)果如圖13所示。
圖13 集群規(guī)模對搜索效率的影響Fig.13 Effect of swarm size on search efficiency
由仿真結(jié)果可知,當(dāng)UAV數(shù)量小于8架時,隨著UAV數(shù)量的增加,捕獲目標(biāo)數(shù)量、目標(biāo)探測次數(shù)及信息交互次數(shù)會明顯增加,即UAV集群協(xié)同搜索效率有明顯提升。當(dāng)UAV數(shù)量超過8架之后,盡管UAV之間的信息交互次數(shù)明顯增加,但目標(biāo)探測次數(shù)、目標(biāo)捕獲次數(shù)并不明顯提升,說明在任務(wù)區(qū)域及目標(biāo)數(shù)量一定的條件下,UAV數(shù)量的持續(xù)增加并不能一直帶來搜索效率的迅速提升,需要根據(jù)任務(wù)的具體情況確定UAV集群的規(guī)模。
為分析本文方法在通信中斷條件下的有效性,分別以區(qū)域覆蓋率和目標(biāo)捕獲數(shù)量作為評價指標(biāo),對靜目標(biāo)和動目標(biāo)的搜索效率進(jìn)行綜合評估。設(shè)定仿真總時間為6 000 s,將仿真時間離散為間隔為10 s的600個規(guī)劃步,設(shè)定搜索任務(wù)進(jìn)行至2 000 s時出現(xiàn)通信受干擾中斷,進(jìn)行至3 200 s時通信恢復(fù)正常,仿真結(jié)果如圖14和圖15所示。
圖14 通信中斷條件下的覆蓋率Fig.14 Coverage under communication interruption
圖15 通信中斷條件下捕獲的目標(biāo)數(shù)量Fig.15 Number of captured targets under communication interruption
由仿真結(jié)果可知,對于靜目標(biāo)搜索,在仿真時間2 000 s處通信中斷后,UAV集群中所有成員依據(jù)自身環(huán)境認(rèn)知地圖進(jìn)行決策,區(qū)域覆蓋率增速放緩,這是由于UAV之間失去信息交互,造成了對靜目標(biāo)的重復(fù)搜索。在仿真時間3 200 s通信恢復(fù)后,區(qū)域覆蓋率增速加快,這是由于各UAV之間通過信息交互機制避免了對靜目標(biāo)的重復(fù)搜索,提高了覆蓋搜索效率。
對于動目標(biāo)搜索,在2 000 s處通信中斷后,UAV之間失去信息交互,發(fā)現(xiàn)目標(biāo)的UAV無法引導(dǎo)其他UAV再次確認(rèn)目標(biāo),導(dǎo)致難以捕獲目標(biāo)。在3 200 s通信恢復(fù)后,UAV可通過信息交互引導(dǎo)其他UAV對目標(biāo)存在概率高的區(qū)域再次確認(rèn),進(jìn)而完成對動目標(biāo)的捕獲。
本節(jié)分別采用光柵式、文獻(xiàn)[17]以及本文方法對想定任務(wù)區(qū)域展開搜索,進(jìn)一步驗證本文算法對動目標(biāo)捕獲的有效性。設(shè)定集群規(guī)模為8架,機間有效通信距離為2.5 km。采用蒙特卡羅方法進(jìn)行50次仿真驗證,仿真時長為6 000 s,通過環(huán)境覆蓋率與捕獲目標(biāo)數(shù)量對方法的有效性進(jìn)行評估,仿真結(jié)果如圖16所示,3種方法的平均覆蓋率分別為85.84%,83.40%,86.10%,平均捕獲目標(biāo)數(shù)量分別為0.24,0.425,6.04,本文方法對于靜態(tài)目標(biāo)和動態(tài)目標(biāo)的搜索捕獲效率均高于其他兩種方法。
圖16 與其他方法性能對比Fig.16 Performance comparison with other methods
從仿真結(jié)果可以看出,光柵式搜索方法受限于UAV初始位置分布,未能充分發(fā)揮對靜態(tài)目標(biāo)的搜索優(yōu)勢,在缺少回訪機制引導(dǎo)的條件下,光柵式搜索方法無法再次對目標(biāo)進(jìn)行確認(rèn)搜索,因此對運動目標(biāo)的搜索效果并不理想,具有一定的局限性。文獻(xiàn)[17]所提出的動態(tài)規(guī)劃搜索方法在一定程度上提高了對動目標(biāo)的搜索性能,但并未有效利用先驗信息,因此在有限時間內(nèi)其捕獲目標(biāo)數(shù)量低于本文方法。本文方法能夠根據(jù)先驗信息引導(dǎo)UAV首先對目標(biāo)存在概率較高的區(qū)域進(jìn)行搜索,在搜索初期注重對靜態(tài)目標(biāo)信息的獲取,隨著搜索任務(wù)的進(jìn)行,更加注重對相關(guān)柵格的回訪,提高對運動目標(biāo)的捕獲概率;通過信息交互機制,有效完成了集群成員環(huán)境認(rèn)知信息的共享,提高了UAV集群協(xié)同搜索效能,具有更好的魯棒性與實用性。
為提高通信受限條件下UAV集群執(zhí)行協(xié)同搜索任務(wù)過程時對先驗信息的利用效率,本文設(shè)計了包含3種屬性的環(huán)境認(rèn)知地圖,基于不確定性地圖引導(dǎo)UAV集群對任務(wù)區(qū)域中的靜目標(biāo)進(jìn)行搜索,基于目標(biāo)概率地圖引導(dǎo)UAV對動目標(biāo)存在概率高的區(qū)域進(jìn)行搜索,基于信息素地圖引導(dǎo)UAV在長時間搜索任務(wù)中實現(xiàn)回訪搜索,并通過設(shè)計不同通信場景下的信息交互機制提高UAV集群在搜索任務(wù)中的協(xié)同能力,通過數(shù)值仿真試驗,得出如下結(jié)論。
(1) 算法設(shè)計了不同通信距離約束下的UAV集群信息交互機制,在UAV集群搜索任務(wù)中,實現(xiàn)了通信距離受限條件下的協(xié)同航跡規(guī)劃。
(2) 通過引入環(huán)境不確定圖和目標(biāo)概率圖,提供了UAV集群覆蓋搜索過程中兼顧動目標(biāo)搜索的能力。通過建立信息交互機制,體現(xiàn)了UAV集群能夠通過機間協(xié)同提高搜索任務(wù)效率的優(yōu)勢。
(3) 在協(xié)同搜索任務(wù)中,UAV集群規(guī)模及有效通信距離與協(xié)同搜索效率之間呈現(xiàn)出非線性關(guān)系,可以通過數(shù)值仿真為實際任務(wù)中的集群設(shè)計提供一定指導(dǎo)。
本文假設(shè)UAV集群之間的有效通信僅受距離約束,暫未考慮通信延時、丟包等約束條件對UAV集群協(xié)同搜索的影響,后續(xù)研究中可考慮通信延時、丟包等情況,進(jìn)一步完善UAV集群協(xié)同搜索方法。