鐘昊
摘要:多無人機協(xié)同無源定位移動輻射源目標,需要實時優(yōu)化調(diào)整多機組合航向,不斷追求多機與目標之間的動態(tài)最優(yōu)構(gòu)型,以提高和穩(wěn)定定位精度。針對傳統(tǒng)集中式優(yōu)化方法由于航向計算時延和信息分發(fā)時延造成的定位精度低和穩(wěn)定性差,本文提出一種多機航向協(xié)同自主生成方法,通過離線構(gòu)建多樣化構(gòu)型和最優(yōu)航向數(shù)據(jù)集,基于圖神經(jīng)網(wǎng)絡(luò)離線機器學習組合航向與最優(yōu)構(gòu)型下的隱式規(guī)則,線上各無人機航向決策神經(jīng)網(wǎng)絡(luò)基于一致實時態(tài)勢,自主預(yù)測本機航向和協(xié)同生成最優(yōu)航向組合。仿真驗證表明,該方法相對于傳統(tǒng)方法能夠更快達到更高定位精度,且提高了定位跟蹤穩(wěn)定性。
Abstract: In order to improve and stabilize the positioning accuracy, it is necessary to optimize and adjust the Multi-UAV combination heading in real time, and constantly pursue the dynamic optimal configuration between the Multi-UAV and the target. In view of the low positioning precision and poor stability caused by the time delay and information distribution delay of the traditional centralized optimization method, a Multi-UAV combination heading cooperative autonomous generation method is proposed in this paper. The multiple configurations and optimal heading data sets are constructed off line, and the combination course and the optimal structure are machine learned off-line based on the graph neural network. Under the implicit rule, the line decision neural network based on the unmanned aerial vehicle (UAV) is based on the consistent real time situation and independently predicts the course direction and cooperative generation of the optimal course combination. Simulation results show that the proposed method can achieve higher positioning accuracy and improve the stability of location tracking compared with traditional methods.
關(guān)鍵詞:多機無源定位;航向自主生成;圖神經(jīng)網(wǎng)絡(luò);動態(tài)構(gòu)型;克拉羅美下界
Key words: multi-UAV passive location;autonomous generation heading;graph neural network;dynamic configuration;Cramer-Rao Lower Bound
中圖分類號:V24;TP3? ? ? ? ? ? ? ? ? ? ? ? ? ? 文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1006-4311(2020)12-0254-05
0? 引言
隨著無人機集群技術(shù)、現(xiàn)代電子戰(zhàn)技術(shù)和航空通信技術(shù)的迅猛發(fā)展,多無人機對移動信號輻射源目標進行無源協(xié)同定位,在軍事偵察、環(huán)境監(jiān)測、反恐維穩(wěn)和應(yīng)急救援諸多領(lǐng)域具有巨大應(yīng)用潛力。在運動狀態(tài)下,多無人機與目標的之間的動態(tài)構(gòu)型,即各無人機與目標之間的實時距離,以及任意兩架無人機與目標之間的實時角度,直接影響多機協(xié)同無源定位精度以及穩(wěn)定跟蹤效果。如何在線生成各無人機實時航向指令,實現(xiàn)多無人機與目標之間的最優(yōu)動態(tài)構(gòu)型,從而提高無源定位精度和跟蹤穩(wěn)定性,成為熱點研究問題之一[1-2]。
當前針對面向無源定位的多機航向動態(tài)生成問題,主要采用集中式實時優(yōu)化方法(Centralized Real-Time Optimization,CRTO)[3-6],基于測角、測頻或測TOA等無源定位方式,獲得目標位置估計值后,以卡拉美羅下界卡拉羅美下界(Cramer-Rao Lower Bound,CRLB)[7]為定位精度指標,并假設(shè)環(huán)境電磁噪聲服從高斯分布,然后實時計算搜索下一時刻CRLB最小的多機組合航向,最后逆推各無人機當前航向指令。該方法存在兩個問題,一是無源定位精度對組合航向敏感,需要對航向粒度進行細致劃分,隨著無人機數(shù)量增多,可選組合航空決策變量空間呈指數(shù)增加,從而導致計算延時過大,難以滿足對高速移動目標定位需求;二是需要對所有無人機的航向指令進行集中計算,然后分發(fā)給各無人機,增加了通信延時,且存在中心節(jié)點,在作戰(zhàn)環(huán)境下,造成無人機集群抗毀性差。
針對CRTO方法存在的問題,本文提出分布式協(xié)同自主生成方法(Distributed Cooperative and Autonomous Generation Approach,DCAG),即基于自組織協(xié)同思想和機器學習方法[8-9],為每架無人機最優(yōu)航向決策構(gòu)建均構(gòu)建一個多隱含層神經(jīng)網(wǎng)絡(luò),并大樣本仿真多無人機與目標的不同構(gòu)型數(shù)據(jù)集和離線搜索最優(yōu)航向標簽集,實現(xiàn)神經(jīng)網(wǎng)絡(luò)線下機器學習如何針對不同構(gòu)型生成最優(yōu)航向,線上根據(jù)真實無源定位信息,自主快速輸出最優(yōu)航向指令,確保多機自同步按照最優(yōu)航跡飛行,不斷減小定位誤差和保持跟蹤穩(wěn)定性,使得多機無源定位中計算量大耗時長的航向組合實時優(yōu)化問題,被轉(zhuǎn)化為低功耗低時延的分布式在線預(yù)測問題,使得該問題得以有效解決。
1? 問題描述與建模
理論上單機測向,雙機即可完成定位,但是存在環(huán)境電磁噪聲,定位會存在誤差。在信號處理和定位算法確定的條件下,且假設(shè)無人機速度方向始終與航向始終保持一致,要提高對移動目標的無源定位精度,需要在線組合優(yōu)化多無人機實時組合航向,從而直接決定多無人機下一時刻航跡點,達到不斷追求多無人機與目標之間的動態(tài)最優(yōu)構(gòu)型的目的。由于CRLB可以屏蔽無人機輻射信號和環(huán)境噪聲對定位精度的影響,因此通過計算CRLB值,定量比較多無人機可選組合航向下的不同定位精度,從而找出CRLB最小的組合航向,即為使得定位精度最高的最優(yōu)航向組合。
假設(shè)無人機數(shù)量為M,可選航向粒度為θ,無人機可機動航向角區(qū)間為[?準1,?準2],則每一時刻多無人機協(xié)同航向組合可選決策空間數(shù)量規(guī)模如式(1)所示,隨M的增加呈指數(shù)增長,為NP-Hard問題。
根據(jù)上述分析,在X-Y絕對二維坐標下,以各無人機下一時刻最優(yōu)航向為決策變量,以下一時刻CRLB最小為目標函數(shù),建立下一時刻最優(yōu)航向的優(yōu)化模型,如式(2)-(8)所示,其中,式(2)是受各無人機與目標實時時刻位置影響的目標函數(shù),式(3)表示無人機下一時刻位置更新方程,且受實時航向VUdi影響,式(4)是移動目標位置更新方程,式(5)是最大可選航向邊界約束條件。
2? 傳統(tǒng)集中式實時優(yōu)化方法
針對上述多無人機航向組合優(yōu)化問題,傳統(tǒng)集中式實時優(yōu)化方法CRTO需要將各無人機實時測向數(shù)據(jù)及其實時定位信息,發(fā)送至中心無人機,根據(jù)協(xié)同定位算法結(jié)算目標估計位置,然后以式(2)所示目標函數(shù),面向大規(guī)模組合優(yōu)化變量空間,運用啟發(fā)式或超啟發(fā)式等智能優(yōu)化算法進行求解,然后通過搜索尋優(yōu)得到多機組合最優(yōu)航向,最后中心無人機通過機載數(shù)據(jù)鏈將每一時刻最優(yōu)航向指令不斷分發(fā)給其他對應(yīng)的無人機,如圖1所示。根據(jù)工程經(jīng)驗,由實時優(yōu)化計算各無人機組合航向和分發(fā)航向指令帶來的延時超過2秒以上,易造成精度降低和跟蹤穩(wěn)定性降低。
3? 分布式協(xié)同自主生成方法
3.1 方法框架
針對CRTO方法帶來的延時過長問題,本文所提DCAG方法針對CRLB直接反映構(gòu)型對定位精度影響這一特點,在地面離線仿真生成大樣本多無人機與目標的構(gòu)型數(shù)據(jù),并運用智能優(yōu)化算法離線搜索每種構(gòu)型下各無人機最優(yōu)航向組合,由此一對一地形成面向每架無人機的帶標簽數(shù)據(jù)集,實現(xiàn)離線訓練測試各無人機航向決策圖神經(jīng)網(wǎng)絡(luò),在線使用訓練好的各無人機神經(jīng)網(wǎng)絡(luò),如圖2所示。
通過DCAG方法,各無人機只需要實時共享各自的定位信息和測向數(shù)據(jù),在求出目標估計值一致的條件下,就能基于圖神經(jīng)網(wǎng)絡(luò)快速自主運算生成本機最優(yōu)航向,從而避免在線實時優(yōu)化NP-Hard問題,造成的過長延時。同時,由于各機神經(jīng)網(wǎng)絡(luò)離線學習到自主協(xié)同生成最優(yōu)航向組合的隱式規(guī)律,在線生成實時最優(yōu)航向天然即為組合最優(yōu),從而也避免了由于中心計算組合航向需要分發(fā)帶來的通信延時。
3.2 圖神經(jīng)網(wǎng)絡(luò)構(gòu)建
圖神經(jīng)網(wǎng)絡(luò)[10,11]是為了在圖結(jié)構(gòu)的數(shù)據(jù)信息基礎(chǔ)上進行學習而建立起來的。本文所研究多架無人機在定位過程中的航跡生成,其本質(zhì)屬于圖數(shù)據(jù)下的構(gòu)型變換,因此本文采用圖神經(jīng)網(wǎng)絡(luò)進行學習訓練,實時生成不同時刻每架無人機航跡角輸出。
為了實現(xiàn)多無人機之間的在線協(xié)同飛行以減小定位誤差,需要將所有無人機當前時刻到目標的構(gòu)型圖作為每架無人機神經(jīng)網(wǎng)絡(luò)的輸入。在目標真實位置未知條件下,以目標無源定位估計值近似為目標真實位置。神經(jīng)網(wǎng)絡(luò)輸出則設(shè)計為所控制無人機的下一時刻最優(yōu)航向。神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)采用多個隱含層和全連接結(jié)構(gòu)。設(shè)無人機數(shù)量為M,則隱含層數(shù)量和每個隱含層的節(jié)點數(shù)可以設(shè)置為M和2M。
3.3 網(wǎng)絡(luò)離線訓練測試
按照無人機航向決策圖神經(jīng)網(wǎng)絡(luò)的輸入和輸出構(gòu)建好數(shù)據(jù)集和標簽集后,采用TensorFlow[12]進行網(wǎng)絡(luò)的離線訓練和學習。在訓練過程中需要注意三點:一是對于神經(jīng)網(wǎng)絡(luò)在兩種坐標軸角度下表示預(yù)測航向,需要分別與真實最優(yōu)航向相減后,以偏差最小值作為損失函數(shù)值;二是選擇Adam學習算法優(yōu)化網(wǎng)絡(luò)的權(quán)重和閾值;三是在每一輪訓練完成后都輸入測試數(shù)據(jù)集,判斷損失函數(shù)值是否連續(xù)變小作為訓練終止條件之一,以防止過擬合,具體流程如圖3所示。
4? 仿真驗證分析
4.1 仿真示例描述
以雙機無源定位移動通信輻射源仿真示例,驗證本文所提DCAG方法的有效性,并假設(shè)如下:①無源定位算法采用AOA到達角測量法;②信噪比為0.05;③雙機速度在單次仿真中固定,多次仿真中變化范圍為[120,200];④目標速度大小在單次仿真中固定,多次仿真中變化范圍為[100,180];⑤目標速度方向始終為雙機位置連線中點至目標方向;⑥無人機每秒內(nèi)完成50次測向信號采樣;⑦目標與各無人機之間的距離不大于15000,不小于1000;⑧雙機之間的距離不小1000;⑨用于離線訓練各無人機無源定位航向圖神經(jīng)網(wǎng)絡(luò)產(chǎn)生的部分數(shù)據(jù)集如表1所示。