張?zhí)陨?,?藝
(1.空軍第一航空學(xué)院,河南 信陽(yáng) 464000;2.空軍工程大學(xué)航空航天工程學(xué)院,西安 710038)
基于BP神經(jīng)網(wǎng)絡(luò)的UCAV航跡綜合評(píng)價(jià)
張?zhí)陨?,魯 藝2
(1.空軍第一航空學(xué)院,河南 信陽(yáng) 464000;2.空軍工程大學(xué)航空航天工程學(xué)院,西安 710038)
針對(duì)目前航跡規(guī)劃過(guò)程中評(píng)價(jià)指標(biāo)難以統(tǒng)一且指標(biāo)權(quán)重確定過(guò)分依賴主觀經(jīng)驗(yàn)的問(wèn)題,在建立較為完備的UCAV航跡評(píng)價(jià)指標(biāo)體系基礎(chǔ)上,引入BP神經(jīng)網(wǎng)絡(luò)對(duì)UCAV備選航跡進(jìn)行綜合評(píng)價(jià),從備選航跡的樣本數(shù)據(jù)出發(fā),客觀分析航跡的優(yōu)劣,為決策者提供更加科學(xué)合理的參考依據(jù),最后結(jié)合仿真算例,驗(yàn)證了該方法的可行性。
UCAV航跡,綜合評(píng)價(jià),指標(biāo)標(biāo)準(zhǔn)化,BP神經(jīng)網(wǎng)絡(luò)
傳統(tǒng)航跡規(guī)劃問(wèn)題是通過(guò)構(gòu)建航跡代價(jià)函數(shù)并結(jié)合尋優(yōu)算法得到一條最優(yōu)航跡,但航跡規(guī)劃不僅是多目標(biāo)優(yōu)化問(wèn)題,更是集作戰(zhàn)態(tài)勢(shì)、作戰(zhàn)決心、技術(shù)和戰(zhàn)術(shù)于一體的綜合性作戰(zhàn)決策問(wèn)題,傳統(tǒng)方法得到的航跡對(duì)決策指揮人員來(lái)說(shuō)并非是絕對(duì)的最優(yōu)[1-2]。當(dāng)任務(wù)改變或在飛行過(guò)程中遇到突發(fā)情況時(shí),預(yù)先規(guī)劃好的航跡可能不再適用,備選航跡就成為提高任務(wù)成功率的重要手段[3-4]。在作戰(zhàn)使用中,如何快速地在備選航跡方案集中進(jìn)行決策,對(duì)航跡綜合評(píng)價(jià)的研究提出了更迫切的需求,見(jiàn)文獻(xiàn)[5-7]。本文引入BP神經(jīng)網(wǎng)絡(luò),在建立評(píng)價(jià)指標(biāo)體系的基礎(chǔ)上,以真實(shí)航跡樣本數(shù)據(jù)為基礎(chǔ),客觀評(píng)價(jià)每條航跡的優(yōu)劣,進(jìn)而為指揮員提供決策依據(jù)和參考。
1.1 指標(biāo)選取
選取科學(xué)合理的評(píng)價(jià)指標(biāo)是進(jìn)行科學(xué)合理評(píng)價(jià)的前提和基礎(chǔ)。結(jié)合UCAV作戰(zhàn)使用的特殊性及影響總體作戰(zhàn)效能的因素,本文以飛行性能、滿足任務(wù)參數(shù)、突防性能和航跡魯棒性作為一級(jí)指標(biāo),選取影響一級(jí)指標(biāo)的主要因素作為二級(jí)指標(biāo),建立如下頁(yè)圖1的UCAV航跡綜合評(píng)價(jià)指標(biāo)體系[8-9]:
在圖1的指標(biāo)體系中,部分指標(biāo)的涵義及量化定義如下:①目標(biāo)進(jìn)入角:從某一預(yù)先確定角度進(jìn)入目標(biāo),與具體任務(wù)性質(zhì)有關(guān)。通常存在某一確定的方向θbest,使得以該角度接近目標(biāo),能保證從目標(biāo)最薄弱方位進(jìn)行有效攻擊;②巡航飛行高度:UCAV在做巡航飛行時(shí),距離地面的高度[6];③地形跟蹤高度:地形跟隨飛行時(shí)距離地面的高度。在低空突防時(shí)UCAV跟蹤地形的最佳離地高度Hbest為:海面上空3 m~15 m,陸地平原上空為60 m~80 m,丘陵山區(qū)上空為130 m左右;④威脅區(qū)暴露時(shí)間:UCAV在搜索雷達(dá)(CSR)或跟蹤制導(dǎo)雷達(dá)可發(fā)現(xiàn)并跟蹤的區(qū)域內(nèi)飛行所需要的時(shí)間,可由飛經(jīng)威脅區(qū)的長(zhǎng)度與平均速度的比值求出;⑤不可飛航跡點(diǎn)數(shù)目:不滿足任務(wù)設(shè)定的殺傷概率條件航跡點(diǎn)數(shù)目,表征生存力的重要指標(biāo)。考慮該指標(biāo)主要因?yàn)閭鹘y(tǒng)尋優(yōu)算法只是選擇航跡整體代價(jià)值較優(yōu)的航跡,某條航跡可能整體代價(jià)值最小,但局部某些航跡點(diǎn)所受威脅度可能很大,導(dǎo)致沒(méi)有評(píng)價(jià)航跡的所有信息熵[10]。
圖1 UCAV航跡綜合評(píng)價(jià)的指標(biāo)體系
1.2 指標(biāo)標(biāo)準(zhǔn)化
①成本型指標(biāo):
②效益型指標(biāo):
③適度型指標(biāo):
其中,xbest為評(píng)價(jià)指標(biāo)的最合適值。
根據(jù)各子指標(biāo)在實(shí)際使用中的特點(diǎn),表1給出了選取的11個(gè)指標(biāo)的所屬的不同標(biāo)準(zhǔn)化類(lèi)型。
表1 指標(biāo)標(biāo)準(zhǔn)化類(lèi)型分類(lèi)
在航跡綜合評(píng)價(jià)問(wèn)題中,一些指標(biāo)相互耦合,呈現(xiàn)復(fù)雜非線性關(guān)系,BP神經(jīng)網(wǎng)絡(luò)作為一種智能化數(shù)據(jù)處理方法,為綜合評(píng)價(jià)問(wèn)題提供了強(qiáng)有力的工具[11]。BP神經(jīng)網(wǎng)絡(luò)是一種前饋網(wǎng)絡(luò),該網(wǎng)絡(luò)可模擬專(zhuān)家進(jìn)行定量評(píng)價(jià),減輕了人為選擇權(quán)重的主觀影響與不確定性,提高了評(píng)價(jià)結(jié)果的可信度[12]。
2.1 BP神經(jīng)網(wǎng)絡(luò)算法
2.1.1 訓(xùn)練樣本的選取
對(duì)BP神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)問(wèn)題,通常認(rèn)為訓(xùn)練樣本數(shù)目與神經(jīng)網(wǎng)絡(luò)之間有如下式子:
Np為所需訓(xùn)練樣本數(shù)目,NI為輸入層節(jié)點(diǎn)數(shù),NO為輸出層節(jié)點(diǎn)數(shù),Nh為隱含層點(diǎn)數(shù)。
2.1.2 隱含層節(jié)點(diǎn)數(shù)確定
構(gòu)建BP網(wǎng)絡(luò)時(shí)最應(yīng)注意隱含層節(jié)點(diǎn)數(shù)選取,根據(jù)目前研究,主要有以下3種確定隱含層節(jié)點(diǎn)數(shù) Nh的方案,可供試驗(yàn)參考:①
2.1.3 訓(xùn)練函數(shù)選取
本文采用L-M算法作為訓(xùn)練函數(shù),相比其他算法,L-M算法迭代次數(shù)少,收斂速度快,精確度高,更適用于備選航跡快速有效的評(píng)價(jià)要求。L-M算法的權(quán)值調(diào)整公式為[13]:
式中,J為誤差對(duì)權(quán)值微分的雅可比矩陣;e為誤差向量;μ為學(xué)習(xí)速率。
2.2 航跡綜合評(píng)價(jià)模型
本文采用三層BP神經(jīng)網(wǎng)絡(luò)進(jìn)行評(píng)價(jià),如下頁(yè)圖2所示,輸入層為樣本矩陣;中間為網(wǎng)絡(luò)隱含層;輸出層為航跡綜合評(píng)價(jià)值。
圖2 建立的三層評(píng)價(jià)網(wǎng)絡(luò)
圖3 航跡綜合評(píng)價(jià)流程
圖3給出了基于BP神經(jīng)網(wǎng)絡(luò)的航跡綜合評(píng)價(jià)流程,對(duì)于流程中的網(wǎng)絡(luò)學(xué)習(xí)訓(xùn)練環(huán)節(jié),本文通過(guò)專(zhuān)家打分法進(jìn)行期望評(píng)估:邀請(qǐng)專(zhuān)家獨(dú)立地對(duì)指標(biāo)體系中一、二級(jí)指標(biāo)的相對(duì)重要度進(jìn)行評(píng)判,從而得到初始的期望輸出樣本。利用BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)能力,通過(guò)訓(xùn)練后的穩(wěn)定網(wǎng)絡(luò)即具備對(duì)不同航跡的模式識(shí)別能力。在實(shí)際應(yīng)用中,將訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)存入文件,輸入待評(píng)價(jià)航跡的指標(biāo)矩陣,啟動(dòng)網(wǎng)絡(luò),即得到航跡綜合評(píng)價(jià)值。
本文選取網(wǎng)絡(luò)訓(xùn)練樣本規(guī)模為15,樣本指標(biāo)值根據(jù)式(1)~式(3)進(jìn)行處理,得到樣本指標(biāo)標(biāo)準(zhǔn)化矩陣,見(jiàn)表2。設(shè)預(yù)先任務(wù)規(guī)劃中地形跟蹤最佳高度Hbest=135 m;最佳目標(biāo)進(jìn)入角θbest=20°。在計(jì)算樣本的期望輸出時(shí)利用專(zhuān)家打分法得到的指標(biāo)權(quán)重如下:一級(jí)指標(biāo):二級(jí)指標(biāo)
建立三層 BP 神經(jīng)網(wǎng)絡(luò),NI=11,Nh=20,NO=1,最大訓(xùn)練步數(shù)epochs為500,goal為1×10-7,其他參數(shù)采用缺省值。輸入層到隱含層及隱含層到輸出層傳遞函數(shù)分別采用對(duì)Sigmoid型Logsig()函數(shù)和正切Sigmoid型Tansig()函數(shù);訓(xùn)練函數(shù)選用Trainlm函數(shù)。采用MATLAB中神經(jīng)網(wǎng)絡(luò)工具箱N(xiāo)eural Network Toolbox提供的圖形用戶界面(GUI)進(jìn)行建模與仿真,仿真結(jié)果及分析如下:
表2 標(biāo)準(zhǔn)化后的評(píng)價(jià)指標(biāo)值
下頁(yè)圖4為L(zhǎng)-M訓(xùn)練函數(shù)(trainlm)的誤差曲面,gradient圖表示誤差曲面梯度,當(dāng)梯度達(dá)到某一個(gè)值時(shí)就可以結(jié)束訓(xùn)練,變量Mu是算法的一個(gè)參數(shù)取值。圖5為網(wǎng)絡(luò)訓(xùn)練誤差曲線,網(wǎng)絡(luò)訓(xùn)練進(jìn)行51步時(shí),誤差平方和MSE滿足標(biāo)準(zhǔn)誤差goal的要求,完成了網(wǎng)絡(luò)訓(xùn)練。訓(xùn)練效果如圖6,紅色為網(wǎng)絡(luò)輸出結(jié)果,網(wǎng)絡(luò)訓(xùn)練值跟隨期望輸出變化,雖然兩者之間有一些誤差,但曲線走勢(shì)非常接近,最后方案排序是基本相同的,效果比較理想,網(wǎng)絡(luò)比較穩(wěn)定。
為驗(yàn)證所建BP評(píng)價(jià)網(wǎng)絡(luò)的有效性及結(jié)果是否可信,選用5組仿真得到數(shù)據(jù)作為檢驗(yàn)樣本(見(jiàn)表3),將表中數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化后,輸入建好的模型中作為待評(píng)價(jià)對(duì)象,最終得到評(píng)價(jià)結(jié)果見(jiàn)表4。結(jié)果表明該評(píng)價(jià)模型在誤差允許范圍能夠有效客觀評(píng)價(jià)航跡的綜合性能,與專(zhuān)家評(píng)價(jià)保持較好一致性。
圖4 L-M訓(xùn)練函數(shù)的誤差曲面
圖5 全局誤差曲線
圖6 樣本的訓(xùn)練效果
表3 5條備選航跡評(píng)價(jià)指標(biāo)值
為確定備選航跡的綜合性能,本文根據(jù)影響作戰(zhàn)效能的關(guān)鍵因素構(gòu)建了評(píng)價(jià)指標(biāo)體系,并對(duì)不同類(lèi)型指標(biāo)的屬性值進(jìn)行標(biāo)準(zhǔn)化處理,運(yùn)用BP神經(jīng)網(wǎng)絡(luò)建立了綜合評(píng)價(jià)模型對(duì)備選航跡進(jìn)行綜合評(píng)價(jià),為指揮員在備選航跡中決策提供了理論依據(jù)和支撐。最后進(jìn)行了仿真分析,表明通過(guò)訓(xùn)練的穩(wěn)定BP網(wǎng)絡(luò)能合理地對(duì)備選航跡進(jìn)行評(píng)價(jià)。
表4 備選航跡方案排序
[1]王俊,周樹(shù)道,朱國(guó)濤,等.無(wú)人機(jī)航跡規(guī)劃常用算法[J].火力與指揮控制,2012,37(8):5-8.
[2]劉鋼,老松楊,譚東風(fēng).基于功能區(qū)域的反艦導(dǎo)彈逆向航路規(guī)劃 [J].系統(tǒng)工程與電子技術(shù),2011,33(4):799-805.
[3]嚴(yán)江江,丁明躍,周成平.基于K均值聚類(lèi)和遺傳算法的多航跡規(guī)劃方法[J].火力與指揮控制,2010,35(3):147-150.
[4]李素娟,肖前貴,高艷輝,等.多約束條件下UCAV航路規(guī)劃動(dòng)態(tài)評(píng)價(jià)方法[J].指揮控制與仿真,2012,34(2):36-39.
[5]張瑞玲.基于多目標(biāo)的航跡評(píng)價(jià)方法[J].黑龍江科技信息,2013(27):51-52.
[6]ZHANG D Q,ZHAO J F,WANG M H,et al.Grey evaluation and optimization of UAV’s path planning method[C]//2010 2nd International Conference on Electronic Computer Technology(ICECT 2010):85-88.
[7]向明思,劉新學(xué),方喜龍,等.基于DHGF算法的巡航導(dǎo)彈參考航跡綜合性能評(píng)價(jià)研究[J].第二炮兵工程學(xué)院學(xué)報(bào),2012,26(3):65-70.
[8]馮琦,周德云.UCAV任務(wù)規(guī)劃系統(tǒng)的研究進(jìn)展及發(fā)展綜述[J].飛行力學(xué),2003,21(2):1-4.
[9]SWARTZENTRUBEN L S,JUNG L F,ELIOT H W.Three-dimensional multi-objective UAV path planner using terrain information [C]//USA.50th AIAA/ASME/ASCE/AHS/ASC Structures,Structural Dynamics,and Materials Conference,California,2009:1-19.
[10]張亮.基于生存原則的無(wú)人機(jī)航路規(guī)劃方法研究[D].西安:空軍工程大學(xué),2010.
[11]HAGUE M E,SUDHAKAR K V.ANN back-propagation prediction model for fracture toughness in microalloy steel[J]. InternationalJournalofFatigue,2002,24 (9):1003-1010.
[12]LI J,SUN D.Path planning using case-based learning and its neural network implementation of the lunar vehicle’s self-autonomous navigation[C]//The Proceedings of the 3th world Congress on Intelligence Control and Automation,2000:1182-1186.
[13]王建梅,覃文忠.基于L-M算法的BP神經(jīng)網(wǎng)絡(luò)分類(lèi)器[J].武漢大學(xué)學(xué)報(bào) (信息科學(xué)版),2005,30(10):928-931.
UCAV Aircraft Path Evaluation Based on BP Neural Network
ZHANG Tao-sha1,LU Yi2
(1.The First AeronauticalCollege of Air Force,Xinyang 464000,China;2.Engineering College of Aeronautics and Astronautics,Air Force Engineering University,Xi’an 710038,China)
At present, the evaluation index of path planning is difficult to unity and path evaluation function depends more on subjective experience.The two problems cause decision makers feel hard to choose final path in alternative paths.Aiming to the situation,a relatively complete UCAV path evaluation index system is established.And then,in the case of known alternative paths information,BPNeural Networkmethod is proposed to comprehensively evaluate the alternative paths and give the paths’final sorting,which provides reasonable suggestion for decision makers.At last,actual calculations are introduced to demonstrate the feasibility of the method in the paper.
UCAV path,comprehensive evaluation,quantitative index,BP neural network
TJ012.4
A
10.3969/j.issn.1002-0640.2017.07.033
1002-0640(2017)07-0153-04
2016-05-11
2016-06-08
張?zhí)陨常?990- ),男,江蘇宿遷人,碩士研究生。研究方向:飛行器航跡規(guī)劃,指揮控制與引導(dǎo)。