李曉婷,賈 婧,孟云霞
(北方自動(dòng)控制技術(shù)研究所,太原 030006)
巡飛彈是集無(wú)人機(jī)技術(shù)和彈藥技術(shù)為一體的一種新概念彈藥,不僅能夠?qū)崿F(xiàn)戰(zhàn)場(chǎng)偵察與毀傷評(píng)估,還能實(shí)現(xiàn)高精度打擊、目標(biāo)指示、空中警戒等多種作戰(zhàn)功能,巡飛彈獨(dú)特的巡飛能力不僅對(duì)于攻擊坦克集群、運(yùn)輸車(chē)等動(dòng)態(tài)目標(biāo)具有很強(qiáng)的戰(zhàn)場(chǎng)靈活性和適應(yīng)性,還可根據(jù)戰(zhàn)場(chǎng)需求大大縮短從發(fā)現(xiàn)到摧毀目標(biāo)的時(shí)間,提高作戰(zhàn)效能,而且對(duì)敵方機(jī)場(chǎng)、指揮所、港口、供應(yīng)站等靜態(tài)目標(biāo)也具有十分重要的作用[1]。如何將自組織態(tài)勢(shì)感知與決策系統(tǒng)變得“會(huì)理解、會(huì)思考、會(huì)決策”,實(shí)現(xiàn)自主化、智能化是未來(lái)戰(zhàn)爭(zhēng)中巡飛彈武器充分發(fā)揮其作戰(zhàn)能力的關(guān)鍵所在。因此,推進(jìn)目標(biāo)識(shí)別、自主決策等關(guān)鍵技術(shù)研究,是自組織態(tài)勢(shì)感知與決策系統(tǒng)建設(shè)面臨的重要問(wèn)題。
本文結(jié)合以深度學(xué)習(xí)技術(shù)為代表的人工智能最新研究成果,研究基于巡飛彈武器平臺(tái)的自組織態(tài)勢(shì)感知與決策系統(tǒng)組成和應(yīng)用模式,提出基于深度學(xué)習(xí)的目標(biāo)識(shí)別模型、任務(wù)自主決策模型和任務(wù)分配模型,實(shí)現(xiàn)協(xié)同作戰(zhàn)任務(wù)自主決策和智能規(guī)劃。提高復(fù)雜環(huán)境下情報(bào)信息的獲取、處理、分析以及可視化能力;提高自組織態(tài)勢(shì)感知與決策系統(tǒng)復(fù)雜環(huán)境下的作戰(zhàn)任務(wù)決策速度以及任務(wù)規(guī)劃能力,從而提高系統(tǒng)數(shù)據(jù)化快速?zèng)Q策及協(xié)同作戰(zhàn)能力,最大限度地發(fā)揮巡飛彈武器平臺(tái)協(xié)同作戰(zhàn)效能。
自組織態(tài)勢(shì)感知與決策系統(tǒng),由協(xié)同目標(biāo)識(shí)別子系統(tǒng)、態(tài)勢(shì)感知子系統(tǒng)、作戰(zhàn)任務(wù)自主決策子系統(tǒng)、協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng)、線下深度學(xué)習(xí)子系統(tǒng),以及決策支撐模型算法庫(kù)和數(shù)據(jù)支撐專業(yè)數(shù)據(jù)庫(kù)組成。
協(xié)同目標(biāo)識(shí)別子系統(tǒng)依賴深度學(xué)習(xí)目標(biāo)識(shí)別模型完成光測(cè)/雷測(cè)影像預(yù)處理、目標(biāo)特征提取、特征融合、目標(biāo)識(shí)別、目標(biāo)定位,以及目標(biāo)融合等功能。態(tài)勢(shì)感知子系統(tǒng)完成戰(zhàn)場(chǎng)態(tài)勢(shì)感知、態(tài)勢(shì)綜合等功能。作戰(zhàn)任務(wù)自主決策子系統(tǒng)依賴作戰(zhàn)任務(wù)自主決策模型完成目標(biāo)威脅分析、目標(biāo)動(dòng)向預(yù)測(cè),以及作戰(zhàn)任務(wù)自主決策等功能。協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng)依賴于作戰(zhàn)任務(wù)方案模型及任務(wù)規(guī)劃模型庫(kù)等,采用分布式架構(gòu),進(jìn)行態(tài)勢(shì)數(shù)據(jù)驅(qū)動(dòng)的協(xié)同部署、目標(biāo)數(shù)據(jù)驅(qū)動(dòng)的協(xié)同任務(wù)分配、數(shù)據(jù)驅(qū)動(dòng)的時(shí)域/空域協(xié)同沖突檢測(cè)及規(guī)劃動(dòng)態(tài)調(diào)控等功能,并生成多巡飛彈武器平臺(tái)協(xié)同作戰(zhàn)任務(wù)指令。當(dāng)感知到戰(zhàn)場(chǎng)情況發(fā)生較大變化時(shí),態(tài)勢(shì)感知可將戰(zhàn)場(chǎng)態(tài)勢(shì)信息及動(dòng)態(tài)環(huán)境反饋輸入至協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng),協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng),根據(jù)戰(zhàn)場(chǎng)實(shí)時(shí)態(tài)勢(shì)及動(dòng)態(tài)環(huán)境進(jìn)行實(shí)時(shí)任務(wù)重分配和規(guī)劃調(diào)控。態(tài)勢(shì)可視化子系統(tǒng)對(duì)敵我力量部署、戰(zhàn)場(chǎng)形勢(shì),以及彈載編隊(duì)的任務(wù)分工等進(jìn)行直觀的展現(xiàn)。決策支撐模型庫(kù)包括知識(shí)庫(kù)、深度學(xué)習(xí)目標(biāo)識(shí)別模型庫(kù)、作戰(zhàn)任務(wù)自主決策模型庫(kù)、任務(wù)規(guī)劃模型庫(kù),主要為復(fù)雜環(huán)境下深度目標(biāo)識(shí)別、基于深度學(xué)習(xí)的作戰(zhàn)任務(wù)自主決策,以及多巡飛彈武器平臺(tái)協(xié)同作戰(zhàn)任務(wù)規(guī)劃[2]提供模型算法支撐。數(shù)據(jù)支撐專業(yè)數(shù)據(jù)庫(kù)包括目標(biāo)特征樣本庫(kù)、光測(cè)/雷測(cè)影像庫(kù)、巡飛彈武器平臺(tái)毀傷效能庫(kù)、訓(xùn)練樣本庫(kù)以及綜合業(yè)務(wù)數(shù)據(jù)庫(kù),主要為態(tài)勢(shì)數(shù)據(jù)驅(qū)動(dòng)的協(xié)同部署、目標(biāo)數(shù)據(jù)驅(qū)動(dòng)的協(xié)同任務(wù)分配,以及數(shù)據(jù)驅(qū)動(dòng)的時(shí)域/空域協(xié)同沖突檢測(cè)提供數(shù)據(jù)支撐?;谏疃葘W(xué)習(xí)的自組織態(tài)勢(shì)感知與決策系統(tǒng)的組成如圖1 所示。
自組織協(xié)同態(tài)勢(shì)感知與決策系統(tǒng)的若干個(gè)子系統(tǒng)配合工作,自組織地完成多項(xiàng)任務(wù)[3]?;谘诧w彈的自組織算法如下:
圖1 自組織態(tài)勢(shì)感知與決策系統(tǒng)組成圖
設(shè)集群中有N 個(gè)成員,各個(gè)巡飛彈的動(dòng)力學(xué)模型有如下矩陣表達(dá)形式:
則基于自組織方法的協(xié)同控制問(wèn)題有如下定義:在每個(gè)周期tc=t0+δc內(nèi),求解每個(gè)巡飛彈的理想速度矢量,其表達(dá)式如下:
權(quán)值應(yīng)滿足如下關(guān)系:
Ct代表追擊目標(biāo)的權(quán)重系數(shù),追尋不同的目標(biāo)。Ct的表達(dá)式如下:
本文將目標(biāo)價(jià)值和摧毀概率引入對(duì)目標(biāo)攻擊的權(quán)值。設(shè)每個(gè)目標(biāo)都有一個(gè)給定的價(jià)值Mp以及攻擊時(shí)被摧毀的概率Pkp。令:
系統(tǒng)應(yīng)用模式分為線下訓(xùn)練與線上應(yīng)用兩種模式,線下訓(xùn)練主要是指在戰(zhàn)前,通過(guò)線下深度學(xué)習(xí)工具(包括樣本訓(xùn)練管理工具與模型訓(xùn)練工具),依次完成訓(xùn)練樣本的導(dǎo)入、目標(biāo)識(shí)別/自主決策/任務(wù)規(guī)劃模型訓(xùn)練、模型入庫(kù)等過(guò)程,使訓(xùn)練后的目標(biāo)識(shí)別/自主決策/任務(wù)規(guī)劃模型可以直接應(yīng)用于線上巡飛彈武器平臺(tái)。而線上應(yīng)用主要是指巡飛彈武器平臺(tái)的應(yīng)用,具體包含以下幾個(gè)階段:
在目標(biāo)識(shí)別與態(tài)勢(shì)感知階段,指揮員通過(guò)態(tài)勢(shì)感知子系統(tǒng)觀察在該階段生成的戰(zhàn)場(chǎng)態(tài)勢(shì)信息,對(duì)態(tài)勢(shì)進(jìn)行分析與理解。
在作戰(zhàn)任務(wù)決策階段,區(qū)別于傳統(tǒng)輔助決策模式,指揮員不需要依次進(jìn)行選定目標(biāo)、確定作戰(zhàn)任務(wù)、確定攻擊條件、選定關(guān)鍵目標(biāo)和選定目標(biāo)關(guān)鍵點(diǎn)等多個(gè)過(guò)程的決策。通過(guò)作戰(zhàn)任務(wù)自主決策子系統(tǒng),將自動(dòng)生成針對(duì)每個(gè)目標(biāo)的作戰(zhàn)任務(wù),指揮員的工作只需要對(duì)生成作戰(zhàn)任務(wù)進(jìn)行確認(rèn)與調(diào)整。
在任務(wù)規(guī)劃階段,區(qū)別于傳統(tǒng)指揮員需要進(jìn)行任務(wù)規(guī)劃的模式,指揮員不需要編制作戰(zhàn)方案的每個(gè)細(xì)節(jié)。通過(guò)協(xié)同作戰(zhàn)任務(wù)規(guī)劃子系統(tǒng)將自動(dòng)生成作戰(zhàn)方案,指揮員的工作只需要對(duì)生成的作戰(zhàn)方案進(jìn)行調(diào)整與確定。
在作戰(zhàn)執(zhí)行與評(píng)估階段,指揮員主要對(duì)任務(wù)執(zhí)行以及毀傷評(píng)估進(jìn)行監(jiān)控。
根據(jù)上述內(nèi)容,將自組織態(tài)勢(shì)感知與決策系統(tǒng)應(yīng)用于巡飛彈武器平臺(tái),使指揮員從繁瑣的制定作戰(zhàn)任務(wù)及方案的細(xì)節(jié)中解脫出來(lái),而將精力專注于更高層面的頂層決策上。
自組織態(tài)勢(shì)感知與決策系統(tǒng)應(yīng)用視圖如下頁(yè)圖2 所示。
通過(guò)在地面線下應(yīng)用深度學(xué)習(xí)技術(shù)[4-5]訓(xùn)練協(xié)同態(tài)勢(shì)感知與決策模型,然后將訓(xùn)練好的模型部署到彈載線上系統(tǒng)中,分別完成深度目標(biāo)識(shí)別[6]、任務(wù)自主決策[7]與任務(wù)規(guī)劃。
在深度目標(biāo)識(shí)別模型地面線下學(xué)習(xí)階段,深度學(xué)習(xí)技術(shù)所需的訓(xùn)練樣本,主要來(lái)自歷史采集的巡飛彈圖像數(shù)據(jù)與模擬生成的典型圖像數(shù)據(jù),包括紅外傳感器[8]、可見(jiàn)光探測(cè)器[9]、雷達(dá)所探測(cè)的影像[10],并通過(guò)大數(shù)據(jù)集成引擎完成多源異構(gòu)訓(xùn)練數(shù)據(jù)集的集成與規(guī)格化。傳統(tǒng)用于目標(biāo)識(shí)別所需的知識(shí)庫(kù)與目標(biāo)特征庫(kù)用于對(duì)目標(biāo)識(shí)別模型建模,形成初始目標(biāo)識(shí)別模型。目標(biāo)識(shí)別主要依據(jù)其識(shí)別對(duì)象的類型而獨(dú)立建模的,例如指揮所、雷達(dá)站等目標(biāo)都需要建立其各自獨(dú)立的目標(biāo)識(shí)別模型,因此,在對(duì)目標(biāo)識(shí)別模型進(jìn)行訓(xùn)練時(shí),其訓(xùn)練集是依據(jù)其識(shí)別對(duì)象的類型而選取的,例如在對(duì)指揮所目標(biāo)識(shí)別模型進(jìn)行訓(xùn)練時(shí),需要選取所有包含了指揮所的影像訓(xùn)練集。其次,需要對(duì)模型中的神經(jīng)元的初始參數(shù)進(jìn)行設(shè)置,并且選擇合適的訓(xùn)練算法,以保證識(shí)別誤差達(dá)到理想狀態(tài),并且訓(xùn)練過(guò)程可以快速收斂。在目標(biāo)識(shí)別模型訓(xùn)練后,訓(xùn)練后的模型可以直接應(yīng)用于對(duì)目標(biāo)的識(shí)別。
在任務(wù)自主決策模型[11]地面線下學(xué)習(xí)階段,深度學(xué)習(xí)技術(shù)所需的訓(xùn)練樣本,主要來(lái)自巡飛彈的歷史作戰(zhàn)任務(wù)決策數(shù)據(jù)與典型仿真場(chǎng)景中的作戰(zhàn)任務(wù)決策數(shù)據(jù),并通過(guò)大數(shù)據(jù)集成引擎完成多源異構(gòu)訓(xùn)練數(shù)據(jù)集的集成與規(guī)格化。作戰(zhàn)任務(wù)決策最終需要確定對(duì)目標(biāo)的監(jiān)視、跟蹤、打擊等作戰(zhàn)任務(wù)[12],因此,任務(wù)決策模型是依據(jù)其作戰(zhàn)任務(wù)的類型建立的,例如,監(jiān)視決策模型、跟蹤決策模型等[13]。因此,在對(duì)任務(wù)決策模型進(jìn)行訓(xùn)練時(shí),其訓(xùn)練集也是依據(jù)其決策任務(wù)的類型而選取的,例如,在對(duì)監(jiān)視決策任務(wù)模型進(jìn)行訓(xùn)練時(shí),需要選取所有包含了監(jiān)視決策任務(wù)的訓(xùn)練集。其次,需要對(duì)模型中神經(jīng)元的初始參數(shù)進(jìn)行設(shè)置,并且選擇合適的訓(xùn)練算法,以保證識(shí)別誤差達(dá)到理想狀態(tài),并且訓(xùn)練過(guò)程可以快速收斂。在任務(wù)決策模型訓(xùn)練后,訓(xùn)練后的模型可以直接應(yīng)用于任務(wù)決策,將目標(biāo)數(shù)據(jù)、敵情數(shù)據(jù)、我情數(shù)據(jù)及戰(zhàn)場(chǎng)態(tài)勢(shì)信息作為任務(wù)決策模型的輸入,可以得到該目標(biāo)采取某種任務(wù)決策的概率,最終實(shí)現(xiàn)作戰(zhàn)任務(wù)自主決策。
圖2 自組織態(tài)勢(shì)感知與決策系統(tǒng)應(yīng)用模式
在任務(wù)規(guī)劃模型[14]地面線下學(xué)習(xí)階段,深度學(xué)習(xí)技術(shù)所需的訓(xùn)練樣本,主要來(lái)自巡飛彈的歷史作戰(zhàn)任務(wù)方案與典型仿真場(chǎng)景中的作戰(zhàn)任務(wù)方案,并通過(guò)大數(shù)據(jù)集成引擎完成多源異構(gòu)訓(xùn)練數(shù)據(jù)集的集成與規(guī)格化。作戰(zhàn)任務(wù)規(guī)劃最終需要確定我方裝備的作戰(zhàn)任務(wù),作戰(zhàn)任務(wù)包含了許多組成方面,其中最重要的是選擇最優(yōu)的武器/協(xié)同武器來(lái)獲取最佳的殺傷效果,因此,建立的任務(wù)規(guī)劃模型是依據(jù)我方裝備的類型建立的[15],其訓(xùn)練集也是依據(jù)我方裝備類型而選取的,例如,在對(duì)巡飛彈武器平臺(tái)任務(wù)規(guī)模模型進(jìn)行訓(xùn)練時(shí),需要選取所有包含了該巡飛彈武器平臺(tái)與其對(duì)應(yīng)的態(tài)勢(shì)信息的訓(xùn)練集。其次,需要對(duì)模型中神經(jīng)元的初始參數(shù)進(jìn)行設(shè)置,并且選擇合適的訓(xùn)練算法,以保證識(shí)別誤差達(dá)到理想狀態(tài),并且訓(xùn)練過(guò)程可以快速收斂。在任務(wù)規(guī)劃模型訓(xùn)練后,訓(xùn)練后的模型可以直接應(yīng)用于任務(wù)規(guī)劃的武器裝備選擇。
自組織態(tài)勢(shì)感知與決策系統(tǒng)的總體設(shè)計(jì),將為系統(tǒng)的技術(shù)突破、功能實(shí)現(xiàn)、產(chǎn)品設(shè)計(jì)奠定基礎(chǔ)。通過(guò)對(duì)基于深度學(xué)習(xí)的態(tài)勢(shì)感知與決策系統(tǒng)的深入技術(shù)研究與產(chǎn)品研制,可望使系統(tǒng)在如下幾個(gè)方面得到發(fā)展與應(yīng)用:一是向智能化、自主化發(fā)展,使系統(tǒng)變得“會(huì)理解、會(huì)思考、會(huì)決策”;二是向協(xié)同一體、精確作戰(zhàn)方向發(fā)展,有效縮短O(píng)ODA 時(shí)間,提高作戰(zhàn)效能?;谏疃葘W(xué)習(xí)的協(xié)同態(tài)勢(shì)感知與決策系統(tǒng)的發(fā)展,不僅可提高巡飛彈武器的態(tài)勢(shì)感知能力和精確打擊能力,而且可推廣到其他武器協(xié)同態(tài)勢(shì)感知與決策系統(tǒng)的研制,具有很大的軍事、技術(shù)和經(jīng)濟(jì)效益。