鄒明胤 朱曉敏 包衛(wèi)東 王 吉 劉大千
1.國防科技大學(xué)大數(shù)據(jù)與決策實(shí)驗(yàn)室 湖南 長沙 410073 2.軍事科學(xué)院戰(zhàn)略評估咨詢中心 北京 100097
近年來,在人工智能、大數(shù)據(jù)、云計(jì)算、物聯(lián)網(wǎng)等先進(jìn)技術(shù)的推動下,無人平臺已經(jīng)被廣泛應(yīng)用到物品投送、環(huán)境保護(hù)、搶險(xiǎn)救災(zāi)、農(nóng)藥噴灑、燈光表演、地圖測繪、偵察追蹤等領(lǐng)域,在極大解放勞動力的同時(shí),還能夠替代人類執(zhí)行枯燥、惡劣、危險(xiǎn)的任務(wù),正在國民經(jīng)濟(jì)建設(shè)和國防領(lǐng)域扮演著越來越重要的角色[1].
隨著所承擔(dān)任務(wù)的工作量和復(fù)雜性不斷增加,無人平臺在載荷、續(xù)航、決策等方面的負(fù)擔(dān)不斷加劇,逐漸暴露出任務(wù)執(zhí)行能力弱、效率低、靈活性差等問題. 因受制于現(xiàn)有技術(shù)和成本,依靠無人平臺的作業(yè)能力難以勝任不斷涌現(xiàn)的新任務(wù)需求. 無人平臺的研究在工業(yè)生產(chǎn)、搶險(xiǎn)救災(zāi)等實(shí)際環(huán)境中具有時(shí)代意義. 近些年,研究者們面向多無人平臺協(xié)同任務(wù)規(guī)劃方法研究,依靠無人集群實(shí)現(xiàn)目標(biāo)偵察、跟蹤與圍捕等實(shí)時(shí)任務(wù)規(guī)劃,在實(shí)際的環(huán)境中具有廣闊的應(yīng)用前景. 特別是在軍事領(lǐng)域,可以實(shí)現(xiàn)對入侵者的偵察、監(jiān)視、打擊、毀傷評估等,提高了軍隊(duì)各類設(shè)備的智能化程度,在安全保障方面提供了新思路、新方式.
各軍事強(qiáng)國對無人集群任務(wù)規(guī)劃能力高度重視,視之為改變未來戰(zhàn)爭制勝規(guī)則的顛覆性力量. 2018年8月,美國國防部發(fā)布了《無人系統(tǒng)綜合路線圖2017-2042》[2],提出了美國無人系統(tǒng)領(lǐng)域發(fā)展的4 大主題和19 項(xiàng)關(guān)鍵技術(shù). 4 大主題是互用性、自主性、網(wǎng)絡(luò)安全和人機(jī)協(xié)同. 19 項(xiàng)關(guān)鍵技術(shù)包括了機(jī)器人技術(shù)、人工智能、集群能力等. 美正在開展的代表性項(xiàng)目如“小精靈”項(xiàng)目、“進(jìn)攻性蜂群使能戰(zhàn)術(shù)”、“試驗(yàn)性驗(yàn)證網(wǎng)關(guān)演習(xí)”項(xiàng)目等均取得了突破性進(jìn)展[3].2021年10月,“小精靈”項(xiàng)目空中回收“小精靈”無人機(jī)實(shí)驗(yàn)成功,邁出無人集群韌性靈活執(zhí)行任務(wù)的關(guān)鍵一步[4]. 2021年12月,“進(jìn)攻性蜂群使能戰(zhàn)術(shù)”項(xiàng)目融合虛實(shí)結(jié)合技術(shù),通過沉浸式蜂群界面對蜂群指揮控制,為有人/無人協(xié)同執(zhí)行任務(wù)提供了技術(shù)支持[5]. 2022年4月,“試驗(yàn)性驗(yàn)證網(wǎng)關(guān)演習(xí)”完成了由30 架無人機(jī)組成的無人集群作戰(zhàn)試驗(yàn). 此次試驗(yàn)采用空地協(xié)同、分批發(fā)射與分布式控制的方式,依次完成偵察、防空壓制、打擊與毀傷評估任務(wù). 集群作戰(zhàn)概念由“無人機(jī)蜂群”轉(zhuǎn)變成“無人機(jī)狼群”,是低成本無人機(jī)集群作戰(zhàn)的全新作戰(zhàn)理念[6]. 在實(shí)際戰(zhàn)場中,2020年9月,阿塞拜疆部署由6 架異構(gòu)無人機(jī)組成的無人機(jī)集群,摧毀了亞美尼亞的防空系統(tǒng),導(dǎo)致亞美尼亞地面資產(chǎn)遭受大量破壞[7].
在國內(nèi),2021年11月,中國電子技術(shù)標(biāo)準(zhǔn)化研究院發(fā)布《智能無人集群系統(tǒng)發(fā)展白皮書》,指出智能無人集群系統(tǒng)的任務(wù)復(fù)雜度普遍提升,對于集群系統(tǒng)的智能化、魯棒性提出了更高的功能與性能要求[8]. 2018年1月,國防科技大學(xué)智能科學(xué)學(xué)院無人機(jī)系統(tǒng)創(chuàng)新團(tuán)隊(duì)開展了20 余架次的無人機(jī)集群自主協(xié)同飛行試驗(yàn),驗(yàn)證了空中集結(jié)編隊(duì)、定向編隊(duì)飛行和編隊(duì)協(xié)同偵察等任務(wù)執(zhí)行能力[9]. 2020年9月國內(nèi)民營企業(yè),成功地組織了3 051 架無人機(jī)同時(shí)集群飛行,創(chuàng)下了集群控制新的世界記錄[10]. 這些項(xiàng)目在無人集群任務(wù)規(guī)劃相關(guān)技術(shù)進(jìn)行了大量深入的探索.
值得注意的是,目前無人平臺的自主性處于“弱智能”階段,無人集群協(xié)同感知、決策、控制能力略顯不足,逐漸暴露出靈活性差、計(jì)算能力低、環(huán)境感知能力差、任務(wù)執(zhí)行能力差等問題,有人系統(tǒng)與無人集群之間存在態(tài)勢把控難、實(shí)時(shí)信息交互慢等問題.傳統(tǒng)的無人集群在態(tài)勢感知、資源整合、組織協(xié)同等信息力方面的缺陷直接制約了有人系統(tǒng)與無人集群協(xié)同執(zhí)行任務(wù)的完成率和時(shí)效性. 與此同時(shí),考慮在復(fù)雜環(huán)境中目標(biāo)具有動態(tài)性,任務(wù)具有實(shí)時(shí)性等特點(diǎn),進(jìn)一步增加了執(zhí)行任務(wù)的難度. 因此,如何建立智能有人/無人集群任務(wù)規(guī)劃系統(tǒng)集成框架,有效地組織、管理無人集群,實(shí)現(xiàn)單無人平臺自主行為規(guī)劃、無人集群自主協(xié)同、有人系統(tǒng)與無人集群協(xié)同,具有十分重要的研究價(jià)值.
近年來,在各發(fā)達(dá)國家的軍事技術(shù)發(fā)展布局中,無人集群任務(wù)規(guī)劃在戰(zhàn)場物資投送[11]、戰(zhàn)場監(jiān)視[12]、協(xié)同偵察打擊[13]等實(shí)際應(yīng)用中的廣泛性明顯增加. 當(dāng)前,對于無人集群任務(wù)規(guī)劃的研究思路主要集中在路徑規(guī)劃和資源調(diào)度兩方面,并開展了豐富的研究,取得了如下成果.
路徑規(guī)劃是無人集群完成多樣化任務(wù)的重要保證. 在不斷變化的新形式任務(wù)環(huán)境中,具有自主決策和優(yōu)秀感知能力的無人平臺才能快速高效地完成任務(wù). 由于微型無人平臺搭載的硬件設(shè)施能力有限,面對復(fù)雜多變的任務(wù)環(huán)境,無人平臺由于自身偵察范圍有限,往往不能有效的執(zhí)行任務(wù). 因此,需要多無人平臺實(shí)時(shí)路徑規(guī)劃算法,來保持多無人平臺的高機(jī)動性和避障功能. 為了合理制定任務(wù)方案并減少無人集群的成本,許多研究人員已經(jīng)開發(fā)出有效的策略應(yīng)對這一問題[14]. 李瑞陽等提出了基于列生成算法的無人機(jī)路徑規(guī)劃方法[15],以飛行成本最小為目標(biāo)函數(shù),充分考慮時(shí)間約束的前提下建立無人機(jī)路徑規(guī)劃優(yōu)化模型. 該方法采用列生成算法對飛行方案進(jìn)行優(yōu)化選擇,提高了任務(wù)的完成效率. 當(dāng)面對動態(tài)任務(wù)和不確定的環(huán)境時(shí),去中心化無人集群路徑規(guī)劃方法受到了廣泛關(guān)注. KIM 等針對無人機(jī)編隊(duì)在未知區(qū)域協(xié)同執(zhí)行搜索攻擊任務(wù)的路徑規(guī)劃問題,提出了一種分布式路徑規(guī)劃方法[16]. 該方法能夠利用平衡資源消耗的方式有效地利用現(xiàn)有資源,從而通過保留更多可用的無人機(jī)以順利應(yīng)對動態(tài)任務(wù). 經(jīng)驗(yàn)證明該方法獲得了較高的資源保障和快速攻擊響應(yīng)的能力. LEMAIRE 等針對多機(jī)器人系統(tǒng)的任務(wù)規(guī)劃問題,提出了一個(gè)完全分布式的結(jié)構(gòu)[17]. 為了平衡工作負(fù)載,減低系統(tǒng)成員間工作負(fù)荷的不均衡性,引入了一個(gè)公平系數(shù)進(jìn)行調(diào)節(jié),進(jìn)而保持系統(tǒng)完全分布式. LUO 等提出了一種適用于異構(gòu)多機(jī)器人系統(tǒng)的分布式任務(wù)規(guī)劃算法[18]. 該算法將任務(wù)劃分為若干個(gè)不相交的組,并且限定完成每組任務(wù)的機(jī)器人數(shù)量(包括在整個(gè)任務(wù)內(nèi)以及在不同的任務(wù)組內(nèi)). 由于每個(gè)機(jī)器人均在任務(wù)執(zhí)行中獲得一定的收益,因此,該任務(wù)規(guī)劃方法的目標(biāo)函數(shù)是最大化群機(jī)器人總收益. 該方法通過分布式算法迭代地計(jì)算每個(gè)機(jī)器人在執(zhí)行任務(wù)中的成本,從而構(gòu)建群機(jī)器人的任務(wù)規(guī)劃方式. LIU 等針對不確定環(huán)境下的監(jiān)視問題提出了多無人機(jī)協(xié)同路徑規(guī)劃模型[19],以能量消耗和傳輸不可靠為代價(jià),在不確定障礙區(qū)域情況下,根據(jù)實(shí)時(shí)障礙情況,建立不同的約束機(jī)制,通過調(diào)整無人機(jī)監(jiān)視的位置來提高目標(biāo)監(jiān)視性能. ZOU 等針對未知環(huán)境下的編隊(duì)問題提出了多目標(biāo)優(yōu)化控制框架[20].在該框架,無人機(jī)集群可以在保持編隊(duì)相似,編隊(duì)密度一致和快速編隊(duì)的同時(shí),自由變換隊(duì)形.
然而在復(fù)雜未知環(huán)境下,上述無人集群任務(wù)規(guī)劃方法未考慮目標(biāo)及無人平臺動態(tài)變化的情況,尤其是對無人平臺資源調(diào)度的問題缺乏進(jìn)一步討論[21].資源調(diào)度是保證任務(wù)質(zhì)量、提高系統(tǒng)資源利用率、減少系統(tǒng)能耗的有效手段. 由于未知環(huán)境中充滿動態(tài)性、不確定性、突發(fā)性和復(fù)雜性等特征導(dǎo)致無人平臺具有易損性,因此,如何在任務(wù)完成的前提下,最大限度的利用現(xiàn)有資源,是無人系統(tǒng)所要面對的重要問題. 此外,由于無人資源的異構(gòu)性,資源模塊需具有靈活的按需供給能力. 針對上述無人平臺資源調(diào)度問題,近年來,許多研究者從靜態(tài)資源調(diào)度和動態(tài)資源調(diào)度兩個(gè)方面展開研究. 靜態(tài)資源調(diào)度存在約束條件簡單,目標(biāo)函數(shù)單一的問題. 針對這一問題,考慮無人資源合理分配和高效運(yùn)用,皇甫瑩麗等提出了一種面向?yàn)?zāi)害救援的無人機(jī)資源優(yōu)化配置方法[22],該方法以多目標(biāo)規(guī)劃和聚類技術(shù)為核心的優(yōu)化策略,建立了多目標(biāo)規(guī)劃模型,在同時(shí)滿足最大搜救和中繼需求的情況下,解決無人機(jī)資源的優(yōu)化配置問題. 考慮無人機(jī)負(fù)荷有限的約束,蔡偉等提出了一種對觀察窗口偵察資源的協(xié)同優(yōu)化調(diào)度方法[23]. 該方法通過優(yōu)化當(dāng)前場面下各機(jī)電子偵察的瞬時(shí)空-頻域覆蓋選擇,提高無源定位中每個(gè)定位參數(shù)對定位結(jié)果的效用,降低獲取定位參數(shù)所需要的對偵察資源的占用,從而提升無人機(jī)集群能夠同時(shí)應(yīng)對的目標(biāo)數(shù). 考慮最少任務(wù)約束的大規(guī)模資源調(diào)度問題,鄧敏等設(shè)計(jì)成本、效益等多維指標(biāo),利用層次分析法計(jì)算指標(biāo)權(quán)重,結(jié)合并行遺傳模型有效求解大規(guī)模復(fù)雜資源調(diào)度問題,可以有效求解大規(guī)模復(fù)雜資源調(diào)度問題[24].針對動態(tài)資源調(diào)度問題,考慮實(shí)現(xiàn)應(yīng)急情況下多無人機(jī)動態(tài)資源調(diào)度問題,FEI 等提出了一種基于滾動激勵(lì)的異構(gòu)無人機(jī)應(yīng)急任務(wù)調(diào)度方法[25]. 為保證應(yīng)急任務(wù)能夠?qū)崟r(shí)分配給無人機(jī),該算法設(shè)計(jì)了一種基于密度峰值聚類算法的任務(wù)分組策略,能夠?qū)Φ竭_(dá)系統(tǒng)的任務(wù)快速選擇性能匹配的無人機(jī). 該算法在確保應(yīng)急任務(wù)完成率的同時(shí),降低多無人機(jī)的飛行成本,為應(yīng)急救援,智能交通等提供可靠地算法支撐. 考慮動態(tài)資源調(diào)度的擾動因素,劉文文等設(shè)計(jì)調(diào)度收益以及最小方案變動作為目標(biāo)函數(shù),根據(jù)不同擾動因素構(gòu)建不同的動態(tài)資源調(diào)度模型,結(jié)合多目標(biāo)優(yōu)化算法為動態(tài)資源調(diào)度提供解決方案[26]. 此外,為了提高動態(tài)資源部署的計(jì)算效率,FEI 等提出了基于數(shù)據(jù)聚類的彈性資源調(diào)度方法[27],通過任務(wù)聚類,任務(wù)量預(yù)測與動態(tài)資源調(diào)度完成資源靈活調(diào)配.
值得注意的是,由于在復(fù)雜多變的環(huán)境下,無人平臺易發(fā)生損毀,系統(tǒng)內(nèi)呈現(xiàn)出高度動態(tài)的特性,拓?fù)浣Y(jié)構(gòu)不斷變化. 要實(shí)現(xiàn)無人集群動態(tài)、實(shí)時(shí)任務(wù)規(guī)劃,不僅需要精確高效的實(shí)時(shí)規(guī)劃算法,更需要系統(tǒng)集成技術(shù),將無人平臺、無人集群與有人系統(tǒng)有機(jī)地整合在一起,以發(fā)揮出體系效益. 針對上述問題,趙林等面向協(xié)同感知,任務(wù)規(guī)劃與路徑規(guī)劃等任務(wù),提出了分布式協(xié)同框架[28]. 該框架包含任務(wù)分解、任務(wù)調(diào)整、執(zhí)行條件約束、計(jì)算規(guī)劃等關(guān)鍵技術(shù). 通過預(yù)先計(jì)算和任務(wù)預(yù)先分配的方式,無人集群按照既定方案執(zhí)行任務(wù). 向錦武等面向區(qū)域搜索、資源調(diào)度等任務(wù)需求,結(jié)合“感知-判斷-決策-行動”(oberve-orient-decide-act,OODA)循環(huán),建立復(fù)雜環(huán)境下無人集群自主協(xié)同系統(tǒng)集成框架[29]. 該框架通過高維態(tài)勢感知與認(rèn)知、智能決策與規(guī)劃與自主協(xié)同控制三類關(guān)鍵技術(shù),完成非結(jié)構(gòu)化的信息協(xié)同采集、無中心的自組織任務(wù)規(guī)劃與分布式強(qiáng)魯邦控制. 王祥科等融合OODA 回路與集群協(xié)同的關(guān)鍵技術(shù),在感知部分,應(yīng)用協(xié)同觀測技術(shù);在判斷部分,應(yīng)用協(xié)同偵察、協(xié)同定位與建圖技術(shù);在決策部分,應(yīng)用任務(wù)分配與任務(wù)規(guī)劃技術(shù);在行動部分,應(yīng)用聚集、蜂擁與編隊(duì)技術(shù)[30].盡管上述這些文獻(xiàn)結(jié)合系統(tǒng)工程思想與OODA 循環(huán),提出了無人集群自主任務(wù)規(guī)劃系統(tǒng)集成框架. 然而,針對復(fù)雜環(huán)境以及有人無人協(xié)同下的任務(wù)規(guī)劃問題,現(xiàn)如今缺少一定的系統(tǒng)集成框架. 因此,如何實(shí)現(xiàn)無人平臺多功能集成,無人集群系統(tǒng)集成與有人/無人系統(tǒng)集成,仍需開展進(jìn)一步研究.
任務(wù)規(guī)劃是針對已知任務(wù)和已知平臺信息的優(yōu)化求解過程. 常見的任務(wù)規(guī)劃系統(tǒng)流程如圖1 所示.指揮員下達(dá)命令生成任務(wù)列表,這些任務(wù)根據(jù)功能和約束分類成任務(wù)流,這些任務(wù)流經(jīng)過任務(wù)調(diào)度、資源分配和路徑規(guī)劃最終得到任務(wù)規(guī)劃方案.
無人集群任務(wù)規(guī)劃是智能無人系統(tǒng)研究中的熱點(diǎn)問題之一,主旨是在感知未知環(huán)境中的可能目標(biāo)后,如何利用資源調(diào)度優(yōu)化模型對現(xiàn)有可利用資源進(jìn)行整合評估,以最大可能地挖掘各個(gè)無人平臺的潛力,達(dá)到無人平臺的合理部署,從而完成任務(wù)規(guī)劃[31]. 如圖2 所示,無人集群任務(wù)規(guī)劃問題具體可以分為路徑規(guī)劃與資源調(diào)度兩部分,路徑規(guī)劃問題是考慮環(huán)境約束下的平臺位置與任務(wù)位置之間的組合優(yōu)化問題. 而資源調(diào)度是考慮資源與需求之間的匹配機(jī)制,使得路徑規(guī)劃的平臺與任務(wù)在確保任務(wù)完成時(shí)間的同時(shí)確保資源保障到位.
圖2 無人集群任務(wù)規(guī)劃模型Fig.2 Unmanned swarm mission planning model
然而,在復(fù)雜環(huán)境下,這些任務(wù)規(guī)劃流程與模型無法適應(yīng)動態(tài)多變的實(shí)際環(huán)境、無法考慮集群內(nèi)部的協(xié)同、有人/無人集群之間的協(xié)同. 基于此,提出了如圖3 所示的有人/無人任務(wù)規(guī)劃系統(tǒng)集成框架. 該系統(tǒng)集成框架將規(guī)劃決策、無人平臺、有人系統(tǒng)組合起來解決無人集群實(shí)時(shí)任務(wù)規(guī)劃問題. 集成的各個(gè)子部分包含無人平臺自主行為規(guī)劃系統(tǒng)集成、無人集群分布式系統(tǒng)集成與有人/無人集群系統(tǒng)集成.無人平臺自主行為規(guī)劃系統(tǒng)通過感知、認(rèn)知、決策與控制完成自主行為規(guī)劃. 不同無人平臺之間通過交互感知-通信信息,平臺-任務(wù)信息,資源-需求信息與決策信息,完成對無人集群分布式系統(tǒng)集成. 有人系統(tǒng)參與無人集群在準(zhǔn)備階段的預(yù)先規(guī)劃、執(zhí)行任務(wù)階段的實(shí)時(shí)規(guī)劃與完成任務(wù)后的事后評估過程,使得有人系統(tǒng)與無人系統(tǒng)實(shí)時(shí)協(xié)同交互,進(jìn)而完成有人/無人集群系統(tǒng)集成.
圖3 有人/無人任務(wù)規(guī)劃系統(tǒng)集成框架Fig.3 Integration framework of manned/unmanned mission planning system
無人平臺的行為規(guī)劃通常需要提前進(jìn)行充分的計(jì)算和分配,每個(gè)無人平臺按照既定的方案執(zhí)行,這很難適應(yīng)動態(tài)變化和復(fù)雜的環(huán)境. 為了完成自主行為規(guī)劃,將無人平臺自主行為規(guī)劃系統(tǒng)解耦成4 個(gè)層面:感知層、認(rèn)知層、決策層與控制層. 無人平臺通過感知層獲取外部環(huán)境與無人集群的相關(guān)信息,這些信息匯總到認(rèn)知層,經(jīng)過決策層,最終通過控制層反饋給外部環(huán)境和無人集群. 通過無人平臺與外部環(huán)境、無人集群之間的交互,最終完成自主行為規(guī)劃循環(huán),具體過程如圖4 所示.
圖4 無人平臺自主行為規(guī)劃系統(tǒng)集成Fig.4 Autonomous behavior planning system integration for unmanned platform
如圖5 所示,感知層行為具體為無人平臺對外界信息的收集. 外界信息主要包括圖像信息和通信信息. 而在圖像信息中,既包含對靜態(tài)地圖的構(gòu)建,同時(shí)又包含對任務(wù)目標(biāo)的檢測. 因此,感知層行為主要包含靜態(tài)地圖構(gòu)建、任務(wù)目標(biāo)檢測與通信信號接受三類任務(wù). 其中,靜態(tài)地圖構(gòu)建(simultaneous localization and mapping,SLAM),為無人集群提供基礎(chǔ)地圖和定位參考. 根據(jù)無人平臺所攜帶的傳感器的不同,可以將靜態(tài)地圖構(gòu)建分為激光SLAM,視覺SLAM 以及多傳感器融合SLAM[32]. 激光SLAM 通過搭載激光雷達(dá),掃描外界環(huán)境,獲得外界環(huán)境的點(diǎn)信息,根據(jù)不同點(diǎn)的信息差異,獲取環(huán)境信息和無人平臺的位姿信息[33]. 視覺SLAM 通過搭載單目相機(jī)、多目相機(jī)以及深度相機(jī)等記錄外界環(huán)境的圖像信息,根據(jù)和環(huán)境紋理信息提取,深度信息判斷,獲取環(huán)境信息和位姿信息[34]. 多傳感器融合SLAM 通過搭載包含激光雷達(dá)、多目相機(jī)以及慣性測量單元(IMU)等多類傳感器,獲取多維環(huán)境信息,利用多傳感器數(shù)據(jù)融合算法,獲取誤差較小的環(huán)境信息和位姿信息[35].任務(wù)目標(biāo)檢測需要對無人平臺的視野中的任務(wù)目標(biāo)進(jìn)行準(zhǔn)確識別,是無人集群態(tài)勢理解的基礎(chǔ). 常見的目標(biāo)檢測算法可以分為傳統(tǒng)目標(biāo)檢測算法和基于深度學(xué)習(xí)的目標(biāo)檢測算法. 傳統(tǒng)目標(biāo)檢測算法通過區(qū)域選擇器對視野內(nèi)圖像不斷進(jìn)行框選,接著通過特征提取算法分析這些框選區(qū)域,最后根據(jù)預(yù)訓(xùn)練好的分類器對特征進(jìn)行分類并最終完成目標(biāo)檢測[36]. 然而,傳統(tǒng)目標(biāo)檢測算法由于算法時(shí)間復(fù)雜度高、求解效率低、精度低、泛化能力差等缺點(diǎn)而無法滿足目標(biāo)檢測需求. 而深度學(xué)習(xí)目標(biāo)檢測算法包含單階段檢測算法、雙階段檢測算法、對抗學(xué)習(xí)算法等[37],可以在較短時(shí)間內(nèi)完成目標(biāo)精確識別的同時(shí),具有較強(qiáng)的泛化性能,更適合于無人集群自主任務(wù)規(guī)劃場景. 在通信信號接收中,無人平臺既需要接收來自其他無人平臺所感知的態(tài)勢信息,同時(shí)也需要接收來自有人系統(tǒng)的命令.
圖5 感知層行為Fig.5 Perceptual layer behavior
如圖6 所示,認(rèn)知層行為具體為無人平臺對感知信息的整合、匯總,并生成優(yōu)化問題. 隨著感知信息的不斷更新,認(rèn)知層需要將這些信息不斷地融合在整個(gè)態(tài)勢中. 這里的態(tài)勢信息指的是通過感知層信息構(gòu)成的地圖以及地圖內(nèi)各個(gè)要素的參數(shù)信息.認(rèn)知融合算法需要根據(jù)多無人平臺搭載傳感器(可見光、多光譜、紅外、合成孔徑雷達(dá)等)以及多無人平臺間通信所傳回的相關(guān)數(shù)據(jù)轉(zhuǎn)換到統(tǒng)一的“時(shí)-空”坐標(biāo)系中[38]. 常見的融合方式包含估計(jì)理論數(shù)據(jù)融合方法(卡爾曼濾波方法、最小二乘法等)、分類數(shù)據(jù)融合方法(聚類分析法、隨機(jī)森林方法等)、推理數(shù)據(jù)融合方法(貝葉斯估計(jì)法、DS 證據(jù)推理法等)以及人工智能融合方法(模糊邏輯法、神經(jīng)網(wǎng)絡(luò)法等). 例如,秦武韜等針對無人集群任務(wù)規(guī)劃中目標(biāo)的準(zhǔn)確可靠定位問題,提出了層次化分布式多無人機(jī)容錯(cuò)定位濾波結(jié)構(gòu)[39],該結(jié)構(gòu)既有完全分布式結(jié)構(gòu)的通信帶寬低、系統(tǒng)容錯(cuò)強(qiáng)的優(yōu)點(diǎn),同時(shí)又有中心式結(jié)構(gòu)的信息集中處理的優(yōu)點(diǎn),提高了信息融合的容錯(cuò)性和可靠性. 對于存在沖突以及缺失的信息,認(rèn)知層通過推理得到統(tǒng)一的態(tài)勢信息. 李洪瑤等針對無人集群大區(qū)域巡視問題中多無人機(jī)對目標(biāo)位置和類比的信息感知的偏差,設(shè)計(jì)了基于動態(tài)切換機(jī)制的多機(jī)融合識別方法[40],自適應(yīng)選擇DS 證據(jù)推理理論以及DSmT 信息融合算法,有效提高無人集群巡視系統(tǒng)的檢測精度. 周治國等針對無人艇水面目標(biāo)跟蹤任務(wù)中,存在遮擋、光照變化、攝像頭抖動等導(dǎo)致信息偏差的問題,提出了時(shí)空信息融合算法,在空間層面應(yīng)用深度學(xué)習(xí)算法提取圖像語義特征[41],在時(shí)間層應(yīng)用相關(guān)濾波跟蹤算法,計(jì)算與空間層相關(guān)特征的相關(guān)性. 該方法能夠在多源信息存在沖突的情況下,確保了目標(biāo)檢測與跟蹤的魯棒性與實(shí)時(shí)性. 通過該態(tài)勢信息,認(rèn)知層通過自動建模獲取得到?jīng)Q策變量、目標(biāo)函數(shù)以及約束條件最終傳遞到?jīng)Q策層中. 關(guān)于認(rèn)知建模算法,魏瑞軒等針對多無人機(jī)協(xié)同搜索中的搜索策略選擇問題,借鑒人在搜索行為中的認(rèn)知決策方式,提出了3 層結(jié)構(gòu)模糊認(rèn)知決策方法[42],可以在感知環(huán)境信息后,自主選擇優(yōu)化目標(biāo)是全域覆蓋搜索還是針對性目標(biāo)搜索. 針對不同優(yōu)化目標(biāo),根據(jù)模糊聚類算法完成搜索路徑匹配,使得無人機(jī)集群的行動軌跡可以集中于目標(biāo)最可能出現(xiàn)的區(qū)域,從而提高搜索效率. 吳子沉等針對無人機(jī)集群圍捕任務(wù)的環(huán)境適應(yīng)能力差的問題,設(shè)計(jì)基于認(rèn)知發(fā)育的圍捕方法[43],通過建立知識庫的方式,將無人機(jī)集群感知的態(tài)勢狀態(tài)信息與優(yōu)化目標(biāo)、圍捕策略等的匹配規(guī)則建立規(guī)則匹配庫,再根據(jù)優(yōu)化目標(biāo)結(jié)合強(qiáng)化學(xué)習(xí)算法(deep Q-network,DQN)訓(xùn)練無人機(jī)的圍捕動作. 根據(jù)該算法,無人機(jī)集群可以在不同環(huán)境下高效完成圍捕任務(wù).
圖6 認(rèn)知層行為Fig.6 Cognitive layer behavior
如圖7 所示,決策層行為具體為無人平臺對優(yōu)化問題的優(yōu)化求解. 根據(jù)認(rèn)知層獲得的態(tài)勢信息,決策層可以對不同的決策方案進(jìn)行仿真推演,并根據(jù)不同的評估函數(shù)對不同的決策方案進(jìn)行評估. 通過最優(yōu)化算法、啟發(fā)式算法以及貪心算法等對決策優(yōu)化,最終得到當(dāng)前認(rèn)知態(tài)勢下的優(yōu)化決策. 值得注意的是,由于感知層信息的不斷變化,導(dǎo)致認(rèn)知態(tài)勢的不斷變化. 這對決策的實(shí)時(shí)響應(yīng)要求極高. 為此,設(shè)計(jì)優(yōu)化結(jié)果庫可以根據(jù)不同的優(yōu)化問題給出之前結(jié)果的變種. 在決策過程中,認(rèn)知層獲得的實(shí)時(shí)動態(tài)任務(wù)規(guī)劃任務(wù)會根據(jù)規(guī)劃算法庫中算法并行計(jì)算. 這些算法根據(jù)運(yùn)行時(shí)間分為3 類:1)快速算法:這類算法無法求得精確解,但是可以在短時(shí)間內(nèi)快速獲得有效解. 常見算法包括貪心算法[44]、聚類算法[45]等.2)動態(tài)啟發(fā)式算法:這類算法通過不斷迭代,獲得優(yōu)化的解決方案. 其中,動態(tài)啟發(fā)式算法由于環(huán)境的變化導(dǎo)致目標(biāo)函數(shù)、決策變量的變化,需要對優(yōu)化結(jié)果庫中的相似優(yōu)化結(jié)果進(jìn)行重建,并最終反饋給動態(tài)優(yōu)化算法加速迭代計(jì)算[46]. 3)精確算法:這類算法最后計(jì)算得到精確的優(yōu)化結(jié)果,但往往需要大量的計(jì)算時(shí)間.這類算法包含分支限界算法[47]、動態(tài)規(guī)劃算法[48]等. 這3 類算法得到結(jié)果都會記錄在優(yōu)化結(jié)果庫中,通過篩選,取得實(shí)時(shí)最佳結(jié)果到控制層去執(zhí)行.
圖7 決策層行為Fig.7 Decision-making layer behavior
如圖8 所示,控制層行為具體為無人平臺自身對外界環(huán)境的影響. 主要包含無人平臺的移動控制、資源控制以及通信輸出. 在移動控制中,除了要根據(jù)決策層獲得的位置進(jìn)行移動,同時(shí)要注意環(huán)境中的靜態(tài)目標(biāo)與動態(tài)目標(biāo),根據(jù)目標(biāo)信息及時(shí)完成避障、避險(xiǎn)控制. MA 等針對障礙環(huán)境下的無人集群協(xié)同編隊(duì)飛行問題,結(jié)合蜂擁模型以及優(yōu)化算法,設(shè)計(jì)含參的無人集群避障避險(xiǎn)規(guī)則以及行動規(guī)則[49],應(yīng)用優(yōu)化算法在多種不同的障礙環(huán)境中優(yōu)化求解行動規(guī)則的參數(shù),并最終獲取無人集群的行動規(guī)則. 該算法可以在不同環(huán)境中保證無人集群的自主飛行與避障避險(xiǎn).WU 等針對障礙環(huán)境下無人集群協(xié)同編隊(duì)飛行與編隊(duì)圍捕任務(wù),設(shè)計(jì)同質(zhì)-異質(zhì)基因調(diào)控網(wǎng)絡(luò),自適應(yīng)設(shè)計(jì)無人集群的避障避險(xiǎn)規(guī)則以及行動規(guī)則及其相關(guān)參數(shù)[50],根據(jù)基因調(diào)控網(wǎng)絡(luò)自適應(yīng)訓(xùn)練獲取優(yōu)化后的無人集群避障避險(xiǎn)規(guī)則. 該方法可以適應(yīng)不同環(huán)境下無人集群完成高效的協(xié)同編隊(duì)與協(xié)同圍捕任務(wù).在資源控制中,無人平臺需要完成對物資、彈藥等載荷的釋放和對不同傳感器的控制. 在通信輸出中,無人平臺除了對其他無人平臺發(fā)送通信感知、平臺任務(wù)、資源需求與決策的交互信息. 同時(shí)也需要將信息反饋給有人系統(tǒng)中.
圖8 控制層行為Fig.8 Control layer behavior
根據(jù)無人平臺自主行為規(guī)劃,無人平臺從感知層獲得態(tài)勢地圖要素傳遞給認(rèn)知層中. 認(rèn)知層通過融合、推理、建模最終生成態(tài)勢地圖與問題建模傳遞給決策層. 決策層通過優(yōu)化計(jì)算獲得決策結(jié)果傳遞給控制層進(jìn)行執(zhí)行. 控制層反饋移動控制與資源控制到外界環(huán)境中,同時(shí)將當(dāng)前交互信息反饋給無人集群中. 不同層次之間數(shù)據(jù)流如圖9 所示.
圖9 自主行為規(guī)劃系統(tǒng)數(shù)據(jù)流Fig.9 Data flow of autonomous behavior planning system
在復(fù)雜多變的動態(tài)環(huán)境中,無人集群任務(wù)規(guī)劃更加側(cè)重于將動態(tài)到達(dá)的各類任務(wù)規(guī)劃至合適的無人平臺,以使集群內(nèi)各無人平臺在時(shí)間、空間上形成有序的協(xié)同行為并發(fā)揮出各無人平臺的能力,最終聚合形成無人集群協(xié)同體系. 因此,動態(tài)任務(wù)規(guī)劃是智能無人集群系統(tǒng)自主協(xié)同的關(guān)鍵. 復(fù)雜環(huán)境中對抗性強(qiáng)、通信穩(wěn)定性差、任務(wù)時(shí)效性要求高等特點(diǎn)都加大了無人集群動態(tài)任務(wù)規(guī)劃的難度. 在復(fù)雜環(huán)境中,任務(wù)和無人機(jī)資源存在動態(tài)變化的情況. 其中,任務(wù)動態(tài)變化通常指任務(wù)目標(biāo)的位置發(fā)生變化和任務(wù)目標(biāo)的新增等. 任務(wù)和資源動態(tài)變化通常是指無人機(jī)存在損毀以及無人機(jī)增援等情況. 任務(wù)與資源的動態(tài)變化往往帶來優(yōu)化問題的解向量空間的動態(tài)變化.
針對任務(wù)與資源動態(tài)變化問題,提出了如圖10的無人集群分布式系統(tǒng)集成體系架構(gòu). 在該體系架構(gòu)中,每個(gè)無人平臺通過感知、認(rèn)知、決策與控制,完成自主行為規(guī)劃. 為適應(yīng)復(fù)雜多變的動態(tài)環(huán)境,完成無人集群分布式自主控制,每個(gè)無人平臺均為決策主體,平臺間以交互信息、彼此決策的方式完成協(xié)同. 其中,無人平臺之間通過交互通信感知信息、平臺任務(wù)信息、資源需求信息與決策信息等可協(xié)同信息到自身認(rèn)知層協(xié)助決策,進(jìn)而完成平臺間自主協(xié)同. 整個(gè)無人集群通過交互信息,涌現(xiàn)出集群感知、集群認(rèn)知、集群決策與集群控制,進(jìn)而完成無人集群分布式自主控制.
圖10 無人集群任務(wù)規(guī)劃體系架構(gòu)Fig.10 Architecture of unmanned swarm mission planning
在傳統(tǒng)的無人集群任務(wù)規(guī)劃模型中,無人集群的協(xié)作方式分為基于中心式以及基于分布式兩種方式. 基于中心決策式的方法通過中間節(jié)點(diǎn)計(jì)算整個(gè)集群的路徑規(guī)劃和資源調(diào)度,再通過分發(fā)的形式傳遞給無人集群的各個(gè)無人平臺. 這種方式存在通信帶寬過高,任務(wù)響應(yīng)時(shí)間過長等問題[51]. 而基于分布式?jīng)Q策的方法一般通過拍賣協(xié)商機(jī)制,發(fā)現(xiàn)任務(wù)目標(biāo)的無人平臺通過招標(biāo)的方式把任務(wù)分發(fā)給其他無人平臺,其他無人平臺通過競標(biāo)的方式來獲取對應(yīng)的任務(wù)[52].在基于拍賣協(xié)商機(jī)制的分布式?jīng)Q策過程中,為了進(jìn)一步探討無人平臺的交互模式,將交互過程的主體分成我方、友方、敵方與環(huán)境4 部分. 基于此,構(gòu)建了如圖11 的感知決策交互模式. 該模式中,交互信息自下而上分別考慮了通信-態(tài)勢、平臺-任務(wù)、資源-需求和決策. 其中,不同的交互層具有不同的交互任務(wù)以及交互算法,如圖12 所示. 通信-態(tài)勢層應(yīng)用深度學(xué)習(xí)多傳感器融合與定位算法等相關(guān)技術(shù)完成態(tài)勢感知與目標(biāo)檢測任務(wù). 我方設(shè)備通過通信與友方設(shè)備進(jìn)行交互. 與此同時(shí),我方設(shè)備通過計(jì)算機(jī)視覺技術(shù)對友方設(shè)備、敵方設(shè)備、環(huán)境、任務(wù)等進(jìn)行識別;平臺-任務(wù)層應(yīng)用啟發(fā)式算法、行為樹、強(qiáng)化學(xué)習(xí)、復(fù)雜網(wǎng)絡(luò)等相關(guān)技術(shù)完成路徑規(guī)劃、編隊(duì)控制、目標(biāo)跟蹤、目標(biāo)圍捕等任務(wù);資源-需求層應(yīng)用貪心/聚類算法、數(shù)學(xué)規(guī)劃、演化計(jì)算等相關(guān)技術(shù)完成資源匹配、資源調(diào)度等任務(wù);決策層應(yīng)用GMCR沖突分析圖模型、因果理論和博弈論等相關(guān)技術(shù)完成戰(zhàn)術(shù)博弈與沖突分析等任務(wù). 我方?jīng)Q策與友方?jīng)Q策、敵方?jīng)Q策之間組成合作博弈,同時(shí)與任務(wù)之間進(jìn)行匹配,進(jìn)而獲得最佳決策.
圖11 感知決策交互模式Fig.11 Perceptual decision-making interaction mode
圖12 感知決策交互任務(wù)與算法Fig.12 Perceptual decision-making interaction task and algorithm
基于感知決策交互模式,無人平臺在集群中通過交互信息、交互任務(wù)、交互算法完成對自身認(rèn)知的提升的同時(shí),實(shí)現(xiàn)無人平臺與友方協(xié)同,環(huán)境交互和敵方博弈,進(jìn)而涌現(xiàn)出群體感知、群體認(rèn)知、群體決策與群體控制,從而實(shí)現(xiàn)無人集群的分布式系統(tǒng)集成.
為了構(gòu)建有人系統(tǒng)與無人集群的感知、認(rèn)知、決策與控制的交互,本文設(shè)計(jì)了有人/無人集群任務(wù)規(guī)劃系統(tǒng)框架如圖13 所示. 該系統(tǒng)自下而上通過服務(wù)層、應(yīng)用層與數(shù)據(jù)層支持與平臺層中的無人集群進(jìn)行數(shù)據(jù)交互.
圖13 有人/無人任務(wù)規(guī)劃系統(tǒng)框架Fig.13 Manned/unmanned mission planning system framework
服務(wù)層主要包含規(guī)劃方案庫、態(tài)勢實(shí)時(shí)數(shù)據(jù)庫、任務(wù)規(guī)劃算法庫與決策評估庫,為預(yù)先規(guī)劃、實(shí)時(shí)規(guī)劃以及事后評估提供服務(wù)保障. 應(yīng)用層主要分為3個(gè)階段:1)預(yù)先規(guī)劃. 2)實(shí)時(shí)規(guī)劃. 3)事后評估. 在預(yù)先規(guī)劃階段,指揮員通過對所需規(guī)劃任務(wù)分析完成對規(guī)劃計(jì)劃、無人資源以及任務(wù)目標(biāo)的指派. 并將規(guī)劃任務(wù)放入任務(wù)規(guī)劃算法庫中進(jìn)行預(yù)先任務(wù)規(guī)劃,獲得任務(wù)規(guī)劃預(yù)案發(fā)送到無人集群;實(shí)時(shí)規(guī)劃首先需要對整個(gè)任務(wù)的執(zhí)行過程進(jìn)行監(jiān)控,并對實(shí)時(shí)態(tài)勢進(jìn)行統(tǒng)計(jì)分析,利用實(shí)時(shí)任務(wù)規(guī)劃算法獲得實(shí)時(shí)規(guī)劃指令發(fā)送給無人集群;事后評估階段首先評估專家根據(jù)評估問題構(gòu)建評估指標(biāo)體系,之后通過集群收集到的全局交互信息進(jìn)行態(tài)勢分析溯源,并對規(guī)劃方案進(jìn)行評估,最終生成事后分析報(bào)告. 數(shù)據(jù)層是無人集群與任務(wù)規(guī)劃系統(tǒng)交互的橋梁. 應(yīng)用層獲得的任務(wù)規(guī)劃預(yù)案與實(shí)時(shí)規(guī)劃指令傳遞給集群感知層.而集群控制層將實(shí)時(shí)交互信息反饋給任務(wù)規(guī)劃系統(tǒng)應(yīng)用層中及時(shí)進(jìn)行實(shí)時(shí)規(guī)劃.
預(yù)先規(guī)劃是有人/無人集群協(xié)同任務(wù)規(guī)劃的前提和基礎(chǔ). 通過預(yù)先規(guī)劃,可以使人與無人平臺對任務(wù)的了解情況保持一致,為后續(xù)協(xié)同執(zhí)行任務(wù)打下基礎(chǔ). 在預(yù)先規(guī)劃階段,有人/無人任務(wù)規(guī)劃系統(tǒng)需要在已知部分任務(wù)目標(biāo)以及環(huán)境信息的情況下,通過規(guī)劃任務(wù)分析、預(yù)先任務(wù)規(guī)劃、規(guī)劃計(jì)劃篩選,最終制定任務(wù)預(yù)案,并傳遞給無人集群的認(rèn)知層中. 胡月等針對有人/無人直升機(jī)協(xié)同打擊地面目標(biāo)問題,提出了有人/無人直升機(jī)任務(wù)規(guī)劃系統(tǒng)[53]. 該系統(tǒng)包含規(guī)劃臺、規(guī)劃推演系統(tǒng)以及規(guī)劃結(jié)果檢驗(yàn)3 部分組成.規(guī)劃臺負(fù)責(zé)任務(wù)的預(yù)先任務(wù)規(guī)劃,任務(wù)推演系統(tǒng)通過互動仿真的形式,完成對規(guī)劃任務(wù)仿真推演. 最后根據(jù)規(guī)劃結(jié)果檢驗(yàn),將任務(wù)方案通過交互平臺傳遞給有人直升機(jī),再依次傳遞給各個(gè)無人直升機(jī). 然而,該方法的有人系統(tǒng)僅僅參與了預(yù)先任務(wù)規(guī)劃的信息獲取部分,沒有參與預(yù)先規(guī)劃的計(jì)算部分. 為了提高有人/無人集群任務(wù)規(guī)劃的高效自主協(xié)同,本節(jié)設(shè)計(jì)的預(yù)先規(guī)劃流程與方法如圖14 所示. 在該系統(tǒng)中,指揮員與專家需要進(jìn)行規(guī)劃任務(wù)分析. 具體包含明確任務(wù)目標(biāo)、管理無人資源與制定規(guī)劃計(jì)劃3 部分.由于人為制定計(jì)劃往往存在單一性、片面性等缺點(diǎn),因此,需要通過預(yù)先任務(wù)規(guī)劃進(jìn)行規(guī)劃計(jì)劃優(yōu)化. 預(yù)先任務(wù)規(guī)劃在規(guī)劃算法庫中,包含規(guī)劃計(jì)劃評估、規(guī)劃計(jì)劃優(yōu)選與規(guī)劃計(jì)劃修改3 個(gè)部分,通過不斷迭代,最終獲取具有不同側(cè)重的規(guī)劃計(jì)劃. 這些計(jì)劃通過指揮員篩選出最合適的計(jì)劃生成任務(wù)預(yù)案并存入規(guī)劃方案庫中. 每個(gè)預(yù)案包含執(zhí)行任務(wù)的無人平臺編號、任務(wù)分工、以及具體任務(wù). 這些任務(wù)為某個(gè)時(shí)刻需要到達(dá)某個(gè)位置執(zhí)行某些任務(wù). 在圖13 中,如任務(wù)預(yù)案1 中,無人平臺1 需要在22年8月31日15 時(shí)08 分到達(dá)27°51′,112°59′ 的位置執(zhí)行偵察任務(wù). 這些預(yù)案同時(shí)會存儲在無人集群的認(rèn)知層中,等待任務(wù)開始時(shí),無人集群可以按照任務(wù)預(yù)案高效執(zhí)行任務(wù).
圖14 預(yù)先規(guī)劃流程與方法Fig.14 Pre-planning processes and methods
實(shí)時(shí)規(guī)劃是有人/無人集群協(xié)同任務(wù)規(guī)劃的核心.通過實(shí)時(shí)規(guī)劃,可以使人與無人平臺在復(fù)雜環(huán)境中適時(shí)作出合理調(diào)整,提高有人/無人集群協(xié)同任務(wù)規(guī)劃的有效性和魯棒性. 在實(shí)時(shí)規(guī)劃階段,有人/無人任務(wù)規(guī)劃系統(tǒng)通過實(shí)時(shí)態(tài)勢監(jiān)控獲取從無人集群控制層發(fā)出的實(shí)時(shí)交互信息,并通過態(tài)勢統(tǒng)計(jì)分析、實(shí)時(shí)態(tài)勢分析、實(shí)時(shí)任務(wù)規(guī)劃以及規(guī)劃計(jì)劃重篩等獲得實(shí)時(shí)規(guī)劃指令并傳遞給無人集群的感知層中. 柳文林等針對有人/無人機(jī)實(shí)時(shí)協(xié)同編隊(duì)問題,設(shè)計(jì)了有人/無人機(jī)協(xié)同作戰(zhàn)指揮控制結(jié)構(gòu)[54]. 該架構(gòu)通過任務(wù)規(guī)劃層、協(xié)調(diào)控制層與功能實(shí)現(xiàn)層3 層架構(gòu)實(shí)現(xiàn)有人/無人機(jī)之間在沒有地面基站以及操作人員的情況下的協(xié)同編隊(duì)飛行. 其中,任務(wù)規(guī)劃層為有人/無人協(xié)同的關(guān)鍵部分. 在任務(wù)規(guī)劃層中,無人機(jī)通過通信數(shù)據(jù)鏈系統(tǒng)向任務(wù)規(guī)劃層傳入圖像和數(shù)據(jù)等信息.任務(wù)規(guī)劃層將這些數(shù)據(jù)整合形成戰(zhàn)場態(tài)勢,并展示在有人機(jī)的人機(jī)交互界面上. 人機(jī)交互界面同時(shí)還提供輔助決策和在線規(guī)劃等功能,并最終生成指令通過通信數(shù)據(jù)鏈系統(tǒng)發(fā)送給無人機(jī). 然而該架構(gòu)僅僅可以進(jìn)行較為簡單任務(wù)規(guī)劃,無法應(yīng)對復(fù)雜環(huán)境下的任務(wù)規(guī)劃問題. 為了適應(yīng)復(fù)雜環(huán)境下有人/無人集群協(xié)同任務(wù)規(guī)劃,本節(jié)提出的實(shí)時(shí)規(guī)劃流程與方法如圖15 所示. 在該系統(tǒng)中,無人集群所產(chǎn)生的實(shí)時(shí)態(tài)勢數(shù)據(jù)與系統(tǒng)所產(chǎn)生的實(shí)時(shí)計(jì)劃數(shù)據(jù)通過實(shí)時(shí)態(tài)勢監(jiān)控,實(shí)時(shí)記錄在態(tài)勢實(shí)時(shí)數(shù)據(jù)庫中. 這些數(shù)據(jù)經(jīng)過態(tài)勢分析統(tǒng)計(jì),傳遞給指揮員與專家進(jìn)行實(shí)時(shí)態(tài)勢分析. 分析過程主要包含對任務(wù)目標(biāo)的重構(gòu),對無人資源的管理以及對規(guī)劃計(jì)劃的重置. 當(dāng)任務(wù)場景發(fā)生變化時(shí),指揮員與專家首先需要分析當(dāng)前任務(wù)目標(biāo)與當(dāng)前態(tài)勢,判斷當(dāng)前任務(wù)是否需要作出改變,并更新任務(wù)所需資源. 這些更新后的任務(wù)目標(biāo)、資源以及約束條件等通過有人/無人系統(tǒng)傳遞給無人系統(tǒng)中的規(guī)劃算法庫中. 規(guī)劃算法庫將預(yù)先規(guī)劃方案以及作出改變前的規(guī)劃方案通過重構(gòu)生成適合當(dāng)前任務(wù)內(nèi)容的任務(wù)規(guī)劃方法. 重置后的規(guī)劃計(jì)劃經(jīng)過實(shí)時(shí)規(guī)劃算法計(jì)算最終生成實(shí)時(shí)指令. 具體而言,需要規(guī)劃算法庫首先對規(guī)劃計(jì)劃進(jìn)行重構(gòu),并對計(jì)劃進(jìn)行評估、優(yōu)選、修改的迭代. 最終獲得的優(yōu)化實(shí)時(shí)指令記錄在規(guī)劃方案庫中并傳遞給無人集群的感知層中. 這些實(shí)時(shí)指令主要是執(zhí)行任務(wù)的無人平臺編號、以及具體任務(wù). 在圖13 中,實(shí)時(shí)指令1 為無人平臺1 需要在22年8月31日15 時(shí)08 分在27°51′,112°59′完成協(xié)同偵察任務(wù).
圖15 實(shí)時(shí)規(guī)劃流程與方法Fig.15 Real-time planning processes and methods
事后評估階段為有人/無人集群協(xié)同任務(wù)規(guī)劃提供決策可解釋性. 通過事后評估,可以分析不同決策對任務(wù)進(jìn)程的影響,并通過復(fù)盤從而發(fā)現(xiàn)新的優(yōu)化決策. 在事后評估階段,有人/無人任務(wù)規(guī)劃系統(tǒng)通過評估模型構(gòu)建,態(tài)勢分析溯源與規(guī)劃方案評估最終生成事后分析報(bào)告. 左欽文等針對復(fù)雜仿真下的評估科學(xué)性問題,提出了基于大數(shù)據(jù)及機(jī)器學(xué)習(xí)的作戰(zhàn)評估技術(shù)總體框架[55]. 該框架通過指標(biāo)體系智能構(gòu)建、作戰(zhàn)網(wǎng)絡(luò)評估分析、體系評估視圖構(gòu)建的方式,為作戰(zhàn)方案評估提供新的解決方案. 盡管這類方法可以有效評估不同任務(wù)方案的優(yōu)劣,然而,這類方法缺少對任務(wù)方案的溯源與分析. 因此,本節(jié)提出的事后評估流程與方法如圖16 所示. 在該系統(tǒng)中,指揮員與評估專家首先完成評估模型建立. 具體包含確立評估問題、設(shè)計(jì)評估指標(biāo)以及指標(biāo)體系構(gòu)建. 評估模型傳遞給決策評估庫中. 同時(shí),整個(gè)任務(wù)執(zhí)行過程中無人集群所產(chǎn)生的全局態(tài)勢數(shù)據(jù)與系統(tǒng)所產(chǎn)生的全局計(jì)劃數(shù)據(jù)會傳遞給決策評估庫中,完成態(tài)勢溯源、低效決策搜索、決策分析修改以及決策推演評估. 最后,評估專家根據(jù)決策評估分析結(jié)果撰寫事后分析報(bào)告.
圖16 事后評估流程與方法Fig.16 Post-assessment processes and methods
針對動態(tài)環(huán)境下,無人集群任務(wù)規(guī)劃問題,從路徑規(guī)劃與資源調(diào)度兩個(gè)問題分析了任務(wù)規(guī)劃研究現(xiàn)狀,構(gòu)建了有人/無人集群任務(wù)規(guī)劃系統(tǒng)集成架構(gòu). 該系統(tǒng)集成架構(gòu)主要包含無人平臺自主行為規(guī)劃系統(tǒng)、無人集群分布式系統(tǒng)與有人/無人集群任務(wù)規(guī)劃系統(tǒng).無人平臺自主行為規(guī)劃系統(tǒng)集成感知、認(rèn)知、決策與交互完成自主行為規(guī)劃. 無人平臺依據(jù)交互信息,彼此決策的方式,構(gòu)建了無人集群分布式系統(tǒng). 無人平臺間的交互包含通信感知、平臺任務(wù)、資源需求和決策信息. 基于該體系架構(gòu),設(shè)計(jì)了有人/無人集群任務(wù)規(guī)劃系統(tǒng),支持指揮員在預(yù)先規(guī)劃、實(shí)時(shí)規(guī)劃與事后評估階段與無人集群的實(shí)時(shí)協(xié)同交互.