任 章,郭 棟,董希旺,李清東
(1.北京航空航天大學自動化科學與電氣工程學院,北京 100083;2.北京航空航天大學飛行器控制一體化技術國防科技重點實驗室,北京 100191; 3. 北京航空航天大學大數(shù)據(jù)科學與腦機智能高精尖創(chuàng)新中心,北京 100191)
近年來,美、俄、歐等軍事強國和組織均加大了對導彈防御技術的重視程度,加快了反導防御系統(tǒng)的建設步伐,極大影響了進攻型武器的作戰(zhàn)效能。美國的導彈防御系統(tǒng)經過多年的發(fā)展,已經具備了對來襲目標全射程、多層次的攔截能力,傳統(tǒng)的導彈突防能力進一步下降。隨著日益復雜的作戰(zhàn)環(huán)境與作戰(zhàn)需求,單枚導彈的作戰(zhàn)樣式已經很難完成作戰(zhàn)任務,多飛行器協(xié)同作戰(zhàn)技術已經成為未來武器裝備的重要發(fā)展方向。
多飛行器編隊協(xié)同攻擊是適應未來作戰(zhàn)環(huán)境的重要作戰(zhàn)方式。美國國防部高級研究計劃局(Defense Advanced Research Projects Agency,DARPA)的“拒止環(huán)境中協(xié)同作戰(zhàn)”(Collaborative Operations in Denied Environment, CODE)項目提出了多飛行器應采取集群協(xié)同作戰(zhàn)的方案,提高無人飛行器的自主協(xié)同作戰(zhàn)能力和生存率。美國海軍研究局的低成本無人機蜂群技術(Low-Cost UAV Swarm Technology,LOCUST)已經成功完成了多次實驗,實現(xiàn)了多架無人機的編隊飛行與機動。美軍表示,多架無人飛行器集群協(xié)同的作戰(zhàn)樣式能夠很好地滿足未來戰(zhàn)場上的作戰(zhàn)需求。美國空軍研究實驗室提出了忠誠僚機的概念,即通過多駕無人機在有人飛機周圍以特定隊形伴飛來實現(xiàn)多有人/無人群系統(tǒng)間的協(xié)同作戰(zhàn)。多飛行器利用通信鏈路組成一個作戰(zhàn)網絡,打破了傳統(tǒng)單枚飛行器孤立作戰(zhàn)的方式。采用多枚飛行器對目標進行齊射飽和攻擊,可以使對方雷達的探測等功能趨于飽和,減少導彈進入探測區(qū)域的時間間隔,進而提升突防概率。根據(jù)交接班需求設計合理的中制導段編隊構型,可以實現(xiàn)多枚機動性較差的導彈對機動性較強的目標的攔截,有效彌補單枚導彈飛行與探測能力的不足。此外,通過對多枚導彈設計合理的編隊構型,可以實現(xiàn)多飛行器以特定構型對目標的關鍵部位進行重點殺傷,從而大大提升毀傷效果。若編隊中的各枚飛行器能夠保持合適的角度與距離飛行,可以實現(xiàn)對多個方向不同目標的協(xié)同探測,提升對機動目標的觀測精度與識別能力。同時,采用高配置導彈對目標實施探測、低配置導彈利用高配置導彈的導引信息進行打擊的作戰(zhàn)模式,可以在實現(xiàn)對目標飽和打擊的同時有效提高作戰(zhàn)效費比??傊w行器集群作戰(zhàn)可以實現(xiàn)各枚飛行器間的作戰(zhàn)性能互補與戰(zhàn)場態(tài)勢信息共享,完成飛行器各自為戰(zhàn)時不能完成的任務,可以有效提升整體的作戰(zhàn)效能。
多飛行器集群協(xié)同作戰(zhàn)將成為未來的主要作戰(zhàn)形式。隨著日益復雜的作戰(zhàn)環(huán)境與需求,不僅需要根據(jù)各種約束條件為不同飛行器合理地分配任務,還要求各枚飛行器在實現(xiàn)對目標精確打擊的基礎上,配合其他飛行器進行協(xié)同作戰(zhàn),完成協(xié)同探測、編隊飛行和協(xié)同制導等作戰(zhàn)任務,使己方的整體作戰(zhàn)效能最大化。多飛行器協(xié)同制導控制技術是實施編隊協(xié)同作戰(zhàn)的關鍵與先決條件。與傳統(tǒng)的制導理論研究不同,多飛行器集群協(xié)同制導控制技術的實施主要包含以下難點:
1) 如何根據(jù)彈目作戰(zhàn)陣位、飛行器自身機動能力以及目標逃逸方式等,通過動態(tài)任務規(guī)劃與目標分配,為飛行器集群規(guī)劃合理的作戰(zhàn)任務,以及為每枚飛行器分配最優(yōu)的攔截對象;
2) 如何保持最優(yōu)攻擊隊形,當目標機動時,如何及時改變各飛行器在攻擊編隊中的角色,變換攻擊隊形,保證各飛行器按預定作戰(zhàn)編隊構型攻擊目標,滿足中末制導交班要求,即多飛行器時變編隊飛行控制;
3) 多飛行器如何在動力學約束、通信能力約束和戰(zhàn)場環(huán)境約束等約束條件下,實現(xiàn)對單個或多個目標的協(xié)同攻擊,即多約束條件下的多飛行器協(xié)同制導技術。
針對以上技術難點,可以將飛行器集群協(xié)同制導控制問題的關鍵技術總結為:協(xié)同任務規(guī)劃與動態(tài)目標分配技術、時變編隊協(xié)同控制技術和多約束條件下的協(xié)同制導技術,如圖1所示。
圖1 多飛行器協(xié)同制導控制關鍵技術Fig.1 The key technologies of cooperative guidance and control for multiple aerial vehicles
下面就近年來國內外關于任務規(guī)劃與動態(tài)目標分配方法、時變編隊協(xié)同控制方法和多約束條件下的協(xié)同制導方法的研究成果分別進行介紹。
多飛行器的任務規(guī)劃與目標分配是實施編隊協(xié)同作戰(zhàn)的首要和關鍵任務。通過對戰(zhàn)場環(huán)境、作戰(zhàn)需求以及各種約束條件的綜合分析與計算,在任務決策層面對多枚飛行器的作戰(zhàn)任務進行合理規(guī)劃,為多枚飛行器分配合理的目標,可以加倍提升對目標的攻擊效能。目前,多飛行器的任務規(guī)劃方法主要有集中式任務規(guī)劃方法和分布式任務規(guī)劃方法。集中式任務規(guī)劃方法,顧名思義,即系統(tǒng)中存在一個中心節(jié)點,通過中心節(jié)點對系統(tǒng)中的其他節(jié)點進行任務層面的協(xié)調與調度。文獻[1]設計了一種考慮最小轉彎半徑約束的多無人機集中式任務規(guī)劃方法,并通過實物進行了驗證。文獻[2]以多無人機察打一體作戰(zhàn)為背景,在多約束條件下建立了無人機編隊的任務規(guī)劃模型,并運用遺傳算法設計了相應的求解策略。文獻[3]針對多無人機任務規(guī)劃問題進行了集中式建模,并采用混合整數(shù)規(guī)劃方法進行了求解。集中式任務規(guī)劃方法經過近幾十年的發(fā)展,已經較為成熟,其全局特性較好,但收斂性與魯棒性稍顯不足。分布式任務規(guī)劃方法不存在中心節(jié)點,能夠很好地適應系統(tǒng)內節(jié)點數(shù)量的變化,且具備較強的魯棒性與收斂性。文獻[4]基于合同網拍賣算法,針對多無人機協(xié)同控制問題,設計了一種分布式任務規(guī)劃方法。文獻[5]基于組合拍賣算法,設計了一種協(xié)同空戰(zhàn)決策方法。分布式任務規(guī)劃方法原理簡單,計算效率高且易于實現(xiàn),針對系統(tǒng)節(jié)點數(shù)目變化以及其他動態(tài)不確定性的適應性較強,目前正在成為任務規(guī)劃的重點研究方向。文獻[6]針對對抗環(huán)境下的多無人機在線搜索攻擊任務規(guī)劃問題,提出了一種分布式算法,將每架無人機作為獨立單元解決局部優(yōu)化問題,然后通過無人機之間的信息交互,實現(xiàn)多無人機系統(tǒng)的優(yōu)化決策。文獻[7]提出了一種智能自組織算法,用于解決多無人機的搜索-攻擊任務規(guī)劃問題,該方法采用分布式控制架構,將全局優(yōu)化問題分為幾個局部優(yōu)化問題,搜索-攻擊任務規(guī)劃過程包括航路點生成和路徑生成兩部分。文獻[8]針對衛(wèi)星的任務規(guī)劃問題,提出了一種改進的混合整數(shù)線性規(guī)劃算法,該方法將規(guī)劃過程變?yōu)閯討B(tài)組合優(yōu)化問題,能夠滿足在線任務規(guī)劃的實時性要求?;诨旌蟿討B(tài)突變遺傳算法,文獻[9]提出了一種分布式在線任務規(guī)劃算法,用于解決多衛(wèi)星系統(tǒng)的任務規(guī)劃問題。文獻[10]針對敏捷衛(wèi)星任務規(guī)劃問題,比較了多種多目標優(yōu)化算法,提出了交互式框架用于幫助決策者調整參數(shù)。
完成對多飛行器的任務規(guī)劃后,需要根據(jù)實時變化的戰(zhàn)場環(huán)境與作戰(zhàn)需求為某個或某一組飛行器實時確定要打擊的目標,即進行動態(tài)武器目標分配。武器目標分配是多飛行器打擊多目標作戰(zhàn)的重要組成部分,目標分配結果的好壞直接影響到整體的作戰(zhàn)效能。武器目標分配問題的解空間規(guī)模會隨著飛行器數(shù)與目標數(shù)的增加呈指數(shù)級增長,屬于典型的多約束離散NP完全問題。目前求解武器目標分配問題的方法主要有兩類。第一類是整數(shù)規(guī)劃方法等傳統(tǒng)方法的改進。文獻[11]考慮到目標分配問題的復雜性與計算時間約束,運用拉格朗日松弛法設計了一種目標分配方法。文獻[12]針對協(xié)同空戰(zhàn),設計了一種帶時間序列約束的武器目標分配策略,并采用整數(shù)規(guī)劃方法進行求解。以上的傳統(tǒng)求解方法的改進方法可以有效地解決小規(guī)模的武器目標分配問題。當飛行器與目標的數(shù)目比較多時,或者存在其他約束條件時,求解效率會急劇下降。第二類是啟發(fā)式優(yōu)化算法,也是目前研究與應用的熱點。文獻[13]基于分布式協(xié)同拍賣算法,設計了有中心彈和無中心彈情況下的動態(tài)目標分配方法。文獻[14]針對多無人機目標分配問題,分別采用遺傳算法與市場競爭法進行了求解,并比較了兩種方法下的分配結果。文獻[15]針對多枚導彈攔截多枚飛行器,提出了一種帶有分組約束的武器目標分配方法,可以保證每個目標被分配到數(shù)量合適的攔截彈,為后續(xù)的分組協(xié)同作戰(zhàn)提供了良好的初始條件。文獻[16]針對動態(tài)武器目標分配問題,設計了一種改進形式的人工蜂群方法,并和多種優(yōu)化方法進行了對比,驗證了所設計方法的有效性。
多飛行器編隊控制是協(xié)同控制的核心和重要基礎。在很多任務和復雜環(huán)境中,需要多飛行器系統(tǒng)中的個體之間形成和保持預定的隊形,同時適應外部環(huán)境的需求。當多飛行器形成特定編隊時,與單枚飛行器相比,更有利于對目標的搜索與跟蹤,群系統(tǒng)的魯棒性會得到增強,任務可拓展性也會得到延伸[17]。目前編隊控制問題在多機器人與多飛行器領域中的研究已經取得了很多成果,積累了大量的采用集中式、分散式和分布式編隊控制結構的研究成果[18]?;诩惺浇Y構的編隊控制方法計算復雜度高,依賴于可靠的通信系統(tǒng),且魯棒性較差?;诜稚⑹浇Y構的編隊控制方法需要進行分層混合控制器的設計,在面對復雜環(huán)境時容易出現(xiàn)決策層狀態(tài)爆炸的缺點?;诜植际浇Y構的編隊控制方法僅需要系統(tǒng)內部各個分個體的信息,具有計算簡單、魯棒性強等特點,已經廣泛運用于多機器人和多飛行器的編隊控制問題中[19]。在分布式編隊控制策略研究方面,目前主要分為基于行為的編隊控制策略、基于虛擬結構的編隊控制策略、基于領導者-跟隨者的編隊控制策略以及基于一致性的編隊控制策略。
基于行為的編隊控制策略主要是針對多飛行器的預先期望行為集合進行加權分配,根據(jù)行為的重要程度分配相應的權值,每個行為具有相應的控制作用,通過加權獲取最終的控制作用和期望。在預先期望行為集合中包括如編隊形成、障礙避碰、個體避碰、編隊保持和目標跟蹤等期望行為。文獻[20]將編隊行為分解為異常情況處理、項目標點運動、隊形保持和障礙運動四種子行為。對于這種方法,每個個體動作的輸出都可作為其他個體的輸入,個體自身傳感器獲得的敏感信息也可作為輸入,然后根據(jù)行為選擇模塊對信息進行綜合處理。設計基于行為的編隊控制策略的關鍵是設計各種基本行為和有效的協(xié)調機制,或者說如何獲得各個個體之間的相對位置和狀態(tài)等信息,然后根據(jù)上述信息來設計基本行為和相應的協(xié)調機制。然而基于行為的編隊控制策略需要兼顧多種期望行為,沒有基于實際物理系統(tǒng)的動力學模型,僅能通過仿真分析來進行驗證,無法使用嚴格的理論工具對系統(tǒng)編隊行為的穩(wěn)定性進行證明,且隨著系統(tǒng)復雜度與規(guī)模的增大,行為融合的難度與計算復雜度也會進一步增大。
基于虛擬結構的編隊控制策略利用一種剛性的虛擬結構來描述多智能體系統(tǒng),虛擬結構上的每一個點代表多智能體系統(tǒng)中的每個個體。針對每個個體預先設計了能夠產生吸力、斥力和全局最小值的勢能場,勢場力的方向取勢能場的負梯度方向。在勢場力的作用下,虛擬結構代表了系統(tǒng)中每個個體產生期望的運動,個體之間保持一定的幾何形狀。在整個勢能場達到全局最小值時,整個系統(tǒng)達到期望的編隊。基于虛擬結構法的編隊控制策略可以分為3個子過程:第1個子過程,定義虛擬結構期望的動力學特性;第2個子過程,轉化期望運動目標,將整體目標的實現(xiàn)轉化為多智能體系統(tǒng)各自實現(xiàn)目標;第3個子過程,獲得多智能體系統(tǒng)軌跡控制跟蹤控制方法[21]。虛擬結構法主要用于多智能體系統(tǒng),尤其在多飛行器系統(tǒng)的編隊控制和隊形控制等鄰域運用較為廣泛?;谔摂M結構的編隊控制策略具有魯棒性好和控制精度高等特點,但虛擬結構的設計會引入較大的通信量和復雜的計算量,同時需要多體系統(tǒng)個體能夠實時跟蹤虛擬結構的對應期望位置,對實時性要求較高。
領導者-跟隨者方法以其簡單的控制思想得到了許多學者的青睞,國內外許多學者對其進行了深入的研究。文獻[22]考慮了領導者-跟隨者方法的分布式控制策略,設計了一階控制律,在控制律中加入了一個積分項,起到對領導者速度進行觀察的作用,通過選取李雅普諾夫函數(shù)證明了編隊的穩(wěn)定性。文獻[23]針對領導者可能會出現(xiàn)故障的情況,提出了一種解決方法,即在編隊中配置2個領導者,當前領導者出現(xiàn)問題時,備用的領導者立即生效,起到領航的作用。這種編隊控制策略簡單且易于實現(xiàn),但其魯棒性較差。整個系統(tǒng)的編隊對領導者依賴性較高,同時整個系統(tǒng)缺少編隊信息反饋。當領導者與跟隨者之間的性能差異很大或者信息傳輸線路復雜,跟隨者跟不上領導者時,較大的編隊誤差可能會使得整個系統(tǒng)無法實現(xiàn)期望的編隊構型。
隨著多體一致性控制問題取得越來越多的成果,很多學者嘗試將一致性理論引入到編隊控制問題中,形成了一種新的基于一致性的編隊控制策略。其主要思想是通過分布式協(xié)議的作用,讓多體系統(tǒng)中所有個體的狀態(tài)或者輸出相對于某個共同的編隊參考保持一致的偏差,最后達到期望的編隊。此外,相比于定常編隊,時變編隊更具有一般性。在很多實際的工程運用中,由于外部條件約束,多體系統(tǒng)的編隊結構需要改變。例如在多飛行器執(zhí)行打擊任務時,需要執(zhí)行目標區(qū)域搜索和目標跟蹤等任務。當外部環(huán)境存在障礙物使前進空間受限時,多飛行器的編隊構型需要改變,同時各枚飛行器之間的通信結構也可能隨之改變。因此針對多飛行器集群協(xié)同控制問題,對時變編隊控制方法的研究尤為重要。文獻[24]針對多飛行器編隊形成和變換過程中個體避碰的需求,基于一致性理論和基于人工勢場法設計了一種具有避碰功能的時變編隊控制方法。文獻[25]基于反步控制方法,設計了一種時變編隊控制器。文獻[26]將多無人機系統(tǒng)視為二階積分器,運用深度增強學習控制方法設計了相應的時變編隊控制器。文獻[27]采用非奇異終端滑??刂品椒ㄔO計了適用于多架無人飛行器的時變編隊控制方法。對于無人機、導彈以及某些航天器來說,某些情形下其線速度和角速度等狀態(tài)變量并不能通過測量裝置直接測量。因此在多飛行器時變編隊控制器中引入這些狀態(tài)變量作為反饋信息進行控制時可能會導致設計成本高,實際操作困難。此時運用個體的輸出變量作為反饋,進行自適應狀態(tài)時變編隊控制器的設計更加具有一般性和實用價值。文獻[28]在只有輸出信息可用的情況下,為了適應無向通信拓撲和有向通信拓撲兩種情況,設計了一種基于輸出反饋的自適應狀態(tài)時變編隊控制方法。由于飛行環(huán)境等因素的變化,多枚飛行器進行編隊飛行時的通信拓撲可能會發(fā)生改變。針對這一問題,文獻[29]設計了在多體系統(tǒng)的通信拓撲發(fā)生切換的條件下,基于狀態(tài)反饋和輸出反饋的自適應狀態(tài)時變編隊控制器。文獻[30]通過引入自適應輸出反饋的方法,基于動態(tài)輸出反饋構造了自適應輸出時變編隊控制器,并提出了分布式設計自適應輸出時變編隊控制器的算法。該方法僅需要傳遞維數(shù)較低的控制器輸出信息,便可以實現(xiàn)對群系統(tǒng)的時變編隊控制,大大節(jié)約了通信成本,適用于通信條件受限情況下的多飛行器編隊控制。
為了有效突破反導防御系統(tǒng),目前國內外對于多飛行器協(xié)同制導技術的研究,主要集中在對目標實施同時打擊(或者同時進入對方防區(qū))的層面。從實現(xiàn)手段上來看,可以分為兩大類:基于攻擊時間可控的獨立導引方法和基于彈間通信拓撲的協(xié)同導引方法。傳統(tǒng)的制導方法以收斂彈目距離或收斂視線角速率為設計制導律時的目標。而考慮攻擊時間控制的目的是在規(guī)定時間內把彈目相對距離減小到0,即在傳統(tǒng)三維制導的基礎上疊加時間為第4個維度,稱為四維制導。為了實現(xiàn)多枚導彈對目標的協(xié)同攻擊,提升突防能力,攻擊時間控制需要預先為各枚導彈設定一個或者分組設定不同的攻擊時間,然后各枚導彈按照指定的攻擊時間獨立完成攻擊任務。換而言之,攻擊時間可控的獨立導引方法在實施過程中,各枚導彈之間是沒有通信聯(lián)絡的。文獻[31]對于反艦導彈面對艦空防御系統(tǒng)時突防概率不足的問題,提出了一種同時命中的策略來提高突防概率:發(fā)射前為每一枚反艦導彈裝定相同的攻擊時間,通過設計攻擊時間可控的制導律來保證多枚反艦導彈對軍艦的同時命中。基于彈目相對運動學關系近似線性化思想,文獻[32]設計了一種考慮目標探測可觀測性增強的攻擊時間可控制導律。文獻[33]基于傳統(tǒng)比例導引法,設計了一種考慮導彈視場角約束的攻擊時間可控制導律,該制導律僅需要當前彈目距離與航向角信息,便可以求解出有效導航比的解析解。文獻[34]基于滑模變結構控制方法,設計了一種攻擊時間可控的制導律,該方法適用于導彈初始前置角較大的情形,可以實現(xiàn)對靜止目標與勻速直線運動目標的打擊。文獻[35]在考慮導彈動力學模型的基礎上,運用滑模變結構控制方法設計了一種攻擊時間可控的三維制導律。
與攻擊時間控制制導方法不同,協(xié)同制導不需要預先為每枚導彈設定相同的攻擊時間,多枚導彈利用數(shù)據(jù)鏈在線傳輸協(xié)調變量,然后在協(xié)同制導律的導引下,完成攻擊時間的協(xié)調一致。根據(jù)導彈在通信網絡中的地位的不同,協(xié)同制導又可以分為基于領彈-從彈架構的協(xié)同制導律以及分布式協(xié)同制導律。文獻[36]研究了在二維橫側向平面下,領彈與從彈協(xié)同攻擊固定目標的問題,領彈采用比例導引法,從彈對領彈進行跟蹤,并給出了從彈的法向過載指令與軸向過載指令表達式。為了減少通信資源的占用,文獻[37]基于協(xié)調變量的思想設計了從彈的協(xié)同制導律。文中以目標為領彈,以位置與速度為協(xié)調變量,給出了分布式協(xié)同制導指令的表達式,通過合理的權值選取,可以保證從彈對目標的跟蹤,進而完成協(xié)同攻擊任務。文獻[38]基于一致性理論、代數(shù)圖論以及傳統(tǒng)比例導引法,針對多彈異構分布式協(xié)同攻擊問題,設計了一類領-從分布式協(xié)同制導律。文獻[39]基于高可靠的De Bruijn通信拓撲網絡,設計了一種領-從式協(xié)同制導律。該方法形式簡單,容錯性與靈活性較好,便于工程實現(xiàn)。上述基于領彈-從彈架構的協(xié)同制導律具有攻擊時間控制準確、便于工程實施等優(yōu)點,但必須以領彈與從彈間的正常通信為前提。當領彈與從彈間的通信中斷、領彈被攔截或飛行異常,將會導致整個協(xié)同作戰(zhàn)任務的失敗。與基于領彈-從彈架構的協(xié)同制導律不同,分布式協(xié)同制導律網絡架構內的成員地位平等。文獻[40]以剩余飛行時間的估計值為協(xié)調變量,設計了一種打擊靜止目標與機動目標的分布式協(xié)同制導律。為了降低通信網絡的資源損耗,文獻[41]基于鄰居信息,設計了只依賴局部信息交互的協(xié)同制導律,并給出了保證協(xié)同制導有效的參數(shù)選擇方法。文獻[42]基于一致性理論,設計了一種適用于通信拓撲固定與切換情形下的分布式協(xié)同制導律,并嚴格證明了協(xié)同制導律的穩(wěn)定性。在實際的協(xié)同作戰(zhàn)中,由于作戰(zhàn)環(huán)境與其他約束條件的限制,多飛行器間的通信拓撲可能發(fā)生變化。文獻[42]中的方法可以很好地適應這種情況。文獻[43]針對多飛行器分組打擊多個目標的作戰(zhàn)情形,基于組內通信與組間通信,設計了一種分布式分組協(xié)同制導律?;诜答伨€性化的設計方法與李雅普諾夫穩(wěn)定性理論,給出了分組協(xié)同制導律在固定與切換拓撲下有效的充分條件。文獻[44]針對多飛行器協(xié)同攻擊機動目標的問題,基于主-從飛行器架構,設計了一種異構體飛行器協(xié)同制導律,主飛行器與從飛行器組成異構協(xié)同攻擊編隊,對目標形成多打一的作戰(zhàn)態(tài)勢。該制導律在固定拓撲與切換拓撲情形下,均能實現(xiàn)對機動目標的協(xié)同攻擊,為多飛行器協(xié)同攻擊機動目標提供了一種可能的解決方案。
本文分析了多飛行器集群協(xié)同制導控制問題的關鍵技術,介紹了任務規(guī)劃與動態(tài)目標分配方法、時變編隊協(xié)同控制方法和多約束條件下的協(xié)同制導方法的研究成果。目前,多飛行器集群協(xié)同制導控制方法的研究還處于發(fā)展階段,未來研究的主要發(fā)展方向有以下幾點:
1)基于深度學習的多約束條件下快速任務規(guī)劃與動態(tài)目標分配方法
多飛行器系統(tǒng)在執(zhí)行任務時,會受到諸如地理、氣候等因素的限制。此外,導引頭視場角、探測距離、多飛行器間的通信以及飛行器自身復雜的動力學特性也是影響協(xié)同任務規(guī)劃與目標分配的因素。如果在目前已有的任務規(guī)劃與目標分配方法上直接添加上述約束條件,可能會大大降低規(guī)劃與分配計算的準確度。深度學習作為機器學習當中一種重要并且較新的方法,具有自主學習性強、模型效果好、分配識別精度高等優(yōu)點。因此,在多種約束條件下,運用深度學習實現(xiàn)快速任務規(guī)劃與動態(tài)目標分配,是未來多飛行器協(xié)同作戰(zhàn)技術的重點研究方向之一。
2)基于強化學習的復雜作戰(zhàn)環(huán)境下多飛行器編隊控制與隊形優(yōu)化
在多飛行器集群協(xié)同作戰(zhàn)過程中,由于作戰(zhàn)環(huán)境、敵我態(tài)勢等因素復雜多變,多飛行器間的通信會受到較大影響,可能會出現(xiàn)拓撲切換、通信延遲和通信噪聲等情況,對協(xié)同作戰(zhàn)造成一定程度的影響。此外,針對多樣化的作戰(zhàn)需求,需要對多飛行器的編隊構型進行優(yōu)化,使多飛行器能夠更好地完成協(xié)同探測、編隊突防以及中末制導交接班等任務,對目標形成更有利的作戰(zhàn)態(tài)勢。強化學習具備對未知環(huán)境很強的適應能力,能夠在控制與環(huán)境反饋的反復交互作用中以學習的方式不斷優(yōu)化系統(tǒng)的性能指標,非常適合復雜作戰(zhàn)環(huán)境下的多飛行器編隊控制與優(yōu)化。因此,基于強化學習的復雜作戰(zhàn)環(huán)境下編隊控制與隊形優(yōu)化方法是未來重要的應用研究方向。
3)基于博弈理論的協(xié)同制導技術
相比于現(xiàn)有大多數(shù)制導方法,基于博弈理論的制導律不需要對目標的逃逸加速度進行估計,即可同時得到導彈的最優(yōu)攔截策略與目標的最優(yōu)機動策略。目前,基于博弈理論的協(xié)同制導問題研究處于起步階段,絕大多數(shù)研究成果為單對單的追逃博弈或三體問題,多彈間的協(xié)同作戰(zhàn)策略尚未體現(xiàn)在微分博弈的框架中。若通過在代價函數(shù)中加入協(xié)同打擊指標或者結合勢能函數(shù)的思想,將微分博弈理論成功運用到協(xié)同制導方法的設計中,不僅能夠得到多彈間的最優(yōu)攔截策略,還能實現(xiàn)對目標的協(xié)同打擊,實現(xiàn)某種意義下的最優(yōu)協(xié)同制導。因此,研究基于博弈理論的協(xié)同制導技術,是今后協(xié)同制導方向的工作重點。
總之,在未來高動態(tài)、強對抗、拒止作戰(zhàn)背景下,飛行器集群智能化、自主化、高可靠、強魯棒作戰(zhàn)將成為未來戰(zhàn)場上的主要作戰(zhàn)形式,對多飛行器協(xié)同制導控制技術進行深入研究具有重要意義。