費 陳,鄭 晗,趙 亮
(武警士官學校,浙江 杭州 311400)
集群智能行為是一種自然現(xiàn)象,這種方式提高了數(shù)百種不同動物物種的生存機會,如鳥群、蟻群、蜂群、魚群、狼群等,它們通過某種方式進行信息交流,集群中每個物種都遵循一套規(guī)則來優(yōu)化自身的行為,在決策中使用分散和自組織行為來適應(yīng)環(huán)境變化和解決問題,以最大限度地提高集群的整體生存能力。
隨著無人化、智能化和導航技術(shù)的不斷發(fā)展,無人機從最初的訓練靶機,逐漸發(fā)展成為具有自主決策和自主攻擊能力的察打一體化無人機?;跓o人機諸多特點,無人機在軍事[1-5]、民用[6]、未來電子戰(zhàn)[7-9]等領(lǐng)域都扮演著極其重要的角色,也是當前各國軍事智能化研究的熱點問題之一[10-12]。在最近的俄烏沖突中,烏克蘭就利用了TB2無人機成功摧毀2個Buk-M1-2防空系統(tǒng)和大約14輛軍車[13-14]。
但是面對日益繁雜的應(yīng)用場景、詭譎多變的戰(zhàn)場態(tài)勢,無人機受自身硬件、軟件等因素的影響,依然存在一定的局限性[15-16]。對無人機而言,飛行能源、凈重和規(guī)格大小都具有限制性,一架無人機難以實現(xiàn)任務(wù)區(qū)域內(nèi)的多維度、大規(guī)模任務(wù)執(zhí)行,特別是在執(zhí)行高危任務(wù)后,單架無人機可能會受到地面威脅源的打擊或防空系統(tǒng)的干擾而無法執(zhí)行任務(wù)[17]。因此,為解決單架無人機的局限性,無人機一般較少單獨行動,而是用集群的方法來協(xié)調(diào)執(zhí)行工作[18-19],無人機集群、無人機和無人重型坦克等其他載人或無人戰(zhàn)斗裝備構(gòu)成混合的異構(gòu)集群必然是現(xiàn)代化戰(zhàn)爭中關(guān)鍵的作戰(zhàn)方式之一[20-23]。
無人機智能集群作為無人作戰(zhàn)平臺的重要組成部分,具有個體簡單、集群協(xié)同,可形成高度智能的集合體特點[24],能夠完成監(jiān)視、偵察、情報匯集和目標打擊等任務(wù)[25-27]。因此,無人機集群不同于多無人機,它是多無人機的高階形式,通過人工智能算法對多無人機進行合理配置、協(xié)調(diào)所演化的智能無人機群[28-30],相比于多無人機,無人機集群的控制難度更大,成本更低,協(xié)調(diào)能力、空間密度和智能化程度更高。
集中式控制系統(tǒng)是指無人機集群通過唯一的控制中心進行信息傳輸、交互的一種控制結(jié)構(gòu)[31-33],如圖1所示。集群內(nèi)的無人機將自身所收集的數(shù)據(jù)、信息傳送給任務(wù)控制站(控制中心)[34],而任務(wù)控制站負責對這些數(shù)據(jù)、信息進行整理、計算和分析,最終將處理完成的數(shù)據(jù)和信息反饋到集群內(nèi)的無人機,集群內(nèi)的無人機接收到這些反饋指令后進行任務(wù)的分配和實現(xiàn)。
圖1 無人機集中式控制系統(tǒng)結(jié)構(gòu)Fig.1 Structure of UAV centralized control system
如圖2所示,集中式控制下的任務(wù)分配方法主要分為智能類算法[35]和遷移模型[36]。其中,智能類算法由群體智能算法和遺傳算法構(gòu)成[37],而通過模仿自然界生物群體協(xié)作表現(xiàn)出來的智能行為所形成的算法稱為群體智能算法,包括狼群算法[38]、魚群算法[39]、蟻群算法[40]、粒子群算法[41]等。
圖2 集中式任務(wù)分配方法Fig.2 Centralized task allocation method
蟻群算法模仿螞蟻的合作行為來解決復雜的組合優(yōu)化問題,用螞蟻的路徑表示優(yōu)化問題的可行解,整個蟻群的所有路徑構(gòu)成優(yōu)化問題的解空間。由圖3可知,該蟻群的解空間為路徑A、路徑B、路徑C,蟻群出發(fā)地與食物之間最短的路徑為路徑B,隨著時間的推移,路徑A和路徑C上的信息素含量較少,路徑B上的信息素含量最多,因此路徑B上螞蟻的數(shù)量也越來越多,在正反饋作用下,路徑B成為該蟻群獲取食物的最優(yōu)路徑,對應(yīng)優(yōu)化問題的最優(yōu)解。
圖3 蟻群算法概念圖Fig.3 Concept diagram of ant colony algorithm
粒子群算法是指將族群中的個體(粒子)當作優(yōu)化問題的一個解,在解空間中,粒子之間進行信息融合、共享,并結(jié)合自身的策略和經(jīng)驗尋找最優(yōu)解;而遺傳算法(genetic algorithm)則是借鑒自然選擇和遺傳機制,遵循“優(yōu)勝劣汰”的原則,模擬動物繁衍進化中的自然選擇、混合交叉、突變等方法進行更新迭代,以此來尋找最優(yōu)解。
遷移模型主要有多旅行商模型(multiple traveling salesman problem,MTSP)[42]、車輛路徑模型(multiple capacitated vehicle routing problem,MVRP)[43],這兩種模型是將基于集中式控制下的無人機任務(wù)分配問題遷移到旅行商和車輛路徑規(guī)劃上面,從而進行最優(yōu)求解。MTSP模型源于傳統(tǒng)的旅行商問題,將無人機集群中的個體看為旅行商,待分配的任務(wù)看作城市,該模型具有原理簡單、復雜度較低、可擴展性強的優(yōu)點,要求進行任務(wù)分配時需要遍歷所有的任務(wù)點,適用于有限時間內(nèi)無人機集群任務(wù)分配問題;MVRP模型源于無人機智能汽車的貨物配送問題,根據(jù)異構(gòu)無人機集群的個體無人機任務(wù)分配性能約束,利用VRP模型對任務(wù)分配問題進行建模,得到優(yōu)質(zhì)的任務(wù)規(guī)劃方案。
如圖4所示,在無人機集中式控制結(jié)構(gòu)中,無人機根據(jù)任務(wù)控制站或者長機傳輸?shù)男畔⒑蛿?shù)據(jù)進行決策,而無人機本身不具備決策能力[44-45]。
圖4 無人機集中式控制信息傳輸Fig.4 Centralized control information transmission of UAV
該控制結(jié)構(gòu)存在以下弊端:1)決策不及時。由于在該控制結(jié)構(gòu)中,無人機本身不具備決策能力,無人機需要根據(jù)任務(wù)控制站或者長機傳輸?shù)男畔ⅰ?shù)據(jù)來決策[46],任務(wù)控制站需要不斷分析和處理所有無人機的全部信息,因此所承受的計算壓力較大,計算信息多、計算步驟復雜,進行任務(wù)分配時間久[47-48],特別是當集群中出現(xiàn)異構(gòu)無人機時,需要進行海量數(shù)據(jù)交互,任務(wù)控制站可能會出現(xiàn)接收信息不全或信息紊亂的局面,導致任務(wù)決策有誤或任務(wù)決策延遲。2)抗干擾性差。由于任務(wù)控制站通常只有一個,當任務(wù)控制站進行任務(wù)分配時,一旦遭到破壞,那么造成的損害極大[49-50]。但這種方式的優(yōu)點是無人機進行信息傳輸穩(wěn)定、傳輸速率快,易獲得全局最優(yōu)策略,適用于戰(zhàn)場環(huán)境條件已知,敵方攻擊能力弱和攻擊范圍小,或己方控制站或長機隱身能力和機動能力較強,對全局的態(tài)勢感知強,且自身的數(shù)據(jù)處理能力出色,執(zhí)行任務(wù)規(guī)模較小、傳輸數(shù)據(jù)和信息少。
分布式控制系統(tǒng)是指采取自治和協(xié)作的方法來解決全局控制問題,基于各無人機之間的信息交互來完成任務(wù),具有充分的自治權(quán)[51],如圖5所示。分布式控制的集群內(nèi)無人機不僅具有收集信息、信息交互的能力,還具有對數(shù)據(jù)進行整理計算、分析決策的能力[52],并且具備與自然環(huán)境、任務(wù)目標和其他無人機交互的能力,充分考慮各種環(huán)境因素,無人機自身通過計算,能夠生成處理任務(wù)分配的策略。
圖5 分布式控制系統(tǒng)結(jié)構(gòu)Fig.5 Distributed control system structure
目前,基于分布式控制系統(tǒng)進行任務(wù)分配的方法主要有優(yōu)化算法[53]和類市場機制[54],如圖6所示。
圖6 分布式任務(wù)分配方法Fig.6 Distributed task allocation method
優(yōu)化算法主要有基于仿生算法[55]和博弈論[56],基于仿生算法是通過模擬生物自身規(guī)律,并將其通過算法的形式體現(xiàn)出來的一種方法,該算法在分布式控制任務(wù)分配中應(yīng)用十分廣泛,極具代表性的仿生算法是果蠅算法(drosophila algorithm)[57]。如圖7所示,果蠅覓食首先根據(jù)果蠅個體隨機選擇方向進行飛行,然后所有果蠅根據(jù)自身嗅覺能力飛向高氣味食物濃度高的位置,進入該位置范圍后,再利用敏銳的視覺尋找食物源或同伴聚集的位置,形成新的果蠅聯(lián)盟,最后再一次隨機選擇方向飛行,飛向新的氣味食物濃度高的位置并再次聚集,以這樣的方式循環(huán)往復,直到找到食物源為止。
圖7 果蠅覓食Fig.7 Drosophila foraging
文中的博弈論(game-theory)則是研究無人機集群中每架無人機進行任務(wù)分配時所產(chǎn)生的策略,并對策略進行優(yōu)化,實現(xiàn)全局最優(yōu)策略[58],首先將無人機任務(wù)分配問題公式化為成本函數(shù)的最小化,其中包括每架無人機的多個目標和約束條件,然后,建立了一個基于博弈論的框架,將最小化問題歸結(jié)為尋找納什(Nash)均衡,最后利用改進的人工智能算法收斂至納什均衡,即獲得全局最優(yōu)解。
類市場機制主要有合同網(wǎng)算法[59]和拍賣算法[60]。其中,合同網(wǎng)算法是指將集群中每架無人機的任務(wù)分配情況作為投標值,每架無人機都是獨立存在的,招標無人機發(fā)布任務(wù)信息即為招標,接到此次任務(wù)信息的無人機,根據(jù)自身能力和任務(wù)信息進行評估,投放投標值并成為投標無人機,最后評估這些投標無人機的投標值并選擇合適的投標無人機,最終,被選中的投標無人機即為中標無人機而執(zhí)行任務(wù)。拍賣算法與合同網(wǎng)算法類似,都是無人機根據(jù)自身利益依次對分配任務(wù)進行報價,通過多輪次的競標,將該任務(wù)分配給適合的無人機,實現(xiàn)任務(wù)的合理化分配。
如圖8所示,在分布式控制結(jié)構(gòu)內(nèi),無人機之間可以進行信息的融合、交互,將全局的任務(wù)分配難題轉(zhuǎn)變?yōu)榫植康臒o人機之間的任務(wù)分配問題,由無人機自身通過信息協(xié)調(diào)的方式來進行決策和解決[61]。
圖8 無人機分布式控制信息傳輸Fig.8 Distributed control information transmission of UAV
分布式控制結(jié)構(gòu)存在以下問題:1)無人機資源浪費[62]。由于無人機集群中無人機數(shù)量眾多,當無人機進行自主決策時,難于掌握全局信息,存在同一任務(wù)由多架無人機重復完成,這就導致無人機資源的浪費。2)數(shù)據(jù)信息多,處理信息量大[63]。為具有任務(wù)決策的實時性,在此控制模式下,無人機之間要進行大量的數(shù)據(jù)傳輸和共享,信息量會隨著集群內(nèi)無人機的數(shù)量呈指數(shù)增長[64]。
與集中式控制方式相比,分布式控制下的無人機具有較強的主體性和機動性,能夠?qū)θ蝿?wù)信息、自身信息展開分析和管理決策,抗干擾能力強、數(shù)據(jù)計算速度快,可以自主與其他無人機進行信息融合,實現(xiàn)信息共享并協(xié)作完成任務(wù),并對局部態(tài)勢變化做出反應(yīng),提高了系統(tǒng)的靈活性與魯棒性。該控制方式適用于戰(zhàn)場環(huán)境條件未知、動態(tài)環(huán)境或中等至大規(guī)模系統(tǒng)中,對敵方掌握的信息較少,己方無人機集群中單架無人機應(yīng)具備較強的單兵作戰(zhàn)能力,且對局部戰(zhàn)場態(tài)勢感知能力強,自身的數(shù)據(jù)處理能力出色,具有高頻次切換通信的能力、通信質(zhì)量高,執(zhí)行任務(wù)規(guī)模較廣、執(zhí)行任務(wù)層次多等特點。
集散式控制系統(tǒng)如圖9所示。
圖9 集散式控制系統(tǒng)結(jié)構(gòu)Fig.9 Centralized and distributed control system structure
該方法主要是借鑒多智能體系統(tǒng)(MAS)的思想[65],結(jié)合集中式和分布式的優(yōu)缺點,由地面任務(wù)控制站或長機將任務(wù)轉(zhuǎn)化為多項子任務(wù),再分給各無人機,各無人機根據(jù)自身的任務(wù)進行信息共享和信息交互,將完成任務(wù)的收益及損失等信息發(fā)送給長機或地面任務(wù)控制站。各無人機在完成任務(wù)后,都會根據(jù)自身的局部利益、環(huán)境信息進行任務(wù)評估,一旦發(fā)現(xiàn)對自身非常有利的解決方案,將該方案遞交給地面任務(wù)控制站或長機,地面任務(wù)控制站或長機將對每架無人機計劃方案開展總體評定[66-67]。若該方案能夠提高無人機集群整體收益,則方案將被選用,否則被否決,每架無人機的任務(wù)分配方案都是根據(jù)全局收益來規(guī)劃和設(shè)計。
相對于集中式控制體現(xiàn)在任務(wù)控制站或長機對所有任務(wù)先進行集中分配、調(diào)整,分布式控制則體現(xiàn)在以下兩個方面:一是在預分配環(huán)節(jié),各無人機收到任務(wù)控制站或長機的任務(wù)分配信息后,無人機之間協(xié)作完成任務(wù)[68];二是任務(wù)或環(huán)境突然變化時,可采用分布式協(xié)調(diào)的方式,根據(jù)環(huán)境、任務(wù)的變化情況,及時調(diào)整任務(wù)分配策略,以最小損失代價應(yīng)對態(tài)勢的變化。一般利用集散式任務(wù)分層框架來描述無人機集散式控制系統(tǒng)結(jié)構(gòu)[69],如圖10所示。從集散式任務(wù)分層框架中可以看出,主要包括以下兩個部分:
圖10 集散式任務(wù)分層框架Fig.10 Centralized and distributed task hierarchical framework
1)集中控制部分。任務(wù)控制站根據(jù)掌握的任務(wù)信息、環(huán)境資源信息和無人機狀態(tài)信息,對任務(wù)集進行目標聚類,目標聚類的目的是將彼此接近的目標歸為一組,是簡化大規(guī)模任務(wù)分配問題的關(guān)鍵和基本步驟,經(jīng)過這一步,NT目標被劃分為M簇,M等于無人機聯(lián)盟的數(shù)量,為了在無人機聯(lián)盟之間平均分配工作負載,聚類算法必須平衡每個集群中的目標數(shù)量。然后進行任務(wù)集群分配,將多個小無人機聯(lián)盟看為一個大的無人機聯(lián)盟,M個集群分配給大無人機聯(lián)盟中的M個小無人機聯(lián)盟,通過人工智能算法,計算出無人機目標任務(wù)分配的最優(yōu)策略,即每個小無人機聯(lián)盟被分配一個最優(yōu)任務(wù)集群。任務(wù)控制站實現(xiàn)目標聚類和任務(wù)集群分配功能。
在集中控制部分所使用的算法是聚類算法,主要有K均值聚類算法(K-Means)[70]、均值漂移聚類算法[71]、基于密度聚類算法(DBSCAN)[72]、高斯混合模型(GMN)的最大期望(EM)聚類算法[73]等,而K-Means算法是眾多算法中應(yīng)用最為廣泛的聚類算法。如圖11所示,該算法首先隨機確定質(zhì)心數(shù)量K,然后對所有點進行劃分并形成多個簇,將每簇的質(zhì)心更新為該簇所有點的平均值,最后迭代該過程,直到數(shù)據(jù)集中的所有點距離其所對應(yīng)的質(zhì)心最小時結(jié)束循環(huán)。
圖11 K-Means聚類過程Fig.11 K-Means clustering process
2)分布控制部分。在戰(zhàn)場態(tài)勢發(fā)生變化時,小無人機聯(lián)盟內(nèi)決策、協(xié)調(diào)并對任務(wù)進行分配。在每個小無人機聯(lián)盟內(nèi),都有一個Leader無人機,該無人機具有對小無人機聯(lián)盟內(nèi)的指揮作用,Leader無人機通過強化學習算法,將小無人機聯(lián)盟內(nèi)的每架無人機與目標任務(wù)進行交互,獲得這個小無人機聯(lián)盟完成目標任務(wù)的最優(yōu)策略。小無人機聯(lián)盟中Leader無人機獲得聯(lián)盟內(nèi)目標任務(wù)分配的最優(yōu)策略并將任務(wù)分配給單架無人機,指定聯(lián)盟內(nèi)成員的攻擊任務(wù)目標,確定攻擊順序。同時,聯(lián)盟內(nèi)的任務(wù)執(zhí)行情況、環(huán)境變化等信息由Leader無人機向任務(wù)控制站進行反饋交互,任務(wù)控制站可根據(jù)這些信息對任務(wù)和無人機進行二次分配,起到提升任務(wù)執(zhí)行效率和保障任務(wù)完成率的作用。
在分布式控制部分所使用的算法主要是強化學習算法[74],強化學習通過“探索-利用”機制,一方面讓智能體不斷對環(huán)境進行探索,獲得觀測值;另一方面,對已有經(jīng)驗和信息加以利用,不斷更新學習策略,以使累積獎勵最大化。強化學習原理如圖12所示,在強化學習中,一般先定義決策者或智能體(agent),再將智能體之外的事物定義為“環(huán)境(environment)”,系統(tǒng)與環(huán)境相融,智能體和環(huán)境之間的交互過程由三個要素組成,分別是:狀態(tài)(state)、動作(action)、獎勵(reward)。智能體根據(jù)狀態(tài)St,執(zhí)行動作At并與環(huán)境進行交互,得到獎勵Rt并獲得更新的狀態(tài)St+1,在時間步t下,根據(jù)當前狀態(tài)St和獎勵Rt,智能體提供當前動作At,系統(tǒng)狀態(tài)由St轉(zhuǎn)變?yōu)镾t+1,與環(huán)境交互反饋獎勵Rt+1。
圖12 強化學習原理Fig.12 Principles of intensive learning
強化學習算法主要有Q學習算法(Q-Learning)[75]、狀態(tài)-動作-獎勵-狀態(tài)-動作算法(state-action-reward-state-action,SARSA)[76]、深度Q網(wǎng)絡(luò)算法(deepQnetwork,DQN)[77]、深度確定性策略梯度算法(deep deterministic policy gradient,DDPG)[78]、多智能體強化學習(multi-agent deep deterministic policy gradient,MADDPG)[79]等,而傳統(tǒng)的強化學習算法需要一個穩(wěn)定的環(huán)境,由于無人機集群中無人機數(shù)量多,每架無人機的策略都在變化,可選擇的動作空間變大,對于集群中的無人機而言,環(huán)境是不穩(wěn)定的且每架無人機所能觀測的環(huán)境信息也是有限的,這些原因?qū)е聜鹘y(tǒng)強化學習算法無法收斂,而MADDPG可以解決這些問題,因此,MADDPG在無人機集群任務(wù)分配中的應(yīng)用十分廣泛。
如圖13所示,MADDPG采用的是“中心化訓練,去中心化決策”的網(wǎng)絡(luò)架構(gòu),其核心思想是Actor-critic網(wǎng)絡(luò):每個Agent都有一個動作網(wǎng)絡(luò)(策略網(wǎng)絡(luò))和價值網(wǎng)絡(luò),動作網(wǎng)絡(luò)根據(jù)當前獲取的狀態(tài)si計算出執(zhí)行動作的概率分布,根據(jù)動作概率分布隨機選擇動作ai,而價值網(wǎng)絡(luò)根據(jù)當前執(zhí)行的動作和狀態(tài)(ai,si)得到一個Qi值,并根據(jù)Qi值評估當前狀態(tài)下該動作ai的好壞,以此更新動作網(wǎng)絡(luò)參數(shù)θi,提高動作網(wǎng)絡(luò)性能;而價值網(wǎng)絡(luò)則根據(jù)全局狀態(tài)S、所有Agent的動作A,得到一個實數(shù),該實數(shù)表示基于全局狀態(tài)S下,第i個Agent執(zhí)行動作ai的好壞程度,以此來對第i個Agent的動作網(wǎng)絡(luò)性能進行改進,價值網(wǎng)絡(luò)則是根據(jù)ri進行價值網(wǎng)絡(luò)參數(shù)ωi更新,以此來保持較高的評判水平。
圖13 MADDPG網(wǎng)絡(luò)架構(gòu)Fig.13 MADDPG network architecture
在訓練過程中,為了避免經(jīng)驗數(shù)據(jù)的浪費,同時也為了將訓練數(shù)據(jù)序列打散,消除相關(guān)性,使訓練更加穩(wěn)定,加入了訓練回放機制,引入經(jīng)驗池。將每一輪迭代的四元組數(shù)據(jù)(si,ai,ri,si+1)存放在經(jīng)驗池中,經(jīng)驗池大小設(shè)置為N,當數(shù)據(jù)量超過N時,每存入一條新的四元組數(shù)據(jù)將覆蓋掉最早的一條四元組數(shù)據(jù),在訓練階段,動作網(wǎng)絡(luò)隨機抽取一條四元組數(shù)據(jù)進行訓練,價值網(wǎng)絡(luò)則獲取Agent自身信息以及其他Agent的動作和狀態(tài)等信息進行訓練,即中心化訓練;在執(zhí)行階段,由于每個Agent的動作網(wǎng)絡(luò)在訓練階段已經(jīng)訓練完畢,因此在執(zhí)行時,不涉及價值網(wǎng)絡(luò),只需要Agent自身的動作網(wǎng)絡(luò),即去中心化執(zhí)行。這種訓練-執(zhí)行方式克服了環(huán)境的非平穩(wěn)性和觀測環(huán)境信息局部性,使訓練更加穩(wěn)定。
集散式信息控制結(jié)構(gòu)如圖14所示,無人機組成多個無人機聯(lián)盟,各聯(lián)盟內(nèi)有一個Leader無人機負責聯(lián)盟內(nèi)的信息交流、協(xié)同控制、任務(wù)分配等,即在局部任務(wù)執(zhí)行范圍內(nèi),各無人機聯(lián)盟內(nèi)就可完成任務(wù),無需等待無人機控制中心的指令。同時,Leader無人機對信息進行過濾,將聯(lián)盟內(nèi)收集到的高價值信息傳送給無人機控制中心,無人機控制中心整合各無人機聯(lián)盟的信息,根據(jù)實際需求和態(tài)勢變化,從戰(zhàn)場大局的角度對各無人機聯(lián)盟做統(tǒng)一宏觀調(diào)配,無人機控制中心也可通過遠程通信的方式和任務(wù)控制站保持信息交互,接收新的任務(wù)指令,調(diào)整策略。集散式控制方式將目標任務(wù)分配的集中式全局優(yōu)化問題轉(zhuǎn)化為分散的局部優(yōu)化問題。該方式既消除集中式計算量大、分布式獲得信息不全的問題,又能使無人機具備自治能力,極大的提升作戰(zhàn)效率,滿足全局利益最大化。
圖14 集散式信息控制結(jié)構(gòu)框架Fig.14 Distributed information control framework
因此,集散式控制方式下,對無人機的智能化、信息化要求最高,該控制方式適用于戰(zhàn)場環(huán)境詭譎多變,敵方目標多且需精確打擊,或敵方目標不斷改變自身策略,難以在短時間內(nèi)對目標進行打擊等情況。集散式控制方式是最貼近戰(zhàn)場實際情況的一種控制方式,且在該方式下,無人機任務(wù)完成度更高、任務(wù)執(zhí)行效率也更高,即能在短時間內(nèi)對敵方造成毀滅性傷害。
無人機集群任務(wù)分配和控制是無人機集群技術(shù)研究的重要部分。首先就當前無人機集群任務(wù)分配和控制方式的發(fā)展和研究現(xiàn)狀進行了概述,具體分析了集中式、分布式、集散式控制系統(tǒng)結(jié)構(gòu)的關(guān)鍵技術(shù)和研究進展,然后從任務(wù)分配方法、信息傳輸方式等角度進行剖析,著重分析了3種控制結(jié)構(gòu)下的適用范圍、優(yōu)缺點,以及任務(wù)分配算法的種類、原理,以期為無人機集群任務(wù)分配控制發(fā)展提供理論基礎(chǔ),對未來無人機集群任務(wù)分配控制技術(shù)起到一定的推動作用。