周 媛,劉永芳,馬生昌,趙 宇
(西北工業(yè)大學(xué)自動化學(xué)院,西安 710129)
隨著計算機(jī)、互聯(lián)網(wǎng)、微電子等新科技在軍事方面的不斷發(fā)展,現(xiàn)代戰(zhàn)爭形態(tài)逐漸從“機(jī)械化”向“信息化、智能化”轉(zhuǎn)變,無人系統(tǒng)作戰(zhàn)技術(shù)已成為各國爭相發(fā)展的關(guān)鍵技術(shù)。而傳統(tǒng)的單機(jī)作戰(zhàn)由于其探測能力、抗擾能力、打擊能力等方面的局限性導(dǎo)致其無法適應(yīng)現(xiàn)代化戰(zhàn)爭環(huán)境的復(fù)雜性、作戰(zhàn)任務(wù)的艱巨性,因此,無人系統(tǒng)集群作戰(zhàn)將成為未來戰(zhàn)爭的主要作戰(zhàn)方式[1-3]。在此背景下,對基于多智能體的無人系統(tǒng)進(jìn)行協(xié)調(diào)控制這一關(guān)鍵技術(shù)就顯得尤為重要。
多智能體系統(tǒng)是近年來新興的一個比較熱門的研究方向,它是指由一系列信息交互的智能體組成的群體系統(tǒng),其內(nèi)部的各智能體可通過相互感知、相互通信等方式,完成單個智能體所不能完成的大規(guī)模的復(fù)雜的特定任務(wù)。分布式控制是多智能體系統(tǒng)協(xié)調(diào)控制的主要方式,其僅依賴每個智能體與其鄰居智能體間的狀態(tài)信息交互對系統(tǒng)實行控制。分布式控制的優(yōu)勢在于完成任務(wù)的同時也克服了集中式控制產(chǎn)生的計算量與能耗較大的缺陷,具有更高的應(yīng)用價值。作為多智能體系統(tǒng)協(xié)同控制的熱點研究問題,編隊控制要求系統(tǒng)中的每個個體在執(zhí)行任務(wù)過程中能保持一定的幾何形態(tài),以適應(yīng)其所處的環(huán)境約束。比如在大型物資運輸過程中,對運輸車輛所處的位置有一定的要求,以滿足運輸過程的穩(wěn)定和負(fù)載平衡等[4-5]。
近年來,大量的國內(nèi)外學(xué)者對多智能體系統(tǒng)分布式編隊控制進(jìn)行了深入的研究,并且取得了豐碩的研究成果。文獻(xiàn)[6]基于人工勢能場,對輪式機(jī)器人模型系統(tǒng)領(lǐng)航—跟蹤問題進(jìn)行了深入研究,提出了一種新型的“行星–衛(wèi)星”式避障算法。但該算法僅能保證系統(tǒng)漸近收斂,即當(dāng)時間接近正無窮大時,跟蹤者才能收斂到其領(lǐng)航者的軌跡。然而,在實際應(yīng)用時,對任務(wù)時間總是有著一定的要求,人們期望系統(tǒng)能在給定的時間限制之前達(dá)到控制目標(biāo)。因此,Cortés[7]基于一階積分器系統(tǒng)提出了有限時間控制,并將其應(yīng)用于梯度系統(tǒng)實現(xiàn)多智能體系統(tǒng)有限時間一致性控制。自此,出現(xiàn)了多種多樣的有關(guān)多智能體有限時間控制問題,如有限時間跟蹤問題[8-9],多衛(wèi)星有限時間編隊問題[10-13]和自適應(yīng)有限時間同步問題[14]。但是,有限時間控制所得到的收斂時間常與初始狀態(tài)相關(guān),如果不能預(yù)先獲得系統(tǒng)的初始狀態(tài),那么控制器將會失去其效用。于是又提出了固定時間算法[15-17]來解決這個問題。該算法主要依賴控制器的參數(shù),計算出其收斂時間的上界,所以,固定時間算法的收斂時間通常具有一定的保守性。為克服以上算法的缺陷,本文提出了一種指定時間控制算法,使系統(tǒng)的收斂時間僅取決于用戶的設(shè)定值。
需要指出的是,上述文獻(xiàn)的研究均是基于智能體之間為協(xié)同合作關(guān)系假設(shè)得出的,而實際中不同個體間既存在合作關(guān)系又存在競爭關(guān)系,這樣的考慮更為普遍。文獻(xiàn)[18]正是基于這樣的想法,將智能體間的信息交互用圖論進(jìn)行描述,其中正的邊權(quán)重可以表示個體間為合作關(guān)系,負(fù)的權(quán)重可表示智能體間的競爭關(guān)系?;谶@樣的模型,Altafini[18]提出了“雙向一致性”的概念,并給出了多智能體系統(tǒng)實現(xiàn)雙向一致性的充要條件。于是,文獻(xiàn)[19-20]分別研究了一階積分器和二階積分器多智能體系統(tǒng)雙向一致性編隊問題,其要求智能體能以分組的形式實現(xiàn)各組的編隊構(gòu)型,并且每組智能體能以特定的隊形、相反的方向進(jìn)行運動。除此之外,文獻(xiàn)[21]針對二階非線性多智能體系統(tǒng)雙向編隊問題,設(shè)計了脈沖控制器及狀態(tài)反饋控制器,實現(xiàn)脈沖控制機(jī)制下系統(tǒng)雙向編隊目標(biāo)。但目前,在多智能體系統(tǒng)雙向編隊控制這一問題上的研究成果還遠(yuǎn)遠(yuǎn)不足,還需從不同的控制算法、不同的控制系統(tǒng)對多智能體系統(tǒng)雙向編隊控制進(jìn)行較為深入的探討。
因此,本文研究了具有一般線性動力學(xué)的多智能體系統(tǒng)的指定時間雙向編隊問題。利用龐特里亞金極大值原理和運動規(guī)劃技術(shù),提出了雙向編隊控制算法,使系統(tǒng)能夠在指定時間內(nèi)實現(xiàn)雙向編隊。與現(xiàn)有的多智能體系統(tǒng)分布式控制結(jié)果相比,本文的貢獻(xiàn)主要體現(xiàn)在以下三個方面:首先,提出了一種變增益的指定時間控制律,系統(tǒng)的收斂時間可由用戶任意指定,克服了傳統(tǒng)的有限時間控制對初始狀態(tài)的依賴性和固定時間控制導(dǎo)致的保守性的缺點[7-17]。其次,與現(xiàn)有的基于完全協(xié)同拓?fù)鋄6-17]的文獻(xiàn)不同,本文研究的拓?fù)浣Y(jié)構(gòu)同時含有協(xié)同和競爭作用。但本文提出的控制算法同樣適用于解決傳統(tǒng)的非負(fù)圖的指定時間一致性編隊問題。最后,值得注意的是,本文提出的控制器僅依賴離散的采樣時刻多智能體的狀態(tài),也就是說該算法并不需要系統(tǒng)實時通信,僅要求系統(tǒng)在采樣點處滿足一定的通信條件。因此,該算法能夠減輕網(wǎng)絡(luò)的通信負(fù)擔(dān),降低其對網(wǎng)絡(luò)通信能力的要求。
本文使用標(biāo)準(zhǔn)符號。文中,用R表示實數(shù)集,Rn表示n維的實列向量集, Rm×n表示m×n的實矩陣集。那么, 1n∈Rn表示元素為1的n維列向量,In∈Rn×n表示單位矩陣。d iag {m1,m2,… ,mn}表示以m1,m2,… ,mn為對角元素的對角矩陣。?表示克羅內(nèi)克積,表示歐幾里得范數(shù), det ()表示行列式, sgn ()表示符號函數(shù),表示絕對值符號。對于一個矩陣M∈Rn×n來說,M?0意味著M的所有元素均非負(fù),若其同時滿足M1n=1n,則稱M為隨機(jī)矩陣。
引理 1.對于隨機(jī)矩陣M,若其所有特征值滿足則稱其為SIA(Stochastic,Indecomposable, Aperiodic)矩陣。并且M具有如下性質(zhì):其中y∈Rn表示元素均非負(fù)的n維列向量[22]。
基于圖論知識,本文使用帶符號的有向圖G = ( V,E,A)來表示智能體間通信拓?fù)浣Y(jié)構(gòu),其中點集 V ={1 ,2,…,N}表示N個智能體,邊集E = {Eij= (i,j)} 表示智能體之間的信息流,A= [aij] ∈RN×N表示圖G 的加權(quán)鄰接矩陣。邊集元素表示從有信息流從j節(jié)點傳遞給i節(jié)點,從而A中相應(yīng)的元素αij≠ 0,反之,αij=0;如果αij< 0表示j節(jié)點和i節(jié)點之間為競爭關(guān)系,αij> 0表示j節(jié)點和i節(jié)點之間為合作關(guān)系。本文不考慮帶有自環(huán)的拓?fù)浣Y(jié)構(gòu),因此,αii= 0。符號 adj(i)表示智能體i的鄰居集合。那么,圖的拉普拉斯矩陣可以定義為L=[lij],其中若圖G 中存在一個點i可以向圖中其他所有的點傳送信息,那么稱i節(jié)點為根節(jié)點,稱圖G 含有生成樹。
圖G 稱為結(jié)構(gòu)平衡圖當(dāng)且僅當(dāng)點集V分為完全沒有交集的兩個子集并且同時滿足以下條件:(1) V1∪ V2=V, V1∩ V2=?;(2)αij< 0, ?i,j∈Vk;αij> 0, ?i∈Vk,j∈V3-k,其 中k∈{ 1 ,2}。
引理2.如果圖G 為結(jié)構(gòu)平衡圖,L為其相應(yīng)的拉普拉斯矩陣,那么,一定存在對角矩陣Υ=diag {γ1,γ2,… ,γn},使ΥLΥ?0,其中γi∈ {1 ,-1 }[18]。
考慮由N個一般線性動力學(xué)組成的多智能體系統(tǒng),其動力學(xué)方程可以描述為
定義編隊誤差ei(t) =xi(t)-hi,其中hi∈Rn為第i個智能體的編隊向量,那么,系統(tǒng)(1)的指定時間雙向編隊目標(biāo)可以表述如下。
定義 1.對多智能體系統(tǒng)(1),如果對于任意的初始狀態(tài)xi(t0)及人為指定的時間T,都有
則稱系統(tǒng)(1)實現(xiàn)了指定時間雙向編隊。
注 1.式(2)所表述的指定時間雙向編隊問題要求不同組的智能體的狀態(tài)分別實現(xiàn)自己的編隊構(gòu)型,并以不同的方向分別運動。具體來講,當(dāng)智能體i和智能體j屬于同一子集時,αij> 0,那么即i和j運動方向相同;當(dāng)i和j屬于不同子集時,即i和j運動方向相反。顯然,當(dāng)hi=hj= 0時,式(2)描述的控制目標(biāo)可以重新表述為“指定時間雙向一致性”。因此,得出結(jié)論:“雙向一致性”是“雙向編隊”的特例。
為了實現(xiàn)系統(tǒng)“指定時間雙向編隊”的控制目標(biāo),本文做出如下假設(shè)。
假設(shè)1.多智能體系統(tǒng)(1)能控;
假設(shè)2.帶符號的有向拓?fù)浣Y(jié)構(gòu)G為含有一棵生成樹的結(jié)構(gòu)平衡圖。
注 2.本文考慮兩個組的智能體分別實現(xiàn)各自的編隊構(gòu)型,因此系統(tǒng)(1)滿足能控條件僅是對線性系統(tǒng)一個比較基本的條件。另外,假設(shè)2要求拓?fù)浣Y(jié)構(gòu)中有足夠的信息流,其能從網(wǎng)絡(luò)中的某個節(jié)點流向其他節(jié)點;此外,智能體實現(xiàn)雙向編隊還需滿足分組條件。綜其所述,本文所給的假設(shè)1和假設(shè)2是必要且可行的。
引理 3.若多智能體系統(tǒng)(1)滿足假設(shè)1,那么當(dāng)t≠t0時,有[10]
引理 4.記若拓?fù)浣Y(jié)構(gòu)G滿足假設(shè)2,那么圖G的拉普拉斯矩陣L滿足:
其中:lii為拉普拉斯矩陣L的對角元素。
因此,式(4)成立。
基于非周期采樣算法,本文提出非周期采樣時間序列為
另外,在運動規(guī)劃技術(shù)和SIA矩陣的性質(zhì)下,第i個智能體在第k+1步的終端狀態(tài)約束為
因此,對式(1)、(6)應(yīng)用龐特里亞金極大值原理,構(gòu)造式(6)的哈密頓函數(shù):
其中:?i(t)為協(xié)態(tài)變量。繼而,式(8)分別對hi,xi和ui求偏導(dǎo),有
其中,式(9c)為式(8)存在極值的必要條件。聯(lián)立式(9a)、(9b),可發(fā)現(xiàn)其為一線性矩陣方程組。對其從tk至tk1+進(jìn)行積分,有
其中:
定理1.若系統(tǒng)(1)滿足假設(shè)1且拓?fù)浣Y(jié)構(gòu)G滿足假設(shè) 2,那么,控制器(12)按照時間序列式(5)進(jìn)行采樣,能夠保證系統(tǒng)(1)實現(xiàn)指定時間雙向編隊。
證.首先,證明在控制器(12)作用下,多智能體系統(tǒng)(1)的采樣狀態(tài)收斂,即
將式(12)代入系統(tǒng),并對其從t至tk1+進(jìn)行積分,有
根據(jù)引理4中SIA矩陣的性質(zhì),有
綜上所述,控制器(12)能夠使系統(tǒng)(1)實現(xiàn)指定時間雙向編隊。
注 3.文中設(shè)計的控制器(12)取決于時間序列間隔tk+1-tk的大小,由于采樣時間序列是非周期的,因此控制器(12)的增益是時變的。另外,控制器的大小僅取決于離散的采樣時刻狀態(tài)大小,而不需系統(tǒng)滿足實時通信,從而減輕網(wǎng)絡(luò)的通信負(fù)擔(dān),降低其對網(wǎng)絡(luò)通信能力的要求。
注 4.控制器(12)可實現(xiàn)多智能體系統(tǒng)(1)實現(xiàn)指定時間雙向編隊控制。與文獻(xiàn)[7-17]相比,本文設(shè)計的控制器主要優(yōu)勢在于系統(tǒng)的收斂時間可事先人為指定,而不依賴系統(tǒng)的初始狀態(tài),同時也不具有保守性。
注 5.由于文中提出的控制器適用于結(jié)構(gòu)平衡的拓?fù)浣Y(jié)構(gòu),而傳統(tǒng)的無符號拓?fù)浣Y(jié)構(gòu)是一類特殊的結(jié)構(gòu)平衡圖,其中一個子集為空。因此,將本文的控制器應(yīng)用于傳統(tǒng)的拓?fù)浣Y(jié)構(gòu)上時可實現(xiàn)一般的指定時間編隊控制。
注 6.顯然,采樣序列(1)的收斂性在控制系統(tǒng)實現(xiàn)指定時間編隊的過程中發(fā)揮著重要作用,在此,可選取采樣時間間隔為k= 1,2,…},其以多項式速率收斂至T。另一個可選取的采樣時間間隔為k= 1,2,…},其以指數(shù)速率收斂到T。
但是,注意到在以上采樣序列作用下,控制器(12)會在有限時間內(nèi)產(chǎn)生無數(shù)次采樣,即產(chǎn)生了芝諾效應(yīng)。為解決這一問題,通常會采取一個誤差上界來避免此現(xiàn)象,即:當(dāng)時,認(rèn)為其已經(jīng)實現(xiàn)了指定時間雙向編隊。由此,可以推導(dǎo)出采樣頻率的上界:
因此,修正后的采樣間隔序列為
在這一部分,我們考慮6個動力學(xué)為二階積分器類型的智能體的指定時間二分編隊控制問題的數(shù)值仿真。為便于刻畫其在指定時間的收斂性,本文僅考慮x-y平面內(nèi)智能體實現(xiàn)編隊,即則系統(tǒng)的動力學(xué)可如式(16)所示:
其中:
顯然,式(16)描述的系統(tǒng)一定為能控系統(tǒng),即滿足假設(shè)1。智能體間的通信拓?fù)浣Y(jié)構(gòu)可由圖1來描述,其滿足假設(shè) 2,其中V1= {1 ,2,3},V2= {4 ,5,6}。
圖1 6個智能體的通信拓?fù)浣Y(jié)構(gòu)Fig.1 The communication topology with 6 agents
為了能夠以一個三維視圖(時間–二維平面)的方式顯示指定時間算法的有效性,假設(shè)智能體在高度方向上保持一致,則相應(yīng)的編隊隊形為二維平面圖形。指定智能體最后的編隊隊形為兩正三角形,則相應(yīng)的編隊向量可以給定為指定系統(tǒng)的收斂時間為T=8以及編隊誤差界限ε= 10–3,對其進(jìn)行仿真,結(jié)果如下所示。
圖2 智能體位置誤差和速度誤差Fig.2 The position errors and velocity errors of agents
圖3刻畫了6個智能體的運動軌跡,并繪制了系統(tǒng)在t=8和t=15時兩組智能體的編隊隊形。顯然,屬于不同子集的智能體實現(xiàn)各自編隊隊形之后便朝著相反的方向進(jìn)行運動,即實現(xiàn)了雙向編隊。
圖3 6個智能體的飛行軌跡Fig.3 The real flight trajectories of 6 agents
計算機(jī)及網(wǎng)絡(luò)技術(shù)的發(fā)展,推動了現(xiàn)代戰(zhàn)爭向集群作戰(zhàn)方式轉(zhuǎn)變,同時也為多智能體系統(tǒng)技術(shù)的應(yīng)用提供了一個廣闊的平臺。本文針對作戰(zhàn)過程中無人系統(tǒng)的編隊問題,利用龐特里亞金極大值原理,設(shè)計了一類分布式雙向編隊控制器,解決了一般線性動力學(xué)多智能體系統(tǒng)指定時間雙向編隊問題,并且通過數(shù)值仿真證明了控制器的有效性,為無人系統(tǒng)的編隊飛行提供了潛在的應(yīng)用前景。
后續(xù)還可圍繞文中所提算法進(jìn)行以下研究:
(1)針對領(lǐng)航者—跟隨者網(wǎng)絡(luò)編隊問題,設(shè)計相應(yīng)的分布式控制器使系統(tǒng)實現(xiàn)指定時間收斂。
(2)本文控制器依靠狀態(tài)反饋來實現(xiàn)多智能體系統(tǒng)指定時間雙向編隊,但當(dāng)網(wǎng)絡(luò)受到攻擊時,智能體間的通信會受到干擾,因此,可以考慮基于輸出反饋來實現(xiàn)系統(tǒng)指定時間雙向編隊控制。