周建萍,張 健,茅大鈞
(上海電力大學(xué)自動化工程學(xué)院,上海 200090)
近年來,隨著計算機和通信技術(shù)的發(fā)展,多智能體系統(tǒng)的協(xié)調(diào)控制也因其在解決眾多理論和工程問題中的應(yīng)用而受到廣泛關(guān)注[1],如無人機編隊控制[2],多機器人編隊[3],衛(wèi)星星團姿態(tài)同步[4]等方面應(yīng)用。一致性問題是多智能體系統(tǒng)協(xié)調(diào)控制的基本問題,即要求所有智能體通過通信網(wǎng)絡(luò)獲得鄰居信息實現(xiàn)對其狀態(tài)協(xié)議更新,使所有智能體狀態(tài)在所設(shè)計的通信和交互規(guī)則下達到一致。目前針對多智能體系統(tǒng)一致性問題已取得不少成果,按照多智能體系統(tǒng)的動力學(xué)模型可分為:一階[5-7]、二階[8,9]、三階[10,11]、高階[12,13]。
在實際應(yīng)用中,由于CPU 處理速度和內(nèi)存容量的限制,智能體不能頻繁地進行控制以及與其鄰居智能體交換信息。因此,針對資源有限嵌入式系統(tǒng)的新型控制方式---事件觸發(fā)控制應(yīng)運而生[14]。所謂事件觸發(fā)控制是指控制任務(wù)按需執(zhí)行,智能體與鄰居之間只有當一個特定事件發(fā)生(如狀態(tài)誤差超過規(guī)定的閾值)時才進行信息傳遞,避免了智能體之間大量的冗余信息傳輸?;诖耍录|發(fā)機制能有效應(yīng)用到多智能體系統(tǒng)的一致性問題研究中。關(guān)于采用事件觸發(fā)控制多智能體系統(tǒng)一致性始于文獻[15],并在各種類型多智能體系統(tǒng)中都取得巨大進展。D.V.Dimarogonas等人[15~18]基于事件觸發(fā)控制機制來研究了一階多智能體系統(tǒng)的一致性問題。其中文獻[16]給出了一種集中式事件觸發(fā)控制策略,系統(tǒng)中的所有智能體共享一個觸發(fā)函數(shù),當一個事件發(fā)生時,所有智能體同時更新采樣狀態(tài)和控制輸入。文獻[17]、[18]提出了一種分布式事件觸發(fā)控制策略,系統(tǒng)中每個智能體的觸發(fā)時刻由對應(yīng)的觸發(fā)函數(shù)決定,相比于集中式事件觸發(fā)控制策略,分布式事件觸發(fā)控制策略能夠更有效地減少智能體之間的信息通訊量。文獻[19~23]基于事件觸發(fā)機制探討了二階多智能體系統(tǒng)的一致性問題。其中文獻[19]提出的控制協(xié)議為分布式事件觸發(fā)控制策略,文獻[20]則為集中式控制觸發(fā)控制策略,文獻[21]將分布式事件觸發(fā)控制策略與集中式控制觸發(fā)控制策略進行了對比研究。文獻[22]研究了二階多智能體系統(tǒng)在固定無向拓撲下的平均一致性問題,構(gòu)造了依賴于時間變化的觸發(fā)函數(shù),并對系統(tǒng)存在時滯的情形進行了討論;文獻[23]針對二階含有領(lǐng)航者的多智能體系統(tǒng)一致性問題進行了分析和研究。需要注意的是,現(xiàn)有的基于事件觸發(fā)控制多智能體系統(tǒng)一致性研究成果大多數(shù)集中在一階和二階系統(tǒng)。迄今為止,針對采用事件觸發(fā)控制三階多智能體系統(tǒng)的研究非常少,目前在文獻[24]中基于事件觸發(fā)控制機制研究了三階多智能體系統(tǒng)的一致性,但是該研究是在離散時間下進行的。在實際工程中,需要系統(tǒng)工作在連續(xù)時間情況下。考慮到實際模型中三階和高階系統(tǒng)十分普遍,且其性能指標又十分復(fù)雜,因此對三階連續(xù)多智能體系統(tǒng)的一致性研究更具有實際意義。
基于上述原因,本文將事件觸發(fā)控制機制應(yīng)用于三階連續(xù)多智能體系統(tǒng)的一致性研究中,利用位置、速度和加速度三者的測量誤差設(shè)計了分布式事件觸發(fā)控制協(xié)議去實現(xiàn)在有向固定通信拓撲的三階連續(xù)多智能體系統(tǒng)的一致性。在該方法下,系統(tǒng)中的每個智能體僅在事件觸發(fā)時刻更新控制輸入,從而降低系統(tǒng)的控制更新頻率。采用模型轉(zhuǎn)化方法將系統(tǒng)的一致性問題轉(zhuǎn)化為穩(wěn)定性問題,并利用線性矩陣不等式方法和Lyapunov穩(wěn)定性理論給出系統(tǒng)達到一致性的充分條件。實驗結(jié)果表明采用事件觸發(fā)控制策略可使三階連續(xù)多智能體系統(tǒng)達到一致性的同時節(jié)省了通信資源,為三階多智能體系統(tǒng)控制提供了一種新的研究思路。
引理1[22]如果G含有一顆有向生成樹,那么拉普拉斯矩陣L滿足如下性質(zhì):
1)rank(L)=N-1;
2)至少一個零特征,1N作為其對應(yīng)的特征向量,滿足L1N=0;
3)L的N個特征值均含有非負實部,且它們可按升序排列為0=λ1(L)≤…≤λN(L)=λmax(L)。
對于三階多智能體系統(tǒng),智能體i的動態(tài)方程描述為
(1)
式中,xi(t)∈R,vi(t)∈R、zi(t)∈R和ui(t)∈R分別表示智能體i的位置、速度、加速度狀態(tài)信息和控制輸入。
一致性控制協(xié)議[20]被給出
(2)
其中,反饋增益常數(shù)k>0隨后將會被確定。
對于智能體i的位置、速度、加速度測量誤差被定義為
(3)
(4)
(5)
智能體i控制協(xié)議進一步滿足
(6)
(7)
定義1:對于三階多智能體系統(tǒng)(1),當且僅當所有智能體的位置變量、速度變量、加速度變量滿足以下條件時,則稱系統(tǒng)(1)能達到一致性。
如上所述,每個智能體根據(jù)自身和來自鄰居的位置、速度和加速度信息來確定事件時刻執(zhí)行其控制輸入更新。滿足式(6)得出智能體i分布式控制協(xié)議
(8)
由(3)~(5)可得
(9)
由(1)和(9)可得
(11)
和
(12)
其中
引理2[20]對于有向圖G的拉普拉斯矩陣L,存在非奇異矩陣
(13)
使得L相似于對角矩陣Λ得到:
(14)
(15)
對智能體定義:
ex(t)=col(ex,1(t),ex,2(t),…)
ev(t)=col(ev,1(t),ev,2(t),…)
ez(t)=col(ez,1(t),ez,2(t),…)
(16)
基于引理1,使用坐標變換
(17)
然后(11)可以被寫成如下形式
(18)
其中
實質(zhì)上,系統(tǒng)(18)可以被認為是兩個互相連接子系統(tǒng)
(19)
和
(20)
(21)
其中
定理1 假設(shè)圖G含有一顆有向生成樹,且事件觸發(fā)函數(shù)為
fi(ζi,ξi)
(22)
或
(23)
存在常數(shù)k?1使得系統(tǒng)(1)在協(xié)議(8)下,所有智能體均滿足定義1,即系統(tǒng)(1)可達到一致性。
其中,ξi(t)=col(xi(t),vi(t),zi(t)),ζi(t)=col(ex,i(t),ev,i(t),ez,i(t)),i∈N,ξ(t)=col(x(t),v(t),z(t)),ζ(t)=col(ex(t),ev(t),ez(t))。
證明:考慮(17)~(18)或者(20),選擇Lyapunov 函數(shù)如下
V(ε)=εTPε
(24)
其中
(25)
=-εTQε+2εTPJ2e
(26)
其中
引理3[25]:(Schur補)線性矩陣不等式(LMI)
其中,S為分塊對稱矩陣,S11、S22均為方陣,等價于下面任意一個條件
(27)
(28)
由引理3結(jié)合式(26)得
≤-λ(Q)‖ε‖2+2λmax(P)‖J2‖‖ε‖‖e‖
≤-‖ε‖[λmin(Q)‖ε‖-2λmax(P)‖J2‖‖e‖]
≤-‖ε‖[λmin(Q)(I2?WU-1)‖ξ‖-2λmax(P)‖J2‖(I2?WU-1)‖ζ‖]
≤-‖ε‖(I2?WU-1)[λmin(Q)‖ξ‖-2λmax(P)‖J2‖‖ζ‖]
(29)
當滿足
或
其中,權(quán)重參數(shù)σi∈(0,1)。結(jié)合(29)可得
(30)
(31)
對式(31)進行積分得
(32)
由于系統(tǒng)(20)是指數(shù)穩(wěn)定的,因此基于事件觸發(fā)條件(22),解(32)具有相對于時間的指數(shù)衰減項。因此,當t→∞時,解收斂到0。因此可得
由式(17)可得
由上式知當t→∞時,有xi(t)-xj(t)→0,vi(t)-vj(t)→0,zi(t)-zj(t),即滿足定義1。
證畢。
注釋1:一般而言,Zeno行為是在有限時間間隔內(nèi)發(fā)生無限次事件觸發(fā)的現(xiàn)象。當然,一旦Zeno行為發(fā)生,計算機模擬變得不精確和耗時。因此,必須在模型分析中排除Zeno行為。
為了表明在整個事件觸發(fā)控制過程中不會產(chǎn)生Zeno現(xiàn)象。給出了如下定理。
定理 2:考慮多智能體系統(tǒng)式(1)在一致性協(xié)議式(7)的作用下。假設(shè)圖 G 含有一顆有向生成樹。且事件觸發(fā)函數(shù)滿足式(22)或(23),則對于所有的智能體,任意兩個連續(xù)事件觸發(fā)時刻之間的間隔tD不小于
(33)
(34)
其中,y滿足y(t)≤φ(t,φ0),這里的φ(t,φ0)是方程的解,滿足
(35)
在初始條件φ(0,0)=0下解方程(35)得
(36)
(37)
結(jié)合(33)則有
(38)
(39)
由(36)和(39)可解出時間下界
證畢。
本部分將利用一個仿真來驗證本文所提算法及理論的正確性和有效性。假設(shè)三階多智能體系統(tǒng)包含四個智能體,且有向通信拓撲結(jié)構(gòu)如圖1所示,可以明顯看出該圖包含有向生成樹。
圖1 通信拓撲
通信拓撲Laplacian矩陣由下式給出
對于起始位置、速度、加速度和各參數(shù)分別設(shè)置為:x(0)=col(10,20,30,40),v(0)=(1,2,3,4),z=(0.5,1,1.5,2),k=1.5,采樣周期T=0.01。
仿真結(jié)果如圖2~圖7所示。
圖2 位置軌跡
圖3 速度軌跡
圖4 加速度軌跡
圖5 測量誤差與閾值
圖6 事件觸發(fā)序列
圖7 事件觸發(fā)序列(19s~20s)
圖2、圖3和圖4分別表征了多智能體系統(tǒng)(1)的位置、速度和加速度的軌跡,從圖中可以看出,隨著時間的推移,三個變量均達到了一致性,表明了本文所提出的事件觸發(fā)控制策略可使三階多智能體系統(tǒng)到達一致性。根據(jù)定理1可知,基于控制器(2)和事件觸發(fā)函數(shù)(31)的系統(tǒng)(1)能實現(xiàn)一致。從圖2~圖4可以看出,仿真結(jié)果與理論分析符合。即驗證了定理1的有效性。
圖5給出了0s~20s各智能體的事件觸發(fā)閾值和定義測量誤差。圖6給出了0s~20s各智能體的事件觸發(fā)時刻序列。從圖5、圖6中可以看出,本文所設(shè)計的事件觸發(fā)協(xié)議確實可以有效減少智能體之間的通信次數(shù),從而達到節(jié)約資源的目的。圖7是對圖6觸發(fā)較為密集的19s~20s 的時間區(qū)間進行了局部放大,可以看到各次觸發(fā)之間的時間間隔仍然是嚴格大于零的,沒有發(fā)生 Zeno 行為,符合理論結(jié)論。
本文研究了三階連續(xù)多智能體系統(tǒng)一致性問題,構(gòu)造了一個分布式事件觸發(fā)一致性協(xié)議。基于圖論和矩陣理論使所有智能體的位置、速度和加速度狀態(tài)信息達到一致性。分析了所提出的事件觸發(fā)一致性控制閉環(huán)多智能體系統(tǒng)的輸入到狀態(tài)穩(wěn)定性,并排除了Zeno行為。最后,數(shù)值仿真驗證了上述結(jié)論的有效性。