韓 琦, 王 霞, 王 慧, 袁藝云, 曹 瑞, 翁騰飛
(1.重慶科技學院 智能技術與工程學院, 重慶401331; 2.重慶師范大學 數(shù)學科學學院,重慶 401331;3.重慶科技學院 電氣工程學院,重慶 401331)
近些年來,隨著多智能體的協(xié)同控制在各個領域得到應用,多智能體系統(tǒng)的協(xié)同控制受到了眾多研究者的廣泛關注[1-3]。其中研究得最多的就是一致性問題,利用多智能體的一致性可以應用到編隊控制、智能電網(wǎng)經(jīng)濟調度[4]等問題。在多智能體的系統(tǒng)控制中,研究者多數(shù)是采用分布式控制協(xié)議,與集中式協(xié)議相比,分布式控制中單個個體設計簡單,且個別的智能體的失效不會影響全局,最重要的是分布式控制擁有協(xié)作好、靈活性高、信息交流少、應用性強等優(yōu)勢[5]。
到目前為止,多智能體一致性問題已經(jīng)得到眾多學者的深入的研究,文獻[6]結合分布式事件觸發(fā)機制考慮了一種帶有容錯性質的自適應一般線性多智能體系統(tǒng)。但是在很多研究中都會發(fā)現(xiàn),網(wǎng)絡中的信息流通常不是即時的,會存在時間的延遲。時滯一致性意味著跟隨者的狀態(tài)與領導者的相應狀態(tài)有一段時間延遲。在以往的研究中,針對時滯問題,有很多研究者主要集中在對時滯下系統(tǒng)的收斂性[7]和一致性[8]加以討論。且在存在時滯的系統(tǒng)中,不同孤立群集中的智能體在不同時刻的狀態(tài)都落后于它們的共同領導者,從而避免了在容量受限網(wǎng)絡上運行的多智能體系統(tǒng)的擁塞。為了確保系統(tǒng)時滯一致,并在一定程度解決信息流擁塞問題。
基于以上的啟發(fā),考慮事件觸發(fā)機制作為信息傳輸策略。因為事件觸發(fā)機制避免了控制器的連續(xù)更新問題,不僅減少了網(wǎng)絡中的數(shù)據(jù)量,而且延長了網(wǎng)絡組件的使用壽命。現(xiàn)如今事件觸發(fā)在很多領域得到利用,在文獻[9]中研究了一種關于事件觸發(fā)的雙邊非線性的二階多智能體系統(tǒng),該系統(tǒng)可利用事件觸發(fā)達到競爭下多智能體分組的一致,增加了事件觸發(fā)的范圍。文獻[10]考慮了關于事件觸發(fā)中具有干擾的主動控制的多智能系統(tǒng),并且該系統(tǒng)實現(xiàn)了一致性。綜合時滯和事件觸發(fā)這兩方面,討論具有事件觸發(fā)的二階領導-跟隨多智能體時滯一致性問題。
主要貢獻可歸納為如下方面:
(1) 考慮具有領導者的二階非線性多智能體系統(tǒng),通過設計一種關于時滯一致性的事件觸發(fā)控制器,相比文獻[11],有效結合事件觸發(fā)機制,減少了不必要的計算,降低了成本。
(2) 針對觸發(fā)控制協(xié)議,給出了相應的觸發(fā)條件,和利用圖論、矩陣理論和Lyapunov穩(wěn)定性方法,給出了保證多智能體系統(tǒng)達到時滯一致的充分條件。最后利用微分方程理論和范數(shù)不等式理論,得到了本文設計的事件觸發(fā)協(xié)議是可以避免Zeno 行為。
用帶有N個節(jié)點的有向圖G={V,Ε,W}表示由N個多智能體構成的多智能體系統(tǒng)。定義i,j=1,2,…,N,那么其中V={v1,v2,…vi,…vN}表示為節(jié)點集,vi表示第i個多智能體;E={eji=(vi,vj),vi≠vj,且vi∈V,vj∈V}?V×V代表邊緣的集合,相應的(vi,vj)表示節(jié)點vi可以接受來自vj的信息,而且如果圖G被稱為強連通圖,則對于任意兩個節(jié)點都存在有向路徑來達到連通。W=(wij)N×N表示節(jié)點與節(jié)點之間的鄰接矩陣。如果(vi,vj)∈E,?vi,vj∈V,則wij>0,否則wij=0。圖G中的Laplace矩陣L=[lij]∈Rn×n滿足下列定義
IN表示n維單位矩陣;IN=[1,1,…,1]T∈Rn;‖·‖表示歐氏空間的歐氏距離;矩陣的范數(shù)為‖A‖=sup{‖Ax‖:‖x‖=1};?表示克羅內克積;對于對稱矩陣Y,Y>0(Y<0),表示矩陣Y∈Rn×n是正定矩陣(負定矩陣),λmax(Y)表示矩陣Y的最大特征值,λmin(Y)表示最小特征值。
研究一個領導者和N個跟隨者構成的二階非線性多智能體系統(tǒng),其中領導者的系統(tǒng)形式描述如下:
(1)
跟隨者的系統(tǒng)形式:
(2)
其中,xi(t)∈n,vi(t)∈n,ui(t)∈n(i=0,1,2,…,N)分別表示智能體i在時間t時的位移,速度和控制輸入,并且f(t,xi(t),vi(t))∈n是第i個智能體的非線性函數(shù)。
定義1在式(1)和式(2)中,智能體的系統(tǒng)達到二階領導-跟隨時滯一致,當且僅當對于任何初始狀態(tài),滿足
其中,τ是正常數(shù)。
假設1存在非負常數(shù)ξ1和ξ2,使得f(t,xi(t),vi(t))滿足利普希次條件
‖f(t,x,v)-f(t,y,z)‖≤ξ1‖x-y‖+
ξ2‖v-z‖?x,y,v,z∈n,t∈[0,∞)
假設2領導者和N個智能體之間至少存在一個有向的生成樹,且該網(wǎng)絡拓撲圖是一個連通圖。
引理1[21]線性矩陣不等式:
其中,Q(x)=QT(x),R(x)=RT(x),上述不等式成立時,可以轉化為其中一個下面的等價條件:
(1)Q(x)>0,R(x)-ST(x)Q-1(x)S(x)>0;
(2)R(x)>0,Q(x)-S(x)R-1(x)ST(x)>0。
引理2[22]如果矩陣H∈N×N是非奇異矩陣,并且H的非對角元素是非正數(shù),則下面敘述的結論互相等價:
(1)H是一個非奇異的M-矩陣;
(2)H的所有特征值是在平面的右半平面,意味著J(H)>0;
(3) 存在一個正定的對角矩陣P=diag{p1,p2,…,pN}>0,使得有PH+HTP>0成立。
基于事件觸發(fā)控制定義(2)的控制協(xié)議如下
(3)
其中,σ>0是控制增益,τ是正常數(shù)。
定義觸發(fā)誤差為
一致性誤差分別是
選擇觸發(fā)函數(shù)
(4)
接下來結合一致性誤差、事件觸發(fā)誤差和事件觸發(fā)的控制改寫系統(tǒng)式(1)和式(2)如下:
(5)
令
這部分運用矩陣理論來證明事件觸發(fā)下的領導跟隨者的時滯一致問題,并排除Zeno行為。
則多智能體系統(tǒng)式(1)和式(2)可以實現(xiàn)領導跟隨的滯后一致性。
證明設定V函數(shù)如下:
其中,Q=P(L+B)+(L+B)TP。
V(t)對t求導有
(6)
對于式(6)的最后一項有
(7)
α‖φi(t)+ei(t)‖≤
α‖φi(t)‖+α‖ei(t)‖
bi(xi(t)-x0(t-τ)+vi(t)-v0(t-τ))‖ =
則對于式(6)的第二項有下列式子
(8)
(9)
-μ(P(L+B)+(L+B)TP)?IN>2ξ(P?IN)
即-μ(P(L+B)+(L+B)TP)>2ξP。
定理2領導跟隨多智能體系統(tǒng)式(1)和式(2)利用事件觸發(fā)函數(shù)式(4)和控制式(3)達到時滯一致是可以排除Zeno行為的。
證明
所以,
取ξ=max{ξ1‖L+B‖,(ξ2+1)‖L+B‖},則
(10)
又在式(9)中令,有Ξ>0,可得
故
-λmin(Ξ)ηT(t)η(t)。
令
有V(t)=η(t)Ψη(t)。
故有
(11)
故由式(10)有
即
考慮4個跟隨者和一個領導者的非線性的二階系統(tǒng),其中0表示領導者,相應的跟隨者網(wǎng)絡拓撲如圖1所示。
圖1 跟隨者與領導者結構拓撲圖Fig. 1 Communication topology of leader-follower system
其中,Laplace矩陣表示為
從圖2和圖3可以看出,4個跟隨者是可以和領導者達成滯同步一致的。而從圖4可以得到,每個智能體的誤差曲線,最后都會趨于0,說明跟隨者會和領導者趨于一致。圖5表明了智能體的控制變化趨勢,最后也是每個智能體都是當時間趨于無窮時控制趨于0,充分說明了智能體的時滯一致性。圖6是每個跟隨者的觸發(fā)間隔,從圖中可以明顯看出該觸發(fā)事件是沒有Zeno行為的。圖2—圖6都有效說明理論的正確性。
圖2 智能體速度變化軌跡圖Fig. 2 The velocity trajectory of agent
圖3 智能體的狀態(tài)軌跡圖Fig. 3 The state trajectory of agent
圖4 跟隨者的誤差趨勢變化Fig. 4 Error trend of followers
圖5 智能體的控制輸入變化趨勢Fig. 5 Control input trend of agent
圖6 跟隨者觸發(fā)間隔圖Fig. 6 Follower trigger interval graph
主要研究智能體的非線性動力學系統(tǒng),考慮具有時滯效應的二階領導——跟隨多智能體的系統(tǒng)的時滯一致性。首先,結合事件觸發(fā)機制給出一個基于局部信息的分布式控制協(xié)議;然后在這個協(xié)議下,運用Lyapunov穩(wěn)定性理論,圖論等相關知識導出該系統(tǒng)實現(xiàn)滯后一致性的充分條件;最后,數(shù)值模擬驗證理論結果的正確性。