唐朝君
(重慶理工大學 理學院,重慶 400054)
?
切換拓撲下離散時間多智能體系統(tǒng)的包含控制
唐朝君
(重慶理工大學 理學院,重慶 400054)
研究具有多個領導智能體的離散時間多智能體系統(tǒng)的包含控制問題。首先,對于系統(tǒng)中的跟隨智能體提出了一個分布式的控制協議;其次,主要利用非負矩陣理論和代數圖論的知識,分別給出了固定網絡拓撲和切換網絡拓撲下系統(tǒng)解決包含控制問題的拓撲條件;最后,數值模擬結果驗證了理論結果的正確性。
多智能體系統(tǒng);包含控制;切換拓撲;離散時間系統(tǒng);分布式控制
多智能體系統(tǒng)是近年來迅速發(fā)展起來的一門新興的復雜系統(tǒng)控制科學,它的研究涉及數學、控制、計算機、通信、生物和人工智能等多個學科,并得到了來自這些領域研究學者的廣泛關注。同時,由于它在傳感器網絡、無人駕駛飛行器、移動機器人、自治水下潛艇、編隊控制、人造衛(wèi)星簇的姿態(tài)調整等諸多領域有著廣泛的應用,對多智能體系統(tǒng)的研究已經成為當前系統(tǒng)控制領域研究的前沿和熱點課題。包含控制是多智能體系統(tǒng)研究中的一個重要子課題。所謂包含控制是指一群具有自治性的智能體在一定的網絡拓撲結構和外界環(huán)境下通過交換局部鄰居信息聚集到某一個給定的靜止或移動的目標區(qū)域內。
目前,對包含控制的研究已得到了一些有趣的結果。Ji,Egerstedt等[1]采用1階偏微分方程建立了包含控制模型,提出了基于Go-To策略的包含控制策略,使跟隨者最終達到由領導者生成的凸包內。Cao等[2]在Ji等的研究成果上研究了固定和切換有向拓撲下的1階連續(xù)多智能體系統(tǒng)的包含控制問題。溫廣輝等[3]主要利用非光滑控制的方法對具有不確定線性動力學模型的多智能體系統(tǒng)進行了研究。利用H∞控制理論中的規(guī)范投影引理,Li等[4]對具有一般線性動力學的連續(xù)時間和離散時間的多智能體系統(tǒng)建立了基于觀測的包含控制模型。Liu和Kan等[5-6]研究了隨機網絡拓撲下的包含控制問題。Liu等[7]研究了基于事件觸發(fā)機制的包含控制問題。在這些研究結果中,往往假設系統(tǒng)的通信拓撲是固定的,或者每個時刻系統(tǒng)的通信拓撲都是連通的,對系統(tǒng)的通信拓撲的要求比較強。在實際應用當中,由于智能體的位置不斷變化,智能體之間的通信還會受到障礙物的影響,智能體之間的通信會出現中斷和重新連接的情況。因此,對切換拓撲下包含控制的研究就顯得尤為重要。此外,系統(tǒng)的通信拓撲可能一直都是不連通的,尋找解決包含控制的最弱的拓撲條件也是非常必要的。
多智能體系統(tǒng)的通信拓撲用有向圖G=(V,E)表示,其中:V={1,2,…,n}為頂點集合,頂點i代表第i個智能體;E={(i,j)|i,j∈V}為邊集,若智能體j能直接獲取智能體i的信息,則(i,j)∈E,否則(i,j)?E。若(j,i)∈E,則稱頂點j是頂點i的鄰居或智能體j是智能體i的鄰居。從頂點i1到ik的一條有向路由一系列不同的頂點i1,i2,…,ik構成,且這些頂點滿足(ij-1,ij)∈E,j=2,3,…,k。如果有向圖G中至少有一個頂點到其他任何頂點都有有向路,則稱有向圖G包含生成樹。
加權有向圖G(A)由有向圖G和非負矩陣A=[aij]∈Rn×n構成,滿足aij>0?(j,i)∈E,其中矩陣A稱為鄰接矩陣,aij稱為邊(j,i)的權重。加權有向圖G(A)的Laplacian矩陣L=[lij]∈Rn×n定義為
Laplacian矩陣在多智能體系統(tǒng)協調控制的研究中具有非常重要的作用,它具有以下性質:
引理1[8]0是矩陣L的特征值,e=(1,1,…,1)T是對應的特征向量;若G包含生成樹,則0是代數簡單的,且其他特征值的實部全大于0。
設所研究的多智能體系統(tǒng)含有n個智能體,用F={1,2,…,m}和R={m+1,m+2,…,n}分別表示跟隨智能體和領導智能體的集合。系統(tǒng)中跟隨智能體的動力力學模型為:
(1)
其中:k=0,1,2,…,xi(k)∈RN是跟隨智能體i在時刻k的狀態(tài);aij(k)是k時刻邊(j,i)的權值。假設領導智能體的位置保持不變,即相應的動力學模型為
(2)
其中xi(k)∈RN是領導智能體i在時刻k的狀態(tài)。為研究方便,設N=1,利用Kronecker積,后面的結論容易推廣到高維情形。
定義1 如果
(3)
其中D(k)=[dij(k)]∈Rn×n。
假設系統(tǒng)中每個智能體都能獲取自身的狀態(tài)信息,即aii(k)>0。矩陣D(k)可寫成分塊矩陣的形式
其中D1(k)∈Rm×m,D2(k)∈Rm×(n-m)。令
其中α(k)=D2(k)e。
為了得到主要結論,需要下面的幾個結論:
引理3[9]設m≥2是一個正整數,P1,P2,…,Pm是n階的非負矩陣,且對角線元素均大于0,則
其中γ的值由矩陣P1,P2,…,Pm來確定。
引理4[8]設A=[aij]∈Rn×n是一個隨機矩陣,且對角線元素全大于0。如果Γ(A)包含生成樹,則矩陣A為SIA矩陣。
首先考慮通信拓撲固定不變的情形,此時式(3)變?yōu)?/p>
x(k+1)=Dx(k)
定理1 設系統(tǒng)的通信拓撲G包含聯合生成樹,則系統(tǒng)解決包含控制問題,且
(4)
其中
由于
故
由x(k)=Dkx(0)易得式(4)。
由于(I-D1)-1D2e=e和(I-D1)-1非負,因此由式(4)可得
即系統(tǒng)解決包含控制問題。
注1 從定理1可以看到:對于固定拓撲的情形,跟隨智能體的狀態(tài)最終趨于由領導智能體的狀態(tài)所生成的凸包內,而且各個跟隨智能體的狀態(tài)將趨于一個固定值。
接下來考慮切換拓撲的情形,可得以下結論:
證明 該證明的部分思想源于文獻[8],這里考慮的是具有多個領導智能體的包含控制問題。
注2 從定理2的證明可以看出:當系統(tǒng)的通信拓撲是切換拓撲時,雖然跟隨智能體的狀態(tài)最終趨于領導智能體生成的凸包內,但各跟隨智能體的狀態(tài)將隨時間不斷變化。
在二維空間中考慮包含控制,設多智能體系統(tǒng)含有5個跟隨智能體(用頂點1~5表示)和3個領導智能體(用頂點6~8表示),系統(tǒng)所有可能的通信拓撲為G1、G2、G3,如圖1所示,并按照順序依次變化。假設圖中所有邊的權值均為1。領導智能體的位置和跟隨智能體的初始位置隨機取定。跟隨智能體的位置隨時間的變化軌跡如圖2所示。從圖2可以看出:跟隨智能體的狀態(tài)最終趨于領導智能體所構成的凸包內(紅色三角形區(qū)域為領導智能體的位置所構成的凸包)。
圖1 系統(tǒng)的通信拓撲
圖2 跟隨智能體的狀態(tài)軌跡
利用矩陣理論和代數圖論的方法研究了具有切換網絡拓撲的離散時間多智能體系統(tǒng)的包含控制。對于固定網絡拓撲,當系統(tǒng)的通信拓撲包含聯合生成樹時,所給的協議解決包含控制問題,而且系統(tǒng)中所有跟隨智能體的狀態(tài)各自趨于一個固定的值。對于切換網絡拓撲,當系統(tǒng)的通信拓撲包含聯合生成樹時,所給的協議解決包含控制問題,此時各跟隨智能體的狀態(tài)將隨時間不斷變化,可能不會趨于一個固定值。本研究成果極大地減弱了包含控制中對系統(tǒng)通信拓撲的限制,進一步豐富了包含控制的理論。
[1] JI M,FERRARI-TRECATE G,EGERSTEDT M,et al.Containment control in mobile networks[J].IEEE Transaction on Automatic Control,2008,53(8):1972-1975.
[2] CAO Y,REN W.Containment control with multiple stationary or dynamic leaders under a directed interaction graph[C]//IEEE Conf.Decision Control,Shanghai,IEEE,2009:3014-3019.
[3] WEN G,DUAN Z,ZHAO Y,et al.Robust containment tracking of uncertain linear multiagent systems:a non-smooth control approach[J].International Journal of Control,2014,87(12):2522-2534.
[4] LI Z,REN W,LIU X.Distributed containment control of multi-agent systems with general linear dynamics in the presence of multiple leaders[J].International Journal of Robust and Nonlinear Control,2013,23:534-547.
[5] LIU S,XIE L,ZHANG H.Mean square containment control of multi-agent systems with transmission noises[J].Acta Automatica Sinica,2013,39(11):1787-1794.
[6] KAN Z,SHEA J M,DIXON W E.Leader-follower containment control over directed random graphs[J].Automatica,2016,66:56-62.
[7] LIU K,JI Z,XIE G,et al.Event-based broadcasting containment control for multi-agent systems under directed topology[J].International Journal of Control,2016,89(11):2360-2370.
[8] REN W,BEARD R W.Consensus seeking in multiagent systems under dynamically changing interaction topologies[J].IEEE Transactions on Automatic Control,2005,50(5):655-661.
[9] JADBABAIE A,LIN J,MORSE A S.Coordination of groups of mobile autonomous agentsusing nearest neighbor rules[J].IEEE Transactions on Automatic Control,2003,48(6):988-1001.
[10]WOLFOWITZ J.Products of indecomposable,aperiodic,stochastic matrices[J].The American Mathematical Society,1963,15(5):733-737.
(責任編輯 陳 艷)
Containment Control of Discrete-Time Multi-Agent Systems with Switching Topologies
TANG Zhao-jun
(College of Science, Chongqing University of Technology, Chongqing 400054, China)
Containment control of discrete-time multi-agent systems with multiple leaders is investigated. Firstly, a distributed control protocol is proposed for the follower-agents in the system. Secondly, conditions on the topology are derived under both fixed topology and switching topologies by employing theory of nonnegative matrix and algebraic graph. Finally, numerical simulations are provided to illustrate the effectiveness of the theoretical results.
multi-agent system; containment control; switching topology; discrete-time system;distributed control
2017-01-18 基金項目:重慶市教委科學技術研究項目(KJ1600915);重慶市基礎與前沿研究計劃項目(cstc2016jcyjA0396)
唐朝君(1979—),男,河南鄭州人,博士,講師,主要從事多智能體系統(tǒng)協調控制研究,E-mail:zhaojuntang@163.com。
唐朝君.切換拓撲下離散時間多智能體系統(tǒng)的包含控制[J].重慶理工大學學報(自然科學),2017(5):143-147.
format:TANG Zhao-jun.Containment Control of Discrete-Time Multi-Agent Systems with Switching Topologies[J].Journal of Chongqing University of Technology(Natural Science),2017(5):143-147.
10.3969/j.issn.1674-8425(z).2017.05.024
TP18;O231
A
1674-8425(2017)05-0143-05