朱 偉,王治健,曹文吉
(重慶郵電大學(xué) 復(fù)雜系統(tǒng)智能分析與決策重慶市高校重點(diǎn)實(shí)驗(yàn)室,重慶 400065)
多智能體系統(tǒng)作為群體智能領(lǐng)域的一類典型系統(tǒng),近10余年來受到了廣大科研工作者的高度重視,其協(xié)同控制在包括航空航天在內(nèi)的眾多領(lǐng)域中展現(xiàn)出了強(qiáng)大的應(yīng)用潛力。柴院士[1]指出:多智能體協(xié)同控制系統(tǒng)是實(shí)現(xiàn)運(yùn)載工具未來需求的自動(dòng)化系統(tǒng)愿景功能的三大系統(tǒng)之一。
編隊(duì)控制是多智能體系統(tǒng)協(xié)同控制的熱點(diǎn)研究問題之一,其通過智能體之間形成的網(wǎng)絡(luò)進(jìn)行局部信息傳輸,調(diào)整智能體之間的相對(duì)位置,使智能體系統(tǒng)形成與保持特定的編隊(duì)隊(duì)形。近年來,學(xué)者們針對(duì)不同類型的多智能體系統(tǒng)開展編隊(duì)控制問題的研究,如一階系統(tǒng)[2],二階系統(tǒng)[3],一般線性系統(tǒng)[4-5]以及哈密頓系統(tǒng)[6]等。
最近,林志贇教授團(tuán)隊(duì)將復(fù)Laplacian引入到多智能體系統(tǒng)編隊(duì)控制研究中[7-9],基于相對(duì)位置信息,得出連續(xù)線性分布式控制策略,證明了穩(wěn)定增益矩陣的存在性,得出了編隊(duì)形成的幾何條件,即圖是雙根的,從而實(shí)現(xiàn)了多智能體系統(tǒng)的完全分布式編隊(duì)控制。然而,留意到關(guān)于多智能體系統(tǒng)編隊(duì)控制的大部分研究成果中,控制器需要使用鄰居的連續(xù)信息,導(dǎo)致編隊(duì)的實(shí)現(xiàn)需要消耗大量的通信資源、在線計(jì)算信息等,對(duì)編隊(duì)的實(shí)際應(yīng)用具有巨大的挑戰(zhàn)性?;谑录|發(fā)的通信機(jī)制提供了一種能有效節(jié)約多智能體系統(tǒng)資源的新方法,由于其在減少信息交換方面的潛在優(yōu)勢(shì),受到了廣泛關(guān)注。文獻(xiàn)[10]研究了基于實(shí)Laplacian的二階多智能體系統(tǒng)環(huán)形編隊(duì)的問題,證明了在集中式和分散式的事件觸發(fā)控制協(xié)議下,二階多智能體系統(tǒng)能形成環(huán)形編隊(duì)。文獻(xiàn)[11]研究了基于事件觸發(fā)機(jī)制的環(huán)形編隊(duì)問題,假設(shè)所有智能體均在同一圓環(huán)上移動(dòng),每個(gè)智能體僅能獲取自身與其前后2個(gè)相鄰智能體的相對(duì)位置信息。文獻(xiàn)[10-11]的研究局限在環(huán)形編隊(duì)。文獻(xiàn)[12]研究了連續(xù)和離散系統(tǒng)在事件觸發(fā)控制下基于復(fù)矩陣的編隊(duì)問題,在滿足圖論的條件下,系統(tǒng)能形成具有3個(gè)自由度——平移、旋轉(zhuǎn)、收縮的相似編隊(duì)且不存在Zeno現(xiàn)象。文獻(xiàn)[13]研究了存在輸入時(shí)延的連續(xù)多智能體系統(tǒng)在事件觸發(fā)控制下基于復(fù)矩陣的編隊(duì)問題,給出系統(tǒng)能形成相似編隊(duì)的充分條件,且排除了Zeno現(xiàn)象。
本文將針對(duì)一類由復(fù)差分方程描述的多智能體系統(tǒng)的編隊(duì)問題開展研究。利用智能體的狀態(tài)信息及指數(shù)衰減函數(shù)構(gòu)造了事件觸發(fā)函數(shù),進(jìn)而根據(jù)事件觸發(fā)條件確定事件觸發(fā)序列,并在考慮智能體控制器存在輸入時(shí)延的情況下,設(shè)計(jì)了一類基于事件觸發(fā)機(jī)制的控制器,從而獲得了多智能體系統(tǒng)形成任意給定編隊(duì)的充分條件,并給出了輸入時(shí)延的存在范圍。進(jìn)一步,排除了事件觸發(fā)序列在離散意義下可能存在的Zeno現(xiàn)象。最后通過數(shù)值仿真例子驗(yàn)證了本文理論結(jié)果的有效性。
為了刻畫智能體之間的連接關(guān)系,引入如下的圖論知識(shí)。
無向圖G=(ν,ε,A) 表示智能體之間的通信拓?fù)鋱D,其中,ν={v1,…,vn}為頂點(diǎn)集合;ε?ν×ν為邊集;A=(aij)n×n為鄰接矩陣,aii=0,aij=aji>0 如果(i,j)∈ε,否則aij=0。Ni表示智能體i的集合,即Ni={j:(i,j)∈ε)}。
復(fù)LaplacianL的元素L(i,j)由(1)式確定
(1)
(1)式中,ωij滿足
(2)
(2)式中,ξ=[ξ1,ξ2,…,ξn]T∈n,ξi≠ξj當(dāng)i≠j, 為任意編隊(duì)。
定義1[8]如果ker(L)=c11n+c2ξ,則稱由Lξ=0指定的框架圖(G,ξ)是相似的,其中,c1,c2∈。
定義2[8]對(duì)頂點(diǎn)v及非孤立點(diǎn)集u?G,若去掉任意不同于v的頂點(diǎn)后,還存在一條u中的頂點(diǎn)到頂點(diǎn)v的路,則稱頂點(diǎn)v是2可達(dá)的。
定義3[8]如果無向圖G中存在2個(gè)頂點(diǎn),使得其他頂點(diǎn)到這2個(gè)頂點(diǎn)都是2可達(dá)的,則稱無向圖G是雙根的,這2個(gè)頂點(diǎn)稱為圖G對(duì)應(yīng)的根。
考慮復(fù)平面中的n個(gè)智能體,其動(dòng)力學(xué)方程為
zi(t+h)=zi(t)+hui(t),i=1,2,…,n
(3)
(3)式中,zi∈與ui(t)∈分別表示第i個(gè)智能體的狀態(tài)與控制輸入。本文在假設(shè)系統(tǒng)狀態(tài)可測(cè)的基礎(chǔ)上研究控制器存在輸入時(shí)延時(shí),系統(tǒng)(1)的基于事件觸發(fā)機(jī)制的任意隊(duì)形編隊(duì)問題,為此控制器設(shè)計(jì)如下
(4)
(5)
ei(t-τ)-ej(t-τ))
(6)
令Q為(n-2)×n的行正交矩陣,即QQT=In-2,且Q1n=0,Qξ=0。由文獻(xiàn)[9]知,多智能體系統(tǒng)(3)能形成目標(biāo)編隊(duì)ξ等價(jià)于y:=Qz→0,z=[z1,z2,…,zn]T。
注意到In-QTQ為向量1n與ξ生成空間上的正交投影矩陣,且1n與ξ在L的零空間中,所以L(I-QTQ)=0 ,即L=LQTQ。
故,由(3)式和(6)式得
y(t+h)=y(t)-hρQΓLQTy(t-τ)-
hρQΓLe(t-τ)
(7)
(7)式中:y(t)=[y1(t),…,yn(t)]T,Γ=diag{γ1,…,γn};e(t)=[e1(t),…,en(t)]T,
定義4如果對(duì)任意初始值z(mì)i(0),都存在正常數(shù)χ>0與0<ζ<1,使得
‖Qz(t)‖=‖y(t)‖≤χζt,t≥0
(8)
則稱多智能體系統(tǒng)(3)能全局指數(shù)收斂到任意隊(duì)形ξ的相似編隊(duì)。
引理1[9]給定雙根圖G及隊(duì)形ξ,對(duì)滿足條件Lξ=0的LaplacianL,存在矩陣Γ使得ΓL除2個(gè)0以外的特征值可以分布在復(fù)平面任意位置。
引理2[12]矩陣QΓLQT與矩陣ΓL具有相同的非零特征值。
引理4若σ(In-2-hρQΓLQT)<1,則存在正常數(shù)ψ>0與ζ∈(0,1)使得
‖In-2-hρQΓLQT‖p≤ψζp,
p=0,1,2,…
(9)
證由方程(7),通過簡(jiǎn)單迭代可知
y(t)=(In-2-hρQΓLQT)py(0)-y(sh))-
p-s-1hρQΓLe(sh-τ)
(10)
進(jìn)而由引理4有
(11)
由事件觸發(fā)條件知
(12)
下面將證明對(duì)任意N>1有
‖y(t)‖ (13) 若(13)不成立,則必然存在t*=p*h>0 使得 ‖y(t*)‖≥NZηt* (14) 且 ‖y(t)‖ (15) 所以,由(11)—(15)式得 NZηt*≤y(t*)≤ ψζp*‖y(0)‖+hρ‖QΓLQT‖ ψζp*‖y(0)‖+ Nψζp*‖y(0)‖+ (16) 情形1Z=Z1 此時(shí)有ψ‖y(0)‖-Z1≤0,則 情形2Z=ψ‖y(0)‖ 此時(shí)有ψ‖y(0)‖≥Z1,則 NZηt* NZηt*矛盾。 以上2種情形矛盾顯示,(3)式對(duì)任意N>1均成立,令N→1即可得 ‖y(t)‖≤Zηt,t≥0 (17) 因此,z(t)全局指數(shù)收斂到c11n+c2ξ,即多智能體系統(tǒng)(3)能全局指數(shù)收斂到任意隊(duì)形ξ的相似編隊(duì)。 因?yàn)閦(t)全局指數(shù)收斂到c11n+c2ξ,所以存在正常數(shù)T>0使得 ‖zi(t)-(c1+c2ξi)‖≤Zηt,t>T (18) ‖zi(t)-(c1+c2ξi)‖≤ (19) 由事件觸發(fā)時(shí)間的確定知,只有當(dāng)fi(t)≥0 時(shí)事件才會(huì)被觸發(fā),即 (20) 因此,由(19)式和(20)式可得 即 (21) 本部分將利用包含6個(gè)智能體的多智能體系統(tǒng)進(jìn)行數(shù)值仿真,驗(yàn)證本文所得理論結(jié)果的有效性。假設(shè) ξ=[-1+ι,-2+2ι,-2-2ι, 2-2ι,2+2ι,1+ι]T, 智能體之間的通信拓?fù)淙鐖D1。 圖1 通信拓?fù)鋱DFig.1 Communication graph 并假設(shè)智能體之間有連接,則權(quán)重為1,否則為零。顯然節(jié)點(diǎn)1與2為此圖的2個(gè)根。由ξ可知,Laplacian矩陣可以選擇如下 (22) 滿足rank(L)=n-2,Lξ=0。 簡(jiǎn)單計(jì)算可知,Laplacian矩陣L的特征值為 λ1=-5.9767-0.9778ι;λ2=-1.8096+0.5166ι;λ3=-1.8425-2.3150ι;λ4=-0.3713-2.2239ι;λ5=0,λ6=0。令Γ=diag{-1,-1,-1,-1,-1,-1}, (23) 則QΓLQT的特征值為λ1=5.976 7+0.977 8ι,λ2=1.809 6-0.516 6ι,λ3=0.371 3+2.223 9ι,λ4=1.842 5+2.315 0ι。因此,根據(jù)定理1,可以選擇α,γ,β1,β2,τ使得多智能體系統(tǒng)隊(duì)形ξ的相似編隊(duì)。 令z(0)={1+ι,2-ι,3+1ι,4-1ι,5+ι,2-ι}T,h=0.000 1,ψ=1,η=0.36,ζ=0.35,δ1=0.01,δ2=2.2,ρ=1,α=0.37,β1=0.01,β2=2.2,γ=0.35,τ=0.000 1。仿真結(jié)果如圖2,圖3,可見相似編隊(duì)達(dá)到且事件觸發(fā)時(shí)間序列不存在Zeno現(xiàn)象。 圖3 事件觸發(fā)時(shí)間序列Fig.3 Event-triggered timesequences 針對(duì)存在輸入時(shí)延情況下的多智能體系統(tǒng)編隊(duì)問題,本文利用圖論、矩陣?yán)碚摵头€(wěn)定性理論研究了事件驅(qū)動(dòng)控制下一類由復(fù)差分方程描述的多智能體系統(tǒng)的編隊(duì)問題,設(shè)計(jì)了含輸入時(shí)延的事件驅(qū)動(dòng)控制器,其驅(qū)動(dòng)時(shí)間序列由構(gòu)造的事件觸發(fā)函數(shù)確定。利用事件觸發(fā)控制器,很大程度的減少了控制器的更新次數(shù),并得到了系統(tǒng)形成任意給定編隊(duì)的充分條件也排除了離散意義下的Zeno現(xiàn)象。數(shù)值仿真結(jié)果驗(yàn)證了理論的有效性。3 數(shù)值仿真
4 結(jié) 論