張 毅,于 浩,楊秀霞,姜子劼
(海軍航空大學(xué),山東 煙臺(tái) 264001)
隨著通信技術(shù)和計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的發(fā)展,多智能體系統(tǒng)在無人系統(tǒng)協(xié)同控制、電力、交通等領(lǐng)域得到了廣泛應(yīng)用[1-3]。多智能體系統(tǒng)最顯著的特征就是能夠?qū)崿F(xiàn)基于分布式通信網(wǎng)絡(luò)的協(xié)同控制,避免了集中式控制存在的可靠低、魯棒性差的問題。
一致性問題作為研究多智能體系統(tǒng)的一個(gè)重要問題,受到國內(nèi)外許多學(xué)者的廣泛關(guān)注,并取得了豐碩的研究成果。文獻(xiàn)[4]通過設(shè)計(jì)一致性控制策略實(shí)現(xiàn)了多智能體系統(tǒng)在預(yù)定的時(shí)間收斂。文獻(xiàn)[5]研究了多智能體系統(tǒng)的方向一致性問題,提出了系統(tǒng)達(dá)到一致的條件,Ren[6]等研究了拓?fù)淝袚Q下多智能體系統(tǒng)的一致性問題。文獻(xiàn)[7]研究了均等通信時(shí)滯下多智能體系統(tǒng)的控制問題,給出了時(shí)滯系統(tǒng)的穩(wěn)定性條件。文獻(xiàn)[8]基于一致性理論,設(shè)計(jì)分布式控制律對有向切換拓?fù)渫ㄐ艞l件下的多智能體系統(tǒng)進(jìn)行了研究。
近年來,基于競爭-合作思想的分組一致性控制成為多智能體系統(tǒng)的研究熱點(diǎn)。在實(shí)際應(yīng)用中,復(fù)雜的多智能體系統(tǒng)往往由多個(gè)子網(wǎng)絡(luò)構(gòu)成,子網(wǎng)絡(luò)內(nèi)智能體是合作關(guān)系,而不同子網(wǎng)絡(luò)間是競爭關(guān)系,各個(gè)子網(wǎng)絡(luò)因任務(wù)的不同需收斂到各自的狀態(tài)值,而同個(gè)子網(wǎng)絡(luò)中的智能體具有相同的任務(wù)需收斂到相同的狀態(tài)值。Altafini[9]等通過將通信邊的權(quán)值設(shè)為負(fù)值來描述不同子網(wǎng)絡(luò)中智能體間的競爭關(guān)系。文獻(xiàn)[10]基于競爭原則和競爭-合作原則分別設(shè)計(jì)了多智能體系統(tǒng)的分組一致性控制協(xié)議,但未考慮時(shí)滯對系統(tǒng)的影響。文獻(xiàn)[11]針對無拓?fù)浣Y(jié)構(gòu)的分組一致性問題,設(shè)計(jì)了有無時(shí)滯兩種情況下的控制協(xié)議,但其采用的模型為一階系統(tǒng),實(shí)際的應(yīng)用范圍較小。文獻(xiàn)[12]在文獻(xiàn)[11]的基礎(chǔ)上將模型推廣為二階系統(tǒng),但僅考慮了在固定時(shí)滯情況下控制律的設(shè)計(jì)。
上述文獻(xiàn)針對分組一致性的研究都是基于無向通信拓?fù)溥M(jìn)行的,而對于有向通信拓?fù)湎驴刂坡傻脑O(shè)計(jì)卻鮮有研究;另外,上述文獻(xiàn)僅研究了固定時(shí)滯的情形,即某一確定大小的時(shí)滯在系統(tǒng)中一定會(huì)發(fā)生的情況,而實(shí)際應(yīng)用中,通信時(shí)滯可能是以某一概率隨機(jī)出現(xiàn)的,所以含確定性時(shí)滯的控制律應(yīng)用于實(shí)際系統(tǒng)具有一定的局限性。
本文在一致性控制和時(shí)滯系統(tǒng)理論的研究成果上,重點(diǎn)解決了隨機(jī)時(shí)滯情況下多智能體系統(tǒng)的分組一致性控制問題。相比于已有的研究成果,本文通過將時(shí)滯信息與當(dāng)前信息相結(jié)合,基于競爭原則進(jìn)行分組一致性控制算法的設(shè)計(jì),研究不同時(shí)滯情況對多智能體系統(tǒng)收斂性能的影響,解決了有向連通二部圖的通信拓?fù)浣Y(jié)構(gòu)下具有隨機(jī)時(shí)滯的多智能體系統(tǒng)控制問題,并通過構(gòu)造Lyapunov-krasovskii函數(shù)給出了系統(tǒng)達(dá)到分組一致性的條件。
在多智能體系統(tǒng)中,可用通信拓?fù)鋪肀硎局悄荏w間的信息交換。設(shè)系統(tǒng)中包含n個(gè)智能體,其通信拓?fù)溆肎=(V,E,A)表示,其中V={v1,v2,…,vn}表示n個(gè)節(jié)點(diǎn),即n個(gè)智能體組成的集合,vi表示第i個(gè)智能體。E={e1,e2,…,en}?V×V,表示拓?fù)鋱D的邊集,即智能體之間的通信鏈路集,其任一元素eij=(vi,vj)∈E表示第i個(gè)智能體能接收到第j個(gè)智能體的信息,邊集權(quán)值矩陣為A=[aij],其中aij≠0(i≠j),aij=0(i=j),Ni={vj∈V|(vi,vj)∈E}表示第i個(gè)智能體鄰居的集合。定義圖G的入度矩陣為
D=diag{di,i=1,2,…n}
定義1(二部圖[13]):設(shè)G=(V,E)表示系統(tǒng)的通信拓?fù)?如果節(jié)點(diǎn)的集合V可分為兩個(gè)互不互不相交的子集(G1,G2),使各個(gè)邊(vi,vj)所連接的兩個(gè)節(jié)點(diǎn)vi和vj分別屬于這兩個(gè)不同的節(jié)點(diǎn)集(vi∈G1,vj∈G2),則稱圖為G二部圖,如圖1所示。
圖1 含有5個(gè)節(jié)點(diǎn)的有向二部圖
引理1[14]Moon不等式:設(shè)C∈Rn×n是任意的正定矩陣,對于任意的向量x,y∈Rn滿足以下不等式
-2xTy≤xTC-1x+yTCy
(1)
考慮具有n個(gè)節(jié)點(diǎn)的二階多智能體系統(tǒng)
(2)
其中,I={1,2,…,n},xi(t)、vi(t)、ui(t)分別為第i個(gè)智能體在t時(shí)刻的位置、速度以及控制輸入。
本文的控制目標(biāo)是研究系統(tǒng)(2)在隨機(jī)時(shí)滯的情況下實(shí)現(xiàn)分組一致,通過設(shè)計(jì)控制律使得同一子網(wǎng)絡(luò)中智能體的狀態(tài)趨于一致。受文獻(xiàn)[10]啟發(fā),本文用(xi(t)+xj(t))、(vi(t)+vj(t))表示智能體i和智能體j之間存在競爭關(guān)系,并考慮時(shí)滯產(chǎn)生的隨機(jī)性,得到基于競爭原則的分組一致性控制律
(3)
其中,τ為時(shí)滯參數(shù),γ>0,表示位置狀態(tài)和速度狀態(tài)的權(quán)重系數(shù),ε(t)為隨機(jī)變量,表示智能體發(fā)生時(shí)滯的隨機(jī)性,0≤ε(t)≤1。
當(dāng)ε(t)=0時(shí),表示在t時(shí)刻第i個(gè)智能體能夠接收到第j個(gè)智能體傳輸?shù)漠?dāng)前信息,此時(shí)控制律為:
即為不含時(shí)滯時(shí)分組一致性控制律的形式。
當(dāng)ε(t)=1時(shí),表示智能體間無法完成當(dāng)前狀態(tài)信息的傳輸,此時(shí)控制律為
vi(t-τ)+vj(t-τ))]
即為純時(shí)滯情況下分組一致性控制律的形式。
需要說明的是,多智能體系統(tǒng)的時(shí)滯取決于通信狀況,當(dāng)智能體間的通信數(shù)據(jù)量較小、通信質(zhì)量高時(shí),時(shí)滯量很小趨近于0;而當(dāng)通信壓力較大、通信質(zhì)量較差時(shí),時(shí)滯則會(huì)影響系統(tǒng)的穩(wěn)定性,因此研究智能體間的通信時(shí)滯,需考慮時(shí)滯產(chǎn)生的隨機(jī)性。為此,在上述控制律的設(shè)計(jì)中,本文用服從二項(xiàng)分布的隨機(jī)變量ε(t)來描述t時(shí)刻通信時(shí)滯的隨機(jī)性,更加具有實(shí)際的應(yīng)用價(jià)值。
假設(shè)ε(t)服從參數(shù)為p∈(0,1)的二項(xiàng)分布,可得E[ε(t)]=E[(ε2(t)]=p。
將控制律帶入系統(tǒng)模型(1)中,得到
(4)
(5)
定理:假設(shè)多智能體系統(tǒng)有n個(gè)智能體組成,系統(tǒng)時(shí)滯參數(shù)為τ,那么對于方程(5),若存在正定對稱矩陣P,Q,R>0滿足
(6)
則控制律(3)能夠使系統(tǒng)(2)在基于連通二部圖的通訊拓?fù)湎逻_(dá)到分組一致。
證明:構(gòu)造具有如下形式的Lyapunov-krasovskii函數(shù)。
(7)
令
教師可以利用超星學(xué)習(xí)通和超星泛雅網(wǎng)絡(luò)教學(xué)平臺(tái)的統(tǒng)計(jì)功能,及時(shí)了解學(xué)生的學(xué)習(xí)動(dòng)態(tài)和課程內(nèi)容的瀏覽利用情況,在此基礎(chǔ)上進(jìn)行客觀公正的學(xué)生評價(jià),同時(shí)對教學(xué)過程和教學(xué)效果進(jìn)行有益的反思,以利于今后課程的教學(xué)設(shè)計(jì)和教學(xué)改進(jìn)工作。
(8)
對(8)式求導(dǎo)可得
=2(1-ε(t))φT(t)PMφ(t)
+2ε(t)φT(t)PNφ(t-τ)
+ε(t)φT(t-τ)NT]R[(1-ε(t))Mφ(t)
+ε(t)Nφ(t-τ)]
+τε2(t)φT(t)MTRMφ(t)
+τε(t)(1-ε(t))φT(t)MTRNφ(t-τ)
+τε(t)(1-ε(t))φT(t-τ)NTRMφ(t)
+τε2(t)φT(t-τ)NTRNφ(t-τ)
2ε(t)φT(t)PNφ(t-τ)
≤2ε(t)φT(t)PNφ(t)+τε(t)φT(t)PNR-1NTPTφ(t)
(9)
進(jìn)而可得
(10)
其中K=2(1-ε(t))PM+2ε(t)PN
+τε(t)PNR-1NTPT+Q+τ(1-ε(t))2MTRM
系統(tǒng)中含有的隨機(jī)變量ε(t)可由期望來代替,即E[ε(t)]=p。
為方便后續(xù)簡化,令
進(jìn)而可得
對式(10)取數(shù)學(xué)期望得
(11)
其中W=2Pη+2pPN+τpPNR-1NTPT+Q+τηTRη。
(12)
因式(12)含非線性項(xiàng),為將其轉(zhuǎn)化為線性矩陣不等式,利用引理2,將W化為如下形式:
(13)
其中,Ψ=2Pη+2pPN+Q+τηTRη。
得到一致性判據(jù)
所以當(dāng)滿足上述定理時(shí),具有隨機(jī)時(shí)滯的多智能體系統(tǒng)的位置和速度狀態(tài)可達(dá)成一致。
為驗(yàn)證控制律設(shè)計(jì)的正確性和有效性,令n=4,即4個(gè)智能體對本文設(shè)計(jì)的控制算法進(jìn)行驗(yàn)證,多智能體系統(tǒng)的通信拓?fù)淙鐖D2所示,易知,節(jié)點(diǎn)v1、v2以及節(jié)點(diǎn)v3、v4分別屬于不同的子網(wǎng)絡(luò)G1、G2。若控制律(3)成立,則兩個(gè)子網(wǎng)絡(luò)中的智能體將分別收斂到同一狀態(tài)。
圖2 多智能體系統(tǒng)通信拓?fù)?/p>
設(shè)各連接邊權(quán)重為1,未連接邊的權(quán)重為0,位置速度權(quán)重系數(shù)γ=1.5。設(shè)系統(tǒng)的初始狀態(tài)為:x1(0)=-6,x2(0)=5,x3(0)=-1,x4(0)=3;v1(0)=-2,v2(0)=5,v3(0)=-5,v4(0)=0。
為研究時(shí)滯以不同概率發(fā)生時(shí)對系統(tǒng)一致性的影響,設(shè)時(shí)滯時(shí)間τ=0.3s,分別取隨機(jī)概率為0.2、0.6,得到如下仿真結(jié)果:
1)時(shí)滯τ=0.3s
從圖3中可以得知,在設(shè)計(jì)的控制律作用下,隨著仿真時(shí)間的增加,4個(gè)智能體的位置和速度狀態(tài)能夠?qū)崿F(xiàn)隨機(jī)時(shí)滯下的分組一致。
圖3 隨機(jī)概率為0.2時(shí)系統(tǒng)的狀態(tài)響應(yīng)
圖4 隨機(jī)概率為0.6時(shí)系統(tǒng)的狀態(tài)響應(yīng)
圖6 隨機(jī)概率為0.6時(shí)系統(tǒng)的狀態(tài)響應(yīng)
對比上述兩種情況下的仿真結(jié)果可以看出,當(dāng)多智能體系統(tǒng)存在的時(shí)滯時(shí)間一定時(shí),隨著產(chǎn)生時(shí)滯概率的增大,系統(tǒng)的位置和速度兩個(gè)狀態(tài)信息的波動(dòng)變大,系統(tǒng)達(dá)到一致的速度明顯變慢。
時(shí)滯τ=0.5s
對比(1)、(2)兩種情況下的仿真結(jié)果可知,當(dāng)系統(tǒng)中時(shí)滯產(chǎn)生的概率相同時(shí),隨著時(shí)滯時(shí)間的增加,4個(gè)智能體達(dá)到一致的時(shí)間明顯變長。
本文基于有向二部圖的通信拓?fù)浣Y(jié)構(gòu),研究了多智能體系統(tǒng)在隨機(jī)時(shí)滯作用下實(shí)現(xiàn)分組一致的問題??紤]時(shí)滯產(chǎn)生的隨機(jī)性,設(shè)計(jì)了含當(dāng)前/時(shí)滯符合狀態(tài)信息的分組一致性控制律,使得對問題的研究更加符合應(yīng)用實(shí)際;利用Lyapunov穩(wěn)定性理論,得到了在該控制律下多智能體系統(tǒng)實(shí)現(xiàn)分組一致性的充要條件。仿真結(jié)果驗(yàn)證了本文控制律設(shè)計(jì)的正確性和有效性。