茆漢國,張建德
南京工程學院 計算機工程學院,南京211167
隨著人工智能技術的火熱發(fā)展,多智能體系統(tǒng)的一致性問題受到了國內外學者們的廣泛關注[1],并且在機器人編隊控制、無人機協(xié)同控制、蟲類蜂擁、蜂群計算等領域有著廣泛的應用[2-5]。
在過去的幾十年中,學者們對一致性問題的研究取得了許多成果。其中,Vicsek等[6]就一群自驅粒子的相變問題提出了著名的Vicsek模型。之后,Jadbabaie等[7]運用圖論的方法就Vicsek模型的一致性行為給出了理論解釋。在Vicsek模型基礎之上,Cucker和Smale[8]又介紹并分析了一個含有N個粒子系統(tǒng)的蜂擁模型,簡稱C-S模型。Sun等[9-10]進一步探討了C-S模型中存在通訊時滯和隨機噪聲擾動的蜂擁問題。除了線性系統(tǒng)之外,文獻[11]研究了基于事件觸發(fā)的隨機非確定線性多智能體系統(tǒng)的指數(shù)同步問題。最近,文獻[12]討論了事件觸發(fā)機制下的多智能體領導跟隨一致性。
總體來說,在這些系統(tǒng)中[2-12]實現(xiàn)一致(或蜂擁)都是漸進穩(wěn)定的,也就是收斂時間是趨于無窮大的。但是在實際運用中往往需要多智能體系統(tǒng)在有限時間內實現(xiàn)一致,比如要實現(xiàn)較高的控制精度。此外,有限時間一致性具有較高的抗干擾性和魯棒性。Wang等[13]較早地分析了動態(tài)多智能體網(wǎng)絡的有限時間一致性問題。Sun等[14-16]繼續(xù)討論了在噪聲環(huán)境下的有限時間一致性和蜂擁問題。同時,這些工作[13-16]都對實現(xiàn)一致性(或蜂擁)時間的上界進行了估計。
此外,一個隨之而來的問題是,對有限時間上界的估計高度依賴系統(tǒng)的初始狀態(tài),也就是不同的初始條件可能產(chǎn)生不同的時間估計。在實際多智能體系統(tǒng)中,由于一些不確定性因素的影響,人們無法預先知道系統(tǒng)模型的初始狀態(tài),這就對以往有限時間一致性問題又提出了挑戰(zhàn)。為了克服這個困難,Polyakov[17]突破性地介紹了一種新型非線性回饋控制技術,實現(xiàn)了閉環(huán)系統(tǒng)的固定時間穩(wěn)定性,其最終實現(xiàn)穩(wěn)定的有限時間上界估計與系統(tǒng)的初始狀態(tài)無關。最近,Chen等[18]討論了多智能體系統(tǒng)中的固定時間凸優(yōu)化問題。Tian等[19]分析了二階多智能體系統(tǒng)中含有引導者-追隨者的固定時間一致性問題。文獻[20]對多智能體系統(tǒng)固定時間協(xié)同控制進行了概述。
無論是有限時間一致性(或蜂擁)問題,還是多智能體系統(tǒng)中的固定時間一致性問題,其控制協(xié)議中大多含有一個符號函數(shù)sign(?)。由于符號函數(shù)在0點處具有非連續(xù)性,在實際控制作用中當誤差趨于0的時候勢必產(chǎn)生震顫現(xiàn)象。如果震顫頻率過高,則會對系統(tǒng)本身造成一定程度的傷害。為了解決這一問題,本文設計了一個光滑連續(xù)的一致性協(xié)議,從而有效地避免了震顫現(xiàn)象的發(fā)生。具體地,本文旨在探索非震顫固定時間多智能體網(wǎng)絡的一致性問題,創(chuàng)新性如下:
(1)實現(xiàn)了多智能體網(wǎng)絡的固定時間一致性,同時對實現(xiàn)一致的時間上界進行了估計,其不再依賴于系統(tǒng)的初始狀態(tài)條件。
(2)設計了新穎的一致性控制策略,解決了傳統(tǒng)有限時間和固定時間一致性協(xié)議中存在震顫的問題,提高了系統(tǒng)的性能。
(3)通過運用Lyapunov穩(wěn)定性理論,得到了實現(xiàn)固定時間一致性的充分條件,且通過數(shù)值仿真驗證了理論分析的有效性和可行性。
形式上,用一個圖G=(V,E)來表示N個智能體所構成的網(wǎng)絡。V={v1,v2,…,vN}為N個智能體構成的點集。E?V×V為圖G的邊集。圖G中的無向邊記為aij=aji=(vi,vj)=(vj,vi)∈E。如果智能體j與智能體i(i≠j)間存在一條連接,則aij=aji=1,否則aij=0。圖G的拉普拉斯矩陣記為L=[lij]∈RN×N,其中l(wèi)ij=-aji(i≠j),lii=-。圖中一系列的連接邊構成路徑。如果任意兩個智能體之間都存在一條路徑,則圖是連通的?!瑇‖表示列向量x∈RN的2范數(shù)。
網(wǎng)絡中每個智能體的動力學方程為:
其中,xi∈RN為第i個智能體的狀態(tài),ui為待設計的一致性控制協(xié)議。
為了明確得出本文的主要結果,下面先給出固定時間一致性的定義和相關必備的引理。
定義 稱系統(tǒng)(1)中各智能體狀態(tài)在固定時間內達到一致,如果存在不依賴于初始狀態(tài)的時間函數(shù)T,使得
這里,T也被稱作設定時間。
引理1[21]如果存在一個連續(xù)函數(shù)V(t):[0,∞)→[0,∞),使得V正定,且存在正實數(shù)c>0,0<ρ<1滿足V?(t)≤-cVρ(t),t≥t0,那么V1-ρ(t)≤V1-ρ(t0)-c(1-ρ)(t-t0),t0≤t≤t*,且V(t)=0,t≥t*,其中t*=t0+
引理2[22]如果存在一個連續(xù)的徑向無界函數(shù)V:Rn→R+∪{0},使得:
(1)V(x)=0?x=0;
(2)任意狀態(tài)x(t)滿足不等式:
D*V(x(t))≤-(αVl(x(t))+βVm(x(t)))k
其中,參數(shù)α,β,l,m,k>0,且lk<1,mk>1。D*V(x(t))為函數(shù)V(x(t))的右上界導數(shù)。那么,原點為全局固定時間穩(wěn)定點,且設定時間
引理2給出了一個相對保守的設定時間估計。考慮以下情形:常數(shù)l、m滿足形式l=1-γ>1,可以得到更為精確的時間估計,見下述引理。
引理3[22]如果存在一個連續(xù)的徑向無界函數(shù)V:Rn→R+∪{0},使得:
(1)V(x)=0?x=0;
(2)任意狀態(tài)x(t)滿足不等式:
D*V(x(t))≤-αVl(x(t))-βVm(x(t))
其中,參數(shù)α,β>0,D*V(x(t))為函數(shù)V(x(t))的右上界導數(shù)。那么,原點為全局固定時間穩(wěn)定點,且設定時間
引理4[23]如果y1,y2,…,yN≥0,那么
引理5[24]對一個連通無向圖G而言,其拉普拉斯矩陣L有以下性質:任意x=[x1,x2,…,xN]∈RN,有??芍狶為半正定,0是其單特征值,對應N元特征列向量1(每個元素都是1)。不妨設L的特征值為0,λ2,…,λN,并滿足0<λ2≤…≤λN。此外,如果1Tx=0,那么xTLx=λ2xTx。λ2(L)也稱作拉普拉斯矩陣L的代數(shù)連通度。
為實現(xiàn)多智能體網(wǎng)絡的非震顫固定時間一致性,設計如下的一致性協(xié)議:
其中,k1>0,k2>0為控制增益,A=[aij]∈RN×N,B=[bij]∈RN×N為多智能體之間信息傳輸網(wǎng)絡的鄰接矩陣。p、q、r、s為正奇數(shù),且滿足p<q,r>s。
注1受文獻[25]的啟發(fā),本文設計了上述固定時間非震顫一致性協(xié)議(2)。與文獻[13-16,18-19]中的控制協(xié)議相比,本文所設計的控制協(xié)議(2)不再使用傳統(tǒng)的符號函數(shù)sign(?),即式(2)是光滑連續(xù)型的一致性協(xié)議,從而有效地避免了震顫現(xiàn)象的發(fā)生。
定理 無向連通多智能體網(wǎng)絡中的各智能體i在一致性協(xié)議(2)的作用下,N個智能體能在固定時間內達到平均一致狀態(tài),且達到一致的時間上界滿足:
證明 考慮以下Lyapunov函數(shù):
對上述Lyapunov函數(shù)求導,可得:
根據(jù)引理4,可得:
再根據(jù)引理5,可以得到:
其中,Lq和Ls分別為權圖和的Laplacian矩陣。λ2(Lq)和λ2(Ls)分別表示矩陣Lq和Ls的代數(shù)連通度。
那么有:
最后再由引理2可知,多智能體網(wǎng)絡(1)可在固定時間內實現(xiàn)一致,且設定時間:
證畢!
根據(jù)引理3,可直接得到以下推論:
推論1在一致性協(xié)議(2)的作用下,如果參數(shù)p、q、r、s滿足,且γ>1,那么無向連通多智能體網(wǎng)絡(1)可以在固定時間Tmax:=內實現(xiàn)一致性。
如果控制協(xié)議(2)僅含有第一項,那么利用引理1可推導出下述推論。
注2控制協(xié)議(2)中第一項的作用是初步實現(xiàn)有限時間多智能體網(wǎng)絡的一致性。但是從推論2可以看出,最終實現(xiàn)有限時間一致性的時間上界估計依賴于智能體系統(tǒng)的初始狀態(tài)。類似地,文獻[13-16]中對實現(xiàn)有限時間一致性時間上界的估計也高度依賴系統(tǒng)中各智能體的初始狀態(tài)。為了擺脫這一束縛,本文進一步在(2)中設計了第二項,其作用是實現(xiàn)固定時間一致性,即智能體系統(tǒng)(1)在控制協(xié)議(2)的作用下達到有限時間一致性的時間上界估計與系統(tǒng)的初始狀態(tài)無關。這樣,對實現(xiàn)有限時間一致性的時間上界估計就可以事先根據(jù)實際需要,通過選取合適的控制增益k1、k2和參數(shù)r、s、p、q的值來調節(jié)。這是文獻[13-16]所不及的,同時也是固定時間一致性與有限時間一致性的本質區(qū)別。另一方面,本文與文獻[18-19]都對實現(xiàn)固定時間一致性的時間上界進行了估計。因為本文和文獻[18-19]關于時間上界的估計式中的增益和參量選取都比較靈活,可根據(jù)現(xiàn)實需要進行適當選取,所以對估計值之間的比較并沒有特殊意義。本文與文獻[18-19]相比,其優(yōu)點是本文所采取的控制策略是連續(xù)光滑型的,能夠有效地消除震顫現(xiàn)象。
這里通過一個數(shù)值例子來驗證理論結果的有效性和可行性。不妨設智能體網(wǎng)絡的規(guī)模為N=5,其拓撲如圖1所示。控制增益取k1=1,k2=2,參數(shù)p=1,q=3,r=5,s=3。各智能體初始狀態(tài)值xi(0)從區(qū)間[-10,10]中隨機選取。
圖1 多智能體網(wǎng)絡拓撲
由圖2可以發(fā)現(xiàn),各個智能體狀態(tài)能夠在固定時間不超過2.5 s內達到一致。同時,圖3給出了控制協(xié)議(2)的演化軌跡??梢钥闯觯@些曲線都是光滑的,不存在震顫現(xiàn)象。為了進一步驗證固定時間一致性能夠擺脫對系統(tǒng)初始狀態(tài)的依賴,本文隨機選取了6組不同的初始值進行模擬。圖4給出了完全誤差E(t)=‖ ‖e(t)軌跡??梢园l(fā)現(xiàn),對于任意的初始條件,多智能體網(wǎng)絡系統(tǒng)總能在2.5 s內趨于一致。
圖2 智能體x i(i=1,2,…,5)狀態(tài)變化軌跡
圖3 控制協(xié)議ui(i=1,2,…,5)的演化軌跡
圖4 完全誤差軌跡
本文研究了多智能體網(wǎng)絡的固定時間一致性問題。一方面,克服了傳統(tǒng)有限時間一致性問題對智能體系統(tǒng)初始狀態(tài)的依賴性。另一方面,所設計的控制協(xié)議不再含有符號函數(shù),解決了傳統(tǒng)帶有符號函數(shù)一致性協(xié)議中的震顫問題,提高了多智能體網(wǎng)絡系統(tǒng)的性能。并且利用經(jīng)典的Lyapunov第二方法得到了實現(xiàn)固定時間非震顫一致性的充分條件。在后續(xù)工作中可進一步考慮隨機噪聲和時滯所帶來的影響,以及時間與能量的關系問題。