周紹磊,趙學遠,王帥磊,祁亞輝
(海軍航空大學, 山東 煙臺 264001)
近年來,隨著多智能體系統(tǒng)一致性問題的研究日益深入,將多智能體系統(tǒng)一致性的分布式控制思想及方法,應(yīng)用到多智能體編隊控制中也取得了大量成果[1-3]。文獻[4]中利用多智能體之間相對距離信息,基于鴿群行為設(shè)計了最優(yōu)編隊控制器,使得系統(tǒng)形成編隊,并在復雜運動下能夠有效地保持編隊隊形。文獻[5]中利用一致性思想設(shè)計了控制器,使得一類特殊的高階系統(tǒng)形成編隊。為了解決離散的多智能體系統(tǒng)編隊控制問題,文獻[6]中設(shè)計了一致性分布式控制器。在無向圖下,文獻[7]中為二階系統(tǒng)設(shè)計了分布式控制器,使其能夠形成編隊。雖然以上文獻,為了實現(xiàn)編隊控制,所采用的都是一致性的方法和思想,但是所設(shè)計的控制都要求通信拓撲保持實時無線通信。如文獻[8]所述,這種通信方式占用傳感器70%的能源,不僅浪費通信帶寬,而且也消耗了大量計算資源。因此,將文獻[9]中提出的事件觸發(fā)的控制策略應(yīng)用到多智能體的編隊控制當中,能夠有效地降低傳感器對于高頻數(shù)據(jù)采集的要求,在兩次事件觸發(fā)的時間間隔內(nèi),多智能體系統(tǒng)不需要進行通訊,能量消耗大幅降低,整個系統(tǒng)能夠更高效地完成任務(wù)?;谑录|發(fā)的編隊控制問題在文獻[10-12]中也有所研究,但與之不同的是,本文研究的是有向拓撲條件下的,多智能體編隊控制問題,提出了一種新的解決事件觸發(fā)下多智能體系統(tǒng)編隊控制問題的解決方案,利用Laplacian矩陣的特殊性質(zhì),將高階系統(tǒng)編隊控制問題簡化為了低階系統(tǒng)的漸近穩(wěn)定性問題。
引理1[13]拓撲圖G的Laplacian矩陣L至少有一個零特征值,其他非零特征值均具有正實部;如果有向圖G包含有一個有向生成樹,則0是L的簡單特征值,1N是其對應(yīng)的右特征向量。
引理2[14]對于圖的Laplacian矩陣L∈RN×N,那么存在一個矩陣M∈RN×N-1使得L=ME,其中E∈R(N-1))×N,其特定形式為
進一步,如果圖包含一個有向生成樹,那么矩陣M是列滿秩的,且矩陣EM的特征值是L的非零特征值,則Re(λ(EM))>0。
考慮N個多智能體構(gòu)成的多智能體系統(tǒng),其中每個智能體的運動模型描述如下
(1)
其中,xi∈Rn,ui∈Rp分別為第i個智能體的系統(tǒng)狀態(tài)和控制輸入。
定義1:對于多智能體系統(tǒng)(1)和任意的初始狀態(tài),如果存在一個控制器使得
(2)
成立,則稱多智能體系統(tǒng)(1)能夠形成編隊。其中hi(t)表示多智能體系統(tǒng)的編隊隊形,即每個智能體xi(t)的期望狀態(tài),本文所研究的編隊隊形hi(t)為時變編隊隊形,相比于固定編隊更具有意義。
本研究把基于事件觸發(fā)函數(shù)設(shè)計一個控制器,使得多智能體系統(tǒng)的狀態(tài)滿足定義1作為主要研究問題。事件觸發(fā)函數(shù)的設(shè)計多智能體系統(tǒng)僅在事件觸發(fā)函數(shù)等于零的時刻進行通信,降低了多智能體系統(tǒng)的通信頻率。
僅依靠鄰居智能體之間的相對狀態(tài)信息,基于事件驅(qū)動的多智能體系統(tǒng)一致性分布式控制器按如下設(shè)計
(xi(tk)-hi(t))]+wi(t)
(3)
其中:tk為系統(tǒng)第k次事件觸發(fā)時刻,k=0,1,2,…,wi為待設(shè)計的輔助控制輸入函數(shù)。當事件未觸發(fā)時,系統(tǒng)內(nèi)部無線通信保持靜默狀態(tài);事件觸發(fā)時,多智能體系統(tǒng)內(nèi)部按照相關(guān)通信拓撲圖進行通信,這樣有效地節(jié)省了通信帶寬和計算資源,所需要的事件觸發(fā)函數(shù)在后文進行設(shè)計。
將式(3)代入式(1)可得
(xi(tk)-hi(t))]+wi(t)
(4)
進一步整理可得
(IN?In)w(t)
(5)
令θi(t)=xi(t)-hi(t)可得
(6)
其中θj(tk)=xj(tk)-hj(t),θi(tk)=xi(tk)-hi(t)
進一步整理可得
(7)
定義狀態(tài)誤差
ei(t)=xi(tk)-xi(t)
(8)
將其代入式(7)可得
(9)
因此當
(10)
時系統(tǒng)(1)形成編隊。至此系統(tǒng)(1)的編隊控制問題轉(zhuǎn)化為系統(tǒng)式(9)的一致性問題。
令
(11)
則有
(12)
因此可以得到
(EM?In)ξ(t)-(E?In)w(t)
(13)
所以
(14)
故多智能體系統(tǒng)(1)能夠形成編隊h(t)的充要條件是
(15)
且系統(tǒng)
(16)
是漸進穩(wěn)定的。
引理3:在采用基于事件驅(qū)動的一致性控制器(3)作用下,系統(tǒng)(1)能夠形成編隊h(t),當事件觸發(fā)函數(shù)為
(17)
其中λ為(EM)?In的最小特征值。||·||為矩陣范數(shù),其中δ為常數(shù),且滿足0<δ<1。
證明:構(gòu)造李雅普諾夫函數(shù)
V(t)=ξ(t)Tξ(t)
(18)
對式(18)沿著系統(tǒng)(16)求導可得
(19)
根據(jù)引理2可知λ>0,因此
(20)
即
(21)
所以
(22)
令
(23)
將式(23)代入式(20)可得
(24)
因此所設(shè)計的事件驅(qū)動函數(shù)(17)能夠使得系統(tǒng)(16)漸進穩(wěn)定,此時即系統(tǒng)(1)能夠形成編隊h(t)。
引理4:根據(jù)引理3所設(shè)計的事件驅(qū)動函數(shù),不存在Zeno現(xiàn)象,即兩次事件驅(qū)動的時間間隔嚴格大于0,其最小時間間隔為
(25)
證明:類比文獻[15]由式(23)可得
(26)
因此可得
(27)
則有
(28)
因此事件驅(qū)動的時間間隔與φ的增長速率成正比。故φ的增長速率達到最大值當且僅當
(29)
令φ(t,φ0)為當初始值為φ0,在時刻t的值。設(shè)φ(t,0)是式(29)的解。求解可以得到
(30)
在式(30)中,φ的增長速率最大,為了求解最短的事件觸發(fā)時間間隔Δtmin,將其代入式(23),取等號,求得
證畢。
考慮在三維運動的4架無人機構(gòu)成的多智能體系統(tǒng),其中動力學模型由式(1)描述,xi表示第i架無人機位置信息,ui表示第i架無人機的控制輸入。無人機之間通信拓撲結(jié)構(gòu)如圖1所示。
圖1 通信拓撲圖
由通信拓撲結(jié)構(gòu),得到Laplacian矩陣為
無人機初始狀態(tài)為
xi1,xi2,xi3代表第i架無人機在三維坐標系中x軸坐標,y軸坐標,z軸坐標。
編隊隊形設(shè)計為
其中hi1(t)、hi2(t)、hi3(t)表示第i個智能體的期望編隊。
在控制器(3)的作用下,4架無人機構(gòu)成的系統(tǒng)能夠形成編隊,當編隊形成時,系統(tǒng)第一個狀態(tài)與編隊之間誤差隨時間變化如圖2所示,其余兩個狀態(tài)與編隊誤差與之相似,故在此不予展示。
圖2 系統(tǒng)狀態(tài)與編隊誤差xi1-hi1, i=1,2,3,4
結(jié)合圖2分析,4架無人機在5.5 s時系統(tǒng)狀態(tài)與所要實現(xiàn)的編隊狀態(tài)誤差達成一致,此后一直保持一致狀態(tài),根據(jù)定義1可以知道編隊能夠形成。
圖3~圖5分別為4架無人機在t=2 s,t=5.5 s,t=20 s三維空間中形成的編隊。
通過x的三維狀態(tài),將4架無人機在三維空間位置呈現(xiàn)在圖3~圖5。對圖2的分析,可知在5.5 s時,系統(tǒng)形成編隊,因此當5.5 s時,圖4上的4架無人機系統(tǒng)在三維空間中形成平行四邊形編隊,圖3為2 s時4架無人機在三維空間位置,明顯看出其未形成平行四邊形,即仍未達成編隊。由于本文設(shè)計的編隊為時變編隊,因此隨著時間的變化,無人機系統(tǒng)形成的編隊隊形也是時變的,對比20 s(圖5)時和5.5 s(圖4)時4架無人機位置可知,4架隊形均為平行四邊形,但是兩個平行四邊形對應(yīng)頂點位置的無人機不同,即編隊隊形為時變的平行四邊形。
圖3 t=2 s時編隊隊形
圖4 t=5.5 s時編隊隊形
圖5 t=20 s時編隊隊形
使4架無人機形成以上時變編隊,使用的式 給出的基于事件觸發(fā)的控制器,為了顯示的清晰,將基于事件觸發(fā)函數(shù)(17)設(shè)計的控制器觸發(fā)時間間隔由圖6表示,其表示0~10 s內(nèi)的觸發(fā)時間間隔,圖6中橫坐標為事件觸發(fā)時刻,縱坐標為兩次事件觸發(fā)時間間隔。
從圖6的事件驅(qū)動時間間隔看出,兩次事件觸發(fā)最小間隔為0.007 9 s,最大的時間間隔為0.197 s,平均時間間隔為0.042 9 s。根據(jù)公式計算最小時間間隔為0.007 3 s,由此觀之實際仿真當中最小觸發(fā)時間間隔是大于所要求的最小時間間隔,所設(shè)計的控制器有效,平均時間間隔和最大時間間隔明顯大于系統(tǒng)所要求的最小時間間隔。
因此基于事件驅(qū)動下設(shè)計的一致性控制器能夠使得系統(tǒng)形成時變編隊,并有效降低智能體之間的通信壓力。
圖6 t=0-10 s內(nèi)事件觸發(fā)事件間隔tk+1-tk
1) 本研究基于事件觸發(fā)設(shè)計的分布式控制器,使得多智能體系統(tǒng)在事件觸發(fā)時刻,進行通訊,兩次事件觸發(fā)時間間隔內(nèi)無線通信保持休眠,節(jié)約了資源,減少了連續(xù)通信對系統(tǒng)造成的負擔。
2) 所研究的拓撲結(jié)構(gòu)為一般的有向拓撲,通過對Laplacian矩陣的特殊分解,將編隊控制問題轉(zhuǎn)為穩(wěn)定性問題分析,降低了編隊控制的難度,同時降低了通信要求。