孔祥磊, 汪芳琴, 鐘選明, 魯中軒
中國空間技術(shù)研究院, 北京 100094
近幾年,隨著集群控制領(lǐng)域的發(fā)展,一致性[1-5]問題成為不同領(lǐng)域?qū)W者關(guān)注的重點,不同類型的一致性協(xié)議在不同的工程技術(shù)領(lǐng)域得到廣泛應(yīng)用.在衛(wèi)星協(xié)同控制領(lǐng)域,通過設(shè)計非線性一致性協(xié)議,BONDHUS等[6]實現(xiàn)了無角速度測量信息的主-從編隊姿態(tài)同步.在機器人控制領(lǐng)域,基于群體機器人隊形一致性控制,徐志強等[7]設(shè)計了能夠克服系統(tǒng)中噪聲影響的領(lǐng)導(dǎo)者-跟隨者的多機器人編隊模型.在智能電網(wǎng)控制中,基于帶時滯的一致性理論,CHEN等[8]提出了一種能源優(yōu)化調(diào)度算法,解決了分布式電力系統(tǒng)出現(xiàn)的時滯問題等等.此外,一致性理論的典型應(yīng)用還包括了包圍控制[9]、可控性[10-13]、可鎮(zhèn)定性[14-15]、編隊控制[16-17]等等.
然而,在很多實際場景中,系統(tǒng)某些狀態(tài)量趨于一致或相同并不能滿足期望.如在航天控制中,由于太空垃圾越來越多,衛(wèi)星和巨型星座運營者需要考慮如何實現(xiàn)衛(wèi)星在運行過程中躲避這些衛(wèi)星碎片.特別是在近地軌道,由于擠滿了衛(wèi)星和巨型星座,更加需要設(shè)計合理的防撞機制和軌道擁堵治理策略.在智能交通中,對同車道行駛的機動車,需要設(shè)計后車與前車保持足夠的安全距離以防止車尾沖撞.在環(huán)保領(lǐng)域,部署的多臺無人飛行器需要在指定區(qū)域內(nèi)分散開以實現(xiàn)對環(huán)境的持續(xù)監(jiān)控等.針對上述類似場景,多智能體系統(tǒng)的反一致性[18-19]理論結(jié)果存在巨大應(yīng)用價值.
多智能體系統(tǒng)的反一致性問題是一個具有巨大潛在價值的研究課題.在文獻[18]中,作者給出了一類反一致性協(xié)議設(shè)計方法,實現(xiàn)了所有智能體最終靜止且彼此距離不低于指定值.進一步,作者討論了有界范圍內(nèi)多智能體系統(tǒng)的反一致性問題,并給出了相應(yīng)協(xié)議,保證系統(tǒng)在有界范圍內(nèi)達到反一致狀態(tài).在文獻[19]中,作者討論了一類非完整約束動力學(xué)系統(tǒng)的反一致性問題,實現(xiàn)了所有智能體避碰并達到指定隊形.在文獻[20]中,作者通過設(shè)計包含反一致性的控制律,解決了具有領(lǐng)航者的多智能體系統(tǒng)包圍控制問題,最終實現(xiàn)了跟隨者進入領(lǐng)航者構(gòu)成的包圍區(qū)域且演化過程避碰.值得說明的是,實際應(yīng)用中,個體在空間中的運動往往是受方向約束的.如發(fā)射出去的導(dǎo)彈只能向前飛,衛(wèi)星在軌運行時,很難絕對靜止和后退.上述研究[18-20]中,均沒有考慮智能體受方向約束時系統(tǒng)的反一致性問題.
本文研究了具有方向約束的多智能體系統(tǒng)的反一致性問題.首先,假設(shè)所有智能體在一維空間服從單向運動.通過設(shè)計反一致性協(xié)議,實現(xiàn)了所有智能體最終達到指定狀態(tài),滿足反一致性條件.隨后,將系統(tǒng)動力學(xué)模型推廣到高階,討論了高階多智能體系統(tǒng)的反一致性問題,并給出了一種控制律設(shè)計方法,實現(xiàn)了所有智能體最終實現(xiàn)指定的反一致狀態(tài).進一步,將系統(tǒng)從一維空間推廣到N維空間.假設(shè)多智能體系統(tǒng)中智能體在N維空間運動,并在第k個坐標軸方向上沿正向運動,在其他方向上不受約束.通過設(shè)計智能體的控制輸入,實現(xiàn)了系統(tǒng)中所有智能體最終達到反一致狀態(tài).最后仿真校驗了主要理論成果.
與現(xiàn)有的研究成果相比,主要創(chuàng)新點在于:1)考慮了具有方向約束的多智能體系統(tǒng)的反一致性問題.首先討論了智能體在一維空間中服從單向運動的反一致協(xié)議設(shè)計問題.其次,將系統(tǒng)從一維空間推廣到N維空間,討論了系統(tǒng)中智能體在N維空間沿第k個坐標軸的正向運動,在其他方向上不受約束時,系統(tǒng)的反一致性問題;2)系統(tǒng)中智能體僅僅通過觀測其鄰近智能體位置狀態(tài),自主分布式的決策和協(xié)調(diào)控制輸入,最終實現(xiàn)整個系統(tǒng)在整體層面達到反一致狀態(tài);3)對提出的理論成果進一步擴展,可以解決更高階、更復(fù)雜的系統(tǒng)模型.
1)如果矩陣A為對稱梅茲內(nèi)矩陣,則矩陣A的所有特征值都是非負的實數(shù),并且0是其平凡特征值.
2)如果矩陣A為對稱梅茲內(nèi)矩陣,則其特征值0是一重的,當且僅當對稱梅茲內(nèi)矩陣對應(yīng)的無向通信拓撲圖G是連通的.
考慮多智能體系統(tǒng)具有n個智能體,標記為x1,…,xn,其中,xi∈RN,i=1,…,n,為了簡化理論的證明,假設(shè)N=1,智能體xi的動力學(xué)模型為
(1)
其中,ui是智能體xi的控制輸入.
(2)
為θij的函數(shù).其中,0
不失一般性,假設(shè)多智能體系統(tǒng)(1)沿正方向做單向運動.智能體xi的控制輸入設(shè)計如下:
(3)
(4)
假設(shè)1在初始時刻,所有智能體x1,…,xn靜止,所有智能體初始位置保證避碰,且至少存在一組xi,xj,i,j=1,…,n,滿足dij≤r.
定理1在假設(shè)1的條件下,多智能體系統(tǒng)(1)使用控制律(4),可以實現(xiàn)所有智能體在動力學(xué)演化過程中避碰且服從單向運動,所有的智能體最終滿足任意xi,xj,i,j=1,…,n,dij≥r.
其中,α=[αi]n×1,且有αi=[Vx]i,β=[βi]n×1,且有當[Vx]i>0時,βi=αi,當[Vx]i≤0時,βi=0.顯然,
下面證明所有的智能體最終不僅靜止,且滿足任意xi,xj,i,j=1,…,n,dij≥r.假設(shè)當t→+∞,存在xi,xj,使得dij
假設(shè)N>1,即,智能體在高維空間運動,同時假設(shè)智能體在N維空間中沿第k個坐標軸的正向做單向運動,智能體xi的控制輸入設(shè)計如下:
(5)
(6)
推論1在假設(shè)1的條件下,多智能體系統(tǒng)(1)使用控制律(6),可以實現(xiàn)所有智能體在動力學(xué)演化過程中避碰且在N維空間中沿第k個坐標軸的正向做單向運動,所有的智能體最終滿足任意xi,xj,i,j=1,…,n,dij≥r.
考慮多智能體系統(tǒng)中,智能體的動力學(xué)模型為二階積分器形式
(7)
其中,vi表示智能體xi的速度.
智能體的控制律設(shè)計如下:
(8)
(9)
假設(shè)2在初始時刻,系統(tǒng)中的智能體x1,…,xn的速度v1,…,vn滿足vi≥0,i=1,…,n.
定理2在假設(shè)1和假設(shè)2條件下,多智能體系統(tǒng)(7)使用控制律(9),可以實現(xiàn)所有智能體在動力學(xué)演化過程中避碰且服從單向運動,所有的智能體最終靜止且滿足任意xi,xj,i,j=1,…,n,dij≥r.
其中,x,V=[vij]n×n定義如上.結(jié)合控制律(9),有李亞普諾夫函數(shù)L的導(dǎo)數(shù)
其中,v=[v1,…,vn]T,α=[αi]n×1,β=[βi]n×1,且有當[Vx]i<0,vi≤0時,αi=βi=0,否則,αi=[Vx]i,βi=vi.李亞普諾夫函數(shù)L的導(dǎo)數(shù)等價于
根據(jù)拉薩爾不變集原理,所有智能體x1,…,xn是在動力學(xué)演化過程中,最終狀態(tài)穩(wěn)定到不變集
由于協(xié)議(9)的設(shè)計保證了系統(tǒng)中所有智能體xi的速度vi≥0,所以有任意l=lj,j=1,…,h,vl=0,故S等價于S={x,v|vi=0,i=1,…,n},所以智能體x1,…,xn最終靜止.
下面說明,所以智能體x1,…,xn最終靜止當且僅當[Vx]i=0,i=1,…,n.假設(shè)存在智能體xi,滿足[Vx]i≠0,即,Ni≠0.考慮多智能體系統(tǒng)中,xi所在的最大連通子圖為G={xl1,…,xlh},即任意的xi∈G,存在xj∈G,滿足dij
假設(shè)N>1,即,智能體在高維空間運動,設(shè)計智能體在N維空間中沿第k個坐標軸的正向做單向運動,設(shè)計智能體xi的控制輸入如下:
(10)
(11)
推論2在假設(shè)1和假設(shè)2條件下,多智能體系統(tǒng)(7)使用控制律(11),可以實現(xiàn)所有智能體在動力學(xué)演化過程中避碰且在N維空間中沿第k個坐標軸的正向做單向運動,所有的智能體最終靜止且滿足任意xi,xj,i,j=1,…,n,dij≥r.
下面通過數(shù)值實例1~2校驗上述定理和推論的主要理論結(jié)果.
下面通過數(shù)值實例校驗定理1和推論1的理論結(jié)果.假設(shè)多智能體系統(tǒng)中存在13個智能體,其形式表示為xi=[xi1,xi2]T∈R2,所有智能體在平面沿xi2坐標軸正向運動,系統(tǒng)參數(shù)c=1,k1=1,智能體感知半徑r=2,通過計算,得到k2=2.5,a0=-0.16666667,a1=1.33333333,a2=-0.16666667.初始時刻,隨機選取智能體位置滿足,所有智能體保證避碰,且至少存在一組智能體,其之間的距離小于感知半徑r=2.圖1表示所有智能體的狀態(tài)軌跡,其中,圓點表示智能體初始時刻位置,三角表示智能體在t=50000時的位置,可以看出所有智能體在狀態(tài)演化過程中,位置隨時間漸近分散.圖2表示智能體軌跡演化的俯視圖,從中可以看出,所有智能體沿xi2坐標軸正向運動.圖3為t=50000時刻所有智能體位置俯視圖,其中圓環(huán)為以智能體為圓心,r=2為半徑,可以看出,隨著時間增大,任意一組智能體的距離漸近大于等于感知半徑,其與定理1和推論1的理論結(jié)果一致.
圖1 位置演化軌跡Fig.1 Position evolution trajectory
圖2 位置演化俯視圖Fig.2 Top view of position evolution
圖3 t=50000時刻俯視圖Fig.3 Top view of position at time t=50000
接下來校驗定理2和推論2的理論結(jié)果.假設(shè)多智能體系統(tǒng)中存在13個智能體,其形式表示為xi=[xi1,xi2]T∈R2,所有智能體在平面沿xi2坐標軸正向運動,系統(tǒng)參數(shù)和感知半徑如數(shù)值實例1.初始時刻,隨機選取智能體位置和速度滿足,所有智能體保證避碰,且至少存在一組智能體,其之間的距離小于感知半徑r=2,所有智能體速度分量vi2不小于0.圖4表示所有智能體的狀態(tài)演化軌跡,其中,圓點表示智能體初始時刻位置,三角表示智能體在t=50000時的位置,可以看出所有智能體在狀態(tài)演化過程中,位置隨時間漸近分散.圖5表示所有智能體速度演化過程,其中虛線表示滿足的vi1=vi2=0的直線,可以看出,隨著時間增加,所有智能體的速度趨于0.圖6表示智能體軌跡演化的俯視
圖4 位置演化軌跡Fig.4 Position evolution trajectory
圖5 速度演化軌跡Fig.5 Velocity evolution trajectory
圖6 位置演化俯視圖Fig.6 Top view of position evolution
圖7 t=50000時刻俯視圖Fig.7 Top view of position at time t=50000
圖,從中可以看出,所有智能體沿xi2坐標軸正向運動.圖7為t=50000時刻所有智能體位置俯視圖,其中圓環(huán)為以智能體為圓心,r=2為半徑,可以看出,隨著時間增大,任意一組智能體的距離漸近大于等于感知半徑,其與定理2和推論2的理論結(jié)果一致.
研究了具有方向約束的多智能體系統(tǒng)的反一致性問題.對服從單向運動的一維多智能體系統(tǒng),給出了一類反一致性協(xié)議設(shè)計方法,實現(xiàn)了所有智能體避碰并最終狀態(tài)滿足任意一組智能體,其之間的距離不小于感知半徑.進一步,針對二階多智能體系統(tǒng),給出了一類包含速度的反一致協(xié)議設(shè)計方法,系統(tǒng)中智能體僅僅通過觀測其鄰近智能體位置狀態(tài)和檢測自身速度,最終實現(xiàn)整個系統(tǒng)在整體層面達到反一致狀態(tài).最后,將系統(tǒng)從一維空間推廣到N維空間,給出了系統(tǒng)中所有智能體在N維空間第k個坐標軸方向上沿正向運動,在其他方向上不受約束時,系統(tǒng)實現(xiàn)反一致性狀態(tài)的協(xié)議.給出的仿真實例說明了該方法的有效性.