曹昊哲,吳炎烜,周峰,王正杰
(北京理工大學(xué)機(jī)電學(xué)院,北京100081)
帶有避碰機(jī)制的2階非線性多智能體系統(tǒng)包圍編隊(duì)研究
曹昊哲,吳炎烜,周峰,王正杰
(北京理工大學(xué)機(jī)電學(xué)院,北京100081)
當(dāng)前關(guān)于包圍編隊(duì)的研究沒(méi)有考慮一定條件下跟隨者之間可能出現(xiàn)的碰撞問(wèn)題?;趫D論、矩陣分析、非線性分析,研究帶有避碰機(jī)制的2階非線性多智能體系統(tǒng)包圍編隊(duì)問(wèn)題,分別設(shè)計(jì)了帶有避碰機(jī)制的靜態(tài)和自適應(yīng)包圍編隊(duì)協(xié)議,并結(jié)合李雅普諾夫分析方法得到包圍協(xié)議穩(wěn)定的充分條件。通過(guò)仿真實(shí)驗(yàn)驗(yàn)證包圍編隊(duì)協(xié)議的有效性。研究結(jié)果表明:協(xié)議可使跟隨者的運(yùn)動(dòng)軌跡最終趨向以所有領(lǐng)導(dǎo)者運(yùn)動(dòng)軌跡張成凸包的有限半徑范圍內(nèi),同時(shí)所有跟隨者之間距離均始終大于安全距離。
兵器科學(xué)與技術(shù);一致性問(wèn)題;包圍控制;避碰;多智能體系統(tǒng)
近年來(lái),多智能體系統(tǒng)的編隊(duì)問(wèn)題得到了廣泛研究和應(yīng)用[1]。這里所述智能體是指具有自主控制能力、計(jì)算能力的物理對(duì)象,例如:無(wú)人機(jī)、無(wú)人車、無(wú)人潛航器等。當(dāng)前多智能體系統(tǒng)編隊(duì)算法已有很多種,例如最初傳統(tǒng)的基于PID控制的編隊(duì)[2],該方法的典型特點(diǎn)是需要提前規(guī)劃好隊(duì)形,然后每個(gè)智能體根據(jù)隊(duì)形來(lái)確定相鄰節(jié)點(diǎn)并發(fā)送和接受狀態(tài)信息。這種算法適用于智能體數(shù)量少、編隊(duì)松散的情況,當(dāng)智能體數(shù)量很多、編隊(duì)密集時(shí),算法難以擴(kuò)展和應(yīng)用;進(jìn)而,有學(xué)者提出基于透光性協(xié)議的編隊(duì)[3],這種方法易擴(kuò)展,適用于密集編隊(duì),但很難進(jìn)行穩(wěn)定性分析,與此類似的還有基于蟻群、遺傳等啟發(fā)式算法的編隊(duì)[4],這些算法雖然易于擴(kuò)展但均難以進(jìn)行穩(wěn)定性分析。由于在很多編隊(duì)問(wèn)題中,多智能體都需要靠保持速度、方向一致來(lái)維持隊(duì)形,這便產(chǎn)生了所謂的一致性理論,很多學(xué)者研究了基于一致性理論的編隊(duì)[5],這種基于一致性理論的算法是分布式的,具有良好的擴(kuò)展性,同時(shí)又采用嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)模型來(lái)描述,而且可以進(jìn)行穩(wěn)定性分析,因此有關(guān)一致性問(wèn)題現(xiàn)已成為當(dāng)前復(fù)雜系統(tǒng)、協(xié)同控制等研究領(lǐng)域的重要研究方向。
一致性算法來(lái)源于編隊(duì),但其應(yīng)用并不僅限于編隊(duì)。例如傳感器網(wǎng)絡(luò)在監(jiān)視目標(biāo)時(shí)需要各個(gè)節(jié)點(diǎn)對(duì)目標(biāo)信息保持一致,此時(shí)就可對(duì)網(wǎng)絡(luò)中每個(gè)傳感器節(jié)點(diǎn)應(yīng)用一致性算法。又如,在群水下航行器網(wǎng)絡(luò)中,需要協(xié)同跟蹤某一目標(biāo),但無(wú)法保證所有航行器都可以獲得目標(biāo)信息,此時(shí)可對(duì)網(wǎng)絡(luò)中航行器應(yīng)用一致性算法[6]。諸如此類的一致性算法應(yīng)用還有很多,應(yīng)用領(lǐng)域廣泛。一致性問(wèn)題分類方式多樣,根據(jù)網(wǎng)絡(luò)是否有領(lǐng)導(dǎo)者,一致性問(wèn)題分兩種,即無(wú)領(lǐng)導(dǎo)者的一致性[7]以及帶有一個(gè)或多個(gè)領(lǐng)導(dǎo)者的一致性。其中,對(duì)于單個(gè)領(lǐng)導(dǎo)者的情形,所有跟隨者的狀態(tài)均會(huì)收斂至領(lǐng)導(dǎo)者的狀態(tài),這種情形也稱為一致性跟蹤[8]。對(duì)于多個(gè)領(lǐng)導(dǎo)者的情形,亦有其獨(dú)特優(yōu)勢(shì),例如一群智能體向某個(gè)目標(biāo)運(yùn)動(dòng),只需部分智能體安裝導(dǎo)航、環(huán)境感知等傳感器,這部分智能體即是領(lǐng)導(dǎo)者,它們擁有較強(qiáng)的運(yùn)動(dòng)能力,可精確導(dǎo)航并能探測(cè)環(huán)境中的障礙物,其他智能體只需聚集在這些領(lǐng)導(dǎo)者所形成的安全區(qū)域內(nèi)并跟隨領(lǐng)導(dǎo)者運(yùn)動(dòng),這就是所謂的包圍控制。
綜上所述可以看出,包圍控制不但可以因傳感器數(shù)量減少而節(jié)省成本,從而更具實(shí)際應(yīng)用價(jià)值,而且又不會(huì)影響包圍效果,所以包圍控制在近些年獲得了廣泛研究。在文獻(xiàn)[9]研究了多個(gè)剛體在無(wú)向通信拓?fù)湎碌淖藨B(tài)包圍控制問(wèn)題。文獻(xiàn)[10]研究了1階和2階多智能體系統(tǒng)在有向通信拓?fù)湎碌陌鼑刂茊?wèn)題。文獻(xiàn)[11]研究了隨機(jī)切換有向通信拓?fù)湎碌陌鼑刂?。文獻(xiàn)[12]研究了多個(gè)拉格朗日系統(tǒng)的包圍控制問(wèn)題。文獻(xiàn)[13]提出一種利用相鄰節(jié)點(diǎn)控制輸入的包圍控制協(xié)議。文獻(xiàn)[14]研究了異構(gòu)多智能體系統(tǒng)的包圍控制問(wèn)題。文獻(xiàn)[15]研究了2階非線性多智能體系統(tǒng)的包圍控制問(wèn)題。文獻(xiàn)[16-17]研究了一般動(dòng)力學(xué)多智能體系統(tǒng)的包圍控制問(wèn)題。文獻(xiàn)[18]研究領(lǐng)導(dǎo)者控制輸入時(shí)變情形下的一般動(dòng)力學(xué)多智能體系統(tǒng)的包圍控制問(wèn)題。文獻(xiàn)[19]研究了帶有不確定項(xiàng)的一般動(dòng)力學(xué)多智能體系統(tǒng)的魯棒包圍控制問(wèn)題。文獻(xiàn)[20]研究了帶有通信噪聲條件下的1階積分器網(wǎng)絡(luò)包圍控制問(wèn)題。文獻(xiàn)[21]研究了帶有通信延遲的包圍控制問(wèn)題。
包圍協(xié)議會(huì)使跟隨者趨向于由所有領(lǐng)導(dǎo)者狀態(tài)張成的凸包,每個(gè)跟隨者趨向的凸包權(quán)重值由通信拓?fù)浣Y(jié)構(gòu)決定,由于通信拓?fù)浣Y(jié)構(gòu)的任意性會(huì)使部分跟隨者趨向的凸包相近或一樣,應(yīng)用在編隊(duì)控制中則會(huì)導(dǎo)致跟隨者相互碰撞,而綜上可見,目前對(duì)包圍編隊(duì)的避碰問(wèn)題討論甚少。文獻(xiàn)[22]研究了拉格朗日系統(tǒng)的包圍編隊(duì)問(wèn)題,只是提到在拉格朗日系統(tǒng)前提下的避碰情況,然而實(shí)際的物理系統(tǒng)更多的是具有2階非線性動(dòng)力學(xué)形式,并非拉格朗日系統(tǒng)。因此本文研究2階非線性多智能體系統(tǒng)的包圍編隊(duì)控制,設(shè)計(jì)了一個(gè)帶有避碰機(jī)制的包圍編隊(duì)協(xié)議,使得各個(gè)跟隨者的位置聚集在以所有領(lǐng)導(dǎo)者位置所張成凸包的有限半徑范圍內(nèi),各個(gè)跟隨者的速度趨向于所有領(lǐng)導(dǎo)者速度所張成的凸包。結(jié)合李雅普諾夫穩(wěn)定性分析方法研究了各個(gè)領(lǐng)導(dǎo)者速度任意變化情形下包圍編隊(duì)協(xié)議的穩(wěn)定性。
一個(gè)帶有權(quán)重的有向圖由G=(V,E,A)表示,其中V=(vi,i=1,2,…,N)表示圖中有限點(diǎn)集,E?V×V表示圖的邊集,A=(aij)∈RN×N表示圖的鄰接矩陣。L=(lij)∈RN×N表示圖的拉普拉斯矩陣。關(guān)于圖論中各個(gè)概念的詳細(xì)定義見參考文獻(xiàn)[23]。
假設(shè)有一個(gè)多智能體系統(tǒng)由N個(gè)節(jié)點(diǎn)組成,序號(hào)1,2,…,M表示跟隨者,序號(hào)M+1,M+2,…,N表示領(lǐng)導(dǎo)者。F={1,2,…,M}表示跟隨者集合,R={M+1,M+2,…,N}表示領(lǐng)導(dǎo)者集合。N個(gè)節(jié)點(diǎn)之間的通信圖用Glf表示,^L∈RN×N是同Glf相關(guān)的拉普拉斯矩陣,跟隨者之間的通信圖用G表示,L∈RM×M是同G相關(guān)的拉普拉斯矩陣。這里假設(shè)多智能體系統(tǒng)通信拓?fù)涞淖兓?guī)律滿足假設(shè)1.
假設(shè)1 跟隨者之間的通信圖G是連通的,且
由于領(lǐng)導(dǎo)者不接收任何跟隨者的信息,因此^L可劃分為每個(gè)領(lǐng)導(dǎo)者至少是一個(gè)跟隨者的鄰接點(diǎn)。
為研究問(wèn)題方便,引入信息交換矩陣的定義:
定義1(信息交換矩陣) 令H=L+B,H∈RM×M是信息交換矩陣,其中,B=diag[b1,b2,…,
式中:H是信息交換矩陣。
引理1[9]若假設(shè)1成立,則是一個(gè)非負(fù)矩陣,且每一行的行和等于1.
定義2(凸包) 有一個(gè)集合K?Rn,如果對(duì)于任意的x、y∈K滿足(1-α)x+αy∈K,α∈[0,1],則稱該集合為凸包。一個(gè)有限點(diǎn)集x1,x2,…,xN∈ Rn的凸包用來(lái)表示,具體定義為
由(1)式可知,當(dāng)部分跟隨者所趨向的凸包相近或相同時(shí)會(huì)產(chǎn)生碰撞,因此這部分跟隨者不能直接趨向凸包,而是趨向凸包附近,同時(shí)跟隨者之間保持一定安全距離以避免碰撞。這意味著:
式中:v是正的常數(shù);d表示安全距離;^F?F表示所趨向的凸包相近或相同的那部分跟隨者;^R?R表示與跟隨者所趨向的凸包相近的那部分領(lǐng)導(dǎo)者。
2.1靜態(tài)包圍編隊(duì)協(xié)議
2階積分器是2階非線性動(dòng)力學(xué)方程的特例,很多智能體的動(dòng)力學(xué)模型都可以通過(guò)輸入輸出線性化的方式簡(jiǎn)化為2階積分器動(dòng)力學(xué)方程[24-25],但本文均是以一般性的2階非線性動(dòng)力學(xué)方程來(lái)描述,因而討論的是更具一般性的物理對(duì)象編隊(duì)情形。
每個(gè)跟隨者的動(dòng)力學(xué)方程為
式中:xi∈Rn和vi∈Rn分別表示第i個(gè)跟隨者的位置和速度;ui∈Rn是其相應(yīng)的輸入;f:Rn×Rn×R→Rn是連續(xù)可微的向量函數(shù)。
每個(gè)領(lǐng)導(dǎo)者的動(dòng)力學(xué)方程為
領(lǐng)導(dǎo)者的運(yùn)動(dòng)獨(dú)立于跟隨者,并做任意變速運(yùn)動(dòng),因此ui是個(gè)時(shí)變函數(shù),這里假設(shè)各個(gè)領(lǐng)導(dǎo)者的速度相同,因此由領(lǐng)導(dǎo)者構(gòu)成的隊(duì)形保持不變。假設(shè)領(lǐng)導(dǎo)者的非線性動(dòng)力學(xué)模型與跟隨者的一樣,并且這些非線性動(dòng)力學(xué)模型滿足以下假設(shè):
假設(shè)2 給定有限數(shù)量的非負(fù)常數(shù)η1,η2,…,存在兩個(gè)非負(fù)的常數(shù)ρ1和 ρ2,使得非線性函數(shù)f 滿足
若N-M=1,即多智能體系統(tǒng)只有一個(gè)領(lǐng)導(dǎo)者,則假設(shè)2就是很多非線性系統(tǒng)均滿足的利普希茨條件。若N-M>1,即多智能體系統(tǒng)有多個(gè)領(lǐng)導(dǎo)者,則只有部分非線性系統(tǒng)滿足假設(shè)2,選取其中某一種,例如:
下面介紹勢(shì)函數(shù)的定義,將用于包圍編隊(duì)協(xié)議。
定義3(勢(shì)函數(shù)) 勢(shì)函數(shù)Vij是關(guān)于‖xi-xj‖的可微、非負(fù)函數(shù),并滿足以下條件:
示感知距離,即開始執(zhí)行避碰機(jī)制的距離,r>d.
引理2[22]對(duì)于定義3中的勢(shì)函數(shù)Vij滿足
為各個(gè)跟隨者設(shè)計(jì)以下靜態(tài)包圍編隊(duì)協(xié)議:
式中:aij(j=1,2,…,N)表示鄰接矩陣元素;α、β、γ、κ是正的常數(shù);sgn(·)表示對(duì)向量各項(xiàng)做符號(hào)運(yùn)算的函數(shù)。
包圍協(xié)議(5)式由3部分組成:第1部分是協(xié)議中第1項(xiàng),作用是防止碰撞,即讓跟隨者之間以及跟隨者與領(lǐng)導(dǎo)者之間的距離大于安全距離;第2部分是協(xié)議中第2項(xiàng),作用是讓每個(gè)跟隨者趨向各自位置凸包;第3部分是協(xié)議中后面幾項(xiàng),作用是讓每個(gè)跟隨者趨向各自速度凸包,協(xié)議中非線性項(xiàng)的作用是為了抵消非線性動(dòng)力學(xué)的影響。
再令
多智能體系統(tǒng)(3)式、(4)式、(5)式可寫成閉環(huán)動(dòng)力學(xué)形式為
式中:In為n階單位對(duì)角矩陣。
對(duì)于多智能體系統(tǒng)(3)式、(4)式和包圍編隊(duì)協(xié)議(5)式,得出以下結(jié)論:
定理1 對(duì)于2階多智能體系統(tǒng)(3)式和(4)式,若通信拓?fù)錆M足假設(shè)1,非線性動(dòng)力學(xué)滿足假設(shè)2,且包圍編隊(duì)協(xié)議(5)式中的參數(shù)滿足條件κ≥
令初始時(shí)刻系統(tǒng)中所有節(jié)點(diǎn)間距離均大于安全距離,則在協(xié)議(5)式的作用下,所有跟隨者的位置趨向由所有領(lǐng)導(dǎo)者位置構(gòu)成凸包的有限半徑范圍內(nèi),且跟隨者之間以及跟隨者與領(lǐng)導(dǎo)者之間均大于安全距離,跟隨者的速度趨向由所有領(lǐng)導(dǎo)者速度構(gòu)成的凸包。σ1、σ2、σ3和函數(shù)V在后文定義,V(0)是李雅普諾夫函數(shù)V初始時(shí)刻的值。
由上所述可以看出,由于V(0)中包含初始位置、初始速度等信息,所以κ值的確定與這些信息緊密相關(guān)。
構(gòu)造李雅普諾夫函數(shù)
將V沿著系統(tǒng)(6)式的軌線求導(dǎo)可得
結(jié)合引理2以及各個(gè)領(lǐng)導(dǎo)者速度均相同這一假設(shè)可得
因此(8)式可變?yōu)?/p>
式中:λmin(·)表示矩陣最小特征值。則由(12)式可得
根據(jù)Barbalat引理,由(13)式可知,隨著時(shí)間t→∞,vf-vdl→0,即每個(gè)跟隨者的速度趨向于各自的速度凸包。從(10)式還可看出李雅普諾夫函數(shù)V是非遞增函數(shù),因此對(duì)于所有t≥0,V(t)≤V(0),所
2.2自適應(yīng)包圍編隊(duì)協(xié)議
2.1節(jié)研究了靜態(tài)包圍編隊(duì)協(xié)議,協(xié)議中參數(shù)κ的確定需要了解很多全局信息,例如需要知道初始位置和速度、信息交換矩陣、非線性動(dòng)力學(xué)參數(shù)以及領(lǐng)導(dǎo)者控制輸入上界,很多時(shí)候這些全局信息的確定也非常麻煩。因此設(shè)計(jì)一個(gè)自適應(yīng)包圍編隊(duì)協(xié)議,使參數(shù)κ通過(guò)自適應(yīng)的方式來(lái)確定,且不需要了解任何全局信息。
為各個(gè)跟隨者設(shè)計(jì)下面的自適應(yīng)包圍編隊(duì)協(xié)議:
式中:ci表示各個(gè)跟隨者的時(shí)變?cè)鲆妗?/p>
多智能體系統(tǒng)(3)式、(4)式、(14)式可寫成閉環(huán)動(dòng)力學(xué)形式:
式中:C=diag(c1,c2,…,cM).
對(duì)于多智能體系統(tǒng)(3)式、(4)式和包圍編隊(duì)協(xié)議(14)式,得出以下結(jié)論:
定理2 對(duì)于2階多智能體系統(tǒng)(3)式和(4)式,若通信拓?fù)錆M足假設(shè)1,非線性動(dòng)力學(xué)滿足假設(shè)2,令初始時(shí)刻系統(tǒng)中所有節(jié)點(diǎn)間距離均大于安全距離,則在協(xié)議(14)式的作用下,系統(tǒng)中所有跟隨者的位置趨向由所有領(lǐng)導(dǎo)者位置構(gòu)成凸包的有限半徑范圍內(nèi),且跟隨者之間以及跟隨者與領(lǐng)導(dǎo)者之間均大于安全距離,跟隨者的速度趨向由所有領(lǐng)導(dǎo)者速度構(gòu)成的凸包。
式中:ω是足夠大的正常數(shù)。
將V沿著系統(tǒng)(15)式的軌線求導(dǎo)可得
各個(gè)跟隨者的時(shí)變?cè)鲆鎐i是個(gè)遞增的變量,2.2節(jié)中的李雅普諾夫函數(shù)又是非遞增的函數(shù),因此時(shí)變?cè)鲆鎐i有上界,并趨向一個(gè)穩(wěn)定的值。
類似文獻(xiàn)[26]中的討論,本文多智能體系統(tǒng)的信息交換圖分為感知圖和通信圖,從前面的分析可看出感知圖對(duì)應(yīng)的拓?fù)涫菚r(shí)變的,包圍編隊(duì)協(xié)議中的第1項(xiàng)就是基于感知圖,該項(xiàng)的作用是防止智能體之間的碰撞。通信圖滿足假設(shè)1,其對(duì)應(yīng)的拓?fù)涫枪潭ǖ?,包圍編?duì)協(xié)議中的其他項(xiàng)基于通信圖,這些項(xiàng)的作用是讓每個(gè)跟隨者趨向各自對(duì)應(yīng)的位置和速度凸包。
這一部分對(duì)包圍編隊(duì)協(xié)議(14)式進(jìn)行數(shù)值仿真來(lái)驗(yàn)證其有效性??紤]一個(gè)2階多智能體系統(tǒng)由3個(gè)領(lǐng)導(dǎo)者和4個(gè)跟隨者組成,其通信圖對(duì)應(yīng)的鄰接矩陣如下:
各個(gè)智能體的非線性動(dòng)力學(xué)具有如下形式:
各個(gè)跟隨者的初始位置是:x1=[0m,30m]T,x2=[30m,30m]T,x3=[30m,0m]T,x4=[0m,0m]T,初始速度均為0m/s.假設(shè)各個(gè)領(lǐng)導(dǎo)者采用一定的控制率使其各自保持在如下位置:x5=[60m,30m]T,x6=[80m,15m]T,x7=[60m,0m]T.碰撞安全距離d=8 m,感知距離r= 10m.控制輸入?yún)f(xié)議(14)式中參數(shù)α、β、γ選取α= 1,β=15,γ=0.05.
勢(shì)函數(shù)的具體形式有很多,這里采用如下形式:
容易驗(yàn)證,其滿足定義3.
圖1是采用文獻(xiàn)[15]的不含避碰機(jī)制的包圍編隊(duì)協(xié)議仿真結(jié)果。其中,黑色三角形的3個(gè)頂點(diǎn)分別表示3個(gè)領(lǐng)導(dǎo)者的位置,4條彩色軌跡分別表示4個(gè)跟隨者的運(yùn)動(dòng)軌跡。圖2中的彩色軌跡分別對(duì)應(yīng)圖1中兩兩跟隨者之間的距離,黑色虛線表示安全距離。從圖2中結(jié)果可看出,雖然每個(gè)跟隨者趨向各自位置凸包,但很多跟隨者間的距離小于安全距離。
圖1 不含避碰機(jī)制的包圍編隊(duì)Fig.1 Containment without collision avoidance mechanism
圖3是加入避碰機(jī)制的包圍編隊(duì)仿真結(jié)果,采用的是本文提出的包圍編隊(duì)協(xié)議(14)式。其中,黑色三角形與4條彩色軌跡線與圖1含義相同,圖4中的彩色軌跡線分別對(duì)應(yīng)表示圖3中兩兩跟隨者之間的距離,黑色虛線同樣表示安全距離。從圖4中可看出任意兩個(gè)跟隨者間的距離均大于安全距離,同時(shí)所有跟隨者分布在各自位置凸包附近。
圖2 兩兩跟隨者間的距離Fig.2 Distances among followers
圖3 加入避碰機(jī)制的包圍編隊(duì)Fig.3 Containment with collision avoidance mechanism
圖4 兩兩跟隨者間的距離Fig.4 Distances among followers
本文所提出的包圍編隊(duì)協(xié)議對(duì)碰撞安全距離和感知距離大小沒(méi)有特殊限制,理論上只要滿足感知距離大于安全距離的邏輯條件即可,具體的取值可根據(jù)實(shí)際物理對(duì)象的約束確定。圖5和圖6是碰撞安全距離d=20 m,感知距離r=50 m情形下的仿真結(jié)果。其中,各個(gè)跟隨者的初始位置是: x1=[0m,150m]T,x2=[150m,150m]T,x3=[150m,0m]T,x4=[0m,0m]T,初始速度均為0m/s.并且假設(shè)對(duì)各個(gè)領(lǐng)導(dǎo)者采用一定的控制率,使其各自保持在如下位置:x5=[300m,150m]T,x6=[400m,60m]T,x7=[300m,0m]T.
圖5 加入避碰機(jī)制的包圍編隊(duì)Fig.5 Containment with collision avoidance mechanism
圖6 兩兩跟隨者間的距離Fig.6 Distances among followers
本文前述對(duì)于領(lǐng)導(dǎo)者采用一定的控制器,使其保持位置固定,但本文所提協(xié)議并不限定領(lǐng)導(dǎo)者必須保持位置固定。為了展現(xiàn)編隊(duì)協(xié)議控制能力,圖7是在本文所提出的包圍編隊(duì)協(xié)議(14)式控制下的領(lǐng)導(dǎo)者運(yùn)動(dòng)情形的仿真結(jié)果。虛線三角形的頂點(diǎn),表示領(lǐng)導(dǎo)者的初始位置;實(shí)線三角形的頂點(diǎn),表示領(lǐng)導(dǎo)者的仿真結(jié)束位置,3條黑色軌跡分別表示3個(gè)領(lǐng)導(dǎo)者的運(yùn)動(dòng)軌跡,領(lǐng)導(dǎo)者在x軸和y軸方向上的運(yùn)動(dòng)速度均是3 m/s.4條彩色軌跡線分別表示4個(gè)跟隨者從初始時(shí)刻到仿真結(jié)束的運(yùn)動(dòng)軌跡,初始時(shí)刻速度均為0 m/s.領(lǐng)導(dǎo)者與跟隨者初始位置如圖7所示,這里不再贅述。由圖7可見:跟隨者的運(yùn)動(dòng)軌跡最終趨向領(lǐng)導(dǎo)者軌跡張成的凸包。
圖8中彩色線條同前所述,依然表示圖7中兩兩跟隨者之間的距離,黑色虛線表示安全距離。從圖8中可見,任意兩個(gè)跟隨者間的距離均始終大于安全距離。
本文研究了2階非線性多智能體系統(tǒng)的包圍編隊(duì)問(wèn)題,基于鄰近狀態(tài)信息分別設(shè)計(jì)了靜態(tài)和自適應(yīng)包圍編隊(duì)協(xié)議。對(duì)于靜態(tài)包圍編隊(duì)協(xié)議,通過(guò)李雅普諾夫分析得到其穩(wěn)定的充分條件。對(duì)于自適應(yīng)包圍編隊(duì)協(xié)議則不需要任何全局信息,是完全分布式的。兩種包圍編隊(duì)協(xié)議均可使各個(gè)跟隨者的位置聚集在以所有領(lǐng)導(dǎo)者位置所張成凸包的有限半徑范圍內(nèi),同時(shí)所有跟隨者之間以及跟隨者與領(lǐng)導(dǎo)者之間距離均大于安全距離。數(shù)值仿真結(jié)果驗(yàn)證了該協(xié)議的有效性。
圖7 領(lǐng)導(dǎo)者運(yùn)動(dòng)情形下加入避碰機(jī)制的包圍編隊(duì)Fig.7 Containment with collision avoidance mechanism of moving leaders
圖8 兩兩跟隨者間的距離Fig.8 Distances among followers
(References)
[1] Oh K K,Park M C,Ahn H.A survey of multi-agent formation control[J].Automatica,2015,53:424-440.
[2] 劉小熊,章衛(wèi)國(guó),王振華,等.無(wú)人機(jī)自適應(yīng)編隊(duì)飛行控制設(shè)計(jì)與仿真[J].系統(tǒng)仿真學(xué)報(bào),2009,21(5):1420-1422. LIU Xiao-xiong,ZHANG Wei-guo,WANG Zhen-hua,et al.A-daptive formation flight control design for UAVs[J].Journal of System Simulation,2009,21(5):1420-1422.(in Chinese)
[3] 吳森堂,張杰,杜陽(yáng).一種基于透光性假說(shuō)的飛行器密集自主編隊(duì)控制方法:中國(guó),201310671331.3[P].2014-03-12. WU Sen-tang,ZHANG Jie,DU Yang.A dense autonomous forma-tional control method of aircraft based on the translucent hypothesis:China,201310671331.3[P].2014-03-12.(in Chinese)
[4] 張邦楚,彭琛,余新榮.基于蟻群優(yōu)化的多彈協(xié)同目標(biāo)分配算法[J].彈箭與制導(dǎo)學(xué)報(bào),2012,32(4):69-73. ZHANG Bang-chu,PENG Chen,YU Xin-rong.Cooperative target assignment algorithm of multiple missile based on ant colony optimization[J].Journal of Projectiles,Rockets,Missiles and Guidance.2012,32(4):69-73.(in Chinese)
[5] Olfati-saber R,F(xiàn)ax A,Murry M R.Consensus and cooperation in networked multi-agent systems[J].Proceedings of IEEE.2007,95(1):215-233
[6] 王銀濤,嚴(yán)衛(wèi)生.多自主水下航行器系統(tǒng)一致性編隊(duì)跟蹤控[J].控制理論與應(yīng)用,2013,30(3):379-384. WANG Yin-tao,YAN Wei-sheng.Consensus formation tracking control of multiple autonomous underwater vehicle systems[J]. Control Theory and Applicaions.2013,30(3):379-384.(in Chinese)
[7] 薛瑞彬,宋建梅,張民強(qiáng).具有時(shí)延及聯(lián)合連通拓?fù)涞亩囡w行器分布式協(xié)同編隊(duì)飛行控制研究[J].兵工學(xué)報(bào),2015,36(3):492-502. XUE Rui-bin,SONG Jian-mei,ZHANG Min-qiang.Research on distributed multi-vehicle coordinated formation flight control with coupling time-delay and jointly-connected topologies[J].Acta Armamentarii,2015,36(3):492-502.(in Chinese)
[8] 王青,后德龍,李君,等.存在時(shí)延和拓?fù)洳淮_定的多彈分散化協(xié)同制導(dǎo)時(shí)間一致性分析[J].兵工學(xué)報(bào),2014,35(7): 982-989. WANG Qing,HOU De-long,LI Jun,et al.Consensus analysis of multi-missile decentralized cooperative guidance time with time-delays and topologies uncertainty[J].Acta Armamentarii,2014,35(7):982-989.(in Chinese)
[9] Meng Z Y,Ren W,You Z.Distributed finite-time attitude containment control for multiple rigid bodies[J].Automatica,2010,46:2092-2099.
[10] Liu H Y,XIEGM,Wang L.Necessary and sufficient conditions for containment control of networked multi-agent systems[J]. Automatica,2012,48:1415-1422.
[11] Lou Y C,Hong Y G.Target containment control of multi-agent systems with random switching interconnection topologies[J]. Automatica,2012,48:879-885.
[12] Mei J,Ren W,Ma G F.Distributed containment control for Lagrangian networks with parametric uncertainties under a directed graph[J].Automatica,2012,48:653-659.
[13] Liu S,Xie L H,Zhang H S.Containment control of multi-agent systems by exploiting the control inputs of neighbors[J].International Journal of Robust and Nonlinear Control,2013,23(5): 534-547.
[14] Zheng Y S,Wang L.Containment control of heterogeneous multiagent systems[J].International Journal of Control,2014,87(1):37-41.
[15] Wang P,Jia Y M.Distributed containment control of second-or-der multi-agent systems with inherent non-linear dynamics[J]. IET Control Theory and Applications,2014,8(4):277-287.
[16] Li Z K,Duan Z S,Ren W,et al.Containment control of linear multi-agent systems with multiple leaders of bounded Inputs using distributed continuous controllers[J].International Journal of Robust and Nonlinear Control,2014,25(13):2101-2121.
[17] Ma Q,Miao G Y.Distributed containment control of linear multiagent systems[J].Neurocomputing,2014,133(10):399-403.
[18] Li Z K,Ren W,Liu X D,et al.Distributed containment control of multi-agent systems with general linear dynamics in the presence of multiple leaders[J].International Journal of Robust and Nonlinear Control,2013,23(5):534-547.
[19] Wen G H,Duan Z S,Zhao Y,et al.Robust containment tracking of uncertain linear multi-agent systems:a non-smooth control approach[J].International Journal of Control,2014,87(12): 2522-2534.
[20] LiW Q,Xie L H,Zhang JF.Containment tracking of leader-following multi-agent systems with measurement noise[C]∥32nd Chinese Control Conference.Xi'an,Shaanxi,China:TCCT,2013:7330-7334.
[21] Liu K E,Xie GM,Wang L.Containment control for second-order multi-agent systems with time-varying delays[J].Systems and Control Letters.2014,67(7):24-31.
[22] Meng Z Y,Lin Z L,Ren W.Leader-follower swarm tracking for networked Lagrange systems[J].Systems and Control Letters,2012,61(1):117-126.
[23] Godsil C,Royle G.Algebraic Graph Theory[M].NY,US: Springer,2001.
[24] Ren W.Consensus strategies for cooperative control of vehicle formations[J].IET Control Theory and Applications,2007,1(2):505-512.
[25] LiW.Persistent surveillance for a swarm of micro aerial vehicles by flocking algorithm[J].Journal of Aerospace Engineering,2015,229(1):185-194.
[26] Cao Y C,Ren W.Distributed coordinated tracking with reduced interaction via a variable structure approach[J].IEEE Transactions on Automatic Control,2012,57(1):33-48.
Research on Containment Control of Second-order Nonlinear Multi-agent with Collision Avoidance Mechanism
CAO Hao-zhe,WU Yan-xuan,ZHOU Feng,WANG Zheng-jie
(School of Mechatronical Engineering,Beijing Institute of Technology,Beijing 100081)
The containment protocol proposed in the previous researches does not take the collision among followers into consideration under certain conditions.The containment of second-order nonlinear multi-agent system with collision avoidance mechanism around formation is studied based on the graph theory,matrix analysis and nonlinear analysis.The static and adaptive protocols are proposed,respectively.Lyapunov method is used to obtain the sufficient condition for stability of protocols.The simulations are used to verify the effectiveness of the containment control protocols.The protocols can make followers'trajectories finally converge to a finite radius from the convex hull spanned by leaders'trajectories,and keep the distances among followers being more than the safe distances all the time.
ordnance science and technology;consensus problem;containment control;collision avoidance;multi-agent system
V279+.2
A
1000-1093(2016)09-1646-09
10.3969/j.issn.1000-1093.2016.09.014
2015-11-12
北京理工大學(xué)基礎(chǔ)研究基金項(xiàng)目(20120242009)
曹昊哲(1989—),男,博士研究生。E-mail:horizoncao@163.com;吳炎烜(1981—),男,講師,博士。E-mail:alexwyx@bit.edu.cn