李 猛,付興建
(北京信息科技大學(xué)自動(dòng)化學(xué)院,北京 100192)
隨著無人機(jī)應(yīng)用場(chǎng)景的逐步擴(kuò)展,單個(gè)無人機(jī)由于感知能力有限,載荷不足,覆蓋范圍小等缺點(diǎn),已經(jīng)較難滿足需求。人們受自然界中候鳥蜂擁、魚類渦旋、螢火蟲閃爍同步等群體行為啟示[1],在實(shí)際的應(yīng)用中將多個(gè)無人機(jī)進(jìn)行協(xié)同控制,以此得到更高的執(zhí)行效率以及完成更加復(fù)雜的任務(wù),比如野火監(jiān)控、商業(yè)表演、情報(bào)偵察、目標(biāo)搜索等。
然而,多無人機(jī)系統(tǒng)在執(zhí)行任務(wù)的過程中需要進(jìn)行狀態(tài)采樣、信息傳輸、控制輸入更新,而且每個(gè)無人機(jī)在處理信息時(shí)也需要一個(gè)過程,這樣會(huì)導(dǎo)致多無人機(jī)系統(tǒng)存在一定的時(shí)滯。文獻(xiàn)[2]對(duì)具有通信時(shí)滯的多智能體系統(tǒng)的群集運(yùn)動(dòng)進(jìn)行了研究。
系統(tǒng)中無人機(jī)之間進(jìn)行信息交互需要大量的通信資源,但是,網(wǎng)絡(luò)帶寬和無人機(jī)自身的能量都是有限的,這就給多無人機(jī)系統(tǒng)造成重大負(fù)擔(dān)。為了節(jié)約有限的通信資源,許多研究者提出采樣數(shù)據(jù)控制,文獻(xiàn)[3-4]在采樣數(shù)據(jù)控制的基礎(chǔ)上研究對(duì)多智能體系統(tǒng)的控制。
Dimarogonas 等首次將事件觸發(fā)控制應(yīng)用到多智能體系統(tǒng)中。為了減少通信次數(shù),事件觸發(fā)控制策略在多無人機(jī)系統(tǒng)中得到廣泛研究。文獻(xiàn)[5]研究了帶有輸入時(shí)滯的線性多智能體系統(tǒng)的事件觸發(fā)一致性問題。文獻(xiàn)[6-10]研究了非線性多智能體系統(tǒng)在事件觸發(fā)機(jī)制下的一致性問題。文獻(xiàn)[11-16]研究了二階多智能體系統(tǒng)在事件觸發(fā)下的一致性控制。隨機(jī)采樣的事件觸發(fā)控制協(xié)議可以有效地減少數(shù)據(jù)傳輸[15]。
受上述啟發(fā),本文考慮在事件觸發(fā)下不完全隨機(jī)采樣的基礎(chǔ)上,研究了既包含時(shí)滯又受到非線性因素影響的二階多無人機(jī)系統(tǒng)能夠達(dá)到一致性控制的問題。首先,本文考慮到在實(shí)際多無人機(jī)系統(tǒng)應(yīng)用中通信資源有限,提出了在事件觸發(fā)機(jī)制下不完全隨機(jī)的混合采樣,相比于周期采樣,這樣的采樣方式更加有利于此類系統(tǒng);其次,在實(shí)際應(yīng)用中的系統(tǒng)一般會(huì)受到非線性因素影響,所以本文使用了帶有非線性項(xiàng)的動(dòng)力學(xué)模型,同時(shí)在研究中加入固定的輸入時(shí)滯;給出了事件觸發(fā)機(jī)制下的多無人機(jī)系統(tǒng)控制策略,在減少無人機(jī)之間的通信量和減少系統(tǒng)計(jì)算量的同時(shí),使此系統(tǒng)完成一致性控制;最后,通過理論證明和仿真驗(yàn)證了控制策略的可行性。
本文考慮一個(gè)由n 個(gè)無人機(jī)構(gòu)成的多無人機(jī)系統(tǒng),該系統(tǒng)拓?fù)鋱DG 僅含一棵有向生成樹,,稱圖G 的節(jié)點(diǎn)集;W 為圖G 中無人機(jī)之間的權(quán)重矩陣,其元素wij表示無人機(jī)i 與無人機(jī)j之間的權(quán)重。當(dāng)且僅當(dāng)有向通信拓?fù)鋱DG 包含一棵有向生成樹時(shí),相應(yīng)的Laplacian 矩陣恰好有一個(gè)為0 的特征根,并且該矩陣的其他非0 特征根的實(shí)部全為正。無人機(jī)的運(yùn)動(dòng)區(qū)域?yàn)槿S空間,如果把無人機(jī)看成三維空間中的質(zhì)點(diǎn),在地面坐標(biāo)系(地軸系)下,系統(tǒng)中無人機(jī)i 的位置狀態(tài)向量和速度狀態(tài)向量皆為三維列向量。
系統(tǒng)中無人機(jī)i 的二階動(dòng)力學(xué)模型如下:
定義1:基于非均勻采樣的二階時(shí)滯多無人機(jī)系統(tǒng)如果滿足下列條件,則系統(tǒng)(1)能夠達(dá)到一致性
注1:本文主要研究事件觸發(fā)機(jī)制下的多無人機(jī)系統(tǒng)一致性問題,可以把無人機(jī)看作質(zhì)點(diǎn)進(jìn)行相關(guān)研究,使其在給出的算法下各個(gè)無人機(jī)的狀態(tài)信息達(dá)到一致。由于本文不研究多無人機(jī)編隊(duì)隊(duì)形的控制,所以不需要無人機(jī)位置狀態(tài)偏差量為一個(gè)非零常量。只研究多無人機(jī)系統(tǒng)狀態(tài)一致性的控制,那么定義1 中的式(2)為目標(biāo)函數(shù)是合理的。
注2:根據(jù)眾多參考文獻(xiàn),在實(shí)際應(yīng)用中各種控制指令不能夠連續(xù)執(zhí)行,并且多無人機(jī)系統(tǒng)在一致性控制過程中,初始幾秒狀態(tài)幅值波動(dòng)最大,在控制器調(diào)整下后續(xù)幅值波動(dòng)較小,并且隨機(jī)采樣的采樣間隔在一定范圍內(nèi)無法確定每次的間隔大小,而以固定小間隔采樣可以保證每次都以足夠小的時(shí)間間隔進(jìn)行,但控制過程始終使用固定間隔采樣是沒有必要的,所以本文在減少采樣次數(shù)情況下選擇在不同時(shí)段采用不同的采樣方式,以此讓采樣信息更加準(zhǔn)確地反映實(shí)際狀態(tài)信息。
考慮到在多無人機(jī)實(shí)際應(yīng)用系統(tǒng)中并不需要進(jìn)行完全的周期性觸發(fā),而且事件觸發(fā)的隨機(jī)采樣雖然有一定優(yōu)點(diǎn),但是其閾值一般需要不斷進(jìn)行計(jì)算,所以設(shè)計(jì)一種可以不僅依賴于無人機(jī)狀態(tài)信息,還依賴于時(shí)間觸發(fā)時(shí)刻的觸發(fā)機(jī)制,閾值在兩次事件觸發(fā)之間只需要計(jì)算一次,不需要連續(xù)計(jì)算。
在事件觸發(fā)機(jī)制式(4)下進(jìn)行控制器的設(shè)計(jì),需要考慮系統(tǒng)(1)中存在固定輸入時(shí)滯以及受到非線性因素的影響。假如無人機(jī)i 利用采樣信息更新控制輸入的時(shí)刻如下
則無人機(jī)i 的事件觸發(fā)時(shí)刻為
其中,k0代表控制增益;k1,k2分別是位置和速度狀態(tài)誤差的放大系數(shù);為大于0 的常數(shù)。
為了得到一致性控制主要結(jié)論,進(jìn)行以下分析:
那么式(2)等價(jià)于
令
則通過Kronecker 內(nèi)積,系統(tǒng)(1)的緊湊形式如下
式(9)中,
則式(9)轉(zhuǎn)化為式(10)
通過Newton-Leibnitz 公式可知
將式(10)代入式(11)得
下面分析會(huì)用到這些參數(shù)。
引理1[15]:如果矩陣P1的所有特征根的實(shí)部全為負(fù),那么可以選擇兩個(gè)合理的正實(shí)數(shù)β≥1 和γ>0 滿足
特征根Mij的實(shí)部為負(fù)。
定理1:當(dāng)假設(shè)1 與假設(shè)2 成立,系統(tǒng)的控制增益k0、k1、k2滿足式(15),并且系統(tǒng)中各無人機(jī)自身采樣間隔在區(qū)間(0,ξ)之內(nèi),那么控制策略(6)和事件觸發(fā)機(jī)制(4)在系統(tǒng)(1)中是可行的,即多無人機(jī)系統(tǒng)能夠達(dá)到一致性,并且因?yàn)椴蓸娱g隔一定是為正且不為無窮小的,則此系統(tǒng)不可能引發(fā)芝諾行為。
證明:為了證明系統(tǒng)(1)能在本文控制策略下達(dá)到一致,即式(8)成立,將對(duì)式(13)進(jìn)行微分方程求解并取范數(shù)得
同時(shí)根據(jù)范數(shù)性質(zhì)可得到
由式(17)和式(18)可得
那么
結(jié)合式(25),對(duì)式(26)進(jìn)行反證可知其成立
由此可知式(8)成立。
為驗(yàn)證本文控制算法的有效性,本小節(jié)將進(jìn)行以下仿真實(shí)驗(yàn)。
穩(wěn)態(tài)調(diào)節(jié)是對(duì)動(dòng)植物生命活動(dòng)的調(diào)節(jié),在植物生長過程中會(huì)通過生長素或其他相關(guān)激素來對(duì)其生命進(jìn)行調(diào)節(jié),而動(dòng)物則會(huì)利用體液和神經(jīng)調(diào)節(jié)的方式進(jìn)行有序的生命活動(dòng)。在種植水果或蔬菜時(shí),人們會(huì)利用催熟劑來促進(jìn)植物快速生長,如乙烯具有催熟果實(shí)的重要作用。而人在調(diào)節(jié)身體平衡狀態(tài)時(shí),都是通過自身免疫力的調(diào)節(jié)來預(yù)防疾病發(fā)生,如食用維生素。以上都是生活中常見的穩(wěn)態(tài)調(diào)節(jié)。
實(shí)驗(yàn)1:以4 架無人機(jī)系統(tǒng)的仿真來證明本文多無人機(jī)系統(tǒng)一致性理論結(jié)果的正確性。依據(jù)上述引理和文中條件并且參考文獻(xiàn)[15]可以選取參數(shù)為k0=1.25,k1=1,k2=1.25,ρ=0.05,α=0.32,b1=0.6,b2=0.8,=0.002 s 非均勻采樣間隔位于區(qū)間[0.005,0.015)且h=0.005,T1=2。分別表示智能體i 的位置狀態(tài)信息和速度狀態(tài)信息,其初始值從區(qū)間[-100,100]與[-10,10]中隨機(jī)產(chǎn)生如下:
根據(jù)以上信息進(jìn)行Matlab 數(shù)值仿真,如圖1~圖2所示。
圖1 實(shí)驗(yàn)1 條件下多無人機(jī)位置狀態(tài)演化過程Fig.1 Position state evolution process of multiple UAVs under experiment 1 condition
圖2 實(shí)驗(yàn)1 條件下多無人機(jī)速度狀態(tài)演化過程Fig.2 Evolution process of velocity state of multiple UAVs under experiment 1 condition
實(shí)驗(yàn)2:在實(shí)驗(yàn)1 的基礎(chǔ)上只改變k2,其他參數(shù)不變。其中,k2=2 時(shí)的仿真圖,如圖3~圖4 所示。
圖3 實(shí)驗(yàn)2 條件下多無人機(jī)位置狀態(tài)演化過程Fig.3 Position state evolution process of multiple UAVs underexperiment 2 condition
圖4 實(shí)驗(yàn)2 條件下多無人機(jī)速度的狀態(tài)演化過程Fig.4 Evolution process of velocity state of multiple UAVs under experiment 2 condition
多次改變k2值后進(jìn)行仿真,仿真圖不再一一列出,對(duì)其結(jié)果統(tǒng)計(jì)如表1 所示。
表1 不同k2 值情況下的系統(tǒng)仿真結(jié)果Table 1 System simulation results under different k2 values
實(shí)驗(yàn)3:在實(shí)驗(yàn)1 的基礎(chǔ)上改變k1,使k1>k2,令k1=2 的仿真圖,如圖5~圖6 所示。
圖5 實(shí)驗(yàn)3 條件下多無人機(jī)位置的狀態(tài)演化過程Fig.5 Position state evolution process of multiple UAVs under experiment 3 condition
圖6 實(shí)驗(yàn)3 條件下多無人機(jī)速度的狀態(tài)演化過程Fig.6 Evolution process of velocity state of multiple UAVs under experiment 3 condition
實(shí)驗(yàn)4:把實(shí)驗(yàn)1 的無人機(jī)數(shù)量改為9 架,其他參數(shù)不變進(jìn)行仿真實(shí)驗(yàn)。9 架無人機(jī)的位置和速度狀態(tài)初始值由程序從區(qū)間[-100,100]與[-10,10]中隨機(jī)產(chǎn)生,令無人機(jī)之間的權(quán)重矩陣W 和仿真圖如圖7~圖8 所示。
圖7 實(shí)驗(yàn)4 條件下多無人機(jī)位置的狀態(tài)演化過程Fig.7 Position state evolution process of multiple UAVs under experiment 4 condition
圖8 實(shí)驗(yàn)4 條件下多無人機(jī)速度的狀態(tài)演化過程Fig.8 Evolution process of velocity state of multiple UAVs under experiment 4 condition
分析:由實(shí)驗(yàn)仿真結(jié)果可知系統(tǒng)中各個(gè)無人機(jī)的三維位置狀態(tài)和速度狀態(tài)皆趨近于一致,驗(yàn)證了算法的有效性。經(jīng)過多次仿真實(shí)驗(yàn)知k1,k2對(duì)系統(tǒng)影響較大,所以對(duì)其進(jìn)行了詳細(xì)分析,由實(shí)驗(yàn)2 可知在實(shí)驗(yàn)1 其他參數(shù)滿足本文條件且不變的情況下,k2∈(1,2)則系統(tǒng)能夠更快的達(dá)到一致性;通過圖2 與圖6 對(duì)比,可見圖6 速度狀態(tài)波動(dòng)更加劇烈,從系統(tǒng)穩(wěn)定性的角度考慮應(yīng)該使k1<k2。
本文與文獻(xiàn)[15]相比,兩者的事件觸發(fā)閾值均是狀態(tài)與時(shí)間結(jié)合,但與之不同的是本文閾值只與采樣時(shí)刻相結(jié)合,由實(shí)驗(yàn)1 和實(shí)驗(yàn)4 的仿真結(jié)果可見兩者的事件觸發(fā)機(jī)制有相近的控制性能,增加無人機(jī)的數(shù)量不會(huì)影響本文算法的控制效果,而且事件觸發(fā)閾值不需要連續(xù)進(jìn)行計(jì)算,僅僅在事件觸發(fā)時(shí)刻計(jì)算一次,作為下次事件觸發(fā)的閾值,在本文研究的系統(tǒng)中更具優(yōu)勢(shì)。除此之外,本模型考慮了非線性因素的影響,并且控制算法考慮了輸入時(shí)滯,如此與實(shí)際的多無人機(jī)系統(tǒng)更接近。
本文研究了事件觸發(fā)機(jī)制下帶有固定輸入時(shí)滯的二階多無人機(jī)系統(tǒng)在不完全隨機(jī)采樣下的一致性控制問題,并提出閾值不僅依賴于狀態(tài),還依賴于事件觸發(fā)時(shí)刻的事件觸發(fā)機(jī)制,如此避免了狀態(tài)依賴型閾值較小以及隨機(jī)采樣在兩次事件觸發(fā)之間不斷計(jì)算閾值的缺陷,同時(shí)還能夠減少無人機(jī)之間信息交互??刂戚斎氲臓顟B(tài)信息依賴于采樣,由于采樣間隔嚴(yán)格大于零,那么事件觸發(fā)間隔嚴(yán)格大于零,系統(tǒng)就避免了芝諾行為,并且減少了控制輸入的更新。通過對(duì)算法進(jìn)行分析以及仿真實(shí)驗(yàn)結(jié)果驗(yàn)證了結(jié)論的正確性。