胡滿江,王智煒,杜長坤,葉俊,邊有鋼?
(1.湖南大學機械與運載工程學院,湖南長沙 410082;2.北京理工大學機電學院,北京 100081;3.湖南大學無錫智能控制研究院,江蘇無錫 214072)
隨著海洋資源爭奪的日益激烈,作為海洋探測開發(fā)的工具,自主水下機器人(Autonomous Underwater Vehicle,AUV)的研究引起了眾多學者的關(guān)注.目前,對AUV 的研究主要集中在單個AUV 的智能控制上.在一些特殊的場合中,單個AUV 因功能單一、承載空間有限、無法攜帶大量配置等,無法完成某些指定任務,如:對某一指定區(qū)域進行監(jiān)測、海底測繪、復雜的戰(zhàn)術(shù)進攻圍捕等.因此,多AUV 協(xié)同系統(tǒng)的研究日益重要.多AUV 系統(tǒng)不是單個AUV 的簡單疊加,而是涉及通信、隊形結(jié)構(gòu)等的編隊問題,通過建立合理的編隊協(xié)同機制,使多個AUV 保持期望的位姿,完成特定的任務[1].
目前,編隊控制方法多應用于船舶、飛行器、車輛[2-3]等,應用于多AUV 系統(tǒng)則相對較少.常見的多AUV編隊控制方法分為協(xié)調(diào)路徑跟蹤和協(xié)調(diào)目標跟蹤.協(xié)調(diào)路徑跟蹤[4]的控制目標是跟蹤一個參數(shù)化的預定路徑,協(xié)調(diào)目標跟蹤的控制目標是跟蹤領航者附近的一個參考點或目標點[5].如Cui 等[6]研究了欠驅(qū)動AUV 在水平面上運動的領航者-跟隨者(Leader-Follower)編隊控制問題,其中跟隨者根據(jù)領航者的位置和預定的隊列跟蹤參考軌跡,而無需領航者的速度,減小了通信負擔.Millán 等[7]將AUV 視為單車模型,利用運動學關(guān)系和泰勒公式展開定理,對單車模型進行線性化處理,保持編隊轉(zhuǎn)彎能力,使編隊通過跟蹤共同參考航線向目標方向航行.高振宇等[8]將AUV 不確定模型參數(shù)及海洋擾動視為復合擾動,設計了復合擾動觀測器,實現(xiàn)對擾動的精確估計,而后基于反步法提出一種固定時間編隊控制律,使編隊在固定時間達到期望隊形.需要注意的是,上述方法均需要領航者信息,通過跟蹤領航者或者跟蹤依靠領航者信息生成的預設路徑,以實現(xiàn)漸近穩(wěn)定的編隊控制,本質(zhì)上都是跟蹤問題.此外,上述方法要求多AUV 間進行連續(xù)通信,并在每一個采樣時刻將自身AUV 的狀態(tài)廣播給鄰居.連續(xù)通信會帶來較高的通信負擔和能量消耗,這對作業(yè)中只能依靠自身攜帶能源的AUV 來說是一個不小的負擔.因此,在滿足控制性能的前提下,減少通信次數(shù)具有很強的現(xiàn)實意義.
近年來,基于事件觸發(fā)的編隊控制策略得到了廣泛研究.該控制策略在AUV 滿足特定觸發(fā)條件時才會對其鄰居廣播自身的狀態(tài)信息,并同時更新自身的控制律,可有效降低通信負擔和能量消耗,為解決上述問題提供了有效手段.
目前,事件觸發(fā)的編隊控制研究多集中于多智能體系統(tǒng)[9-13]和車輛隊列[14-15]系統(tǒng).Behera等[16]采用事件觸發(fā)策略,利用滑模控制解決了受外部干擾的非線性系統(tǒng)的魯棒鎮(zhèn)定問題.Li 等[17]提出了一個新的事件觸發(fā)方案,解決了非線性動力學和時間變化延遲的多智能體系統(tǒng)的共識問題.Liu等[18]通過構(gòu)造底層變量,設計了拉格朗日系統(tǒng)的事件觸發(fā)控制策略,并結(jié)合滑??刂品椒ǎ鉀Q了無向圖下具有拉格朗日動力學的多智能體系統(tǒng)的共識問題.Gao 等[19]針對AUV 平動模型,通過間歇性采樣進行通信機制設計,并結(jié)合反步法設計了AUV 觸發(fā)策略,實現(xiàn)了基于領航者-跟隨者的固定時間AUV 編隊控制.Su等[20]考慮AUV 的水平面模型,基于事件觸發(fā)策略,運用反步法設計了具有外部不確定性的固定時間編隊控制器,通過仿真驗證了用于多AUV 系統(tǒng)的固定時間事件觸發(fā)編隊協(xié)議的有效性.
上述研究所采用的均為靜態(tài)觸發(fā)策略.為了增大觸發(fā)時刻間隔、進一步降低通信負擔,動態(tài)事件觸發(fā)策略得到了關(guān)注,通過設計動態(tài)參數(shù),讓觸發(fā)閾值隨狀態(tài)的變化而改變,有效地增加了觸發(fā)間隔.Yi等[21]針對一階系統(tǒng)的一致控制問題,設計了兩種動態(tài)事件觸發(fā)策略,并提出了自觸發(fā)算法,仿真結(jié)果表明,動態(tài)觸發(fā)策略可有效降低能耗.Du 等[22]針對一階跟隨者-領航者跟隨問題,首先提出了集中事件觸發(fā)機制;然后,通過引入內(nèi)部變量設計了分布式動態(tài)觸發(fā)策略,在兩種情況下,根據(jù)設計的事件觸發(fā)規(guī)則排除了Zeno現(xiàn)象.
本文研究基于動態(tài)事件觸發(fā)策略的多AUV 一致控制問題,主要貢獻包括:首先,提出了一種動態(tài)事件觸發(fā)通信策略,根據(jù)觸發(fā)時刻的AUV 與鄰居的狀態(tài)改變動態(tài)參數(shù),讓觸發(fā)閾值隨狀態(tài)的變化而改變.在設計的控制策略中,AUV 只在滿足觸發(fā)條件時才會對鄰居廣播自身的狀態(tài)信息,并同時更新自身的控制律,該策略可以顯著減小AUV 之間通信造成的能耗.其次,基于一致性理論、滑模變結(jié)構(gòu)控制方法,設計了考慮環(huán)境干擾的多AUV 魯棒一致控制器,并通過構(gòu)建輔助變量簡化了控制律的設計過程.最后,利用反證法,證明了觸發(fā)間隔存在一個嚴格大于0的數(shù),排除了Zeno現(xiàn)象.
文中用到的符號如下:
本文中AUV 編隊通信網(wǎng)絡結(jié)構(gòu)用圖表示.跟隨者AUV 的通信拓撲表示為無向圖G=(V,ε,A),其中V={1,2,…,N}是節(jié)點集合,ε?V×V是弧集,表示兩節(jié)點之間的連接通道,A=[aij]∈RN×N是一個對稱矩陣,當節(jié)點i和節(jié)點j連通時,aij=aji=1;否則aij=0.集合Ni={j∈V:(i,j) ∈ε}表示與節(jié)點i鄰接的節(jié)點集合,|Ni|表示與節(jié)點i鄰接的節(jié)點的個數(shù).對角矩陣D=diag{d11,d22,…,dNN}∈RN×N是度矩陣,其中dii=
設無向圖G的拉普拉斯矩陣L=[lij]∈RN×N定義為:
其中,L矩陣的元素定義為:
對角矩陣B定義為:
當?shù)趇個跟隨者與領航者連通時,ai0>0;否則,ai0=0.
對于一個領航者-跟隨者系統(tǒng),用下標i=0 表示領航者AUV,i=1,…,N表示跟隨者AUV.基于領航者間歇性運動,考慮多AUV 編隊的一致問題.在領航者間歇性運動間隙,領航者固定不動,只發(fā)送自身狀態(tài)信息.AUV 的運動可以通過地面坐標系G-abc和載體坐標系O-abc兩個坐標系來描述.
假設1在AUV 中,一般橫傾運動都是自穩(wěn)定,因此忽略橫傾運動對AUV 的影響,即橫滾角恒為0.縱傾角范圍為[-π∕6,π∕6].
假設2AUV 是上下、左右、前后高度對稱的模型;AUV 低速運行,低速情況下AUV 的水動力參數(shù)近似看作不變;重心與浮心重合;AUV工作在海面以下,故忽略海風、海浪對AUV 的影響,僅考慮海流,其大小有界且緩慢變化.
假設3跟隨者間的通信拓撲圖G無向且連通.
AUV運動學方程[23-24]為:
AUV動力學方程[23-24]為:
式中:ηi=[xi,yi,zi,θi,ψi]T表示地面坐標系下的位姿坐標,xi為縱向軸位移,yi為橫向軸位移,zi為垂向軸位移,以垂直向下為z軸的正方向,θi為縱傾角,ψi為航向角;Θi=[θi,ψi]T表示地面坐標系下的姿態(tài)角;vi=[ui,?i,wi,qi,ri]T為載體坐標系下AUV 的線速度與角速度,ui為縱向速度,?i為側(cè)向速度,wi為垂向速度,qi為縱向角速度,ri為航向角速度.J1(Θi) ∈R3×3表示線速度從載體坐標系到地面坐標系的轉(zhuǎn)換矩陣;J2(Θi) ∈R2×2表示角速度從載體坐標系到地面坐標系的轉(zhuǎn)換矩陣;Mi為慣性矩陣;C(vi)為科氏及向心力矩陣;D(vi)為阻尼矩陣;g(Θi)為回復力向量;τi為輸入;根據(jù)假設2,?為有界擾動,‖?i‖1≤bi,bi為干擾的上界值.
定 義cosψi=cψi,sinψi=sψi,cosθi=cθi,sinθi=sθi,有
本文的控制目標是設計基于動態(tài)觸發(fā)的跟隨者AUV 控制律,當領航者AUV 保持靜止時,使其與領航者AUV保持期望的相對位置與相對姿態(tài),即
式中:η0(t)=Ω,用來表示領航者AUV 的固定狀態(tài)信息,Ω為5維常數(shù)列向量;vi(t) ∈R5×1;di0∈R5×1代表跟隨者i與領航者之間期望的相對位置與相對姿態(tài).后文中η0(t)簡寫為η0.
本節(jié)針對AUV 編隊的一致性問題,提出一種結(jié)合分布式控制器與動態(tài)觸發(fā)律的分布式動態(tài)事件觸發(fā)一致性協(xié)議.排除了Zeno 現(xiàn)象,保證了協(xié)議的可行性.
為實現(xiàn)AUV 編隊的一致性,受文獻[18]的啟發(fā),針對系統(tǒng)存在外部干擾的情況,采用以下分布式控制器:
注2定義輔助變量ξi(t)來簡化AUV模型,根據(jù)一階微分方程的性質(zhì),當ξi(t)收斂到一個確定的值T時,vi(t)逐漸收斂到0,ηi(t)逐漸收斂到T.
注3上述設計的控制器把廣義位置ηi(t)與載體速度vi(t)的一致控制轉(zhuǎn)化為對輔助變量ξi(t)的一致控制,通過引入?yún)⒖甲兞喀襥(t)構(gòu)建上層參考模型,利用滑模控制保證ξi(t)對σi()t的跟蹤效果,進而實現(xiàn)編隊的一致性.
注4通過引入ξi(t)和σi(t)構(gòu)建分級控制框架,將相鄰信息交互與分布式動態(tài)控制分離開,簡化設計過程.動態(tài)觸發(fā)律基于σi(t)設計,以實現(xiàn)σi(t)一致.相較于同時考慮AUV運動學模型與AUV動力學模型設計控制器,通過引入ξi(t)簡化AUV 動力學模型,使分布式控制器可以僅在簡化后的AUV 動力學模型上進一步設計,并通過保證ξi(t)對σi(t)的跟蹤效果來實現(xiàn)編隊的一致性.
巖性、構(gòu)造、地貌及水系,是貴州觀賞石資源形成的重要控制因素。形、質(zhì)、色、紋、韻四種審美元素在貴州觀賞石資源上體現(xiàn)得十分充分和典型。其中,“色彩”是貴州觀賞石的顯著特點,可概括和解讀為“十大色系”,展現(xiàn)出觀賞石資源中“多彩貴州”的無限魅力。
對于每一個跟隨者i,定義狀態(tài)測量誤差:
動態(tài)事件觸發(fā)律設計如下:
結(jié)合式(24)、式(25)得:
結(jié)合式(6)、式(19),得到最終的控制系統(tǒng)為:
定理1在假設1—假設3 下,觸發(fā)律(24)和控制律(19)可以使跟隨者系統(tǒng)(28)收斂到指定位姿.
當ki>0且?i>bi時,有
將式(41)代入式(40),有
根據(jù)式(32),對V3求導,得
將式(38)、式(42)和式(43)代入式(29),有
所以
所以有ei(t)=ej(t),σic(t)=σjc(t),σi(t)=σj(t).根據(jù)式(20),有ξi(t)=σi(t).當t→∞,ξi(t)=ξj(t)時,(ηi(t) -ηj(t)) +vi(t) -vj(t)=0.根據(jù)一階微分方程性質(zhì),得t→∞,ηi(t) -ηj(t)=0,vi(t) -vj(t)=0.由上述分析可知,當且僅當V˙=0 時,多AUV 系統(tǒng)能夠?qū)崿F(xiàn)一致.因此,多AUV 系統(tǒng)最終能收斂到期望隊形.
證畢.
定理2在假設1—假設3 下,觸發(fā)律(24)和控制律(19)可以使跟隨者系統(tǒng)(28)無Zeno現(xiàn)象.
保證式(51)一定成立的情況下,設定如下條件:
與式(50)比較,得在觸發(fā)律(24)和控制律(19)條件下,可以使跟隨者系統(tǒng)(28)無Zeno現(xiàn)象.
證畢.
本文以4 艘跟隨者與一艘領航者組成的系統(tǒng)進行編隊研究,通過仿真驗證所提出定理的正確性和控制算法的有效性.
領航者AUV 與跟隨者AUV 同質(zhì),AUV 動力學方程中的標稱矩陣M、C(v)、D(v)參數(shù)如表1 所示,跟隨者AUV 的控制系統(tǒng)參數(shù)如表2 所示,通信拓撲如圖1 所示.領航者的固定位姿為η0=[0,0,0,0,π∕6]T,4 個跟隨者的初始位姿分別為η1=[-4.5,-5,1,π∕6,-π∕3]T,η2=[-4,-5,1,-π∕6,-π∕6]T,η3=[6,-5,2,π∕12,π∕3]T,η4=[10,-5,3,-π∕12,π∕6]T.
圖1 AUV的通信拓撲圖Fig.1 Communication topology map of AUV
表1 AUV模型參數(shù)Tab.1 Model parameter of AUV
表2 動態(tài)觸發(fā)控制系統(tǒng)參數(shù)Tab.2 Parameter of dynamic triggering control system
領航者固定,4 個跟隨者的初始速度v1=v2=v3=v4=[0,0,0,0,0]T,期望的編隊構(gòu)型d10=[2,2,0,0,0.152]T,d20=[1,4,0,0,0.152]T,d30=[-1,4,0,0,-0.152]T,d40=[-2,2,0,0,-0.152]T.AUV 重力Fi等于浮力Ti,F(xiàn)i=Ti.海洋擾動
為體現(xiàn)動態(tài)觸發(fā)策略優(yōu)越性,對靜態(tài)觸發(fā)策略進行仿真.靜態(tài)觸發(fā)函數(shù)作為動態(tài)觸發(fā)函數(shù)的一種特殊情況,當額外動態(tài)變量ρi(t)=0 時,得到靜態(tài)觸發(fā)函數(shù):
靜態(tài)觸發(fā)仿真的AUV 模型參數(shù)見表1,控制系統(tǒng)參數(shù)見表3,初始速度、初始位姿、編隊構(gòu)型、通信拓撲、浮力重力以及海洋擾動的選取均與動態(tài)觸發(fā)仿真一致.
表3 靜態(tài)觸發(fā)控制系統(tǒng)參數(shù)Tab.3 Parameter of static triggering control system
注6圖1 展示了AUV 編隊通過分布式動態(tài)事件觸發(fā)協(xié)議期望達到的最終隊形,這里控制目標是使領航者與跟隨者從不同平面收斂到同一水平面,縱傾角均收斂為0,跟隨者航向角均與領航者的航向角保持各自期望的偏差值.
圖1 展示了水下機器人之間的通信拓撲關(guān)系,其中領航者與跟隨者間的通信拓撲用鄰接矩陣B表示.
跟隨者之間的通信拓撲用拉普拉斯矩陣L表示.
圖2 為AUV 在x、y、z方向上的位置變化.由圖2可知,當時間到達6 s 以后,各個跟隨者AUV 均收斂到期望位置.圖3 給出了AUV 縱傾角與航向角的變化,由圖3 可知,當時間到達6 s 以后,各個跟隨者AUV 均收斂到期望姿態(tài)角.根據(jù)圖2 與圖3 可以得出,跟隨者AUV 在本文設計的控制器下可以收斂到期望位姿,AUV 編隊可以保持期望隊形.圖4給出了AUV 的線速度變化,由圖4 可知,當時間到達8 s 以后,各個跟隨者AUV 的線速度均可收斂至0.圖5 給出了AUV 的角速度變化,由圖5 可知,當時間到達8 s以后,各個跟隨者AUV的角速度均可收斂至0.圖6 給出了各個AUV 的測量誤差與閾值,由圖6 可知,各個AUV 的測量誤差與閾值逐漸收斂至0,證明跟隨者AUV 在本文設計的控制器下可以收斂到期望位姿,AUV 編隊可以保持期望隊形.圖7(a)給出了各個跟隨者AUV 在靜態(tài)觸發(fā)策略下的觸發(fā)時刻,可以看出3 s以后跟隨者AUV的觸發(fā)極其密集,無法達成減少觸發(fā)次數(shù)的目的;圖7(b)給出了各個跟隨者AUV 在動態(tài)觸發(fā)策略下的觸發(fā)時刻.對比圖7(a)(b),可以明顯看出,基于動態(tài)觸發(fā)的控制策略顯著增大了觸發(fā)間隔,從而減小了觸發(fā)次數(shù).圖7(b)驗證了跟隨者AUV 在所設計的動態(tài)觸發(fā)控制律下不存在Zeno現(xiàn)象.表4為不同觸發(fā)策略下的觸發(fā)次數(shù),由表4 可以看出,動態(tài)觸發(fā)策略能顯著減少觸發(fā)次數(shù),節(jié)省大量的通信資源.
表4 不同觸發(fā)策略下的觸發(fā)次數(shù)Tab.4 The number of triggering under different triggering strategies
圖2 各個AUV的位置Fig.2 Position of each AUV
圖3 各個AUV的姿態(tài)Fig.3 Posture of each AUV
圖4 各個AUV的線速度Fig.4 Linear velocity of each AUV
圖7 AUV觸發(fā)時刻Fig.7 The triggering instants of AUV
上述仿真試驗驗證了所設計的動態(tài)觸發(fā)律與協(xié)同編隊控制律的有效性與正確性,并排除了Zeno現(xiàn)象.
本文研究了基于動態(tài)事件觸發(fā)的AUV 分布式一致控制問題.通過一致性理論、滑模變結(jié)構(gòu)控制,設計了基于動態(tài)觸發(fā)的AUV 分布式控制策略.通過李雅普諾方程證明了所提出控制律與觸發(fā)律的正確性,并通過反證法,證明了觸發(fā)間隔存在一個正定下界,排除了Zeno 現(xiàn)象.仿真結(jié)果表明,所提出方法在考慮了具有外界干擾的情況下可以讓AUV 隊列收斂到期望位置,與連續(xù)通信相比,降低了能耗,減小了通信負擔;與靜態(tài)觸發(fā)的通信策略相比,觸發(fā)間隔更大,可進一步減小通信消耗.
在實際工程中,通信數(shù)據(jù)很有可能出現(xiàn)丟包或延遲的現(xiàn)象,而且實際AUV 的執(zhí)行器具有輸出約束,往往指令輸入信號與實際執(zhí)行信號之間存在巨大差異,但這兩個問題在本文中均被忽略了.因此,未來的研究工作將集中在:1)考慮丟包和時延對觸發(fā)控制的影響;2)考慮執(zhí)行器輸入飽和以及故障發(fā)生的情況,對控制器進行補償.