楊浩 裴海龍
(華南理工大學 自動化科學與工程學院,廣東 廣州 510640)
高階擾動在實際系統(tǒng)中經常出現(xiàn),如輪式倒立擺[1]、無人直升機[2]和柔性機械臂[3]等。按照進入被控對象的具體形式,擾動可以分為匹配擾動和非匹配擾動。對含有非匹配擾動項的被控對象進行控制器設計所面臨的難度更大,因此相關抗擾控制器的設計方法一直備受關注,并吸引了大量研究人員參與。近年來產生了不少針對非匹配擾動項的抗擾控制方法,如基于LMI的滑??刂品椒╗4]、H∞控制方法[5]和自適應控制方法[6]等。該類方法在抵消擾動項影響時會犧牲閉環(huán)系統(tǒng)的標稱反饋控制性能[7],而基于觀測器的抗擾控制方法可以單獨設計基于擾動觀測的前饋模塊與反饋控制模塊,從而避免了標稱反饋性能與抗擾性之間的沖突[8- 10]。
有限時間觀測器(FTDO)是一種滑模觀測器。在文獻[8- 10]中,研究人員針對含有高階非匹配擾動項的多種仿射系統(tǒng)提出了基于FTDO的控制方法,并實現(xiàn)了被控系統(tǒng)對期望固定點的漸進跟蹤。然而該類方法要求被控系統(tǒng)具有仿射結構,且系統(tǒng)的相對階需要與自身階次相同。非仿射非線性系統(tǒng)在實際系統(tǒng)中很常見,如均質充量壓縮點火式發(fā)動機[11]、大迎角飛行下的舵面控制系統(tǒng)[12]和超音速飛行器[13]等。針對非仿射非線性系統(tǒng)的常見控制方法有線性化方法、擴張狀態(tài)法和基于人工神經網絡與模糊控制的方法等。然而,僅在平衡點附近有效、引入奇點或運算負荷較大等因素限制了上述方法在實際系統(tǒng)中的應用[14- 15]。本文針對一類含有高階擾動項的非仿射非線性系統(tǒng)的跟蹤控制問題提出了一種基于FTDO的非線性控制器設計方法。首先構建FTDO,并通過觀測輸出對被控系統(tǒng)進行重構;之后應用一種被稱為“近似動態(tài)逆”的非線性動態(tài)逆控制方法進行控制器設計,該方法作為一種基于奇異值攝動理論的非線性動態(tài)逆控制器,并沒有引入奇點,且解決了反步法中常見的“復雜性爆炸”問題[14- 16]。在控制器設計過程中,首先搭建一個快變子系統(tǒng)以求得非仿射函數的精確逆;然后在慢時間尺度下使重構系統(tǒng)轉換為仿射形式,并通過奇異值攝動理論確保閉環(huán)系統(tǒng)的跟蹤性能;最后通過仿真驗證了控制器的跟蹤性能與有效性。
考慮如下含有高階非匹配擾動項的非仿射純反饋非線性系統(tǒng):
(1)
(2)
設標稱系統(tǒng)(2)和參考軌跡yr分別滿足下列假設。
注1 假設1是近似動態(tài)逆控制器設計過程中的常見假設[14- 16]。
假設2 參考軌跡yr及其高階導數存在且有界。
由于式(1)所具有的非仿射結構無法直接應用文獻[4- 10]中基于FTDO的抗擾控制算法,所以接下來將通過近似動態(tài)逆方法為非仿射非線性系統(tǒng)(1)設計基于FTDO的跟蹤控制器,使輸出信號y在任意有限時間段內跟蹤期望軌跡yr。
考慮具有如下形式的非線性系統(tǒng):
(3)
(4)
邊界層子系統(tǒng)為
(5)
其中,e=κ-h(t,x),ξ0=ξ(0),η0=η(0)。
引理1[17]令κ=h(t,x)為奇異值攝動系統(tǒng)(3)對應代數方程0=g(t,x,κ,0)的孤立根。假設下列條件對于所有(t,x,κ-h(t,x),)∈[0,t1]×Dx×De×[0,0]成立:
(1)函數f、g以及它們對(x,κ,)的一階偏導數和g對時間t的一階偏導數連續(xù);h(t,x)和雅克比矩陣[?g(t,x,κ,0)/?κ]對其自變量都存在連續(xù)的一階偏導數;函數ξ()和η()是關于的光滑函數。
(3)式(5)表示的邊界層子系統(tǒng)的原點是指數穩(wěn)定平衡點,且在(t,x)上一致;令e?De為邊界層子系統(tǒng)的吸引區(qū),Ωe為e的緊子集。
(6)
文獻[16]指出,引理1中的條件(3)可以通過下面的引理2來驗證。
(7)
(?(t,x)∈[0,t1]×Dx)
則有e=0為邊界層子系統(tǒng)的指數穩(wěn)定平衡點。其中c為正常數。
針對式(1)中含有高階非匹配擾動項的非仿射非線性系統(tǒng)設計如下FTDO:
(8)
(9)
(10)
值得注意的是,式(10)中的重構系統(tǒng)依然是一個具有非仿射結構的純反饋非線性系統(tǒng),可將式(10)寫成如下更為緊湊的形式:
(11)
(12)
本節(jié)將通過反步法為式(12)中的標稱系統(tǒng)設計近似動態(tài)逆控制器。
(13)
(14)
ε為待調的奇異值攝動參數,函數Q1的定義如下:
(15)
(16)
其中v1=α1-h1。根據奇異值攝動理論,令ε→0,則可以得到式(16)中奇異值攝動系統(tǒng)的降階慢變子系統(tǒng):
(17)
與邊界層子系統(tǒng):
(18)
注3 從式(14)的虛擬控制量α1的動態(tài)方程中可以看出,奇異值攝動參數ε獨立于被控系統(tǒng)的具體結構。這表明降階慢變子系統(tǒng)(17)與邊界層子系統(tǒng)(18)之間時標分離的有效性與原系統(tǒng)固有的時標分離特性無關。
(19)
(20)
虛擬控制量αi的動態(tài)方程定義如下:
(21)
函數Qi定義為
(22)
(23)
其中vi=αi-hi。令ε→0,可以得到式(23)所對應的降階慢變子系統(tǒng):
(24)
與邊界層子系統(tǒng):
(25)
注4 從式(22)中可以看出,虛擬控制量的導數可以通過Qi直接得到,而無需對前面步驟中的虛擬控制量αi-1進行求導,從而避免了反步法中常見的“復雜性爆炸”問題[14- 16]。
(26)
實際控制量u的動態(tài)方程定義為
(27)
函數Qn設計為
(28)
(29)
其中vn=u-hn。令ε→0,可以得到式(29)中奇異值攝動系統(tǒng)對應的降階慢變子系統(tǒng):
(30)
與邊界層子系統(tǒng):
(31)
至此,控制器設計完畢。
證明將式(14)、(21)和(27)構成的近似動態(tài)逆控制器代入式(10)中的重構系統(tǒng),則包含F(xiàn)TDO和控制器的整個閉環(huán)系統(tǒng)可以表示為如下奇異值攝動標準型:
(32)
其中,v=[v1v2…vn]T∈Rn,q=[Q1Q2…Qn]T,h=[h1h2…h(huán)n]T,且
(33)
按照奇異值攝動理論,令ε→0,則可得到系統(tǒng)(32)的降階慢變子系統(tǒng):
(34)
和邊界層子系統(tǒng):
(35)
其中A=diag(-k1,…,kn),為Hurwitz矩陣。
根據假設1、定理1的條件(2)可得:
(36)
由引理2可知邊界層子系統(tǒng)在原點處局部指數穩(wěn)定。根據參考文獻[10],為降階慢變子系統(tǒng)(34)定義有限時間有界函數(FTBF):
(37)
對式(37)求導并代入式(34):
(38)
(39)
y(t)=yr(t)+O(ε)
(40)
證畢。
注5 從式(34)中可以看出,反饋增益k1,k2,…,kn將決定降階慢變子系統(tǒng)特征根的位置,因此應根據控制任務對閉環(huán)動態(tài)性能的具體要求選取合適的參數。
注6 奇異值攝動參數ε應選取足夠小的數值,以保證降階慢變子系統(tǒng)和邊界層子系統(tǒng)之間時標分離的有效性。此外,從式(40)中可以看出,較小的ε取值也能降低閉環(huán)系統(tǒng)的跟蹤誤差。
考慮如下含有高階非匹配擾動項的非仿射非線性被控對象[16]:
(41)
按照式(8)為式(41)構建如下FTDO:
(42)
(43)
(44)
圖1 x1和的響應曲線、ADI作用下的響應曲線x1c以及參考軌跡yr
圖2 跟蹤誤差e1和e1c的響應曲線Fig.2 Response curves of tracking errors e1 and e1c
圖3 x2、x2c和的響應曲線Fig.3 Response curves of x2,x2c and
圖5 控制輸入曲線Fig.5 Curve of control input
考慮單連桿的機電系統(tǒng)如下所示[18]:
(45)
從圖6所示狀態(tài)響應曲線可以看出,在本文控制器的作用下,即便存在高階擾動項,系統(tǒng)(45)的輸出信號依然可以快速跟蹤參考軌跡;同時,另外兩個狀態(tài)也能夠保持在理想的區(qū)間范圍內。在圖6和圖7中,FTDO的觀測輸出能夠快速、準確地跟蹤各個狀態(tài)變量和擾動項。圖8所示控制輸入的響應曲線表明本文的控制器在起始階段快速增長,以使系統(tǒng)的輸出誤差迅速降低,并在之后進入穩(wěn)定的區(qū)間,從而保證了控制效果。
圖6 狀態(tài)與對應觀測輸出及參考軌跡的響應曲線
圖7 擾動項與對應觀測輸出的響應曲線
圖8 控制輸入曲線Fig.8 Curve of control input
本文針對一類含有高階非匹配擾動項的非仿射非線性系統(tǒng)的跟蹤控制問題,提出了基于有限時間觀測器(FTDO)的非線性近似動態(tài)逆控制器。針對以往研究中FTDO僅能應用于具有仿射結構的非線性系統(tǒng)且只能保證系統(tǒng)輸出跟蹤期望固定點的局限,本文提出的控制方法擴展了FTDO的適用范圍,使其可以應用于非仿射非線性系統(tǒng)對時變軌跡的跟蹤問題;同時本文控制器的有效性不依賴于被控系統(tǒng)固有的時標分離特性,并且避免了反步法中常見的“復雜性爆炸”問題。該控制方法結構簡單且具有良好的可操作性,僅比文獻[9]中的控制器增加了一個待調參數ε。仿真結果也驗證了控制器的有效性以及觀測與跟蹤性能。需要指出的是,本文并未求出ε*的具體值,因此如何確定時標分離參數的邊界是下一步研究的重點。