劉棕成,董新民,薛建平,張立鵬
(1.空軍工程大學航空航天工程學院,陜西西安710038;2.空軍西安飛行學院,陜西西安710306)
一類不確定執(zhí)行器非線性系統(tǒng)的自適應控制
劉棕成1,董新民1,薛建平1,張立鵬2
(1.空軍工程大學航空航天工程學院,陜西西安710038;2.空軍西安飛行學院,陜西西安710306)
針對一類帶不確定執(zhí)行器非線性的控制系統(tǒng),提出了一種自適應神經網絡控制方法。建立了包括死區(qū)、齒隙和“類齒隙”磁滯特征的非線性執(zhí)行器模型。通過結合所建立的模型和Nussbaum增益技術,解決了當執(zhí)行器非線性不確定時的控制問題。所設計的方案不需知道非線性特征參數邊界,并且當非線性特征為死區(qū)時,其坡度可以為時變的。引入了自適應補償項消除建模誤差和干擾的影響。仿真結果驗證了該方法的有效性。
自適應控制;執(zhí)行器非線性;Nussbaum函數;非線性系統(tǒng)
執(zhí)行器非線性廣泛存在于實際控制系統(tǒng)中,常見的類型有死區(qū)、齒隙和“類齒隙”磁滯[1]等。這三大類型都是非光滑的,并且普遍存在于機械連接、液壓伺服系統(tǒng)、壓電系統(tǒng)和電子伺服系統(tǒng)中。它們不僅會給控制系統(tǒng)帶來穩(wěn)態(tài)誤差,還會嚴重影響系統(tǒng)的控制性能,甚至造成系統(tǒng)的不穩(wěn)定。近年來許多學者針對這些執(zhí)行器非線性的系統(tǒng)進行了廣泛研究[13],以期消除其對控制系統(tǒng)的影響,并取得了一些顯著的研究成果。
文獻[4]提出了一種自適應逆的方法,在執(zhí)行器非線性特征參數都為常數的前提下,該方法可以通過構造死區(qū)[4]、齒隙[5]和磁滯[6]的自適應逆,將其與控制對象級聯(lián)起來以消除執(zhí)行器非線性的影響。文獻[7- 8]通過構造全局線性化模型將死區(qū)當作一個線性輸入與有界非線性擾動,從而設計了能克服死區(qū)影響的魯棒自適應控制方法。然而遺憾的是,這些方法都是在執(zhí)行器非線性類型已知的條件下才能有效。值得注意的是,在實際工程中執(zhí)行器的非線性輸出往往都是難以準確獲得的,而且甚至可能是完全不可測的[9],這將導致很難明確地判斷出執(zhí)行器非線性類型。并且有些非線性特征是相似的,例如齒隙[5]和“類齒隙”磁滯[1011]就難以區(qū)別。在機器操縱系統(tǒng)中,這種執(zhí)行器非線性類型難以判定的情況是經常存在的[12],然而對于這方面的研究目前卻嚴重不足。文獻[12]采用構建自適應逆的方法研究了帶不確定執(zhí)行器非線性的機器操控系統(tǒng)控制問題,但該方法要求死區(qū)或齒隙參數必須都為時不變常數。文獻[13]給出了一種執(zhí)行器含死區(qū)或齒隙的不確定非線性系統(tǒng)的變結構控制方法,其中死區(qū)參數可以是有界時變的,但要求死區(qū)或齒隙的參數邊界都已知。文獻[12]和文獻[13]存在的共同問題是僅限于執(zhí)行器存在死區(qū)和齒隙兩種情況,并且由于只是將控制方法進行簡單綜合,因此不具有一般性而難以推廣。
本文針對執(zhí)行器非線性類型不確定時的控制問題,提出了一種魯棒自適應跟蹤控制方法。該方法首先建立了一類具有非線性輸入特征的執(zhí)行器模型,所建立的模型包含了死區(qū)、齒隙和“類齒隙”磁滯這3種主要的執(zhí)行器非線性特征;然后利用Nussbaum增益技術,取消了系統(tǒng)控制方向已知的條件;通過引入自適應補償項消除了建模誤差和不確定干擾的影響;通過Lyapunov綜合方法,證明了閉環(huán)系統(tǒng)所有信號半全局一致終結有界,系統(tǒng)輸出能趨近于期望參考軌跡的鄰域。
考慮如下一類具有不確定執(zhí)行器非線性的控制系統(tǒng):
式中,x(t)=[x1(t),x2(t),…,xn(t)]T∈Rn為可測量狀態(tài)向量;y∈R為系統(tǒng)輸出;f(x)為未知光滑函數;Δ(t)表示外界擾動或系統(tǒng)的不確定項;b是不為0的常數;v(u(t))是具有一類未知非線性特征的執(zhí)行器的輸出。該執(zhí)行器模型可以描述為
式中,u為執(zhí)行器輸入;v(u(t))為執(zhí)行器輸出;k(u,t)是嚴格為正的未知函數;εu為建模誤差。
假設1 非線性執(zhí)行器輸出v(u(t))不可測。
假設2 模型式(2)中的未知函數k(u,t)滿足有界條件,即存在未知正數m1和m2使得
恒成立。
假設3 模型式(2)中的建模誤差εu為有界的,即存在一個未知常數ε*u>0使得|εu|≤ε*u恒成立。
假設4 存在未知常數d使得有界擾動|Δ(t)|≤d恒成立。
假設5 給定期望跟蹤軌跡yd是有界光滑的,即是連續(xù)有界的。
值得注意的是,本文所建立的非線性執(zhí)行器模型式(2)包含了死區(qū)、齒隙和“類齒隙”磁滯的情況。換言之,模型式(2)可以是上述3個類型中的任意一種,這是本文區(qū)別于其他大多數文獻的特點。對該問題具體的3種情形分析說明如下。
情形1 若執(zhí)行器帶死區(qū)非線性特征,其輸入輸出關系如圖1所示。
圖1 死區(qū)非線性
其模型[14]通常可以描述為
式中,ku(u)和kl(u)為死區(qū)坡度;bl>0和br>0為死區(qū)發(fā)生的起始點和終止點。一般來說存在未知正數kL和kM使得死區(qū)傾斜度ku(u)和kl(u)值均在正區(qū)間[kL,kM]中。因此,令模型式(2)中函數k(u,t)為
且
則顯然有kL≤k(u,t)≤kM,且|εu|≤εu*,εu*為kM· max{|br|,|bl|}。將式(5)兩邊同時乘以變量u并加上式(6),再將得到的式子代入式(2)。不難發(fā)現(xiàn),死區(qū)模型式(4)可用模型式(2)表示,且滿足假設2和假設3。與文獻[12]中所研究的死區(qū)模型相比,式(4)中的死區(qū)坡度ku(u)和kl(u)可以是時變的,并且不需要知道其邊界kL和kM的值。
情形2 若執(zhí)行器帶齒隙非線性特征,其輸入輸出關系如圖2所示。
圖2 齒隙非線性
其模型[15]通??梢悦枋鰹?/p>
式中,m>0為齒隙坡度;Br>0和Bl<0為相關位置。令模型式(2)中函數k(u,t)為
且
顯然可以看出εu為有界[15],且ε*u=max{|mBr|,|mBl|}。將式(8)兩邊同時乘以變量u并加上式(9),再將得到的式子代入式(2)。不難發(fā)現(xiàn),齒隙模型式(7)可用模型式(2)表示。
情形3 若執(zhí)行器帶“類齒隙”磁滯非線性特征,其輸入輸出關系如圖3所示。
圖3 “類齒隙”磁滯非線性
其模型[11]通??梢悦枋鰹?/p>
式中,α,c和B1為未知正數。由文獻[11]可知,式(10)能被寫為v(t)=cu(t)+d1(u),其中d1(u)是一個有界函數[11]。令k(u,t)=c且εu=d1(u),顯然,“類齒隙”磁滯模型也可用模型式(2)表示,且滿足假設2和假設3。
由于系統(tǒng)式(1)中存在未知函數,本文將采用徑向基(radial basis function,RBF)神經網絡進行逼近。RBF神經網絡是一個線性參數化的神經網絡,其能以任意精度逼近任何連續(xù)非線性函數h(Z),即
式中,輸入向量Z∈Ωz?Rn,n是神經網絡的輸入維數;ε為神經網絡的逼近誤差且滿足|ε|≤ε*,ε*是未知正數;(Z)∈Rl是基函數向量,l是神經網絡節(jié)點數;W*∈Rl是最優(yōu)權重向量,其定義為
式中,W為任意的權重向量。
將模型式(2)代入式(1)可以看出,未知量bk(u,t)可以近似地看成閉環(huán)系統(tǒng)的控制增益,為了解決控制增益不確定的問題,引入Nussbaum函數。
定義1 如果連續(xù)函數N(ζ):R→R滿足
則稱N(ζ)為Nussbaum函數。
引理1[16]已知V(·)和ζ(·)是[0,tf)上的光滑函數且V(t)≥0,tf∈[0,∞],N(ζ)是Nussbaum函數,如果下列不等式成立:在區(qū)間[0,tf)上有界。
式中,c1為適當的常數;c2為正數;g(x(τ))為取值在區(qū)間I=[l-,l+]的任意函數,其中0?I。那么必有V(t),ζ(t)和
控制目標:考慮執(zhí)行器帶有不確定特征的情況下,針對非線性系統(tǒng)式(1),利用Nussbaum增益技術設計一種魯棒自適應控制器u,使得系統(tǒng)所有信號半全局一致終結有界,且系統(tǒng)輸出y能趨近于期望的給定軌跡yd。
文中,‖·‖表示·的2-范數;·^表示·*的估計值;表示矩陣A的最大特征值。并且,取Nussbaum函數
在所有狀態(tài)量x均為可利用的條件下,設計能實現(xiàn)控制目標的魯棒自適應控制器。為此,先定義一個期望跟蹤向量xd和誤差向量ξ
然后利用滑模面的思想定義一個濾波跟蹤誤差
式中,Λ=[λ1,λ2,…,λn-1]T是一個可設計的參數向量,它使得sn-1+λn-1sn-2+…+λ1為Hurwitz多項式。對濾波跟蹤誤差求關于時間的導數,可得
為考察式(13)所描述的系統(tǒng)穩(wěn)定性,定義一個二次型正定函數
沿著式(13)對Ve求導,可得
由假設4及式(15)可以得到
式中,Yd=-y(n)d+[0ΛT]ξ。將式(2)代入式(16),并利用假設3,可以得到
注意到式(17)中含有未知函數f(x)。因此為了能夠繼續(xù)設計控制器,在此采用一個RBF神經網絡對未知函數進行逼近,即
式中,ε是逼近誤差,并且由RBF網絡的逼近性質可知存在未知正數ε*使得|ε|≤ε*恒成立。由于最優(yōu)權重向量W*未知,因此利用其估計值^W來進行控制器設計,^W的值將在后面給出。將式(18)代入式(17),可以得到
式中,δ*=ε*+ε*u+d為未知正數,它包含神經網絡逼近誤差、建模誤差和未知干擾項,將在后面設計一個自適應補償項將該項誤差消除。
考慮如下所示的Lyapunov函數:
式中,Γ=Γ-1是自適應增益矩陣;γ是一個自適應增益系數;~W=W*-^W且δ~=δ*-^δ,^δ的值將在后面給出。
由式(19)可得V關于時間的導數為
設計控制律和自適應律為
式中,β>0,τ>0,σ1>0和σ2>0均為設計參數。
下面對所設計閉環(huán)控制系統(tǒng)所有信號的穩(wěn)定性進行分析。
將式(22)代入式(21),可以得到
在式(25)的右邊同時加減˙ζ,可得
將式(24)代入式(26),得
由于下列不等式對于任意的τ>0和e∈R恒成立[17]
將式(28)代入式(27),可得
利用如下不等式:
可將式(29)進一步轉化,并整理得
其中
將式(30)兩邊同時乘以ea1t,并對式(30)兩邊的t同時積分,得
由假設2可知k(u,τ)?[m1,m2],則由引理1知V(t),
則由式(31)和式(32)可得
由V(t)有界和式(20)可得閉環(huán)系統(tǒng)所有信號^W,^δ,e和ξ均為半全局一致終結有界。
由式(20)和式(33)可得
因此,可以通過調節(jié)設計參數使得系統(tǒng)輸出趨近于期望跟蹤軌跡的一個小鄰域內。
為了驗證本文所提理論及設計控制方法的有效性,將其應用到文獻[13]構造的機器人系統(tǒng)中的一個單桿連接控制。機器人系統(tǒng)存在著大量的機械連接,因此它實際上是執(zhí)行器非線性理論一個重要的實際應用領域。本文所考慮的單桿連接系統(tǒng)數學模型為
式中,f(x(t))=-x2+3.5x22cos x1-35sin x1;b=1;Δ(t)=0.8e-0.2tsin t。系統(tǒng)狀態(tài)變量x1=θ表示角位移;它的導數為x2=˙θ。值得注意的是,與大多數文獻不同,仿真算例式(35)中的非線性執(zhí)行器v(u(t))可能帶有死區(qū)、齒隙或“類齒隙”磁滯中的任意一種。
此次仿真中,控制器u(t)的設計為式(22),參數自適應律為式(23)和式(24)。選取高斯函數作為RBF神經網絡的基函數,即
仿真中選擇RBF神經網絡為:^WT(x)包含l=9個節(jié)點,中心μi(i=1,2,…,9)均勻分布在[-4,4]×[-4,4];寬度υi=2(i=1,2,…,9)。神經網絡權值初值^W(0)均設為零。
系統(tǒng)的給定期望輸出軌跡設置為yd=0.5(sin t+sin(0.5t)),系統(tǒng)狀態(tài)的初始值為x1(0)=0和x2(0)=0,參數自適應估計初值設置為^δ(0)=0和ζ(0)=1。選擇設計參數為:Γ=diag[0.5],λ1=2,σ1=σ2=0.5,γ=1.5,τ=0.5,β=3。至此,本仿真算例中的控制器設計已經完成。下面分3種情況來考察所設計控制器的有效性。
情況1 若執(zhí)行器的非線性特征為死區(qū)時,其仿真所用數學模型為
顯然,它滿足假設2和假設3。仿真中,將本文與文獻[13]的實驗結果作對比,如圖4所示。
圖4 執(zhí)行器帶死區(qū)非線性時的仿真曲線
圖4 中,yd是目標曲線;y,e和u分別是應用本文所設計的控制方法得到的系統(tǒng)輸出、跟蹤誤差和控制輸入;y′,e′和u′分別是應用文獻[13]方法得到的系統(tǒng)輸出、跟蹤誤差和控制輸入。從圖4可以看出,本文所設計的控制器能夠很快地使系統(tǒng)輸出跟蹤期望的軌跡曲線,實現(xiàn)了較好的跟蹤效果。相比于文獻[13],本文方法的跟蹤誤差更小,而且避免了文獻[13]由于控制律的切換造成的顫振。
情況2 若執(zhí)行器的非線性特征為齒隙,其模型為
無需改變控制器,采用與前面相同的控制器所得到的仿真結果如圖5所示。從圖5可以看出,即使執(zhí)行器的非線性特征已經改變,所設計的控制方法仍然取得了滿意的控制效果。
圖5 執(zhí)行器帶齒隙非線性時的仿真曲線
情況3 若執(zhí)行器的非線性特征為“類齒隙”磁滯,其模型[11]為
根據前面的分析可知它也滿足假設2和3,應用所設計的控制器得到仿真結果如圖6所示。
圖6 執(zhí)行器帶“類齒隙”磁滯時的仿真曲線
從所得到的仿真結果圖4~圖6可以看出,即使執(zhí)行器存在非線性且其特征不確定,所設計的控制方法仍然能使系統(tǒng)的輸出曲線很好地跟蹤期望軌跡曲線,達到了非常好的跟蹤效果。
本文針對一類執(zhí)行器非線性特征不確定的控制系統(tǒng),提出了一種魯棒自適應神經網絡跟蹤控制方案。該方案的主要特點有:①不需明確知道執(zhí)行器非線性屬于死區(qū)、齒隙或“類齒隙”磁滯中的哪一種,在執(zhí)行器具有此類特征中的任何一種時所設計方法都有效可用;②取消了非線性特征參數上下邊界需已知的假設,并且所考慮的死區(qū)坡度可以是有界時變的;③引入了自適應補償項消除建模誤差、神經網絡逼近誤差和外界干擾造成的影響;④本文設計的控制方法若與反推技術結合,能很容易地拓展為嚴反饋非線性系統(tǒng)穩(wěn)定跟蹤控制器。
[1]Su C Y,Masahiro O,Henry H.Stable adaptive fuzzy control of nonlinear systems preceded by unknown backlash-like hysteresis[J].IEEE Trans.on Fuzzy System,2003,11(1):1- 8.
[2]Zhou J,Wen C,Zhang Y.Adaptive output control of nonlinear systems with uncertain dead-zone nonlinearity[J].IEEE Trans. on Automatic Control,2006,51(3):504- 511.
[3]Luo X,Wu X.Adaptive backstepping fault-tolerant control for unmatched non-linear systems against actuator dead-zone[J].IET Control Theory and Applications,2011,5(15):879- 888.
[4]Cho H,Bai E.Convergence results for an adaptive dead zone inverse[J].International Journal of Adaptive Control and Signal Process,1998,12(1):451- 466.
[5]Zhou J,Zhang C J,Wen C Y.Robust adaptive output control of uncertain nonlinear plants with unknown backlash nonlinearity[J].IEEE Trans.on Automatic Control,2007,52(3):503- 509.
[6]Tao G,Kokotovic P V.Adaptive control of plants with unknown hysteresis[J].IEEE Trans.on Automatic Control,1995,40(3):200- 212.
[7]Zhang T P,Ge S S.Adaptive dynamic surface control of nonlinear systems with unknown dead zone in pure feedback form[J].Automatica,2008,44(7):1895- 1903.
[8]Wang J H,Hu J.Robust adaptive neural control for a class of uncertain non-linear time-delay systems with unknown dead-zone non-linearity[J].IET Control Theory and Applications,2011,5(15):1782- 1795.
[9]Zhang T P,Ge SS.Adaptive neural network tracking control of MIMO nonlinear systems with unknown dead zones and control directions[J].IEEE Trans.on Neural Networks,2009,20(3):483- 496.
[10]Wen C,Zhou J.Decentralized adaptive stabilization in the presence of unknown backlash-like hysteresis[J].Automatica,2007,43(3):426- 440.
[11]Zhou J,Wen C,Zhang Y.Adaptive backstepping control of a class of uncertain nonlinear systems with unknown backlashlike hysteresis[J].IEEE Trans.on Automatic Control,2004,49(10):1751- 1757.
[12]Miyasato Y.Nonlinear adaptive H∞control of constrained robotic manipulators with input nonlinearity[C]∥Proc.of the American Control Conference,2009:2000- 2005.
[13]Conrradini M,Orlando G.Robust stabilization of nonlinear uncertain plants with backlash or dead zone in the actuator[J].IEEE Trans.on Control Systems Technology,2002,10(1):158- 166.
[14]Wang J H,Hu J B.Robust adaptive control of nonlinear systems with actuator dead-zone fault[J].Systems Engineering and Electronics,2012,34(1):142- 148.(王堅浩,胡劍波.非線性系統(tǒng)執(zhí)行器死區(qū)故障的魯棒自適應控制[J].系統(tǒng)工程與電子技術,2012,34(1):142- 148.)
[15]Guo J,Wu Y F,Chen Q W,et al.Adaptive control of a nonlinear system with input backlash[J].Acta Armamentarii,2011,32(10):1298- 1304.(郭健,吳益飛,陳慶偉,等.具有輸入齒隙的一類非線性系統(tǒng)自適應控制[J].兵工學報,2011,32(10):1298 -1304.)
[16]Ge S S,Hong F,Lee T H.Adaptive neural control of nonlinear time-delay system with unknown virtual control coefficients[J].IEEE Trans.on Systems,Man and Cybernetics,2004,34(1):499- 516.
[17]Polycarpou M,Ioannou P.A robust adaptive nonlinear control design[J].Automatica,1995,31(1):423- 427.
Adaptive control for a class of nonlinear systems with uncertain actuator nonlinearity
LIU Zong-cheng1,DONG Xin-min1,XUE Jian-ping1,ZHANG Li-peng2
(1.College of Aeronautics and Astronautics Engineering,Air Force Engineering University,Xi’an 710038,China;2.Air Force Xi’an Flight College,Xi’an 710306,China)
An adaptive neural network control method is proposed for a class of control systems with uncertain actuator nonlinearity.A model for the nonlinear actuator is developed which includes the characteristics of dead zone,backlash and“backlash-like”hysteresis.By combining the developed model and the Nussbaum-gain technique,the problem of uncertain actuator nonlinearity is solved perfectly.The proposed scheme does not require the prior knowledge on the bounds of parameters of the motioned characteristics,and the slopes of dead zone can be time variant when dead zone nonlinearity is concerned.The adaptive compensation term is adopted to minify the influence of modeling error and external disturbance.Simulation results are presented to demonstrate the effectiveness of this method.
adaptive control;actuator nonlinearity;Nussbaum-type function;nonlinear system
TP 273
A
10.3969/j.issn.1001-506X.2015.01.26
劉棕成(1987-),男,博士研究生,主要研究方向為先進控制理論與應用。E-mail:liu434853780@163.com
董新民(1963-),男,教授,博士研究生導師,博士,主要研究方向為飛行器導航、制導與控制。
E-mail:dongxinmin@139.com
薛建平(1967-),男,副教授,碩士研究生導師,碩士,主要研究方向為飛行器控制理論及應用、系統(tǒng)自動化檢測與維護保障。
E-mail:xiankgy@163.com
張立鵬(1986-),男,講師,碩士,主要研究方向為非線性系統(tǒng)控制理論及其應用。
E-mail:zhang121860@163.com
1001-506X(2015)01-0163-06
網址:www.sys-ele.com
2013- 12- 16;
2014- 06- 05;網絡優(yōu)先出版日期:2014- 08- 05。
網絡優(yōu)先出版地址:http://w ww.cnki.net/kcms/detail/11.2422.TN.20140805.1341.003.html
國家自然科學基金(61304120)資助課題