張驍駿 袁夏明 王向陽 朱紀洪 李春文
滑??刂品椒ㄊ且活惪刂菩袨椴贿B續(xù)的非線性控制方法,通過控制量切換迫使系統(tǒng)狀態(tài)沿著預(yù)定的滑模面運動,具有設(shè)計簡單、對匹配不確定性和外部擾動魯棒性強的特點,因而在機器人[1]、飛行器[2]、伺服系統(tǒng)[3]、發(fā)電機組[4]等對象中得到了廣泛的研究與應(yīng)用.滑??刂品椒ㄔO(shè)計時首先根據(jù)期望系統(tǒng)軌跡選擇滑模面,然后設(shè)計反饋控制律,使系統(tǒng)軌跡到達并駐留在滑模面上.滑模控制方法的缺點在于其控制律中包含不連續(xù)的高頻切換項會導(dǎo)致“抖振現(xiàn)象”.針對抖振現(xiàn)象,相關(guān)文獻提出了基于“邊界層”的準滑模動態(tài)方法[5]、動態(tài)滑模方法[6]、高階滑模方法[7]等解決方法.
傳統(tǒng)的滑模設(shè)計方法通常選擇線性超平面,收斂速度可以通過參數(shù)調(diào)節(jié),但只能得到系統(tǒng)狀態(tài)的漸近收斂特性.終端滑??刂品椒?Terminal sliding mode control,TSMC)在超平面設(shè)計中引入非線性函數(shù),實現(xiàn)了系統(tǒng)狀態(tài)的有限時間收斂.Bhat等[8]給出了基于李雅普諾夫函數(shù)的有限時間穩(wěn)定性定理和收斂時間估計.有限時間穩(wěn)定理論的時間上界與初值有關(guān),學(xué)者們進一步研究了具有固定時間上界的固定時間穩(wěn)定性理論.Polyakov 等研究了基于李雅普諾夫方法[9]和隱李雅普諾夫方法[10]的固定時間穩(wěn)定性理論,并應(yīng)用于終端滑??刂破髟O(shè)計[9].標準的終端滑??刂圃谀承┫到y(tǒng)狀態(tài)下會出現(xiàn)奇異問題,限制了其實際應(yīng)用.Feng等[11]探討了有限時間非奇異終端滑模面的設(shè)計問題,在此基礎(chǔ)上,Yang等[12]研究了固定時間收斂非奇異終端滑模面.Zuo等[13]針對二階非線性系統(tǒng)設(shè)計了新型固定時間終端滑模面,并使用了倒立擺模型作為基準測試平臺.在此基礎(chǔ)上,Li等[14]和Corradini等[15]分別設(shè)計新型非奇異終端滑模面,并使用該倒立擺模型進行了測試.Levant等[16]和Andrieu等[17]研究了基于齊次性理論的有限/固定時間收斂理論,并應(yīng)用于觀測器[18]和魯棒微分器[19]設(shè)計.由于其快速收斂性和魯棒性,固定時間終端滑模控制器在飛行控制[20]、潛航器控制[21]、多智能體控制[22]、電力混沌系統(tǒng)控制[23]、電機無位置控制[24]等方面得到了廣泛的應(yīng)用.
模型參考控制的目標是設(shè)計補償控制器使得被控對象的輸出盡可能跟蹤參考模型的輸出,使廣義誤差收斂至零[25].補償控制器用來補償被控對象與參考模型的狀態(tài)誤差、對象模型不確定性和外部擾動.模型參考自適應(yīng)[25]基于穩(wěn)定性理論設(shè)計自適應(yīng)律調(diào)節(jié)補償控制器參數(shù).在其基礎(chǔ)上,L1 自適應(yīng)[26]引入低通濾波器使得自適應(yīng)性能與魯棒性能解耦,保證閉環(huán)系統(tǒng)的魯棒性和動態(tài)性能.除此之外,還可以通過信號補償方法[27]、神經(jīng)網(wǎng)絡(luò)[28]、滑模控制[29]等方法設(shè)計補償控制器.模型參考控制方法將跟蹤問題轉(zhuǎn)換為廣義誤差系統(tǒng)的鎮(zhèn)定問題,便于設(shè)計系統(tǒng)動態(tài)特性,在機械臂控制[30]、飛行控制[31]、混沌系統(tǒng)控制[32]等方面得到了廣泛應(yīng)用.
現(xiàn)有模型參考方法只能得到廣義誤差漸近收斂的結(jié)論,本文將固定時間收斂終端滑??刂品椒☉?yīng)用于模型參考方法的反饋控制器設(shè)計,使得被控對象狀態(tài)在固定時間內(nèi)收斂到參考模型狀態(tài).首先,在模型參考控制基礎(chǔ)上設(shè)計新的控制結(jié)構(gòu),引入輸入限幅和補償信號濾波,保證補償信號無損地輸入廣義誤差系統(tǒng).然后設(shè)計了一種新型的固定時間終端滑模面,其可以較好地平衡遠離和靠近平衡點收斂速度.在其基礎(chǔ)上針對廣義誤差系統(tǒng)設(shè)計終端滑??刂破?使得廣義誤差信號在固定時間內(nèi)收斂到零.使用李雅普諾夫方法證明了閉環(huán)系統(tǒng)的穩(wěn)定性并給出了收斂時間上界的估計.最后,將該方法應(yīng)用于存在極限環(huán)的非線性對象控制中,分別針對二階[33]和三階[34]對象進行了仿真,并與現(xiàn)有算法進行了比較,驗證了該方法的控制效果和魯棒性.
本文后續(xù)內(nèi)容安排如下:第1 節(jié)給出預(yù)備知識和定理,并介紹了被控對象;第2 節(jié)提出了新的控制器結(jié)構(gòu)和滑模面,針對誤差動態(tài)設(shè)計了固定時間終端滑??刂破?證明了閉環(huán)系統(tǒng)的穩(wěn)定性并得到了收斂時間上界的估計;第3 節(jié)采用兩種仿真模型進行仿真驗證和比較;最后對本文進行了總結(jié).
考慮如下具有模型不確定性和外部擾動的時變Byrnes-Isidori 標準型系統(tǒng)[35]
其中,x=[x1x2··· xn]T∈Rn為系統(tǒng)狀態(tài)變量,f(x)為非線性光滑函數(shù),且f(0)=0.Δf(x,t)和d(x,t)分別表示模型不確定性和外部擾動,且存在上界使得|Δf(x,t)|<D1,|d(x,t)|<D2.合并表示為等價干擾的形式為dn(x,t)=Δf(x,t)+d(x,t),則有|dn(x,t)|<D=D1+D2.
參考模型可以表示為
為了方便進行動態(tài)特性設(shè)計,一般采用線性定常系統(tǒng),即fm(xm)=[-am1··· -amn]xm.輸入um=kgr(t),其中r(t)為指令信號,為參考模型直流增益的逆.本文的控制目標是使系統(tǒng)狀態(tài)x跟蹤參考模型狀態(tài)xm,從而實現(xiàn)對輸入信號r(t)的期望響應(yīng).
Bhat等[8]首先研究了有限時間收斂理論并給出了基于李雅普諾夫函數(shù)的判定條件
定義1[8].若系統(tǒng)(1)滿足:1)原點是漸近穩(wěn)定平衡點;2)存在原點的開鄰域Dn和正定函數(shù)T(x0):Dn→R使得對于所有x0∈Dn{0}有
則原點是有限時間穩(wěn)定的.當Dn=Rn時,原點是全局有限時間穩(wěn)定的.
定理1[8].若存在連續(xù)正定方程V(x):Rn→R滿足
其中,參數(shù)α,p>0,p<1.則系統(tǒng)(1)是全局有限時間穩(wěn)定的,且收斂時間為T(x0)≤1/(p(1-α))V(x0)1-α.
在有限時間收斂理論的基礎(chǔ)上,Polyakov等[9]研究了固定時間收斂理論及其判定條件.
定義2[9].若系統(tǒng)(1)滿足:1)原點是全局有限時間穩(wěn)定平衡點;2)存在一個與初始值無關(guān)的收斂時間上界,即存在Tmax>0使得T(x0)<Tmax,?x0∈Rn.則原點是固定時間穩(wěn)定的.
定理2[9].若存在連續(xù)正定方程V(x):Rn→R滿足
其中,參數(shù)α,β,p,q>0,p<1,q>1,則系統(tǒng)(1)是全局固定時間穩(wěn)定的,且收斂時間上界為T(x0)<Tmax=1/(α(1-p))+1/(β(q-1)).
在傳統(tǒng)的模型參考結(jié)構(gòu)的基礎(chǔ)上,本文在補償控制器通道加入低通濾波器,在總輸入通道加入限幅,得到如圖1 所示的控制器結(jié)構(gòu).
圖1 模型參考控制器結(jié)構(gòu)Fig.1 Structure of the model reference controller proposed
設(shè)計被控對象輸入u(t)為
其中,sat(u)為限幅函數(shù),限幅值為被控對象輸入飽和邊界umax,參考輸入不會達到飽和邊界,引入函數(shù) satn(u)表示施加在補償信號上的等效限幅函數(shù),uC為固定時間補償控制器輸出.
設(shè)計參考模型輸入um(t)為
補償控制量沒有達到飽和邊界且高頻信號弱時,um(t)≈kgr(t).
將式(6)和式(7)分別輸入被控對象(1)和參考模型(2),得到系統(tǒng)閉環(huán)廣義誤差信號=xm-x的方程為
對于誤差系統(tǒng),補償控制量uC不受限幅和濾波的影響,不影響誤差狀態(tài)收斂性;同時通過限幅函數(shù)sat(u)和低通濾波器C(u),將超過umax、高頻的補償信號輸入到參考模型中,避免輸入長時間飽和和高頻補償信號激發(fā)被控對象的未建模動態(tài),導(dǎo)致系統(tǒng)不穩(wěn)定.本文采用固定時間終端滑模方法設(shè)計控制量uC,使得廣義誤差信號在給定時間上界內(nèi)收斂到原點,則被控對象實現(xiàn)了對參考模型狀態(tài)的跟蹤.
本節(jié)提出一種新型終端滑動模態(tài)設(shè)計方法,該方法受到Corradini等[15]所提出的一類終端滑動模態(tài)的啟發(fā).
定理3[15].對一類標量系統(tǒng)其中參數(shù)β>0,h(x)為非線性函數(shù),滿足h(0)=0,h′(x)≠0,x∈R{0},limx→0(h′(x))-1=0.若原點為全局漸近穩(wěn)定平衡點,則該系統(tǒng)有限時間穩(wěn)定,收斂時間為T=|h(x0)|/β.若存在上界Hmax使得|h(x)|<Hmax,則T<Hmax/β,系統(tǒng)固定時間收斂.一種典型的非線性函數(shù)為
定理3中所述滑動模態(tài)的固定時間收斂特性是通過h(x)有界得到的,在系統(tǒng)狀態(tài)遠離平衡點時收斂速度快,但可能導(dǎo)致輸入量過大;在靠近平衡點時收斂速度下降,慢于普通終端滑模.與基于定理2 的一般固定時間終端滑動模態(tài)sigpx=sign(x)|x|p相比,設(shè)計參數(shù)較少,不便于平衡不同位置的收斂速度.本文將傳統(tǒng)終端滑動模態(tài)與定理3 中的滑動模態(tài)(9)結(jié)合,設(shè)計了一種新型終端滑動模態(tài).考慮一類標量系統(tǒng)
其中,參數(shù)α,β,p,q>0,p<1,選擇非線性函數(shù)為
定理4.式(10)所表示的系統(tǒng)固定時間收斂到平衡點,且收斂時間上界為
證明.令z=|x|,可得
若z0>1,設(shè)z在T1時刻收斂到z=1,則由式(13)可得
若z0≤1,設(shè)z在T2時刻收斂到z=0,則由式(13),可得
z收斂等價于x收斂,則式(10)所表示的系統(tǒng)在固定時間內(nèi)收斂到原點,且收斂時間上界為
選取不同的參數(shù)如表1 所示,考察參數(shù)對于標量系統(tǒng)收斂特性的影響.式(10)系統(tǒng)收斂過程如圖2所示.
圖2 標量系統(tǒng)收斂過程Fig.2 Convergence process of the scalar system
表1 標量系統(tǒng)參數(shù)和收斂時間 (s)Table 1 Coefficients and convergence time (s)of the scalar system
參數(shù)1 等價于Corradini等[15]采用的方法,對比參數(shù)1和參數(shù)2 可以看出,本文的增加項提高了標量系統(tǒng)在靠近平衡點區(qū)域的收斂速度.以參數(shù)2為基準,參數(shù)3~6 分別體現(xiàn)了α,β,p,q對標量系統(tǒng)收斂速度的影響:第1 項參數(shù)α,p主要影響靠近平衡點區(qū)域的收斂速度;第2 項參數(shù)β,q主要影響遠離平衡點區(qū)域的收斂速度;系數(shù)α,β對下降速率影響較大,系數(shù)越大,收斂越快;指數(shù)項p,q影響相對較小.
采用單級倒立擺基準測試模型[13-15]對設(shè)計方法進行考察,并與現(xiàn)有方法進行對比[12-15].由于系統(tǒng)收斂時間依賴于參數(shù)選擇,為便于比較,調(diào)整參數(shù)使得初始下降速率基本相同.跟蹤誤差收斂曲線如圖3所示.可以看出,本文所提出的滑動模態(tài)設(shè)計方法的收斂速度優(yōu)于現(xiàn)有方法,與Corradini等[15]方法相比在靠近平衡點處收斂速度更快.
圖3 基準模型跟蹤誤差曲線Fig.3 Tracking error curve of the benchmark model
首先以二階系統(tǒng)為例設(shè)計控制器,廣義誤差信號可以表示為
基于式(10)定義滑模變量和趨近律
其中,參數(shù)αi,βi,pi,qi>0,pi<1,當廣義誤差信號到達滑模面時,s()=0,則有誤差系統(tǒng)按照式(10)的設(shè)計滑動模態(tài)收斂到原點.
針對式(18)所定義的滑模變量和趨近律,設(shè)計非線性控制律(19).其中u1用于抵消誤差動態(tài),u2為滑模運動控制項,u3為趨近運動控制項.
定理5.采用式(19)所述非線性控制律的二階廣義誤差系統(tǒng)固定時間穩(wěn)定,且收斂時間上界為
證明.將輸入式(19)代入式(17),得到滑模變量的導(dǎo)數(shù)如式(21)所示.
則誤差系統(tǒng)全局漸近穩(wěn)定,s最終收斂到0.又由式(21)和定理4,可得系統(tǒng)趨近滑模面的到達時間為
系統(tǒng)到達滑模面后s=0,隨后沿著滑模面收斂到原點,由式(18)和定理4 可得收斂時間為
綜上所述,系統(tǒng)在固定時間內(nèi)收斂到原點,收斂時間上界為誤差系統(tǒng)的相平面圖如圖4 所示.
圖4 誤差系統(tǒng)相平面圖Fig.4 Phase plane plots of error dynamic
相軌跡穿過S3后沿著預(yù)定軌跡運動,不會再次進入奇異區(qū),因此,系統(tǒng)仍然是固定時間穩(wěn)定的,收斂時間上界為
系統(tǒng)動態(tài)到達滑模面后,控制量中的不連續(xù)項可能會導(dǎo)致抖振問題,引入連續(xù)函數(shù)(29)近似切換函數(shù)以減少抖振影響,參數(shù)ρ越大越接近切換函數(shù).
高階系統(tǒng)廣義誤差信號可以表示為
由于第2.2 節(jié)所述終端滑動模態(tài)適用于相對階為1 的系統(tǒng),因此高階系統(tǒng)需要設(shè)計具有遞歸結(jié)構(gòu)的滑動模態(tài)
其中,參數(shù)αi,βi,pi,qi>0,pi<1.將誤差動態(tài)代入式(31),得到滑模變量sn-1的導(dǎo)數(shù)如式(32)所示
將其代入式(32),可得滑模變量sn-1的導(dǎo)數(shù)為
則閉環(huán)系統(tǒng)漸近穩(wěn)定,各階滑模變量依次收斂,收斂時間上界為
翼搖是大后掠角飛機在大迎角時出現(xiàn)的一種滾轉(zhuǎn)通道自激振蕩的現(xiàn)象.Capello等[33]通過風(fēng)洞實驗建立了兩種飛機機型的翼搖運動模型,并使用L1 自適應(yīng)算法實現(xiàn)了對于該現(xiàn)象的抑制.在此基礎(chǔ)上,學(xué)者們使用基于擴張狀態(tài)觀測器的魯棒控制[36]、自適應(yīng)控制[37]等方法對該模型進行研究.
翼搖運動模型可以表示為
兩種機型的模型參數(shù)如表2和表3 所示[33].
表2 模型A 的氣動數(shù)據(jù)Table 2 Aerodynamic coefficients for Model A
表3 模型C 的氣動數(shù)據(jù)Table 3 Aerodynamic coefficients for Model C
迎角αAOA=0.57 時的模型C 開環(huán)響應(yīng)相平面如圖5 所示,系統(tǒng)開環(huán)響應(yīng)存在極限環(huán).
圖5 模型C 開環(huán)響應(yīng)極限環(huán)Fig.5 Open-loop response of Model C exhibiting limit cycle
參考模型選擇為
采用第2.1 節(jié)所述控制結(jié)構(gòu),則廣義誤差信號可以表示為
采用第2.3 節(jié)所述方法設(shè)計固定時間收斂終端滑??刂破鳛?/p>
選取控制器參數(shù)為α1=α2=3,β1=β2=1,p1=q1=5/9,p2=q2=3/9,收斂時間估計為Tmax=1.9 s.
外部擾動d?(t,?(t),?′(t))=10 sin(2πt)+20 sin(πt)+w,w為白噪聲.采用simulink 搭建模型,龍格庫塔方法進行仿真,步長為0.0001 s.分別仿真不同初始滾轉(zhuǎn)角收斂特性、不同迎角情況下的滾轉(zhuǎn)角收斂特性和對階躍信號的跟蹤.采用繪制輸入曲線.
1)使用模型A 測試不同初始滾轉(zhuǎn)角下控制器的收斂性能.固定迎角αAOA=0.61,初始滾轉(zhuǎn)角選擇為?0=-1.22,-0.52,-0.26,0.26,0.52,1.22.參考信號恒為零,得到仿真結(jié)果如圖6 所示.
圖6 不同初值模型A 閉環(huán)響應(yīng)Fig.6 Closed-loop response of Model A for several initial
可以看出,控制器(42)可以實現(xiàn)對不同初始角度的鎮(zhèn)定.隨著初值增加,收斂時間增加不大,在0.4 s以內(nèi),遠小于估計上界,體現(xiàn)了控制器的固定時間收斂特性.
2)使用模型C 測試不同狀態(tài)下控制器的魯棒性,以迎角αAOAm=0.61 時的模型參數(shù)作為已知模型,初始滾轉(zhuǎn)角?0=0.35,初始迎角分別設(shè)置為αAOA0=0.48,0.57,0.65,0.74.實際仿真迎角在已知迎角附近變化,取αAOA=αAOA0+0.044 sin(2t).仿真結(jié)果如圖7所示,不同迎角下滾轉(zhuǎn)角誤差響應(yīng)(圖7(a))幾乎相同,輸入(圖7(b))補償了不同迎角下的模型誤差和擾動,體現(xiàn)了控制器對于模型不確定性和外部擾動的魯棒性.
圖7 不同迎角模型C 閉環(huán)響應(yīng)Fig.7 Closed-loop response of Model C for several angle of attack
3)使用模型A 考察控制器對階躍信號的跟蹤性能.并與現(xiàn)有的模型參考類方法(L1 自適應(yīng)[26],信號補償[27])和基于現(xiàn)有非奇異固定時間終端滑模面(Corradini等[15],Li等[14],Yang等[12])的模型參考方法進行比較.以αAOAm=0.61 時的模型參數(shù)作為已知模型,初始滾轉(zhuǎn)角?0=0.70,實際仿真迎角為αAOA=(0.61+ 0.087 sin(2t)).仿真結(jié)果如圖8 所示.從仿真結(jié)果可以看出,本文所采用的控制器收斂時間最短,可以一直保持較快的下降速度,并且初始階段輸入量較小,沒有達到飽和邊界.文獻[15]和文獻[14]所設(shè)計的滑模面在初始階段下降較快,但誤差接近原點時收斂速度減緩;文獻[12]和L1自適應(yīng)[26]整體收斂速度較慢;信號補償[27]方法收斂速度較快,但會出現(xiàn)誤差超調(diào),整體收斂時間慢于本文算法.
圖8 模型A 對階躍信號跟蹤響應(yīng)Fig.8 Closed-loop response to step signal tracking of Model A
采用文獻[34]所用的3 階非線性模型進行驗證,被控對象如式(43)所示
其開環(huán)特性如圖9 所示,存在三維空間極限環(huán).選取參考模型參數(shù) [-1-2.414-2.414].廣義誤差信號表示為
圖9 模型(43)開環(huán)響應(yīng)特性Fig.9 Open-loop response of model (43)
選取控制器參數(shù)為α=[0.8 2.1 2.1],β=[0.04 0.4 0.4],p=[7/9 5/9 5/9],q=[5/9 4/9 4/9],收斂時間上界估計為Tmax=19.7 s,初始狀態(tài)x0=[4-2-1]T.文獻[15]方法參數(shù)為[0.12 0.55 0.6].
圖10 為期望輸入為階躍信號時的仿真結(jié)果.從仿真結(jié)果可以看出,本文算法可以一直保持較快的下降速度,收斂時間T=2.8 s.從輸入曲線可以看出,基于文獻[15]終端滑模面所設(shè)計的控制器在收斂時間相近的情況下,初始輸入較大,達到了限幅值,因此導(dǎo)致補償信號輸入?yún)⒖寄P椭?使得參考模型狀態(tài)向被控對象實際狀態(tài)逼近.雖然導(dǎo)致最終跟蹤期望輸入r(t)較慢,但保證了廣義誤差信號收斂速度不變,避免了長時間飽和可能導(dǎo)致的系統(tǒng)不穩(wěn)定,體現(xiàn)了本文所采用的控制結(jié)構(gòu)的優(yōu)勢.信號補償算法[27]和L1 自適應(yīng)[26]的特性與二階系統(tǒng)仿真結(jié)果基本相同.
圖10 閉環(huán)系統(tǒng)對階躍信號跟蹤響應(yīng)Fig.10 Response to step signal tracking of closed-loop system
綜上所述,本文所采用的控制結(jié)構(gòu)可以避免長時間飽和和高頻補償信號輸入被控對象,引起系統(tǒng)不穩(wěn)定;所設(shè)計的終端滑模面在整個下降過程中可以保持較快的下降速度,較好地平衡了遠離平衡點處和靠近平衡點處的收斂特性,避免了初始狀態(tài)誤差較大時補償輸入過大;可以保證被控對象的狀態(tài)在固定時間內(nèi)跟蹤參考模型狀態(tài).
本文針對存在模型不確定性和外部擾動的時變非線性系統(tǒng)研究了固定時間終端滑模模型參考控制方法:1)設(shè)計了新型模型參考控制結(jié)構(gòu),在加入輸入限幅和補償信號濾波的同時,保證了廣義誤差系統(tǒng)收斂特性;2)設(shè)計了新型終端滑模面,較好地平衡了遠離平衡點和靠近平衡點的收斂特性;3)針對高階系統(tǒng)設(shè)計了遞歸結(jié)構(gòu)終端滑??刂破?本文控制器保證了誤差動態(tài)在固定時間內(nèi)收斂到原點,使得被控對象能夠在固定時間內(nèi)收斂并跟蹤參考模型動態(tài),便于進行閉環(huán)系統(tǒng)動態(tài)設(shè)計.后續(xù)工作考慮采用自適應(yīng)算法或擾動觀測器動態(tài)調(diào)整切換項增益以減少控制量抖振,考慮結(jié)合魯棒微分器和反步法設(shè)計高階系統(tǒng)控制器,避免解析求解導(dǎo)致高階系統(tǒng)控制器過于復(fù)雜.