張?jiān)慢g,向國菲,稅懿,佃松宜*
連續(xù)型機(jī)械臂是一種具有柔性化結(jié)構(gòu)的機(jī)械臂,其結(jié)構(gòu)緊湊、彎曲性能良好,在外骨骼系統(tǒng)[1]、農(nóng)業(yè)采摘[2]、外科手術(shù)環(huán)境[3-4]、以及飛機(jī)油箱[5]等人員和傳統(tǒng)剛性機(jī)械臂難以到達(dá)或危險的環(huán)境有著廣泛的應(yīng)用前景.在這些應(yīng)用場景里,連續(xù)型機(jī)械臂常搭載檢測和操作工具,如內(nèi)窺鏡、手術(shù)鉗和機(jī)械爪等,實(shí)現(xiàn)特定的操作任務(wù),那么,高性能軌跡跟蹤控制是實(shí)現(xiàn)這些應(yīng)用的重要基礎(chǔ)技術(shù).目前用于連續(xù)型機(jī)械臂控制的有計(jì)算力矩法[6-7]、混合力/位置閉環(huán)控制法[8]、反饋線性化[9],但這些控制方法高度依賴精確的系統(tǒng)模型.由于連續(xù)型機(jī)械臂本質(zhì)的非剛性結(jié)構(gòu),在使用幾何分析法[10]、歐拉-拉格朗日法[11]、虛功法[12]等建模方法時,得到的模型或者太過復(fù)雜而難以基于此設(shè)計(jì)控制器;或者忽略系統(tǒng)未建模動態(tài)、未知干擾等因素,從而導(dǎo)致基于上述控制方法得到的控制器難以實(shí)現(xiàn)良好的控制性能.因此,針對連續(xù)型機(jī)械臂缺乏精確模型、存在多源不確定性的情況,設(shè)計(jì)何種控制策略實(shí)現(xiàn)對連續(xù)型機(jī)械臂的高精度軌跡跟蹤,這一問題有著重要的理論和現(xiàn)實(shí)意義.
考慮系統(tǒng)不確定性,文獻(xiàn)[13]首次將魯棒控制用于連續(xù)型機(jī)械臂,但魯棒控制主要針對系統(tǒng)內(nèi)部小范圍的不確定性,對較大未知外部擾動的處理能力有限,且需單獨(dú)考慮內(nèi)部不確定性、外擾等因素設(shè)計(jì)控制器,使控制器復(fù)雜保守.文獻(xiàn)[14]用神經(jīng)網(wǎng)絡(luò)對連續(xù)型機(jī)械臂進(jìn)行系統(tǒng)辨識,文獻(xiàn)[15]和文獻(xiàn)[16]利用模糊系統(tǒng)作為逼近器,雖然實(shí)現(xiàn)了對連續(xù)型機(jī)械臂的控制,但神經(jīng)網(wǎng)絡(luò)、模糊控制器中需手動整定的參數(shù)過多,運(yùn)算量大,神經(jīng)元的權(quán)值或模糊規(guī)則的訓(xùn)練時間長,在工程實(shí)現(xiàn)上存在困難,目前仍較少應(yīng)用于實(shí)際連續(xù)型機(jī)械臂控制.
自抗擾控制(active disturbance rejection control, ADRC)將被控對象的內(nèi)部不確定性和外部干擾統(tǒng)一視作“總擾動”[17,18],并利用擴(kuò)張狀態(tài)觀測器(extended state observer, ESO)對其實(shí)時估計(jì),然后通過反饋對控制量進(jìn)行補(bǔ)償,達(dá)到在干擾產(chǎn)生影響前消除可能產(chǎn)生誤差的作用[19],實(shí)現(xiàn)主動抗擾.ADRC中“總擾動”的設(shè)計(jì)思想避免了對每一可能出現(xiàn)的不確定性分別設(shè)計(jì)控制器,簡化控制器結(jié)構(gòu),使其更易于工程實(shí)現(xiàn).ESO實(shí)時觀測、獲取估計(jì)量的能力,避免了神經(jīng)網(wǎng)絡(luò)、模糊控制等方法的長時間離線訓(xùn)練過程.同時,ESO具備的狀態(tài)觀測功能,可以實(shí)現(xiàn)對輸出的各階導(dǎo)數(shù)進(jìn)行觀測,在控制系統(tǒng)部署時可節(jié)省相應(yīng)傳感器.這些優(yōu)勢對結(jié)構(gòu)緊湊連續(xù)型機(jī)械臂的軌跡跟蹤控制有著重要的實(shí)際意義.
傳統(tǒng)ADRC的設(shè)計(jì)采用非線性函數(shù),雖然具備實(shí)現(xiàn)良好的控制效果的能力,但其參數(shù)整定困難,控制性能受參數(shù)整定的影響,不利于實(shí)際工程應(yīng)用.基于此,文獻(xiàn)[20]提出的線性自抗擾控制(linear active disturbance rejection control, LADRC),結(jié)構(gòu)比較簡單,對非線性系統(tǒng)同樣具備較強(qiáng)抗擾能力,在工業(yè)生產(chǎn)線[21]、飛行器[22]、剛性機(jī)器人[23]等對象的控制中應(yīng)用廣泛.據(jù)作者所知,該方法尚未應(yīng)用于柔性化的連續(xù)型機(jī)械臂系統(tǒng).本文所考慮的線驅(qū)連續(xù)型機(jī)械臂是典型的強(qiáng)耦合非線性的MIMO系統(tǒng),解耦設(shè)計(jì)是控制的難點(diǎn),文獻(xiàn)[24]在對雙連桿機(jī)械臂設(shè)計(jì)自抗擾控制器時,忽略了雙關(guān)節(jié)間的耦合影響.文獻(xiàn)[25]考慮耦合影響,利用虛擬控制量與LADRC結(jié)合,實(shí)現(xiàn)了對多輸入多輸出系統(tǒng)的解耦,但未考慮解耦率未知的情況.文獻(xiàn)[20]和文獻(xiàn)[26]在理論層面提出了解耦率未知時的自抗擾控制器設(shè)計(jì),但未應(yīng)用于實(shí)際對象.
基于此,針對連續(xù)型機(jī)械臂末端軌跡跟蹤,本文提出基于解耦策略的線性自抗擾控制方案.首先,引入虛擬控制量實(shí)現(xiàn)對MIMO系統(tǒng)的解耦;然后,對解耦后的系統(tǒng)并行設(shè)計(jì)雙通道線性自抗擾控制器.考慮系統(tǒng)中存在未知解耦率、未建模動態(tài)、未知外部擾動等情況,將多源不確定性估計(jì)問題轉(zhuǎn)化為 “總擾動”的抗擾問題,進(jìn)一步利用“擴(kuò)張狀態(tài)”思想,轉(zhuǎn)換為狀態(tài)估計(jì)問題.采用線性擴(kuò)張觀測器,基于“帶寬法”調(diào)整觀測器參數(shù).采用Lyapunov穩(wěn)定性理論證明該線性擴(kuò)張觀測器的收斂性,得到估計(jì)值,實(shí)時反饋并補(bǔ)償控制量,進(jìn)而實(shí)現(xiàn)不確定條件下連續(xù)型機(jī)械臂的高精度軌跡跟蹤控制.
本文以典型的線驅(qū)連續(xù)型機(jī)械臂為研究對象,其結(jié)構(gòu)如圖1 所示,由主骨架、驅(qū)動線(次骨架)和圓盤組成,骨架利用NiTi合金的超彈性能實(shí)現(xiàn)柔性,圓盤采用輕質(zhì)鋁材,小孔互成120°分布.末端圓盤可搭載內(nèi)窺鏡等檢修設(shè)備.給驅(qū)動線施加驅(qū)動力矩τ1和τ2后,驅(qū)動線產(chǎn)生伸縮形變,從而帶動機(jī)械臂實(shí)現(xiàn)連續(xù)的彎曲運(yùn)動.
Ek=Ekl+Ekp=
(1)
其中ρ和A表示骨架的密度和橫截面積,m表示支撐盤的質(zhì)量.
連續(xù)型機(jī)械臂的勢能由彈性勢能和重力勢能兩部分組成,通過實(shí)驗(yàn)表明[11]計(jì)算時可將重力勢能忽略,因此連續(xù)型機(jī)械臂的彈性勢能表示為:
(2)
其中EI表示骨架的剛度,q1表示彎曲角,并且用q2表示旋轉(zhuǎn)角.
假設(shè)p1和p2代表在力矩τ1和τ2作用下的位移,則系統(tǒng)在某一確定位姿下的廣義力可表示為[11]:
(3)
由理論力學(xué)得系統(tǒng)拉格朗日第二類方程為:
(4)
將式(1)、(2)代入式(4),可得到連續(xù)型機(jī)械臂動力學(xué)微分方程[11]形式如式(5)所示:
(5)
但是由于連續(xù)型機(jī)械臂非剛性的結(jié)構(gòu)特點(diǎn),由運(yùn)動學(xué)求解得到的速度表達(dá)式高度非線性強(qiáng)耦合,十分復(fù)雜[5],難以用于后續(xù)動力學(xué)推導(dǎo),導(dǎo)致式(5)中具體參數(shù)Mij、Cij、Kij(i=1,2;j=1,2)難以獲得;或者對推導(dǎo)過程中的復(fù)雜中間參數(shù)采用最小二乘擬合[11]等方式進(jìn)行簡化,導(dǎo)致建立得到的動力學(xué)參數(shù)Mij、Cij、Kij(i=1,2;j=1,2)不夠準(zhǔn)確,從而進(jìn)一步導(dǎo)致基于動力學(xué)設(shè)計(jì)的控制器難以實(shí)現(xiàn)良好的控制性能.因此,本文分別考慮動力學(xué)方程中Mij、Cij、Kij(i=1,2;j=1,2)存在不確定性的情況,提出控制策略以抑制不確定性對控制性能的不利影響.
式(5)描述的連續(xù)型機(jī)械臂動力學(xué)模型可寫為
(6)
(7)
即可將解耦后的系統(tǒng)(7)看作并行的兩個SISO系統(tǒng)如式(8)所示,可對其設(shè)計(jì)相同結(jié)構(gòu)的控制器.
(8)
(9)
(10)
由上式可知,通過選擇適當(dāng)?shù)脑鲆鎘ai(i=1,2)和kbi(i=1,2),跟蹤誤差可漸近收斂至零.
圖2 LADRC控制框圖Fig.2 Control diagram of LADRC
(11)
同理,若考慮未知外部干擾d,式(7)表示為
(12)
當(dāng)解耦率M未知時,此時將系統(tǒng)(6)看作式(13)的形式
(13)
(14)
(15)
其中β1、β2為定常正數(shù).
同理可由系統(tǒng)(13)得到式(11)的形式.將系統(tǒng)(11)看作解耦后得到的兩個系統(tǒng),如式(16)、(17)所示:
(16)
(17)
(18)
(19)
利用線性擴(kuò)張觀測器得到的觀測量,設(shè)計(jì)反饋控制律如下式所示:
(20)
當(dāng)解耦率已知時,解耦后得到作用于被控對象的控制量為
τ=M·U
(21)
當(dāng)解耦率未知時,利用解耦率估計(jì)值得到作用于被控對象的控制量為
τ=M0·U
(22)
證明.
=-α1η1+η2
(23)
(24)
(25)
則觀測誤差狀態(tài)方程可寫為:
(26)
矩陣A的特征方程為:
(27)
由特征方程即可得:
λ3+α1λ2+α2λ+α3=0
(28)
對α1,α2,α3取值使上式其滿足Hurwitz,則對于對稱正定陣Q,存在P滿足Lyapunov方程:
ATP+PA+Q=0
(29)
設(shè)Lyapunov函數(shù)為:
V0=εηTPη
(30)
對其求導(dǎo)可得:
(31)
(32)
(33)
同理對線性擴(kuò)張觀測器(19)也成立,由此定理1證明完畢,在保證參數(shù)滿足式(33)的條件下,系統(tǒng)收斂.
由定理1可知,為確保LESO收斂,ε一般取較小值,但當(dāng)LESO的初值與對象的初值不同時,起始階段較小值的ε可能產(chǎn)生峰值現(xiàn)象,影響LESO的收斂效果,因此可設(shè)計(jì)ε為式(34)的形式:
(34)
其中R為常值參數(shù).
為驗(yàn)證該控制方法對具強(qiáng)耦合、非線性特性的連續(xù)型機(jī)械臂的可行性,使用如下式所示的連續(xù)型機(jī)械臂動力學(xué)模型[8]對上述控制方法進(jìn)行仿真驗(yàn)證,設(shè)計(jì)反饋控制律如式(20)、(21)、(22)所示,LESO如式(18)(19)所示:
其中
進(jìn)行仿真的連續(xù)型機(jī)械臂參數(shù)選為:r=3,m1=1.086,m2=0.8,l=1.5,E=0.65,I=1.02,n=10,h=0.15.為驗(yàn)證對連續(xù)型機(jī)械臂旋轉(zhuǎn)角、彎曲角的控制效果,跟蹤函數(shù)設(shè)計(jì)為q2d=cos(1.2t),q1d=sin(1.2t-90°), LESO的參數(shù)取為α1=6,α2=11,α3=6,R=100,控制器參數(shù)取為kai=60(i=1,2),kbi=50(i=1,2).為驗(yàn)證算法的有效性,本文考慮了多種不確定性的情況進(jìn)行討論,為驗(yàn)證LADRC的抗擾能力和處理不確定性的能力,對同樣的被控對象采用CTC進(jìn)行仿真對比.
當(dāng)系統(tǒng)模型精確已知,即ΔC、ΔK、d、ΔM為0時,兩種控制方法的仿真結(jié)果如圖3所示,在此基礎(chǔ)上,進(jìn)一步考慮未建模動態(tài)不確定性ΔC、ΔK、突加外部干擾d,解耦率不確定性ΔM,表示如下:
圖3 模型精確已知時的軌跡跟蹤圖Fig.3 System tracking trajectories with known model
考慮突加外部干擾時的控制結(jié)果如圖4所示,考慮未建模不確定性時的控制結(jié)果如圖5所示,考慮解耦率不確定性時的仿真結(jié)果如圖6所示.
圖4 突加外部干擾時的軌跡跟蹤圖Fig.4 System tracking trajectories with external disturbances
圖5 含未建模不確定性時的軌跡跟蹤圖Fig.5 System tracking trajectories with unmodeled dynamics
圖6 含解耦率不確定性時的軌跡跟蹤圖Fig.6 System tracking trajectories with uncertain decoupling rate
以上結(jié)果表明,在被控對象模型精確已知的理想假設(shè)下,CTC和LADRC都能實(shí)現(xiàn)對目標(biāo)軌跡的跟蹤,且LADRC對q2有更好的控制性能,而CTC對q1有更好的控制性能,兩種控制方法各有優(yōu)劣.圖4表明,4s時刻突加外擾后,LADRC受外部干擾影響小,而CTC受外擾影響出現(xiàn)了跟蹤誤差,且在6s時刻外部擾動消失后,仍需經(jīng)過過渡時間才重新跟蹤上目標(biāo)軌跡.圖5和圖6表明存在未建模不確定、解耦率不確定時,與CTC相比,LADRC能以更小的誤差快速實(shí)現(xiàn)軌跡跟蹤.且當(dāng)不確定性超過一定范圍時,CTC失去控制,說明隨著不確定性的出現(xiàn),LADRC展現(xiàn)出比CTC更強(qiáng)的魯棒性,抗擾性,能處理更大范圍的不確定性,顯示出更好的控制性能.
為進(jìn)一步驗(yàn)證對連續(xù)型機(jī)械臂在更大范圍不確定性情況下的控制效果,考慮解耦率M完全未知,同時系統(tǒng)模型參數(shù)C、K完全未知,且存在外部干擾d,三種不確定性同時存在的情況,此時僅利用連續(xù)型機(jī)械臂模型階次信息設(shè)計(jì)三階LADRC,得到仿真結(jié)果如圖7~圖9所示.
圖7是q1、q2對目標(biāo)軌跡的跟蹤圖,表明在僅知模型階次信息的情況下,經(jīng)過一段過渡時間后,LADRC能實(shí)現(xiàn)對連續(xù)型機(jī)械臂的軌跡跟蹤.圖8是LESO對實(shí)際角度、實(shí)際角速度的觀測圖像,圖9是LESO對總干擾的觀測圖像,圖8、圖9驗(yàn)證了LESO能實(shí)現(xiàn)對連續(xù)型機(jī)械臂的狀態(tài)觀測和總干擾觀測,圖中的突刺,據(jù)分析是這一時刻兩個角度的跟蹤目標(biāo)值重合,數(shù)值計(jì)算問題導(dǎo)致的,能在最終的軌跡控制中被LADRC處理.
圖7 解耦率未知、存在未建模動態(tài)和外部擾動時的軌跡跟蹤圖Fig.7 System tracking trajectories with unknown decoupling rate, unmodeled dynamics and external disturbance
圖8 LESO狀態(tài)觀測圖Fig.8 State observation of LESO
圖9 LESO總干擾觀測圖Fig.9 Total disturbance observation of LESO
以上仿真結(jié)果表明,在連續(xù)型機(jī)械臂具有不確定性時,LADRC跟蹤時間快,跟蹤誤差小,能處理更大范圍的不確定性,抗擾能力更強(qiáng),魯棒性更好,展現(xiàn)出比CTC更好的控制性能.同時LADRC能在僅模型階次信息已知的情況下,實(shí)現(xiàn)對連續(xù)型機(jī)械臂的控制,使這一控制方法不依賴于被控對象精確模型,對連續(xù)型機(jī)械臂的實(shí)際應(yīng)用有重要意義.
本文針對包含多源不確定性的連續(xù)型機(jī)械臂軌跡跟蹤問題,提出了基于解耦策略的LADRC控制方案.通過引入虛擬控制量實(shí)現(xiàn)對系統(tǒng)的解耦,并行設(shè)計(jì)雙通道控制方案,針對解耦率已知和未知的不同情況分別設(shè)計(jì)LADRC控制器設(shè)計(jì).采用LESO,簡化系統(tǒng)參數(shù)整定,給出參數(shù)整定方法,基于Lyapunov穩(wěn)定性理論證明了其收斂性.仿真驗(yàn)證中,綜合考慮系統(tǒng)解耦率不確定性、未建模動態(tài)以及外部擾動,并將本文設(shè)計(jì)的控制方案與CTC相比,結(jié)果表明本文提出的控制方案,跟蹤誤差小,能處理更大范圍的不確定性,有較強(qiáng)抗干擾能力和強(qiáng)魯棒性.尤其是在三種不確定性同時存在,僅知模型階次信息的情況下,基于解耦設(shè)計(jì)的LADRC能實(shí)現(xiàn)對連續(xù)型機(jī)械臂的軌跡跟蹤.本文的控制方法結(jié)構(gòu)簡單,易于工程實(shí)現(xiàn),對實(shí)際工業(yè)應(yīng)用中連續(xù)型機(jī)械臂軌跡跟蹤控制提供了新的方案.