周景雷
(菏澤學(xué)院機(jī)電工程系,菏澤274015)
不確定性機(jī)器人的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制
周景雷
(菏澤學(xué)院機(jī)電工程系,菏澤274015)
針對(duì)一類(lèi)不確定性機(jī)器人軌跡跟蹤問(wèn)題,提出了一種神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制。首先利用反饋控制技術(shù)把基于拉格朗日方程的多關(guān)節(jié)機(jī)器人動(dòng)力學(xué)模型轉(zhuǎn)化成二階系統(tǒng)。其次,將神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制方法和所轉(zhuǎn)化的二階系統(tǒng)相結(jié)合,找到了一種新方法來(lái)研究機(jī)器人系統(tǒng),該方法是應(yīng)用RBF神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制思想來(lái)設(shè)計(jì)控制器,所設(shè)計(jì)的控制器能夠保證機(jī)器人的實(shí)際運(yùn)動(dòng)軌跡漸近無(wú)誤差地跟蹤給定的期望軌跡。最后,以?xún)申P(guān)節(jié)機(jī)器人系統(tǒng)為例,給出其仿真試驗(yàn)結(jié)果。
不確定性;機(jī)器人;神經(jīng)網(wǎng)絡(luò);自適應(yīng)控制;漸近穩(wěn)定
機(jī)器人系統(tǒng)是一類(lèi)時(shí)變、強(qiáng)耦合和高度非線(xiàn)性的動(dòng)力學(xué)系統(tǒng),并且存在著大量的不確定性因素,因而想獲得機(jī)器人的精確數(shù)學(xué)模型是不可能的。
近些年來(lái)基于機(jī)器人的智能控制受到控制領(lǐng)域的廣泛關(guān)注,提出了很多非線(xiàn)性補(bǔ)償控制方法[1-4]。文獻(xiàn)[3]采用了自適應(yīng)控制方法,能夠通過(guò)在線(xiàn)估計(jì)未知參數(shù),并且根據(jù)其估計(jì)值修正控制策略,然而其設(shè)計(jì)的控制器有著變結(jié)構(gòu)的形式,這樣必然會(huì)存在"抖振"現(xiàn)象。文獻(xiàn)[4]采用了神經(jīng)網(wǎng)絡(luò)控制,雖然在逼近區(qū)域內(nèi)利用神經(jīng)網(wǎng)絡(luò)其到了補(bǔ)償作用,能夠克服變結(jié)構(gòu)的“抖振”,但最大的問(wèn)題是如何得到準(zhǔn)確的在線(xiàn)訓(xùn)練數(shù)據(jù)和怎樣解決實(shí)時(shí)控制差的問(wèn)題。這兩種智能控制都有著一定的問(wèn)題,于是人們開(kāi)始將自適應(yīng)控制和神經(jīng)網(wǎng)絡(luò)控制結(jié)合起來(lái)[5-6]。文獻(xiàn)[5]將這種結(jié)合應(yīng)用到了空間機(jī)器人上,這不具有一般性;文獻(xiàn)[6]在自適應(yīng)控制和神經(jīng)網(wǎng)絡(luò)控制的基礎(chǔ)上又增加了迭代學(xué)習(xí)控制,這雖然有助于提高控制的精度和穩(wěn)定性,但是這必然增加了難度,不宜操作。同時(shí),上述文獻(xiàn)均未將基于拉格朗日方程的機(jī)器人動(dòng)力學(xué)模型,轉(zhuǎn)化成一個(gè)比較簡(jiǎn)單的、易于控制的模型。
考慮到上述不足之處,本文提出一種神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制,將其直接應(yīng)用到帶有外界干擾的不確定機(jī)器人系統(tǒng)當(dāng)中去。首先將基于拉格朗日方程的機(jī)器人動(dòng)力學(xué)模型轉(zhuǎn)化成二階系統(tǒng),這是一狀態(tài)空間模型,于是可以利用現(xiàn)代控制理論對(duì)其進(jìn)行控制。
然后,采用了神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制方案,通過(guò)李雅普諾夫穩(wěn)定性分析設(shè)計(jì)了控制器和自適應(yīng)調(diào)整律,很好地保證了實(shí)際運(yùn)動(dòng)軌跡漸近無(wú)誤差地跟蹤給定的期望軌跡。
基于拉格朗日方程的n關(guān)節(jié)機(jī)器人動(dòng)力學(xué)模型可由下面二階非線(xiàn)性向量微分方程來(lái)描述
對(duì)于外界不確定性干擾需要滿(mǎn)足假設(shè):假設(shè)外界不確定性干擾f有界。
令
式(3)中,Kv,Kp為選定的正定增益陣,分別可理解為微分和比例增益。為簡(jiǎn)便起見(jiàn),下文設(shè)它們都為對(duì)角陣。
由式(2)~(3)得到系統(tǒng)誤差動(dòng)態(tài)方程
如果再令d=M-1(q)f,則得到更簡(jiǎn)單的狀態(tài)方程
上式中,u為外界控制輸入量,d包含了外界不確定性干擾。再令x=[]T,x1=q,x2=˙q,則機(jī)器人系統(tǒng)就可以寫(xiě)成
式(4)中,f(x)=-Kv˙q-Kpq,假設(shè)其未知,因?yàn)槲覀兪遣恢缹?shí)際運(yùn)動(dòng)軌跡的,目的就是控制實(shí)際軌跡跟蹤給定的期望軌跡qb,所以這樣的假設(shè)是可以的。根據(jù)d=M-1(q)f中M(q)的有界性和對(duì)外界干擾f所做的假設(shè)知,有‖d‖≤d0,d0為已知的正常數(shù)。
我們?cè)俣x跟蹤誤差e=q-qd,顯然,qd二階連續(xù)可導(dǎo)。那么對(duì)于系統(tǒng)(4)的控制目的,就是設(shè)計(jì)外界控制輸入u,使實(shí)際軌跡qd漸近地跟蹤給定期望軌跡e,也即跟蹤誤差e趨于零。
上式中,cji∈R2n和σji(j=1,2)分別表示第i個(gè)基函數(shù)的中心向量和寬度。cji和σji是可調(diào)的參數(shù),在實(shí)際工程應(yīng)用上,為了數(shù)學(xué)上處理方便,可以根據(jù)對(duì)象的一些信息,將它們的取值固定,不過(guò)有時(shí)也利用局部訓(xùn)練技術(shù)來(lái)獲取它們的值[7]。
下面給出2個(gè)假設(shè)。
這里要注意:(A1)所說(shuō)的是神經(jīng)網(wǎng)絡(luò)估計(jì)誤差的能力,已經(jīng)證明了只要加權(quán)矩陣也就是神經(jīng)元的個(gè)數(shù)足夠多,那么網(wǎng)絡(luò)估計(jì)誤差會(huì)變得任意?。?]。
我們采用徑向基(RBF)神經(jīng)網(wǎng)絡(luò)來(lái)估計(jì)未知函數(shù) ,其估計(jì)^f(x)為
這里^θ是網(wǎng)絡(luò)加權(quán)矩陣θ的估計(jì)。下面我們要設(shè)計(jì)網(wǎng)絡(luò)加權(quán)的自適應(yīng)修正律來(lái)保證這種網(wǎng)絡(luò)性能的一定要求。向量?(x)是高斯型函數(shù),其第i個(gè)元素分別有如下數(shù)學(xué)表示形式
為了下面的需要,我們?cè)谶@里先定義一個(gè)開(kāi)關(guān)函數(shù)
其中,星號(hào)表示一個(gè)任意的標(biāo)量。
再給出一個(gè)引理:設(shè)a,c∈Rn為列向量,D∈Rn×n為方陣,則有a′Dc=tr(D′ac′)。
對(duì)于系統(tǒng)(4),我們選取如下控制律
式(5)中,
隨著大數(shù)據(jù)的廣泛應(yīng)用和新技術(shù)的層出不窮,智慧城市建設(shè)得到有序推進(jìn),創(chuàng)新融合理念深入人心。作為公共文化服務(wù)機(jī)構(gòu),圖書(shū)館如何在自動(dòng)化、數(shù)字化、智能化的基礎(chǔ)上,順應(yīng)時(shí)代發(fā)展要求,開(kāi)展圖書(shū)館智慧化建設(shè);如何以讀者需求為導(dǎo)向,建立智慧化的信息系統(tǒng),提高館員工作效率和資源利用率,是當(dāng)前我們圖書(shū)館人應(yīng)該思考的課題。新一代智慧圖書(shū)館信息系統(tǒng)的建設(shè)面臨著諸多不確定性,比如技術(shù)進(jìn)步、社會(huì)環(huán)境變化等,但可以確定的是,智慧化、復(fù)合型是新一代智慧圖書(shū)館信息系統(tǒng)的重要特征,也是圖書(shū)館轉(zhuǎn)型與超越的必然要求。
這里,α,β∈Rn×n為正定增益矩陣,在一般情況下為了解耦方便,都取它們?yōu)閷?duì)角陣。sgn(e1)為一列向量,其中的每一個(gè)元素sgni(e1i)都滿(mǎn)足上面定義的開(kāi)關(guān)函數(shù)。e1為定義的濾波誤差[9],有e1=[P2P3]S,S=[eT˙eT]T。[P2P3]為下面李雅普諾夫方程(9)的解P的一部分
把式(5)~(7)代入式(4),得誤差狀態(tài)方程
式(8)中
其中
矩陣A是穩(wěn)定矩陣[10],于是,對(duì)于下面的李雅普諾夫方程,總存在正定解P
選擇如下的權(quán)矩陣修正算法
式(9)中,η為正常數(shù),作為自適應(yīng)律。很容易得出下面的結(jié)論:考慮系統(tǒng)(4)和上述所做的假設(shè),如果控制器由式(5)~(6)組成,權(quán)矩陣由式(10)來(lái)調(diào)節(jié),那么跟蹤誤差e漸近收斂到0點(diǎn)。
證明,我們構(gòu)造如下李雅普諾夫函數(shù)
進(jìn)一步,把修正法則(10)帶入上式并根據(jù)引理得
根據(jù)式(7)以及(A1)和對(duì)d所做的有界性的限定,容易證明下面的不等式成立
對(duì)于第i個(gè)分量,設(shè)e1i>0,有
同理,當(dāng)e1i=0,不等式(11)仍然成立。并容易得知,當(dāng)e1i=0,不等式(11)變成了等式。因此,不等式(11)總是成立的,于是
這樣我們就證明了李雅普諾夫函數(shù) 是單調(diào)遞減的,那么就可以得出閉環(huán)系統(tǒng)是全局漸近穩(wěn)定的,也就是當(dāng)t→∞有S→0,那么跟蹤誤差e和它的導(dǎo)數(shù)˙e也都漸近收斂于0。
下面以?xún)申P(guān)節(jié)機(jī)器人為例來(lái)驗(yàn)證我們的控制方法,這種機(jī)器人機(jī)械臂的結(jié)構(gòu)圖及參數(shù):連桿質(zhì)量m1,m2(kg)連桿長(zhǎng)度l1,l2(m)角坐標(biāo)q1,q2(rad)如圖1所示。
圖1 兩關(guān)節(jié)機(jī)器人Fig.1 The t wo-link robot
動(dòng)力學(xué)模型(1)中的參數(shù)為
這里q=[q1,q2]T,ci=cos(qi),si=sin(qi),i=1,2。
為了仿真簡(jiǎn)便,我們簡(jiǎn)單的取各參數(shù)值如下m1=1(kg),m2=10(kg),l1=l2=1(m),初始坐標(biāo)選為q1(0)=q2(0)=-0.5,˙q1(0)=˙q2(0)=0,外界干擾f=[0.5cos(t) 0.5sin(t)]T,期望軌跡qd1=0.5cos t,qd2=0.5sin t,a0=4I2,a1=2I2。
選擇2×20×1的RBF神經(jīng)網(wǎng)絡(luò)來(lái)估計(jì)f(x)=-Kv˙q-Kpq,Kq,Kv=Kp=I2。選取加權(quán)矩陣的初值為^θ(0),寬度σ=0.2,中心ci在(-0.2,0.2)任意選擇。仿真圖如圖2所示。圖2中,點(diǎn)劃線(xiàn)表示的是實(shí)際軌跡,實(shí)線(xiàn)表示期望軌跡。從仿真圖中,我們可以看出,經(jīng)過(guò)很短的時(shí)間,實(shí)際軌跡就與期望軌跡重合了,這說(shuō)明我們的理論可行。
圖2 軌跡曲線(xiàn)Fig.2 Track curve
本文根據(jù)狀態(tài)空間中的李雅普諾夫思想來(lái)設(shè)計(jì)權(quán)矩陣修正律和控制器,對(duì)機(jī)器人系統(tǒng)的神經(jīng)網(wǎng)絡(luò)自適應(yīng)控制器進(jìn)了研究,其思路清晰,設(shè)計(jì)簡(jiǎn)單。所設(shè)計(jì)的控制器很好地保證了機(jī)器人系統(tǒng)的穩(wěn)定性,使機(jī)器人的實(shí)際運(yùn)動(dòng)軌跡漸近無(wú)誤差地跟蹤給定的期望軌跡。
[1]Ham C,Qu Z,Johnson R.Robust f uzzy control for robot manipulators[J].IEE Peoceedings on Control Theory and Application,2000,147(2):212-216.
[2]Jin M L,Lee J,Chang P H,et al.Practical nonsingular ter minal sliding-mode control of robot manipulators for high-accuracy tracking control[J].IEEE Transactions on Industrial E-lectronics,2009,56(9):3593-3601.
[3]Su H H,Li C F.A fully adaptive decentralized control of robot manipulators[J].Automatica,2006,42(5):1761-1767.
[4]張文輝,齊乃明,尹洪亮.不確定機(jī)器人的神經(jīng)網(wǎng)絡(luò)軌跡控制[J].自動(dòng)化與儀表,2010,30(5):22-25.
[5]謝箭,劉國(guó)良,顏世佐,等.基于神經(jīng)網(wǎng)絡(luò)的不確定性空間機(jī)器人自適應(yīng)控制方法研究[J].宇航學(xué)報(bào),2010,31(1):123-129.
[6]王躍靈,沈書(shū)坤,王洪斌.不確定機(jī)器人的自適應(yīng)神經(jīng)網(wǎng)絡(luò)迭代學(xué)習(xí)控制[J].武漢理工大學(xué)學(xué)報(bào),2009,31(24):135-139.
[7]Sanner R M,Sloting J J E.Gaussian net wor ks for direct adaptive control[J].IEEE Transactions on Neural,Networ ks,1992,3(6):837-863.
[8]Chen B S,Lee T S,F(xiàn)eng J H.A nonlinear H∞control design in robotic systems under parameter perturbation and external disturbance[J].International Journal of Control,1994,59(2):439-461.
[9]Niu Y G,Zou Y,Yang C W.Neural net work-based adaptive tracking control for a class of nonlinear systems[J].Control Theory and Applications,2001,18(3):461-464.
[10]周景雷,張維海.一種機(jī)器人軌跡的魯棒跟蹤控制[J].控制工程,2007,14(3):336-339.
Adaptive Control for Uncertain Robot Based on Neural Net work
ZHOU Jinglei
(Department of Machine and Electronic,Heze College,Heze 274015,China)
A kind of neural net work adaptive control for a sort of uncertain robotic system is presented.First,the multi-joint robotic dynamical model based on the lagrange equation istransf or med into a two-order system via feedback control technique.Then,combine the two-order system with the neural net work adaptive control,finding out a new way to study the robotic systems.This way is to use the RBF neural net work adaptive control methods to design the controller,which can guarantee the actual tracks of robot asymptotically tail after the given desired tracks without any error.At last,take a two-joint robot as an example and give its simulation results.
uncertain;robot;neural net work;adaptive control;asymptotically stable
TP242
A
1007-7383(2011)03-0390-04
2011-01-23
山東省自然科學(xué)基金項(xiàng)目(ZR2009GZ001)
周景雷(1981-),男,碩士,研究方向?yàn)闄C(jī)器人控制、魯棒控制。