龍 億,杜志江,王偉東
(機器人技術(shù)與系統(tǒng)國家重點實驗室(哈爾濱工業(yè)大學),150001哈爾濱)
穿戴式外骨骼機器人,與人體高度貼合,可增強人體的力量與耐力,緩解人體疲勞.BLEEX下肢外骨骼機器人是由美國加利福利亞Berkeley分校研制的,于2004年進行了樣機試驗.BLEEX采用液壓驅(qū)動系統(tǒng),所有傳感器安裝在外骨骼機器人上,包括力/力矩傳感器、位置碼盤等,所提出的控制方法稱為靈敏度放大控制(sensitivity amplification control,SAC)[1-2].在SAC 中,靈敏度被定義為外骨骼的輸出運動信息與人機交互信息之間的關(guān)系,所以如果控制靈敏度在合適范圍內(nèi),就可以減小人機交互作用,使外骨骼實現(xiàn)高度跟隨人體運動軌跡.SAC方法是基于模型的控制,其控制效果取決于系統(tǒng)動態(tài)模型的精確程度,而外骨骼機器人是多自由度的非線性系統(tǒng),要建立其精確的數(shù)學模型非常困難[3].神經(jīng)網(wǎng)絡(luò)在機器人系統(tǒng)的動力學辨識方面得到了廣泛的應用[4-5].如下肢外骨骼的動力學精確模型的建立,一是離線的BP網(wǎng)絡(luò)訓練;二是系統(tǒng)的模式識別.運用BP網(wǎng)絡(luò)來學習外骨骼的逆模型,網(wǎng)絡(luò)的輸入層為外骨骼關(guān)節(jié)的運動參數(shù)(角度、角速度、角加速度),輸出為力矩,采用正模型來獲取實驗數(shù)據(jù),離線學習得到BP網(wǎng)絡(luò)[6].然而,BP網(wǎng)絡(luò)每一次學習都需要重新調(diào)整權(quán)值,收斂速度慢,離線學習得到的BP網(wǎng)絡(luò)的泛化能力難以得到保證.基于外骨骼單腿的三連桿模型,使用最小二乘法,運用實驗手段對外骨骼模型中的參數(shù)(如剛度力矩、摩擦力等)進行了辨識[7],但是全部過程需要大量的實驗數(shù)據(jù),耗時長.
針對外骨骼機器人系統(tǒng)有效地在線學習方法報道很少,本文設(shè)計了一種基于遺傳算子(GA)優(yōu)化的徑向基函數(shù)(RBF)網(wǎng)絡(luò)在線學習方法,獲取外骨骼機器人的動力學模型,并將模型用于SAC中.
靈敏度放大控制(SAC)是美國Berkley外骨骼系統(tǒng)(BLEEX)采用的控制方法,其控制原理如圖1.其中,Ghm是人機交互模型,Gexo是外骨骼的動力學模型,Td是外部干擾力矩,包括人施加的人機作用力以及環(huán)境的干擾力,Ta是外骨骼驅(qū)動器施加的力矩,q=[q,,]為外骨骼的輸出軌跡參數(shù).
由圖1可得
定義系統(tǒng)的靈敏度為
S表示外骨骼的輸出軌跡對外在力的感應程度,S越大,表示Td對q的影響越大.
考慮人機交互力矩以及機構(gòu)的阻尼、摩擦等,將圖1改寫為閉環(huán)的形式,如圖2所示,其中,Thm是人機交互力矩,Ta是驅(qū)動器施加的力矩,α是放大系數(shù),G'exo是外骨骼的逆動力學模型,qhm人體運動軌跡,即是外骨骼的目標運動軌跡.一般地,Ta=(1-α-1)G'exo,那么可以推導出新的靈敏度為
圖1 SAC原理
圖2 SAC閉環(huán)控制
外骨骼實體機構(gòu)如圖3所示,每一條腿有兩個主動自由度,踝關(guān)節(jié)不加驅(qū)動,驅(qū)動部分由液壓缸完成.不失一般性,外骨骼機器人的動力學方程可以表示為
其中:M(q)∈R2×2是慣性項,C(q,)∈R2×2是阻尼與摩擦項,G(q)∈R2×1是重力項,T∈R2×1是關(guān)節(jié)力矩,D∈R2×1為未建模動力學以及干擾項.
圖3 外骨骼機器人模型
在SAC中,設(shè)計控制律為[8]
在式(1)中,T=Ta+Thm,可得
式(3)表明,α越大,Thm越小,即是靈敏度增大了,人機交互力矩就會減小,外骨骼的跟隨性就會越好.
RBF的性能很大程度上取決于中心矢量、基寬度參數(shù)以及權(quán)值,用GA優(yōu)化RBF結(jié)構(gòu)能夠獲得較好的性能[9-11].本文權(quán)值由設(shè)定的算法進行在線更新,在已知輸入值范圍的條件下,用GA優(yōu)化出RBF網(wǎng)絡(luò)最佳的中心矢量與基寬度.
GA優(yōu)化RBF網(wǎng)絡(luò)流程見圖4.
圖4 GA優(yōu)化RBF網(wǎng)絡(luò)的基本流程
設(shè)定進化代為G=250,種群規(guī)模為30,編碼長度為10.要設(shè)計的RBF網(wǎng)絡(luò)是用來學習外骨骼動力學方程中的矩陣M(q)、C(q,)以及G(q),分別通過GA獲得相應的中心矢量
式中:cM、cC、cG為中心矢量,N為隱含層節(jié)點數(shù).基寬度可以由下面的經(jīng)驗式獲得:
式中:bM、bC、bG為基寬度,cMmax,cCmax,cGmax為中心矢量元素的最大間隔.進行GA優(yōu)化,得到優(yōu)化后的 RBF網(wǎng)絡(luò)的基寬度與中心矢量.對學習M(q)的RBF網(wǎng)絡(luò),GA優(yōu)化RBF網(wǎng)絡(luò)的結(jié)果如圖5,迭代到20代左右即可獲得最佳個體.
圖5 GA優(yōu)化中心矢量與基寬度的收斂過程
外骨骼機器人系統(tǒng)由于其高度的非線性以及外部環(huán)境的影響,很難求得精確的動力學模型,借助神經(jīng)網(wǎng)絡(luò)的學習能力,構(gòu)造一種在線學習的RBF網(wǎng)絡(luò),可獲取更為準確的動力學方程.本文提出了RBF網(wǎng)絡(luò)在線學習外骨骼動力學模型(1)中的矩陣M(q)、C(q,)以及G(q).在RBF的結(jié)構(gòu)中,輸入向量為X=[x1,x2,…,xn],映射到隱含層采用高斯徑向基函數(shù)
式中:N為隱含層節(jié)點數(shù),Hj為jth節(jié)點隱含層的輸出,bj為jth節(jié)點的基寬度,cj為jth節(jié)點中心矢量.
外骨骼的動力學模型中,矩陣M(q)、C(q,)以及G(q)是關(guān)于關(guān)節(jié)角度、角速度的矩陣.對于M(q)、C(q,)以及G(q),基于(4)中的中心矢量與基寬度,輸入矢量分別為關(guān)節(jié)角度與角速度的組合,通過高斯徑向基函數(shù),可以得到隱含層的輸出為
其中,輸入矢量分別為
式中:bM(j)、bC(j)、bG(j)分別為jth節(jié)點的基寬度,cM(j)、cC(j)、cG(j)分別為jth節(jié)點的中心矢量,t是時間變量,學習過程如圖6,輸入是關(guān)節(jié)的角度(角速度),經(jīng)過隱含層的映射,然后與當前時刻的權(quán)值相乘,加和后即可得矩陣(q)(q,),(q))輸出的元素,每個時刻對權(quán)值進行在線更新.
設(shè)外骨骼跟隨人體軌跡的角度、角速度、角加速度誤差為
式中:qh(t)是人體軌跡,q(t)是外骨骼軌跡,定義s(t)(t)+λe(t),其中,λ是正常數(shù),定義等效速度與等效加速度為
式中:κ是正常數(shù).權(quán)值的更新是根據(jù)實際的軌跡誤差以及誤差變化率構(gòu)造的,權(quán)值更新的表達式如下[12-13]:
式中:WM-1(j)、WC-1(j)、WG-1(j)為初始權(quán)值矩陣,WM(j)、WC(j)、WG(j)是更新后的權(quán)值矩陣,η是學習速率.經(jīng)過RBF網(wǎng)絡(luò)學習后,網(wǎng)絡(luò)的輸出為
所以,控制律(2)改寫為
圖6 RBF在線學習動力學模型的M(q)矩陣
控制框圖如圖7所示.
圖7 在線學習動力學方程的SAC控制框圖
圖3所示的外骨骼主動自由度包括髖關(guān)節(jié)、膝關(guān)節(jié),踝關(guān)節(jié)為被動自由度.根據(jù)臨床步態(tài)實驗[14],一個步態(tài)周期內(nèi)髖關(guān)節(jié)、膝關(guān)節(jié)的軌跡如圖8,將獲得的離散點擬合為時間t的(周期為2 s)方程:
圖8 人體臨床步態(tài)髖關(guān)節(jié)、膝關(guān)節(jié)運動軌跡
取采樣周期為Ts=0.001 s,0≤t≤2,應用控制律(5),控制外骨骼機器人跟蹤(6)所示的曲線,得到的跟隨效果如圖9.圖9表明,外骨骼的關(guān)節(jié)軌跡與人體的行走軌跡基本吻合,實現(xiàn)了高度地跟隨.跟隨的誤差曲線如圖10,可以看出,誤差在0的小鄰域內(nèi)變化,基本能夠收斂到0.為了說明GA對RBF網(wǎng)絡(luò)的作用,常規(guī)的RBF與優(yōu)化后的RBF比較結(jié)果如圖11、12所示.優(yōu)化后的RBF網(wǎng)絡(luò)跟蹤誤差更小,優(yōu)化后的RBF網(wǎng)絡(luò)SAC控制使得人機交互信息基本穩(wěn)定地保持在0的小鄰域內(nèi),人機交互信息的減小,表明了外骨骼能夠高度跟隨人體的運動軌跡.
圖9 RBF在線學習SAC的人體軌跡跟蹤
圖10 RBF在線學習SAC的軌跡跟蹤誤差
圖11 人體軌跡跟蹤誤差對比曲線
圖12 人機交互力矩對比曲線
1)利用GA優(yōu)化出滿足適應度函數(shù)要求的RBF神經(jīng)網(wǎng)絡(luò)最佳中心矢量與基寬度,能夠一定程度上改善RBF網(wǎng)絡(luò)的映射能力.
2)設(shè)定的在線RBF學習過程只作權(quán)值的更新,通過設(shè)定的算法在線計算外骨骼機器人的動力學模型.
3)GA優(yōu)化的RBF網(wǎng)絡(luò)與沒有優(yōu)化的RBF網(wǎng)絡(luò)的SAC控制比較表明,GA優(yōu)化的RBF網(wǎng)絡(luò)在跟隨人體運動軌跡時有較高的精度以及較小的人機交互力矩.
4)基于GA優(yōu)化的RBF網(wǎng)絡(luò)學習外骨骼動力學模型的方法是可行的,實現(xiàn)SAC控制方法精確控制,但實際應用需要試驗驗證.
[1]KAZEROONI H,STEGER R,HUANG L.Hybrid control of the Berkeley Lower Extremity Exoskeleton(BLEEX)[J].The International Journal of Robotics Research,2006,25(5/6):561-573.
[2]ZOSS A B,KAZEROONI H,CHU Andrew.Biomechanical design oftheBerkeleyLowerExtremityExoskeleton(BLEEX)[J].IEEE/ASME Trans on Mechatronics,2006,11(2):128-138.
[3] GHAN J,STEGER R,KAZEROONI H.Control and system identification for the Berkeley Lower Extremity Exoskeleton(BLEEX)[J].Advanced Robotics,2006,20(9):989-1014.
[4]JIANG Z,ISHIDA T,SUNAWADA M.Neural network aided dynamic parameter identification of robot manipulators[C]//Proceedings of IEEE International Conference on Systems,Man and Cybernetics.Taipei:IEEE,2006:3298-3303.
[5] BIDYADHAR S.DEBASHISHA J.Nonlinear system identification using memetic differential evolution trained neural networks[J].Neurocomputing,2011,74(10):1696-1709.
[6]楊智勇,歸麗華,楊秀霞,等.骨骼服神經(jīng)網(wǎng)絡(luò)靈敏度放大控制方法[J].吉林大學學報:工學版,2009(3):824-829.
[7] GHAN J,KAZEROONI H.System Identification for the Berkeley Lower Extremity Exoskeleton(BLEEX)[C]//Proceedings of IEEE International Conference on Robotics and Automation.Orlando:IEEE,2006:3477-3484.
[8]楊智勇,張遠山,顧文錦,等.骨骼服靈敏度放大控制方法研究[J].計算機仿真,2010(1):177-180.
[9] WANG Hongfa,XU Xinai.Applying RBF neural networks and genetic algorithms to nonlinear system optimization[J].Advanced Materials Research,2012,605-607:2457-2460.
[10]DING Shifei, XU LI, SU Chunyang, et al.An optimizing method of RBF neural network based on genetic algorithm [J]. Neural Computing &Applications,2012,21(2):333-336.
[11]WANG Binli,BAI Guangliang,WEI Zhaolan.Bridge safety evaluation by RBF neural network with genetic algorithm[C]//Proceedings ofIEEE International Conference on Information and Financial Engineering(ICIFE).Chongqing:IEEE,2010:563-566.
[12]GE S S,HANG C C,WOON L C.Adaptive neural network control of robot manipulators in task space[J].IEEE Trans on Industrial Electronics,1997,44(6):746-752.
[13]劉金琨.機器人控制系統(tǒng)的設(shè)計與MATLAB仿真[M].北京:清華大學出版社,2008:31-158.
[14]KIRTLEY C.CGA normative gait database[DB/OL].[2014-06-5].http://www.clinicalgaitanalysis.com/data/.