穆海芳 郭 凱,2 胡 波
(1.宿州學(xué)院 機械與電子工程學(xué)院,安徽 宿州 234000;2.安徽省智能機器人信息融合與控制工程實驗室,安徽 蕪湖 241002)
由腦卒中、腦梗死造成的中樞神經(jīng)系統(tǒng)損傷,會導(dǎo)致患者的肢體運動功能出現(xiàn)障礙,嚴重影響患者的生活質(zhì)量。借助康復(fù)醫(yī)師進行康復(fù)訓(xùn)練是一種恢復(fù)肢體運動功能的傳統(tǒng)方法,但這種方法不僅成本高,而且治療效果主要取決于醫(yī)師的技術(shù)水平和臨床經(jīng)驗,導(dǎo)致康復(fù)效率比較低[1]。隨著機器人技術(shù)的發(fā)展,將機器人技術(shù)用于康復(fù)治療成為一個熱點,康復(fù)機器人技術(shù)可以彌補康復(fù)醫(yī)師的不足[2]。
現(xiàn)代康復(fù)訓(xùn)練中,阻抗控制是一種有效的力控制方法,在訓(xùn)練時為患肢提供一定的阻力,幫助肢體完成康復(fù)訓(xùn)練[3]。根據(jù)現(xiàn)代偏癱治療學(xué)原理,肢體運動功能的恢復(fù)過程大致分成三個階段,每一個階段的病情變化很大,在恢復(fù)訓(xùn)練過程中,如果能夠根據(jù)患者肌力的恢復(fù)情況,給患者提供的阻力能夠相應(yīng)的調(diào)整,則將在一定程度上激發(fā)肢體的自主康復(fù)能力,大大提高康復(fù)效果[4]。目前阻抗控制廣泛應(yīng)用于康復(fù)機器人的運動控制中,目標(biāo)阻抗參數(shù)決定了整個系統(tǒng)的性能,而在傳統(tǒng)的阻抗控制方法中,目標(biāo)阻抗參數(shù)一經(jīng)確定后,在整個控制過程中保持不變,這就大大降低了阻抗控制的性能[5]。神經(jīng)網(wǎng)絡(luò)是一種模擬人腦的神經(jīng)網(wǎng)絡(luò)以期能夠?qū)崿F(xiàn)類人工智能的機器學(xué)習(xí)技術(shù),控制器使用的神經(jīng)網(wǎng)絡(luò)大多是基于靜態(tài)的前饋神經(jīng)網(wǎng)絡(luò),采用反向傳播(back-propagation,BP)算法對網(wǎng)絡(luò)進行訓(xùn)練[6,7],阻抗控制與智能控制技術(shù)結(jié)合可以實時調(diào)整目標(biāo)阻抗參數(shù),提高控制性能。
傳統(tǒng)PID算法具有簡單易用的優(yōu)點,在控制系統(tǒng)中廣泛使用,但其參數(shù)固定不變,在復(fù)雜非線性系統(tǒng)中很難使用[8]。而模糊算法不需要精確的數(shù)學(xué)模型,用于PID參數(shù)的整定,可以實時調(diào)整PID的參數(shù)值,彌補傳統(tǒng)PID算法的不足[9,10]。
在患肢進行康復(fù)訓(xùn)練過程中,為了給患者提供更好的康復(fù)訓(xùn)練體驗,本文提出了一種模糊PID神經(jīng)網(wǎng)絡(luò)阻抗控制器,包括兩個模塊:即位置控制模塊,使用模糊PID算法;阻抗控制模塊,使用神經(jīng)網(wǎng)絡(luò)調(diào)節(jié)參數(shù)。通過仿真實驗驗證該方法對上肢康復(fù)機器人手臂的控制效果。
整個系統(tǒng)的結(jié)構(gòu)是由模糊PID控制器和神經(jīng)網(wǎng)絡(luò)阻抗控制器組成,模糊PID控制器用于位置控制,而神經(jīng)網(wǎng)絡(luò)實現(xiàn)阻抗控制,如圖1所示。
圖 1 控制系統(tǒng)結(jié)構(gòu)圖
θ是關(guān)節(jié)角度,用來衡量機器人上肢的位置,θ'是角速度,用來衡量患者上肢與機器人接觸力的大小,Xe是實際位置,Xd是期望位置。
模糊PID算法主要用于機器人上肢的運動軌跡和位置跟蹤控制,PID控制器的參數(shù)可以使用模糊數(shù)學(xué)理論實時調(diào)整,以達到最優(yōu)控制目標(biāo)。如圖2,PID控制器的輸入輸出量分別為e(t)和u(t),模糊控制器的輸入變量為Δθ、Δθ',輸出量為比例系數(shù)kp、積分時間系數(shù)ki、微分時間系數(shù)kd。
圖 2 模糊PID控制器
由于比例項在機械臂的位置跟蹤實驗中對跟蹤性能的影響最大,因此設(shè)計一模糊邏輯控制器,它的輸出是可以實時調(diào)整的kp,經(jīng)實驗總結(jié)得到控制邏輯:當(dāng)Δθ較大時,應(yīng)增大kp;當(dāng)Δθ為中等值時,應(yīng)保持kp為較小值;當(dāng)Δθ較小時,應(yīng)保證kp的取值大一點。設(shè)θ增大為正,減小為負,采用三角形隸屬度函數(shù)的模糊子集得到邏輯推理規(guī)則如表1所示。
表 1 模糊邏輯推理規(guī)則表
康復(fù)機器人輔助訓(xùn)練初期,由于患肢的病情嚴重,所以常進行被動康復(fù)訓(xùn)練,即患肢按照預(yù)定的軌跡完成康復(fù)運動。經(jīng)過一段時間的被動訓(xùn)練,患肢病情緩解,這時應(yīng)將被動訓(xùn)練方式改為主動訓(xùn)練,充分發(fā)揮肢體的自我恢復(fù)能力。如果目標(biāo)阻抗系數(shù)是固定不變的,則不能夠適應(yīng)患肢病情的變化,而基于神經(jīng)網(wǎng)絡(luò)的阻抗控制器可以實時調(diào)節(jié)阻抗系數(shù),以適應(yīng)患肢康復(fù)進度的變化。為了使患肢能夠自主實時調(diào)整運動軌跡,基于神經(jīng)網(wǎng)絡(luò)阻抗控制方法建立了患肢和機械臂之間作用力和位置的動態(tài)關(guān)系,阻抗控制與力/位置混合控制方法相比,穩(wěn)定性更好,不需要切換控制模式,目標(biāo)阻抗控制模型表示如下:
(1)
其中,M是目標(biāo)慣性矩陣,B是阻尼矩陣,A是剛度矩陣,X是位置量,X′是速度量,X″是加速度量,F(xiàn)e是實際接觸力,F(xiàn)d是期望接觸力。
為了保證患者的安全,在進行康復(fù)訓(xùn)練時,患肢的運動速度都比較慢,所以患肢運動的加速度可以不用考慮。這里取上肢機械臂關(guān)節(jié)矢狀面,假設(shè)僅僅做單自由度旋轉(zhuǎn)運動,則在笛卡爾坐標(biāo)系下,機械臂末端的目標(biāo)阻抗模型表示如下:
fe×rd=b(θ'd-θ')-a(θd-θ)
(2)
其中,fe表示機械臂與上肢的交互力,rd表示選擇半徑,b∈B,a∈A,θ表示關(guān)節(jié)實際角度,θd表示關(guān)節(jié)期望角度。
如圖3所示,神經(jīng)網(wǎng)絡(luò)阻抗控制器包括剛度控制器和阻尼控制器,剛度控制器的輸入變量為力偏差Δf和角度偏差Δθ,輸出為變剛度量ΔAd(t),阻尼控制器的輸入變量為力偏差Δf和速度偏差Δθ′,輸出為變阻尼量ΔBd(t)。
圖 3 神經(jīng)網(wǎng)絡(luò)阻抗控制器
采用的神經(jīng)網(wǎng)絡(luò)是基于誤差反向傳播算法(BP)的3層前向神經(jīng)網(wǎng)絡(luò),使用BP算法的學(xué)習(xí)時,前向傳播是在采集信息后,經(jīng)輸入層處理傳給隱含層,經(jīng)隱含層再傳給輸出層。如果此時在輸出層得到的輸出量不能滿足需求,則進一步進行處理,即反向計算在前向傳播路徑中的誤差信號,不斷調(diào)整網(wǎng)絡(luò)權(quán)值以實現(xiàn)誤差信號的減小,直到獲取所需的輸出量,這就是反向傳播。剛度控制器的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖4,阻尼控制器的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)與之類似。
圖 4 神經(jīng)網(wǎng)絡(luò)剛度控制器
圖中網(wǎng)絡(luò)的輸入層是i,隱含層是j,輸出層是k,Δθ、Δf是神經(jīng)網(wǎng)絡(luò)的輸入量,用ti表示,i對應(yīng)輸入量的個數(shù),取2。Si作為隱含層的輸入,dj為輸出,ωij為隱含層輸入權(quán)重系數(shù),ωjk為隱含層輸出權(quán)重系數(shù),yk是神經(jīng)網(wǎng)絡(luò)的輸出量。輸入層、輸出層、隱含層的表達式如下:
(3)
=f(ω1jΔf+ω2jΔp)
(4)
(5)
隱含層的激活函數(shù)選擇Sigmoid函數(shù):
(6)
假設(shè)g(k)是上肢控制系統(tǒng)的實際輸出,則網(wǎng)絡(luò)的性能指標(biāo)函數(shù)可以表示為:
(7)
根據(jù)梯度下降法對輸出權(quán)值進行計算:
(8)
ω(k)=Δω+ω(k-1)+β[ω(k-1)-
ω(k-2)]
(9)
其中,α是學(xué)習(xí)速率,β是動量因子。
為了驗證本文所提方法的有效性,選擇某二自由度康復(fù)機器人上肢,使用Matlab軟件,在Simulink環(huán)境下作仿真實驗。初始選定剛度系數(shù)360N/m,阻尼系數(shù)80Ns/m,神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速率0.080,圖5中關(guān)節(jié)角度軌跡作為目標(biāo)曲線,當(dāng)期望運動軌跡的幅值和頻率固定,從傳統(tǒng)控制方法與本文控制方法實際獲取的運動軌跡,可以看出本文方法的效果要好。為了進一步分析兩者的效果,設(shè)定變頻變幅的期望軌跡,兩個方法得到的實際軌跡如圖6所示,可以看出本文方法不僅能夠滿足控制要求,而且柔順性和協(xié)調(diào)性也較好。
使用跟蹤誤差來評價控制精度,圖7是期望軌跡為固定幅值和頻率運動曲線的誤差比較圖,圖8是變頻變幅的誤差比較圖。
圖 5 固定頻率固定幅值的仿真運動軌跡
圖 6 變化頻率變化幅值的仿真運動軌跡
圖 7 固定頻率固定幅值的跟蹤誤差
圖 8 變化頻率變化幅值的跟蹤誤差
為了測評協(xié)調(diào)能力,定義均方根誤差:
(10)
其中,n是采樣次數(shù),Ti是實際運動軌跡對應(yīng)的采樣點,T是期望軌跡對應(yīng)的采樣點,得到跟蹤誤差、均方根誤差的值如表2所示,u表示跟蹤誤差值。
表 2 不同方法的誤差值對比
從圖7和圖8以及表2可以看出,無論是固定頻率幅值還是變化頻率幅值的期望運動軌跡,本文方法控制的實際運動軌跡不僅響應(yīng)速度快,而且跟蹤誤差也較小,同時,均方根誤差和平均偏差反映的運動協(xié)調(diào)能力也較強。
為了在使用機器人輔助肢體運動功能障礙患者進行康復(fù)訓(xùn)練時保證訓(xùn)練的柔順性,本文利用阻抗控制原理建立了上肢訓(xùn)練機器人的目標(biāo)阻抗控制器,提出了一種模糊PID算法結(jié)合神經(jīng)網(wǎng)絡(luò)阻抗控制的策略,模糊PID模塊主要用于訓(xùn)練軌跡的跟蹤控制,神經(jīng)網(wǎng)絡(luò)主要用于實時調(diào)整目標(biāo)阻抗參數(shù)。仿真實驗結(jié)果表明,與傳統(tǒng)的控制方法比較,本文方法控制的運動軌跡響應(yīng)較快,跟蹤誤差較小,協(xié)調(diào)性能指標(biāo)較好。