楊靜宜,崔建弘*,龐雅靜
(1. 河北工程技術(shù)學(xué)院,河北 石家莊 050000;2. 河北科技大學(xué),河北 石家莊 050000)
作為人機協(xié)作的計算研究對象之一,人機協(xié)調(diào)操作感知控制備受研究人員的關(guān)注,成為現(xiàn)階段重點研究的對象之一。
為了實現(xiàn)人機協(xié)同操作,需要在機器人控制系統(tǒng)中添加人的行為感知特征信息,使人和機器人共同工作時,機器人能夠更好地匹配人體的運動模式。一般而言,阻抗控制大致可分為直接分配、力控制、阻抗與控制等,比較有代表性的是阻抗控制方法,具體操作即將控制坐標(biāo)信息與接觸力信息統(tǒng)一起來,通過控制結(jié)果來控制操作的感知,但是這種方法只有依靠固定環(huán)境間的接觸力量,機器人才能完美地響應(yīng)人體直接接觸,存在工作空間的限制;另一種有代表性的是一種既變阻尼控制,又稱變阻尼性控制方法,首先分析人與人之間的協(xié)調(diào)特點,根據(jù)速度的快慢設(shè)定不同的阻尼參數(shù),從而控制機器人的協(xié)調(diào)動作,但是降低了人機之間的作用力,造成操作者和機器人在執(zhí)行任務(wù)時,出現(xiàn)延遲或系統(tǒng)故障等問題;另一種關(guān)節(jié)控制方法是通過關(guān)節(jié)空間的動力學(xué)模型,基于增廣PD控制理論,補償耦合力及摩擦力,設(shè)計主動關(guān)節(jié)的同步控制,但是僅靠速度信息并不能很好地控制人與機器人之間的配合。
針對上述問題,本文提出了一種基于特征深度學(xué)習(xí)的機器人協(xié)調(diào)操作感知控制方法,其關(guān)鍵在于依靠迭代來估算目標(biāo)函數(shù)的最優(yōu)質(zhì)解,優(yōu)化網(wǎng)絡(luò)信息交互的拓?fù)浣Y(jié)構(gòu),特征深度學(xué)習(xí)感知單元,減少數(shù)據(jù)量較大對計算機梯度的消耗,實現(xiàn)操作者與機器人之間的協(xié)調(diào)操作感知性能。
在機器人系統(tǒng)內(nèi),協(xié)調(diào)即機器人與操作者在完成一集體運作時的互相作用,是機器人系統(tǒng)對環(huán)境的適應(yīng)。由于機器人存在著知識不完整、不兼容、不一致和不可度量等問題,使得機器人與操作人員之間可能存在許多沖突,系統(tǒng)在正常有序運行時出現(xiàn)錯誤。在操作更復(fù)雜的物體時,需要操作者和機器人協(xié)同操作,共同完成這一任務(wù)。在這種情況下,為了最大限度地減少彼此間的沖突,機器人和操作者之間需要一種兩者相互感知的協(xié)調(diào)。機械人協(xié)調(diào)主要包括兩個方面的內(nèi)容:機械人與操作者的協(xié)調(diào)操作和機械人部件的協(xié)作。機器人與操作者協(xié)作解決的關(guān)鍵問題是如何組織多個部件共同完成一項任務(wù),而完成任務(wù)的前提條件是決策機制與操作員之間的組織問題[1],機器人的協(xié)作解決主要是如何實現(xiàn)或保持機器人和操作員在執(zhí)行任務(wù)的過程中動作的一致性,即協(xié)作關(guān)系確立后,機器人如何具體控制動作。
對機器人的協(xié)作,現(xiàn)在還沒有一種較為統(tǒng)一的定義。大體上來說,協(xié)調(diào)控制映射了機器人在不同的層次中對交互與感知控制提出的不同要求。其中,機器人系統(tǒng)不同層次的協(xié)調(diào)問題,如圖1所示。
圖1 機器人系統(tǒng)不同層次的協(xié)調(diào)協(xié)作
圖1內(nèi):①隱式協(xié)調(diào),機器人憑借自身現(xiàn)存的規(guī)劃模型控制整體部件的規(guī)劃進而出現(xiàn)的協(xié)調(diào)模式[2];②異步協(xié)調(diào),機器人與操作者的在某個環(huán)境內(nèi),其在出現(xiàn)互相間關(guān)涉的條件下為了將自己的任務(wù)完成所出現(xiàn)的協(xié)作;③同步協(xié)調(diào),機器人和操作者為了對共同的復(fù)雜任務(wù)進行處理,而出現(xiàn)的協(xié)作。
在進行人機協(xié)作時,負(fù)載的承受體是機器人[3],而機器人會與操作者通過力傳感器進行相互作用,操作者經(jīng)過意圖感知對機器人進行負(fù)載運動操作。其運作的流程如圖2所示。
圖2 人機協(xié)調(diào)操作模型
人和機器人協(xié)作搬移質(zhì)量是M的負(fù)載,系統(tǒng)的動力學(xué)模型是:
(1)
式中,M代表負(fù)載的質(zhì)量,m,c,k即虛擬慣量、虛擬剛度系數(shù)與虛擬阻尼,F(xiàn)h就是人機交互力,F(xiàn)r就是負(fù)載上機器人的作用力。機器人是承載負(fù)載的主體,而m,c,k就是決定人機協(xié)調(diào)操作性能的參數(shù)[4]。
憑借上述擬定的人機協(xié)調(diào)操作模型,構(gòu)建人機協(xié)調(diào)系統(tǒng),首先在單自由度人機協(xié)作模型內(nèi)取消回彈力設(shè)置[5],然后擬定機器人阻抗控制剛度的參數(shù)為零,即Kd=0。機器人阻抗控制在笛卡爾空間內(nèi)能夠表示成
(2)
為了提升人機協(xié)作內(nèi)機器人的跟隨性能,使人機系統(tǒng)更為柔順[6],本文擬定了一種阻抗控制器,對機器人的速度進行補償,利用人機作用力和期望力的誤差不斷調(diào)節(jié)速度的補償項,從而使機器人的現(xiàn)實末端速度可以較好地跟隨期望末端速度。
自適應(yīng)阻尼控制器
(3)
式中,Ω代表速度補償項,fd代表期望的交互力,擬定fd=[-t,t],t代表正向接近于零的常數(shù),剩余參數(shù)如上式所示。
速度補償項擬定成
(4)
式中,λ代表收集樣本的周期,η代表更新率,b代表常數(shù)。
特征深度學(xué)習(xí)是神經(jīng)網(wǎng)絡(luò)模型的一種[7],它是一門信息科學(xué)和神經(jīng)心理學(xué)相結(jié)合的交叉學(xué)科,大致上依賴于模擬生物神經(jīng)的工作模式和網(wǎng)絡(luò)結(jié)構(gòu),它并不能完全模擬人的智能。神經(jīng)細(xì)胞是神經(jīng)網(wǎng)絡(luò)中較為基本的一類,它以人腦中神經(jīng)元的基本工作原理為基礎(chǔ),向各種類型的輸入信號傳遞信息,使數(shù)據(jù)完成控制替換。處理后的信息通過神經(jīng)元相互傳遞,從而拓展了網(wǎng)絡(luò)的信息交互范圍。其神經(jīng)網(wǎng)絡(luò)的架構(gòu)如圖3所示。
圖3 神經(jīng)網(wǎng)絡(luò)架構(gòu)圖
在特征深度學(xué)習(xí)算法里,優(yōu)化算法即依靠迭代來估算目標(biāo)函數(shù)的最優(yōu)質(zhì)解。在優(yōu)化問題中,為了減少數(shù)據(jù)量較大對計算機梯度的消耗[8],就需要進行迭代計算,迭代可以讓所有計算步驟逐漸縮小,在非優(yōu)化問題里,憑借迭代方法逐漸的靠近目標(biāo)函數(shù)最優(yōu)質(zhì)解。
針對約束問題minf(x),其目標(biāo)函數(shù)的最小值是x*,f(x)的二階泰勒展開式是
(5)
式中,gk代表f(x)函數(shù)在xk坐標(biāo)的梯度,H(xk)代表f(x)在xk坐標(biāo)的海森矩陣[9],且函數(shù)滿足極值點坐標(biāo)的梯度是零,即
?f(x)=0
(6)
在計算最小值的流程內(nèi),擬定第k+1次迭代里,?f(xk+1)=0,那么通過式(5)計算獲得
?f(x)=gk+Hk(x-xk)
(7)
即:gk+Hk(xk+1-xk)=0,所以能夠獲得牛頓法迭代公式
(8)
上述雖然得到的牛頓法迭代公式,但其計算后無法得到全局最優(yōu)解,因此就需要一種優(yōu)化方法對其進行全局最優(yōu)解。
擬定f(x)含有一階連續(xù)偏導(dǎo)數(shù),在計算此類無約束最優(yōu)問題minf(x)里,x*為最小的目標(biāo)函數(shù)值。在估算最優(yōu)解的過程里,負(fù)梯度坐標(biāo)就是依靠函數(shù)下降最快的方法,因此在迭代的過程時,都需要憑借負(fù)梯度坐標(biāo)來更新x值。f(x)的一階泰勒擴展公式是
(9)
式中,gk代表f(x)函數(shù)在xk坐標(biāo)的梯度,那么第k+1次迭代滿足
x(k+1)←xk+λkPk
(10)
式中,Pk代表搜索的方向,即負(fù)梯度方向,λk為步長。在凸優(yōu)化函數(shù)的估算的流程里,梯度下降方法可以得到全局最優(yōu)解的函數(shù)。
得到最優(yōu)解之后需要對其進行海塞矩陣的計算,但在牛頓法迭代里,計算海塞逆矩陣H-1較為困難,因此能夠憑借n階矩陣來靠近H-1。在算法的所有迭代步驟內(nèi),滿足
(11)
式中,k代表迭代的次數(shù),那么Hk的更新規(guī)則是
(12)
(13)
(14)
(15)
(16)
式中,rk代表比值系數(shù),只要利用最后的曲率信息來估算出現(xiàn)實的海森矩陣,并且其可以使當(dāng)前不的搜索方向為期望方向,從而縮短結(jié)果與現(xiàn)實值之間的誤差,并且在步長是ak=1的狀態(tài)下也可以獲得滿足,進而使后期步長的時間與搜索步驟得到節(jié)省。
由于力傳感器信息中含有噪聲,因此需要平滑去噪處理,以保證人機協(xié)調(diào)操作的穩(wěn)定性,因此在人機協(xié)同操作感知中,輸入與速度之間沒有線性關(guān)系。通過人機交互力信息的采集,在利用導(dǎo)納控制方法收集源件時達(dá)到了理想的運行效率。受到導(dǎo)納控制的人機協(xié)調(diào)模型如圖4所示。
圖4 導(dǎo)納控制的人機協(xié)調(diào)操作感知模型
機械阻抗是導(dǎo)納理論的前身,是一種依據(jù)剛度、廣義慣量和阻尼的等效理念,把現(xiàn)實的物理系統(tǒng)擬定為一種具有導(dǎo)納特征的輸出與輸入系統(tǒng),建造理想速度與作用力之間的聯(lián)系。其定義是
(17)
式中,M,C,K分別代表廣義阻尼、廣義慣量與廣義剛度。
本文對控制系統(tǒng)的虛擬阻尼參數(shù)進行調(diào)解,從而使系統(tǒng)的感知響應(yīng)速度得到提高。可變阻尼的參數(shù)調(diào)解規(guī)則如下所示
1)在|dF|<β時,操作者施加作用力,那么具有力的轉(zhuǎn)化信息的可變阻抗控制規(guī)則即
(18)
2)初始速度方向上的力突然降低,其可以表示成減速,這就能夠判定操作者需要改變方向或是停止。此時需要將系統(tǒng)的阻尼參數(shù)值進行提升控制,進而使系統(tǒng)的感知響應(yīng)時間縮短,即|dF|↓?c↑,因此人機交互內(nèi)、運動速度與加速度的關(guān)聯(lián)是
(19)
為了使人機協(xié)調(diào)操作的條件得到滿足,讓操作者的操作環(huán)境更為舒適、穩(wěn)定與安全,力的增量需要在一個可控的范圍里,即|dF|<β,假如dF>0時的加速度超過零,那么就說明操作者想要加速,反之就是想要減速。
3)在|dF|≥β時,代表人機協(xié)作出現(xiàn)偏差,即人機操作時力出現(xiàn)一種突變的狀態(tài),需要剔除此刻的力信息,機器人持續(xù)上一時刻的作用力,不出現(xiàn)置換。
仿真環(huán)境為Intel Celeron Tulatin1GHz CPU、384MB SD內(nèi)存的硬件環(huán)境以及MATLAB6.1的軟件環(huán)境。
為了證明本文方法的實用性,引入阻抗控制方法(方法一)、變阻尼性控制方法(方法二)和關(guān)節(jié)控制方法(方法三)對機器人部位進行關(guān)節(jié)1和關(guān)節(jié)2追蹤位置測試,通過部位關(guān)節(jié)的位置跟蹤性能評定操作者與機器人之間的協(xié)調(diào)操作感知控制狀況,結(jié)果如圖5、6所示。
圖5 關(guān)節(jié)1位置誤差
通過圖5能夠看出,本文方法的誤差度大于0,完全可以滿足實際運行的需要。
圖6為官集結(jié)2位置的誤差度對比測試結(jié)果。
圖6 關(guān)節(jié)2位置誤差
由圖6可知,最高可達(dá)0.2,說明本文方法對機器人的協(xié)調(diào)操作感知有著較好的控制精度,同時還存在較好的操作性能,操作模型可以平滑切換。
本文利用人機作用力和期望力的誤差不斷調(diào)節(jié)速度的補償項,從而使機器人的現(xiàn)實末端速度可以較好地跟隨期望末端速度?,F(xiàn)應(yīng)用方法1、方法2和方法3對多個補償項下的末端速度進行迭代測試,不同方法的測試結(jié)果如圖7所示。
圖7 不同方法末端速度迭代測試結(jié)果
由圖7可知,在迭代過程中,本文方法對人機作用力和期望力的擬合效果較高,且皆高于其它方法,因為控制系統(tǒng)的軟件使用了模塊化的架構(gòu),使系統(tǒng)可以更容易的得到維護與擴充,進而減少系統(tǒng)資源的占用比值,最高為94%,減少了操作者的負(fù)擔(dān)。
1)為了對機器人進行負(fù)載操作,實現(xiàn)操作者與機器人之間的穩(wěn)定交互,本文提出了一種基于特征深度學(xué)習(xí)的機器人協(xié)調(diào)操作感知控制方法。
2)分析機器人的協(xié)調(diào)操作原理,優(yōu)化機器人協(xié)調(diào)操作的感知性能,減少系統(tǒng)資源的占比最高可達(dá)94%。
3)利用虛擬阻尼、虛擬慣量與虛擬剛度系數(shù)構(gòu)建人機協(xié)調(diào)操作模型,模型誤差度大于0,最高可達(dá)0.2,使得人機協(xié)調(diào)操作的穩(wěn)定性得到提升,機器人負(fù)載運動狀態(tài)控制更為穩(wěn)定。