劉成菊 林立民 劉 明 陳啟軍
相比單臂機(jī)器人,多臂機(jī)器人可以通過協(xié)作完 成一些更加復(fù)雜的動(dòng)作,實(shí)現(xiàn)各種靈巧操作任務(wù),如搬運(yùn)、焊接和裝配等.多臂機(jī)器人各個(gè)機(jī)械臂的工作空間一般存在著相互重疊的區(qū)域,即它們之間的協(xié)作工作區(qū)域,在這個(gè)區(qū)域內(nèi)各個(gè)機(jī)械臂可以完成協(xié)作任務(wù)[1-3].然而,多臂機(jī)器人如何在這個(gè)工作區(qū)域協(xié)調(diào)好多個(gè)任務(wù)一直是研究熱點(diǎn)和難點(diǎn).
Lim 等[4]研究了雙臂機(jī)器人的抓取,通過對雙臂的軌跡進(jìn)行提前規(guī)劃,并由微分變換算出手臂的移動(dòng)增量,成功實(shí)現(xiàn)了對水平放置的圓柱體的抓取和搬移;Ortenzi 等[5]實(shí)現(xiàn)了保持末端相對位置不變的雙機(jī)械臂軌跡規(guī)劃策略,先對主機(jī)械臂的軌跡進(jìn)行規(guī)劃,然后通過建立的運(yùn)動(dòng)約束方程來生成從機(jī)械臂的軌跡;Ramirez-Alpizar 等[6]利用Leap Motion 運(yùn)動(dòng)捕捉器采集人類手臂執(zhí)行零件裝配任務(wù)時(shí)的運(yùn)動(dòng),然后提取裝配任務(wù)時(shí)軌跡關(guān)鍵點(diǎn)的手指所處的位置和姿態(tài),用于控制Baxter 機(jī)器人生成裝配任務(wù)的軌跡;Tuan 等[7]提出了一種基于姿態(tài)估計(jì)的滑??刂撇呗?設(shè)計(jì)了一種具有魯棒性的自適應(yīng)控制器,用于雙臂機(jī)器人的3D 協(xié)作運(yùn)動(dòng),但是該算法作者只將其運(yùn)用到單臂自由度為2 的雙臂機(jī)器人上.這些多臂協(xié)作控制策略提前規(guī)劃機(jī)器人的執(zhí)行軌跡,實(shí)時(shí)性有待提高,往往也需要建立復(fù)雜的機(jī)器人動(dòng)力學(xué)模型.近年來,研究學(xué)者希望通過示教學(xué)習(xí)的策略,讓機(jī)器人學(xué)習(xí)人類如何執(zhí)行靈巧操作的任務(wù).動(dòng)態(tài)運(yùn)動(dòng)基元 (Dynamic movement primitive,DMP)模型[8-12]和高斯混合模型 (Gaussian mixture model,GMM)[13-19]是典型的示教學(xué)習(xí)算法.
DMP 模型由動(dòng)作變化系統(tǒng)和標(biāo)準(zhǔn)時(shí)間系統(tǒng)構(gòu)成[8].該模型通過對機(jī)器人的示教軌跡進(jìn)行擬合,提取示教軌跡的形狀特征,并通過設(shè)定期望的軌跡終點(diǎn)和時(shí)長生成具有泛化性的機(jī)器人軌跡.DMP 的優(yōu)點(diǎn)在于可以控制生成軌跡的時(shí)長和幅度,但是這種示教學(xué)習(xí)模型只能應(yīng)用于軌跡終點(diǎn)速度為0 的場景.Kober 等[9]對原始DMP 模型進(jìn)行了改進(jìn),將其應(yīng)用于終點(diǎn)速度不為0 的場景,但是如果軌跡稍有差異,都需要重新進(jìn)行模型的設(shè)計(jì),即基于DMP的學(xué)習(xí)算法只能實(shí)現(xiàn)單條示教軌跡的學(xué)習(xí).如果示教軌跡存在噪聲,泛化得到的輸出軌跡效果非常不理想.GMM 示教學(xué)習(xí)模型利用高斯混和模型來對機(jī)器人軌跡進(jìn)行建模,用概率的方法來提取軌跡之間的相關(guān)關(guān)系,從而對示教軌跡進(jìn)行表征;然后利用高斯混合回歸可以實(shí)現(xiàn)軌跡的泛化輸出.基于GMM 的軌跡學(xué)習(xí)模型能夠很好地保持示教軌跡的空間形狀特征,但是一旦示教軌跡存在時(shí)長上的差異,GMM 模型的軌跡學(xué)習(xí)效果不佳.
針對DMP 和GMM 軌跡學(xué)習(xí)算法各自存在的問題,本文提出基于動(dòng)態(tài)時(shí)間規(guī)整-高斯混合模型(Dynamic time warping-Gaussian mixture model,DTW-GMM)的多機(jī)械臂協(xié)同軌跡生成方法.論文主要內(nèi)容分為三部分: 1)針對機(jī)器人示教軌跡往往存在時(shí)間長短差異較大的問題,采用DTW 算法來規(guī)整機(jī)器人的示教軌跡.文獻(xiàn)[20]利用DTW 方法來規(guī)整人類不同語速的發(fā)音,消除語音的發(fā)音時(shí)間長短不一對語音識(shí)別的影響.本文將DTW 核心思想進(jìn)行遷移,用其來規(guī)整機(jī)器人的示教軌跡.2)基于DTW 所規(guī)整的示教軌跡,利用GMM 概率模型來學(xué)習(xí)示教軌跡的共同特征,并設(shè)計(jì)多機(jī)械臂多任務(wù)協(xié)同的軌跡生成策略,利用高斯混合回歸(Gaussian mixture regression,GMR)泛化輸出各機(jī)械臂的執(zhí)行軌跡.3)設(shè)計(jì)機(jī)器人的運(yùn)動(dòng)控制引擎并利用Pepper 機(jī)器人平臺(tái),完成手臂協(xié)作搬運(yùn)和漢字軌跡書寫實(shí)驗(yàn),驗(yàn)證本文提出的多機(jī)械臂協(xié)同控制策略的可行性和有效性.
動(dòng)態(tài)時(shí)間規(guī)整(Dynamic time warping,DTW)算法可以用來規(guī)整機(jī)器人的示教軌跡.該方法主要的核心思想在于,將兩個(gè)長度不一的時(shí)間信號(hào)通過對齊拉伸到相同長度,且拉伸后使得兩條軌跡之間的距離最短.DTW算法可以由如下目標(biāo)方程描述[21]:
式中,Wx=[aij](1≤i ≤nx,1≤j ≤n,aij ∈{0,1})和Wy=[aij](1≤i ≤ny,1≤j ≤n,aij ∈{0,1}) 表示二值時(shí)間規(guī)整矩陣,通過將時(shí)間信號(hào)X和Y中的相關(guān)向量進(jìn)行拉伸,最終將兩個(gè)軌跡矩陣規(guī)整到相同長度.
時(shí)間規(guī)整矩陣必須同時(shí)滿足以下三個(gè)約束條件:
1)X和Y的初始和終止向量點(diǎn)必須對齊;
2)規(guī)整矩陣本質(zhì)上表示的是時(shí)間序列,因此規(guī)整矩陣中取值為1 的點(diǎn)所依次連成的路徑(即規(guī)整路徑)必須是單調(diào)的;
3) 由于信號(hào)需要保持有序性,因此矩陣X和Y中對應(yīng)向量的前后順序必須保持不變.
求解目標(biāo)方程(1)中的時(shí)間規(guī)整矩陣可以使用動(dòng)態(tài)規(guī)劃(Dynamical programming,DP)算法或廣義典型時(shí)間規(guī)整(Generalized canonical time warping,GCTW)算法[21-22],兩種求解算法的時(shí)間復(fù)雜度的對比如表1 所示,其中l(wèi)用于設(shè)置GCTW算法規(guī)整后軌跡信號(hào)的長度,原則上選取l=1.2×max(nx,ny),m表示單調(diào)增函數(shù)基的個(gè)數(shù),一般m的取值為5 左右.GCTW 比DP 算法具有較低的時(shí)間復(fù)雜度,后文采用GCTW 算法進(jìn)行多機(jī)械臂示教軌跡的規(guī)整策略.
表1 算法的時(shí)間復(fù)雜度Table 1 Time complexity of algorithms
圖1 表示兩個(gè)示教軌跡序列在DTW 算法規(guī)整下的結(jié)果.圖1(b)所示的規(guī)整路徑將圖1(a)原始序列規(guī)整成圖1(c).由此可見,DTW 算法可以很好地改善原有示教軌跡存在的時(shí)間差異較大的問題,從而統(tǒng)一時(shí)間的變化.
經(jīng)DTW 規(guī)整后的示教軌跡,利用GMM 概率模型[23-25]進(jìn)行表征,從而提取示教軌跡的共同特征.對于多機(jī)械臂示教數(shù)據(jù),本文將其表示為:
式中,yi,s,yi,t分別表示示教軌跡的空間信息和時(shí)間信息,T表示示教軌跡中示教點(diǎn)的個(gè)數(shù).
對于多維示教變量y=(y1,y2,···,yT),建模GMM 為:
式中,p(y)表示概率密度函數(shù),K表示高斯分布的個(gè)數(shù),πk表 示第k個(gè)高斯分布所占的權(quán)重,N(y;μk,Σk)表示以μk為均值,Σk為協(xié)方差矩陣的高斯概率密度函數(shù),D代表示教軌跡的維度.
相比于高斯分布的參數(shù)估計(jì),混合高斯分布的參數(shù)估計(jì)更加復(fù)雜.主要原因在于隱變量的存在.對于示教樣本集y=(y1,y2,···,yT),通過隱變量γt,k的引入,即表示yt這個(gè)樣本由第k個(gè)模型生成,可以將數(shù)據(jù)展開成完全數(shù)據(jù):
若yt由 第1類采樣而來,則有γt,1=1,γt,2=0,···,γt,K=0,表示為(yt,1,0,···,0).
故完全數(shù)據(jù)的似然函數(shù)為:
可以利用期望值最大(Expectation maximum,EM) 算法進(jìn)行迭代計(jì)算,求取GMM模型的參數(shù)πk,μk,Σk.先定義Q 函數(shù)如下:
式中,μi,Σi,πi分別表示第i次迭代時(shí)GMM 模型的各個(gè)高斯分布模型的均值,協(xié)方差矩陣和權(quán)重集合;表示對γ的估計(jì):
對Q 函數(shù)進(jìn)行求導(dǎo),并令其導(dǎo)數(shù)為0,可得:
為了使得EM 算法能夠更快地收斂,本文將經(jīng)由DTW 規(guī)整后的多機(jī)械臂示教軌跡利用K 均值(K-means)聚類算法進(jìn)行聚類,劃分?jǐn)?shù)據(jù)的所屬類別,進(jìn)行期望值最大算法的參數(shù)初始化.同時(shí)利用赤池信息準(zhǔn)則[26](Akaike information criterion,AIC),通過最優(yōu)化AIC 指標(biāo)函數(shù)對K-means 的K值進(jìn)行選取:
式中,C(K)表示GMM 概率模型參數(shù)數(shù)目;D表示示教數(shù)據(jù)集的維度;l nL(y)表示初始參數(shù)下示教樣本的對數(shù)似然函數(shù).采用DTW-GMM 算法對機(jī)器人的多機(jī)械臂示教軌跡進(jìn)行特征提取的步驟如算法1 所示.
算法1.基于DTW-GMM 算法的多機(jī)械臂示教軌跡特征提取
圖2 是基于本文提出的算法生成的二維雙臂協(xié)同軌跡泛化輸出.圖2(a)為雙臂協(xié)作的示教軌跡,左、右機(jī)械臂分別負(fù)責(zé) “U”和 “Z”字形的任務(wù)執(zhí)行軌跡.圖2(b)則為基于DTW-GMM 算法的軌跡表征圖,此處經(jīng)由AIC 準(zhǔn)則確定的K取值為3.圖2(c)對應(yīng)以左手臂空間矢量作為查詢向量下,右手臂的泛化輸出圖.由圖2 可以看出,本文算法可以對多機(jī)械臂的示教軌跡進(jìn)行表征,并在GMR 回歸下生成具有一定泛化性的機(jī)械臂執(zhí)行軌跡,用于完成多臂協(xié)作任務(wù).
圖2 雙臂協(xié)同軌跡泛化輸出Fig.2 Generalized dual-arm collaborative trajectory output
對機(jī)器人進(jìn)行示教時(shí),軌跡的噪聲時(shí)時(shí)存在.圖3 探討了本文采用的GMR 泛化輸出策略對示教噪聲的抗干擾性.圖3(a)為單條示教軌跡時(shí),漢字軌跡 “打”存在框選處的噪聲時(shí),軌跡的表征輸出結(jié)果.而圖3(b)對應(yīng)3 條示教軌跡時(shí),GMR 的輸出情況.由圖3 可以看出,本文的軌跡泛化策略具有一定的抗干擾性,即使存在噪聲,算法依舊可以充分提取示教軌跡的共同特征.
為了將本文提出的多機(jī)械臂多任務(wù)協(xié)同策略運(yùn)用到機(jī)器人控制中,設(shè)計(jì)了如圖4 所示的控制系統(tǒng)架構(gòu)[27].其中多機(jī)械臂協(xié)同軌跡生成器主要負(fù)責(zé)多機(jī)械臂示教軌跡的特征學(xué)習(xí)與協(xié)同軌跡輸出.其通過傳感器反饋的姿態(tài)信息為查詢向量,實(shí)時(shí)輸出機(jī)械臂的協(xié)同軌跡.而運(yùn)動(dòng)引擎主要負(fù)責(zé)對多機(jī)械臂協(xié)同輸出的軌跡進(jìn)行跟蹤控制.
圖4 總體系統(tǒng)架構(gòu)設(shè)計(jì)Fig.4 The system architecture block diagram
多機(jī)械臂軌跡生成原器的原理框圖如圖5 所示.首先,對多機(jī)械臂進(jìn)行軌跡示教 然后利用DTWGMM 算法對示教軌跡進(jìn)行特征提取.其中EM 算法用于GMM 概率模型參數(shù)的學(xué)習(xí),而K-means算法對經(jīng)由DTW 算法規(guī)整后的示教軌跡進(jìn)行聚類學(xué)習(xí),獲得EM 算法迭代的初始參數(shù)μ0、Σ0、π0.與參數(shù)隨機(jī)初始化相比,K-means 可以加快EM 算法的收斂.而K-means算法中K值的選定由AIC指標(biāo)函數(shù)確定,防止模型的過擬合.為了滿足機(jī)械臂軌跡生成的實(shí)時(shí)性要求,多機(jī)械臂協(xié)同軌跡生成器需要進(jìn)行預(yù)訓(xùn)練,否則軌跡的規(guī)整和參數(shù)的學(xué)習(xí)將耗費(fèi)較多的時(shí)間.預(yù)訓(xùn)練之后的軌跡生成器實(shí)時(shí)接收查詢向量的輸入,利用GMR 在線輸出各個(gè)機(jī)械臂的協(xié)同軌跡.
圖5 多機(jī)械臂協(xié)同軌跡生成器框圖Fig.5 Multi-arm collaborative trajectory generator block diagram
在機(jī)器人運(yùn)動(dòng)學(xué)中,關(guān)節(jié)空間與工作空間的對應(yīng)關(guān)系可以描述為:
式中,T=[T1,T2,···,TN] 表示機(jī)器人末端的位置和姿態(tài);θ=[θ1,θ2,···,θM] 中的θi表示第i個(gè)連桿相對于第i -1 個(gè)連桿的旋轉(zhuǎn)角度或者位移.
本文采用分解速度控制法[28](Resolved motion rate control,RMRC)來控制機(jī)器人的關(guān)節(jié)角速度.機(jī)器人的微分運(yùn)動(dòng)學(xué)和逆微分運(yùn)動(dòng)學(xué)方程可以表示為:
式中,J(θ)、J-1(θ)分別表示雅克比矩陣和其逆矩陣.
當(dāng)機(jī)器人系統(tǒng)冗余時(shí),即M>N時(shí),雅可比矩陣可能存在非滿秩的狀態(tài).此時(shí),可以用雅可比矩陣的偽逆矩陣代替其逆矩陣[29]:
為了防止奇異性問題的出現(xiàn),通過引入阻尼系數(shù)λ來保證偽逆矩陣有意義:
由此,設(shè)計(jì)基于微分逆運(yùn)動(dòng)學(xué)的機(jī)器人運(yùn)動(dòng)控制引擎如圖6 所示.其中,Xref表示多機(jī)械臂協(xié)同學(xué)習(xí)系統(tǒng)輸出的參考軌跡,J表示雅可比矩陣,qreal表示機(jī)器人的實(shí)時(shí)關(guān)節(jié)角.
圖6 基于微分逆運(yùn)動(dòng)學(xué)的機(jī)器人運(yùn)動(dòng)控制引擎設(shè)計(jì)框圖Fig.6 Block diagram of the motion control engine based on differential inverse kinematics
4.1.1 雙臂搬運(yùn)示教與DTW 規(guī)整
如圖7 所示,本文選用Pepper 仿人機(jī)器人作為實(shí)驗(yàn)驗(yàn)證平臺(tái).Pepper 高1.2 m,裝有加速度計(jì)和陀螺儀等多種傳感器,共有20 個(gè)自由度,本文只考慮其左、右手臂各有的5 個(gè)自由度.其帶有的操作系統(tǒng)NAOqi 支持python SDK 和C++SDK.本文利用Matlab 良好的數(shù)據(jù)處理特性進(jìn)行DTW多機(jī)械臂示教軌跡的規(guī)整、GMM 概率模型的軌跡表征訓(xùn)練以及Pepper 正逆運(yùn)動(dòng)學(xué)的計(jì)算等工作,然后將泛化輸出的多機(jī)械臂協(xié)同軌跡數(shù)據(jù)存儲(chǔ)為.mat 格式的文件,最后調(diào)用這些文件控制Pepper 的雙臂完成協(xié)作搬運(yùn).
圖7 Pepper 實(shí)驗(yàn)平臺(tái)Fig.7 Pepper experimental platform
圖8 所示為Pepper 雙臂協(xié)作完成搬運(yùn)的示教過程序列,不同人的示教過程往往存在時(shí)間長短和速度差異較大的問題.實(shí)驗(yàn)時(shí)進(jìn)行三次搬運(yùn)示教,將示教得到的軌跡數(shù)據(jù)傳到Matlab,并利用DTW算法規(guī)整原始示教軌跡,結(jié)果如圖9 所示.左側(cè)表示三次示教時(shí)右手臂末端的軌跡和x、y、z三維上的變化情況.左側(cè)對應(yīng)的原始示教軌跡序列表明,對于三次相同動(dòng)作的示教軌跡,軌跡的時(shí)間差異明顯,而右側(cè)經(jīng)由DTW 規(guī)整后的軌跡消除了示教過程中的時(shí)間不一的影響,統(tǒng)一了時(shí)間維度上的變化.
圖8 雙臂協(xié)作搬運(yùn)示教Fig.8 Demonstrations of dual-arm collaborative moving trajectory
圖9 右手臂軌跡DTW 規(guī)整Fig.9 DTW output of right arm trajectory
4.1.2 DTW-GMM 軌跡表征
基于DTW 規(guī)整后的多機(jī)械臂示教軌跡,利用算法1 所述流程進(jìn)行軌跡的表征學(xué)習(xí).實(shí)驗(yàn)中相關(guān)參數(shù)設(shè)置如表2 所示.
表2 DTW-GMM 算法參數(shù)設(shè)置Table 2 Parameter setting of the DTW-GMM algorithm
圖10 是GMM 模型跟本文提出的DTWGMM 模型針對搬運(yùn)時(shí)右手臂的x、y、z的三維特征表征情況.此處由式(11) AIC 準(zhǔn)則確定的K的取值為4.GMM 是一種概率模型的軌跡表征策略,圖10 中用橢圓來描述示教軌跡的特征提取結(jié)果.橢圓的形狀由高斯分布的協(xié)方差矩陣所決定,其面積大小表示右手臂三維空間位置的不確定度.面積越大,不確定度越大,即軌跡的特征提取效果越差.DTW-GMM 的表征結(jié)果優(yōu)于GMM.表3 和表4是GMM和DTW-GMM 表征的同一個(gè)高斯分布的協(xié)方差矩陣表.由協(xié)方差矩陣表的定量分析可以看出,DTW-GMM 對應(yīng)的各維度變量之間具有較小的協(xié)方差,算法可以更好地提取機(jī)械臂示教軌跡的特征,具有更好的表征結(jié)果.
圖10 右手臂軌跡表征Fig.10 Right arm trajectory characterization
表3 GMM 表征協(xié)方差矩陣表Table 3 Covariance matrix of GMM algorithm
表4 DTW-GMM 表征協(xié)方差矩陣表Table 4 Covariance matrix of DTW-GMM algorithm
4.1.3 GMR 軌跡泛化輸出
對機(jī)械臂示教軌跡經(jīng)GMM 編碼后,利用GMR進(jìn)行軌跡重構(gòu),可以得到泛化的輸出軌跡.圖11 是右手臂的泛化輸出示意圖.經(jīng)由DTW 規(guī)整后的示教軌跡特征更加明顯,泛化輸出時(shí)具有更低的不確定度.
圖11 右手臂軌跡泛化輸出Fig.11 Generalized right arm trajectory output
得到右手臂的GMR 泛化輸出軌跡后,利用第3 節(jié)所述多機(jī)械臂的協(xié)同策略,以作為查詢向量,實(shí)時(shí)獲取左手臂的位置控制向量,最后得到搬運(yùn)實(shí)驗(yàn)時(shí)左、右手臂的協(xié)作執(zhí)行軌跡如圖12所示.其中,虛線表示原始的三條示教軌跡,實(shí)線是泛化輸出的執(zhí)行軌跡.原始示教軌跡由于噪聲的存在,軌跡的平滑性能較差.本文所提出的DTW-GMM策略對噪聲具有一定的抗干擾性,能夠充分提取示教軌跡的共同特征,且最終輸出的執(zhí)行軌跡具有較好的平滑性.
圖12 搬運(yùn)實(shí)驗(yàn)左右手臂軌跡泛化輸出Fig.12 Generalized dual-arm trajectory output in moving experiment
4.1.4 實(shí)體機(jī)器人實(shí)驗(yàn)
在Pepper 機(jī)器人平臺(tái)上,基于本文所提出的DTW-GMM 策略,以右手臂的空間位置信息和DTW 規(guī)整后的時(shí)間信息為查詢向量,實(shí)時(shí)獲取左右臂的協(xié)同執(zhí)行軌跡信息.在第3.2 節(jié)設(shè)計(jì)的運(yùn)動(dòng)控制引擎作用下,對軌跡進(jìn)行跟蹤控制.圖13 是Pepper 機(jī)器人雙臂協(xié)作完成搬運(yùn)實(shí)驗(yàn)的截圖.通過實(shí)驗(yàn)可以發(fā)現(xiàn),本文的多機(jī)械臂協(xié)同軌跡生成時(shí)間約為1 ms,實(shí)驗(yàn)的硬件環(huán)境為16.00 GB RAM,Intel i7-7500U CPU,軟件環(huán)境為Matlab 2018a.實(shí)驗(yàn)結(jié)果表明了基于DTW-GMM 模型對控制機(jī)器人雙機(jī)械臂完成協(xié)同任務(wù)的可行性.
圖13 雙臂協(xié)作搬運(yùn)實(shí)驗(yàn)截圖Fig.13 Snapshots of dual-arm to collaboratively move basket
漢字軌跡由筆畫組成,是一種離散化的軌跡[30-34].當(dāng)前的漢字軌跡書寫主要是基于預(yù)規(guī)劃軌跡的執(zhí)行策略.通過將漢字軌跡分段進(jìn)行規(guī)劃,并設(shè)計(jì)控制器跟蹤所規(guī)劃的筆畫軌跡.這種策略模式單一,泛化性不足.近年來,研究人員希望通過示教學(xué)習(xí)的策略,來學(xué)習(xí)漢字軌跡的特征,提高軌跡生成的泛化性.而當(dāng)前基于示教學(xué)習(xí)的研究主要將漢字軌跡進(jìn)行連續(xù)化處理,這樣會(huì)失去原有漢字軌跡的基本特征,且當(dāng)漢字軌跡較為復(fù)雜時(shí)進(jìn)行連續(xù)化示教操作繁瑣.為此,本節(jié)提出基于DTW-GMM 的漢字軌跡書寫策略.
由于漢字軌跡的書寫主要是在x、y平面上的運(yùn)動(dòng),所以可以將某一個(gè)機(jī)械臂的x、y平面上的位置信息向量和經(jīng)由DTW 規(guī)整后的時(shí)間t,即以作為查詢向量,通過GMM 和GMR 的多機(jī)械臂軌跡的表征和泛化,輸出其他機(jī)械臂的協(xié)同軌跡.圖14(a)是基于本文提出的協(xié)同策略的漢字軌跡"木"的書寫情況.將 “木”字按照筆畫分解為“一”、“丨”、“丿”、“丶”四段軌跡,由4 個(gè)機(jī)械臂分別執(zhí)行,并以執(zhí)行 “一”的機(jī)械臂的位置矢量作為查詢向量,實(shí)時(shí)獲取其余機(jī)械臂的協(xié)同軌跡數(shù)據(jù).“木”字軌跡較為簡單,當(dāng)漢字的筆畫較為復(fù)雜時(shí),比如對于交叉型的軌跡,可以適當(dāng)調(diào)整策略,通過將某些筆畫分配給同一個(gè)機(jī)械臂,可以減少需要進(jìn)行協(xié)同的機(jī)械臂的數(shù)量,減少書寫任務(wù)的復(fù)雜性,如對于漢字軌跡 “打”字,可以利用雙機(jī)械臂分別對軌跡的 “扌”和 “丁”進(jìn)行學(xué)習(xí),最終 “打”字的軌跡表征與生成情況如圖14(b)所示.
圖14 基于DTW-GMM 算法的漢字軌跡書寫Fig.14 Chinese character trajectory generation based on DTW-GMM algorithm
本文提出了一種基于概率模型的多機(jī)械臂示教軌跡表征策略,可以用于實(shí)現(xiàn)機(jī)器人的多臂協(xié)作.利用DTW-GMM 算法對原始示教軌跡進(jìn)行時(shí)間規(guī)整并提取共同特征,然后設(shè)計(jì)多機(jī)械臂協(xié)同控制策略,最后基于GMR 回歸多機(jī)械臂的協(xié)同軌跡.Pepper 機(jī)器人雙臂協(xié)作完成搬運(yùn)和漢字軌跡書寫實(shí)驗(yàn)驗(yàn)證了本文所提出的基于DTW-GMM 的多機(jī)械臂多任務(wù)協(xié)同策略的有效性.下一步預(yù)期在軌跡生成時(shí)融入視覺信息反饋和基于強(qiáng)化學(xué)習(xí)的參數(shù)學(xué)習(xí)策略,實(shí)現(xiàn)復(fù)雜環(huán)境下的多機(jī)械臂適應(yīng)性協(xié)同軌跡的輸出.