于建均,姚紅柯,左國玉,阮曉鋼,安碩
(1. 北京工業(yè)大學(xué) 信息學(xué)部,北京 100124; 2. 北京工業(yè)大學(xué) 計(jì)算智能與智能系統(tǒng)北京市重點(diǎn)實(shí)驗(yàn)室,北京100124)
目前,在機(jī)器人技術(shù)的研究中,如何使機(jī)器人具備類似于人類的智能行為已成為一大研究熱點(diǎn)[1]。而從人類學(xué)習(xí)中發(fā)展而來的模仿學(xué)習(xí),作為機(jī)器人直接獲取知識和技能的一種方式,在機(jī)器人的智能性的提升方面越來越發(fā)揮出巨大的作用,越來越多地受到學(xué)術(shù)界的關(guān)注和研究[2-6]。一方面,相對于傳統(tǒng)的機(jī)器人編程控制,模仿學(xué)習(xí)將使機(jī)器人編程更加容易,提高了機(jī)器人的作業(yè)效率;另一方面,模仿學(xué)習(xí)賦予機(jī)器人獲取知識、學(xué)習(xí)知識的能力,使其更加具備智能性[7]。
機(jī)器人模仿學(xué)習(xí)一般分為3個步驟完成:示教過程、學(xué)習(xí)過程、再現(xiàn)過程。當(dāng)前,模仿學(xué)習(xí)的研究,主要集中在對學(xué)習(xí)過程的研究,已經(jīng)出現(xiàn)了多種模仿學(xué)習(xí)的算法用來實(shí)現(xiàn)機(jī)器人的學(xué)習(xí)過程[8-11]。其中基于軌跡匹配的機(jī)器人模仿學(xué)習(xí)算法主要有高斯混合模型(GMM)[12]和高斯混合回歸 GMR(gaussian maxture regression)[12-13]、局部加權(quán)回歸LWR(locally weighted regression)[14-15]、人工神經(jīng)網(wǎng)絡(luò)ANN(artificial neural networks)[16-17]等,這些算法的特點(diǎn)是將示教運(yùn)動軌跡數(shù)據(jù)建模為回歸過程,以期獲得控制策略指導(dǎo)機(jī)器人對示教運(yùn)動進(jìn)行再現(xiàn)。雖然基于軌跡匹配的回歸算法具有較強(qiáng)的數(shù)據(jù)表征能力和抗噪能力,但是也存在泛化能力差、穩(wěn)定性差等缺點(diǎn)[18]。Ijspeert等[19]提出的一種基于動態(tài)運(yùn)動基元DMP(dynamic morement primitives)的機(jī)器人模仿學(xué)習(xí)方法。該方法將運(yùn)動行為軌跡建模為一組微分方程,并通過線性動態(tài)系統(tǒng)保證了目標(biāo)的全局穩(wěn)定性,可以從一個簡單的示教中學(xué)習(xí)較復(fù)雜的運(yùn)動行為,已有廣泛的使用[19-22]。然而,DMP對時間具有依賴性,使其對時間擾動較為敏感,穩(wěn)定性受到一定影響;而且泛化能力有限,其背后的物理意義也比較難于理解。
動態(tài)系統(tǒng)(DS)法[13,23]是近些年出現(xiàn)的一種對運(yùn)動數(shù)據(jù)建模的機(jī)器學(xué)習(xí)方法。DS可以表征更豐富的行為,可以在狀態(tài)空間的不同部分學(xué)習(xí)不同的運(yùn)動。然而,由于DS存在穩(wěn)定性的問題,常規(guī)的基于GMR、GPR(gaussian process regression)[24]以及LWR的回歸方法與DS結(jié)合也沒有實(shí)現(xiàn)在目標(biāo)點(diǎn)上的穩(wěn)定收斂[25]。其往往是找到關(guān)于系統(tǒng)的一個局部最優(yōu)模型,此局部最優(yōu)模型的約束條件無法保證系統(tǒng)收斂到穩(wěn)定的目標(biāo)點(diǎn),仍然存在穩(wěn)定性差和泛化能力不足的問題。
針對以上問題,本文通過GMM將示教運(yùn)動建模為非線性DS,附加約束條件以確保DS的全局漸近收斂,將動態(tài)系統(tǒng)模型的參數(shù)學(xué)習(xí)問題轉(zhuǎn)化為求解一個約束優(yōu)化問題,通過優(yōu)化問題的求解得到DS的參數(shù),獲得關(guān)于示教運(yùn)動的非線性DS模型,并將其作為控制策略應(yīng)用于機(jī)器人以實(shí)現(xiàn)對示教運(yùn)動的模仿。通過將動態(tài)系統(tǒng)方法引入模仿學(xué)習(xí),并考慮其在目標(biāo)點(diǎn)處全局漸近收斂的約束條件,相對于基于軌跡匹配的機(jī)器人模仿學(xué)習(xí)方法,其除了具有較強(qiáng)的數(shù)據(jù)編碼能力和抗噪能力,而且可以保證生成的軌跡收斂到目標(biāo)點(diǎn),避免了先前方法穩(wěn)定性差的問題。同時,從未示教區(qū)域開始的再現(xiàn)運(yùn)動軌跡也可以保證收斂到目標(biāo)點(diǎn),泛化能力將大大提高。以7bot機(jī)械臂為實(shí)驗(yàn)對象,進(jìn)行仿真實(shí)驗(yàn)和機(jī)器人實(shí)驗(yàn)研究,實(shí)驗(yàn)結(jié)果表明:基于DS的模仿學(xué)習(xí)方法再現(xiàn)生成的模仿軌跡具有全局漸近收斂的特點(diǎn),從不同起始位置開始的生成軌跡最終都可以到達(dá)目標(biāo)點(diǎn),學(xué)習(xí)得到的運(yùn)動模型在穩(wěn)定性和泛化能力兩方面表現(xiàn)較好。
在機(jī)器人模仿示教者示教運(yùn)動的過程中,示教者通過直接或者間接的方式指導(dǎo)機(jī)器人手臂完成一次或多次的運(yùn)動,機(jī)器人通過其內(nèi)部的關(guān)節(jié)傳感器或者位置傳感器,或者是外部傳感器,如:Kinect視覺傳感,來捕獲關(guān)于示教運(yùn)動的相關(guān)信息。其中示教運(yùn)動的軌跡信息可以表示為如下的集合形式
為了得到動態(tài)系統(tǒng)具體的表達(dá)形式,考慮使用基于統(tǒng)計(jì)方法的GMM來建立對于DS的概率描述/估計(jì)。高斯混合模型是一種有限混合模型,其通過有限的高斯函數(shù)的混合來建立對示教運(yùn)動數(shù)據(jù)的粗略的表示,同時消{除數(shù)}據(jù)的噪聲。給定一組次示教軌跡數(shù)據(jù),GMM由以下概率密度函數(shù)表示
式(10)、(11)得到的動態(tài)系統(tǒng)表示為一組線性動態(tài)系統(tǒng)的非線性加權(quán)的形式,也即得到了關(guān)于示教運(yùn)動的動態(tài)系統(tǒng)模型的具體表達(dá)形式。
由以上得到的動態(tài)系統(tǒng)模型,為了保證動態(tài)系統(tǒng)模型在示教的目標(biāo)點(diǎn)具有全局收斂的特性以及提高其泛化能力,也即將在不同的初始點(diǎn)開始最終到達(dá)同一目標(biāo)點(diǎn)的模仿學(xué)習(xí)任務(wù)轉(zhuǎn)化為具有全局收斂的學(xué)習(xí)任務(wù),則需要考慮其穩(wěn)定性問題。對于由定義的動態(tài)系統(tǒng),根據(jù)Lyapunov穩(wěn)定性理論:其在點(diǎn)處全局漸近穩(wěn)定的充分條件是存在一個連續(xù)可微的Lyapunov函數(shù)
為了得到式(10)中DS的穩(wěn)定條件,可以構(gòu)造如下的Lyapunov函數(shù):
由式(12)、(13)可以求得保證DS全局穩(wěn)定的充分條件
將式(14)作為DS的約束條件,則DS滿足全局收斂的特性。同時,考慮高斯混合模型的性質(zhì)和式(14)的條件,其共同組成了具有全局漸進(jìn)穩(wěn)定的動態(tài)系統(tǒng)的完整的約束條件。此后,需要求解動態(tài)系統(tǒng)模型的相應(yīng)參數(shù),得到對于動態(tài)系統(tǒng)完整的描述。
為了學(xué)習(xí)得到具有全局漸近穩(wěn)定的DS,需要對其參數(shù)進(jìn)行求解。由以上可知DS的未知參數(shù)為。本文通過將動態(tài)系統(tǒng)參數(shù)學(xué)習(xí)的過程轉(zhuǎn)化為求解一個非線性優(yōu)化問題,在保證模型全局漸近穩(wěn)定的約束條件下求解優(yōu)化問題來計(jì)算的最優(yōu)值。使用對數(shù)似然函數(shù)作為優(yōu)化的目標(biāo)函數(shù)
對于以上優(yōu)化問題,可以將其化為非線性規(guī)劃問題,借助于標(biāo)準(zhǔn)的優(yōu)化約束技術(shù)可以很好地解決,最終得到具有全局漸近穩(wěn)定的動態(tài)系統(tǒng)的最優(yōu)參數(shù),實(shí)現(xiàn)對于動態(tài)系統(tǒng)的完整描述。
在以上內(nèi)容的基礎(chǔ)上,設(shè)計(jì)了基于DS的機(jī)器人模仿學(xué)習(xí)系統(tǒng)。所設(shè)計(jì)的機(jī)器人模仿學(xué)習(xí)系統(tǒng)工作流程如圖1所示。在機(jī)器人模仿學(xué)習(xí)系統(tǒng)中,本文主要集中在對示教過程和學(xué)習(xí)過程的研究。
圖1 模仿學(xué)習(xí)系統(tǒng)工作流程Fig. 1 Workflow of imitation learning system
對應(yīng)于模仿學(xué)習(xí)的3個基本的步驟,模仿學(xué)習(xí)系統(tǒng)工作流程,首先,對于某個固定的模仿任務(wù)(如:繪畫或書寫、拿放物品、籃球投籃等任務(wù)),通過手把手地抓取機(jī)器人手臂末端執(zhí)行器進(jìn)行多次目標(biāo)點(diǎn)相對固定的軌跡示教,獲得示教軌跡數(shù)據(jù);然后,將獲得的示教軌跡數(shù)據(jù)預(yù)處理后送入學(xué)習(xí)算法學(xué)習(xí)關(guān)于動態(tài)系統(tǒng)模型的參數(shù),得到動態(tài)系統(tǒng)模型。最后,將動態(tài)系統(tǒng)模型作為機(jī)器人的控制策略,設(shè)置機(jī)器人手臂初始的運(yùn)動位置,結(jié)合機(jī)器人的控制系統(tǒng)完成對示教任務(wù)的模仿。
為了驗(yàn)證基于動態(tài)系統(tǒng)的機(jī)器人模仿學(xué)習(xí)方法的有效性,在已設(shè)計(jì)的模仿學(xué)習(xí)系統(tǒng)的框架下進(jìn)行仿真實(shí)驗(yàn)和機(jī)器人實(shí)驗(yàn)研究。
實(shí)驗(yàn)中的機(jī)器人平臺是7bot機(jī)械臂,如圖2所示。7bot機(jī)械臂是一款桌面應(yīng)用級的機(jī)械臂,也是一款6軸的全金屬智能機(jī)械臂。借助于Processing和Arduino Due實(shí)現(xiàn)開發(fā)和控制,使用USB線與計(jì)算機(jī)之間完成數(shù)據(jù)通信,能夠?qū)崿F(xiàn)在三維空間的多種運(yùn)動,使用方便靈活。
實(shí)際中,對于示教數(shù)據(jù)的獲取,是在機(jī)械臂的運(yùn)動空間內(nèi)通過抓取7bot機(jī)械臂末端進(jìn)行次運(yùn)動軌跡示教。由機(jī)器臂自身攜帶的關(guān)節(jié)角度傳感器記錄運(yùn)動軌跡信息。另外,也可以通過在仿真環(huán)境中拖動虛擬機(jī)械臂,進(jìn)行示教并獲取示教數(shù)據(jù)。
具體地,實(shí)際中的示教數(shù)據(jù)是由上位機(jī)程序處理示教軌跡信息,得到關(guān)于(機(jī)械臂末端執(zhí)行)器在笛卡爾坐標(biāo)系中的位置,即為示教數(shù)據(jù)。對應(yīng)于算法中的表述,經(jīng)過計(jì)算,對于示教數(shù)據(jù)有、。
圖2 7bot機(jī)械臂Fig. 2 7bot manipulator
而對于具體的運(yùn)動軌跡的示教,模仿學(xué)習(xí)示教過程如圖3所示。示教者通過抓取機(jī)械臂末端進(jìn)行運(yùn)動示教,此運(yùn)動可以是一個拿放物品的運(yùn)動。圖中的幾個關(guān)鍵子過程可以說明整個示教過程是如何完成的,黑色的圓點(diǎn)代表示教運(yùn)動的起始點(diǎn),黑色的星形點(diǎn)代表示教運(yùn)動的終點(diǎn)或目標(biāo)點(diǎn),實(shí)線代表已完成的示教運(yùn)動過程,虛線代表未完成的示教運(yùn)動過程。
圖3 模仿學(xué)習(xí)示教過程示意Fig. 3 Imitation learning demonstration process diagram
本文在MATLAB環(huán)境中進(jìn)行相關(guān)仿真實(shí)驗(yàn),為了簡化實(shí)驗(yàn)操作的復(fù)雜性,主要在MATLAB環(huán)境中進(jìn)行二維平面的模仿學(xué)習(xí)仿真實(shí)驗(yàn),具體步驟如下:
1)將實(shí)際采集的或在仿真環(huán)境中生成的多次示教運(yùn)動軌跡信息在MATLAB中進(jìn)行預(yù)處理并可視化,完成模仿學(xué)習(xí)的示教過程。
2)設(shè)置算法的相關(guān)初始值,將示教運(yùn)動數(shù)據(jù)由GMM模型編碼為一動態(tài)系統(tǒng)模型。
3)通過求解帶有全局漸近穩(wěn)定性約束條件的動態(tài)系統(tǒng)相關(guān)參數(shù)集合,學(xué)習(xí)得到動態(tài)系統(tǒng)模型,完成模仿學(xué)習(xí)的學(xué)習(xí)過程。
4)由學(xué)習(xí)得到的動態(tài)系統(tǒng)模型生成新的模仿運(yùn)動軌跡,并分析生成的運(yùn)動軌跡的相關(guān)結(jié)果。
5)最后將學(xué)習(xí)得到的動態(tài)系統(tǒng)模型作為控制策略,結(jié)合機(jī)器人控制系統(tǒng),完成對模仿學(xué)習(xí)過程中示教運(yùn)動的模仿。
本部分主要針對簡單示教運(yùn)動和較復(fù)雜示教運(yùn)動進(jìn)行實(shí)驗(yàn)仿真。通過將示教運(yùn)動軌跡與提出的方法生成的軌跡相比較來驗(yàn)證方法的有效性;并結(jié)合仿真環(huán)境中的兩連桿機(jī)械臂系統(tǒng),展示最終的學(xué)習(xí)效果。其中,規(guī)定簡單示教運(yùn)動是具有一定彎曲度的類直線運(yùn)動。而較復(fù)雜示教運(yùn)動相比于簡單示教運(yùn)動其示教運(yùn)動體現(xiàn)出更多的示教變化,如二次及以上的曲線形狀的運(yùn)動、自相交運(yùn)動或者它們的組合等。
模仿學(xué)習(xí)性能的量化指標(biāo)可采用機(jī)械臂末端位置與目標(biāo)點(diǎn)的距離、示教與再現(xiàn)運(yùn)動的路徑模仿任務(wù)的時間與示教時間的差,以此來衡量。
5.3.1 簡單示教運(yùn)動實(shí)驗(yàn)
圖4給出了單次簡單示教的仿真結(jié)果。示教運(yùn)動代表的任務(wù)類型可以是繪畫任務(wù)中的一筆或者是拿和放物品的運(yùn)動等。圖4中,(a)為在MATLAB環(huán)境中簡單示教運(yùn)動軌跡,起點(diǎn)是,目標(biāo)點(diǎn);(b)為使用文中的學(xué)習(xí)方法,模型生成的使機(jī)器人到達(dá)目標(biāo)點(diǎn)的平滑軌跡流圖,可見所有生成軌跡均收斂到目標(biāo)點(diǎn);(c)、(d)中藍(lán)色虛線為在MATLAB中模擬的一個兩連桿機(jī)械臂系統(tǒng),將學(xué)習(xí)得到的運(yùn)動模型作為控制策略,從不同起點(diǎn)執(zhí)行模仿的結(jié)果,起點(diǎn)分別為、。最終,機(jī)械臂末端與目標(biāo)點(diǎn)的距離分別為、。
在實(shí)際示教過程中,機(jī)器人可能需要多次示教。圖5分別為多次示教運(yùn)動軌跡和經(jīng)算法學(xué)習(xí)后生成的平滑的軌跡流圖,可見生成的軌跡均收斂到示教運(yùn)動的目標(biāo)點(diǎn)。
圖4 單次簡單示教運(yùn)動與仿真結(jié)果Fig. 4 Single simple demonstration motion and simulation results
圖5 多次簡單示教運(yùn)動與仿真結(jié)果Fig. 5 Multiple simple demonstration motion and simulation results
由以上可知,學(xué)習(xí)得到的運(yùn)動模型一方面具有很強(qiáng)的穩(wěn)定性,軌跡均收斂到同一個目標(biāo)點(diǎn)。另一方面,由未示教區(qū)域開始的再現(xiàn)運(yùn)動也可以在具有一定模仿相似性的前提下到達(dá)目標(biāo)點(diǎn)附近,誤差較小,體現(xiàn)出模型具有較好的泛化能力。
5.3.2 較復(fù)雜示教運(yùn)動實(shí)驗(yàn)
對于較復(fù)雜的示教運(yùn)動,相應(yīng)的仿真結(jié)果如圖6、7所示。其中圖6是對機(jī)器人進(jìn)行單次示教后的實(shí)驗(yàn)結(jié)果。單次示教的起點(diǎn)為,目標(biāo)點(diǎn)為。通過算法學(xué)習(xí)后,模型生成的軌跡均收斂到目標(biāo)點(diǎn)。類似地,分別從不同的起點(diǎn)和開始再現(xiàn)模仿,實(shí)驗(yàn)結(jié)果如圖6(c)、(d)所示。機(jī)械臂末端與目標(biāo)點(diǎn)的距離分別為、,誤差較小。
同樣地,在實(shí)際的機(jī)器人示教過程中,需要多次示教時,實(shí)驗(yàn)結(jié)果如圖7所示。其中,經(jīng)過算法學(xué)習(xí)后,學(xué)習(xí)得到的運(yùn)動模型生成的軌跡收斂到同一個目標(biāo)點(diǎn)。
圖6 單次較復(fù)雜示教運(yùn)動與仿真結(jié)果Fig. 6 Single more complex demonstration motion and simulation results
圖7 多次較復(fù)雜示教運(yùn)動與仿真結(jié)果Fig. 7 Multiple more complex demonstration motion and simulation results
由此可知,學(xué)習(xí)得到的運(yùn)動模型對于此類較復(fù)雜的示教運(yùn)動也有不錯的學(xué)習(xí)效果,模型的穩(wěn)定性較好,未示教空間的泛化能力也較好。
此部分結(jié)合實(shí)際的7bot機(jī)器人系統(tǒng)來驗(yàn)證學(xué)習(xí)方法的有效性。
圖8、9分別展示了二維平面中單次示教時,機(jī)器人真實(shí)示教運(yùn)動軌跡和經(jīng)算法學(xué)習(xí)后的學(xué)習(xí)效果。紅色虛線為示教軌跡,藍(lán)色實(shí)線為生成軌跡。由圖可知,所有生成軌跡最終都收斂到目標(biāo)點(diǎn),體現(xiàn)了運(yùn)動模型具有全局漸進(jìn)穩(wěn)定性的特點(diǎn);但對于有交叉點(diǎn)的自相交運(yùn)動,其在交叉點(diǎn)的學(xué)習(xí)效果并不明顯,忽略了部分的學(xué)習(xí),學(xué)習(xí)效果有待提高。
圖8 二維真實(shí)示教運(yùn)動與學(xué)習(xí)效果Fig. 8 Two-dimensional real demonstration motion and learning results
圖9 自相交運(yùn)動與學(xué)習(xí)效果Fig. 9 Self-intersection motion and learning results
圖10 、11展示了通過7bot機(jī)械臂系統(tǒng)對示教運(yùn)動進(jìn)行模仿的結(jié)果。將學(xué)習(xí)得到的運(yùn)動模型作為控制策略,設(shè)定機(jī)器人的初始位置,由機(jī)器人系統(tǒng)進(jìn)行模仿實(shí)現(xiàn)。實(shí)驗(yàn)結(jié)果顯示其成功實(shí)現(xiàn)了對運(yùn)動的模仿,到達(dá)目標(biāo)點(diǎn)附近。
圖10 機(jī)械臂模仿的結(jié)果Fig. 10 Results of the imitation of a manipulator
圖11 機(jī)械臂對于自相交運(yùn)動的模仿結(jié)果Fig. 11 Results of the imitation of a manipulator for selfintersection motion
同樣,圖12中分別為在三維空間中的示教及學(xué)習(xí)效果??梢钥闯鰪钠鹗键c(diǎn)開始的三條生成軌跡均收斂到目標(biāo)點(diǎn),表明運(yùn)動模型的穩(wěn)定性很好。圖13是7bot機(jī)械臂對示教運(yùn)動進(jìn)行模仿的結(jié)果,可見其也很好地完成了對示教運(yùn)動的模仿,到達(dá)目標(biāo)點(diǎn)附近。
表1給出了機(jī)器人實(shí)驗(yàn)中機(jī)器人模仿性能的量化結(jié)果。可以看出運(yùn)動模仿結(jié)束后,機(jī)械臂末端距離目標(biāo)點(diǎn)較近,誤差較小;示教時間和模仿時間相差不大;但是在自相交運(yùn)動上軌跡長度之差比較大。
圖12 三維真實(shí)示教運(yùn)動與學(xué)習(xí)效果Fig. 12 Three-dimensional real demonstration motion and learning results
圖13 機(jī)械臂對于三維運(yùn)動的模擬結(jié)果Fig. 13 Results of the imitation of a manipulator for threedimensional motion
表1 機(jī)器人模仿性能的量化結(jié)果Table 1 Quantitative results of robot imitative performance
綜上實(shí)驗(yàn)結(jié)果,基于DS的模仿學(xué)習(xí)方法在簡單示教運(yùn)動、較復(fù)雜示教運(yùn)動以及真實(shí)示教運(yùn)動的學(xué)習(xí)上,通過附加穩(wěn)定性約束條件的方法,再現(xiàn)的生成軌跡均收斂到目標(biāo)點(diǎn),一方面使運(yùn)動模型的穩(wěn)定性更強(qiáng);另一方面,使運(yùn)動模型具有較好的泛化能力。
本文針對當(dāng)前機(jī)器人模仿學(xué)習(xí)過程中,運(yùn)動模仿穩(wěn)定性差,泛化能力不足,引入了一種基于動態(tài)系統(tǒng)的模仿學(xué)習(xí)方法來解決以上問題。首先,通過使用高斯混合模型將示教運(yùn)動建模為一動態(tài)系統(tǒng);然后,考慮穩(wěn)定性問題,基于Lyapunov穩(wěn)定性理論,給出動態(tài)系統(tǒng)全局漸近穩(wěn)定的充分條件;最后,建立一個包含多約束的非線性優(yōu)化問題,迭代求解以得到最優(yōu)參數(shù),進(jìn)而得到動態(tài)系統(tǒng)模型,并作為機(jī)器人的控制策略實(shí)現(xiàn)對示教運(yùn)動的模仿。從實(shí)驗(yàn)中可以得到以下結(jié)論:
1)文中提出的模仿學(xué)習(xí)方法在簡單示教運(yùn)動和較復(fù)雜的示教運(yùn)動的仿真實(shí)驗(yàn)中,學(xué)習(xí)得到的運(yùn)動模型從示教起始點(diǎn)生成的軌跡均能夠到目標(biāo)點(diǎn),軌跡平滑,穩(wěn)定性好。
2)將示教運(yùn)動建模為動態(tài)系統(tǒng),通過附加穩(wěn)定性約束條件,保證了學(xué)習(xí)得到的運(yùn)動模型生成的軌跡都收斂到目標(biāo)點(diǎn)。
3)文中的方法可以實(shí)現(xiàn)從單一到多次示教運(yùn)動的學(xué)習(xí),對于未被示教的狀態(tài)空間其模型也可以生成平滑的軌跡收斂到目標(biāo)點(diǎn),具有較強(qiáng)的泛化能力。
4)存在的問題是對于復(fù)雜的自相交的示教運(yùn)動,模型忽略了運(yùn)動的關(guān)鍵信息,運(yùn)動再現(xiàn)相似度將會稍差。同時,在其他機(jī)器人系統(tǒng)上的應(yīng)用還有待進(jìn)一步驗(yàn)證。對于非精密要求場合、目的為導(dǎo)向的機(jī)器人工作場合,此方法的通用性和穩(wěn)定性具有較大優(yōu)勢。
在未來,可以結(jié)合具有高精度控制的機(jī)器人來實(shí)現(xiàn)實(shí)時調(diào)整再現(xiàn)軌跡提高模仿的相似性;同時,可以通過提高系統(tǒng)的階次來學(xué)習(xí)復(fù)雜的自相交運(yùn)動;另外,結(jié)合快速控制技術(shù)可以將其擴(kuò)展到快速捕獲運(yùn)動目標(biāo)的領(lǐng)域。