霍雨佳,李一平,封錫盛
(1.中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室,遼寧沈陽(yáng) 110016;2.中國(guó)科學(xué)院機(jī)器人與智能制造創(chuàng)新研究院,遼寧沈陽(yáng) 110169;3.遼寧省水下機(jī)器人重點(diǎn)實(shí)驗(yàn)室,遼寧沈陽(yáng) 110169;4.中國(guó)科學(xué)院大學(xué),北京 100049)
傾轉(zhuǎn)旋翼水空跨域機(jī)器人(以下簡(jiǎn)稱(chēng)跨域機(jī)器人),充分結(jié)合了水下機(jī)器人(AUV)的隱蔽性和無(wú)人機(jī)(UAV)的機(jī)動(dòng)性,具備水空兩棲多種介質(zhì)下的作業(yè)能力,擴(kuò)展了原有機(jī)器人的作業(yè)環(huán)境和應(yīng)用范圍。跨域機(jī)器人應(yīng)分別具備在水中、空氣中兩種介質(zhì)中穩(wěn)定工作,同時(shí)具備水空兩種介質(zhì)間多次反復(fù)跨介質(zhì)轉(zhuǎn)換的能力。由于兩種工作介質(zhì)在密度等方面的顯著區(qū)別,跨域機(jī)器人在多種介質(zhì)中穩(wěn)定的作業(yè)需求對(duì)機(jī)器人的運(yùn)動(dòng)控制器提出了艱巨的挑戰(zhàn)。因此,針對(duì)跨域機(jī)器人,建立可靠的動(dòng)力學(xué)模型是設(shè)計(jì)機(jī)器人運(yùn)動(dòng)控制器的關(guān)鍵。
模型辨識(shí)方法在水下機(jī)器人和無(wú)人機(jī)上都有廣泛應(yīng)用,辨識(shí)數(shù)據(jù)來(lái)源于機(jī)器人傳感器的數(shù)據(jù)采集,將所獲的動(dòng)力學(xué)模型用于機(jī)器人運(yùn)動(dòng)控制仿真平臺(tái)搭建和控制策略設(shè)計(jì)。最小二乘法、極大似然等參數(shù)化建模方法,需要一定的先驗(yàn)知識(shí),如機(jī)器人的動(dòng)力學(xué)模型結(jié)構(gòu),可由流體力學(xué)、慣性和結(jié)構(gòu)布局等分析得到。所獲得的高精度模型常限制在一個(gè)小范圍內(nèi),通常通過(guò)增加建模的復(fù)雜性提高模型的范圍。利用神經(jīng)網(wǎng)絡(luò)、示教學(xué)習(xí)等非參數(shù)化建模也可獲得一定的效果,但所構(gòu)建的模型被限制在受過(guò)訓(xùn)練的集合內(nèi),難以應(yīng)對(duì)模型的不確定性。
高斯過(guò)程回歸(Gaussian Processes Regression,GPR)是基于貝葉斯理論和統(tǒng)計(jì)學(xué)習(xí)理論的一種機(jī)器學(xué)習(xí)方法,適于處理小樣本、非線性等復(fù)雜問(wèn)題,被廣泛應(yīng)用于機(jī)器人等領(lǐng)域。該方法提供了一種簡(jiǎn)單有效的方式表示數(shù)據(jù)的先驗(yàn)分布,可使用較少的參數(shù)得到準(zhǔn)確的模型。GPR屬于非參數(shù)模型,只需假設(shè)它服從指定均值函數(shù)和協(xié)方差函數(shù)的高斯過(guò)程。相較于其他常用的參數(shù)模型,如神經(jīng)網(wǎng)絡(luò)、支持向量回歸、多項(xiàng)式回歸等,GPR具有易訓(xùn)練、超參數(shù)自適應(yīng)獲取以及預(yù)測(cè)結(jié)果具有概率意義等特點(diǎn)。KO等利用高斯過(guò)程(Gaussian Processes,GP)模型和強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)對(duì)飛艇的模型辨識(shí)和運(yùn)動(dòng)控制。FU等利用高斯過(guò)程實(shí)現(xiàn)對(duì)船舶模型的辨識(shí)。HEMAKUMARA和SUKKARIEH利用GP模型對(duì)固定翼UAV的模型進(jìn)行辨識(shí),獲得了固定翼機(jī)翼模型。CAO等利用GP模型和MPC控制器實(shí)現(xiàn)四旋翼無(wú)人機(jī)的運(yùn)動(dòng)控制仿真。
本文作者利用高斯過(guò)程對(duì)跨域機(jī)器人的動(dòng)力學(xué)模型進(jìn)行辨識(shí)。通過(guò)采集遙控飛行過(guò)程中機(jī)器人的狀態(tài)數(shù)據(jù),獲得機(jī)器人的動(dòng)力學(xué)模型。這種非參數(shù)化建模方法可利用機(jī)器人運(yùn)行過(guò)程中的反饋數(shù)據(jù)較大范圍地獲取機(jī)器人的動(dòng)態(tài)特性,而不需要對(duì)機(jī)器人的模型結(jié)構(gòu)具備先驗(yàn)知識(shí),可以在控制器設(shè)計(jì)環(huán)節(jié)節(jié)省大量試驗(yàn)成本。
為實(shí)現(xiàn)對(duì)跨域機(jī)器人的動(dòng)力學(xué)模型進(jìn)行辨識(shí),應(yīng)對(duì)機(jī)器人進(jìn)行模型分析。本文作者采用一種新型跨域機(jī)器人,具有4臺(tái)水空兩棲涵道推進(jìn)器,如圖1所示。如圖1(b)所示,4臺(tái)推進(jìn)器可以旋轉(zhuǎn)的最大角度為π/2,可實(shí)現(xiàn)推進(jìn)器推力由向下到向后的切換。
該跨域機(jī)器人具備水下航行、水面滑行起飛、水面(陸地)垂直起飛懸停和空中平飛等工作模式。其中,在垂直起飛懸停模式下,推進(jìn)器推力向下,機(jī)器人以旋翼飛行器模式工作;在空中平飛狀態(tài)下,機(jī)器人以固定翼飛機(jī)模式工作,通過(guò)升力體機(jī)翼提供機(jī)器人升力,通過(guò)控制涵道推進(jìn)器傾轉(zhuǎn)角度和螺旋槳轉(zhuǎn)速控制機(jī)器人的俯仰。
機(jī)器人載體坐標(biāo)系選擇重心為原點(diǎn),遵循右手系,指向前方并與機(jī)器人縱向?qū)ΨQ(chēng)軸重合;位于機(jī)器人水線面,與垂直并指向右舷;位于機(jī)器人縱中剖面,與垂直并指向下,如圖1(a)所示。
圖1 傾轉(zhuǎn)四旋翼跨域機(jī)器人
本文作者主要考慮機(jī)器人以?xún)A轉(zhuǎn)旋翼模式在空中飛行時(shí)的運(yùn)動(dòng)控制問(wèn)題。機(jī)器人在飛行中受力主要分為涵道推進(jìn)器推力、機(jī)翼升力與阻力、重力和機(jī)身阻力。上述力會(huì)同時(shí)對(duì)機(jī)器人產(chǎn)生相應(yīng)的力矩,同時(shí)涵道推進(jìn)器槳葉的旋轉(zhuǎn)也會(huì)產(chǎn)生相應(yīng)的力矩。
由文獻(xiàn)[16-17]可知,令=[,,]表示載體坐標(biāo)系下機(jī)器人在橫滾、俯仰和偏航方向的角速度,=[,,]表示機(jī)器人姿態(tài)角,=[,,]表示載體坐標(biāo)下機(jī)器人各方向線速度,=[,,]表示世界坐標(biāo)系下機(jī)器人位置,則跨域機(jī)器人的動(dòng)力學(xué)模型可描述為
(1)
其中:=[,,}為載體坐標(biāo)系下機(jī)器人各方向分力;=[,,]為載體坐標(biāo)系下機(jī)器人繞各軸力矩;為載體坐標(biāo)系到世界坐標(biāo)系的旋轉(zhuǎn)矩陣;為載體角速度到姿態(tài)角速率的旋轉(zhuǎn)矩陣。則世界坐標(biāo)系下,機(jī)器人的受力可描述為
(2)
跨域機(jī)器人的4個(gè)涵道風(fēng)扇推進(jìn)器產(chǎn)生的合外力為
(3)
其中:T,、T,和T,分別表示合力在載體坐標(biāo)系下、和軸上的分量,有:
同時(shí),推進(jìn)器推力產(chǎn)生的力矩為
T,=T,
(4)
式中:表示第個(gè)推旋翼進(jìn)器中心距離重心的距離,表達(dá)式為
(5)
其中:,為第個(gè)傾轉(zhuǎn)旋翼推進(jìn)器軸中心到機(jī)體坐標(biāo)系下平面的距離;,為傾轉(zhuǎn)旋翼推進(jìn)器軸中心到機(jī)體坐標(biāo)系平面的距離;為推進(jìn)器旋翼中心到傾轉(zhuǎn)軸的距離。
(6)
(7)
其中:(,)為通過(guò)所有數(shù)據(jù)集輸入計(jì)算得到的協(xié)方差矩陣;為單位矩陣。輸出數(shù)據(jù)集和對(duì)問(wèn)詢(xún)點(diǎn)的預(yù)測(cè)輸出()的聯(lián)合分布為
(8)
其中:()的條件分布服從一個(gè)新的正態(tài)分布:
(|,)~[(),()]
(9)
則()的均值和方差的表達(dá)式為
(10)
()=(,)-(,)((,)+
(11)
因此,計(jì)算預(yù)測(cè)點(diǎn)的預(yù)測(cè)值可得:
=(,)
(12)
同時(shí),采用平方指數(shù)協(xié)方差函數(shù)作為GPR的內(nèi)核函數(shù)(,):
(13)
(14)
(15)
則GPR模型的優(yōu)化目標(biāo)為
=argmin()
(16)
對(duì)超參數(shù)進(jìn)行迭代更新以最小化()。最后將優(yōu)化后的超參數(shù)代入式(10)和式(11)得到測(cè)試樣本最終的預(yù)測(cè)值和方差()。
由于高斯過(guò)程回歸在輸入訓(xùn)練集較大時(shí)計(jì)算緩慢,為降低其模型回歸過(guò)程中的計(jì)算復(fù)雜度,提出采用局部高斯過(guò)程回歸方法。該方法通過(guò)引入多個(gè)局部模型,將訓(xùn)練集分配到多個(gè)局部模型中進(jìn)行單獨(dú)訓(xùn)練,由此減少每個(gè)局部模型的數(shù)據(jù)量和總體的計(jì)算復(fù)雜度。因此,該方法可以保證模型的快速更新。
通過(guò)計(jì)算新的訓(xùn)練數(shù)據(jù)與模型中心的距離,對(duì)數(shù)據(jù)進(jìn)行分配,該距離可描述為
(17)
同時(shí),設(shè)置閾值,判斷它是否屬于已有的局部模型。當(dāng)數(shù)據(jù)不屬于已有的任一局部模型時(shí),則以此數(shù)據(jù)建立新的局部模型。局部高斯過(guò)程回歸流程如圖 2所示。
圖2 局部高斯過(guò)程回歸流程
(18)
基于新型水空跨域機(jī)器人,考慮當(dāng)前機(jī)器人以?xún)A轉(zhuǎn)旋翼無(wú)人機(jī)模式進(jìn)行飛行(空中懸停)的情況,通過(guò)遙控器控制機(jī)器人的飛行。機(jī)器人的輸入為其8個(gè)執(zhí)行機(jī)構(gòu)的動(dòng)作量,包括4臺(tái)涵道螺旋槳的轉(zhuǎn)速(=1,2,3,4)和4臺(tái)傾轉(zhuǎn)舵機(jī)的傾轉(zhuǎn)角度(=1,2,3,4)。機(jī)器人的傳感器如IMU和GPS獲得機(jī)器人的運(yùn)動(dòng)狀態(tài)包括位置信息、姿態(tài)信息、速度和角速度信息等。
如圖 3所示,機(jī)器人控制模塊主要由PX-4控制板構(gòu)成,PX-4主要承擔(dān)通信、數(shù)據(jù)記錄功能,與無(wú)線遙控器實(shí)現(xiàn)通信并下發(fā)指令。同時(shí),利用它自帶的簡(jiǎn)單的傾轉(zhuǎn)旋翼機(jī)器人控制算法,實(shí)現(xiàn)簡(jiǎn)單的機(jī)器人飛行控制試驗(yàn),以獲取機(jī)器人的運(yùn)動(dòng)狀態(tài)數(shù)據(jù)。機(jī)器人通過(guò)外接的60 V直流電源通電。
圖3 試驗(yàn)平臺(tái)構(gòu)成
對(duì)于時(shí)刻,基于高斯過(guò)程的機(jī)器人動(dòng)力學(xué)模型辨識(shí)有:
(19)
(20)
機(jī)器人的輸入包括執(zhí)行機(jī)構(gòu)控制量和機(jī)器人的速度和姿態(tài)等信息。同樣的,在相同的執(zhí)行機(jī)構(gòu)中控制輸入,利用第2.2節(jié)方法,獲得機(jī)器人的動(dòng)力學(xué)模型。并對(duì)比相同控制輸入下的模型預(yù)測(cè)值和實(shí)際測(cè)量值。
圖4 模型預(yù)測(cè)與實(shí)際測(cè)量值對(duì)比
定義平均絕對(duì)值誤差(Mean Absolute Error,MAE)評(píng)價(jià)模型預(yù)測(cè)精度,如式(21)所示。同時(shí),對(duì)比全局GPR和LGPR的更新時(shí)間和預(yù)測(cè)時(shí)間,評(píng)價(jià)兩種方法在計(jì)算復(fù)雜度上的區(qū)別,結(jié)果如表1所示。
表1 全局GPR和LGPR性能評(píng)價(jià)
(21)
本文作者提出了一種基于高斯過(guò)程的辨識(shí)方法,采用該方法實(shí)現(xiàn)對(duì)新型跨域機(jī)器人在空中以?xún)A轉(zhuǎn)旋翼無(wú)人機(jī)模式下飛行的動(dòng)力學(xué)模型辨識(shí)。通過(guò)試驗(yàn),對(duì)比了測(cè)量值和模型預(yù)測(cè)值,證明了該方法的有效性。該模型為跨域機(jī)器人仿真平臺(tái)及其運(yùn)動(dòng)控制器設(shè)計(jì)提供了參考,同時(shí)后續(xù)應(yīng)完善機(jī)器人的功能(如空中平飛和水下航行等),實(shí)現(xiàn)對(duì)機(jī)器人更多模式下的動(dòng)力學(xué)模型辨識(shí)。