基于高斯過(guò)程的傾轉(zhuǎn)旋翼機(jī)器人模型辨識(shí)

2022-09-15 09:14:16霍雨佳李一平封錫盛

機(jī)床與液壓 2022年11期

霍雨佳，李一平，封錫盛

(1.中國(guó)科學(xué)院沈陽(yáng)自動(dòng)化研究所機(jī)器人學(xué)國(guó)家重點(diǎn)實(shí)驗(yàn)室，遼寧沈陽(yáng) 110016;2.中國(guó)科學(xué)院機(jī)器人與智能制造創(chuàng)新研究院，遼寧沈陽(yáng) 110169;3.遼寧省水下機(jī)器人重點(diǎn)實(shí)驗(yàn)室，遼寧沈陽(yáng) 110169;4.中國(guó)科學(xué)院大學(xué)，北京 100049)

0 前言

傾轉(zhuǎn)旋翼水空跨域機(jī)器人(以下簡(jiǎn)稱(chēng)跨域機(jī)器人)，充分結(jié)合了水下機(jī)器人(AUV)的隱蔽性和無(wú)人機(jī)(UAV)的機(jī)動(dòng)性，具備水空兩棲多種介質(zhì)下的作業(yè)能力，擴(kuò)展了原有機(jī)器人的作業(yè)環(huán)境和應(yīng)用范圍。跨域機(jī)器人應(yīng)分別具備在水中、空氣中兩種介質(zhì)中穩(wěn)定工作，同時(shí)具備水空兩種介質(zhì)間多次反復(fù)跨介質(zhì)轉(zhuǎn)換的能力。由于兩種工作介質(zhì)在密度等方面的顯著區(qū)別，跨域機(jī)器人在多種介質(zhì)中穩(wěn)定的作業(yè)需求對(duì)機(jī)器人的運(yùn)動(dòng)控制器提出了艱巨的挑戰(zhàn)。因此，針對(duì)跨域機(jī)器人，建立可靠的動(dòng)力學(xué)模型是設(shè)計(jì)機(jī)器人運(yùn)動(dòng)控制器的關(guān)鍵。

模型辨識(shí)方法在水下機(jī)器人和無(wú)人機(jī)上都有廣泛應(yīng)用，辨識(shí)數(shù)據(jù)來(lái)源于機(jī)器人傳感器的數(shù)據(jù)采集，將所獲的動(dòng)力學(xué)模型用于機(jī)器人運(yùn)動(dòng)控制仿真平臺(tái)搭建和控制策略設(shè)計(jì)。最小二乘法、極大似然等參數(shù)化建模方法，需要一定的先驗(yàn)知識(shí)，如機(jī)器人的動(dòng)力學(xué)模型結(jié)構(gòu)，可由流體力學(xué)、慣性和結(jié)構(gòu)布局等分析得到。所獲得的高精度模型常限制在一個(gè)小范圍內(nèi)，通常通過(guò)增加建模的復(fù)雜性提高模型的范圍。利用神經(jīng)網(wǎng)絡(luò)、示教學(xué)習(xí)等非參數(shù)化建模也可獲得一定的效果，但所構(gòu)建的模型被限制在受過(guò)訓(xùn)練的集合內(nèi)，難以應(yīng)對(duì)模型的不確定性。

高斯過(guò)程回歸(Gaussian Processes Regression,GPR)是基于貝葉斯理論和統(tǒng)計(jì)學(xué)習(xí)理論的一種機(jī)器學(xué)習(xí)方法，適于處理小樣本、非線性等復(fù)雜問(wèn)題，被廣泛應(yīng)用于機(jī)器人等領(lǐng)域。該方法提供了一種簡(jiǎn)單有效的方式表示數(shù)據(jù)的先驗(yàn)分布，可使用較少的參數(shù)得到準(zhǔn)確的模型。GPR屬于非參數(shù)模型，只需假設(shè)它服從指定均值函數(shù)和協(xié)方差函數(shù)的高斯過(guò)程。相較于其他常用的參數(shù)模型，如神經(jīng)網(wǎng)絡(luò)、支持向量回歸、多項(xiàng)式回歸等，GPR具有易訓(xùn)練、超參數(shù)自適應(yīng)獲取以及預(yù)測(cè)結(jié)果具有概率意義等特點(diǎn)。KO等利用高斯過(guò)程(Gaussian Processes,GP)模型和強(qiáng)化學(xué)習(xí)實(shí)現(xiàn)對(duì)飛艇的模型辨識(shí)和運(yùn)動(dòng)控制。FU等利用高斯過(guò)程實(shí)現(xiàn)對(duì)船舶模型的辨識(shí)。HEMAKUMARA和SUKKARIEH利用GP模型對(duì)固定翼UAV的模型進(jìn)行辨識(shí)，獲得了固定翼機(jī)翼模型。CAO等利用GP模型和MPC控制器實(shí)現(xiàn)四旋翼無(wú)人機(jī)的運(yùn)動(dòng)控制仿真。

本文作者利用高斯過(guò)程對(duì)跨域機(jī)器人的動(dòng)力學(xué)模型進(jìn)行辨識(shí)。通過(guò)采集遙控飛行過(guò)程中機(jī)器人的狀態(tài)數(shù)據(jù)，獲得機(jī)器人的動(dòng)力學(xué)模型。這種非參數(shù)化建模方法可利用機(jī)器人運(yùn)行過(guò)程中的反饋數(shù)據(jù)較大范圍地獲取機(jī)器人的動(dòng)態(tài)特性，而不需要對(duì)機(jī)器人的模型結(jié)構(gòu)具備先驗(yàn)知識(shí)，可以在控制器設(shè)計(jì)環(huán)節(jié)節(jié)省大量試驗(yàn)成本。

1 跨域機(jī)器人動(dòng)力學(xué)模型分析

為實(shí)現(xiàn)對(duì)跨域機(jī)器人的動(dòng)力學(xué)模型進(jìn)行辨識(shí)，應(yīng)對(duì)機(jī)器人進(jìn)行模型分析。本文作者采用一種新型跨域機(jī)器人，具有4臺(tái)水空兩棲涵道推進(jìn)器，如圖1所示。如圖1(b)所示，4臺(tái)推進(jìn)器可以旋轉(zhuǎn)的最大角度為π/2，可實(shí)現(xiàn)推進(jìn)器推力由向下到向后的切換。

該跨域機(jī)器人具備水下航行、水面滑行起飛、水面(陸地)垂直起飛懸停和空中平飛等工作模式。其中，在垂直起飛懸停模式下，推進(jìn)器推力向下，機(jī)器人以旋翼飛行器模式工作；在空中平飛狀態(tài)下，機(jī)器人以固定翼飛機(jī)模式工作，通過(guò)升力體機(jī)翼提供機(jī)器人升力，通過(guò)控制涵道推進(jìn)器傾轉(zhuǎn)角度和螺旋槳轉(zhuǎn)速控制機(jī)器人的俯仰。

機(jī)器人載體坐標(biāo)系選擇重心為原點(diǎn)，遵循右手系，指向前方并與機(jī)器人縱向?qū)ΨQ(chēng)軸重合;位于機(jī)器人水線面,與垂直并指向右舷;位于機(jī)器人縱中剖面,與垂直并指向下，如圖1(a)所示。

圖1 傾轉(zhuǎn)四旋翼跨域機(jī)器人

本文作者主要考慮機(jī)器人以?xún)A轉(zhuǎn)旋翼模式在空中飛行時(shí)的運(yùn)動(dòng)控制問(wèn)題。機(jī)器人在飛行中受力主要分為涵道推進(jìn)器推力、機(jī)翼升力與阻力、重力和機(jī)身阻力。上述力會(huì)同時(shí)對(duì)機(jī)器人產(chǎn)生相應(yīng)的力矩，同時(shí)涵道推進(jìn)器槳葉的旋轉(zhuǎn)也會(huì)產(chǎn)生相應(yīng)的力矩。

由文獻(xiàn)[16-17]可知，令=[,,]表示載體坐標(biāo)系下機(jī)器人在橫滾、俯仰和偏航方向的角速度，=[,,]表示機(jī)器人姿態(tài)角，=[,,]表示載體坐標(biāo)下機(jī)器人各方向線速度，=[,,]表示世界坐標(biāo)系下機(jī)器人位置,則跨域機(jī)器人的動(dòng)力學(xué)模型可描述為

(1)

其中:=[,,}為載體坐標(biāo)系下機(jī)器人各方向分力；=[,,]為載體坐標(biāo)系下機(jī)器人繞各軸力矩;為載體坐標(biāo)系到世界坐標(biāo)系的旋轉(zhuǎn)矩陣；為載體角速度到姿態(tài)角速率的旋轉(zhuǎn)矩陣。則世界坐標(biāo)系下，機(jī)器人的受力可描述為

(2)

跨域機(jī)器人的4個(gè)涵道風(fēng)扇推進(jìn)器產(chǎn)生的合外力為

(3)

其中：T,、T,和T,分別表示合力在載體坐標(biāo)系下、和軸上的分量，有：

同時(shí)，推進(jìn)器推力產(chǎn)生的力矩為

T,=T,

(4)

式中：表示第個(gè)推旋翼進(jìn)器中心距離重心的距離，表達(dá)式為

(5)

其中：,為第個(gè)傾轉(zhuǎn)旋翼推進(jìn)器軸中心到機(jī)體坐標(biāo)系下平面的距離；,為傾轉(zhuǎn)旋翼推進(jìn)器軸中心到機(jī)體坐標(biāo)系平面的距離；為推進(jìn)器旋翼中心到傾轉(zhuǎn)軸的距離。

2 基于高斯過(guò)程回歸的跨域機(jī)器人動(dòng)力學(xué)預(yù)測(cè)模型

2.1 高斯過(guò)程回歸模型

(6)

(7)

其中:(,)為通過(guò)所有數(shù)據(jù)集輸入計(jì)算得到的協(xié)方差矩陣;為單位矩陣。輸出數(shù)據(jù)集和對(duì)問(wèn)詢(xún)點(diǎn)的預(yù)測(cè)輸出()的聯(lián)合分布為

(8)

其中:()的條件分布服從一個(gè)新的正態(tài)分布：

(|,)～[(),()]

(9)

則()的均值和方差的表達(dá)式為

(10)

()=(,)-(,)((,)+

(11)

因此，計(jì)算預(yù)測(cè)點(diǎn)的預(yù)測(cè)值可得：

=(,)

(12)

同時(shí)，采用平方指數(shù)協(xié)方差函數(shù)作為GPR的內(nèi)核函數(shù)(,)：

(13)

(14)

(15)

則GPR模型的優(yōu)化目標(biāo)為

=argmin()

(16)

對(duì)超參數(shù)進(jìn)行迭代更新以最小化()。最后將優(yōu)化后的超參數(shù)代入式(10)和式(11)得到測(cè)試樣本最終的預(yù)測(cè)值和方差()。

2.2 基于權(quán)值的局部高斯過(guò)程回歸模型

由于高斯過(guò)程回歸在輸入訓(xùn)練集較大時(shí)計(jì)算緩慢，為降低其模型回歸過(guò)程中的計(jì)算復(fù)雜度，提出采用局部高斯過(guò)程回歸方法。該方法通過(guò)引入多個(gè)局部模型，將訓(xùn)練集分配到多個(gè)局部模型中進(jìn)行單獨(dú)訓(xùn)練，由此減少每個(gè)局部模型的數(shù)據(jù)量和總體的計(jì)算復(fù)雜度。因此，該方法可以保證模型的快速更新。

通過(guò)計(jì)算新的訓(xùn)練數(shù)據(jù)與模型中心的距離，對(duì)數(shù)據(jù)進(jìn)行分配，該距離可描述為

(17)

同時(shí)，設(shè)置閾值，判斷它是否屬于已有的局部模型。當(dāng)數(shù)據(jù)不屬于已有的任一局部模型時(shí)，則以此數(shù)據(jù)建立新的局部模型。局部高斯過(guò)程回歸流程如圖 2所示。

圖2 局部高斯過(guò)程回歸流程

(18)

3 驗(yàn)證

3.1 試驗(yàn)設(shè)計(jì)

基于新型水空跨域機(jī)器人，考慮當(dāng)前機(jī)器人以?xún)A轉(zhuǎn)旋翼無(wú)人機(jī)模式進(jìn)行飛行(空中懸停)的情況，通過(guò)遙控器控制機(jī)器人的飛行。機(jī)器人的輸入為其8個(gè)執(zhí)行機(jī)構(gòu)的動(dòng)作量，包括4臺(tái)涵道螺旋槳的轉(zhuǎn)速(=1,2,3,4)和4臺(tái)傾轉(zhuǎn)舵機(jī)的傾轉(zhuǎn)角度(=1,2,3,4)。機(jī)器人的傳感器如IMU和GPS獲得機(jī)器人的運(yùn)動(dòng)狀態(tài)包括位置信息、姿態(tài)信息、速度和角速度信息等。

如圖 3所示，機(jī)器人控制模塊主要由PX-4控制板構(gòu)成，PX-4主要承擔(dān)通信、數(shù)據(jù)記錄功能，與無(wú)線遙控器實(shí)現(xiàn)通信并下發(fā)指令。同時(shí)，利用它自帶的簡(jiǎn)單的傾轉(zhuǎn)旋翼機(jī)器人控制算法，實(shí)現(xiàn)簡(jiǎn)單的機(jī)器人飛行控制試驗(yàn)，以獲取機(jī)器人的運(yùn)動(dòng)狀態(tài)數(shù)據(jù)。機(jī)器人通過(guò)外接的60 V直流電源通電。

圖3 試驗(yàn)平臺(tái)構(gòu)成

對(duì)于時(shí)刻，基于高斯過(guò)程的機(jī)器人動(dòng)力學(xué)模型辨識(shí)有：

(19)

(20)

3.2 試驗(yàn)

機(jī)器人的輸入包括執(zhí)行機(jī)構(gòu)控制量和機(jī)器人的速度和姿態(tài)等信息。同樣的，在相同的執(zhí)行機(jī)構(gòu)中控制輸入，利用第2.2節(jié)方法，獲得機(jī)器人的動(dòng)力學(xué)模型。并對(duì)比相同控制輸入下的模型預(yù)測(cè)值和實(shí)際測(cè)量值。

圖4 模型預(yù)測(cè)與實(shí)際測(cè)量值對(duì)比

定義平均絕對(duì)值誤差(Mean Absolute Error,MAE)評(píng)價(jià)模型預(yù)測(cè)精度，如式(21)所示。同時(shí)，對(duì)比全局GPR和LGPR的更新時(shí)間和預(yù)測(cè)時(shí)間，評(píng)價(jià)兩種方法在計(jì)算復(fù)雜度上的區(qū)別，結(jié)果如表1所示。

表1 全局GPR和LGPR性能評(píng)價(jià)

(21)

4 結(jié)論

本文作者提出了一種基于高斯過(guò)程的辨識(shí)方法，采用該方法實(shí)現(xiàn)對(duì)新型跨域機(jī)器人在空中以?xún)A轉(zhuǎn)旋翼無(wú)人機(jī)模式下飛行的動(dòng)力學(xué)模型辨識(shí)。通過(guò)試驗(yàn)，對(duì)比了測(cè)量值和模型預(yù)測(cè)值，證明了該方法的有效性。該模型為跨域機(jī)器人仿真平臺(tái)及其運(yùn)動(dòng)控制器設(shè)計(jì)提供了參考，同時(shí)后續(xù)應(yīng)完善機(jī)器人的功能(如空中平飛和水下航行等)，實(shí)現(xiàn)對(duì)機(jī)器人更多模式下的動(dòng)力學(xué)模型辨識(shí)。