馬衛(wèi)華,袁大鐘,孟思洋,羅建軍
(1. 航天飛行動(dòng)力學(xué)技術(shù)重點(diǎn)實(shí)驗(yàn)室,西安 710072;2. 西北工業(yè)大學(xué)航天學(xué)院,西安 710072;3.上海機(jī)電工程研究所,上海 201109)
對(duì)空間目標(biāo),特別是非合作目標(biāo),進(jìn)行慣性參數(shù)辨識(shí)是實(shí)施后續(xù)精準(zhǔn)操作的基礎(chǔ),典型的辨識(shí)策略大致分為兩類(lèi),基于視覺(jué)測(cè)量的非接觸式辨識(shí)和基于主動(dòng)激勵(lì)的接觸式辨識(shí)。
Aghili[1]針對(duì)攜帶相機(jī)的機(jī)械臂,建立了基于目標(biāo)表面特征點(diǎn)信息的非接觸參數(shù)辨識(shí)方法,基于傳統(tǒng)運(yùn)動(dòng)學(xué)模型,采用濾波方法估計(jì)目標(biāo)的姿態(tài)參數(shù)、轉(zhuǎn)動(dòng)慣量比以及質(zhì)心位置。在此基礎(chǔ)上,Hou等[2]改進(jìn)運(yùn)動(dòng)學(xué)模型,采用對(duì)偶四元數(shù)重新建模,減少了辨識(shí)過(guò)程中的計(jì)算量。這類(lèi)辨識(shí)方法無(wú)需和被測(cè)目標(biāo)發(fā)生物理接觸,但只能辨識(shí)目標(biāo)的質(zhì)心位置和轉(zhuǎn)動(dòng)慣量比,無(wú)法給出轉(zhuǎn)動(dòng)慣量絕對(duì)值,以及非常重要的質(zhì)量信息。
接觸式辨識(shí)多見(jiàn)于攜帶機(jī)械臂的空間操作機(jī)器人,將操作平臺(tái)和非合作目標(biāo)通過(guò)機(jī)械臂物理連接構(gòu)建為組合體,利用操作平臺(tái)的主動(dòng)激勵(lì)改變組合體線(xiàn)運(yùn)動(dòng)和角運(yùn)動(dòng),實(shí)施對(duì)組合體的慣性特征參數(shù)辨識(shí)。Yoshisada等[3]詳細(xì)闡述了基于兩大原理(動(dòng)量守恒方程、牛頓-歐拉方程)的空間非合作目標(biāo)慣性參數(shù)辨識(shí)方案,利用線(xiàn)性辨識(shí)方程求廣義逆完成目標(biāo)慣性參數(shù)辨識(shí)。Roberto和Gerhard[4]利用牛頓-歐拉方程,并通過(guò)使用加速度計(jì)測(cè)量來(lái)辨識(shí)空間非合作目標(biāo)的慣性參數(shù)。
目前很多學(xué)者對(duì)于目標(biāo)慣性參數(shù)辨識(shí)的研究都是基于動(dòng)量守恒原理,在剛體/撓性體、辨識(shí)求解方法等方面開(kāi)展的。
采用剛體目標(biāo)假設(shè),Walker等[5]學(xué)者引入線(xiàn)動(dòng)量守恒方程與角動(dòng)量守恒方程,根據(jù)機(jī)器人運(yùn)動(dòng)學(xué),采用單臂連續(xù)運(yùn)動(dòng)的激勵(lì)方式,實(shí)現(xiàn)了空間機(jī)器人慣性參數(shù)的完全辨識(shí); Ma等[6]提出了基于單機(jī)械臂主動(dòng)機(jī)動(dòng)從而辨識(shí)本體參數(shù)的方法,利用機(jī)械臂運(yùn)動(dòng)改變本體運(yùn)動(dòng),只需要測(cè)量本體的速度、角速度,即可實(shí)現(xiàn)空間本體慣性參數(shù)的完全辨識(shí),辨識(shí)算法簡(jiǎn)化,實(shí)現(xiàn)方案容易;金磊等[7]基于動(dòng)量守恒原理提出了全增量式(線(xiàn)動(dòng)量和角動(dòng)量)的辨識(shí)方程,研究了單臂自由飄浮空間機(jī)器人抓取未知目標(biāo)的質(zhì)量特性參數(shù)辨識(shí)問(wèn)題;洪炳镕等[8-9]基于動(dòng)量守恒原理針對(duì)雙臂/多臂機(jī)器人探討了其捕捉非合作目標(biāo)過(guò)程中的參數(shù)辨識(shí);為提高辨識(shí)精度,Chu等[10]學(xué)者提出引入末端操作機(jī)構(gòu)的接觸力信息,較為準(zhǔn)確的反映出操作階段的運(yùn)動(dòng)學(xué)、動(dòng)力學(xué)過(guò)程,避免常規(guī)外界測(cè)量誤差對(duì)系統(tǒng)辨識(shí)精度的影響,從而更能準(zhǔn)確的描述抓捕作用過(guò)程,改善辨識(shí)效果。采用撓性體目標(biāo)假設(shè),何驍?shù)萚11]針對(duì)大角度機(jī)動(dòng)情況下帶撓性附件航天器轉(zhuǎn)動(dòng)慣量在軌辨識(shí)的問(wèn)題,提出一種將轉(zhuǎn)動(dòng)慣量參數(shù)估計(jì)和撓性附件狀態(tài)估計(jì)相結(jié)合的并發(fā)遞推算法。
在辨識(shí)求解方法上,除了常規(guī)最小二乘法外,徐文福等[12]提出了基于參數(shù)解耦的最小二乘法和基于PSO算法的非線(xiàn)性?xún)?yōu)化兩種方法;孫俊等[13]針對(duì)傳統(tǒng)依賴(lài)廣義逆求解的辨識(shí)方法的問(wèn)題,諸如辨識(shí)過(guò)程運(yùn)算量大、數(shù)值容易產(chǎn)生劇烈振蕩,造成辨識(shí)結(jié)果不穩(wěn)定等,采用基于歸一化最小均方(Normalized least mean square, NLMS)準(zhǔn)則的Adaline神經(jīng)網(wǎng)絡(luò)方法進(jìn)行空間非合作目標(biāo)慣性參數(shù)的辨識(shí),但需要解決NLMS準(zhǔn)則中α,β參數(shù)的最優(yōu)選取問(wèn)題。顯然,優(yōu)化、智能算法將會(huì)進(jìn)一步應(yīng)用于目標(biāo)慣性參數(shù)辨識(shí)中。
綜上可見(jiàn),僅依賴(lài)視覺(jué)的非接觸辨識(shí)方法,無(wú)法獲得目標(biāo)轉(zhuǎn)動(dòng)慣量和質(zhì)量信息;而接觸式辨識(shí)中,要求本體必須具備主動(dòng)激勵(lì)能力,這對(duì)于未裝備機(jī)械臂之類(lèi)裝置的飛行器,特別是微小型衛(wèi)星平臺(tái)而言是較難實(shí)現(xiàn)的。
隨著微重力環(huán)境黏附技術(shù)的發(fā)展[14],具備黏附能力的新型飛行器有望形成。這類(lèi)裝有黏附裝置的空間飛行器在具有一定相對(duì)沖量的前提下,可黏附在目標(biāo)航天器表面上。而對(duì)于空間目標(biāo)來(lái)說(shuō),相對(duì)沖量是一種自然激勵(lì),會(huì)導(dǎo)致其運(yùn)動(dòng)狀態(tài)的變化,相當(dāng)于產(chǎn)生了接觸辨識(shí)中的主動(dòng)激勵(lì)。因此,黏附過(guò)程應(yīng)當(dāng)具備辨識(shí)空間目標(biāo)慣性參數(shù)的潛力。
由于一般情況下黏附過(guò)程的激勵(lì)程度較小,完整辨識(shí)目標(biāo)慣性參數(shù)的能力有限。為此,本文基于非接觸辨識(shí)和接觸辨識(shí)的特點(diǎn),提出了基于黏附激勵(lì)的辨識(shí)方法。首先采用視覺(jué)非接觸辨識(shí)方式,建立基于視線(xiàn)信息估計(jì)目標(biāo)慣性參數(shù)和相對(duì)運(yùn)動(dòng)參數(shù)的濾波器,并估計(jì)黏附前的目標(biāo)質(zhì)心和轉(zhuǎn)動(dòng)慣量比;然后利用黏附激勵(lì)改變目標(biāo)運(yùn)動(dòng)狀態(tài),直接利用非接觸方式的濾波器估計(jì)黏附后目標(biāo)(組合體)質(zhì)心運(yùn)動(dòng)速度,并基于動(dòng)量守恒辨識(shí)目標(biāo)質(zhì)量參數(shù);最后通過(guò)數(shù)值仿真完成驗(yàn)證了方法的有效性。
假設(shè)主星攜帶黏附衛(wèi)星,并安裝有相機(jī)來(lái)獲取目標(biāo)特征點(diǎn)的位置和視線(xiàn)信息,圖1給出了目標(biāo)和主星的相對(duì)位置關(guān)系。
借鑒文獻(xiàn)[1]中Aghili的研究工作,定義相關(guān)物理量及坐標(biāo)系含義:{A}代表慣性坐標(biāo)系,原點(diǎn)在主星質(zhì)心處;{B}代表目標(biāo)本體系,三軸方向與目標(biāo)主軸方向平行,原點(diǎn)在目標(biāo)的質(zhì)心處;{C}代表目標(biāo)表面特征點(diǎn)本體系,原點(diǎn)在特征點(diǎn)處。鑒于部分特征點(diǎn)本體系和目標(biāo)本體系近似重合,為簡(jiǎn)化問(wèn)題,在此假設(shè){C}和{B}重合。
轉(zhuǎn)動(dòng)慣量比p定義為[1]:
(1)
式中:Ixx,Iyy,Izz為目標(biāo)的主慣量矩。
因?yàn)榧僭O(shè){C}和{B}近似重合,所以本節(jié)定義的狀態(tài)向量數(shù)目少于Aghili給出的狀態(tài)向量,狀態(tài)方程、觀測(cè)方程和文獻(xiàn)[1]對(duì)應(yīng)模型相比略微簡(jiǎn)單。后續(xù)1.2、1.3、1.4節(jié)中的參數(shù)模型的具體推導(dǎo)過(guò)程可參見(jiàn)文獻(xiàn)[1]。
選取目標(biāo)姿態(tài)四元數(shù)矢量部分qv、旋轉(zhuǎn)角速度ω、質(zhì)心r、速度v、轉(zhuǎn)動(dòng)慣量比p和特征點(diǎn)相對(duì)目標(biāo)質(zhì)心位置ρ構(gòu)建狀態(tài)向量:
(2)
通過(guò)對(duì)文獻(xiàn)[1]狀態(tài)方程適當(dāng)簡(jiǎn)化得到:
(3)
(4)
(5)
其中,
B=diag(bx,by,bz),
式中:用a×表示矢量a對(duì)應(yīng)的反對(duì)稱(chēng)矩陣,ω×即為矢量ω對(duì)應(yīng)的反對(duì)稱(chēng)矩陣。
ε表示系統(tǒng)噪聲,
(6)
式中:ετ和εf為過(guò)程噪聲,均定義為標(biāo)準(zhǔn)正態(tài)分布的白噪聲。
主星可以利用相機(jī)獲取目標(biāo)表面特征點(diǎn)的方位信息以及位置信息(均在坐標(biāo)系{A}中測(cè)量得到),定義測(cè)量矢量z為:
(7)
其中:rs為特征點(diǎn)在{A}系中的位置,其模型為[1]:
rs=r+A(q)ρ
(8)
其中:A(q)是從{B}系到{A}系的坐標(biāo)旋轉(zhuǎn)矩陣,由四元數(shù)q確定:
(9)
其中:η為特征點(diǎn)在{A}系中的位置和特征點(diǎn)坐標(biāo)系姿態(tài)指向四元數(shù),近似認(rèn)為和q相同:
η=q
(10)
式(7)中的ν表示測(cè)量噪聲,假設(shè)為高斯白噪聲,協(xié)方差R=E[ννT]。
擴(kuò)展Kalman濾波要求對(duì)非線(xiàn)性狀態(tài)方程和觀測(cè)方程(7)作線(xiàn)性化。在文獻(xiàn)[1]中相關(guān)矩陣基礎(chǔ)上,本文直接簡(jiǎn)化得到對(duì)應(yīng)的雅克比矩陣。
狀態(tài)方程的雅克比矩陣F為:
(12)
(13)
N(ω)=diag(ωyωz,ωxωz,ωxωy)
(14)
觀測(cè)方程的雅克比矩陣H
(15)
(16)
聯(lián)合式(3)、式(7)、式(12)、式(15),利用擴(kuò)展卡爾曼濾波基于視覺(jué)信息估計(jì)黏附前目標(biāo)質(zhì)心和轉(zhuǎn)動(dòng)慣量比。
黏附過(guò)程中,目標(biāo)受到黏附衛(wèi)星的碰撞后會(huì)有兩種運(yùn)動(dòng)情況:一種是碰撞后彼此分離,沿各自軌跡進(jìn)行運(yùn)動(dòng);另一種是碰撞后連接形成組合體一起運(yùn)動(dòng)。假設(shè)黏附能力足夠強(qiáng),黏附衛(wèi)星和目標(biāo)形成了組合體,如圖2所示。
VT,VS和V′分別為目標(biāo)黏附前速度、黏附衛(wèi)星初始速度和黏附后組合體速度;ms,mT分別表示黏附衛(wèi)星質(zhì)量、目標(biāo)星質(zhì)量;ωr,ω′分別表示黏附前后目標(biāo)的旋轉(zhuǎn)角速度。
黏附前及黏附后,主星將持續(xù)觀察目標(biāo),借助1.2節(jié)的濾波器可以估計(jì)黏附后目標(biāo)的質(zhì)心速度,估計(jì)算法和第1步完全一致。
黏附前后滿(mǎn)足動(dòng)量守恒:
mSVS+mTVT=(mS+mT)V′
(17)
該動(dòng)量守恒方程在主星當(dāng)?shù)剀壍雷鴺?biāo)系中是成立的,方程中的速度均是相對(duì)速度,數(shù)值一般比較小,碰撞前目標(biāo)和主星保持相對(duì)靜止,目標(biāo)速度一般可認(rèn)為接近0,則上述模型可以進(jìn)一步簡(jiǎn)化為
mSVS=(mS+mT)V′
(18)
目標(biāo)質(zhì)量的估計(jì)模型為
mT=mS(V′TVS)(V′TV′)-1-mS
(19)
如果假設(shè)黏附衛(wèi)星質(zhì)量、目標(biāo)質(zhì)量、黏附衛(wèi)星速度、目標(biāo)黏附后速度的測(cè)量精度均方差分別用σδmS,σδmT,σδVS,σδV′表示,根據(jù)式(18)可以得到辨識(shí)后質(zhì)量的相對(duì)精度模型:
(20)
式中:σδmT是目標(biāo)質(zhì)量誤差的協(xié)方差。顯然,目標(biāo)質(zhì)量相對(duì)精度和黏附衛(wèi)星初始速度有關(guān),隨其數(shù)值增大而提高,和黏附衛(wèi)星/目標(biāo)的質(zhì)量比也有關(guān),如果二者質(zhì)量相近,則目標(biāo)質(zhì)量估計(jì)精度最好,反之則會(huì)變差。
3.1.1目標(biāo)參數(shù)和黏附衛(wèi)星參數(shù)
根據(jù)文獻(xiàn)[1]設(shè)定主星部分狀態(tài)的真值見(jiàn)表1,
論文仿真計(jì)算中對(duì)應(yīng)的狀態(tài)估計(jì)初值及部分誤差參數(shù)也列于該表。
黏附衛(wèi)星的質(zhì)量、在目標(biāo)軌道系初始速度和黏附點(diǎn)在目標(biāo)本體系下位置分別為20 kg、[0.5 m/s,0 m/s,0 m/s]和[0.25 m,0 m,0 m]。為驗(yàn)證不同質(zhì)量比下目標(biāo)質(zhì)量的辨識(shí)精度,目標(biāo)質(zhì)量分別設(shè)定為2 kg,4 kg,20 kg,80 kg,200 kg,黏附衛(wèi)星/目標(biāo)的質(zhì)量比分別為10,5,1,0.2,0.1。
3.1.2測(cè)量與其他仿真參數(shù)
目標(biāo)姿態(tài)軌道的動(dòng)力學(xué)/運(yùn)動(dòng)學(xué)積分步長(zhǎng)為0.05 s,測(cè)量裝置的輸出頻率2 Hz。測(cè)量的特征點(diǎn)位置和方位精度分別為0.045 m(1σ)和0.003°(1σ)。
3.1.3仿真計(jì)算流程
完整仿真數(shù)據(jù)流程如下圖所示。
3.2.1黏附前的目標(biāo)特性參數(shù)估計(jì)
目標(biāo)轉(zhuǎn)動(dòng)慣量比估計(jì)變化如圖4所示,目標(biāo)質(zhì)心位置估計(jì)誤差、質(zhì)心運(yùn)動(dòng)速度估計(jì)誤差、特征點(diǎn)位置估計(jì)誤差曲線(xiàn)分別見(jiàn)圖5、圖6、圖7。圖4中三條虛線(xiàn)表示標(biāo)準(zhǔn)的轉(zhuǎn)動(dòng)慣量比,圖5~圖7中對(duì)稱(chēng)分布的黑色曲線(xiàn)為估計(jì)誤差協(xié)方差值(3σ),考慮到三軸數(shù)據(jù)類(lèi)似,圖5~圖7只提供了X軸數(shù)據(jù)。
根據(jù)仿真結(jié)果可見(jiàn),大概30 s后目標(biāo)轉(zhuǎn)動(dòng)慣量比、質(zhì)心位置、質(zhì)心速度和特征點(diǎn)位置的估計(jì)值分別接近真實(shí)值,誤差基本在3σ誤差協(xié)方差曲線(xiàn)以?xún)?nèi),誤差估計(jì)和方差吻合得比較好。表2給出了仿真所得的參數(shù)辨識(shí)末端精度,對(duì)應(yīng)的三向合成精度分別為0.08 m(1σ)、2.47 mm/s(1σ)、0.0053(1σ)、0.07 m(1σ)。
表2 黏附前辨識(shí)末端的目標(biāo)參數(shù)精度Table 2 Terminal estimation precision of target parameter before adhesion
基于視覺(jué)信息的濾波計(jì)算可以較好的估計(jì)出目標(biāo)的質(zhì)心、質(zhì)心速度、轉(zhuǎn)動(dòng)慣量比以及特征點(diǎn)位置等參數(shù)。特別是目標(biāo)質(zhì)心速度的良好估計(jì),為黏附后黏附過(guò)程的目標(biāo)質(zhì)量辨識(shí)提供了良好的條件。
3.2.2黏附后的目標(biāo)質(zhì)量估計(jì)
根據(jù)式(20),目標(biāo)質(zhì)量估計(jì)精度主要取決于黏附衛(wèi)星/目標(biāo)的質(zhì)量比以及目標(biāo)質(zhì)心速度精度。
首先估計(jì)目標(biāo)質(zhì)心速度精度。
主星采用和黏附前相同的濾波器估計(jì)組合體質(zhì)心速度,黏附衛(wèi)星/目標(biāo)不同質(zhì)量比下黏附后目標(biāo)質(zhì)心運(yùn)動(dòng)速度估計(jì)如圖8所示,圖中對(duì)稱(chēng)分布的虛線(xiàn)為估計(jì)誤差協(xié)方差值(3σ),末端精度統(tǒng)計(jì)見(jiàn)表3。圖形左端的數(shù)字表示黏附衛(wèi)星/目標(biāo)質(zhì)量比。
黏附衛(wèi)星與目標(biāo)質(zhì)量比速度估計(jì)精度/(mm·s-1,1σ)X向Y向Z向三向10510.20.1101.591.331.652.6552.601.482.934.1912.951.643.444.820.21.151.141.141.980.13.943.572.225.76
從末端精度統(tǒng)計(jì)看,組合體質(zhì)心速度估計(jì)精度沒(méi)有呈現(xiàn)明顯規(guī)律性變化,各種情況下的精度相差不大,基本可以認(rèn)為在mm/s量級(jí)精度范圍,因此可以近似認(rèn)為目標(biāo)和微小衛(wèi)星的質(zhì)量比變化時(shí),組合體質(zhì)心速度估計(jì)精度是近似相當(dāng)?shù)摹?/p>
其次針對(duì)不同目標(biāo)/黏附衛(wèi)星質(zhì)量比分析目標(biāo)質(zhì)量估計(jì)精度。
完成5種工況下的仿真結(jié)果,鑒于結(jié)果曲線(xiàn)波動(dòng)形態(tài)較為相似,在此僅給出黏附衛(wèi)星/目標(biāo)質(zhì)量比為10和1的仿真曲線(xiàn),相對(duì)誤差的統(tǒng)計(jì)分析結(jié)果展示于表4中。
依仿真可見(jiàn),依據(jù)動(dòng)量守恒定理計(jì)算目標(biāo)質(zhì)量時(shí),目標(biāo)質(zhì)量估計(jì)精度受黏附衛(wèi)星/目標(biāo)質(zhì)量比的影響很明顯。兩者質(zhì)量相當(dāng)時(shí),質(zhì)量估計(jì)精度最高,相對(duì)精度大概5%;隨著質(zhì)量差異明顯,精度逐漸下降,在比值為1∶10或10∶1時(shí)(見(jiàn)圖9,圖10),目標(biāo)質(zhì)量辨識(shí)的相對(duì)誤差在20%左右。
黏附衛(wèi)星/目標(biāo)質(zhì)量比目標(biāo)質(zhì)量估計(jì)相對(duì)誤差/%1∶10201∶5101∶155∶11010∶120
黏附衛(wèi)星以一定相對(duì)速度逼近并黏附于目標(biāo),產(chǎn)生可改變目標(biāo)運(yùn)動(dòng)狀態(tài)的自然激勵(lì),文中基于此提出了利用黏附過(guò)程的自然激勵(lì)實(shí)施空間目標(biāo)慣性參數(shù)辨識(shí)的辨識(shí)方法。
相對(duì)于常規(guī)辨識(shí)方法,文中提出的辨識(shí)方法僅利用主星視覺(jué)測(cè)量、充分利用黏附過(guò)程自然激勵(lì)即可實(shí)現(xiàn)對(duì)目標(biāo)轉(zhuǎn)動(dòng)慣量比、質(zhì)心和質(zhì)量的辨識(shí),無(wú)需常規(guī)辨識(shí)方法必須的額外主動(dòng)激勵(lì),且辨識(shí)過(guò)程中算法統(tǒng)一、無(wú)需切換,使用更為便捷。
仿真結(jié)果證實(shí)了所提方法能夠?qū)崿F(xiàn)對(duì)非合作目標(biāo)質(zhì)心、質(zhì)心速度、轉(zhuǎn)動(dòng)慣量比的估計(jì),驗(yàn)證了算法的可行性。
鑒于算法和目標(biāo)、主星、黏附衛(wèi)星的初始狀態(tài)有密切關(guān)系,且沒(méi)有獲取目標(biāo)轉(zhuǎn)動(dòng)慣量具體數(shù)值。后續(xù)將對(duì)此進(jìn)行完善,分析算法穩(wěn)定運(yùn)行條件,并將辨識(shí)約束融入黏附策略設(shè)計(jì)中。