王 澤, 程月華*, 宮江雷, 郭小紅, 何漫麗
1. 南京航空航天大學(xué) 自動化學(xué)院, 江蘇 南京 211100 2. 西安電子科技大學(xué), 西安 710071 3. 宇航動力學(xué)國家重點實驗室, 西安 710043
隨著我國航天向著深空、載人、空間站等多方向的不斷發(fā)展,衛(wèi)星故障診斷逐漸成為一項重要的航天領(lǐng)域技術(shù),是維護(hù)衛(wèi)星正常在軌運行和延長在軌壽命的有力保證.常用的故障診斷方法可分為:基于模型[1]、基于信號[2]和基于數(shù)據(jù)的方法[3].其中,基于數(shù)據(jù)的故障診斷方法是目前最為熱門的方向[4-6].
相較于傳統(tǒng)的基于模型和信號的故障診斷方法,基于數(shù)據(jù)的方法具有明顯的優(yōu)點:其依靠大數(shù)據(jù)支持,無需構(gòu)建精確的數(shù)學(xué)模型,故更加適用于實際情況.但其依賴大量的已標(biāo)記數(shù)據(jù)作為訓(xùn)練集,這與實際衛(wèi)星故障樣本數(shù)據(jù)稀少的現(xiàn)狀相沖突.
遷移學(xué)習(xí)起源于圖像處理領(lǐng)域,是一種應(yīng)對缺乏大量數(shù)據(jù)集問題的有效方法.其核心思想是將模型在豐富的源域數(shù)據(jù)集中訓(xùn)練,再將模型遷移到目標(biāo)域中.不少國內(nèi)外學(xué)者圍繞上述思想,在故障診斷領(lǐng)域展開關(guān)于遷移學(xué)習(xí)應(yīng)用的研究工作[7-8].文獻(xiàn)[9]通過添加多層域自適應(yīng)正則化項和偽標(biāo)簽學(xué)習(xí)正則化項,用以診斷軸承故障.文獻(xiàn)[10]提出了一種基于TCA遷移學(xué)習(xí)的故障診斷方法,利用歷史工況建立工作狀態(tài)下的故障診斷模型.文獻(xiàn)[11]提出了一種基于實例加權(quán)的多目標(biāo)遷移學(xué)習(xí)網(wǎng)絡(luò),并以工業(yè)機(jī)器人為對象驗證其故障診斷算法的準(zhǔn)確性和魯棒性.
文獻(xiàn)[12]將深度遷移學(xué)習(xí)應(yīng)用到衛(wèi)星故障診斷問題,通過搭建基于殘差的故障診斷深度學(xué)習(xí)框架,并設(shè)計網(wǎng)絡(luò)聯(lián)合分布自適應(yīng)代價函數(shù),對模型進(jìn)行參數(shù)重調(diào),使網(wǎng)絡(luò)適用于目標(biāo)任務(wù).本文針對故障樣本缺失問題,從另一種角度出發(fā),提出一種基于DDC遷移學(xué)習(xí)算法的故障診斷方法:采用LSTM-AE模型對衛(wèi)星姿態(tài)數(shù)據(jù)進(jìn)行重構(gòu),得到結(jié)果并計算殘差;采用統(tǒng)計學(xué)方法對殘差提取有效特征;采用淺層網(wǎng)絡(luò)充當(dāng)故障定位分類器,并引入DDC遷移學(xué)習(xí)算法對分類器進(jìn)行改進(jìn).相較于深度遷移學(xué)習(xí),本文采用的方法具有更好的可解釋性.
本文提出一種基于DDC遷移學(xué)習(xí)的數(shù)據(jù)驅(qū)動故障診斷方法如圖1所示.
圖1 基于DDC的故障定位方法結(jié)構(gòu)圖Fig.1 Structure diagram of fault location method based on DDC
(1)建立衛(wèi)星數(shù)值仿真模型生成標(biāo)稱衛(wèi)星A的姿態(tài)信息,采集三軸氣浮臺的實際數(shù)據(jù)作為目標(biāo)衛(wèi)星B的姿態(tài)信息,分別將標(biāo)稱衛(wèi)星A和目標(biāo)衛(wèi)星B的3維姿態(tài)角和3維角速度數(shù)據(jù)通過LSTM-AE模型進(jìn)行重構(gòu)建模.
(2)計算殘差并提取殘差的均值E(r)、方差Var(r)、信息熵H(r)作為特征信息,得到標(biāo)稱衛(wèi)星A特征集(源域)和目標(biāo)衛(wèi)星B特征集(目標(biāo)域).
(3)使用標(biāo)稱衛(wèi)星特征集訓(xùn)練BP網(wǎng)絡(luò),得到BP網(wǎng)絡(luò)故障分類器.
(4)引入DDC遷移學(xué)習(xí)算法,在故障分類器網(wǎng)絡(luò)中添加一層域適應(yīng)層并修改損失函數(shù)形式,凍結(jié)淺層網(wǎng)絡(luò)參數(shù),利用目標(biāo)衛(wèi)星特征集對BP網(wǎng)絡(luò)進(jìn)行再訓(xùn)練,得到最終可用于實際情況的BP網(wǎng)絡(luò)故障定位分類器.
LSTM-AE是一種由LSTM神經(jīng)元構(gòu)成的AE網(wǎng)絡(luò),其結(jié)合LSTM對長時序信息的特征學(xué)習(xí)能力和AE的無監(jiān)督特性,可以高效地完成對長時序多維數(shù)據(jù)的重構(gòu).本文利用其模型對長時序多維數(shù)據(jù)的無監(jiān)督重構(gòu)能力,對衛(wèi)星的動力學(xué)和運動學(xué)模型進(jìn)行建模.
(1)
分別對標(biāo)稱衛(wèi)星A和目標(biāo)衛(wèi)星B的姿態(tài)數(shù)據(jù)進(jìn)行重構(gòu),對輸入和輸出取殘差,得到標(biāo)稱衛(wèi)星A的殘差集Rs和目標(biāo)衛(wèi)星B的殘差集Rt.
為進(jìn)一步對故障的特征信息進(jìn)行提取,在獲得殘差數(shù)據(jù)后,提取殘差的均值E(r)、方差Var(r)、信息熵H(r)作為特征.其中均值E(r)體現(xiàn)時序信息的整體偏差,方差Var(r)和信息熵H(r)體現(xiàn)時序信息的波動程度和無序程度,因此經(jīng)過特征提取后的數(shù)據(jù)能使故障定位網(wǎng)絡(luò)學(xué)習(xí)到更多的故障特征信息.
記ri為殘差向量的第i維分量,其特征提取公式如式(2)
(2)
對殘差集Rs和Rt特征提取,得到標(biāo)稱衛(wèi)星A特征集Xs={Es,Vars,Hs}和目標(biāo)衛(wèi)星B特征集Xt={Et,Vart,Ht}
DDC[13]遷移學(xué)習(xí)方法是起源于計算機(jī)視覺領(lǐng)域的一種經(jīng)典的深度遷移學(xué)習(xí)方法,如今也被用于解決多分類的遷移學(xué)習(xí)問題[14-17].
本文引入DDC遷移學(xué)習(xí)改善分類器網(wǎng)絡(luò)性能:首先固定故障定位分類器網(wǎng)絡(luò)的特征層權(quán)值,然后在特征層和輸出層之間添加域適應(yīng)層,使網(wǎng)絡(luò)學(xué)習(xí)域適應(yīng)知識.在訓(xùn)練過程中,域適應(yīng)層和輸出層的損失函數(shù)如式(3)
LOSS=Lc(Xs,ys)+λMMD2(Xs,Xt)
(3)
式中,Xs為源域樣本,Xt為目標(biāo)域樣本,ys為源域標(biāo)簽,LOSS為總損失,Lc(Xs,ys)為源域的樣本和標(biāo)簽產(chǎn)生的損失,λ為域適應(yīng)損失系數(shù),MMD2(Xs,Xt)為使用MMD函數(shù)計算得到的源域樣本和目標(biāo)域樣本產(chǎn)生的損失.MMD具體計算公式如式(4)
(4)
MMD(maximum mean discrepancy)又稱最大均值差異,用來衡量源域與目標(biāo)域分布通過φ(·)映射到再生希爾伯特空間的距離.在遷移學(xué)習(xí)中常將MMD項加入損失函數(shù)中,讓神經(jīng)網(wǎng)絡(luò)同時學(xué)習(xí)分類損失和域適應(yīng)損失,以縮小源域和目標(biāo)域之間的距離.φ(·)本身為未知映射,為求解上述等式,引入核矩陣K以及系數(shù)矩陣L.
(5)
(6)
其中n1為源域樣本數(shù),n2為目標(biāo)域樣本數(shù).
將式(4)轉(zhuǎn)換為如下形式:
MMD(Xs,Xt)=trace(KL)-λtrace(K)
(7)
進(jìn)一步降維構(gòu)造W矩陣使得
(8)
將上述問題轉(zhuǎn)化為最優(yōu)問題如下:
(9)
其中
H=1n1+n2-1/(n1+n2)11T
s.t.1=[1,1,…,1]n2+n2
(10)
因此,求解出(KLK+μI)-1KHK的前m個特征值,即是MMD(Xs,Xt)的值.
依據(jù)文獻(xiàn)[13],進(jìn)行DDC遷移工作的主要任務(wù)分為3個方面:以MMD損失值為中間指標(biāo),以故障定位準(zhǔn)確率為最終指標(biāo),通過網(wǎng)格搜索法結(jié)合經(jīng)驗選取的方式,確定最優(yōu)的域適應(yīng)層位置、域適應(yīng)層尺寸和域適應(yīng)損失系數(shù),如圖3所示.
(11)
本文引入遷移學(xué)習(xí)作為一種解決訓(xùn)練樣本缺失的方法,這也擁有相應(yīng)的局限性.當(dāng)源域樣本的邊緣分布和條件分布與目標(biāo)域樣本的差距過大時,網(wǎng)絡(luò)的域適應(yīng)層將難以從源域?qū)W習(xí)到可適用于目標(biāo)域的知識,從而導(dǎo)致在遷移學(xué)習(xí)后網(wǎng)絡(luò)在目標(biāo)域的效果依舊不佳.
本文使用半物理仿真平臺采集目標(biāo)衛(wèi)星實際數(shù)據(jù)作為目標(biāo)域數(shù)據(jù),對算法在半物理仿真平臺上進(jìn)行實物驗證.
圖3 DDC遷移學(xué)習(xí)步驟Fig.3 DDC transfer learning steps
圖4 半物理仿真平臺Fig.4 Semi physical simulation platform
如圖4所示,半物理仿真平臺主體分為3個部分:氣浮臺、姿態(tài)視覺測量系統(tǒng)及控制計算機(jī).氣浮臺主體通過氣浮軸承懸浮在底部支架上,用于模擬衛(wèi)星姿態(tài)運動,其上方平面安裝一個三軸陀螺儀,以測量氣浮臺主體角速度信息;控制計算機(jī)作為上位機(jī)接收數(shù)據(jù),并向氣浮臺發(fā)送姿態(tài)指令和注入故障;姿態(tài)視覺測量系統(tǒng)通過上方相機(jī)捕捉氣浮臺主體特征靶標(biāo),并利用位姿解算方法得到氣浮臺姿態(tài)量,結(jié)合傾角計所測得的傾角數(shù)據(jù)計算氣浮臺主體的姿態(tài)角信息,具體配置如圖5.
圖5 姿態(tài)視覺測量系統(tǒng)Fig.5 Attitude vision measurement system
對標(biāo)稱衛(wèi)星A(Matlab數(shù)值仿真模型)和目標(biāo)衛(wèi)星B(半物理仿真平臺)的姿態(tài)數(shù)據(jù)進(jìn)行重構(gòu),得到殘差并提取特征,得到標(biāo)稱衛(wèi)星A特征集(源域)和目標(biāo)衛(wèi)星B特征集(目標(biāo)域).
如圖6和圖7所示分別為仿真數(shù)據(jù)和實際數(shù)據(jù)在健康(黑色圓點)、陀螺故障(紅色星形點)、星敏故障(黃色方點)和動量輪故障(藍(lán)色加號點)4種情況下的殘差,經(jīng)過故障特征提取步驟后的3維特征分布圖.每張子圖對應(yīng)一種姿態(tài)信息殘差特征,坐標(biāo)軸三軸分別為均值E(r)、方差Var(r)和信息熵H(r).綜合以上特征分布圖可以看出,本文采用的特征提取方法效果較好,4種健康與故障情況特征點都具有明顯的分布差異.
圖6 健康和故障仿真數(shù)據(jù)殘差特征分布圖Fig.6 Characteristic distribution of residuals of health and fault simulation data
圖7 健康和故障實際數(shù)據(jù)殘差特征分布圖Fig.7 Characteristic distribution of residuals of health and fault actual data
使用標(biāo)稱衛(wèi)星A特征集數(shù)據(jù)對BP網(wǎng)絡(luò)預(yù)訓(xùn)練,再引入DDC遷移學(xué)習(xí)算法,在BP網(wǎng)絡(luò)中添加域適應(yīng)層并利用目標(biāo)衛(wèi)星B特征集對BP網(wǎng)絡(luò)進(jìn)行再訓(xùn)練,得到最終可用于目標(biāo)衛(wèi)星B實際情況的BP網(wǎng)絡(luò)故障定位分類器.
DDC遷移工作的主要任務(wù)主要分為3個方面:確定域適應(yīng)層位置、確定域適應(yīng)層尺寸和確定域適應(yīng)損失系數(shù).基于上述步驟內(nèi)容進(jìn)行實驗,對網(wǎng)絡(luò)參數(shù)修改并對比訓(xùn)練結(jié)果.
圖8 DDC遷移學(xué)習(xí)參數(shù)選擇Fig.8 DDC transfer learning parameter selection
如圖8,依據(jù)DDC遷移學(xué)習(xí)步驟,首先進(jìn)行域適應(yīng)層位置n的確定.本文使用3層的BP網(wǎng)絡(luò)結(jié)構(gòu),所以域適應(yīng)層的添加位置只有4處.可以看出當(dāng)n由1加深到3的過程中,故障定位準(zhǔn)確率不斷升高,且在第3層時準(zhǔn)確率達(dá)到最高80.2%.因此本文選擇第3層為域適應(yīng)層最佳位置.
確定域適應(yīng)層最佳位置n之后,進(jìn)行域適應(yīng)層尺寸a的確定,即該層網(wǎng)絡(luò)的神經(jīng)元數(shù).根據(jù)文獻(xiàn)[13],測試使用的域適應(yīng)層尺寸a之間應(yīng)保持2的冪次倍數(shù)關(guān)系,可以看出在a由5增加到20的過程中,故障定位準(zhǔn)確率持續(xù)升高,在a為20時準(zhǔn)確率達(dá)到最高80.2%.因此本文選擇域適應(yīng)層最佳尺寸a為20個神經(jīng)元.
經(jīng)過以上兩步確定工作,進(jìn)行域適應(yīng)損失系數(shù)λ的確定.為避免將λ設(shè)置的過低而導(dǎo)致網(wǎng)絡(luò)無法學(xué)習(xí)到域之間的特征,同時也為避免將λ設(shè)置的過高而導(dǎo)致對原網(wǎng)絡(luò)的過度修改和域之間的過度靠近,選擇λ=0.25.
表1 DDC遷移學(xué)習(xí)效果Tab.1 Results of DDC transfer learning
在BP神經(jīng)網(wǎng)絡(luò)的DDC遷移學(xué)習(xí)訓(xùn)練完成之后,測試其對實際數(shù)據(jù)的故障定位準(zhǔn)確率如上表1所示,從其統(tǒng)計結(jié)果可以看出,在使用DDC方法對BP網(wǎng)絡(luò)遷移學(xué)習(xí)之后,健康情況和動量輪故障情況的定位準(zhǔn)確率提升效果最為明顯,分別為37.1%和22.3%;星敏故障的定位準(zhǔn)確率提升最少,為10.0%.這說明本文提出的算法提高了實際情況下目標(biāo)衛(wèi)星ACS系統(tǒng)的故障定位精度.
本文設(shè)計了一種基于數(shù)據(jù)的故障定位方案,利用LSTM-AE對標(biāo)稱衛(wèi)星A和目標(biāo)衛(wèi)星B的姿態(tài)信息重構(gòu),計算原數(shù)據(jù)和重構(gòu)數(shù)據(jù)的殘差提取特征信息,建立特征數(shù)據(jù)集訓(xùn)練BP網(wǎng)絡(luò)分類器以定位衛(wèi)星ACS故障.針對目標(biāo)衛(wèi)星無故障樣本問題,提出了引入DDC遷移學(xué)習(xí)算法的故障定位改進(jìn)方法,在原BP網(wǎng)絡(luò)中添加域適應(yīng)層并修改損失函數(shù),以改善算法在目標(biāo)衛(wèi)星實際情況的定位效果.最終通過氣浮臺半物理仿真實驗,以標(biāo)稱衛(wèi)星A為源域,目標(biāo)衛(wèi)星B為目標(biāo)域開展實驗驗證.從實驗結(jié)果看,故障定位精度有了最高37.1%的提升.
由于DDC遷移學(xué)習(xí)算法只學(xué)習(xí)源域和目標(biāo)域之間的邊緣分布差異,而未考慮到條件分布差異.因此在源域和目標(biāo)域之間條件分布差異較大的情況下,如何選取效果更好的遷移學(xué)習(xí)算法,是下一步的研究方向.