楊高朋,岑恩杰,陳換過*,陳 培,肖 雪,徐 淼,劉培君
(1.浙江理工大學(xué)機(jī)械與自動(dòng)控制學(xué)院,浙江 杭州 310018;2.杭州定川信息技術(shù)有限公司,浙江 杭州 310018;3.北京精密機(jī)電控制設(shè)備研究所,北京 100076)
作為一種新型的電傳控制系統(tǒng),電靜壓伺服機(jī)構(gòu)(Electro-Hydrostatic Actuator,EHA)是未來航空航天領(lǐng)域推力矢量系統(tǒng)的主要發(fā)展趨勢之一,具有重載能力強(qiáng)、易實(shí)現(xiàn)冗余等優(yōu)點(diǎn)[1-2]。因此,開展EHA小樣本數(shù)據(jù)增強(qiáng)并進(jìn)行故障診斷對(duì)掌握EHA健康狀態(tài)和保證EHA安全可靠服役具有重要的意義。然而由于EHA小子樣、長儲(chǔ)存加上裝備本身高可靠性,導(dǎo)致電靜壓伺服機(jī)構(gòu)故障樣本少,再加上有些零部件傳感器位置布置困難,使得獲取數(shù)據(jù)更加困難。采用小樣本數(shù)據(jù)增強(qiáng)故障診斷方法可有效解決上述問題。目前,該方法主要集中在:增加噪聲、數(shù)據(jù)合成、隨機(jī)采樣和數(shù)據(jù)變換四種[3]。其中隨機(jī)采樣僅通過簡單的插值對(duì)數(shù)據(jù)進(jìn)行擴(kuò)充,不能有效提高數(shù)據(jù)多樣性,其做法反而會(huì)增加模型過擬合的風(fēng)險(xiǎn)。變分自編碼網(wǎng)絡(luò)(Variational Auto-Encoding network,VAE)和生成對(duì)抗網(wǎng)絡(luò)(generate adversarial network,GAN)都是通過學(xué)習(xí)真實(shí)數(shù)據(jù)的分布規(guī)律,進(jìn)而對(duì)樣本進(jìn)行擴(kuò)充。Francisco J等[4]詳細(xì)介紹了VAE和GAN方法的原理,并通過試驗(yàn)驗(yàn)證了數(shù)據(jù)增強(qiáng)方法對(duì)深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練效果的增益。從實(shí)際應(yīng)用上看,GAN采用零和博弈原理學(xué)習(xí)樣本特征分布,對(duì)樣本數(shù)據(jù)進(jìn)行擴(kuò)充,生成數(shù)據(jù)結(jié)果表現(xiàn)優(yōu)于VAE[4]。
目前,GAN主要集中應(yīng)用在解決軸承故障樣本數(shù)據(jù)不平衡問題[5-7]。對(duì)于EHA這一小子樣領(lǐng)域,浙江理工大學(xué)劉培君[8]利用GAN及其變種對(duì)EHA小樣本數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng)并進(jìn)行故障診斷。結(jié)果表明,WDCGAN相比原始GAN生成數(shù)據(jù)更接近于真實(shí)樣本,但因樣本量少不足以提取足夠樣本特征,使得生成數(shù)據(jù)質(zhì)量多樣性受限,導(dǎo)致在利用數(shù)據(jù)增強(qiáng)樣本進(jìn)行故障診斷時(shí)仍存在過擬合、準(zhǔn)確率低的問題。隨著遷移學(xué)習(xí)的發(fā)展,吳定會(huì)等[9]將數(shù)據(jù)增強(qiáng)模型與遷移學(xué)習(xí)相結(jié)合,提高了風(fēng)電機(jī)軸承小樣本故障診斷精度。肖兒良等[10]利用改進(jìn)的生成對(duì)抗網(wǎng)絡(luò)(WGAN-GP)與遷移學(xué)習(xí)結(jié)合解決了醫(yī)學(xué)圖像融合時(shí)融合圖像效果差的問題。
本文提出遷移學(xué)習(xí)和生成對(duì)抗網(wǎng)絡(luò)相結(jié)合的故障診斷方法,可有效解決基于WDCGAN故障診斷模型存在的準(zhǔn)確率低和過擬合問題。首先利用遷移學(xué)習(xí)對(duì)已有的EHA生成數(shù)據(jù)進(jìn)行特征提取,得到預(yù)訓(xùn)練模型;然后將預(yù)訓(xùn)練模型與WDCGAN結(jié)合進(jìn)行微調(diào);對(duì)電靜壓伺服機(jī)構(gòu)試驗(yàn)數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng);最后采用MMD距離和3種故障診斷結(jié)果評(píng)價(jià)指標(biāo)對(duì)文章故障診斷方法進(jìn)行評(píng)價(jià)。結(jié)果表明:本文所提方法有效解決了基于WDCGAN的故障診斷方法過擬合和準(zhǔn)確率低的問題。
如圖1所示,EHA伺服系統(tǒng)由伺服控制驅(qū)動(dòng)和電靜壓伺服機(jī)構(gòu)兩部分構(gòu)成,伺服機(jī)構(gòu)在工作時(shí),控制器接受位移反饋信號(hào)和指令信號(hào),通過控制算法進(jìn)行綜合處理后傳遞給驅(qū)動(dòng)器帶動(dòng)伺服電機(jī)泵轉(zhuǎn)動(dòng),同時(shí)將液壓油輸送到活塞推動(dòng)活塞桿進(jìn)行工作。
圖1 EHA工作原理圖
根據(jù)圖1所示EHA的工作原理搭建伺服機(jī)構(gòu)試驗(yàn)平臺(tái),并模擬油濾堵塞和增壓油箱漏氣兩種故障模式,試驗(yàn)樣機(jī)如圖2[11]。
圖2 EHA試驗(yàn)樣機(jī)
試驗(yàn)通過控制油濾通油面積,模擬油濾堵塞故障,其中通油面積分別設(shè)置為:100%(無堵塞故障狀態(tài))、76%、67%、55%、43%、29%、15%、9%、7%、6%、4%共11種工況。采用充氣嘴增壓油箱排放氮?dú)獾姆绞侥M增壓油箱漏氣,其中增壓油箱壓力分別設(shè)置為:1.6 MPa(無漏氣故障狀態(tài))、1.432 MPa、1.070 MPa、0.81 MPa、0.55 MPa共5種工況,試驗(yàn)時(shí)間為0.5 s,采樣頻率為500 Hz。進(jìn)行幅值為70.8 mm的連續(xù)位置指令階躍信號(hào)測試,通過圖3所示總成測試儀對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行采集,試驗(yàn)采集6個(gè)特征信號(hào),分別為:電機(jī)電壓、電流、轉(zhuǎn)速、作動(dòng)器位移、伸出腔壓力1和縮回腔壓力2,然后對(duì)位移求導(dǎo),得到作動(dòng)器速度,共7維試驗(yàn)數(shù)據(jù),試驗(yàn)每隔0.02 s對(duì)數(shù)據(jù)進(jìn)行采集,即試驗(yàn)數(shù)據(jù)形狀為250×7。
圖3 總成測試儀
以WDCGAN生成的電靜壓伺服機(jī)構(gòu)數(shù)據(jù)為源域并結(jié)合遷移學(xué)習(xí),采用“預(yù)訓(xùn)練+微調(diào)”的方法,實(shí)現(xiàn)對(duì)試驗(yàn)故障樣本的數(shù)據(jù)增強(qiáng)。
假設(shè)試驗(yàn)數(shù)據(jù)x={x1,x2…x m}服從分布pr,下標(biāo)m代表試驗(yàn)數(shù)據(jù)特征向量的個(gè)數(shù)(文中m=7),x m代表第m個(gè)特征向量,隨機(jī)噪聲服從分布pz,將隨機(jī)噪聲作為生成器輸入,經(jīng)過多層神經(jīng)元計(jì)算獲得與試驗(yàn)數(shù)據(jù)維度一致的樣本。而判別器輸入包含真實(shí)樣本標(biāo)簽和生成的假樣本,同樣經(jīng)過多層神經(jīng)元計(jì)算獲得輸入數(shù)據(jù)是否為真實(shí)數(shù)據(jù)的概率。生成器目標(biāo)是生成樣本分布盡可能逼近真實(shí)樣本分布。判別器目標(biāo)則是甄別輸入數(shù)據(jù)的來源屬性。二者損失函數(shù)如下所示[12]。
式中:pz為隨機(jī)噪聲服從的分布;pr為真實(shí)樣本服從的分布。二者通過交替訓(xùn)練各自提高自己的生成能力和判別能力并最終達(dá)到納什均衡點(diǎn),有效解決了傳統(tǒng)GAN存在梯度消失和訓(xùn)練不穩(wěn)定的情況。Transfer-WDCGAN模型框架如下:
如圖4所示,模型框架分為模型訓(xùn)練和數(shù)據(jù)生成兩部分。首先通過WDCGAN對(duì)試驗(yàn)數(shù)據(jù)進(jìn)行數(shù)據(jù)增強(qiáng),并將生成數(shù)據(jù)作為遷移學(xué)習(xí)源域,以EHA試驗(yàn)樣機(jī)采集的7類信號(hào)(電機(jī)電壓、電流、指令轉(zhuǎn)速、作動(dòng)器位移、作動(dòng)器速度、作動(dòng)器兩腔室壓力)為目標(biāo)域;然后采用“預(yù)訓(xùn)練+微調(diào)”的方式,對(duì)模型進(jìn)行訓(xùn)練;最后,將隨機(jī)噪聲輸入訓(xùn)練穩(wěn)定的生成器模型中,實(shí)現(xiàn)對(duì)試驗(yàn)樣本的數(shù)據(jù)增強(qiáng)。主訓(xùn)練過程中生成器Gm和判別器Dm參數(shù)與預(yù)訓(xùn)練過程中參數(shù)共享。為更加詳細(xì)描述生成器生成樣本時(shí)的特征提取過程,分別選取1 000、5 000、10 000次迭代時(shí)各卷積層所生成的樣本,并將其轉(zhuǎn)化為灰度圖,如圖5所示。
圖4 Transfer-WDCGAN模型框架
如圖5(a)所示,x軸代表生成器卷積核,y軸代表模型迭代次數(shù)。生成器輸入為一組隨機(jī)噪聲,總迭代次數(shù)為10 000次。分別對(duì)2 000次、5 000次、10 000次時(shí)的訓(xùn)練模型進(jìn)行保存。模型進(jìn)行迭代時(shí),卷積核conv1提取的特征值作為conv2卷積核輸入進(jìn)一步進(jìn)行特征提取。當(dāng)模型損失值穩(wěn)定時(shí),conv4卷積核的特征值更接近于真實(shí)樣本。坐標(biāo)(conv4,10 000)為最優(yōu)生成網(wǎng)絡(luò)下得到的生成樣本灰度圖。同時(shí)將WDCGAN生成數(shù)據(jù)灰度圖和圖5(b)中對(duì)應(yīng)故障模式真實(shí)樣本進(jìn)行對(duì)比可知,文章所提模型生成數(shù)據(jù)更接近于真實(shí)樣本。
圖5 Transfer-WDCGAN生成器特征提取過程
利用上節(jié)的數(shù)據(jù)增強(qiáng)模型對(duì)電靜壓伺服機(jī)構(gòu)7類信號(hào)進(jìn)行數(shù)據(jù)增強(qiáng),試驗(yàn)數(shù)據(jù)樣本形狀為250×7的矩陣。按照故障種類和堵塞程度將故障劃分為正常、輕微堵塞、嚴(yán)重堵塞、輕微漏氣、嚴(yán)重漏氣五種故障類型。分別對(duì)每種故障樣本進(jìn)行數(shù)據(jù)增強(qiáng),每個(gè)故障樣本數(shù)據(jù)增強(qiáng)后為1 000組。選取4類具有代表性特征信號(hào)對(duì)Transfer-WDCGAN與WDCGAN的生成結(jié)果進(jìn)行對(duì)比,如圖6所示。
圖6 Transfer-WDCGAN與WDCGAN生成信號(hào)對(duì)比結(jié)果
從圖6可知,發(fā)生故障時(shí),4類信號(hào)之間均發(fā)生不同程度響應(yīng),當(dāng)發(fā)生油濾堵塞故障時(shí),圖6(c)作動(dòng)器腔室壓力發(fā)生明顯變化,Transfer-WDCGAN生成結(jié)果雖然發(fā)生震蕩,但總體趨勢相比于WDCGAN更加吻合。電機(jī)作為系統(tǒng)動(dòng)力來源,當(dāng)發(fā)生故障時(shí),從圖6(a)電機(jī)電壓信號(hào)來看,0.3 s~0.5 s內(nèi)WDCGAN生合成數(shù)據(jù)與真實(shí)樣本有較為明顯的差別。圖6(d)作動(dòng)器速度作為EHA性能參數(shù),當(dāng)發(fā)生故障時(shí)也發(fā)生明顯變化。從圖6特征信號(hào)局部放大圖來看,Transfer-WDCGAN生成樣本變化幅度較小,更接近于真實(shí)樣本。另外,從圖6(b)位移信號(hào)也可以看出,WDCGAN生成數(shù)據(jù)在0.3 s~0.4 s內(nèi)相比于真實(shí)數(shù)據(jù)差別較為明顯。
綜合上述分析可知,當(dāng)發(fā)生故障時(shí),圖6的4類信號(hào)特征變化趨勢中Transfer-WDCGAN生成結(jié)果相對(duì)于真實(shí)數(shù)據(jù)波動(dòng)較小,更接近于真實(shí)數(shù)據(jù)。
為了更好地評(píng)估Transfer-WDCGAN模型的優(yōu)越性,引入MMD距離(Maximum Mean Discrepancy)來度量生成數(shù)據(jù)與真實(shí)數(shù)據(jù)的距離,距離越近則表示生成數(shù)據(jù)特征越接近于真實(shí)樣本。MMD的計(jì)算需要引入核函數(shù),這里采用高斯核函數(shù),實(shí)現(xiàn)低維空間到高維空間的轉(zhuǎn)換,同時(shí)又能從低維空間計(jì)算高維點(diǎn)積,定義如式(3):
MMD距離計(jì)算公式定義為:
式中:pr,pg分別代表真實(shí)數(shù)據(jù)和生成數(shù)據(jù)分布。根據(jù)式(4),分別計(jì)算出兩種模型與真實(shí)數(shù)據(jù)在五種故障模式下的MMD距離,如圖7所示。選取故障診斷模型分類結(jié)果對(duì)WDCGAN和Transfer-WDCGAN兩種模型生成數(shù)據(jù)進(jìn)行評(píng)價(jià)。
圖7 生成數(shù)據(jù)與真實(shí)數(shù)據(jù)MMD距離對(duì)比結(jié)果
當(dāng)計(jì)算MMD距離時(shí),每次抽樣個(gè)數(shù)為1。由式(4)可知,當(dāng)pr和pg分布相同時(shí),即生成樣本與真是樣本服從同一分布,則D(pr,pg)值將變?yōu)?。由此可知,MMD距離越接近于0,表示生成樣本與真實(shí)樣本越接近。從圖7可看出,在五種故障模式下,Transfer-WDCGAN模型生成數(shù)據(jù)的MMD距離均小于WDCGAN模型,其結(jié)果表明Transfer-WDCGAN生成數(shù)據(jù)更接近于真實(shí)數(shù)據(jù)。
綜上所述,從生成數(shù)據(jù)與真實(shí)數(shù)據(jù)MMD距離以及7類信號(hào)生成圖像兩方面對(duì)比可以看出,文章所提模型生成樣本特征結(jié)果優(yōu)于WDCGAN??紤]文章最終目的是以生成數(shù)據(jù)為基礎(chǔ),訓(xùn)練故障診斷模型,提高診斷結(jié)果準(zhǔn)確率,并緩解過擬合問題,因此,文章另選取Transfer-WDCGAN和WDCGAN兩種模型數(shù)據(jù)集,同時(shí)把試驗(yàn)數(shù)據(jù)作為驗(yàn)證集,去衡量診斷模型的泛化能力。采用BP、SDAE(Stacked Denoising AutoEncoder)、InceptionCNN、DRSN(Deep Residual Shrinkage Networks)、SAE、CNN六種診斷模型對(duì)兩種數(shù)據(jù)集進(jìn)行評(píng)價(jià)。最終從真實(shí)數(shù)據(jù)和測試數(shù)據(jù)兩種結(jié)果去評(píng)價(jià)數(shù)據(jù)增強(qiáng)模型。五種故障類別標(biāo)簽如表1所示。
表1 故障類別標(biāo)簽
在試驗(yàn)過程中,對(duì)故障診斷模型參數(shù)多次調(diào)優(yōu)后,選取20次診斷結(jié)果并取平均值,用F1-score,Kappa,Accuracy對(duì)診斷結(jié)果進(jìn)行評(píng)價(jià)。評(píng)價(jià)指標(biāo)計(jì)算公式如表2。
表2 診斷結(jié)果評(píng)價(jià)指標(biāo)
根據(jù)表2的評(píng)價(jià)指標(biāo),選取Transfer-WDCGAN與WDCGAN兩種模型數(shù)據(jù)集和6種故障診斷模型,各個(gè)指標(biāo)分析結(jié)果如圖8。
從圖8看出,在6種故障診斷模型中Transfer-WDCGAN-SDAE組合模型表現(xiàn)最好,評(píng)價(jià)指標(biāo)結(jié)果相對(duì)集中,表明診斷模型更加穩(wěn)定。在測試集中三種評(píng)價(jià)指標(biāo)均值如表3。
圖8 測試集各指標(biāo)評(píng)價(jià)結(jié)果對(duì)比
結(jié)合表3測試集中評(píng)價(jià)指標(biāo)均值結(jié)果可以看出,在Transfer-WDCGAN數(shù)據(jù)增強(qiáng)模型中,各故障診斷結(jié)果評(píng)價(jià)指標(biāo)表現(xiàn)整體優(yōu)于WDCGAN,尤其是Transfer-WDCGAN-SDAE模型,在所有故障診斷模型中表現(xiàn)最好。在Transfer-WDCGAN數(shù)據(jù)集中,故障診斷結(jié)果特征圖如圖9所示。
圖9 Transfer-WDCGAN數(shù)據(jù)集故障診斷模型特征散點(diǎn)圖
表3 測試數(shù)據(jù)集診斷結(jié)果指標(biāo)均值對(duì)比
從圖中分析可以看出,在Transfer-WDCGAN生成數(shù)據(jù)中,SDAE故障診斷模型代表五種故障模式的顏色之間區(qū)分比較明顯,并且單個(gè)故障模式顏色相對(duì)集中,一方面由于SDAE是多個(gè)降噪自編碼器(Denoising Auto-Encoder,DAE)堆疊而成的特征提取器,并在模型輸入層中加入噪音,使得模型更具有魯棒性;另一方面采用“無監(jiān)督學(xué)習(xí)+有監(jiān)督微調(diào)”的訓(xùn)練方法,使其特征提取能力更強(qiáng),能更好地區(qū)分不同故障模式的特征量。而在其他故障診斷模型中,雖然五種故障模式顏色有區(qū)別,但出現(xiàn)了重合,這表明其他故障診斷模型不能很好地挖掘數(shù)據(jù)之間的特征量。因此,結(jié)合以上分析可得,在測試集中最優(yōu)組合模型為Transfer-WDCGANSDAE。若僅從測試集中衡量數(shù)據(jù)增強(qiáng)模型和故障故障診斷模型組合的優(yōu)劣,無法看出組合模型的泛化能力。因此,將15組真實(shí)數(shù)據(jù)作為驗(yàn)證集代入故障診斷模型同樣進(jìn)行20次故障診斷,結(jié)果如圖10所示。
從圖10可以看出,在6種故障診斷模型中,SDAE三種指標(biāo)結(jié)果比較集中并且均值優(yōu)于其他5種故障診斷模型,3種指標(biāo)均值見表4。從表中可以看出,故障診斷模型在Transfer-WDCGAN數(shù)據(jù)集下三種評(píng)價(jià)指標(biāo)均值都優(yōu)于WDCGAN數(shù)據(jù)集,這說明故障診斷模型經(jīng)過Transfer-WDCGAN生成數(shù)據(jù)訓(xùn)練后,其故障類型識(shí)別能力優(yōu)于WDCGAN生成數(shù)據(jù)。尤其是最優(yōu)故障診斷模型SDAE其準(zhǔn)確率由79%提高到了90%,故障診斷準(zhǔn)確率明顯提高。
圖10 真實(shí)數(shù)據(jù)集各指標(biāo)結(jié)果對(duì)比
表4 真實(shí)數(shù)據(jù)集各指標(biāo)均值對(duì)比結(jié)果
文章以電靜壓伺服機(jī)構(gòu)為研究對(duì)象,研究了小樣本情況下將遷移學(xué)習(xí)與數(shù)據(jù)增強(qiáng)技術(shù)結(jié)合對(duì)樣本進(jìn)行數(shù)據(jù)增強(qiáng),并以增強(qiáng)后的數(shù)據(jù)集進(jìn)行故障診斷,采用6種深度學(xué)習(xí)故障診斷模型對(duì)增強(qiáng)后樣本進(jìn)行故障診斷,得出以下結(jié)論:
(1)對(duì)電靜壓伺服機(jī)構(gòu)小樣本數(shù)據(jù)增強(qiáng)模型進(jìn)一步優(yōu)化,通過生成數(shù)據(jù)特征信號(hào)變化趨勢分析和故障診斷結(jié)果均值結(jié)果兩方面對(duì)比發(fā)現(xiàn),文章所提模型表優(yōu)于WDCGAN。
(2)從故障診斷模型在測試集和驗(yàn)證集準(zhǔn)確率可看出,文章所提模型很好地緩解了故障診斷模型出現(xiàn)的過擬合現(xiàn)象,提高了故障診斷模型的準(zhǔn)確率。其中,SDAE故障診斷模型準(zhǔn)確率由79%提高到了90%。
(3)通過測試集與驗(yàn)證集故障診斷結(jié)果得出,文章最優(yōu)組合模型均為Transfer-WDCGAN-SDAE。解決了因真實(shí)數(shù)據(jù)樣本量少導(dǎo)致的試驗(yàn)過程中真實(shí)數(shù)據(jù)集與測試集最優(yōu)組合模型結(jié)果不一致問題。