吳春志, 馮輔周, 吳守軍, 陳湯, 江鵬程
(陸軍裝甲兵學(xué)院 車輛工程系, 北京 100072)
行星傳動(dòng)機(jī)構(gòu)具有體積小、重量輕、傳動(dòng)比大、承載能力強(qiáng)、傳動(dòng)效率高等諸多優(yōu)點(diǎn),廣泛應(yīng)用于直升機(jī)主減速器、艦船、自行火炮、飛機(jī)、裝甲車輛等軍用裝備中[1-2]。在實(shí)際運(yùn)行過程中,行星傳動(dòng)機(jī)構(gòu)承受動(dòng)態(tài)重載,運(yùn)行環(huán)境復(fù)雜多變,導(dǎo)致太陽齒輪,行星齒輪,齒圈等關(guān)鍵部件容易發(fā)生故障。這些故障如果不能被及時(shí)排除,將會(huì)導(dǎo)致嚴(yán)重的安全事故[3]。
設(shè)計(jì)故障診斷分類模型時(shí),各個(gè)故障狀態(tài)的樣本數(shù)量通常保持一致,而在真正的應(yīng)用環(huán)境中,類別分布并不均衡,故障數(shù)據(jù)往往相對(duì)較少。當(dāng)數(shù)據(jù)集不均衡時(shí),傳統(tǒng)的分類器通常偏向大多數(shù)類,因此無法正確地對(duì)少數(shù)類進(jìn)行分類,當(dāng)訓(xùn)練數(shù)據(jù)高度不平衡時(shí),甚至可能無法檢測(cè)到少數(shù)類。處理樣本不均衡問題有3種主要方法:第1種是修改或者創(chuàng)建一種新的算法,加強(qiáng)對(duì)少數(shù)群體的學(xué)習(xí);第2種方法是在數(shù)據(jù)或算法級(jí)別使用代價(jià)敏感算法,以便最大限度地降低誤差;第3種也是更通用的方法是通過欠采樣、過采樣或混合方法重新平衡類分布,從而在數(shù)據(jù)級(jí)別進(jìn)行修改[4]。在少量故障樣本下的行星齒輪箱故障診斷中,研究人員通常采用的是第1種方法。楊宇等[5]提出了一種基于增量半監(jiān)督(VPMCD)的故障診斷方法,該方法可以在小診斷樣本的情況下對(duì)齒輪故障模式進(jìn)行分類。Yang等[6]應(yīng)用經(jīng)驗(yàn)?zāi)B(tài)分解算法提取故障特征,并采用支持向量機(jī)(SVM)對(duì)小樣本情況下的齒輪故障進(jìn)行分類。在故障樣本少的條件下,SVM和灰色模型常用作故障診斷算法[7-8]。然而這些方法在對(duì)特定對(duì)象進(jìn)行故障特征提取的同時(shí)還要在模式識(shí)別算法上做相適應(yīng)的改變,無法滿足更多更復(fù)雜情況下的診斷需求。
深度學(xué)習(xí)以其無需人工經(jīng)驗(yàn)選取可自動(dòng)學(xué)習(xí)特征的特點(diǎn)逐漸成為解決此類問題的最佳選擇。2014年,Goodfellow等[9]提出了生成式對(duì)抗網(wǎng)絡(luò)(GAN),它可以生成高分辨率的真實(shí)感圖像,在此基礎(chǔ)上又逐漸演變出深度卷積生成對(duì)抗網(wǎng)絡(luò)(DCGAN)、Wassertein 生成對(duì)抗網(wǎng)絡(luò)(WGAN)、條件生成對(duì)抗網(wǎng)絡(luò)(CGAN)等百余種變體算法。通過這些算法可以擴(kuò)展故障集,實(shí)現(xiàn)樣本均衡。
本文重點(diǎn)研究過采樣技術(shù)用以解決樣本不均衡下行星傳動(dòng)機(jī)構(gòu)的故障診斷問題。使用改進(jìn)的Wasserstein生成式對(duì)抗網(wǎng)絡(luò)構(gòu)造樣本生成模型,與GAN相比確保了訓(xùn)練的穩(wěn)定性和生成樣本的多樣性,再通過卷積神經(jīng)網(wǎng)絡(luò)(CNN)進(jìn)行故障分類識(shí)別。為了評(píng)估WGAN算法,在加州大學(xué)歐文分校(UCI)人工數(shù)據(jù)集上對(duì)所提方法和其他過采樣方法進(jìn)行對(duì)比分析,然后在某型坦克行星變速箱故障試驗(yàn)臺(tái)上進(jìn)行驗(yàn)證。
CNN是由哺乳動(dòng)物視覺皮層細(xì)胞感受野啟發(fā)而建立的一種前饋神經(jīng)網(wǎng)絡(luò),現(xiàn)在已經(jīng)是圖片和視頻識(shí)別領(lǐng)域應(yīng)用最為廣泛的方法。一個(gè)傳統(tǒng)的CNN模型如圖1所示,由一個(gè)輸入層,兩組交替出現(xiàn)的卷積層和池化層,以及全連接層組成。卷積層中每一個(gè)特征圖都對(duì)應(yīng)一個(gè)卷積核,這些卷積核通過一組權(quán)重來卷積前一層的輸入并組成一組特征輸出,成為下一層的輸入。與傳統(tǒng)濾波器需要人工設(shè)定參數(shù)不同,CNN的權(quán)值和偏置通過反向傳播(BP)算法進(jìn)行訓(xùn)練。池化層主要是為了實(shí)現(xiàn)兩個(gè)目的:一是大幅減少輸入卷積層的空間維度,使權(quán)重參數(shù)減少75%,從而降低計(jì)算成本;二是控制過擬合,使測(cè)試集準(zhǔn)確度更接近訓(xùn)練集準(zhǔn)確度。主流的池化方式有最大值池化、平均池化、L2-norm池化。經(jīng)過兩組卷積層和池化層后,會(huì)接一個(gè)全連接層。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)類似,全連接層可以應(yīng)用到不同的分類模型。全連接層后接一個(gè)隱藏層,最后由Softmax回歸層完成分類。CNN以其出色的特征自動(dòng)提取并分類的能力受到廣大研究人員的青睞,在機(jī)械故障診斷領(lǐng)域得到了廣泛的應(yīng)用[10-11],本文所用模式識(shí)別方法統(tǒng)一采用CNN,與傳統(tǒng)方法對(duì)比可見文獻(xiàn)[10-11]。
圖1 典型卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.1 Typical convolutional neural network structure
在GAN誕生之前,非監(jiān)督學(xué)習(xí)的基本思想是根據(jù)數(shù)據(jù)集估計(jì)樣本的分布p(x),然后對(duì)p(x)進(jìn)行采樣,生成與樣本分布類似的新樣本,這種方法難以解決高維樣本的生成問題。GAN作為非監(jiān)督深度學(xué)習(xí)的代表,創(chuàng)造性地提出了生成器G和判別器D. 生成器G學(xué)習(xí)樣本x的分布pd,并從噪聲數(shù)據(jù)z中生成新樣本G(z)得到生成樣本分布pg,G(z)通過訓(xùn)練自己,希望以假亂真,讓判別器D判別不出到底哪個(gè)是真、哪個(gè)是假。而判別器D獨(dú)自訓(xùn)練自己,希望能分辨出真實(shí)的數(shù)據(jù)分布和生成器G(z)給的數(shù)據(jù)分布。二者進(jìn)行博弈從而優(yōu)化模型,GAN的目標(biāo)函數(shù)loss可以描述為
(1)
式中:Ex~pd和Ex~pg是期望值;Ex~pd[lgD(x)]表示樣本x分布pd的對(duì)數(shù)損失函數(shù),最大化這一項(xiàng)意味著D(x)→1;Ex~pg[lg(1-D(G(z)))]則是根據(jù)從噪聲數(shù)據(jù)z生成樣本分布pg構(gòu)建的對(duì)數(shù)損失函數(shù),最小化這一項(xiàng)意味著D(G(z))→0.
圖2 WGAN-CNN結(jié)構(gòu)圖Fig.2 Structure of WGAN-CNN
在訓(xùn)練GAN模型時(shí),先固定G再訓(xùn)練D,使得D的準(zhǔn)確率達(dá)到最大;然后再固定D,訓(xùn)練G,使得D的準(zhǔn)確率達(dá)到最小。當(dāng)且僅當(dāng)pd=pg時(shí)達(dá)到全局最優(yōu)解,也就是從噪聲中生成的數(shù)據(jù)分布和真實(shí)樣本分布基本達(dá)到一致。
為了解決梯度消失的問題,Arjovsky等提出了WGAN,引入了Wasserstein距離,由于其相對(duì)Kullback-Leibler散度與Jensen-Shannon散度具有優(yōu)越的平滑特性,理論上可以解決梯度消失的問題。在WGAN中最后的目標(biāo)函數(shù)loss可以描述為
(2)
將圖1中所示模型優(yōu)化為圖2右側(cè)部分所示的一維CNN模型。優(yōu)化后的模型由輸入層、CNN層組(由卷積層和池化層組成)、全連接層、輸出層組成。其中CNN層組可以根據(jù)所需分類數(shù)據(jù)的復(fù)雜度增加或減少,本模型使用2個(gè)CNN層組。第1個(gè)CNN層組中卷積核數(shù)量為N1,第2個(gè)CNN層組中卷積核數(shù)量為N2,相應(yīng)卷積核的權(quán)值向量和偏置值分別為W和b,激活函數(shù)采用修正線性單元ReLU.
(3)
(4)
(5)
第2個(gè)CNN層的輸出為
(6)
CNN訓(xùn)練的目的是為了使最終的損失達(dá)到最小,模型采用的損失函數(shù)為交叉熵,優(yōu)化器選用AdamOptimizer. 對(duì)于不均衡樣本的分類問題,首先采用WGAN對(duì)少數(shù)類樣本進(jìn)行生成(見圖2左側(cè)部分),再結(jié)合CNN進(jìn)行分類識(shí)別。
為了測(cè)試WGAN在處理樣本不均衡問題中的效果,本節(jié)將使用8個(gè)經(jīng)典的UCI人工數(shù)據(jù)集,人為減少某一類的樣本數(shù)量構(gòu)成不同不均衡比例(IR)的數(shù)據(jù)集,并與其他傳統(tǒng)的過采樣方法進(jìn)行對(duì)比,使用CNN方法來分類識(shí)別。通過計(jì)算調(diào)和平均值Fe、幾何平均值Gm以及AUC作為過采樣算法的評(píng)價(jià)指標(biāo)。
過采樣為的是增加少數(shù)類樣本,最直接的方法是對(duì)樣本進(jìn)行隨機(jī)復(fù)制,但重復(fù)的樣本會(huì)造成過擬合,為了解決這個(gè)問題,一種隨機(jī)生成無重復(fù)少數(shù)類樣本的樣本生成技術(shù)(SMOTE)方法[12]應(yīng)運(yùn)而生,沿著連接少數(shù)類樣本的線段生成合成樣本,數(shù)據(jù)生成過程的直接方法是使用捕獲實(shí)際數(shù)據(jù)分布的生成模型。接著一些SMOTE的變體方法也被提出來用以改進(jìn)SMOTE的過生成問題。Bunkhumpornpat等[13]提出Safe-level SMOTE方法生成的少數(shù)類樣本在“安全層”以內(nèi),避免了樣本重復(fù)。Han等[14]提出Borderline-SMOTE方法識(shí)別分類邊界的少數(shù)類樣本并進(jìn)行過采樣,提高了邊界樣本的識(shí)別率。對(duì)于類內(nèi)有多個(gè)簇的樣本,Cieslak等[15]提出了Cluster-SMOTE,首先使用k-means算法將少數(shù)類聚類成m個(gè)子聚類,然后將SMOTE方法應(yīng)用于每個(gè)子聚類。
如表1混淆矩陣所示,在二分類問題中,測(cè)試精確度Precision、召回率Recall、Fe、Gm分別為
(7)
(8)
(9)
(10)
式中:FN表示被判定為負(fù)樣本,但事實(shí)上是正樣本;FP表示被判定為正樣本,但事實(shí)上是負(fù)樣本;TN表示被判定為負(fù)樣本,事實(shí)上也是負(fù)樣本;TP表示被判定為正樣本,事實(shí)上也是正樣本;Precision表示的是預(yù)測(cè)為正的樣本中有多少是真正的樣本;Recall表示樣本中的正例有多少被預(yù)測(cè)正確了;β為調(diào)和參數(shù),一般取1.Gm考慮了分類的正確率,如果分類器忽略少數(shù)類并且有利于多數(shù)類,則分類器將獲得較低的Gm;AUC是受試者工作特征(ROC)圖下的區(qū)域,對(duì)二類的分布不敏感,這使得它適合作為不平衡問題的分類性能指標(biāo)。
表1 混淆矩陣表
通過繪制真陽性率(TPR)與假陽性率(FPR)之間的關(guān)系來獲得ROC圖,定義為
(11)
式中:Np是少數(shù)類數(shù)量;NN是多數(shù)類數(shù)量。
對(duì)于多分類情況,可以將多分類問題拆分成多個(gè)二分類問題,將所得到的多個(gè)二分類指標(biāo)Fe、Gm以及AUC求幾何平均值后得到最終的分類評(píng)價(jià)指標(biāo)Fa、Ga、AUCa.
從經(jīng)典的UCI人工數(shù)據(jù)集中選出8個(gè)常用數(shù)據(jù)集,如表2所示。其中數(shù)據(jù)集1、6、7是多分類問題,其余是二分類問題,數(shù)據(jù)集1~3、6、7中少數(shù)類是由原樣本中隨機(jī)選出產(chǎn)生的,造成從1∶1.38~1∶6不同的IR. 然后采用隨機(jī)復(fù)制(Random)、SMOTE、Borderline-SMOTE、Cluster SMOTE、Safe_level SMOTE、WGAN 6種過采樣方法對(duì)少數(shù)類進(jìn)行過采樣,最后經(jīng)過CNN分類并計(jì)算Fa、Ga、AUCa. 對(duì)每種數(shù)據(jù)集所得到的每類評(píng)價(jià)指標(biāo)進(jìn)行1~6的排名,求得排名的平均值表如表3所示。從表3中可以看出,WGAN相對(duì)于其他5種過采樣方法,在UCI人工數(shù)據(jù)集上的分類表現(xiàn)最好。雖然WGAN模型在訓(xùn)練階段學(xué)習(xí)樣本構(gòu)造生成模型時(shí)用時(shí)相對(duì)較長,一旦模型訓(xùn)練完畢,則可以源源不斷地帶來所需樣本,此時(shí)的樣本生成時(shí)間可忽略不計(jì)。
表2 所選UCI數(shù)據(jù)集的詳細(xì)信息表
表3 過采樣方法評(píng)價(jià)指標(biāo)排名平均值表
某型坦克行星變速箱故障模擬試驗(yàn)臺(tái)實(shí)物圖如圖3所示。試驗(yàn)臺(tái)機(jī)械傳動(dòng)裝置由變頻電動(dòng)機(jī)、變頻器柜、錐齒輪傳動(dòng)箱、行星變速箱、轉(zhuǎn)速轉(zhuǎn)矩儀、加載發(fā)電機(jī)等組成。電機(jī)輸出經(jīng)變頻柜調(diào)節(jié)后的轉(zhuǎn)速及扭矩,動(dòng)力經(jīng)錐齒輪傳動(dòng)箱輸入到行星變速箱內(nèi)。錐齒輪傳動(dòng)箱的作用是改變力的傳遞方向,使試驗(yàn)臺(tái)整體合理布置。行星變速箱兩側(cè)的輸出端與轉(zhuǎn)速轉(zhuǎn)矩儀相連,使用發(fā)電機(jī)對(duì)其進(jìn)行加載,液壓站負(fù)責(zé)對(duì)行星變速箱提供潤滑油壓及換擋壓力。實(shí)驗(yàn)設(shè)置兩種故障狀態(tài),分別是K3排的太陽輪斷齒故障(齒數(shù)為30的太陽輪故障,簡(jiǎn)稱Z30)以及與太陽輪嚙合的行星輪斷齒故障(齒數(shù)為15的行星輪故障,簡(jiǎn)稱Z15),斷齒故障設(shè)置如圖4所示。
圖3 行星變速箱故障模擬試驗(yàn)臺(tái)Fig.3 Fault simulation test rig for planetary gearbox
圖4 齒輪故障設(shè)置Fig.4 Gear failure setting
測(cè)試系統(tǒng)裝置包括主控平臺(tái)、32通道信號(hào)采集儀、振動(dòng)傳感器和相應(yīng)的數(shù)據(jù)線。通過主控平臺(tái)控制行星變速箱故障模擬試驗(yàn)臺(tái)的啟停、轉(zhuǎn)速調(diào)節(jié)、加載扭矩等工程,采用相應(yīng)的數(shù)據(jù)采集軟件實(shí)現(xiàn)對(duì)信號(hào)采集儀的通道設(shè)置。采樣頻率為20 kHz,采樣時(shí)間30 s,選用的四檔、工況為轉(zhuǎn)速1 500 r/min、負(fù)載900 N·m的數(shù)據(jù)為測(cè)試數(shù)據(jù),每種狀態(tài)的時(shí)域圖如圖5所示。由于時(shí)域信號(hào)采樣頻率高,同一周期內(nèi)點(diǎn)數(shù)較多且規(guī)律性不明顯,因此對(duì)截取的多段時(shí)域信號(hào)樣本做傅里葉變換,用頻譜信號(hào)作為訓(xùn)練集樣本。文獻(xiàn)[10]指出頻譜信號(hào)相較于振動(dòng)信號(hào)直接作訓(xùn)練樣本,在應(yīng)用CNN時(shí)能得到更高的準(zhǔn)確率。
圖5 振動(dòng)信號(hào)時(shí)域圖Fig.5 Vibration signals
為了直觀地了解在不同IR下CNN對(duì)樣本的分類情況,分別取Z15訓(xùn)練集數(shù)量為30、120、600組進(jìn)行CNN訓(xùn)練,模型結(jié)構(gòu)參數(shù)如表4所示。將所有測(cè)試樣本經(jīng)過CNN模型的中間層時(shí)得到的特征向量作t分布領(lǐng)域嵌入算法(t-SNE)計(jì)算,降維后得到3個(gè)維度的特征,分別為特征值1、特征值2、特征值3,展示如圖6所示。從圖6中可以直觀地看到,當(dāng)IR為1∶20時(shí),正常狀況和Z15斷齒基本上沒有分開,當(dāng)IR逐漸降低時(shí),3種狀況被很好地分開。
表4 訓(xùn)練集數(shù)量及CNN結(jié)構(gòu)參數(shù)
圖6 不同IR分類散點(diǎn)圖Fig.6 Different IR classification scatter plots
由于在臺(tái)架試驗(yàn)中可以得到足夠多的樣本,為了模擬實(shí)際操作中某個(gè)故障樣本稀少的情況,將Z15斷齒故障樣本取30組,其余樣本取600組,而測(cè)試樣本都為400組。以30組樣本作為WGAN的訓(xùn)練集(結(jié)構(gòu)參數(shù)見表4),訓(xùn)練生成模型,生成的樣本如圖7所示。從圖7中可以看出,生成的頻譜圖對(duì)于頻率幅值較低的部分生成得不夠細(xì)致,但是對(duì)于頻譜圖幅值較高的部分還原得較好,在整體上基本上反應(yīng)了原始樣本的特征,可以作為原始樣本的擴(kuò)展樣本。
圖7 WGAN生成振動(dòng)信號(hào)頻譜和原信號(hào)頻譜對(duì)比圖Fig.7 Spectra of WGAN vibration signal and original signal
圖8 不同IR下評(píng)價(jià)指標(biāo)變化曲線 Fig.8 Evaluation indexes of different IRs
為了證明WGAN生成頻譜樣本的有效性,全部以生成樣本構(gòu)造訓(xùn)練集,以原始樣本作為測(cè)試集進(jìn)行實(shí)驗(yàn)。不同過采樣方法對(duì)Z15的單個(gè)類別統(tǒng)計(jì)如表5所示。由于同一狀態(tài)不同樣本的幅值譜較為接近,因此采用Random可以得到相對(duì)較好的結(jié)果,而WGAN表現(xiàn)最好。選取Z15斷齒故障作為少數(shù)類,在不同IR下,分別計(jì)算Z15單個(gè)類別的Fe、Gm、AUC、Precision、Recall以及整體的Fa、Ga、AUCa、Precision、Recall,如圖8所示。隨著IR降低,除Precision外,Z15的評(píng)價(jià)指標(biāo)逐漸接近平均值,并在在IR達(dá)到1∶2以上時(shí),評(píng)價(jià)指標(biāo)接近1,這說明故障樣本的不均衡嚴(yán)重影響了分類器的判斷,也說明了WGAN生成的樣本的有效性,在IR等于1時(shí),分類各個(gè)指標(biāo)達(dá)到了100%. 同時(shí)通過對(duì)比Z15的Precision和Recall隨IR的變化情況可知,對(duì)于不均衡樣本的分類評(píng)價(jià),單純求Precision容易陷入誤區(qū),應(yīng)考慮其他評(píng)價(jià)指標(biāo)做綜合評(píng)判。
表5 過采樣方法對(duì)Z15測(cè)試結(jié)果統(tǒng)計(jì)表
本文針對(duì)在實(shí)際運(yùn)行過程中行星變速箱故障樣本不均衡的問題,提出了使用WGAN-CNN算法作為不平衡數(shù)據(jù)的故障診斷分類方法,同時(shí)將二分類評(píng)價(jià)指標(biāo)擴(kuò)展到多分類問題中。經(jīng)過8個(gè)經(jīng)典的UCI人工數(shù)據(jù)集以及樣本不均衡下行星變速箱齒輪故障實(shí)驗(yàn),得到如下結(jié)論:
1) 在8個(gè)人工數(shù)據(jù)集上采用Random、SMOTE、Borderline-SMOTE、Cluster SMOTE、Safe_level SMOTE 5種常用的過采樣算法和WGAN算法進(jìn)行比較,WGAN算法在Fa、Ga、AUCa上的平均排名最高、效果最好。
2) 設(shè)置Z15故障頻譜信號(hào)為少數(shù)類樣本,采用WGAN-CNN模型對(duì)行星變速箱進(jìn)行故障診斷。通過對(duì)比不同IR下行星變速箱的分類情況以及評(píng)價(jià)指標(biāo)變化情況,驗(yàn)證了樣本不均衡問題會(huì)嚴(yán)重影響模型的分類結(jié)果,同時(shí)表明模型生成的頻譜信號(hào)基本上反應(yīng)了原始樣本的特征,可以作為原始樣本的擴(kuò)展樣本,解決了故障樣本不均衡問題。