蔣 兆,馬義中
(南京理工大學(xué) 經(jīng)濟管理學(xué)院,江蘇 南京 210094)
近年來,遷移學(xué)習(xí)作為機器學(xué)習(xí)的重要分支開始興起并得到廣泛關(guān)注[1]。傳統(tǒng)機器學(xué)習(xí)實現(xiàn)故障的分類與檢測需要滿足兩個前提條件:①訓(xùn)練樣本與測試樣本服從獨立同分布;②在足夠多的訓(xùn)練樣本數(shù)據(jù)下訓(xùn)練模型[2-3]。但因環(huán)境因素等影響,現(xiàn)實的工況環(huán)境往往無法滿足上述條件[4-7],如,不同工況下數(shù)據(jù)分布不相同導(dǎo)致訓(xùn)練模型的泛化能力不理想[8];故障樣本數(shù)量有限導(dǎo)致故障類型識別時發(fā)生誤診情況[9-11]。實際應(yīng)用表明,支持向量機(Support Vector Machines,SVM)可通過核函數(shù)變換實現(xiàn)高維特征空間上的線性可分[12-13]。此外,為了突破傳統(tǒng)機器學(xué)習(xí)方法的局限性,遷移成分分析(Transfer Component Analysis,TCA)被廣泛地應(yīng)用于故障分類中[14-17]。TCA能夠減小不同領(lǐng)域數(shù)據(jù)分布的差異性,提高跨領(lǐng)域的學(xué)習(xí)能力,其主要思想是將源域知識遷移到目標(biāo)域,以達(dá)到目標(biāo)域分類的目的[18-22]。
近年來,TCA方法的知識遷移能力被應(yīng)用到故障分類、監(jiān)控與診斷等領(lǐng)域。例如,XIE等[23]將TCA方法應(yīng)用在變速齒輪箱故障分類中;段禮祥等[24]應(yīng)用TCA方法減小訓(xùn)練樣本與測試樣本的差異性,提高故障分類的準(zhǔn)確性。沈飛等[25]通過應(yīng)用TCA方法提取樣本特征來提高電機故障分類的準(zhǔn)確度。但TCA方法進(jìn)行故障診斷時需要大量帶標(biāo)簽的樣本數(shù)據(jù)來訓(xùn)練分類器,而對實際生產(chǎn)中所產(chǎn)生的實時數(shù)據(jù)進(jìn)行人為標(biāo)簽的成本高且不確定性大。由于工況的復(fù)雜性,數(shù)據(jù)的分布差異巨大,帶標(biāo)簽樣本并不一定適用于最新產(chǎn)生的數(shù)據(jù),以此訓(xùn)練出來的分類器更是難以滿足需求[26-27]。而且監(jiān)測數(shù)據(jù)通常只有少量可以與目標(biāo)域數(shù)據(jù)相匹配的標(biāo)簽數(shù)據(jù),這將嚴(yán)重影響特征遷移的效率[28]。因此,本文提出無監(jiān)督遷移成分分析(Unsupervised Transfer Component Analysis,UTCA),其核心思想是通過設(shè)置核函數(shù),將兩個樣本集的特征映射到同一個核空間中,最小化領(lǐng)域之間的數(shù)據(jù)分布距離。在特征映射時無需考慮樣本標(biāo)注信息,能夠有效提高特征遷移效率,降低人為標(biāo)注的不確定性。UTCA方法的難點在于如何度量這兩個領(lǐng)域間的分布距離,對此目前主要方法有Bregman差異[29]、基于熵的Kullback-Leibler差異[30]和最大均值差異(Maximum Mean Discrepancy,MMD)[31]。由于Bregman差異通過梯度下降方法來求解目標(biāo)函數(shù),計算比較復(fù)雜,而基于熵的Kullback-Leibler差異先驗概率密度很難計算。MMD因其計算簡單而獲得了廣泛應(yīng)用。如PAN等[32]提出將MMD與主成分分析相結(jié)合,嘗試通過減少數(shù)據(jù)分布差異來提高分類的準(zhǔn)確度。LONG等[33]提出基于MMD的TCA分析方法并應(yīng)用于風(fēng)機故障分類中,獲得了比較好的分類效果。
為解決因源域和目標(biāo)域數(shù)據(jù)存在分布差異及故障樣本缺乏,影響故障分類準(zhǔn)確度的問題,本文將UTCA和SVM兩種算法相結(jié)合,提出一種新的故障診斷方法。該方法主要由特征提取和故障狀態(tài)分類兩個部分組成,首先利用UTCA方法引入MMD來度量源域和目標(biāo)域數(shù)據(jù)分布的差異,實現(xiàn)域間數(shù)據(jù)分布近似相同,進(jìn)而獲得故障診斷分類特征。在故障狀態(tài)分類方面,由于SVM在解決小樣本,非線性問題時表現(xiàn)出優(yōu)異的性能,本文將SVM作為故障狀態(tài)分類器來提高故障狀態(tài)分類的準(zhǔn)確率,并通過凱斯西儲大學(xué)(Case Western Reserve University,CWRU)實驗室所采集的滾動軸承實驗數(shù)據(jù)作為實驗對象,驗證所提方法的有效性。
本文提出了基于UTCA和SVM的分類方法,首先利用UTCA將源領(lǐng)域和目標(biāo)領(lǐng)域映射到再生核希爾伯特空間并進(jìn)行降維并提取數(shù)據(jù)。其次利用SVM對于目標(biāo)領(lǐng)域數(shù)據(jù)進(jìn)行分類,解決了因缺乏目標(biāo)域樣本小而影響分類模型性能的問題。
在應(yīng)用UTCA方法時,首先將源域和目標(biāo)域的樣本數(shù)據(jù)映射到同一個特征子空間中,通過分布度量準(zhǔn)則來縮小特征分布差異:即假設(shè)源域為Ds={Xs,Ys},其中:Xs為源域樣本集,Ys為標(biāo)簽樣本;目標(biāo)域為DT={XT},其中XT為標(biāo)簽未知的目標(biāo)域樣本集。通過特征映射函數(shù)Φ,使映射后的邊緣概率分布盡可能相似,即P(Φ(Xs))≈Q(Φ(XT))。
其中Φ(Xs)與Φ(XT)是經(jīng)過Hilbert核空間映射后的源域特征樣本集與目標(biāo)域特征樣本集,源域和目標(biāo)域之間的距離表示為:
(1)
式中:‖·‖H為RKHS范數(shù);N1為源域樣本個數(shù);N2為目標(biāo)域樣本個數(shù);xsi∈Xs,xTj∈XT。將上述映射函數(shù)Φ轉(zhuǎn)化為內(nèi)核學(xué)習(xí)問題,則映射后的源域和目標(biāo)域距離表示為:
dis(Φ(Xs),Φ(XT))=trace(KL)。
(2)
式中:trace(·)表示矩陣KL的跡,其中K=[KS,SKS,T]∈R(N1+N2),KS,S、KS,T分別為源域和目標(biāo)域的核矩陣,
(3)
核矩陣K還可以表示為:
K=(KK-1/2)(K-1/2Κ)。
(4)
(5)
dis(Φ(Xs),Φ(XT))=trace((KWWΤK)L)=
trace(WΤKLKW)。
(6)
為使不同領(lǐng)域分布的間距離盡可能小,需要在式(6)中添加正則項μ·trace(WTW)來控制矩陣W的復(fù)雜度,優(yōu)化目標(biāo)轉(zhuǎn)化為:
s.t.
WΤKHKW=IM。
(7)
式中:μ>0為平衡參數(shù);IM∈RM×M為單位矩陣。
根據(jù)約束條件WΤKHKW=IM,式(7)可轉(zhuǎn)化為目標(biāo)函數(shù)求解:
(8)
可由式(8)求解(I+μKLK)-1KHK得到最佳映射核矩陣W,樣本矩陣X*=KW。
SVM建立于統(tǒng)計理論中的結(jié)構(gòu)風(fēng)險最小化原理上,根據(jù)相對有限的樣本信息,在模型復(fù)雜性和學(xué)習(xí)能力之間尋求平衡,以獲得最佳的模型泛化能力。
(9)
s.t.
yi(ATφ(xi)+b)≥1-ξi,i=1,...,n。
(10)
其中:ξi為松弛變量,表示訓(xùn)練樣本的錯分程度;C為懲罰常數(shù),控制對錯分樣本的懲罰程度;A和b分別為函數(shù)f(x)=A·φ(x)+b的權(quán)和閾值。利用拉格朗日法得到判決函數(shù):
(11)
R(x,xi)=exp(-g|x-xi|2)。
(12)
SVM模型有兩個非常重要的參數(shù)C與g,其中C為懲罰系數(shù),即對誤差的寬容度。當(dāng)C取值過大時,對于錯誤的容忍度相對較高,邊界會變寬。模型的波動相對較小,偏差較大。C取值過小情況正好相反。g越大,支持向量越少,這將影響訓(xùn)練與預(yù)測的速度。由于遺傳算法不依賴背景知識,搜索方向由適應(yīng)度函數(shù)決定,適合解決參數(shù)優(yōu)化問題。因此,本文采用遺傳優(yōu)化算法(Genetic Algorithm,GA)優(yōu)化SVM模型優(yōu)化模型參數(shù)即式(9)中的懲罰因子C和式(12)中的核函數(shù)參數(shù)g,取值范圍根據(jù)經(jīng)驗并參考文獻(xiàn)[34-36]設(shè)置為[0,100]。將分類準(zhǔn)確度作為適應(yīng)度函數(shù),以輪盤賭的方式進(jìn)行選擇,以0.6的概率進(jìn)行交叉,變異概率為0.02,最大遺傳代數(shù)為100。
實驗主要由提取樣本特征和分類器進(jìn)行故障分類兩個部分組成,因此本文首先應(yīng)用UTCA算法進(jìn)行樣本特征的提取,然后應(yīng)用SVM分類器對于故障狀態(tài)進(jìn)行分類,以達(dá)到提高滾動軸承故障狀態(tài)分類準(zhǔn)確度的目的,具體實施步驟如圖1所示。
圖1 基于無監(jiān)督遷移成分分析流程圖
無監(jiān)督遷移成分分析—支持向量機(UTCA-SVM)故障分類模型對于軸承不同狀態(tài)進(jìn)行識別的具體步驟如下:
步驟1利用傳感器采集原始信號,選取某種工況下4種軸承狀態(tài)(健康、內(nèi)圈故障、滾動體故障、外圈故障)的信號作為源域樣本數(shù)據(jù)。另一種工況下4種軸承狀態(tài)的信號作為目標(biāo)域樣本數(shù)據(jù)。
步驟2采用EEMD將原始信號分解,得到若干IMF分量;通過計算IMF分量與原始信號的相關(guān)系數(shù)篩選出含故障信息量較大的IMF分量;再對該分量進(jìn)行Hilbert變換,獲取頻譜能量分布。
步驟3將源域和目標(biāo)域樣本信號通過MMD指標(biāo)來度量遷移的源域樣本數(shù)據(jù)并提取其樣本數(shù)據(jù)特征。
步驟4將遷移學(xué)習(xí)的源域數(shù)據(jù)樣本數(shù)據(jù)作為訓(xùn)練數(shù)據(jù)獲得最優(yōu)的參數(shù)組合,同時將目標(biāo)域樣本數(shù)據(jù)作為測試集來完成故障狀態(tài)的識別。
本文采用凱斯西儲大學(xué)(CWRU)實驗室采集的滾動軸承實驗數(shù)據(jù)來驗證所提方法的有效性,對表1所示的8種軸承狀態(tài)振動信號進(jìn)行識別。
表1 信號采樣頻率為12 kHz的滾動軸承故障數(shù)據(jù)
CWRU數(shù)據(jù)集中按照功率的不同可分為0 HP、1 HP,本文將不同的功率之間相互遷移。每個樣本為6 000個采樣點構(gòu)成的信號,在0 HP功率下采集200個源域數(shù)據(jù)樣本作為訓(xùn)練集;在1 HP功率下采集100個目標(biāo)域數(shù)據(jù)樣本作為測試集,共300個樣本。
首先,利用傳感器采集不同故障狀態(tài)的原始信號并通過小波變換得到時域和頻域數(shù)據(jù)。其次,通過EEMD方法分解3層原始振動信號,再計算各IMF分量與原始振動信號的相關(guān)系數(shù)R,選擇相關(guān)系數(shù)R最大的IMF分量對其進(jìn)行Hilbert變換,求出各頻帶信號的能量。
(13)
圖2 功率0HP工況下軸承信號能量譜
從圖2中可以看出:
(1)在0 HP工況下,內(nèi)圈、滾動體和外圈未發(fā)生故障時,序號1,2的能量譜明顯高于故障狀態(tài),表明軸承能量譜特征的故障狀態(tài)與正常狀態(tài)差異明顯。
(2)對比正常狀態(tài)及不同位置故障狀態(tài)能量譜可以看出,3種故障類型的軸承序號都是3、7能量譜明顯高于正常狀態(tài),而3種故障狀態(tài)的能量譜之間的區(qū)別不明顯。
本文采用以上相同的步驟計算出功率1 HP工況下軸承的頻譜能量分布,然后通過UTCA方法將兩者的頻譜能量映射到同一個核希爾伯特空間中,通過MMD指標(biāo)來度量可以遷移的源域樣本數(shù)據(jù)并提取其樣本數(shù)據(jù)的特征。如圖3所示,滾動軸承不同故障類別之間Hilbert邊際譜能量有著顯著差異,所以該特征向量可以用來區(qū)分滾動軸承的故障類別。
圖4 遺傳算法參數(shù)優(yōu)化過程
最后為驗證UTCA-SVM方法的有效性,使用PCA-SVM和SVM方法進(jìn)行對比。將相同訓(xùn)練樣本輸入到兩種分類器中,算法初始種群數(shù)都設(shè)置為20,最大迭代次數(shù)為100。通過遺傳算法對參數(shù)尋優(yōu)后得到3種分類器對于滾動軸承故障狀態(tài)分類的結(jié)果如圖5~圖7所示。
圖5 UTCA-SVM分類器對于滾動軸承故障狀態(tài)分類的結(jié)果
圖6 SVM分類器對于滾動軸承故障狀態(tài)分類的結(jié)果
圖7 PCA-SVM分類器對于滾動軸承故障狀態(tài)分類的結(jié)果
從圖5~圖7中3種分類器對于滾動軸承故障狀態(tài)分類的結(jié)果來看,展示了不同算法生成的用于進(jìn)行多類別樣本分類的決策邊界。一個好的決策邊界應(yīng)該包含更多的己類樣本和更少的他類樣本。從3張圖中的決策邊界的劃分來看,本文所提方法產(chǎn)生的決策邊界能夠?qū)?種故障類型的軸承準(zhǔn)確劃分,而SVM和PCA-SVM方法都出現(xiàn)不同程度的劃分錯誤,決策邊界內(nèi)不僅包括己類故障樣本數(shù)據(jù),還包括其他類型的故障數(shù)據(jù)樣本。因此,UTCA-SVM方法的分類效果明顯要優(yōu)于SVM和PCA-SVM方法。再將測試集數(shù)據(jù)輸入到訓(xùn)練集訓(xùn)練好的3種分類器模型中,故障分類結(jié)果如表2所示。
表2 故障分類結(jié)果 %
由表2故障分類結(jié)果可以看出,相較于SVM和PCA-SVM方法,UTCA-SVM方法對于故障識別的準(zhǔn)確度最高。這是由于UTCA-SVM方法不僅能夠縮小源域與目標(biāo)域間樣本數(shù)據(jù)分布的差異性,更為重要的是UTCA-SVM方法能夠減少人為標(biāo)記對樣本標(biāo)簽的不確定性,提高故障分類的準(zhǔn)確度。
為解決因源域和目標(biāo)域數(shù)據(jù)存在分布差異及故障樣本缺乏影響故障分類準(zhǔn)確度的問題,本文提出一種基于無監(jiān)督遷移成分分析的滾動軸承故障狀態(tài)分類方法,該方法通過尋找共同成分進(jìn)行遷移學(xué)習(xí)來實現(xiàn)不同工況下故障的分類。遷移學(xué)習(xí)可通過有效減小域間數(shù)據(jù)的分布差異來達(dá)到滿足測試樣本與訓(xùn)練樣本獨立同分布假設(shè)的嚴(yán)苛要求[32]。最后通過實驗進(jìn)行驗證,從圖5~圖7決策邊界的劃分結(jié)果可以可視化地看出本文所提方法只包括己類故障樣本數(shù)據(jù)而PCA-SVM和SVM方法不僅包括己類故障樣本數(shù)據(jù),還包括其他類型的故障樣本數(shù)據(jù)。從實驗結(jié)果中可以看出,本文所提方法相較于PCA-SVM和SVM方法對于軸承故障狀態(tài)分類的準(zhǔn)確度分別提高約6%和12%。因此UTCA-SVM方法相較于傳統(tǒng)機器學(xué)習(xí)方法能夠明顯地提升軸承故障狀態(tài)的分類準(zhǔn)確度,適用于軸承故障狀態(tài)的分類。本文重點研究軸承故障診斷方法,并進(jìn)行實驗驗證,但還有許多方面有待進(jìn)一步研究:(1)考慮其他基于遷移學(xué)習(xí)的故障狀態(tài)識別方法,通過集成不同的分類器構(gòu)建一個分類能力更強的分類器;(2)針對篩選樣本數(shù)據(jù),考慮其他度量源域和目標(biāo)域數(shù)據(jù)分布差異的方法,進(jìn)一步提高遷移學(xué)習(xí)的效率。