劉冬冬,李友榮,徐增丙
(武漢科技大學(xué)冶金裝備及控制教育部重點(diǎn)實(shí)驗(yàn)室,湖北 武漢 430081)
軸承是機(jī)械傳動(dòng)系統(tǒng)中的重要支承部件,受惡劣工況影響,故障頻發(fā),嚴(yán)重影響了企業(yè)的生產(chǎn)運(yùn)營[1-2],為保證設(shè)備正常運(yùn)行,軸承的故障診斷至關(guān)重要。傳統(tǒng)基于機(jī)器學(xué)習(xí)的故障診斷方法如Adaboost[3]、決策樹[4]、最鄰近結(jié)點(diǎn)算法(KNN,K-NearestNeighbor)[5]和支持向量機(jī)(SVM,SupportVectorMachine)[6-7]等機(jī)器學(xué)習(xí)方法進(jìn)行診斷分析時(shí),需面臨兩個(gè)問題:(1)測試與訓(xùn)練數(shù)據(jù)分布一致;(2)訓(xùn)練樣本足夠多[8]。但機(jī)械設(shè)備在實(shí)際工作過程中因工況復(fù)雜多變,導(dǎo)致產(chǎn)生的狀態(tài)信息數(shù)據(jù)分布不一致,進(jìn)而影響了診斷精度。
遷移學(xué)習(xí)是運(yùn)用己存有(源域)知識(shí)對(duì)不同但相關(guān)領(lǐng)域(目標(biāo)域)問題進(jìn)行求解的一種機(jī)器學(xué)習(xí)方法,是一種可以有效解決傳統(tǒng)機(jī)器學(xué)習(xí)以上兩個(gè)問題的方法,目的是遷移已有的知識(shí)來解決目標(biāo)域中僅有少量有標(biāo)簽樣本數(shù)據(jù)甚至沒有的學(xué)習(xí)問題。目前已在文檔分類、情感分類、計(jì)算機(jī)視覺、網(wǎng)絡(luò)搜索排序等領(lǐng)域有著廣泛應(yīng)用[9]。如文獻(xiàn)[10]將基于最大間隔的核均值匹配的遷移學(xué)習(xí)算法應(yīng)用于文檔分類處理;文獻(xiàn)[11]將遷移學(xué)習(xí)應(yīng)用到語音情感識(shí)別,解決了跨庫不易識(shí)別的難題;文獻(xiàn)[12]提出了基于稀疏編碼的遷移學(xué)習(xí)應(yīng)用于行人檢測;文獻(xiàn)[13]將遷移學(xué)習(xí)引入搜索引擎,很好地解決了搜索結(jié)果返回排序難的問題等,但在機(jī)械設(shè)備故障診斷領(lǐng)域應(yīng)用較少。
為此,將SelecTr遷移學(xué)習(xí)(Transfer Learning)[14-16]應(yīng)用于軸承故障診斷中,利用SelecTr遷移方法遷移可用的樣本數(shù)據(jù)應(yīng)用于故障分類,從而解決因工況多變而產(chǎn)生數(shù)據(jù)分布特性不同,導(dǎo)致診斷精度低的問題。診斷流程,如圖1所示。
圖1 診斷流程Fig.1 Diagnostic Process
傳統(tǒng)機(jī)器學(xué)習(xí)對(duì)于不同的學(xué)習(xí)任務(wù),每次都需分別進(jìn)行學(xué)習(xí),學(xué)習(xí)經(jīng)驗(yàn)也不能相互借鑒,如圖2(a)所示。而遷移學(xué)習(xí)中的樣本遷移法則是從目標(biāo)域中篩選、遷移出有效的數(shù)據(jù)樣本遷移至源域,為分類模型提供盡可能多的訓(xùn)練樣本,從而充分利用已有的知識(shí),實(shí)現(xiàn)目標(biāo)域知識(shí)的積累,原理如圖2(b)所示。
圖2 遷移學(xué)習(xí)和機(jī)器學(xué)習(xí)的原理Fig.2 The Principle of Transfer Learning and Machine Learning
傳統(tǒng)的遷移學(xué)習(xí)方法有Tradaboost[17]和Bagging[18],兩者都是將目標(biāo)域和源域混合組成訓(xùn)練數(shù)據(jù),導(dǎo)致目標(biāo)域訓(xùn)練數(shù)據(jù)很快地淹沒在海量的源域數(shù)據(jù)中。而SelecTr算法將目標(biāo)數(shù)據(jù)與所有源域數(shù)據(jù)視為具有同等權(quán)重,很好地解決了這一問題。為此,將SelecTr算法引入設(shè)備故障診斷之中,如圖3所示。其具體算法如下:
輸入:目標(biāo)域數(shù)據(jù)M,和源域數(shù)據(jù)Y,其中M={(a1,x(a1)),(a2,x(a2)),…,(an,x(an))}和Y={(c1,x(c1)),(c2,x(c2)),…,(cm,x(cm)),且ai和ci是數(shù)據(jù)的特征矢量,x(a)和x(c)返回?cái)?shù)據(jù)樣本的標(biāo)簽,x(a),x(c)∈{1,2,3,4,5,6},且m>n。
(1)計(jì)算源域置信度,并剔除掉置信度后20%的樣本。
本數(shù)據(jù),S越大,表示源域和目標(biāo)域樣本數(shù)據(jù)相似度越高。
(2)對(duì)篩選后的源域進(jìn)行N次隨機(jī)采樣,得到N個(gè)源域樣本子集。
(3)將N個(gè)源域子集分別與目標(biāo)訓(xùn)練數(shù)據(jù)混合,組成訓(xùn)練數(shù)據(jù)并得到N個(gè)SVM分類器。
(4)集成投票,票多者為最終的診斷結(jié)果。
圖3 SelecTr算法的流程圖Fig.3 Flow Chart of SelecTr Algorithm
特征參數(shù)是描述設(shè)備運(yùn)行狀態(tài)信息的重要參量。過多的特征參數(shù)因冗余或不相關(guān)性不僅增加計(jì)算時(shí)間,也會(huì)影響診斷精度。為提升設(shè)備故障診斷精度,提出了一種基于類內(nèi)類間分散度的特征選取方法,具體算法如下:
(1)提取特征參數(shù),描述如下。
Spi,fj,nk表示第i種故障下,第j類特征中第k個(gè)特征值。其中i=1,2,…,6,j=1,2,…,10,N=Σnk表示一種特征向量下,特征值的個(gè)數(shù)。
(2)計(jì)算類內(nèi)中心,并按從小到大排序。
(3)計(jì)算重復(fù)度Cp,f。
(4)計(jì)算每個(gè)特征參數(shù)類內(nèi)距離所占總類內(nèi)距離的比例。
(a)計(jì)算類內(nèi)距離dp,f
(b)所占比例η
(5)最終的影響因子γ。
(6)評(píng)價(jià)系數(shù)β。
γ越大,表明其對(duì)應(yīng)的特征參數(shù)越敏感,將β設(shè)為評(píng)價(jià)閾值,大于β則其對(duì)應(yīng)的特征參數(shù)視為敏感特征參數(shù),小于β的則剔除。
本次實(shí)驗(yàn)采用西儲(chǔ)大學(xué)軸承數(shù)據(jù),由圖4的軸承測試系統(tǒng)測得。共5種故障狀態(tài)數(shù)據(jù)分別是滾動(dòng)體故障、內(nèi)圈故障、外圈3點(diǎn)鐘方向故障、外圈6點(diǎn)鐘方向故障和外圈12點(diǎn)鐘方向故障,最后還有一個(gè)正常狀態(tài)數(shù)據(jù)。共有四種不同負(fù)載和轉(zhuǎn)速的數(shù)據(jù),分別是轉(zhuǎn)速為1797r/min、1772r/min、1750r/min和1730r/min,實(shí)驗(yàn)采用轉(zhuǎn)速相差最大的兩種數(shù)據(jù)1797r/min和1730r/min,其中,1797r/min作為源域數(shù)據(jù)而1730r/min作為目標(biāo)域數(shù)據(jù)。
圖4 軸承測試系統(tǒng)Fig.4 The Bearing Test System
為了充分獲取軸承狀態(tài)信息,提取了標(biāo)準(zhǔn)差、峭度、整流平均值、波形因子、峰值因子、裕度因子、均方根、脈沖因子、峭度因子和最大奇異值等10種特征參數(shù),且考慮到特征參數(shù)的冗余性或不相關(guān)性,利用提出的特征參數(shù)優(yōu)選方法對(duì)其進(jìn)行了優(yōu)選,結(jié)果,如圖5所示。其中評(píng)價(jià)系數(shù)β=0.75,從圖中可以看出有4個(gè)特征參數(shù)是敏感特征。
圖5 特征選擇結(jié)果Fig.5 Feature Selection Results
4.3.1 源域數(shù)據(jù)樣本不變,目標(biāo)域數(shù)據(jù)樣本增加
為了分析目標(biāo)域數(shù)據(jù)樣本量對(duì)遷移學(xué)習(xí)診斷精度的影響,對(duì)源域數(shù)據(jù)樣本量不變的情況下,通過增加目標(biāo)域數(shù)據(jù)樣本量,對(duì)SelecTr遷移學(xué)習(xí)的診斷精度進(jìn)行了分析,并且為了驗(yàn)證該方面的優(yōu)越性,與SVM和Adaboost兩種傳統(tǒng)機(jī)器學(xué)習(xí)也進(jìn)行了對(duì)比分析,診斷過程中源域數(shù)據(jù)樣本為40,目標(biāo)域數(shù)據(jù)樣本分別為5、10、15、20、25、30、35、40、45和50,而測試樣本為200,而診斷結(jié)果,如圖6(a)、圖6(b)所示。從圖中可看出當(dāng)目標(biāo)數(shù)據(jù)增加到10個(gè)時(shí),遷移學(xué)習(xí)的診斷精度有了大幅提升,且隨著目標(biāo)數(shù)據(jù)的不斷加入,遷移學(xué)習(xí)的診斷精度不斷增大,當(dāng)樣本為45時(shí),精度高達(dá)99%。并且從圖6(a)可看出,當(dāng)傳統(tǒng)機(jī)器學(xué)習(xí)在診斷過程中無源域數(shù)據(jù)樣本,目標(biāo)數(shù)據(jù)樣本少于20個(gè)時(shí),SVM的診斷精度高于Adaboost,而遷移學(xué)習(xí)的診斷精度又高SVM約14%,從而說明遷移學(xué)習(xí)在少樣本情況下具有較強(qiáng)的診斷能力。而當(dāng)傳統(tǒng)機(jī)器學(xué)習(xí)在診斷過程中有源域數(shù)據(jù)樣本時(shí),從圖6(b)可看出隨著源域數(shù)據(jù)樣本的增加,傳統(tǒng)機(jī)器學(xué)習(xí)的診斷精度均有提升,但均低于遷移學(xué)習(xí),且在目標(biāo)數(shù)據(jù)少于20個(gè)樣本之前,幅值低至45%,從而說明遷移學(xué)習(xí)在少樣本條件下具有較好的診斷精度,且在數(shù)據(jù)樣本分布不一致即工況多變的情況下比傳統(tǒng)機(jī)器學(xué)習(xí)具有更強(qiáng)的診斷能力。
圖6 改變目標(biāo)數(shù)據(jù)下遷移學(xué)習(xí)和機(jī)器學(xué)習(xí)有無源域數(shù)據(jù)的對(duì)比Fig.6 The Comparison Between the Transfer Learning and Machine Learning with the Change of Target Data when the Source Data Exsit or Not
4.3.2 目標(biāo)域數(shù)據(jù)樣本不變,源域數(shù)據(jù)樣本遞增
為了分析源域數(shù)據(jù)樣本量對(duì)遷移學(xué)習(xí)診斷精度的影響,在目標(biāo)域域數(shù)據(jù)樣本量不變的情況下,通過對(duì)源域數(shù)據(jù)樣本量的增加,對(duì)SelecTr遷移學(xué)習(xí)的診斷精度進(jìn)行了分析,分析過程中,目標(biāo)域數(shù)據(jù)樣本為10個(gè),源域數(shù)據(jù)樣本分別為20、30、40、50、60、70、80、90、100和110個(gè)樣本,而測試數(shù)據(jù)樣本為200,診斷結(jié)果,如圖7所示。從圖中可看出,當(dāng)目標(biāo)數(shù)據(jù)不變,隨著源域數(shù)據(jù)的不斷增加,遷移學(xué)習(xí)的診斷精度也隨之增加,且當(dāng)源域數(shù)據(jù)樣本達(dá)到70后,診斷精度達(dá)到最大且呈現(xiàn)穩(wěn)定。并且,從圖7(a)可看出,當(dāng)沒有源域數(shù)據(jù)樣本加入時(shí),SVM和Adaboost兩種機(jī)器學(xué)習(xí)診斷精度均保持不變,且均低于遷移學(xué)習(xí)15%;從圖7(b)可看出,當(dāng)源域數(shù)據(jù)樣本達(dá)到30時(shí),SVM和Adaboost兩種機(jī)器學(xué)習(xí)分類能力達(dá)到最大值,而當(dāng)源域數(shù)據(jù)樣本繼續(xù)增大時(shí),兩方法精度呈現(xiàn)下降趨勢,且診斷精度均遠(yuǎn)低于遷移學(xué)習(xí),從而說明源域數(shù)據(jù)樣本增加會(huì)提升遷移學(xué)習(xí)的診斷精度,而源域數(shù)據(jù)樣本對(duì)傳統(tǒng)機(jī)器學(xué)習(xí)的診斷能力沒有明顯的促進(jìn)作用,也進(jìn)一步說明在工況多變情況下遷移學(xué)習(xí)具有與傳統(tǒng)機(jī)器學(xué)習(xí)無法比擬的診斷能力。
圖7 改變?cè)从驍?shù)據(jù)下遷移學(xué)習(xí)和機(jī)器學(xué)習(xí)有無源域?qū)Ρ菷ig.7 The Comparison Between the Transfer Learning and Machine Learning with the Change of Source Data when the Source Data Exsit or Not
4.3.3 特征參數(shù)未優(yōu)選條件下遷移學(xué)習(xí)診斷分析
為了進(jìn)一步驗(yàn)證特征參數(shù)優(yōu)選的優(yōu)越性,結(jié)合未優(yōu)選的特征參數(shù)利用SelecTr遷移學(xué)習(xí)和SVM和Adaboost三種方法對(duì)軸承故障分別進(jìn)行了診斷分析結(jié)果,如圖9所示。并且通過將圖8(a)與圖6(b)、圖8(b)與圖7(b)分別進(jìn)行比較分析發(fā)現(xiàn),進(jìn)行特征參數(shù)優(yōu)選后,遷移學(xué)習(xí)的診斷精度提升了40%以上,而SVM和Adaboost傳統(tǒng)機(jī)器學(xué)習(xí)的診斷精度提升達(dá)55%以上,從而說明優(yōu)選后的特征參數(shù)不僅有助于遷移學(xué)習(xí)而且也有助于傳統(tǒng)機(jī)器學(xué)習(xí)方法診斷精度的提升,也進(jìn)一步說明所提出的特征參數(shù)優(yōu)選方法的有效性。
圖8 沒有特征選擇的情況下遷移學(xué)習(xí)和機(jī)器學(xué)習(xí)的對(duì)比圖Fig.8 A contrast Diagram of Transfer Learning and Machine Learning without Feature Selection
通過將遷移學(xué)習(xí)應(yīng)用于軸承故障診斷之中,從而解決了因工況多變導(dǎo)致傳統(tǒng)機(jī)器學(xué)習(xí)方法診斷精度低的問題。(1)遷移學(xué)習(xí)通過對(duì)源域數(shù)據(jù)的篩選和遷移,獲得更多目標(biāo)域可用的分類數(shù)據(jù),提升了傳統(tǒng)機(jī)器學(xué)習(xí)方法的診斷精度。(2)提出的特征優(yōu)選方法可有效剔除冗余或不相關(guān)特征參數(shù),進(jìn)一步提升了遷移學(xué)習(xí)和傳統(tǒng)機(jī)器學(xué)習(xí)方法的診斷精度。