趙宇凱,徐高威,劉 敏
(同濟(jì)大學(xué) 電子與信息工程學(xué)院,上海201804)
傳動裝置是日常生活和工業(yè)生產(chǎn)當(dāng)中最常用的機(jī)械裝置之一,而傳動裝置的安全平穩(wěn)運(yùn)行離不開軸承的正常工作。在各種各樣的工作環(huán)境下,軸承的工作狀況是急劇變化的,對軸承故障的早期診斷可以有效預(yù)防安全問題的發(fā)生。然而,基于傳統(tǒng)可靠性工程的診斷方法已經(jīng)很難適應(yīng)軸承類傳動部件故障診斷的需求[1-2];同時,隨著物聯(lián)網(wǎng)技術(shù)與大數(shù)據(jù)技術(shù)的飛速發(fā)展,越來越多的軸承狀態(tài)監(jiān)測數(shù)據(jù)被采集并存儲下來[3]。因此,數(shù)據(jù)驅(qū)動的故障診斷方法在學(xué)術(shù)界與工業(yè)界被廣泛研究與應(yīng)用,如:陳彬強(qiáng)等[2]將分形小波變換和稀疏分類的方法應(yīng)用到航天器傳動機(jī)械零部件的故障診斷問題中,解決了數(shù)據(jù)稀缺的問題;于景洋等[4]提出1D卷積神經(jīng)網(wǎng)絡(luò)的滾動軸承診斷方法,可以對一維振動信號進(jìn)行處理。然而,這些傳統(tǒng)方法存在如下問題:1)需要對原始數(shù)據(jù)進(jìn)行煩瑣的預(yù)處理;2)需要大量的訓(xùn)練數(shù)據(jù)來對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,訓(xùn)練時間長,人力物力耗費(fèi)巨大。針對以上問題,康守強(qiáng)等[5]利用特征遷移的學(xué)習(xí)方法,針對變工況下的滾動軸承故障診斷問題提出基于變分模態(tài)分解的特征提取和遷移方法;張根保等[6]提出了一種用于軸承故障診斷的遷移學(xué)習(xí)模型,由棧式稀疏編碼器和柔性最大值函數(shù)組成,當(dāng)工況發(fā)生變化時只需要少量樣本就可以重新執(zhí)行診斷任務(wù)。
本文提出一種基于VGG16卷積神經(jīng)網(wǎng)絡(luò)的遷移學(xué)習(xí)方法,將在源域預(yù)訓(xùn)練過的VGG16網(wǎng)絡(luò)應(yīng)用到軸承故障數(shù)據(jù)集中。首先利用信號轉(zhuǎn)化的處理方法,將原始一維振動信號轉(zhuǎn)化為二維(224×224)灰度圖像,再對單通道的灰度圖像進(jìn)行復(fù)制、疊加成為三通道(224×224×3)圖像;然后將處理后的圖片樣本分為訓(xùn)練集和測試集,對訓(xùn)練集在預(yù)先訓(xùn)練過的網(wǎng)絡(luò)當(dāng)中進(jìn)行微調(diào),以達(dá)到網(wǎng)絡(luò)最佳參數(shù);最后通過測試集驗(yàn)證該模型的故障分類能力。
基于卷積神經(jīng)網(wǎng)絡(luò)的故障診斷方法很難直接對原始振動信號進(jìn)行處理,因此,對原始數(shù)據(jù)進(jìn)行預(yù)處理尤為重要。當(dāng)前的數(shù)據(jù)預(yù)處理方法是通過時頻分析對原始信號的特征進(jìn)行提取,通常需要花費(fèi)大量的時間,并且人工提取的特征對最終的分類結(jié)果影響很大。而本文設(shè)計一種直接的信號?圖像轉(zhuǎn)換方法,無須依賴任何專家經(jīng)驗(yàn)。
通常軸承故障數(shù)據(jù)采集的是時域信號,是一種一維矩陣的格式。要將原始的時域信號轉(zhuǎn)換成為一個N×N像素數(shù)的圖片格式,首先需要從連續(xù)的信號中隨機(jī)取樣,抽取N個長度為N的時間信號,組成一個二維矩陣L,經(jīng)過對矩陣作0~255的歸一化之后,即得到一個N×N像素的灰度圖像格式。具體變換過程可表示為
其中round(·)函數(shù)返回是四舍五入的函數(shù)值。該方法對軸承正常情況下信號的轉(zhuǎn)化過程如圖1所示,一維的振動信號輸出在MatLab上為振動波形式,經(jīng)過該信號轉(zhuǎn)化方法處理后,原來的振動信號被轉(zhuǎn)化為相應(yīng)大小的矩陣,再對矩陣進(jìn)行歸一化之后輸出灰度圖像格式。
圖1 信號轉(zhuǎn)圖像處理方法Fig.1 Signal-to-image conversion method
卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)仿照生物的視知覺機(jī)制構(gòu)建,是機(jī)器學(xué)習(xí)的代表算法之一[7]。CNN 的基本結(jié)構(gòu)包括輸入層、卷積層、池化層、全連接層和輸出層,其中:卷積層和池化層可以多次疊加來提高網(wǎng)絡(luò)性能;卷積層利用卷積核進(jìn)行卷積操作,對輸入樣本的局部加權(quán)求和,提取輸入的特征;池化層進(jìn)行特征降維,減少學(xué)習(xí)量并降低網(wǎng)絡(luò)復(fù)雜度[8]。在訓(xùn)練過程中,可以根據(jù)相應(yīng)的需求自由調(diào)整卷積核的步長。經(jīng)過多次卷積、池化操作之后,輸入樣本的特征能夠被網(wǎng)絡(luò)提取,再經(jīng)由全連接層和輸出層激活函數(shù)對結(jié)果進(jìn)行分類。
VGG 卷積神經(jīng)網(wǎng)絡(luò)模型[9]是牛津大學(xué)在2014年提出的,在眾多的VGG變形當(dāng)中,VGG16在圖像分類和目標(biāo)檢測任務(wù)中都表現(xiàn)良好,故本文選擇使用VGG16卷積神經(jīng)網(wǎng)絡(luò)。該網(wǎng)絡(luò)使用連續(xù)的3×3的卷積核代替原本較大的卷積核,并且通過增加網(wǎng)絡(luò)深度使得對樣本的學(xué)習(xí)更加深入。VGG16卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示,通過反復(fù)疊加的卷積層(convolution layer)和池化層(pooling layer),共有13層卷積層和3層全連接層(fully connected layer),而池化層不計權(quán)重故不算在總層數(shù)之內(nèi)。卷積層和池化層其實(shí)就是對輸入圖像的一種提取過程,多層卷積池化層相互堆疊,使得網(wǎng)絡(luò)具有更大感受野的同時又能降低網(wǎng)絡(luò)參數(shù),并且通過ReLU 激活函數(shù)使得原本的單一線性變化變得多樣化,學(xué)習(xí)能力也因此增強(qiáng)[10]。經(jīng)由全連接層和輸出層可以將樣本進(jìn)行分類處理,通過softmax 激活函數(shù)可以得到當(dāng)前樣本屬于不同種類的概率分布[11]。
圖2 VGG16卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Structure chart of VGG16 convolutional neural network
遷移學(xué)習(xí)[12]是一種能夠?qū)钠渌I(lǐng)域?qū)W習(xí)到的知識應(yīng)用到所需研究領(lǐng)域的機(jī)器學(xué)習(xí)方法。當(dāng)一個神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練時,一般認(rèn)為訓(xùn)練集和測試集是同分布的,并且需要成千上萬個樣本對該模型進(jìn)行訓(xùn)練優(yōu)化。因此即使樣本足夠,處理樣本數(shù)據(jù)也是一個成本很高的過程;而遷移學(xué)習(xí)方法能夠很好地彌補(bǔ)因?yàn)閿?shù)據(jù)量不足或者訓(xùn)練時間過長而帶來的問題。
VGG16卷積神經(jīng)網(wǎng)絡(luò)是一個對圖像進(jìn)行提取并不斷深入提煉的過程,它具有很深的網(wǎng)絡(luò)結(jié)構(gòu)。起初的卷積層只對圖像的特征進(jìn)行提取,而網(wǎng)絡(luò)層較深時才處理特定的任務(wù)[13]。因此在遷移學(xué)習(xí)過程當(dāng)中,可以應(yīng)用已經(jīng)在源域預(yù)先訓(xùn)練過的模型,保留較低層的權(quán)重,只對高層進(jìn)行重新訓(xùn)練并微調(diào)相關(guān)參數(shù)。因?yàn)榕c源域數(shù)據(jù)分布不同的特點(diǎn),需要利用目標(biāo)域數(shù)據(jù)集對模型進(jìn)行微調(diào),去掉原來的頂層并添加新的輸出層,加入softmax 函數(shù)對新的問題進(jìn)行分類。圖3所示即為一個對模型進(jìn)行遷移的過程,通過對模型當(dāng)中在源域(自然圖像)訓(xùn)練的權(quán)重進(jìn)行遷移,再利用目標(biāo)域(任務(wù)數(shù)據(jù))進(jìn)行微調(diào),大大簡化了模型在新領(lǐng)域問題當(dāng)中的訓(xùn)練過程。
圖3 卷積神經(jīng)網(wǎng)絡(luò)模型遷移Fig.3 Model transfer of CNN
本文的實(shí)驗(yàn)數(shù)據(jù)集1來自凱斯西儲大學(xué)的軸承數(shù)據(jù)庫[14],其實(shí)驗(yàn)裝置如圖4所示,測試臺由2 HP(1HP=735W)電機(jī)、扭矩傳感器、測力計和控制電子組成。測試軸承支撐電機(jī)軸,采用電火花加工將單點(diǎn)故障人為引入實(shí)驗(yàn)軸承,使用加速度計收集振動數(shù)據(jù),使用扭矩傳感器收集速度和功率數(shù)據(jù)。故障數(shù)據(jù)集分別在12 kHz 和48 kHz 采樣率下的驅(qū)動端和風(fēng)扇端處產(chǎn)生,又各自分成不同位置(內(nèi)圈、外圈、滾動體)、不同故障直徑(0.007、0.014、0.021、0.028英寸)、不同負(fù)載(0、1、2、3HP)下的實(shí)驗(yàn)數(shù)據(jù)。
圖4 凱斯西儲大學(xué)的軸承實(shí)驗(yàn)裝置Fig.4 The bearing test bench in Case Western Reserve University
實(shí)驗(yàn)數(shù)據(jù)集2來自辛辛那提大學(xué)的IMS軸承數(shù)據(jù)庫[15],其實(shí)驗(yàn)裝置通過1個主軸將4個軸承連接在一起,用交流電機(jī)將軸承轉(zhuǎn)速保持在2000 r/m in,每個軸承配備一個對應(yīng)的加速度計記錄軸承數(shù)據(jù)。測試數(shù)據(jù)一共分為3組,每組都記錄4個軸承從測試開始直到軸承失效的振動信號,軸承故障分為內(nèi)圈、外圈、滾動體3類。
如表1所示,為了保證軸承數(shù)據(jù)的多工況條件,本實(shí)驗(yàn)選擇了數(shù)據(jù)集1當(dāng)中軸承故障直徑為0.007英寸、不同負(fù)載條件下,正常、內(nèi)圈故障、滾動體故障和外圈故障的軸承振動信號;并從每組數(shù)據(jù)中通過我們的預(yù)處理方法選擇出500個樣本組成訓(xùn)練集,同時另選出500個樣本組成測試集,共計2000個樣本的訓(xùn)練集和2000個樣本的測試集。除此之外,本實(shí)驗(yàn)還使用相同的方法從數(shù)據(jù)集2中相同故障狀態(tài)下挑選了相同樣本數(shù)量的訓(xùn)練集和測試集,以驗(yàn)證不同工況條件下VGG16故障分類的準(zhǔn)確率。
表1 實(shí)驗(yàn)數(shù)據(jù)集Table 1 Experimental data set
圖5所示為數(shù)據(jù)集1當(dāng)中0 HP負(fù)載下、故障直徑為0.007英寸的軸承振動信號,經(jīng)過信號?圖像轉(zhuǎn)換后所產(chǎn)生的灰度圖像。VGG16網(wǎng)絡(luò)的輸入格式為224×224×3,像素為224×224,故選擇N為224。經(jīng)過轉(zhuǎn)換的振動信號是單通道的灰度圖像,要經(jīng)過復(fù)制才能成為VGG16網(wǎng)絡(luò)的輸入格式。
圖5下半部分以正常軸承的灰度圖像為例,將轉(zhuǎn)換好的灰度圖像進(jìn)行復(fù)制、疊加成為VGG16網(wǎng)絡(luò)可輸入的三通道格式。
圖5 數(shù)據(jù)預(yù)處理Fig.5 Data preprocessing
模型應(yīng)用過程中,首先對訓(xùn)練集在VGG16網(wǎng)絡(luò)中進(jìn)行微調(diào),訓(xùn)練出新的網(wǎng)絡(luò)層參數(shù)之后利用測試集進(jìn)行驗(yàn)證。訓(xùn)練過程中參數(shù)選擇迭代次數(shù)為10代,每一次的梯度下降樣本數(shù)(batch_size)為50,每一輪訓(xùn)練結(jié)束后都進(jìn)行驗(yàn)證,最后由測試集測試模型的分類準(zhǔn)確率。如表2所示,另外選取了一維CNN 和支持向量機(jī)(Support Vector Machines, SVM)這2種比較經(jīng)典的故障診斷方法與本文方法進(jìn)行比較。
表2 軸承故障診斷準(zhǔn)確率Table2 Bearing fault diagnosis results單位:%
本文將實(shí)驗(yàn)分成了9組,依次是0 HP、1 HP、2HP、3HP、IMS這5組四分類任務(wù),以及0~1HP、0~2 HP、0~3 HP、0~3 HP+IMS這4組多分類任務(wù)。從這9組實(shí)驗(yàn)結(jié)果來看,VGG16與CNN、SVM相比,平均準(zhǔn)確率分別高出2.4和5.8個百分點(diǎn)。從圖6可以看出:當(dāng)面對四分類任務(wù)時,VGG16和CNN 都能保持非常高的診斷準(zhǔn)確率,SVM 的準(zhǔn)確率要相對低一些;而隨著分類種類增多,任務(wù)變得復(fù)雜,3種算法的準(zhǔn)確率都有所下降,但VGG16只下降了0.4個百分點(diǎn),而CNN 和SVM的準(zhǔn)確率分別下降了9.6和12.2個百分點(diǎn)。
圖6 3種診斷方法的準(zhǔn)確率曲線Fig.6 Accuracy curve for three diagnosticmethods
由上述實(shí)驗(yàn)結(jié)果可知,VGG16在不同工況條件下均能輕松完成故障的分類任務(wù),且當(dāng)分類任務(wù)變得更加復(fù)雜時依然能夠保持性能的優(yōu)越。
本文針對軸承故障診斷任務(wù),提出基于VGG16遷移學(xué)習(xí)的診斷方法,主要創(chuàng)新點(diǎn)如下:
1)提出了一種高效快捷的信號轉(zhuǎn)圖像處理方法,將原本的一維振動信號轉(zhuǎn)換為灰度圖像信號,大大降低了信號特征提取的復(fù)雜度;
2)設(shè)計了一種可用于軸承故障診斷的VGG16遷移學(xué)習(xí)模型,將完成預(yù)訓(xùn)練的VGG16卷積神經(jīng)網(wǎng)絡(luò)模型中的淺層結(jié)構(gòu)與權(quán)重保留,并用目標(biāo)任務(wù)中的數(shù)據(jù)集對VGG16模型較高層結(jié)構(gòu)中的權(quán)重進(jìn)行微調(diào),微調(diào)后的VGG16模型直接用于對軸承故障類型進(jìn)行分類。
應(yīng)用本文所提出的方法分別對凱斯西儲大學(xué)的軸承故障數(shù)據(jù)集和辛辛那提大學(xué)的IMS軸承數(shù)據(jù)集進(jìn)行了實(shí)驗(yàn)驗(yàn)證,結(jié)果表明,在實(shí)際應(yīng)用中,本文提出的信號轉(zhuǎn)圖像處理方法具有良好的特征提取能力,設(shè)計的VGG16遷移學(xué)習(xí)模型能夠在不同工況條件下和多分類任務(wù)中保持良好的算法性能。