王惠中,賀珂珂,房理想
(1.蘭州理工大學(xué)電氣工程與信息工程學(xué)院,甘肅 蘭州 730050;2.甘肅省工業(yè)過程先進(jìn)控制重點(diǎn)試驗(yàn)室,甘肅 蘭州 730050)
滾動軸承作為電機(jī)常用零件之一。由于電機(jī)工作環(huán)境復(fù)雜,驅(qū)動的負(fù)載不同,導(dǎo)致故障率增加[1]。因此,診斷電機(jī)故障對機(jī)器正常工作有重要理論研究和實(shí)際意義[2]。
目前,傳統(tǒng)的診斷方法有支持向量機(jī)(support vector machine,SVM)[3]、貝葉斯判別函數(shù)[4]、神經(jīng)網(wǎng)絡(luò)(neural network,NN)[5]等。這些方法已被應(yīng)用于故障診斷,但是這些方法屬于有監(jiān)督淺層機(jī)器學(xué)習(xí)。處理復(fù)雜的分類問題時(shí),其泛化能力受到一定的約束[6],且傳統(tǒng)分類器與數(shù)據(jù)的動態(tài)信息無關(guān)。文獻(xiàn)[7]提出深度置信網(wǎng)絡(luò)對風(fēng)電機(jī)組主軸承進(jìn)行診斷,但是需通過預(yù)訓(xùn)練和尋找最優(yōu)參數(shù),使得診斷準(zhǔn)確率不高。文獻(xiàn)[8]對反向傳播 (back propagation,BP)神經(jīng)網(wǎng)絡(luò)和遞歸神經(jīng)網(wǎng)絡(luò)分別建立診斷模型,但是傳統(tǒng)的遞歸神經(jīng)網(wǎng)絡(luò)僅保存網(wǎng)絡(luò)最后的數(shù)據(jù),無法學(xué)習(xí)長期依賴關(guān)系,并且在回饋信息的過程中出現(xiàn)梯度消失效應(yīng)。
為了解決上述問題,本文考慮時(shí)間維度信息,提出了一種長短時(shí)記憶(long short-term memory,LSTM)網(wǎng)絡(luò)的電機(jī)故障診斷方法。該方法不僅可以改善傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的不足,解決梯度消失等問題且學(xué)習(xí)網(wǎng)絡(luò)狀態(tài)長期依賴關(guān)系信息,而且不需要復(fù)雜的調(diào)試網(wǎng)絡(luò)的超參數(shù),默認(rèn)記住數(shù)據(jù)信息。仿真結(jié)果驗(yàn)證了長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)在電機(jī)故障診斷中的可行性。
循環(huán)神經(jīng)網(wǎng)絡(luò) (recurrent neural network,RNN)是針對時(shí)域序列數(shù)據(jù)提出的。RNN結(jié)構(gòu)展開圖如圖1所示。
圖1 RNN結(jié)構(gòu)展開圖
前向傳播過程如式(1)~式(3)所示。RNN利用輸入數(shù)據(jù)的時(shí)間信息,能夠處理一個樣本在同一時(shí)刻的序列數(shù)據(jù)[9]。在同一層內(nèi),單元間的連接形成一個有向循環(huán)。由于RNN特殊的結(jié)構(gòu),使神經(jīng)元的前一時(shí)間點(diǎn)的輸出結(jié)果直接作為下一個時(shí)間點(diǎn)的輸入,再作用到自身,實(shí)現(xiàn)網(wǎng)絡(luò)的輸出,最終結(jié)果為該時(shí)刻的輸入與歷史所有時(shí)刻共同作用的結(jié)果,達(dá)到對時(shí)間序列建模的目的。相比之下,傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)在層間有連接、層中單元無連接,網(wǎng)絡(luò)無法傳輸時(shí)間信息,因此,處理時(shí)間序列的性能較差。
st=Uxt+Wht-1
(1)
ht=f(Uxt+Wht-1)
(2)
ot=g(Wht)
(3)
式中:xt為輸入;st為記憶;ot為輸出;ht為隱藏狀態(tài);f為非線性轉(zhuǎn)換函數(shù);U為輸入層到隱層的權(quán)重;W為隱層到隱層的權(quán)重;V為隱層到輸出層的權(quán)重。
然而,隨著網(wǎng)絡(luò)結(jié)構(gòu)的加深,易出現(xiàn)梯度消失等問題。采用隨機(jī)梯度下降法(stochastic gradient descent,SGD)訓(xùn)練RNN是困難的,因此需要通過其結(jié)構(gòu)的變種來緩解。
為了解決梯度消失問題,在RNN中引入長短時(shí)記憶塊,記憶長時(shí)間或短時(shí)間情況下的值。長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)是深度學(xué)習(xí)領(lǐng)域的遞歸神經(jīng)網(wǎng)絡(luò),主要用來克服RNN神經(jīng)網(wǎng)絡(luò)在訓(xùn)練上的難題和梯度消失等問題[10]。LSTM網(wǎng)絡(luò)得到了廣泛應(yīng)用[11-13]。LSTM神經(jīng)網(wǎng)絡(luò)是RNN的變種結(jié)構(gòu),RNN的隱層單元由輸入門、輸出門、忘記門和記憶單元結(jié)構(gòu)組成。 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 長短時(shí)記憶神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
LSTM神經(jīng)網(wǎng)絡(luò)由控制門來控制信息的狀態(tài),此時(shí)網(wǎng)絡(luò)能較長時(shí)間地保存?zhèn)鬟f信息。
在輸入門的作用是在忘記門之前的狀態(tài)后,從當(dāng)前的輸入補(bǔ)充最新的記憶,如式(4)所示。
i(t)=fg[Wxi(t)x(t)+Whi(t-1)h(t-1)bi]
(4)
忘記門控制程度從前一時(shí)間轉(zhuǎn)移的信息,忘記沒有用的信息,如式(5)所示。
f(t)=f(g[Wxf(t)x(t)+Whf(t-1)h(t-1)+bf]
(5)
新的記憶單元的狀態(tài)信息由兩部分組成。一部分是遺忘門的輸出結(jié)果與前一時(shí)刻的記憶塊狀態(tài)c(t-1)乘積,它決定忘記之前要遺忘的信息;另一部分是輸入門的輸出結(jié)果i與tanh層乘積生成一個新的候選數(shù)值信息。兩部分的和作為新的記憶單元的狀態(tài)信息,如式(6)所示。
ct(t)=ftct-1+ittanh[Wxcx(t)+Whcx(t-1)+bc]
(6)
輸出門的作用是決定是否通過當(dāng)前記憶狀態(tài)輸出結(jié)果ot,經(jīng)過tanh層乘以sigmoid的輸出,輸出需要的結(jié)果,如式(7)~式(8)所示。
ot(t)=fg[Wxo(t)x(t)+Who(t-1)h(t-1)+bo]
(7)
h(t)=otgtanh[c(t)]
(8)
式中:fg為sigmoid激活函數(shù);Wxi、Wxf、Wxo和Wxc為輸入門到輸入門、遺忘門、輸出門和記憶單元的權(quán)重矩陣;Whi、Whf、Who和Whc分別為隱層單元到輸入門、遺忘門、輸出門和記憶單元的權(quán)重矩陣。
Softmax多分類器對于給定的輸入x,通過假設(shè)函數(shù)來估計(jì)每一個類別j的概率值p(y=j|x)。因此,概率值根據(jù)假設(shè)函數(shù)輸出維的向量表示,其中向量和為1。
假設(shè)函數(shù)hθ(x)形式為:
(9)
在訓(xùn)練過程中,Softmax的代價(jià)函數(shù)J(θ)如式(10)所示。
(10)
式中:1{·}為一個指示函數(shù),即當(dāng)式中大括號的值為真時(shí),函數(shù)值為1,否則為0。
本文設(shè)計(jì)了一個由LSTM神經(jīng)網(wǎng)絡(luò)和Softmax多分類器組成的診斷模型。LSTM神經(jīng)網(wǎng)絡(luò)可以從原始故障數(shù)據(jù)中提取具有時(shí)間信息的特征,Softmax層借助LSTM提取的深層特征執(zhí)行多分類任務(wù)。LSTM神經(jīng)網(wǎng)絡(luò)診斷模型結(jié)構(gòu)如圖3所示。在輸入故障數(shù)據(jù)后,該模型在LSTM網(wǎng)絡(luò)中進(jìn)行特征學(xué)習(xí),最后一層是Softmax層。該層接收處理過的特征數(shù)據(jù),計(jì)算每個類別的可能性并進(jìn)行分類。
圖3 LSTM神經(jīng)網(wǎng)絡(luò)診斷結(jié)構(gòu)圖
LSTM神經(jīng)網(wǎng)絡(luò)與Softmax多分類器構(gòu)成故障診斷模型。Softmax多分類器為網(wǎng)絡(luò)的訓(xùn)練提供類別信息,改善了特征的優(yōu)化提取。故障診斷流程如圖4所示。
圖4 故障診斷流程圖
①采集電機(jī)的正常信號與故障信號。在采樣頻率為48 kHz的條件下,利用振動傳感器測得的6205-2RS JEM SKF軸承振動值正常,內(nèi)圈、外圈和滾珠的振動數(shù)據(jù)信號,通過sklearn中的train_test_split按照一定比例對數(shù)據(jù)集進(jìn)行隨機(jī)劃分,分為訓(xùn)練集和測試集。
②故障數(shù)據(jù)特征提取。將采集的振動信號進(jìn)行歸一化后,利用LSTM神經(jīng)網(wǎng)絡(luò)直接進(jìn)行故障特征提取。
③設(shè)置網(wǎng)結(jié)構(gòu)和超參數(shù)。通過設(shè)置LSTM神經(jīng)網(wǎng)絡(luò)層數(shù)和超參數(shù),如學(xué)習(xí)率、步長、迭代次數(shù)和神經(jīng)元個數(shù)等,得到最佳網(wǎng)絡(luò)結(jié)構(gòu)。
④故障分類。根據(jù)步驟②提取的深層特征,利用最后的Softmax層進(jìn)行故障分類,識別故障。
為了驗(yàn)證該方法在電機(jī)故障診斷中的可行性與有效性,本文采用Case Western Reserve University軸承試驗(yàn)中心網(wǎng)站的數(shù)據(jù)[13]。本文選取的具體試驗(yàn)數(shù)據(jù)為電動機(jī)頻率為1 492 W,轉(zhuǎn)速為1 730 r/min,采樣頻率為48 kHz等條件下的振動數(shù)據(jù)。分別在內(nèi)圈、滾珠和外圈6點(diǎn)鐘方向處引入直徑為0.355 6 mm的故障。
表1 樣本數(shù)據(jù)集
隨機(jī)在每個狀態(tài)中選擇一組數(shù)據(jù)點(diǎn),進(jìn)行時(shí)域分析。不同類型故障的時(shí)域波形圖如圖5所示。
從圖5可以看出,在正常狀態(tài)下,電機(jī)軸承的工作狀態(tài)與其他三種的振動波形有很大差別。當(dāng)電機(jī)軸承失效時(shí),其振動信號有一定的沖擊特征。
通過時(shí)域信號數(shù)據(jù)輸入LSTM神經(jīng)網(wǎng)絡(luò)提取故障特征,再利用Softmax多分類器進(jìn)行故障分類。診斷準(zhǔn)確率對比如表2所示。
圖5 不同類型故障的時(shí)域波形圖
故障類型LSTM-SoftmaxSSAE-SoftmaxBPNN正常10010088內(nèi)圈968989外圈988788滾珠1008986
從表2可以看出,LSTM神經(jīng)網(wǎng)絡(luò)根據(jù)連接的隱層單元從數(shù)據(jù)中自動提取時(shí)間信息,可以更好地捕獲故障特征,從而有利于分類。堆棧稀疏自編碼器(stacked sparse autoencoder,SSAE)對原始數(shù)據(jù)直接提取故障特征并分類,其準(zhǔn)確率不高。除此之外,傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)易出現(xiàn)局部極小等問題,準(zhǔn)確率也相對較低。10次重復(fù)試驗(yàn)準(zhǔn)確性如表3所示。
表3 10次重復(fù)試驗(yàn)準(zhǔn)確性
從表3可以得出,經(jīng)過10次重復(fù)試驗(yàn)后,得到所運(yùn)用的方法平均準(zhǔn)確率達(dá)到98.3%。仿真結(jié)果證明了將所提的LSTM與Softmax結(jié)合應(yīng)用于電機(jī)故障診斷的可行性和有效性。
LSTM神經(jīng)網(wǎng)絡(luò)在提取時(shí)間序列的特征方面表現(xiàn)良好,因此,可以有效提取故障數(shù)據(jù)特征,本文將LSTM和Softmax多分類器結(jié)合,搭建故障診斷模型并進(jìn)行分類,實(shí)現(xiàn)了電機(jī)軸承3種常見故障的準(zhǔn)確診斷,得到了最終診斷結(jié)果。LSTM神經(jīng)網(wǎng)絡(luò)可以克服長期以來傳統(tǒng)神經(jīng)網(wǎng)絡(luò)面臨的梯度消失等問題,與堆棧稀疏自編碼器分類和BP網(wǎng)絡(luò)結(jié)果對比發(fā)現(xiàn),所提方法具有更高的分類準(zhǔn)確率。