董紹江,李洋,梁天,趙興新,胡小林,裴雪武,朱朋
(1.重慶交通大學(xué)機(jī)電與車(chē)輛工程學(xué)院 重慶,400074)
(2.重慶長(zhǎng)江軸承股份有限公司 重慶,401336)
(3.重慶工業(yè)大數(shù)據(jù)創(chuàng)新中心有限公司 重慶,401000)
軸承作為現(xiàn)代制造業(yè)的重要組成部分,其故障診斷意義重大[1]。早期的故障診斷方法大多依賴于專家知識(shí),通過(guò)人工手段對(duì)原始信號(hào)進(jìn)行特征提取,效率低下,難以處理高速增長(zhǎng)的海量數(shù)據(jù)[2-5]。近年來(lái),深度學(xué)習(xí)技術(shù)在計(jì)算機(jī)視覺(jué)、自然語(yǔ)言處理及語(yǔ)音識(shí)別等領(lǐng)域取得了跨越式的發(fā)展,一些深度學(xué)習(xí)方法也被使用到軸承故障診斷領(lǐng)域。
在變工況軸承故障診斷問(wèn)題上,Li等[6]提出一種改進(jìn)基于Dempster-Shafer理論的證據(jù)融合的集成深度卷積神經(jīng)網(wǎng)絡(luò)的算法,將原始時(shí)域信號(hào)的快速傅里葉變換特征的均方根圖輸入模型,實(shí)現(xiàn)變工況故障診斷。Ding等[7]提出一種基于小波包能量圖像和深度卷積網(wǎng)絡(luò)的能量波動(dòng)多尺度特征挖掘方法,實(shí)現(xiàn)變工況故障診斷。Zhang等[8]提出基于訓(xùn)練干擾的卷積神經(jīng)網(wǎng)絡(luò)模型,直接將原始信號(hào)輸入模型,實(shí)現(xiàn)變工況故障診斷。Hao等[9]提出一維卷積長(zhǎng)短期記憶網(wǎng)絡(luò)的多傳感器的方法實(shí)現(xiàn)變工況故障診斷。
前期相關(guān)文獻(xiàn)研究成果側(cè)重于強(qiáng)噪聲干擾研究或者變工況影響研究,對(duì)于變工況和噪聲背景的復(fù)雜條件下軸承的故障診斷效果不明顯。筆者圍繞相關(guān)問(wèn)題提出將帶有注意力機(jī)制、將DropConnect和Dropout混合使用加入到CNN-BiLSTM模型,可以有效地解決這一問(wèn)題。首先,將軸承時(shí)域信號(hào)和隨機(jī)噪聲信號(hào)輸入CNN網(wǎng)絡(luò)中提取軸承故障特征;其次,經(jīng)全連接層匯總之后輸入帶有注意力機(jī)制的BiLSTM網(wǎng)絡(luò)層經(jīng)過(guò)權(quán)重分配實(shí)現(xiàn)更有效的深層特征提取;最后,通過(guò)Softmax層分類器實(shí)現(xiàn)滾動(dòng)軸承故障類別診斷。經(jīng)試驗(yàn)驗(yàn)證,該方法在變工況和噪聲背景下獲得了較高的識(shí)別精度。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一。CNN主要由輸入層(Input)、卷積層(Conv)、池化層(Pool)、全連接層(FC)和Softmax層5種結(jié)構(gòu)組成。CNN的訓(xùn)練過(guò)程由前向傳播和反向傳播組成,前向傳播主要提取輸入數(shù)據(jù)的不同特征,反向傳播則主要是優(yōu)化前向傳播的參數(shù),其詳細(xì)訓(xùn)練過(guò)程見(jiàn)文獻(xiàn)[10]。
長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(long short-term memory,簡(jiǎn)稱LSTM)是一種循環(huán)神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的變體,能夠解決循環(huán)神經(jīng)網(wǎng)絡(luò)中遇到的梯度爆炸和梯度消失問(wèn)題[11]。標(biāo)準(zhǔn)LSTM網(wǎng)絡(luò)結(jié)構(gòu)只有前向傳播運(yùn)算,缺乏前后的邏輯性。雙向長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(BiLSTM)是在LSTM的基礎(chǔ)上,利用已知時(shí)間序列和反向位置序列,通過(guò)前向和反向傳播雙向運(yùn)算,加深對(duì)原序列特征提取,提高模型輸出結(jié)果的準(zhǔn)確性。BiLSTM神經(jīng)網(wǎng)絡(luò)最后輸出是前向、反向傳播的LSTM輸出結(jié)果之和。BiLSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示。
圖1 BiLSTM網(wǎng)絡(luò)結(jié)構(gòu)示意圖Fig.1 Schematic diagram of the BiLSTM network structure
在故障診斷領(lǐng)域,對(duì)故障進(jìn)行診斷時(shí)通常先需要進(jìn)行一系列特征提取,以得到故障特征進(jìn)行診斷。但是在特征提取的過(guò)程中,并不是提取到的所有故障特征都有助于故障診斷。為了提高故障診斷的正確率,因此在特征提取時(shí),有必要引入注意力機(jī)制對(duì)其進(jìn)行篩選[12]。注意力機(jī)制的計(jì)算步驟如下。
1)將經(jīng)過(guò)前期網(wǎng)絡(luò)訓(xùn)練得到的各個(gè)故障特征,作為注意力機(jī)制層的各輸入故障特征yi,即先將輸入的故障特征與神經(jīng)元權(quán)重相乘,再加上神經(jīng)元的偏差;再用雙曲正切函數(shù)將前面計(jì)算得到的值映射到[-1,1]區(qū)間,以便于后面計(jì)算各個(gè)故障特征的權(quán)重系數(shù)。計(jì)算公式為
其中:tanh(·)為雙曲正切函數(shù),它可以將輸入特征映射到[-1,1]區(qū)間;w為神經(jīng)元的權(quán)重;b為神經(jīng)元的偏差。
2)式(2)主要是通過(guò)Softmax函數(shù)計(jì)算出不同故障特征權(quán)重以便于后期對(duì)輸入故障特征中的重要特征進(jìn)行篩選。經(jīng)過(guò)式(1)計(jì)算得到的值,先在經(jīng)過(guò)Softmax函數(shù)時(shí)可以計(jì)算出不同故障特征的權(quán)重系數(shù)ai,再對(duì)其進(jìn)行歸一化處理,得到所有特征注意力權(quán)重ai之和為1的概率分布。具體計(jì)算公式為
3)式(3)主要是實(shí)現(xiàn)重要故障特征的篩選之后的最優(yōu)故障特征。將各故障特征輸入量yi與權(quán)重系數(shù)ai相乘并求和,得到經(jīng)過(guò)注意力機(jī)制優(yōu)化以后的最終故障特征表達(dá)Fc為
由于最終的故障特征經(jīng)過(guò)了權(quán)重的重新分配,相較于沒(méi)有經(jīng)過(guò)注意力機(jī)制的故障特征,它反應(yīng)的是更加重要和關(guān)鍵的故障特征。因此,在原有的訓(xùn)練網(wǎng)絡(luò)中加入注意力機(jī)制層,更有利于提升模型的診斷能力。
Dropout是一種常用的解決過(guò)擬合、提高網(wǎng)絡(luò)模型泛化能力的方法。Dropout在神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過(guò)程中,按照一定概率P將一部分中間層單元暫時(shí)從網(wǎng)絡(luò)中丟棄,即把一部分輸出置為0,以此避免過(guò)擬合,如式(4)所示。DropConnect則是一種通過(guò)舍棄一部分輸入單元來(lái)防止過(guò)擬合的方法[13],如式(5)所示。其二者不同之處在于,Dropout一般用于全連接層之后,DropConnect則用于神經(jīng)網(wǎng)絡(luò)連接層的權(quán)重上,是把一部分輸入連接層的權(quán)重W單元置為0。二者的網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。
圖2 Dropout和DropConnect網(wǎng)絡(luò)結(jié)構(gòu)Fig.2 Dropout and DropConnect network structure
其中:m為剩余1-P的沒(méi)有被置為0的概率;a為一個(gè)激活函數(shù);W為權(quán)重;v為上一層的輸出;r為輸出,其中m和a(Wv)相乘是對(duì)應(yīng)元素的相乘。
本研究所提方法是一種端到端的數(shù)據(jù)驅(qū)動(dòng)方法,減少了繁雜的人為特征提取過(guò)程。該方法在原始信號(hào)上加入隨機(jī)高斯白噪聲相當(dāng)于增加訓(xùn)練樣本,不僅可以減弱神經(jīng)網(wǎng)絡(luò)的聯(lián)合適應(yīng)性,以防止過(guò)擬合,還可以增強(qiáng)模型的抗干擾能力[14]。并且在模型的卷積層和全連接層之后,加了可以使得輸入數(shù)據(jù)落入敏感的非線性變換函數(shù)區(qū)域中的批量歸一化(batch normalizatio,簡(jiǎn)稱BN),以防止梯度消失。雖然CNN-BiLSTM模型相較于傳統(tǒng)的CNN模型可以提取到更加深層的故障特征,但是為了使網(wǎng)絡(luò)提取到的特征更有利于故障診斷,筆者引入了注意力機(jī)制對(duì)深層故障特征進(jìn)行篩選。為了進(jìn)一步防止過(guò)擬合和提高抗干擾能力,將DropConnect和Dropout混合使用,分別加入到CNN和BiLSTM層模型中。本研究模型主體結(jié)構(gòu)如圖3所示,注意力機(jī)制的BiLSTM層(A-BiLSTM層)如圖4所示。
圖3 本研究模型主體結(jié)構(gòu)Fig.3 The main structure of this model
圖4 注意力機(jī)制的BiLSTM層Fig.4 BiLSTM network layer of attention mechanism
本研究模型由4個(gè)卷積層和池化層、1個(gè)全連接層、1個(gè)隱藏層為256的注意力機(jī)制的BiLSTM網(wǎng)絡(luò)層和Softmax層組成。筆者使用反向傳播算法和Adam隨機(jī)優(yōu)化方法對(duì)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,迭代輪數(shù)為3 000,數(shù)據(jù)集的訓(xùn)練批處理大小為50,學(xué)習(xí)率為0.001,DropConnect率為0.5,Dropout率為0.5,激活函數(shù)為ReLU,池化類型為最大池化。試驗(yàn)時(shí)采用Google的Tensorflow工具箱。各網(wǎng)絡(luò)層參數(shù)如表1所示。
表1 本研究模型各網(wǎng)絡(luò)層參數(shù)Tab.1 The network layer parameters of this model
為了消除隨機(jī)誤差對(duì)試驗(yàn)結(jié)果的影響,本次試驗(yàn)的測(cè)試結(jié)果為5次的平均值。設(shè)置了4個(gè)變量,分別是:有無(wú)BiLSTM層、有無(wú)注意力機(jī)制、Dropout添加的位置、有無(wú)DropConnect。F1為筆者所提模型:加注意力機(jī)制,DropConnect和Dropout混合使用的CNN-BiLSTM模型。F2,F(xiàn)3和F4模型為CNN-BiLSTM模型,F(xiàn)5為傳統(tǒng)CNN模型。具體如表2所示。
表2 不同模型的變量設(shè)置Tab.2 Variable settings for different models
3.3.1 泛化性和抗噪性試驗(yàn)
試驗(yàn)1:泛化性試驗(yàn)。本研究所提模型主要針對(duì)驅(qū)動(dòng)端數(shù)據(jù)下的軸承故障診斷,本次試驗(yàn)選用4種不同工況數(shù)據(jù),也選用風(fēng)扇端的數(shù)據(jù)和Mad Net軸承數(shù)據(jù)來(lái)驗(yàn)證筆者所提模型的性能。不同數(shù)據(jù)集下模型的正確率如表3所示。
表3 不同數(shù)據(jù)集下模型的正確率Tab.3 Model correct rate under different data sets %
由表3可知:筆者所提模型在驅(qū)動(dòng)端的平均正確率高達(dá)99.93%,而文獻(xiàn)[7]提出的DCNN模型僅為99.10%;所提模型在驅(qū)動(dòng)端數(shù)據(jù)和風(fēng)扇端數(shù)據(jù)都能達(dá)到較高的識(shí)別率,但是二者并不相同。造成同一個(gè)模型針對(duì)不同數(shù)據(jù)集正確率不同的原因,可能是兩者的軸承型號(hào)不同、軸承和傳感器安裝位置不同等因素造成。雖然本研究模型主要是針對(duì)驅(qū)動(dòng)端(同類型軸承)不同工況的故障診斷分析,但是在風(fēng)扇端(其他類型軸承)不同工況下其診斷平均正確率可達(dá)100%,在Mad Net軸承數(shù)據(jù)的10類故障軸承數(shù)據(jù)試驗(yàn)中,其診斷率也高達(dá)100%。通過(guò)本次試驗(yàn)可知,本研究模型有較好的泛化能力。
試驗(yàn)2:抗噪性試驗(yàn)。本次試驗(yàn)在選用驅(qū)動(dòng)端的4種不同工況數(shù)據(jù)測(cè)試時(shí),向測(cè)試數(shù)據(jù)集加入高斯白噪聲SNR=0 db模擬工業(yè)噪聲環(huán)境,求出各模型平均正確率,其結(jié)果如表4和圖5所示。
表4 在0 db時(shí)不同模型在不同工況下的正確率Tab.4 The correct rate of different models under different working conditions at 0 db %
圖5 不同模型的平均正確率Fig.5 The average correct rate of different models
由 表4和圖5可以看到,在0 db時(shí),5個(gè)模 型在不同工況下診斷能力總存在有高有低的情況,由此說(shuō)明同一個(gè)模型很難在所有的工況下都達(dá)到較高的正確率。但是通過(guò)分析發(fā)現(xiàn),筆者所提出的F1模型整體性能是最高的,其平均正確率高達(dá)98.23%,比F2模型高出0.40%,比F3模型高出2.84%,比F4模型高出4.49%,比F5模型高出5.70%。通過(guò)本次試驗(yàn)可以證明,噪聲環(huán)境下,筆者所提模型有較高的整體抗噪性。
試驗(yàn)3:噪聲下的泛化性試驗(yàn)。為了驗(yàn)證筆者所提模型在噪聲環(huán)境下的泛化性,選用驅(qū)動(dòng)端和風(fēng)扇端下的4種不同工況的故障數(shù)據(jù)。本次試驗(yàn)?zāi)M測(cè)試數(shù)據(jù)集在SNR=0 db環(huán)境下,筆者所提模型在2種不同軸承上的正確率,其結(jié)果如表5所示。
表5 在0 db時(shí)不同軸承在4種工況下的正確率Tab.5 The correct rate of different bearings under 4 working conditions at 0 db %
通過(guò)表5可知,當(dāng)SNR為0 db時(shí),驅(qū)動(dòng)端和風(fēng)扇端在4種不同工況下的正確率都高于90%。驅(qū)動(dòng)端數(shù)據(jù)在4種不同工況數(shù)據(jù)的平均故障診斷正確率高達(dá)98.23%,風(fēng)扇端也可以達(dá)到96.06%。通過(guò)試驗(yàn)可以證明,筆者所提模型在噪聲環(huán)境下依然有較強(qiáng)的泛化性。
取山羊奶發(fā)酵乳5 mL,4℃4000×g離心10 min,取上清液測(cè)定抗氧化活性。山羊奶發(fā)酵羊乳p H值調(diào)至2.0,然后取1 mL接于含9 mL的人工胃酸試管中,充分混勻后37℃保溫2 h,沸水浴加熱10 min以終止反應(yīng)。測(cè)定消化前后的抗氧化活性。再將其p H調(diào)至6.8,以1∶9的體積比加入至人工腸液中,于37℃恒溫水浴中模擬消化2 h,沸水浴加熱10 min以終止反應(yīng),再取樣測(cè)定其抗氧化。
試驗(yàn)4:Mad Net軸承數(shù)據(jù)試驗(yàn)。本次試驗(yàn)選取Mad Net軸承數(shù)據(jù),測(cè)試不同模型在SNR=-2 db環(huán)境中的故障診斷能力及各模型的訓(xùn)練時(shí)間,其結(jié)果如表6所示。
表6 在-2 db時(shí)不同模型的正確率和訓(xùn)練時(shí)間Tab.6 The correct rate and training time of different models at-2 db
由表6可知,筆者所提模型在強(qiáng)噪聲環(huán)境下識(shí)別Mad Net軸承數(shù)據(jù)集的正確率達(dá)到了94.13%,遠(yuǎn)高于其他模型。本研究主模型F1是基于F4模型CNN-BiLSTM網(wǎng)絡(luò)改進(jìn)的,增加了注意力機(jī)制,將DropConnect和Dropout混合使用。在時(shí)間僅增加6.88 s的基礎(chǔ)上,本研究模型在強(qiáng)噪聲環(huán)境下的故障診斷能力提升了16.48%,說(shuō)明了本研究模型在犧牲較短時(shí)間的基礎(chǔ)上,獲得了較高的正確率。
3.3.2 自適應(yīng)變工況測(cè)試
試驗(yàn)1:故障診斷領(lǐng)域常見(jiàn)方法對(duì)比試驗(yàn)。自適應(yīng)變工況測(cè)試一直是故障診斷領(lǐng)域的難點(diǎn),即訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集不是同一個(gè)工況。本次試驗(yàn)選用驅(qū)動(dòng)端的0,0.75和1.50 kW混合數(shù)據(jù)訓(xùn)練模型,使用2.25 kW進(jìn)行測(cè)試。主要采用一些故障診斷領(lǐng)域常見(jiàn)的方法,如k最近鄰、支持向量機(jī)、BP神經(jīng)網(wǎng)絡(luò)、文獻(xiàn)[7]DCNN模型和文獻(xiàn)[9]1DCNNLSTM模型等方法與本研究的方法進(jìn)行了比較。其正確率如表7所示。
表7 當(dāng)0,0.75和1.50 kW混合訓(xùn)練2.25 kW測(cè)試正確率Tab.7 2.25 kW test correct rate,when 0,0.75 and 1.50 kW mixed training %
通過(guò)表7可知,用驅(qū)動(dòng)端的0,0.75和1.50 kW工況下的混合數(shù)據(jù)訓(xùn)練模型,用2.25 kW進(jìn)行測(cè)試。筆者所提方法正確率高達(dá)100%,比一些傳統(tǒng)方法和部分深度學(xué)習(xí)方法的正確率都高,體現(xiàn)出了本研究模型有極高的故障診斷能力。
再選用跟文獻(xiàn)[4]多核SSTCA-SVM模型一樣的特定變工況類型。1.50 kW訓(xùn)練,0.75 kW測(cè)試;1.50和0 kW混 合 訓(xùn) 練,0.75和2.25 kW混 合 測(cè) 試;1.50,2.25和0 kW混合訓(xùn)練,0.75 kW測(cè)試3種類型試驗(yàn)。其結(jié)果如表8所示。
表8 本研究方法與多核SSTCA-SVM對(duì)比正確率Tab.8 Comparison of the method in this paper and multi-core SSTCA-SVM correct rate %
由表8可以看出,在以上3種特定變工況類型試驗(yàn)中,筆者所提模型的正確率都高于文獻(xiàn)[4]。本研究的平均正確率高達(dá)98.96%,比文獻(xiàn)[4]高出2.71%。
試驗(yàn)2:變工況下深度學(xué)習(xí)領(lǐng)域的算法對(duì)比試驗(yàn)。接下來(lái)主要是與其他論文提出的關(guān)于軸承故障診斷的深度學(xué)習(xí)方法做比較,使用文獻(xiàn)[6]IDSCNN模型和文獻(xiàn)[8]集成TICNN模型相同的方法做對(duì)比試驗(yàn)。選用0.75,1.50和2.25 kW下驅(qū)動(dòng)端軸承數(shù)據(jù),僅用一種工況數(shù)據(jù)訓(xùn)練模型,測(cè)試時(shí)分別用另一種工況數(shù)據(jù)測(cè)試,其結(jié)果如表9所示。
表9 一種工況訓(xùn)練另外一種工況測(cè)試的正確率Tab.9 The correct rate of one working condition training and another working condition test %
由表9可知,筆者所提的方法平均正確率高達(dá)98.88%,比將原始時(shí)域信號(hào)作為輸入的集成TICNN模型高出2.78%。IDSCNN模型的輸入是將原始時(shí)域振動(dòng)信號(hào)經(jīng)過(guò)了特征提取,將振動(dòng)信號(hào)的FFT特征的均方根圖作為模型輸入。由于IDSCNN模型的輸入數(shù)據(jù)是經(jīng)過(guò)復(fù)雜的人為特征提取,因此其正確率可以高達(dá)98.40%。但是IDSCNN模型相較于本研究直接把原始信號(hào)作為模型輸入進(jìn)行變工況下的故障診斷,其平均正確率也比本研究低0.44%。通過(guò)跟上述文獻(xiàn)中的方法比較,筆者所提模型都取得了較高的精確度。
試驗(yàn)3:不同變工況下的試驗(yàn)。由于軸承實(shí)際工作情況下很少出現(xiàn)0 kW的情況,所以接下來(lái)的試驗(yàn)不再考慮0 kW的情況下。選用0.75,1.50和2.25 kW的驅(qū)動(dòng)端數(shù)據(jù)試驗(yàn)。分別采用一種工況數(shù)據(jù)訓(xùn)練,其余兩種工況數(shù)據(jù)混合測(cè)試;用兩種工況數(shù)據(jù)訓(xùn)練,其余一種工況數(shù)據(jù)測(cè)試。其結(jié)果如表10和表11所示。
表10 一種工況數(shù)據(jù)訓(xùn)練兩種工況數(shù)據(jù)混合測(cè)試正確率Tab.10 One working condition data training correct rateofmixedtestoftwoworkingconditiondata %
表11 兩種工況訓(xùn)練一種測(cè)試的正確率Tab.11 The correct rate of the other test for training under two working conditions %
通過(guò)試驗(yàn)可知,用一種工況訓(xùn)練,另外兩種混合工況測(cè)試,本研究模型的平均正確率為98.78%。結(jié)合試驗(yàn)2可知,兩種工況混合測(cè)試比分別測(cè)試兩種工況的平均正確率98.88%略低。本次試驗(yàn)比試驗(yàn)2低的原因,結(jié)合實(shí)際情況可推斷為當(dāng)測(cè)試數(shù)據(jù)較為復(fù)雜時(shí),其正確率略有下降。
當(dāng)兩種混合工況訓(xùn)練、單一工況測(cè)試時(shí),其最低正確率也能高達(dá)99%,其平均正確率為99.67%,比用一種工況數(shù)據(jù)訓(xùn)練模型的平均正確率98.78%高出0.89%。結(jié)合實(shí)際情況可知,如果能夠獲取足夠多的故障工況訓(xùn)練模型,那么有助于對(duì)將會(huì)出現(xiàn)的故障進(jìn)行診斷;當(dāng)獲取的故障工況越少,越難以診斷故障。因此可知,本研究上述試驗(yàn)結(jié)果滿足實(shí)際工作情況。
3.3.3 自適應(yīng)變工況下噪聲測(cè)試
由于實(shí)際工作中一般難以獲得足夠多的故障工況數(shù)據(jù),因此在故障診斷時(shí)會(huì)帶來(lái)一定的挑戰(zhàn)。本研究充分考慮實(shí)際情況,本次試驗(yàn)選用驅(qū)動(dòng)端軸承在0.75,1.50和2.25 kW下的數(shù)據(jù),只研究一種工況數(shù)據(jù)訓(xùn)練模型,用其他工況數(shù)據(jù)測(cè)試。軸承實(shí)際工作時(shí)不僅會(huì)受到工況變化的影響,也會(huì)受到噪聲的干擾,因此本小節(jié)做自適應(yīng)變工況下噪聲測(cè)試。如:0.75 kW訓(xùn)練模型時(shí),診斷過(guò)程中分別用1.50 kW,2.25 kW,1.50和2.25 kW混合的3類數(shù)據(jù)集測(cè)試。測(cè)試階段,模擬-4~4 db噪聲環(huán)境。首先分別用0.75,1.50和2.25 kW訓(xùn)練好3個(gè)模 型,然后 依次求出每個(gè)模型在每db噪聲環(huán)境下,3類測(cè)試數(shù)據(jù)集正確率的平均值。如在-4 db環(huán)境下的最終值,實(shí)際是在3個(gè)模型上分別測(cè)出3個(gè)值,然后對(duì)這9個(gè)值求其平均。各模型在每db噪聲下的正確率及其平均值如表12和圖6所示。
表12 一種工況訓(xùn)練其余工況測(cè)試的正確率Tab.12 The correct rate of one working condition training and other working condition test %
圖6 不同模型在不同噪聲下的正確率Fig.6 The correct rate of different models under different noises
由表12和圖6可以看到,筆者所提的F1模型在-4~4 db噪聲環(huán)境中,每db噪聲下都高于其他幾種模型。F4僅比F5多了一層BiLSTM網(wǎng)絡(luò),但在任何噪聲環(huán)境下F4都比F5高。在-4~4 db下,F(xiàn)4平均正確率為87.45%,比F5高出0.98%。F3是在F4的BiLSTM層中引入了注意力機(jī)制,此時(shí)F3不僅在任何噪聲下都比F4和F5高,而且其最終平均值高達(dá)90.00%。由此可見(jiàn),在網(wǎng)絡(luò)中引入注意力機(jī)制可以使模型在訓(xùn)練時(shí),將更多的注意力放在重要的特征挖掘上,從而極大地提高模型的識(shí)別率。
F2與F3,F(xiàn)4及F5相比,F(xiàn)2與F3區(qū)別僅在Dropout位 置 不 同。F2在A-BiLSTM中 加Dropout,F(xiàn)3是 在全連接層中加。在SNR為-2時(shí),F(xiàn)2正確率就達(dá)到了90.01%。然 而F3,F(xiàn)4和F5均 在90%以下,僅 在SNR大于0時(shí),才達(dá)到了90%以上。因此,可以證明將Dropout添加在A-BiLSTM層能夠更好地防止隨著模型層數(shù)的加深而產(chǎn)生過(guò)擬合問(wèn)題。
F1模型與其他模型相比,其最大不同在于將DropConnect和Dropout混合使用。F1主要在F2的全連接層權(quán)重上添加了DropConnect=0.5。F1模型在-4~4 db環(huán)境下,都高于其他幾種模型,在SNR為-4 db時(shí)可以達(dá)到81.90%,其他模型均不到80%;在-2 db時(shí)達(dá)到了92.05%;在0 db時(shí)高達(dá)96.77%;在4 db時(shí)更是高達(dá)98.77%。在噪聲環(huán)境下其平均值可以高達(dá)94.06%,比沒(méi)有DropConnect的F2高出了1.30%,比F3高 出4.06%,比F4高出6.61%,比傳統(tǒng)CNN模型F5高出7.59%。F1模型同時(shí)使用了DropConnect和Dropout,DropConnect通過(guò)將CNN網(wǎng)絡(luò)的一部分輸入的數(shù)據(jù)置為0,以此防止CNN模型訓(xùn)練時(shí)的過(guò)擬合問(wèn)題,而Dropout則通過(guò)丟棄BiLSTM層的一部分輸出數(shù)據(jù),防止網(wǎng)絡(luò)模型層數(shù)加深而產(chǎn)生的過(guò)擬合問(wèn)題。因此,通過(guò)將DropConnect和Dropout混合使用可以在一定程度上提高模型的整體性能。
綜上分析,在用一種工況下的數(shù)據(jù)訓(xùn)練模型,用其余數(shù)據(jù)集在-4~4 db環(huán)境下測(cè)試模型的故障診斷能力。本研究帶有注意力機(jī)制、DropConnect和Dropout混合使用的CNN-BiLSTM模型具有較強(qiáng)的抗干擾能力,在強(qiáng)噪聲環(huán)境下,也具有較高的故障診斷能力。
3.3.4 模型結(jié)果可視化
本小節(jié)主要展示測(cè)試過(guò)程中各網(wǎng)絡(luò)層處理故障數(shù)據(jù)的情況和最后的分類正確率。由于篇幅有限,僅展示SNR為0 db時(shí),用2.25 kW訓(xùn)練模型,用0.75和1.50 kW混合數(shù)據(jù)集的800個(gè)樣本的測(cè)試情況。圖7選用t-隨機(jī)鄰近嵌入(t-distributed stochastic neighbor embedding,簡(jiǎn)稱t-SNE)算法展示了測(cè)試樣本在各網(wǎng)絡(luò)層中的特征分布情況。圖8通過(guò)混淆矩陣的方法展示了測(cè)試數(shù)據(jù)集的最終測(cè)試結(jié)果,詳細(xì)地列出了各個(gè)類別的分類情況和準(zhǔn)確性。
圖7 測(cè)試樣本的特征分布圖Fig.7 Feature distribution of test samples
圖8 測(cè)試結(jié)果的正確率Fig.8 The correct rate of test results
通過(guò)圖7可以看到,測(cè)試數(shù)據(jù)在早期層中是不可分的,隨著層數(shù)加深,特征變得越來(lái)越可分。標(biāo)簽10(正常狀態(tài))在Conv2層的時(shí)候已經(jīng)完全被分離開(kāi),這表明筆者所提模型有較強(qiáng)的區(qū)分故障信號(hào)與無(wú)故障信號(hào)的能力。在帶有注意力機(jī)制的網(wǎng)絡(luò)層(A-BiLSTM)中,可以看到不同類別之間區(qū)分得更加明顯,同類故障之間聚集更加緊湊。通過(guò)圖8可知,筆者所提方法在SNR為0 db時(shí),針對(duì)滾動(dòng)軸承的大多數(shù)故障類別都可以達(dá)到100%的診斷能力。僅標(biāo)簽2(滾動(dòng)體故障0.355 6 mm)和標(biāo)簽3(滾動(dòng)體故障0.533 4 mm)有少量故障被分類到標(biāo)簽1(滾動(dòng)體故障0.177 8 mm)上,其二者的錯(cuò)誤率分別為0.60%和1.20%,與模型測(cè)試輸出的98.20%正確率相吻合。
1)本研究通過(guò)將帶有注意力機(jī)制、DropConnect和Dropout混合使用加入到CNN-BiLSTM模型中,實(shí)現(xiàn)了滾動(dòng)軸承在變工況的噪聲環(huán)境下的故障診斷。在選用驅(qū)動(dòng)端和風(fēng)扇端的兩類軸承分別在4種不同工況的故障數(shù)據(jù),在測(cè)試數(shù)據(jù)集的SNR為0 db時(shí),驅(qū)動(dòng)端平均故障診斷正確率高達(dá)98.23%,風(fēng)扇端也可以達(dá)到96.06%;而且Mad Net軸承數(shù)據(jù)在-2 db下可以達(dá)到94.13%。因此,筆者所提模型在噪聲環(huán)境中具有較強(qiáng)的泛化性和抗噪性。
2)在自適應(yīng)測(cè)試變工況試驗(yàn)中,選用驅(qū)動(dòng)端的0,0.75和1.50 kW混合訓(xùn)練模型,2.25 kW作為測(cè)試時(shí),本研究所提方法高于故障診斷領(lǐng)域常見(jiàn)的方法,正確率高達(dá)100%。在用一種工況數(shù)據(jù)訓(xùn)練模型,分別用另一種工況數(shù)據(jù)測(cè)試時(shí),本研究模型平均正確率高達(dá)98.88%,也高于部分文獻(xiàn)中使用深度學(xué)習(xí)的方法。同時(shí),在噪聲和變工況的復(fù)雜環(huán)境中,通過(guò)比較不同模型,在-4~4 db噪聲下,筆者所提方法正確率高達(dá)94.06%,體現(xiàn)了本研究模型的優(yōu)越性。
3)本研究在CNN-BiLSTM網(wǎng)絡(luò)中引入有注意力機(jī)制,可以幫助網(wǎng)絡(luò)模型將更多的注意力放在重要特征的提取上;將DropConnect和Dropout混合使用可以分別防止CNN網(wǎng)絡(luò)和BiLSTM網(wǎng)絡(luò)在訓(xùn)練過(guò)程中的過(guò)擬合問(wèn)題,達(dá)到了提升模型故障診斷能力的效果。