韓 輝,程德權(quán),徐 赫
(沈陽理工大學(xué)機(jī)械工程學(xué)院,沈陽 110159)
給水泵是電廠鍋爐供水系統(tǒng)中十分重要的設(shè)備。隨著社會發(fā)展進(jìn)步,工業(yè)生產(chǎn)和日常生活對用電的需求大大提高,這就迫使電廠鍋爐必須維持長時(shí)間的運(yùn)行,并且對其強(qiáng)度的要求也超過了以往,這也進(jìn)一步導(dǎo)致水泵出現(xiàn)故障問題的概率明顯增高了。電動(dòng)給水泵組由給水泵、液力耦合器、電動(dòng)機(jī)3部分組成,通過液力耦合器來驅(qū)動(dòng)給水泵的轉(zhuǎn)動(dòng),水泵兩側(cè)由軸承支撐。根據(jù)某電廠采集到的數(shù)據(jù)發(fā)現(xiàn),給水泵發(fā)生故障大部分都是出現(xiàn)在軸承上,所以有必要對水泵軸承進(jìn)行故障診斷。基于人工智能的故障診斷方法,已經(jīng)廣泛應(yīng)用于旋轉(zhuǎn)機(jī)械的故障診斷并取得了較好的效果[1]。
傳統(tǒng)的數(shù)據(jù)驅(qū)動(dòng)方法通常先嘗試設(shè)計(jì)一組合適的特征,然后將它們放入一些淺層的機(jī)器學(xué)習(xí)模型中,如貝葉斯網(wǎng)絡(luò)、支持向量機(jī)(SVM)。Samanta[2]提取了軸承健康狀況的時(shí)域特征,并比較了采用粒子群優(yōu)化算法優(yōu)化的神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的診斷結(jié)果;袁勝發(fā)等[3]通過對傳統(tǒng)支持向量機(jī)的研究,在其基礎(chǔ)上添加了一種網(wǎng)格多分類算法,并且將這種新型的支持向量機(jī)應(yīng)用于渦輪泵試驗(yàn)臺多故障診斷中,得到了很好的準(zhǔn)確率。但是這些工作通常側(cè)重于手動(dòng)特征提取(統(tǒng)計(jì)特征、頻率和時(shí)間-頻率特征),這些特征總是需要大量的人力。同時(shí),這些特征的選擇離不開專業(yè)知識,所以對人的專業(yè)技能有很大要求。
最近幾年,深度學(xué)習(xí)快速發(fā)展,應(yīng)用深度學(xué)習(xí)方法的特征學(xué)習(xí)在機(jī)器學(xué)習(xí)領(lǐng)域中激發(fā)了人們研究學(xué)習(xí)的興趣。深度學(xué)習(xí),也叫做深度神經(jīng)網(wǎng)絡(luò)(Deep neural net?work,DNN),是在機(jī)器學(xué)習(xí)的基礎(chǔ)上演變的一種新的特征學(xué)習(xí)方法,具有多層隱含表示層。這種復(fù)雜的深層結(jié)構(gòu)與簡單的淺層結(jié)構(gòu)比起來,能夠?qū)W習(xí)具有多級抽象的復(fù)雜原始數(shù)據(jù)的表示,這使得其可以很容易地提取用于構(gòu)造分類器或預(yù)測器的有用特性[4-6]。堆疊自編碼(Stacked auto-encoders,SAE)網(wǎng)絡(luò)由RANZATO等[7]提出,是深度學(xué)習(xí)領(lǐng)域中的一種具有代表性的網(wǎng)絡(luò)結(jié)構(gòu)模型,經(jīng)過試驗(yàn)與驗(yàn)證,已經(jīng)證明了該網(wǎng)絡(luò)模型的優(yōu)異性,目前在圖像分類及故障診斷等領(lǐng)域應(yīng)用非常成功。比如郭亮等[8]提出了一種基于SAE網(wǎng)絡(luò)的滾動(dòng)軸承故障方法,該方法從測得的軸承故障信號中提取出時(shí)域、頻域和時(shí)頻域多種特征,之后將這些提取到的特征輸入到SAE網(wǎng)絡(luò)中學(xué)習(xí),得到了很好的分類識別效果,證明了SAE網(wǎng)絡(luò)的優(yōu)越性。Zhou Xiang等[9]針對滾動(dòng)軸承在轉(zhuǎn)速和載荷均發(fā)生變化時(shí)的故障診斷,提出了一種基于Tea?ger計(jì)算順序譜(TCO譜)和堆疊自動(dòng)編碼器(SAE)的診斷方法。診斷結(jié)果表明,無論轉(zhuǎn)速和負(fù)載如何變化,該方法都能夠自適應(yīng)地從滾動(dòng)軸承的振動(dòng)信號中學(xué)習(xí)特征。
SAE網(wǎng)絡(luò)能夠很好地從數(shù)據(jù)中提取有用的特征,但是SAE網(wǎng)絡(luò)有一個(gè)明顯的缺點(diǎn),就是只在訓(xùn)練集上簡單地對輸入數(shù)據(jù)進(jìn)行還原重構(gòu),這樣學(xué)習(xí)得到的特征泛能力不高[10]。因此VINCENT等[11]提出一種SDAE網(wǎng)絡(luò)模型,DAE以一個(gè)被破壞的數(shù)據(jù)版本作為輸入,對原始輸入進(jìn)行重構(gòu)或去噪,這不僅防止AE簡單地學(xué)習(xí)輸入與重構(gòu)輸出之間的身份映射,而且可以從有噪聲的數(shù)據(jù)中捕捉到更有效的表示。與SAE相比,學(xué)習(xí)到的特征具有更好的魯棒性。王麗華等[12]提出了一種新的工具磨損狀態(tài)識別方法,該方法基于堆疊式降噪自動(dòng)編碼(Stacked de-noising auto-encoders,SDAE),通過測得的工具聲發(fā)射信號輸入到內(nèi)置的SDAE神經(jīng)網(wǎng)絡(luò)中進(jìn)行學(xué)習(xí),并對自編碼網(wǎng)絡(luò)進(jìn)行監(jiān)督和微調(diào),以實(shí)現(xiàn)對工具磨損狀態(tài)的準(zhǔn)確識別。YU[13]提出了一種具有負(fù)相關(guān)學(xué)習(xí)的選擇性堆疊去噪自編碼器(SDAE)用于齒輪箱故障診斷,該方法從振動(dòng)噪聲信號中提取出了有效的故障特征,并且建立了可靠的故障診斷模型,從而取得了更好的故障診斷準(zhǔn)確率。
相對于鍋爐、汽輪機(jī)這些大型設(shè)備來說,電動(dòng)給水泵這類設(shè)備并沒有被給予足夠的重視,是設(shè)備狀態(tài)監(jiān)測的薄弱環(huán)節(jié)。某電投電力集團(tuán)公司2013—2018年機(jī)組非停機(jī)事故共64次,其中因電動(dòng)給水泵的轉(zhuǎn)子不平衡振動(dòng)故障、軸承故障、電機(jī)故障和液力耦合器故障等導(dǎo)致的非停機(jī)事故達(dá)27起,占42.18%,最多的還是軸承故障。所以有必要對電動(dòng)給水泵的軸承進(jìn)行故障監(jiān)測與診斷。實(shí)際工作環(huán)境中,電動(dòng)給水泵工作采集到的數(shù)據(jù)中,測得的信號會有噪聲干擾,目前沒文獻(xiàn)對給水泵軸承提出故障診斷方法,并且沒考慮實(shí)際環(huán)境的噪聲,因此本文提出了一種基于SDAE網(wǎng)絡(luò)的水泵軸承故障診斷。本文實(shí)驗(yàn)數(shù)據(jù)來自美國凱斯西儲大學(xué)(Case Western Reserve University)軸承數(shù)據(jù)庫,根據(jù)軸承的故障類型制定標(biāo)簽,搭建SDAE網(wǎng)絡(luò),網(wǎng)絡(luò)的輸入向量為測得的軸承振動(dòng)時(shí)域信號,通過SDAE網(wǎng)絡(luò)實(shí)現(xiàn)了對軸承故障類型的識別。
自動(dòng)編碼器(AE)是Rumelhart[14]提出的一種典型的單隱層神經(jīng)網(wǎng)絡(luò)。因?yàn)檫@個(gè)網(wǎng)絡(luò)使輸入和輸出盡可能一致,在這種情況下,隱含層特征提取和參數(shù)學(xué)習(xí)以無監(jiān)督的方式實(shí)現(xiàn),被稱為AE。在AE結(jié)構(gòu)中,神經(jīng)元在輸入層和輸出層擁有相同數(shù)量的數(shù)據(jù)。自動(dòng)編碼器網(wǎng)絡(luò)結(jié)構(gòu)示意圖如圖1所示。
圖1 自編碼網(wǎng)絡(luò)結(jié)構(gòu)
自編碼網(wǎng)絡(luò)各神經(jīng)元采用全連接的方式將輸入向量X=(x1,x2,…,xn),經(jīng)過加權(quán)求和,然后加上偏置后通過激活函數(shù),得到隱藏層的編碼向量Y=(y1,y2,…,ym);編碼向量通過解碼網(wǎng)絡(luò)重新映射到輸出向量;最后要保證輸入、輸出層盡可能相似,即以重構(gòu)誤差最小為目標(biāo)對權(quán)值和偏置進(jìn)行調(diào)整優(yōu)化。自編碼網(wǎng)絡(luò)的數(shù)學(xué)表述如下:
式 中:Wa∈Rn×m、Ws∈Rm×n、ba∈Rm、bs∈Rn為 權(quán) 值 和 偏置;σa(?)、σs(?)為激活函數(shù)。
在實(shí)際應(yīng)用中,由于環(huán)境原因,會有噪聲混入到訓(xùn)練樣本數(shù)據(jù)中,從而導(dǎo)致數(shù)據(jù)的真實(shí)性不高。因?yàn)樵肼暤脑颍ㄟ^自動(dòng)編碼器得到的特征就會產(chǎn)生誤差。降噪自編碼器(denoisingauto-encoder,DAE)[15]就是為了要消除這種噪聲的干擾而被提出來的,結(jié)構(gòu)如圖2所示。通過對數(shù)據(jù)樣本人工加噪聲后再輸入到DAE網(wǎng)絡(luò),通過隱含層的提取還原,盡可能消除噪聲的干擾,還原出同原始樣本相同的數(shù)據(jù)[16]。
圖2 降噪自編碼網(wǎng)絡(luò)結(jié)構(gòu)
在訓(xùn)練樣本x中加入將隨機(jī)分布噪聲qD,其表達(dá)式如下:
式中:x?為加入噪聲后的樣本;qD為二項(xiàng)分布隨機(jī)噪聲。
DAE通過在訓(xùn)練樣本中加入隨機(jī)噪聲,這樣自動(dòng)編碼器必須學(xué)習(xí)去除噪聲以獲得真正的沒有被噪聲污染的原始信號特征,從而使系統(tǒng)具有更強(qiáng)悍的泛化能力。
想得到更好的特征表達(dá),SDAE可以將多個(gè)DAE編碼器部分在每一層疊加,將上一層隱藏的降噪編碼器作為下一層的輸入,形成一個(gè)由多個(gè)DAE上下連接而成的模型結(jié)構(gòu)[17]。圖3所示為SDAE網(wǎng)絡(luò)結(jié)構(gòu)圖。網(wǎng)絡(luò)結(jié)構(gòu)分為有監(jiān)督與無監(jiān)督網(wǎng)絡(luò),SDAE網(wǎng)絡(luò)結(jié)構(gòu)屬于后者即無監(jiān)督網(wǎng)絡(luò),這就使得其本身沒有辦法進(jìn)行樣本區(qū)分,為了實(shí)現(xiàn)樣本分類這個(gè)功能,本文在SDAE網(wǎng)絡(luò)的最后1層加入1個(gè)Softmax分類器[18],使整個(gè)網(wǎng)絡(luò)成為有監(jiān)督的網(wǎng)絡(luò)。
圖3 SDAE結(jié)構(gòu)
基于SDAE的軸承故障診斷流程如圖4所示。
圖4 SDAE故障診斷流程
訓(xùn)練和測試算法流程如下:
(1)從西儲大學(xué)軸承數(shù)據(jù)庫中獲取數(shù)據(jù),經(jīng)過數(shù)據(jù)預(yù)處理,將處理好的時(shí)域信號作為SDAE網(wǎng)絡(luò)的輸入;
(2)參數(shù)設(shè)置,設(shè)置診斷網(wǎng)絡(luò)的網(wǎng)絡(luò)層數(shù)以及各項(xiàng)參數(shù);
(3)SDAE訓(xùn)練,訓(xùn)練分兩部分,先訓(xùn)練DAE,訓(xùn)練好之后保存DAE模型,接著訓(xùn)練SDAE網(wǎng)絡(luò);
(4)訓(xùn)練好之后輸出診斷結(jié)果。
本次試驗(yàn)數(shù)據(jù)來自美國凱斯西儲大學(xué)(Case West?ern Reserve University)軸承數(shù)據(jù)庫,圖5所示為實(shí)驗(yàn)裝置,結(jié)構(gòu)有3部分,分別為電機(jī)、扭矩傳感器、功率計(jì)。實(shí)驗(yàn)中為了模擬軸承故障,通過使用電火花人工添加故障,分別在軸承滾動(dòng)體外圈、內(nèi)圈上加工了3種不同故障尺寸(0.17 mm/0.35 mm/0.53 mm)來代表軸承不同的故障程度。將振動(dòng)加速度傳感器分別安裝在風(fēng)扇端、電機(jī)驅(qū)動(dòng)端和基座,用來采集振動(dòng)信號,采用的傳感器的采樣頻率為12 000 Hz。軸承轉(zhuǎn)速為1 797 r/min,電機(jī)負(fù)載為0。驅(qū)動(dòng)端模擬水泵吸入側(cè),風(fēng)扇端模擬水泵吐出側(cè)。所有數(shù)據(jù)文件都是Matlab(*.mat)格式。其中:DE為驅(qū)動(dòng)端傳感器數(shù)據(jù),F(xiàn)E為風(fēng)扇端傳感器數(shù)據(jù),BA為基座傳感器數(shù)據(jù)。故障模擬類型如表1所示。
圖5 試驗(yàn)裝置
表1 故障模擬類型
以被側(cè)軸承旋轉(zhuǎn)一圈傳感器采集的樣本量nc作為一組數(shù)據(jù),樣本量的大小與傳感器采樣頻率fs和轉(zhuǎn)速m相關(guān),其計(jì)算公式為[19]:
經(jīng)計(jì)算,軸承旋轉(zhuǎn)一圈傳感器采集400個(gè)點(diǎn)。將n行1列的基座振動(dòng)故障數(shù)據(jù)轉(zhuǎn)換為[n/400,400]的矩陣,其中n為故障數(shù)據(jù)的樣本量,并且在矩陣轉(zhuǎn)換過程中,去掉不足一圈采樣點(diǎn)的最后一行。同理,驅(qū)動(dòng)端和風(fēng)扇端傳感器的序貫故障數(shù)據(jù)進(jìn)行矩陣變換,以軸承旋轉(zhuǎn)一圈過程中,基座、驅(qū)動(dòng)端和風(fēng)扇端傳感器的樣本集作為一個(gè)故障樣本,可得:
按照上述思路構(gòu)建11類故障的樣本空間,并構(gòu)建相應(yīng)的標(biāo)簽矩陣。經(jīng)過預(yù)處理獲得的樣本空間可以視為以1 200個(gè)屬性表征故障。將樣本的2/3作為訓(xùn)練集,1/3作為測試集。
因?yàn)榻?jīng)過上面數(shù)據(jù)預(yù)處理,軸承振動(dòng)信號具有1 200個(gè)維度,因此被輸入到網(wǎng)絡(luò)中,SDAE網(wǎng)絡(luò)輸入層中的神經(jīng)元個(gè)數(shù)為1 200。由于軸承加工故障狀態(tài)有11種,因此相應(yīng)網(wǎng)絡(luò)的輸出層中的節(jié)點(diǎn)數(shù)設(shè)置為11。SDAE網(wǎng)絡(luò)實(shí)質(zhì)上是將幾個(gè)DAE網(wǎng)絡(luò)按照要求進(jìn)行堆疊的,因此,整個(gè)網(wǎng)絡(luò)的訓(xùn)練效果與網(wǎng)絡(luò)層數(shù)和隱含層神經(jīng)元節(jié)點(diǎn)數(shù)有著很大關(guān)系。網(wǎng)絡(luò)提取的最終特征向量由網(wǎng)絡(luò)層數(shù)和隱含層神經(jīng)元節(jié)點(diǎn)數(shù)決定,能否恰當(dāng)選取網(wǎng)絡(luò)層數(shù)和隱含層神經(jīng)元節(jié)點(diǎn)數(shù)影響著軸承故障狀態(tài)識別的精確度。為了得到識別效果最好的網(wǎng)絡(luò)參數(shù),在其他網(wǎng)絡(luò)參數(shù)(表2)不變的情況下,本文對比了在不同網(wǎng)絡(luò)結(jié)構(gòu)下軸承故障狀態(tài)識別的準(zhǔn)確率,識別結(jié)果如表3所示。由表可知,當(dāng)SDAE網(wǎng)絡(luò)具有相同的層數(shù)時(shí),網(wǎng)絡(luò)的測試精度不會隨著隱含層神經(jīng)元節(jié)點(diǎn)數(shù)的增加而增加。另外,當(dāng)增加網(wǎng)絡(luò)層數(shù)時(shí),SDAE網(wǎng)絡(luò)的測試精度并不會提高。其結(jié)果表明,SDAE網(wǎng)絡(luò)的隱藏層神經(jīng)元節(jié)點(diǎn)數(shù)和網(wǎng)絡(luò)層數(shù)不是越多越好,而是要選擇恰當(dāng)?shù)摹T趯?shí)驗(yàn)中,網(wǎng)絡(luò)層數(shù)為5層,結(jié)構(gòu)為1200-600-300-150-50-11的準(zhǔn)確率最高,所以本次實(shí)驗(yàn)選用該種結(jié)構(gòu)。
表2 SDAE網(wǎng)絡(luò)參數(shù)
表3 不同網(wǎng)絡(luò)結(jié)構(gòu)下SDAE網(wǎng)絡(luò)識別結(jié)果
為了尋找合適的網(wǎng)絡(luò)噪聲系數(shù),本節(jié)采用上節(jié)中的最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)1200-600-300-150-50-11進(jìn)行分析,測試結(jié)果如表4所示。在對不同噪聲系數(shù)進(jìn)行分析時(shí),其他參數(shù)保持不變。
表4 不同噪聲系數(shù)識別準(zhǔn)確率及時(shí)間
噪聲自編碼的主要思想是從具有缺陷的原始輸入數(shù)據(jù)中重建或去噪,即在原始輸入中添加統(tǒng)計(jì)噪聲。即,從“受污染”的輸入中了解更強(qiáng)大的功能。降噪自編碼網(wǎng)絡(luò)的特定參數(shù)旨在控制將輸入隨機(jī)隱藏為零的部分,并確定降噪自編碼網(wǎng)絡(luò)在哪個(gè)節(jié)點(diǎn)上重構(gòu)輸入數(shù)據(jù)。當(dāng)噪聲率為0.6時(shí),將隨機(jī)隱藏60%的輸入數(shù)據(jù),而40%的節(jié)點(diǎn)將重建數(shù)據(jù)。但是,在實(shí)際應(yīng)用中,大多數(shù)隱藏的輸入部分小于0.5,因此在此實(shí)驗(yàn)中,最大值設(shè)置為0.6。隨著噪聲率的增加,識別率整體上增加。當(dāng)噪聲率為0時(shí),該網(wǎng)絡(luò)是常規(guī)的自編碼神經(jīng)網(wǎng)絡(luò)。
降噪自編碼網(wǎng)絡(luò)的性能明顯優(yōu)于傳統(tǒng)的自編碼神經(jīng)網(wǎng)絡(luò)。當(dāng)噪聲率達(dá)到0.3時(shí),網(wǎng)絡(luò)性能最佳,識別率也達(dá)到最高。訓(xùn)練所需的時(shí)間受噪聲率的影響,并且隨著噪聲率的增加而增加。例如,當(dāng)噪聲率為0.3時(shí),訓(xùn)練時(shí)間為115 s,而當(dāng)噪聲率為0.4時(shí),時(shí)間為125 s。
批處理大?。˙atchsize)在深度學(xué)習(xí)網(wǎng)絡(luò)訓(xùn)練中起著重要作用,其表示在訓(xùn)練過程中一次性輸入到網(wǎng)絡(luò)中的樣本數(shù)量。適當(dāng)?shù)腂atchsize有3個(gè)好處:(1)高效的內(nèi)存利用率;(2)可減少迭代次數(shù)和縮短實(shí)驗(yàn)時(shí)間;(3)在一定范圍內(nèi),Batchsize越大,引起的訓(xùn)練震蕩越小。
本文分別選取不同大小的Batchsize進(jìn)行SDAE網(wǎng)絡(luò)訓(xùn)練,為了比較不同Batchsize對網(wǎng)絡(luò)的影響,在網(wǎng)絡(luò)結(jié)構(gòu)為1200-600-300-150-50-11的情況下,分別對網(wǎng)絡(luò)的測試準(zhǔn)確率作對比分析,結(jié)果如表5所示。由表可以看出,只有當(dāng)Batchsize為100時(shí),測試準(zhǔn)確率才達(dá)到了98.6%,在其他情況下準(zhǔn)確率均不太高,因此最終選取Batchsize為100。
表5 不同Batchsize識別準(zhǔn)確率
綜合上述試驗(yàn),確定的網(wǎng)絡(luò)最優(yōu)參數(shù),對軸承故障診斷,得到的準(zhǔn)確率以及損失函數(shù)如圖6所示。由圖可知,準(zhǔn)確率維持在較高水平,并且誤差也比較小。
圖6 準(zhǔn)確率及損失函數(shù)
本文提出了一種基于SDAE網(wǎng)絡(luò)的水泵軸承故障診斷方法,該方法以西儲大學(xué)軸承實(shí)驗(yàn)裝置模擬實(shí)際水泵吸入側(cè)和吐出側(cè)軸承發(fā)生故障的情況,并考慮到實(shí)際水泵工作現(xiàn)場有環(huán)境噪聲干擾的可能,將測得的模擬信號經(jīng)過數(shù)據(jù)預(yù)處理直接輸入到SDAE網(wǎng)絡(luò)中,得到了較高的測試準(zhǔn)確率,能達(dá)到98.5%。同時(shí)該方法克服了傳統(tǒng)方法通常側(cè)重于手動(dòng)特征提取的缺點(diǎn),節(jié)省了時(shí)間,提高了診斷準(zhǔn)確率。
由于SDAE網(wǎng)絡(luò)的幾個(gè)關(guān)鍵參數(shù)對其網(wǎng)絡(luò)性能有影響,因此分別比較了不同網(wǎng)絡(luò)結(jié)構(gòu)、噪聲系數(shù)和批量大小,從而確定了最優(yōu)組合。從實(shí)驗(yàn)結(jié)果中可以得出,網(wǎng)絡(luò)結(jié)構(gòu)以及神經(jīng)元節(jié)點(diǎn)數(shù)并不是越復(fù)雜網(wǎng)絡(luò)效果就越好。網(wǎng)絡(luò)太復(fù)雜可能導(dǎo)致網(wǎng)絡(luò)陷入局部最優(yōu)導(dǎo)致過擬合;當(dāng)噪聲系數(shù)設(shè)置太大時(shí),網(wǎng)絡(luò)就很難從被破壞的數(shù)據(jù)中恢復(fù)原始數(shù)據(jù),會導(dǎo)致準(zhǔn)確性大大降低;選擇合適的批次大小可以使網(wǎng)絡(luò)快速收斂,獲得最高的識別準(zhǔn)確率。