鄧飛躍, 強(qiáng)亞文
(1. 石家莊鐵道大學(xué) 河北省工程機(jī)械動(dòng)力與傳動(dòng)控制重點(diǎn)實(shí)驗(yàn)室,河北 石家莊 050043;2. 石家莊鐵道大學(xué) 河北省大型工程機(jī)械裝備制造協(xié)同創(chuàng)新中心,河北 石家莊 050043)
滾動(dòng)軸承作為旋轉(zhuǎn)機(jī)械中的核心組件,其狀況直接影響了機(jī)械整體的正常運(yùn)行。在旋轉(zhuǎn)機(jī)械的各類故障中,滾動(dòng)軸承故障約占30%,對(duì)滾動(dòng)軸承的運(yùn)行狀態(tài)進(jìn)行準(zhǔn)確識(shí)別,能夠及時(shí)發(fā)現(xiàn)軸承故障以制定維修計(jì)劃,保證機(jī)器的正常運(yùn)行。同時(shí)由于旋轉(zhuǎn)機(jī)械運(yùn)轉(zhuǎn)過(guò)程中時(shí)刻產(chǎn)生著海量監(jiān)測(cè)數(shù)據(jù),給故障診斷帶來(lái)了諸多挑戰(zhàn),傳統(tǒng)的支持向量機(jī)(SVM)、BP神經(jīng)網(wǎng)絡(luò)等方法由于或多或少存在一些缺陷[1-2],限制了其實(shí)際應(yīng)用。
極限學(xué)習(xí)機(jī)(Extreme Learning Machine,ELM)作為一種新型神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)方法,相比其他神經(jīng)網(wǎng)絡(luò)方法擁有更快的學(xué)習(xí)速度和泛化性能,已成功應(yīng)用于多個(gè)研究領(lǐng)域[3-9]:Cao et al[3]基于ELM和稀疏表示分類算法提出了一種用于圖像分類的混合分類器;Zhang et al[4]提出了一種基于極限學(xué)習(xí)機(jī)的去噪自動(dòng)編碼器,并將流形正則化框架引入其中,提高了圖像的識(shí)別性能;林怡等[5]利用魚(yú)群尋優(yōu)算法優(yōu)化極限學(xué)習(xí)機(jī)的正則化參數(shù)和核參數(shù),增強(qiáng)了遙感影像分類的準(zhǔn)確度。上述研究均取得了較好的結(jié)果,證實(shí)了ELM方法具有良好的工程應(yīng)用前景。與此同時(shí),ELM方法在機(jī)械設(shè)備故障研究中也得到了較好的應(yīng)用:Li et al[6]提出一種稀疏與鄰域保持深層極限學(xué)習(xí)機(jī)算法,成功用于旋轉(zhuǎn)機(jī)械的故障診斷;皮駿等[7]基于改進(jìn)遺傳算法優(yōu)化極限學(xué)習(xí)機(jī)網(wǎng)絡(luò),將其應(yīng)用于滾動(dòng)軸承故障診斷;鄭近德等[8]提出了一種基于極限學(xué)習(xí)機(jī)的變量預(yù)測(cè)模型用于滾動(dòng)軸承的劣化狀態(tài)識(shí)別;裘日輝等[9]基于PCA和極限學(xué)習(xí)機(jī)提出了單分類算法,獲得了較高的分類準(zhǔn)確率。這些方法雖然具有積極的借鑒意義,但由于ELM模型中輸入權(quán)值和閾值是隨機(jī)生成的,有可能導(dǎo)致病態(tài)問(wèn)題的出現(xiàn)[10],因此在ELM特征向量輸入方面仍需要進(jìn)行進(jìn)一步的研究。
基于上述分析,以極限學(xué)習(xí)機(jī)的模型輸入為出發(fā)點(diǎn),討論了一種新型模型輸入的極限學(xué)習(xí)機(jī)并應(yīng)用于故障模式識(shí)別。該方法首先通過(guò)K-Singular Value Decomposition(K-SVD)方法提取樣本數(shù)據(jù)的自適應(yīng)字典,基于該字典使用正交匹配追蹤(OMP)對(duì)樣本數(shù)據(jù)進(jìn)行稀疏編碼,將稀疏編碼作為模型輸入。通過(guò)美國(guó)西儲(chǔ)大學(xué)發(fā)布的10類滾動(dòng)軸承故障數(shù)據(jù)測(cè)試,該方法在多種不同故障類型以及不同故障程度識(shí)別中具有較好的診斷正確率和可靠性。
圖1 極限學(xué)習(xí)機(jī)結(jié)構(gòu)圖
極限學(xué)習(xí)機(jī)具有和傳統(tǒng)單隱層神經(jīng)網(wǎng)絡(luò)相同的網(wǎng)絡(luò)結(jié)構(gòu)[11],但其輸出權(quán)值矩陣根據(jù)最小范數(shù)最小二乘解理論一部求解得出,所以具有更快的訓(xùn)練速度。
極限學(xué)習(xí)機(jī)的結(jié)構(gòu)見(jiàn)圖1,設(shè)有N個(gè)訓(xùn)練樣本(X,T),X=[x1,x2,…,xN],T=[t1,t2,…,tN],則模型的輸出可表示為
(1)
式中,M為隱藏節(jié)點(diǎn)個(gè)數(shù);wm、bm分別為隨機(jī)給定的隱藏節(jié)點(diǎn)的輸入權(quán)重和偏置;βm為輸出權(quán)重;G為隱含層的激活函數(shù),文獻(xiàn)[4]給出了幾種常用的激活函數(shù)。式(1)還可以改寫(xiě)成如下矩陣形式
O=Hβ
(2)
式中,H=G(wx+b)為隱含層輸出矩陣,ELM的訓(xùn)練目標(biāo)為
‖T-Hβ‖=0
(3)
隱含層的輸出權(quán)值
β=H+T=(HTH)-1HTT
(4)
式中,H+表示H的Moore-Penrose廣義逆。
由此可見(jiàn),ELM模型免去了傳統(tǒng)算法中的參數(shù)設(shè)置以及迭代計(jì)算過(guò)程,計(jì)算更加簡(jiǎn)便,極大地提高了網(wǎng)絡(luò)構(gòu)建的速度。本文使用ELM分類模型[12]用于故障模式識(shí)別。
實(shí)際工程振動(dòng)信號(hào)數(shù)量巨大,并且包含大量背景噪聲,若直接作為模型輸入進(jìn)行診斷,不僅診斷準(zhǔn)確率得不到保障,而且嚴(yán)重降低診斷效率,所以有必要對(duì)數(shù)據(jù)進(jìn)行消噪與降維處理。
K-SVD字典學(xué)習(xí)算法以稀疏編碼-字典更新的循環(huán)迭代方式來(lái)對(duì)樣本信號(hào)進(jìn)行學(xué)習(xí),相比傳統(tǒng)字典擁有更好的自適應(yīng)能力,對(duì)信號(hào)的表示也更稀疏。同時(shí)為提高學(xué)習(xí)速度,采用改進(jìn)型K-SVD算法[13],其具體過(guò)程如下:
(1)給定學(xué)習(xí)樣本Ym×n,設(shè)定K-SVD算法參數(shù):迭代次數(shù)J,迭代過(guò)程中OMP算法的稀疏度為L(zhǎng)并初始化字典Dm×K,字典原子數(shù)目為K。
(2)利用OMP算法求解系數(shù)矩陣WK×n。
(3)隨機(jī)排列字典原子序號(hào),記為rperm,初始化計(jì)數(shù)器j=1。
(4)令h=rperm(j),找出系數(shù)矩陣W第h行中不為零的元素,記錄其位置Ih={
α|W(h,α)≠0|}。
(5)若集合I為空,則計(jì)算誤差矩陣E=Y-DW,并記錄其最大誤差所在列i,將數(shù)據(jù)集的第i列歸一化作為字典的第h個(gè)原子,D(h)=Y(i)/‖Y(i)‖2;若集合I不為空,則根據(jù)集合中元素得到新系數(shù)矩陣WT=(k,α),(k=1,2,…,K;α∈Ih),并找到對(duì)應(yīng)的數(shù)據(jù)列計(jì)算誤差E=Y(α)-DWT,(α∈Ih),對(duì)誤差奇異值分解得到左特征向量p、特征值s、右特征向量d,更新D(h)=d,W(h,α)=spT,(α∈Ih) 。
(6)更新計(jì)數(shù)器j=j+1,返回步驟(4),當(dāng)j=K時(shí)停止。
(7)更新迭代次數(shù)返回步驟(3)直至算法結(jié)束。
改進(jìn)后的算法只根據(jù)系數(shù)矩陣中不為零元素的位置對(duì)其部分字典基進(jìn)行奇異值分解,加快了計(jì)算效率[14]。
利用K-SVD學(xué)習(xí)算法學(xué)習(xí)得到的字典較其他字典稀疏性更好,能夠以較少的系數(shù)準(zhǔn)確表示數(shù)據(jù)的稀疏特征,可以對(duì)海量運(yùn)行監(jiān)測(cè)數(shù)據(jù)進(jìn)行有效地壓縮。相比時(shí)域樣本信號(hào),頻域信號(hào)可以有效消除相同類型樣本之間故障沖擊時(shí)移的影響,故障模式識(shí)別的魯棒性更好。因此,采用其頻域數(shù)據(jù)進(jìn)行處理。
利用K-SVD算法求取ELM模型輸入的過(guò)程如下:①將數(shù)據(jù)庫(kù)中所有數(shù)據(jù)進(jìn)行頻域轉(zhuǎn)換,得到其頻域數(shù)據(jù);②將頻域數(shù)據(jù)庫(kù)分為數(shù)據(jù)集1與數(shù)據(jù)集2,使其2個(gè)數(shù)據(jù)集都均勻包含每種故障類型;③將數(shù)據(jù)集1作為K-SVD算法的樣本數(shù)據(jù)學(xué)習(xí)得到字典D;④基于該字典使用OMP算法[15]分別求取數(shù)據(jù)集1和數(shù)據(jù)集2的稀疏系數(shù)矩陣作為訓(xùn)練集和測(cè)試集,根據(jù)故障類型賦予其標(biāo)簽,得到ELM的模型輸入。
為了說(shuō)明此種模型輸入的有效性與優(yōu)越性,將此模型應(yīng)用于實(shí)例分析。采用西儲(chǔ)大學(xué)發(fā)布的軸承振動(dòng)數(shù)據(jù)進(jìn)行分析[16-17],選取其中10種故障類型的數(shù)據(jù)用于故障模式識(shí)別,并與其他模型輸入方式結(jié)果進(jìn)行對(duì)比。另外2種模型輸入方式為:多種時(shí)、頻域指標(biāo)和PCA融合的特征指標(biāo),在同樣的訓(xùn)練樣本和測(cè)試樣本基礎(chǔ)上,從網(wǎng)絡(luò)的診斷正確率、隱含層激活函數(shù)和神經(jīng)元個(gè)數(shù)多個(gè)方面進(jìn)行綜合分析。同時(shí)為說(shuō)明ELM模型的優(yōu)越性,對(duì)比分析了以稀疏編碼為輸入的BP神經(jīng)網(wǎng)絡(luò)、SVM模型。
原始數(shù)據(jù)的具體信息見(jiàn)表1,該數(shù)據(jù)由軸承支座上放置的加速度傳感器采集得到,采樣頻率為12 kHz。將單點(diǎn)損傷直徑為0.177 8 mm的損傷定為一級(jí)損傷,單點(diǎn)損傷直徑為0.355 6 mm的損傷定為二級(jí)損傷,單點(diǎn)損傷直徑為0.533 4 mm的損傷定為三級(jí)損傷,并將其采集得到的數(shù)據(jù)不重疊地劃分為118個(gè),每個(gè)樣本包含1 024個(gè)數(shù)據(jù)點(diǎn),隨機(jī)劃分每種故障類型的樣本組成訓(xùn)練樣本和測(cè)試樣本,樣本間互不重復(fù),訓(xùn)練樣本包含每種故障類型70個(gè),測(cè)試樣本包含每種故障類型48個(gè)。
表1 數(shù)據(jù)信息
采用稀疏編碼的方式對(duì)數(shù)據(jù)進(jìn)行處理,首先對(duì)全部數(shù)據(jù)進(jìn)行頻域轉(zhuǎn)換,使用訓(xùn)練樣本作為K-SVD算法的學(xué)習(xí)樣本,過(guò)程中,字典原子個(gè)數(shù)K設(shè)置為10,算法過(guò)程中OMP稀疏度L為5,迭代次數(shù)J為5。使用學(xué)習(xí)到的字典對(duì)全部頻域數(shù)據(jù)進(jìn)行稀疏編碼,將每個(gè)樣本數(shù)據(jù)的稀疏系數(shù)向量代替其樣本作為ELM模型的輸入。同時(shí)計(jì)算每個(gè)樣本的時(shí)域、頻域指標(biāo)以及將時(shí)、頻域指標(biāo)進(jìn)行PCA融合后的特征構(gòu)建了其他2種模型輸入。其中,時(shí)域指標(biāo)選取為:最大值、均值、均方根值、方差、偏度、峭度、波形指標(biāo)、脈沖指標(biāo);頻域指標(biāo)選取為:頻率均值、頻率標(biāo)準(zhǔn)差、頻率均方根以及頻譜峭度共12個(gè)指標(biāo);PCA融合后選擇其前6個(gè)主元作為模型輸入。
3種模型輸入的測(cè)試集診斷結(jié)果如表2所示,其中固定神經(jīng)元數(shù)量為40,為消除隨機(jī)因素影響,每種模型輸入計(jì)算30次。
表2 測(cè)試集診斷結(jié)果
從表2可以看出,稀疏編碼為輸入的診斷模型在3種激活函數(shù)下都取得了最高的平均正確率,以Sigmoid函數(shù)為激活函數(shù)時(shí),其正確率最高,為98.57%,標(biāo)準(zhǔn)差也較小,僅為0.29%,診斷結(jié)果最為穩(wěn)定。此外,以Sigmoid函數(shù)為激活函數(shù)時(shí),3種模型輸入均取得了最高的平均正確率和最低的正確率標(biāo)準(zhǔn)差,相比于其他激活函數(shù),此函數(shù)具有更強(qiáng)的魯棒性。因此,基于Sigmoid函數(shù)分析隱含層神經(jīng)元數(shù)量對(duì)測(cè)試集診斷結(jié)果的影響。
極限學(xué)習(xí)機(jī)的隱含神經(jīng)元數(shù)量不僅影響模型的診斷正確率,還關(guān)系到模型的計(jì)算時(shí)間。較少的神經(jīng)元不能有效提取數(shù)據(jù)特征,過(guò)多的神經(jīng)元?jiǎng)t會(huì)造成數(shù)據(jù)冗余,同時(shí)增加計(jì)算負(fù)擔(dān)?;赟igmoid函數(shù)分析神經(jīng)元數(shù)量對(duì)測(cè)試集診斷結(jié)果的影響,在1~400每種神經(jīng)元個(gè)數(shù)下計(jì)算3種模型輸入診斷結(jié)果30次,其平均正確率結(jié)果如圖2所示,正確率標(biāo)準(zhǔn)差如圖3所示。由圖2、圖3可知,3種模型輸入的診斷正確率隨神經(jīng)元個(gè)數(shù)的增加都呈先增加后下降的趨勢(shì),PCA主元作為模型輸入的平均正確率較時(shí)、頻域指標(biāo)略高,但這2種模型輸入的診斷平均正確率在其穩(wěn)定區(qū)域(即隨神經(jīng)元個(gè)數(shù)增加、平均正確率未出現(xiàn)明顯下降的區(qū)域)均低于以稀疏編碼為輸入的模型。并且在較寬的神經(jīng)元個(gè)數(shù)范圍內(nèi)(20~200),以稀疏編碼為輸入的模型診斷平均正確率均穩(wěn)定在98%以上,標(biāo)準(zhǔn)差穩(wěn)定在1%以下,可見(jiàn)該診斷模型不僅具有較高的正確率,穩(wěn)定性也較好。
圖2 平均正確率分析
圖3 標(biāo)準(zhǔn)差分析
以Sigmoid函數(shù)為激活函數(shù)、隱含層神經(jīng)元數(shù)量為100時(shí),3種模型輸入的診斷結(jié)果分別見(jiàn)圖4~圖6。稀疏編碼為輸入時(shí),僅有1個(gè)樣本診斷錯(cuò)誤,明顯低于其他2種輸入的模型,診斷效果非常明顯。
圖4 稀疏編碼為輸入的診斷結(jié)果
圖5 PCA主元為輸入的診斷結(jié)果
圖6 時(shí)、頻域指標(biāo)為輸入的診斷結(jié)果
將稀疏編碼作為輸入,采用BP神經(jīng)網(wǎng)絡(luò)、SVM模型進(jìn)行故障模式識(shí)別。不斷調(diào)整2種方法參數(shù),確定其最優(yōu)參數(shù)如下:BP神經(jīng)網(wǎng)絡(luò)隱含層神經(jīng)元數(shù)量為10,學(xué)習(xí)率為0.1,最高迭代次數(shù)為10 000,隱含層激勵(lì)函數(shù)為“Sigmoid”;SVM核函數(shù)類型為“l(fā)inear”。ELM模型的隱含層神經(jīng)元數(shù)量為100,激活函數(shù)為“Sigmoid”。3種模型每種模型計(jì)算30次,測(cè)試集診斷結(jié)果見(jiàn)表3。測(cè)試平臺(tái)計(jì)算機(jī)的配置為:CPU是酷睿i5-4210(2.4 GHz),8 G內(nèi)存,Matlab軟件版本為R2016a。
表3 測(cè)試集診斷結(jié)果
從表3的診斷結(jié)果可以看出,以稀疏編碼為輸入的ELM模型不僅具有極高的正確率,同時(shí)計(jì)算時(shí)間相對(duì)最短,滿足實(shí)際工程應(yīng)用需要。相比傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)、SVM等方法,ELM建立能反映特征值之間復(fù)雜關(guān)系的非線性高斯函數(shù)模型,進(jìn)而準(zhǔn)確反映不同特征值之間復(fù)雜關(guān)系,可以對(duì)待測(cè)樣本進(jìn)行更加準(zhǔn)確的樣本識(shí)別。
(1)提出了以稀疏編碼為輸入的ELM診斷模型,將其應(yīng)用于10種不同類型、不同程度滾動(dòng)軸承故障進(jìn)行模式識(shí)別,并與其他2種輸入的ELM模型、BP神經(jīng)網(wǎng)絡(luò)、SVM模型對(duì)比。結(jié)果表明,以稀疏編碼為輸入的ELM模型診斷正確率更高,穩(wěn)定性也較好,并且模型保持了ELM計(jì)算速度快的優(yōu)點(diǎn)。
(2)隱含層激活函數(shù)為Sigmoid、神經(jīng)元數(shù)量為20~200時(shí),以稀疏編碼為輸入的ELM診斷模型平均正確率穩(wěn)定在98%以上,標(biāo)準(zhǔn)差穩(wěn)定在1%以下,較強(qiáng)的診斷性能使其更適用于設(shè)備故障診斷。