鄒 旺,江 偉,馮俊杰,鄭 凱
(六盤(pán)水師范學(xué)院,貴州 六盤(pán)水 553004)
軸承是旋轉(zhuǎn)機(jī)電設(shè)備的關(guān)鍵部件,它的可靠性運(yùn)行能夠提高現(xiàn)代生產(chǎn)設(shè)備的安全性和效率。軸承的故障通常被認(rèn)為是設(shè)備故障最常見(jiàn)的原因之一[1-2]。軸承通常在惡劣的環(huán)境中工作,在運(yùn)行期間經(jīng)常發(fā)生不同類(lèi)型的故障,如果不采取有效措施,軸承的故障可能導(dǎo)致整個(gè)機(jī)器的故障并造成大量經(jīng)濟(jì)損失。因此,軸承的剩余使用壽命預(yù)測(cè)技術(shù)變得非常重要,它提前為設(shè)備維修人員提供故障報(bào)警預(yù)告,提前進(jìn)行零部件更換,從而減少昂貴的計(jì)劃外維護(hù)并提高設(shè)備運(yùn)行的安全性。近年來(lái),軸承RUL預(yù)測(cè)的研究已經(jīng)成為了重要的研究方向[3]。RUL預(yù)測(cè)方法可分為兩類(lèi)[4]:基于模型的預(yù)測(cè)方法和基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)方法[5]。基于模型的方法的精度取決于建立模型的準(zhǔn)確性。由于難以清晰、全面地描述軸承退化的復(fù)雜過(guò)程,因此通常難以構(gòu)建軸承剩余使用壽命預(yù)測(cè)的模型?;跀?shù)據(jù)驅(qū)動(dòng)的方法具有數(shù)據(jù)挖掘和機(jī)器學(xué)習(xí)的特點(diǎn),在初始分析階段不需要建立復(fù)雜的控制。此外,此方法能夠提供量化預(yù)測(cè)結(jié)果和預(yù)結(jié)果概論分布,為機(jī)器學(xué)習(xí)算法構(gòu)建合適的機(jī)器學(xué)習(xí)模型。奚立峰等[6]基于自組織映射和反向傳播神經(jīng)網(wǎng)絡(luò),有效預(yù)測(cè)了軸承剩余使用壽命。申中杰等[7]提出基于相對(duì)特征和多向量的剩余壽命預(yù)測(cè)方法,結(jié)果表明多變量支持向量機(jī)可在小樣本條件下獲得準(zhǔn)確的預(yù)測(cè)結(jié)果。Tian Zhigang[8]開(kāi)發(fā)了一種基于人工神經(jīng)網(wǎng)絡(luò)(ANN)的方法,用于實(shí)現(xiàn)對(duì)狀態(tài)監(jiān)測(cè)設(shè)備更準(zhǔn)確的剩余使用壽命預(yù)測(cè),但對(duì)于小樣本條件下預(yù)測(cè)結(jié)果不理想。Sun Chuang等[9]開(kāi)發(fā)了基于SVM的軸承壽命預(yù)測(cè)模型,將該模型應(yīng)用于軸承的壽命預(yù)測(cè),結(jié)果表明該模型具有較高的精度,但該方法采用傳統(tǒng)的特征提取方法無(wú)法抽取出全面反應(yīng)軸承退化所需的特征。Dong Shaojiang等[10]提出了一種基于主成分分析(PCA)和優(yōu)化LS-SVM方法實(shí)現(xiàn)軸承退化預(yù)測(cè)的新方法,結(jié)果證明了該方法的有效性。Ren Lei等[11]提出了通過(guò)結(jié)合時(shí)域特征和頻域特征的多軸承剩余使用壽命預(yù)測(cè)的深度學(xué)習(xí)方法,該方法是基于時(shí)域和頻域特征,引入多層神經(jīng)網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)軸承的RUL,所提出的方法在實(shí)際的數(shù)據(jù)集上的預(yù)測(cè)精度高于其它常用的機(jī)器學(xué)習(xí)方法,但該方法對(duì)于處理小樣本數(shù)據(jù)集時(shí)不能完全反應(yīng)出深度學(xué)習(xí)的優(yōu)勢(shì)。
目前軸承壽命預(yù)測(cè)特征學(xué)習(xí)速度和預(yù)測(cè)精度還有待進(jìn)一步提高,本文結(jié)合時(shí)域特征和頻域特征,提出一種基于人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)融合模型的方法。時(shí)域特征包括均方根、波峰因素和峰度,這三個(gè)特征來(lái)自經(jīng)典的時(shí)域特征,用于軸承振動(dòng)信號(hào)分析;頻域特征,本文采用文獻(xiàn)[11]所提出的頻譜分割求和[FSPS],該特征參數(shù)表現(xiàn)軸承退化前期和后期較突出;兩者相結(jié)合 ,基本上覆蓋了整個(gè)軸承的退化過(guò)程。人工神經(jīng)網(wǎng)絡(luò)模型具有強(qiáng)大的特征學(xué)習(xí)能力[8],支持向量機(jī)對(duì)解決小樣本數(shù)據(jù)分類(lèi)和預(yù)測(cè)問(wèn)題具有絕對(duì)優(yōu)勢(shì)[9]。本文提出的ANN和SVM融合方法是將軸承的6維時(shí)域特征和12維頻域特征作為人工神經(jīng)網(wǎng)絡(luò)模型的輸入,將輸入的特征做進(jìn)一步的抽取,然后把這些特征作為支持向量機(jī)的輸入來(lái)進(jìn)行軸承的RUL預(yù)測(cè)。本文在實(shí)際的數(shù)據(jù)集上驗(yàn)證所提方法的有效性,并與隨機(jī)森林(RFR)模型、LASSO模型、SVM模型和ANN模型進(jìn)行了性能比較,實(shí)驗(yàn)結(jié)果表明所提方法提高了預(yù)測(cè)精度。
人工神經(jīng)網(wǎng)絡(luò)是一種由神經(jīng)元網(wǎng)絡(luò)組成處理復(fù)雜數(shù)據(jù)的學(xué)習(xí)方法。人工神經(jīng)網(wǎng)絡(luò)模型輸入層和輸出層之間具有單層或多層隱藏處理層。模型結(jié)構(gòu)如圖1所示。多層隱藏層神經(jīng)網(wǎng)絡(luò)與單層相比,具有更強(qiáng)的學(xué)習(xí)能力,學(xué)習(xí)到的特征更本質(zhì)地反映數(shù)據(jù)變化規(guī)律,從而更有利于解決分類(lèi)和回歸。本文選用多隱層神經(jīng)網(wǎng)絡(luò)模型對(duì)6維時(shí)域特征和12維頻域特征做處理,將ANN處理后的特征作為SVM模型的輸入,通過(guò)支持向量機(jī)非線性回歸方法預(yù)測(cè)軸承的RUL。本文選用如圖所示的8層神經(jīng)網(wǎng)絡(luò)模型,每層的網(wǎng)絡(luò)節(jié)點(diǎn)數(shù)為[300,250,200,100,80,50,30,8,1],每層的激活函數(shù)為ReLU函數(shù)。由于所提取的特征包含大量反應(yīng)軸承運(yùn)行變化的信息,這些信息并非都適用于RUL預(yù)測(cè)。神經(jīng)網(wǎng)絡(luò)的功能是從時(shí)域和頻域特征中查找詳細(xì)信息,并從詳細(xì)信息中提取有用信息。
圖1 人工神經(jīng)網(wǎng)絡(luò)模型結(jié)構(gòu)
基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)(SVM)是處理小樣本數(shù)據(jù)集問(wèn)題的機(jī)器學(xué)習(xí)算法。給定訓(xùn)練樣本集(xi,yi),對(duì)于i=1,2,3…,m,其中m是樣本的數(shù)量,xi∈Rn為輸入變量,yi是對(duì)應(yīng)的預(yù)期值,在線性回歸的情況下,回歸函數(shù)為:
f(x)=<ω·x>+b
(1)
式中,ω∈Rn為權(quán)值矢量,b∈R為偏差,可以通過(guò)求解下面最優(yōu)問(wèn)題來(lái)求得權(quán)值ω和偏差b:
(2)
(3)
在非線性回歸任務(wù)的情況下,SVM運(yùn)算中可使用核函數(shù),通過(guò)使用非線性矢量核函數(shù),將原始數(shù)據(jù)可以映射到高維特征空間,把非線性回歸問(wèn)題轉(zhuǎn)換為線性問(wèn)題求解。線性回歸函數(shù):
(4)
兩個(gè)常用核函數(shù)分別為:高斯RBF核函數(shù)和Poly核函數(shù),其表達(dá)式分別為式(5)、式(6)所示。
RBF核函數(shù):
(5)
Poly 核函數(shù):
K(xi,xj)=(xixj+1)d
(6)
式中,p是RBF核函數(shù)的指數(shù),d為Poly核函數(shù)的階數(shù)。通過(guò)應(yīng)用拉格朗日函數(shù)將最優(yōu)化問(wèn)題轉(zhuǎn)換成凸二次規(guī)劃問(wèn)題進(jìn)行求解:
(7)
(8)
式中,αi、αi*為拉格朗日函數(shù)乘子。
從軸承振動(dòng)信號(hào)中提取并用于剩余使用壽命預(yù)測(cè)的特征可以分為三類(lèi):時(shí)域特征,頻域特征和時(shí)頻域特征。其中,常用的時(shí)域特征包括均值,方差,RMS,波峰因數(shù)和峰度[12]。時(shí)域特征指標(biāo)可以直觀反映軸承退化的一般趨勢(shì),但對(duì)降級(jí)小變化過(guò)程不能很好地反映,而且容易噪聲信號(hào)干擾,影響預(yù)測(cè)結(jié)果。除了時(shí)域特征外,軸承的振動(dòng)信號(hào)分析還常使用頻率特性方差和頻譜RMS兩個(gè)頻域特征。頻域特征適用于固定信號(hào)處理,廣泛應(yīng)用于軸承故障診斷研究。時(shí)域特征適用于非線性信號(hào)處理,具體的物理含義都可以用公式來(lái)表示,也被廣泛地用于在軸承的剩余使用壽命預(yù)測(cè)研究中。一組合理有效的振動(dòng)信號(hào)特征指標(biāo)對(duì)軸承剩余使用壽命的預(yù)測(cè)結(jié)果至關(guān)重要。本文選用時(shí)域特征和頻域特征作為ANN模型的輸入特征。
時(shí)域信號(hào)特征可以有效反映滾動(dòng)軸承的衰退過(guò)程和故障信息。考慮到信息表示性和信息維度之間的平衡,本文使用均方根XRMS,峰值因數(shù)XCrest和峰度XKurtosis作為時(shí)域特征,其公式表達(dá)式如下:
(9)
(10)
(11)
其中,x(i)是一系列振動(dòng)信號(hào),n是指振動(dòng)信號(hào)數(shù)據(jù)點(diǎn)的數(shù)量。
軸承在整個(gè)生命周期的衰退特性隨時(shí)間變化而變化,但不同衰退階段所反映的軸承健康狀態(tài)不同,而時(shí)域特征不足以反映出信號(hào)頻率。因此,時(shí)域特征不能完全反映軸承的衰退過(guò)程,為了從監(jiān)測(cè)的軸承振動(dòng)信號(hào)中提取反映全生命周期的信息,定義了一個(gè)名為頻譜分區(qū)求和(FSPS)的新頻域特征[12]。給定一系列振動(dòng)信號(hào)x(i),其中i=1,2, …n。XFSPS(k)是指振動(dòng)信號(hào)x(i)通過(guò)傅里葉變換后得到頻譜(s(j)),再對(duì)頻譜進(jìn)行求和獲得的特征,其中j=1,2,…,n。頻譜分區(qū)求和特征計(jì)算公式如下:
(12)
其中,k=1,2 …n。值得注意的是新定義的頻域特征XFSPS(k)是一維向量,由k個(gè)元素組成,k是一個(gè)經(jīng)驗(yàn)參數(shù),通常由具體領(lǐng)域問(wèn)題決定。
本實(shí)驗(yàn)中使用的數(shù)據(jù)來(lái)自法國(guó)FEMTO-ST研究所提供的IEEE PHM2012預(yù)測(cè)試驗(yàn)數(shù)據(jù)[13]。實(shí)驗(yàn)設(shè)備如圖2所示,該設(shè)備的主要作用是提供滾動(dòng)軸承全生命周期的實(shí)驗(yàn)數(shù)據(jù)。
圖2 PRONOSTIA實(shí)驗(yàn)平臺(tái)
該平臺(tái)收集每個(gè)軸承整個(gè)壽命周期的相關(guān)信息,主要是水平方向(X方向)和垂直方向上的振動(dòng)信號(hào)(Y)方向)。所有軸承材料、規(guī)格、技術(shù)等都是相同的,沒(méi)有初始缺陷。加速壽命降級(jí)實(shí)驗(yàn)允許軸承在數(shù)小時(shí)內(nèi)完成生命周期退化過(guò)程。收集數(shù)據(jù)的時(shí)間間隔是10 s,收集數(shù)據(jù)的時(shí)間是0.1 s。采樣頻率為25.6 kHz,每次采樣將有2 560個(gè)采樣點(diǎn),存儲(chǔ)在csv文件中。振動(dòng)信號(hào)的振幅超過(guò)20g,軸承就會(huì)被認(rèn)為失效。如圖3所示顯示了軸承全壽命振動(dòng)原始信號(hào)。
圖3 軸承全生命周期實(shí)驗(yàn)振動(dòng)原始信號(hào)
由上述可知,采用均方根、波峰因素、峰度以及頻域特征FSPS指數(shù)可以提取出軸承從運(yùn)行到故障過(guò)程的有效退化信息??紤]到軸承剩余使用壽命預(yù)測(cè)問(wèn)題的特性,將頻域特征FSPS的經(jīng)驗(yàn)參數(shù)k設(shè)置為6[12]。圖4表現(xiàn)了一個(gè)測(cè)試軸承的RMSE曲線,從曲線可以大致看出軸承的衰退過(guò)程。
圖4 一個(gè)測(cè)試軸承的RMSE曲線
平均絕對(duì)誤差eMAE和均方根誤差eRMSE是兩個(gè)常用的評(píng)估所提模型性能的指標(biāo),數(shù)學(xué)表達(dá)式如下:
(13)
(14)
本文采用9維向量來(lái)表示軸承的振動(dòng)信號(hào)特征,其中有3維時(shí)域特征6維頻域特征,由于數(shù)據(jù)集中的振動(dòng)信號(hào)數(shù)據(jù)是從垂直方向和水平方向上收集的,故輸入到模型的數(shù)據(jù)為18維。此外,為了進(jìn)行軸承剩余使用壽命預(yù)測(cè)實(shí)驗(yàn),將預(yù)處理的數(shù)據(jù)分為訓(xùn)練集和測(cè)試集,采用十折交叉對(duì)預(yù)處理數(shù)據(jù)集進(jìn)行劃分,隨機(jī)生成的測(cè)試集占整個(gè)數(shù)據(jù)集10%、訓(xùn)練集占90%。
本文構(gòu)建了一個(gè)全連接人工神經(jīng)網(wǎng)絡(luò),用于對(duì)軸承的衰退特征做抽取,ANN模型的輸入層完全連接到第一隱層,同樣規(guī)則,第二隱層完全連接到第一隱層,直到輸出層。 ANN由8個(gè)具有不同數(shù)量神經(jīng)元的隱藏層組成(300,200,150,100,80,50,30,1)。ANN輸出層輸出18維特征,作為SVM模型的輸入,設(shè)置相關(guān)參數(shù),對(duì)ANN和SVM融合模型進(jìn)行訓(xùn)練。本文使用4個(gè)軸承數(shù)據(jù)進(jìn)行預(yù)測(cè)驗(yàn)證。實(shí)驗(yàn)結(jié)果如圖5所示,黑色離散點(diǎn)表示預(yù)測(cè)結(jié)果(預(yù)測(cè)值),灰線表示測(cè)試數(shù)據(jù)上觀察到的實(shí)際使用壽命(真實(shí)值)。預(yù)測(cè)的剩余使用壽命也與觀察到的數(shù)據(jù)吻合良好,特別是對(duì)于軸承4。
(a) 軸承1預(yù)測(cè)值與真實(shí)值 (b) 軸承2預(yù)測(cè)值與真實(shí)值
(c) 軸承3預(yù)測(cè)值與真實(shí)值 (d) 軸承4預(yù)測(cè)值與真實(shí)值圖5 基于ANN和SVM融合模型的軸承剩余壽命預(yù)測(cè)
本文將ANN和SVM融合模型方法的預(yù)測(cè)結(jié)果與常用的模型進(jìn)行比較,比較結(jié)果如圖6所示。本文提出的方法在驗(yàn)證集上的MAE和RMSE均取得最好的結(jié)果。
圖6 不同模型預(yù)測(cè)的MAE和RMSE值對(duì)比
隨著現(xiàn)代制造業(yè)信息化、智能化的不斷發(fā)展,軸承的健康分析和壽命預(yù)測(cè)成為了越來(lái)越重要的研究領(lǐng)域。為了提高軸承剩余壽命預(yù)測(cè)精度,本文提出了一種基于ANN和SVM融合模型方法。通過(guò)提取反映軸承運(yùn)行狀態(tài)的3個(gè)時(shí)域特征和6個(gè)頻域特征,并應(yīng)用構(gòu)建的人工神經(jīng)網(wǎng)絡(luò)對(duì)特征進(jìn)行抽取后輸入到SVM模型預(yù)測(cè)剩余壽命。通過(guò)在實(shí)際的數(shù)據(jù)集上進(jìn)行實(shí)驗(yàn)分析,本文所提出的方法與幾種常見(jiàn)的預(yù)測(cè)方法相比,具有更高的預(yù)測(cè)精度。