武向軍,李海虹,郭 宏
(太原科技大學(xué) 機(jī)械工程學(xué)院,太原 030024)
滾動(dòng)軸承作為“工業(yè)的關(guān)節(jié)”支撐著機(jī)械設(shè)備的運(yùn)轉(zhuǎn),一旦發(fā)生故障,很可能會(huì)造成不必要的損失[1-2]。因此,滾動(dòng)軸承的狀態(tài)在線監(jiān)測系統(tǒng)的研究非常重要,大量研究也給出了多種故障診斷的方法[3-5]。但是中國制造2025發(fā)展,從智慧工廠到智能制造,需要進(jìn)行狀態(tài)監(jiān)測的設(shè)備量增長迅速,隨著監(jiān)測點(diǎn)增多、數(shù)據(jù)采樣頻率提高,需要處理的數(shù)據(jù)呈指數(shù)化增長,且要求提高處理效率與準(zhǔn)確率,這對傳統(tǒng)的云平臺監(jiān)測模型提出了挑戰(zhàn)[6]。
邊緣計(jì)算是對云計(jì)算的補(bǔ)充和延伸,能滿足數(shù)據(jù)處理的高效率和傳輸?shù)膶?shí)時(shí)性要求[7-8]。邊緣計(jì)算將任務(wù)處理從云端遷移到網(wǎng)絡(luò)邊緣,減少了數(shù)據(jù)傳送的距離和數(shù)量,可以減輕云計(jì)算平臺網(wǎng)絡(luò)帶寬和數(shù)據(jù)處理的負(fù)擔(dān),提高了萬物互聯(lián)時(shí)代數(shù)據(jù)處理效率及數(shù)據(jù)傳輸?shù)膶?shí)時(shí)性。將邊緣計(jì)算模型與云計(jì)算模型相結(jié)合,有利于解決目前機(jī)械設(shè)備在線狀態(tài)監(jiān)測所面臨的問題。
滾動(dòng)軸承運(yùn)行時(shí)大都處于密封狀態(tài),只能通過對運(yùn)行時(shí)采集的信號進(jìn)行分析處理來判斷其運(yùn)行狀態(tài)。而隱馬爾科夫模型(Hidden Markov Model,HMM)具有雙隨機(jī)特征,可通過觀測序列來推測模型的隱藏狀態(tài)。HMM故障診斷模型非常適合處理連續(xù)的動(dòng)態(tài)信號來監(jiān)測軸承的狀態(tài),可以較早的發(fā)現(xiàn)軸承的故障情況。在訓(xùn)練HMM模型時(shí),高維的特征集會(huì)加大模型的訓(xùn)練難度,且影響分類準(zhǔn)確度的提高,使得模型的魯棒性變差。因此,可利用隨機(jī)森林算法來評估特征的重要性,在不丟失故障信息的情況下,選取重要特征組成敏感特征集來進(jìn)行HMM模型的訓(xùn)練。
本文將隨機(jī)森林算法和隱馬爾可夫模型應(yīng)用于邊緣計(jì)算模型,提出了一種基于邊緣計(jì)算的滾動(dòng)軸承智能監(jiān)測系統(tǒng)。通過對軸承實(shí)測信號進(jìn)行特征提取、特征重要性評估,提取敏感特征集作為HMM模型的輸入,實(shí)現(xiàn)對滾動(dòng)軸承故障狀態(tài)的快速、準(zhǔn)確識別。
邊緣計(jì)算是一種包含終端層、邊緣層和云層三個(gè)部分的新型計(jì)算架構(gòu)[9],每層都可以為應(yīng)用提供所需的資源和服務(wù)。相比于集中式計(jì)算的云平臺模型,邊緣計(jì)算模型具有實(shí)時(shí)性、安全性、可靠性和可擴(kuò)展性等優(yōu)點(diǎn)。
終端層是邊緣計(jì)算架構(gòu)的前端,能夠感知和改變周圍環(huán)境,如傳感器等,負(fù)責(zé)收集數(shù)據(jù)并傳遞到邊緣層。邊緣層位于終端層和云層之間,對大部分的數(shù)據(jù)進(jìn)行計(jì)算和存儲,并將處理后的數(shù)據(jù)上傳至云層。云層由云端服務(wù)器組成,對邊緣層上傳的數(shù)據(jù)進(jìn)行計(jì)算和存儲,并進(jìn)行智能決策和全局調(diào)度。
隨機(jī)森林是包含多個(gè)決策樹的分類器。計(jì)算不同特征在每個(gè)決策樹中做的貢獻(xiàn)值并取平均,根據(jù)均值的大小來判斷特征的重要性。本文用基尼指數(shù)(Gini Index)[10]來介紹貢獻(xiàn)值的計(jì)算方法,基尼系數(shù)越大,節(jié)點(diǎn)純度越高,表示變量越重要。
基尼指數(shù)的計(jì)算公式為:
(1)
式中:K表示有K個(gè)類別,Pmk表示節(jié)點(diǎn)m中類別k所占的比例。
特征Xj在節(jié)點(diǎn)m的重要性,即節(jié)點(diǎn)m分枝前后的基尼指數(shù)變化量為:
(2)
式中:GIl和GIr分別表示分枝后兩個(gè)新節(jié)點(diǎn)的基尼指數(shù)。
定義特征Xj在決策樹i中出現(xiàn)的節(jié)點(diǎn)為集合M,那么Xj在第i顆樹的重要性為:
(3)
假設(shè)隨機(jī)森林中共有n顆樹,則:
(4)
最后,把所有求得的重要性評分做一個(gè)歸一化處理即:
(5)
在軸承的狀態(tài)監(jiān)測和故障診斷過程中,采集到的觀測值是多維連續(xù)信號,更適合使用連續(xù)隱馬爾可夫模型CHMM,該模型能夠精確地描述觀察符號特性。
連續(xù)型隱馬爾科夫模型如下[11]:
(1)隱藏狀態(tài)集S和觀測狀態(tài)集O
S={S1,S2,…,SN}
(6)
O={O1,O2,…,OT}
(7)
式中:N為隱藏狀態(tài)數(shù),T為觀測狀態(tài)數(shù)。
(2)初始狀態(tài)分布矩陣π
π=[π1,π2,…,πN]
(8)
式中:qt為時(shí)刻t時(shí)狀態(tài),πi表示初始狀態(tài)分布概率,滿足:
(9)
(3)狀態(tài)轉(zhuǎn)移概率矩陣A
(10)
aij表示從狀態(tài)i到狀態(tài)j的概率,滿足:
aij=P(qt+1=Sj|qt=Si)
(11)
(12)
(4)觀測序列概率密度函數(shù)
(13)
式中:M為每一狀態(tài)下的混合數(shù),η為高斯概率密度函數(shù),μ和U分別是高斯分布的均值矩陣和協(xié)方差矩陣。cjm為混合權(quán)系數(shù),構(gòu)成權(quán)系數(shù)矩陣C.
連續(xù)型隱馬爾可夫模型CHMM可定義為:
λ=(π,A,C,μ,U)
(14)
根據(jù)Baum-Welch算法和Forward-Backward算法[12]解決模型學(xué)習(xí)和概率計(jì)算問題。
基于邊緣計(jì)算的滾動(dòng)軸承智能監(jiān)測系統(tǒng)實(shí)現(xiàn)流程如圖1所示。
圖1 基于邊緣計(jì)算的滾動(dòng)軸承智能監(jiān)測系統(tǒng)
(1)由滾動(dòng)軸承實(shí)測振動(dòng)加速度信號分析得到其有效值RMS均超過0.1,將系統(tǒng)采集到信號的RMS與0.1進(jìn)行比較,若RMS>0.1則進(jìn)行下一步流程;反之,則說明機(jī)器停止運(yùn)轉(zhuǎn),采集到的數(shù)據(jù)為噪聲數(shù)據(jù),與軸承健康狀態(tài)無關(guān),剔除該組數(shù)據(jù)。
(2)對信號進(jìn)行自相關(guān)分析,統(tǒng)計(jì)自相關(guān)序列在延時(shí)區(qū)間[-t,t]內(nèi)過x軸的次數(shù)Ti,其中,t為每次采樣時(shí)長。若|Ti+1-Ti|<20,則進(jìn)行下一步流程;反之,則判斷為幅值突變數(shù)據(jù),剔除該組數(shù)據(jù)。
(3)判斷軸承的健康狀態(tài),采用3σ準(zhǔn)則自適應(yīng)設(shè)定上限閾值μ+3σ[13],當(dāng)RMS低于μ+3σ,則軸承處于正常狀態(tài);當(dāng)RMS超出μ+3σ,則軸承可能出現(xiàn)故障或該監(jiān)測點(diǎn)受到嚴(yán)重的噪聲干擾;當(dāng)振動(dòng)信號的RMS連續(xù)穩(wěn)定超出μ+3σ區(qū)間時(shí),則判定該軸承出現(xiàn)故障,需進(jìn)行下一步的分析。
(4)提取振動(dòng)信號時(shí)、頻域的24維特征值[14],并使用公式(15)進(jìn)行歸一化。
(15)
(5)利用隨機(jī)森林算法評估特征的重要性,選取重要性高的前4個(gè)特征作為敏感特征集,作為CHMM模型的輸入。
(6)計(jì)算敏感特征集在每個(gè)CHMM模型中的得分。CHMM1、CHMM2、CHMM3分別為軸承內(nèi)圈、外圈、保持架故障模型。
(7)對數(shù)似然概率最高的模型便對應(yīng)該種故障類型,可確定軸承的故障位置。
(8)在云端對信號進(jìn)行包絡(luò)譜分析,判斷邊緣層的診斷結(jié)果是否正確,并做出改進(jìn)、維修決策。
為進(jìn)一步驗(yàn)證所提診斷模型的有效性,對實(shí)測軸承故障數(shù)據(jù)進(jìn)行分析。數(shù)據(jù)來源于西安交通大學(xué)機(jī)械工程學(xué)院雷亞國教授團(tuán)隊(duì)的XJTU-SY軸承數(shù)據(jù)集[15]。測試軸承為LDK UER 204滾動(dòng)軸承,其相關(guān)參數(shù)如表1所示。
表1 LDK UER204滾動(dòng)軸承的基本參數(shù)
文中使用工況2(轉(zhuǎn)速:2 250 r/min,徑向力:11 kN)下的三個(gè)軸承的全壽命周期數(shù)據(jù)來進(jìn)行分析,數(shù)據(jù)信息如表2所示。
表2 工況2滾動(dòng)軸承數(shù)據(jù)信息
文中使用μ+3σ判別方法來找到軸承故障開始的時(shí)間,以Bearing2_2數(shù)據(jù)集中水平振動(dòng)信號數(shù)據(jù)為例進(jìn)行分析。
從圖2(a)可以看出,在軸承的全壽命周期內(nèi),振動(dòng)信號的幅值隨時(shí)間而增加,在開始的52 min內(nèi),振動(dòng)信號幅值表現(xiàn)正常,隨后幅值逐漸增大;同時(shí)從圖2(b)中可以看出,52 min后RMS開始大于上限閾值μ+3σ,則認(rèn)為軸承發(fā)生了退化,開始出現(xiàn)故障。
圖2 軸承的振動(dòng)信號及其RMS-3σ曲線
用上述方法判斷工況2下三個(gè)軸承數(shù)據(jù)集出現(xiàn)故障的時(shí)間,并在出現(xiàn)故障后各取20個(gè)早期故障樣本,樣本數(shù)據(jù)集如表3所示。
表3 早期故障樣本數(shù)據(jù)
將每個(gè)樣本按照4 096個(gè)數(shù)據(jù)點(diǎn)為一組進(jìn)行劃分,共得到480組,其中內(nèi)圈故障(IF)、外圈故障(OF)、保持架故障(CF)各160組。每組提取11個(gè)時(shí)域特征、13個(gè)頻域特征,共24特征,并歸一化。利用隨機(jī)森林算法進(jìn)行特征重要性評估,結(jié)果如圖3所示。
圖3 特征相對重要性
從圖3可以看出,所有特征的相對重要性中,排名前四的特征為3、4、13、1,分別對應(yīng)方根幅值、均方根值、頻率方差和均值。將這四個(gè)特征組成敏感特征集,作為CHMM模型的輸入。
圖4 CHMM故障診斷過程
對3.2節(jié)中480組數(shù)據(jù)提取敏感特征,共得到480組敏感特征集,每種故障狀態(tài)各160組,并將訓(xùn)練集和測試集按7∶3的比例分開。即,每種狀態(tài)用112組數(shù)據(jù)來進(jìn)行模型的訓(xùn)練,將剩余的48組數(shù)據(jù)分6次進(jìn)行模型的測試,每次使用8組。
如圖5所示,為內(nèi)圈故障(IF Model)、外圈故障(OF Model)、保持架故障(CF Model)三種故障模型的訓(xùn)練結(jié)果,分別迭代3、3、4次后便收斂,收斂速度很快,表明CHMM模型在軸承故障診斷方面有較強(qiáng)的學(xué)習(xí)能力。
圖5 收斂迭代次數(shù)
如圖6所示,為三種軸承故障模型的測試結(jié)果,圖(a)、(b)、(c)分別為三種故障狀態(tài)數(shù)據(jù)在IF Model、OF Model、CF Model下的對數(shù)似然概率值。從圖(a)中可以看出,軸承內(nèi)圈故障數(shù)據(jù)的敏感特征集在內(nèi)圈故障模型中的對數(shù)似然概率最大,且與其它兩類故障模型的對數(shù)似然概率相差較大,具有良好的分類效果,同時(shí)輸入的6組測試數(shù)據(jù)全部識別正確,模型的識別正確率為100%.分析圖(b)、(c)同樣可以得出,外圈故障、保持架故障模型的識別正確率均為100%,且分類效果良好。分析結(jié)果表明,CHMM模型在軸承的故障診斷中識別正確率高,分類效果明顯,能夠準(zhǔn)確的識別軸承的內(nèi)圈、外圈、保持架故障,模型有高度的穩(wěn)定性,可用在滾動(dòng)軸承的狀態(tài)監(jiān)測系統(tǒng)中。
圖6 模型測試結(jié)果
邊緣層檢測到滾動(dòng)軸承發(fā)生故障后,將故障數(shù)據(jù)上傳到云平臺,進(jìn)行進(jìn)一步的分析,驗(yàn)證邊緣層的診斷結(jié)果,并進(jìn)行維修安排。
如圖7所示,將測試集中被三種故障模型診斷為外圈故障的數(shù)據(jù)上傳到云平臺,進(jìn)行包絡(luò)譜分析,發(fā)現(xiàn)圖中出現(xiàn)117.2 Hz及其倍頻的頻率成分,與外圈故障特征頻率理論值115.62 Hz接近,說明邊緣層的診斷結(jié)果是正確的,云平臺應(yīng)發(fā)出維修該滾動(dòng)軸承的指令。
圖7 故障信號包絡(luò)譜分析
為提高工業(yè)大數(shù)據(jù)下滾動(dòng)軸承狀態(tài)在線監(jiān)測的效率和準(zhǔn)確度,本文結(jié)合邊緣計(jì)算、隨機(jī)森林算法和連續(xù)隱馬爾科夫模型建立了基于邊緣計(jì)算的滾動(dòng)軸承智能監(jiān)測系統(tǒng),并得到如下結(jié)論:
(1)利用隨機(jī)森林算法對特征重要性進(jìn)行評估,選擇重要性排名前四的特征作為敏感特征集,將特征集從24維降到4維,降低CHMM模型訓(xùn)練的難度;
(2)CHMM模型能夠準(zhǔn)確、高效的識別滾動(dòng)軸承內(nèi)圈、外圈、保持架的早期故障,有較強(qiáng)的學(xué)習(xí)能力和高度的穩(wěn)定性,可用在滾動(dòng)軸承的狀態(tài)監(jiān)測系統(tǒng)中;
(3)邊緣計(jì)算方法的應(yīng)用,使軸承的狀態(tài)監(jiān)測和初步故障診斷在邊緣層完成,在云層只分析故障數(shù)據(jù),進(jìn)行最終判斷和維修安排,大大提高軸承故障診斷的效率,且實(shí)驗(yàn)結(jié)果表明該系統(tǒng)具有很高的穩(wěn)定性和識別準(zhǔn)確率。