朱文輝,黃晉英,衛(wèi)潔潔,陳海霞,封順笑
(中北大學(xué) a.機(jī)械與動(dòng)力工程學(xué)院;b.計(jì)算機(jī)與控制工程學(xué)院,太原 030051)
對于高價(jià)值、高可靠性要求的復(fù)雜機(jī)械系統(tǒng),關(guān)鍵部件的故障診斷具有重大意義和經(jīng)濟(jì)價(jià)值,為了提高故障診斷的準(zhǔn)確性,研究者將各種人工智能方法引入故障診斷中,取得了很好的效果。綜合不同人工智能技術(shù)的優(yōu)點(diǎn),構(gòu)造混合智能故障診斷方法是提高診斷方法的敏感性、魯棒性和精確性的有效途徑之一[1-2]。本文針對齒輪箱的故障診斷,從信息融合的角度,構(gòu)造了基于離散隱馬爾科夫模型(DHMM)和BP神經(jīng)網(wǎng)絡(luò)算法的混合智能診斷方法。隱Markov模型是一種信號時(shí)間序列統(tǒng)計(jì)模型,最初在語音識(shí)別領(lǐng)域里得到了深入的研究和具體的應(yīng)用,齒輪箱發(fā)生故障后,振動(dòng)信號往往具有一定的非線性和再現(xiàn)性不佳等問題,和語音信號有很多相似的特性。隱Markov模型理論上能對任意長的時(shí)間序列建模,能夠很好的彌補(bǔ)神經(jīng)網(wǎng)絡(luò)算法對時(shí)序問題處理能力不足的劣勢[3]。同時(shí),BP神經(jīng)網(wǎng)絡(luò)算法具有較強(qiáng)的自組織、自適應(yīng)和非線性映射能力,可利用其泛函逼近能力對故障類別進(jìn)行分類,易于和其他方法結(jié)合使用[4-6],BP神經(jīng)網(wǎng)絡(luò)算法可以有效彌補(bǔ)隱馬爾科夫模型自適應(yīng)性不足的問題。
現(xiàn)有的隱馬爾科夫模型與神經(jīng)網(wǎng)絡(luò)算法的結(jié)合多是從兩種方法的串聯(lián)入手,構(gòu)建兩級分類器進(jìn)行模式識(shí)別。例如,電子科技大學(xué)的姜波[7]等把CHMM處理后的語音信號的子頻帶和全頻帶特征及幀平均能量作為人工神經(jīng)網(wǎng)絡(luò)的輸入以提高識(shí)別率,東北林業(yè)大學(xué)的楊紅等[8]將HMM的最佳狀態(tài)序列的輸出概率作為BP神經(jīng)網(wǎng)絡(luò)的輸入,從而對網(wǎng)絡(luò)進(jìn)行訓(xùn)練,以達(dá)到物體識(shí)別的目的。合肥工業(yè)大學(xué)的孫瓊[9]將BP神經(jīng)網(wǎng)絡(luò)和隱Markov模型運(yùn)用到駕駛員駕駛狀態(tài)的識(shí)別中。西安建筑科技大學(xué)的黃光球[10]等利用BP神經(jīng)網(wǎng)絡(luò)為HMM提供狀態(tài)概率輸出,實(shí)現(xiàn)了網(wǎng)絡(luò)入侵的檢測。不管哪種方法作為一級模型,當(dāng)輸出向量的維度設(shè)置不合理時(shí)都會(huì)導(dǎo)致二級模型無法收斂或者診斷精度太低,并且一級分類器的診斷精度也會(huì)影響到二級分類器的診斷效果。因此,不同于文獻(xiàn)中將DHMM方法和BP神經(jīng)網(wǎng)絡(luò)算法直接進(jìn)行級聯(lián),本文從信息融合的角度,利用DHMM方法構(gòu)造了包含時(shí)序信息的新特征集,然后用BP神經(jīng)網(wǎng)絡(luò)算法建立了以新特征集作為輸入的故障分類器。當(dāng)BP神經(jīng)網(wǎng)絡(luò)算法用于模式識(shí)別時(shí),網(wǎng)絡(luò)規(guī)模(即神經(jīng)元數(shù)量、隱藏層數(shù))與樣本特征有關(guān),新的特征集包含了更多的信息,適當(dāng)?shù)卦龃罅司W(wǎng)絡(luò)規(guī)模,改善了BP神經(jīng)網(wǎng)絡(luò)處理時(shí)序問題的能力;將BP神經(jīng)網(wǎng)絡(luò)作為分類器,利用了BP神經(jīng)網(wǎng)絡(luò)較強(qiáng)的自適應(yīng)能力,回避了DHMM方法自適應(yīng)性不足,模型泛化性不好的問題。
隱馬爾科夫模型描述了一個(gè)具有狀態(tài)轉(zhuǎn)移概率的馬爾科夫鏈和輸出觀測值的雙隨機(jī)過程,模型的狀態(tài)是不可見的,只能通過觀測序列表現(xiàn)出來,故稱為隱馬爾科夫模型。當(dāng)觀測到的隨機(jī)變量的統(tǒng)計(jì)變量是離散可數(shù)的,則稱這樣的HMM為離散隱Markov模型(記為DHMM)。
一個(gè)DHMM模型可表示為:
λ=(A,B,π,N,M)
(1)
其中,N為模型中隱狀態(tài)數(shù),記N個(gè)狀態(tài)為S1,…,SN,記t時(shí)刻HMM所處狀態(tài)為qt,qt∈(S1,…,SN);M為每個(gè)狀態(tài)對應(yīng)的可能的觀察值數(shù)目,即輸出符號數(shù),M個(gè)觀察值分別為v1,…,vM,記t時(shí)刻觀察到的值為ot,ot∈(v1,…,vM)。
(1)A:狀態(tài)轉(zhuǎn)移概率矩陣
A=(aij)N×N,aij=P(qt+1=Sj│qt=Si)
(2)
(2)B:觀察值概率矩陣
B=(bjk)N×M,bik=P(ot=vk│qt=Sj)
(3)
(3)π:初始狀態(tài)概率分布矢量π=(π1,π2,…,πN),其中,
(4)
運(yùn)用中,初始狀態(tài)概率π往往是隨機(jī)給定的。當(dāng)狀態(tài)轉(zhuǎn)移矩陣、觀察值概率矩陣和初始狀態(tài)矩陣確定了,DHMM模型也就確定了。
對于給定了觀測值序列(o1,o2,…,ot)的DHMM模型的建立,即DHMM參數(shù)估計(jì)問題.當(dāng)已知狀態(tài)序列時(shí),采用極大似然估計(jì)的方法確定相關(guān)參數(shù),對于未知狀態(tài)序列時(shí)采用Baum-Welch重估公式來確定模型λ[11]。本文選取后者來建立各工況的DHMM模型參數(shù)。
定義前向變量αt(i)為:
αt(i)=P(o1,o2,…,ot,qt=Si│λ)
(5)
后向變量βt(i)為:
βt(i)=P(o1,o2,…,ot│qt=Si,λ)
(6)
定義ξt(i,j)為給定觀測值序列O={o1,o2,…,ot}和初始模型λ,
ξt(i,j)=[αt(i)aijbj(ot+1)βt+1(j)])/P(O│λ)
(7)
時(shí)刻t時(shí)Markov鏈處于Si狀態(tài)和時(shí)刻t+1時(shí)處于Sj狀態(tài)時(shí)的概率,那么,t時(shí)刻Markov鏈處于Si狀態(tài)的概率為:
(8)
Baum-Welch算法中的重估公式如下:
(9)
(10)
(11)
齒輪箱由正常到出現(xiàn)故障,系統(tǒng)的某些特性是按照一定規(guī)律由淺入深逐步變化的,這些變化是有先后順序的,而不是隨機(jī)發(fā)生的,因此應(yīng)該用左右型隱馬爾科夫模型來描述這個(gè)變化過程。此時(shí),狀態(tài)轉(zhuǎn)移概率及初始概率具有下列約束:
aij=0,j
(12)
(13)
采用Baum-Welch算法對齒輪箱各工況建立DHMM模型λi,采取前向后向算法計(jì)算測試樣本Ot屬于各工況的概率Pi,取其對數(shù)pi作為新的特征,如下式:
Pi=P(Ot│λi)
(14)
pi=lnPi
(15)
基于DHMM方法的特征融合步驟:
Step 1:對采集到的信號進(jìn)行時(shí)頻分析,提取時(shí)頻特征,得到總樣本集的特征矩陣T=(T1,T2,…Tm)T,其中,Ti=(ti1,ti2,…,tik),Ti為第i個(gè)樣本的特征向量,tik為第i個(gè)樣本的第k個(gè)時(shí)頻特征參數(shù)。采取LGB算法對特征集進(jìn)行標(biāo)量化。
Step 2:采取Baum-Welch算法,分別利用標(biāo)量化后的n類工況的訓(xùn)練樣本建立相應(yīng)工況的DHMM模型:λ1,λ2,…,λn。
Step 3:采取前向后向算法,計(jì)算第i個(gè)測試樣本在各類DHMM模型下的概率值(Pi1,Pi2,…,Pin),求取概率的對數(shù)(pi1,pi2,…,pin)。
Step 4:取測試樣本在各類DHMM模型下概率的對數(shù)作為新的特征添加到原來的時(shí)頻特征集中以構(gòu)造測試樣本新的特征向量Ti′=(ti1,ti2,…,tik,…,pi1,pi2,…,pin)及測試樣本特征集T′=(T1′,T2′,…Ts′)T,s為測試樣本的總個(gè)數(shù)。基于DHMM方法的信息融合框圖如圖1所示。
圖1 基于DHMM的信息融合方法框圖
利用DHMM方法進(jìn)行信息融合后,引入神經(jīng)網(wǎng)絡(luò)對新的特征信息進(jìn)行非線性映射,將新構(gòu)造的特征集作為神經(jīng)網(wǎng)絡(luò)的輸入,利用其泛函逼近能力對故障類別進(jìn)行分類。在設(shè)計(jì)BP神經(jīng)網(wǎng)絡(luò)的時(shí),輸入結(jié)點(diǎn)和輸出節(jié)點(diǎn)是由問題本身所決定的。隱含層的結(jié)構(gòu)在很大程度上決定了網(wǎng)絡(luò)的性能,隱含層結(jié)點(diǎn)太少會(huì)使得網(wǎng)絡(luò)無法收斂,而結(jié)點(diǎn)太多則會(huì)導(dǎo)致產(chǎn)生冗余,產(chǎn)生過度訓(xùn)練。有如下常規(guī)經(jīng)驗(yàn)[12]可以參考:
m=2n+1
(16)
其中,m為隱藏層節(jié)點(diǎn)數(shù),n為輸入層節(jié)點(diǎn)數(shù)?;贒HMM方法特征融合的BP神經(jīng)網(wǎng)絡(luò)算法拓?fù)浣Y(jié)構(gòu)圖如圖2所示。
圖2 基于DHMM方法信息融合的BP神經(jīng) 網(wǎng)絡(luò)算法拓?fù)浣Y(jié)構(gòu)圖
驗(yàn)證實(shí)驗(yàn)在中北大學(xué)振動(dòng)實(shí)驗(yàn)室臺(tái)架上進(jìn)行。選擇型號為JZQ250的二級傳動(dòng)減速器,在箱體上,對應(yīng)輸入軸、中間軸和輸出軸的6個(gè)軸承座上方布置6個(gè)測點(diǎn),設(shè)置正常、斷齒、保持架斷裂、軸承內(nèi)圈剝落和軸承外圈剝落5種工況,采樣頻率設(shè)置為4000Hz,采集齒輪箱1500r/min時(shí)箱體的振動(dòng)信號(見圖3)。對采集到的數(shù)據(jù)進(jìn)行時(shí)頻分析,提取時(shí)域均方根、時(shí)域峭度、時(shí)域八階矩系數(shù)、頻域均方根值等35個(gè)時(shí)頻特征作為原始特征集,用到的時(shí)頻特征如表1所示。每種工況各取100個(gè)樣本作為DHMM的訓(xùn)練樣本,180個(gè)樣本作為DHMM的測試樣本。
圖3 實(shí)驗(yàn)對象
時(shí)域均方根值頻域方差時(shí)域方根幅值頻域峭度時(shí)域絕對平均幅值頻域峰態(tài)時(shí)域方差頻域偏度時(shí)域峭度頻域波形指標(biāo)時(shí)域峰態(tài)頻域峰值指標(biāo)時(shí)域偏度頻域脈沖指標(biāo)時(shí)域波形指標(biāo)頻域裕度指標(biāo)時(shí)域峰值指標(biāo)頻域峭度指標(biāo)時(shí)域脈沖指標(biāo)頻域偏態(tài)指標(biāo)時(shí)域裕度指標(biāo)頻域八階矩系數(shù)時(shí)域峭度指標(biāo)頻域十六階矩系數(shù)時(shí)域偏態(tài)指標(biāo)均方頻譜時(shí)域八階矩系數(shù)功率譜重心指標(biāo)時(shí)域十六階矩系數(shù)頻域方差頻域均方根值相關(guān)因子頻域方根幅值譜原點(diǎn)矩頻域絕對平均幅值
第一階段,構(gòu)造新的特征集。將每個(gè)訓(xùn)練樣本的35個(gè)時(shí)頻特征標(biāo)量化后,作為觀測值序列,由于隱狀態(tài)數(shù)目的選取和確定仍是研究內(nèi)容之一,還沒有指導(dǎo)性的方法,因此,設(shè)置隱狀態(tài)數(shù)目N=5,采取Baum-Welch算法建立齒輪箱5種工況的DHMM模型;再采取前向后向算法計(jì)算各個(gè)測試樣本屬于各工況的似然概率的對數(shù)值;然后構(gòu)造新的特征集,如表2所示。
第二階段,根據(jù)新構(gòu)造的特征集的維度和工況類型,構(gòu)造一個(gè)由40個(gè)輸入節(jié)點(diǎn),81個(gè)隱含層節(jié)點(diǎn)和5個(gè)輸出層節(jié)點(diǎn)構(gòu)成的BP神經(jīng)網(wǎng)絡(luò)。以新的特征集作為輸入,各工況選擇120個(gè)樣本做為訓(xùn)練樣本,60個(gè)樣本做為測試樣本。5種工況下的BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果如圖4所示故障類別由1~5分別為正常、斷齒、保持架斷裂、軸承內(nèi)圈剝落和軸承外圈剝落。由圖可見,基于DHMM方法的信息融合和BP神經(jīng)網(wǎng)絡(luò)算法能對大多數(shù)樣本正確的分類。
為了更好地判別本方法的診斷效果,分別設(shè)置3種方法作為對照組,分別是:第一組,參考文獻(xiàn)[7-10],將DHMM方法和BP神經(jīng)網(wǎng)絡(luò)進(jìn)行簡單級聯(lián),以原始特征作為DHMM模型的輸入,將DHMM方法作為一級分類器,進(jìn)行初步分類,再將DHMM的輸出作為BP神經(jīng)網(wǎng)絡(luò)的輸入,進(jìn)行進(jìn)一步分類;第二組和第三組分別是單獨(dú)采用DHMM方法和BP算法,將原始特征作為輸入,對5種工況進(jìn)行診斷。
本文構(gòu)造的混合算法與對照組的3種方法的診斷結(jié)果如表4所示。從各類方法對各工況的診斷效果來看,單獨(dú)使用DHMM方法和BP算法的診斷結(jié)果均優(yōu)于兩種方法的簡單級聯(lián),說明兩種方法的簡單級聯(lián)有時(shí)候并不能優(yōu)勢互補(bǔ)。實(shí)際上,在第二種方法中,將DHMM模型作為一級分類器進(jìn)行粗分類,實(shí)質(zhì)上是信息加工的過程,可以看作是特征降維,必然會(huì)導(dǎo)致信息丟失,并且DHMM方法自身還有一些不足,將未經(jīng)優(yōu)化的DHMM方法用于粗分類,診斷的準(zhǔn)確率也不高(這一點(diǎn)從僅用DHMM方法的診斷結(jié)果可以看出);由于一級分類器的輸出維數(shù)較小,會(huì)導(dǎo)致作為二級分類器的神經(jīng)網(wǎng)絡(luò)的規(guī)模較小,進(jìn)而影響到了BP神經(jīng)網(wǎng)絡(luò)算法的分類效果。本文的方法中,所構(gòu)建的新的特征集在原始特征集的基礎(chǔ)上增加了時(shí)序信息,是信息增強(qiáng)的過程;同時(shí),不將DHMM方法作為故障診斷的分類器,回避了DHMM方法自適應(yīng)能力不足和模型泛化性的問題。由于新的特征集特征維數(shù)增加了,其作為BP神經(jīng)網(wǎng)絡(luò)算法的輸入,會(huì)使得BP神經(jīng)網(wǎng)絡(luò)模型的輸入層節(jié)點(diǎn)和隱藏層層數(shù)隨之增加,網(wǎng)絡(luò)規(guī)模大于BP神經(jīng)網(wǎng)絡(luò)算法單獨(dú)使用時(shí)的規(guī)模,提高了診斷的準(zhǔn)確率。從表4可以看出,本文所構(gòu)造的方法除了在斷齒與軸承內(nèi)圈剝落這兩種工況的診斷正確率上與BP神經(jīng)網(wǎng)絡(luò)算法持平外,在其他三種工況的診斷上,均有較大的提升。
表2 新構(gòu)造的特征集
圖4 BP神經(jīng)網(wǎng)絡(luò)分類結(jié)果
工況樣本量診斷結(jié)果正常斷齒保持架斷裂軸承內(nèi)圈剝落軸承外圈剝落診斷精度正常6052002686%斷齒60060000100%保持架斷裂6000561394%軸承內(nèi)圈剝落6000059198%軸承外圈剝落6030165082%
表4 4種方法的診斷結(jié)果對比
實(shí)驗(yàn)結(jié)果證明,基于DHMM方法的信息融合算法利用了DHMM較強(qiáng)的時(shí)序建模的優(yōu)點(diǎn),構(gòu)造的新的特征集包含了一定的時(shí)序信息,再結(jié)合BP神經(jīng)網(wǎng)絡(luò)自學(xué)習(xí)、非線性映射等優(yōu)點(diǎn)進(jìn)行故障診斷,顯著的提高了齒輪箱故障診斷精度,實(shí)現(xiàn)了兩種方法的優(yōu)勢互補(bǔ)。
本文構(gòu)造了一種診斷齒輪箱故障的混合智能算法,采用DHMM方法建立了齒輪箱各工況的時(shí)序模型,從信息融合的角度,在原始特征集的基礎(chǔ)上構(gòu)造了包含時(shí)序信息的新特征集,最后將BP神經(jīng)網(wǎng)絡(luò)算法作為故障分類器實(shí)現(xiàn)齒輪箱的故障診斷。本方法綜合利用了DHMM模型較強(qiáng)的時(shí)序建模能力和BP神經(jīng)網(wǎng)絡(luò)算法良好的自適應(yīng)能力,回避了DHMM方法自適應(yīng)能力不佳的問題,適當(dāng)增加了BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)規(guī)模,改善了BP神經(jīng)網(wǎng)絡(luò)算法對時(shí)序問題的處理能力,進(jìn)而提高了齒輪箱故障診斷的準(zhǔn)確率。
[1] Doyle R, Leonard Charest J, Rouquette N, et al. Causal modeling and event-driven simulation for monitoring of continuous systems[C]. 9th Computing in Aerospace Conference (AIAA),1993.
[2] 雷亞國, 何正嘉. 混合智能故障診斷與預(yù)示技術(shù)的應(yīng)用進(jìn)展[J]. 振動(dòng)與沖擊, 2011, 30(9):129-135.
[3] 吳昭同, 楊世錫. 旋轉(zhuǎn)機(jī)械故障特征提取與模式分類新方法[M]. 北京:科學(xué)出版社, 2012.
[4] 鐘秉林, 黃仁. 機(jī)械故障診斷學(xué)[M]. 3版.北京:機(jī)械工業(yè)出版社,2007.
[5] 杜娟, 閻獻(xiàn)國, 韓建華,等. 基于混合神經(jīng)網(wǎng)絡(luò)的數(shù)控機(jī)床故障診斷技術(shù)研究[J]. 組合機(jī)床與自動(dòng)化加工技術(shù), 2011(12):32-34.
[6] 張周鎖, 侯照文, 孫闖,等. 應(yīng)用粒計(jì)算的混合智能故障診斷技術(shù)研究[J]. 西安交通大學(xué)學(xué)報(bào), 2011, 45(1):48-53.
[7] 姜波, 黃煒. 基于多帶CHMM和神經(jīng)網(wǎng)絡(luò)融合的語音識(shí)別[J]. 電子技術(shù)應(yīng)用, 2007, 33(2):126-128.
[8] 楊紅, 任洪娥. 基于HMM與BP神經(jīng)網(wǎng)絡(luò)的物體識(shí)別算法[J]. 微計(jì)算機(jī)信息, 2010, 26(28):160-162.
[9] 孫瓊. 基于BP神經(jīng)網(wǎng)絡(luò)與隱馬爾科夫鏈的駕駛狀態(tài)識(shí)別[D]. 合肥:合肥工業(yè)大學(xué), 2012.
[10] 黃光球, 汪曉海. 基于BP-HMM的網(wǎng)絡(luò)入侵檢測方法研究[J]. 計(jì)算機(jī)工程, 2007, 33(10):131-133.
[11] 王曉強(qiáng), 張?jiān)? 周華民,等. 基于隱馬爾科夫模型的刀具磨損連續(xù)監(jiān)測[J]. 組合機(jī)床與自動(dòng)化加工技術(shù), 2016(10):87-90.
[12] 姚雪梅, 李少波, 璩晶磊. 基于神經(jīng)網(wǎng)絡(luò)和證據(jù)理論的樣本預(yù)測方法[J]. 組合機(jī)床與自動(dòng)化加工技術(shù), 2017(6):110-113.