王昱,尹愛(ài)軍
(重慶大學(xué) 機(jī)械工程學(xué)院 機(jī)械傳動(dòng)國(guó)家重點(diǎn)實(shí)驗(yàn)室,重慶 400044)
齒輪箱是現(xiàn)代機(jī)械設(shè)備的重要部件,也是失效頻率高發(fā)部件。齒輪箱的失效往往致使整個(gè)機(jī)械系統(tǒng)進(jìn)入癱瘓或運(yùn)行失控,造成不必要的財(cái)產(chǎn)損失甚至人員傷亡[1]。因此,對(duì)齒輪箱失效故障的準(zhǔn)確有效診斷是維護(hù)設(shè)備穩(wěn)定、安全運(yùn)行的重要保障。
目前用于齒輪箱故障診斷的方法數(shù)量眾多,包括噪聲分析法、振動(dòng)分析法、油液分析法、聲學(xué)分析法、溫度分析法等[2],而基于振動(dòng)信號(hào)的故障診斷方法應(yīng)用最廣。武哲等[7]利用多元經(jīng)驗(yàn)?zāi)B(tài)分解對(duì)多通道振動(dòng)信號(hào)進(jìn)行自適應(yīng)分解,并依據(jù)峭度準(zhǔn)則和相關(guān)系數(shù)對(duì)此進(jìn)行特征提取。黨建等[8]將排列熵算法用于水輪發(fā)電機(jī)組非平穩(wěn)振動(dòng)信號(hào)的故障診斷中,取得了較好的效果。Wang等[9]提出利用振動(dòng)信號(hào)的局部均值分解對(duì)低速螺旋齒輪箱進(jìn)行診斷的方法。張亢等[10]將局部均值分解(LMD)與階次跟蹤相結(jié)合,提出一種變轉(zhuǎn)速工況下的滾動(dòng)軸承故障診斷方法。Ali等[11]將振動(dòng)信號(hào)的經(jīng)驗(yàn)?zāi)B(tài)分解與深度神經(jīng)網(wǎng)絡(luò)結(jié)合,以實(shí)現(xiàn)軸承故障的自動(dòng)診斷。
在以上及現(xiàn)有的故障診斷方法中,均存在一些共有的不足點(diǎn):一是需要對(duì)特定振動(dòng)信號(hào)作針對(duì)性的特征提取,造成參數(shù)設(shè)置復(fù)雜且通用性不足;二是需要振動(dòng)信號(hào)符合某些特定的假設(shè),而對(duì)于信號(hào)和假設(shè)間的真實(shí)相關(guān)性,往往既缺乏理論依據(jù),也缺乏最佳實(shí)踐;三是一些結(jié)合現(xiàn)代深度學(xué)習(xí)模型的方法數(shù)據(jù)依賴量大,而實(shí)際工況下的數(shù)據(jù)收集往往較困難。
針對(duì)以上問(wèn)題,文中提出一種基于條件變分自編碼器的故障診斷方法。該方法可避免復(fù)雜的人工特征提取,采用振動(dòng)信號(hào)頻域幅值譜作為故障診斷特征向量,通過(guò)學(xué)習(xí)幅值譜到各個(gè)故障下的條件概率分布,實(shí)現(xiàn)故障分類器的概率模型建立。區(qū)別于其余應(yīng)用于機(jī)械故障診斷的自編碼器模型[12],該模型側(cè)重于從理論角度對(duì)頻譜分布進(jìn)行概率建模,而非僅從工程角度構(gòu)建復(fù)雜、缺乏可解釋性且較難訓(xùn)練的特征提取網(wǎng)絡(luò),其表現(xiàn)更加具有可控和可追溯性。實(shí)驗(yàn)表明,基于條件變分自編碼器的故障診斷方法在齒輪箱故障分類任務(wù)上取得了很高的精度,并具有較少的數(shù)據(jù)依賴和較高的通用性,能有效對(duì)齒輪箱各失效故障進(jìn)行準(zhǔn)確識(shí)別診斷,具有較高的工程實(shí)用價(jià)值。
條件變分自編碼器(CVAE)是變分自編碼器(VAE)[15]的改進(jìn)和擴(kuò)展。首先闡述變分自編碼器的基本思想。
由于 x維度往往很高,難以直接建立符合式(1)的優(yōu)化模型。變分自編碼器設(shè)定x由某一低維隱變量z生成,即:
受z的維度限制,式(2)中的積分計(jì)算較為困難。為此VAE引入后驗(yàn)分布 p (z|x),使得在 p (z|x)上通過(guò)蒙特卡洛采樣算法得以實(shí)現(xiàn)對(duì)式(2)的有效估算。由于后驗(yàn)分布 p (z|x)是隱式存在的,并不能為此提供顯式的優(yōu)化途徑。VAE實(shí)際使用可優(yōu)化的推斷后驗(yàn)分布作為真實(shí)后驗(yàn)分布的近似,并使用變分推斷方法優(yōu)化φ使得逼近 p (z|x)。由于 qφ(z|x)往往被指定為高斯分布,考慮易優(yōu)化性,VAE使用KL散度作為變分推斷的具體實(shí)現(xiàn)形式:
對(duì)式(3)運(yùn)用貝葉斯定理變形得:
在對(duì) ELBO的實(shí)際計(jì)算上,VAE提出了一種隨機(jī)梯度變分貝葉斯(SGVB)評(píng)估器作為對(duì)ELBO的高效估算:
通過(guò)優(yōu)化L~VAE(x;θ,φ),VAE得以獲得對(duì)單一數(shù)據(jù)X的概率密度分布p(X)的極大似然優(yōu)化。而在具有標(biāo)簽數(shù)據(jù)Y條件下,條件變分自編碼器在此基礎(chǔ)上實(shí)現(xiàn)了對(duì)條件概率分布 p (X |Y)的估計(jì)[22]。但此類條件變分自編碼器主要用于輔助 VAE生成更加特定化的數(shù)據(jù),并不能勝任對(duì)數(shù)據(jù)性質(zhì)的判別任務(wù)。沿用p(X|Y)條件變分自編碼器思想,文中導(dǎo)出能勝任于分類任務(wù)的另類條件變分自編碼器p(Y|X)。
在同時(shí)具有觀測(cè)數(shù)據(jù)X及標(biāo)簽Y條件下,容易將式(4) lgp(x)擴(kuò)展為lgp(y|x)形式:
式(8)、(9)導(dǎo)出了條件概率分布 (|)pyx的對(duì)數(shù)概率密度下界。和 VAE的隨機(jī)梯度變分貝葉斯評(píng)估器同理,CVAE的優(yōu)化評(píng)估器可表示為:
同樣,z(l)通過(guò)重參數(shù)化函數(shù)重采樣,以避免梯度消失。
在實(shí)際訓(xùn)練中,選擇對(duì)角協(xié)方差標(biāo)準(zhǔn)正態(tài)分布作為先驗(yàn)分部p(z),對(duì)角協(xié)方差高斯分布作為后驗(yàn)分布
為盡可能在不損失原始振動(dòng)信號(hào)信息量的前提下,獲取較為通用穩(wěn)定的信號(hào)特征,文中對(duì)原始信號(hào)x(t)做定長(zhǎng)窗口傅里葉變換,并取變換后的頻域幅值譜x(f)線性歸一化至[0,1]區(qū)間作為特征向量,將其導(dǎo)入CVAE模型進(jìn)行訓(xùn)練。在分類預(yù)測(cè)階段,若標(biāo)簽類別共有n類,則將待預(yù)測(cè)原始信號(hào)x(t)分別和每一類標(biāo)簽yi組合并通過(guò) CAVE計(jì)算其隨機(jī)梯度變分貝葉斯評(píng)估器得到n個(gè)下界評(píng)估值,最后將n個(gè)下界評(píng)估值送入softmax層輸出對(duì)應(yīng)每一個(gè)類別的置信概率,并根據(jù)置信概率實(shí)現(xiàn)對(duì)振動(dòng)信號(hào)各故障類型的診斷識(shí)別。模型結(jié)構(gòu)如圖1所示。
圖1中MLP為多層神經(jīng)網(wǎng)絡(luò),分別代表CVAE編碼器及解碼器,均輸出高斯分布。菱形區(qū)域表示可優(yōu)化項(xiàng),即隨機(jī)梯度變分貝葉斯評(píng)估器組成部分,通過(guò)菱形區(qū)域項(xiàng)可使用Adam等隨機(jī)梯度優(yōu)化算法對(duì)模型進(jìn)行訓(xùn)練優(yōu)化。由于優(yōu)化算法使用了 (|)pyx的下界,而對(duì)真實(shí) (|)pyx的估計(jì)較為麻煩,且在模型經(jīng)過(guò)充分訓(xùn)練后,有理由相信變分證據(jù)下界能夠足夠逼近真實(shí)分布的 (|)pyx,因此在分類預(yù)測(cè)階段仍使用下界作為對(duì)真實(shí)分類概率分布 (|)pyx的估計(jì),并將下界的評(píng)估值送入softmax層以輸出每一類別的置信概率。另外,訓(xùn)練和預(yù)測(cè)過(guò)程可同時(shí)進(jìn)行,也可分別進(jìn)行。
圖1 基于CVAE的振動(dòng)信號(hào)故障分類模型結(jié)構(gòu)Fig.1 Structure of vibration signal fault classification model based on CVAE
模型在訓(xùn)練階段的具體流程見(jiàn)表1。算法的輸入接口為原始振動(dòng)信號(hào)x(t),最后返回神經(jīng)網(wǎng)絡(luò)參數(shù)θ及φ。在分類預(yù)測(cè)階段,只需恢復(fù)神經(jīng)網(wǎng)絡(luò)參數(shù),即可實(shí)現(xiàn)對(duì)信號(hào)故障類別x(t)的快速識(shí)別診斷。
表1 振動(dòng)信號(hào)分類器訓(xùn)練流程Tab.1 Training process of vibration signal classifier
圖2 實(shí)驗(yàn)配置Fig.2 Experimental configuration:a) experimental system; b) gearbox interior
文中通過(guò)齒輪箱故障診斷實(shí)驗(yàn)驗(yàn)證模型對(duì)振動(dòng)信號(hào)的分類性能。實(shí)驗(yàn)系統(tǒng)整體配置如圖 2a所示。電機(jī)(SIEMENS, 3~, 2.0 HP)通過(guò)聯(lián)軸器驅(qū)動(dòng)齒輪箱運(yùn)轉(zhuǎn),同時(shí)電機(jī)通過(guò)變頻器(DANFOSS VLT 1.5 kW)進(jìn)行調(diào)速。齒輪箱輸出軸通過(guò)傳動(dòng)皮帶聯(lián)接一個(gè)電磁扭矩負(fù)載(ROSATI, maximum 8.83 kW)。電磁扭矩負(fù)載受控于一扭矩控制器(TDK-Lambda, GEN 100-15-IS510),使得其負(fù)載扭矩可被動(dòng)態(tài)調(diào)節(jié)。加速度傳感器(PCB ICP 353C03)和聲傳感器(PANAMETRICS V109)可分別收集齒輪箱運(yùn)轉(zhuǎn)過(guò)程中的振動(dòng)和聲音信號(hào)。數(shù)據(jù)采集盒(DAQ, NI cDAQ-9234)將加速度傳感器和聲傳感器的輸出數(shù)據(jù)送入計(jì)算機(jī)(HP Pavilion g4-2055la)進(jìn)行存儲(chǔ)。齒輪箱的內(nèi)部布置如圖2b所示。二級(jí)減速器通過(guò)三根傳動(dòng)軸及 4個(gè)傳動(dòng)齒輪組成。輸入斜齒輪1(Z1=30,模數(shù)=2.25,壓力角=20°,螺旋角=20°)安裝在輸入軸 1上,軸 2上安裝有兩級(jí)傳動(dòng)斜齒輪(Z2=Z3=45),通過(guò)末級(jí)齒輪 4(Z4=80)將功率傳遞至軸 3。除此之外,齒輪箱失效部件還包括軸承1及軸承座1。齒輪箱不同工況下的失效模式見(jiàn)表2。
表2 齒輪箱失效模式及工況Tab.2 Failure modes and working conditions of gearbox
在表2中,實(shí)驗(yàn)在3種輸入轉(zhuǎn)速、3種負(fù)載轉(zhuǎn)矩下共有11種失效模式,其中A為齒輪箱正常狀態(tài)模式。對(duì)于每種失效類型、轉(zhuǎn)速及扭矩,加速度傳感器和聲傳感器均重復(fù)進(jìn)行5次數(shù)據(jù)采集。每次數(shù)據(jù)采集包括24個(gè)采樣周期,每個(gè)采樣周期歷時(shí)0.4096 s。加速度傳感器和聲傳感器的采樣頻率分別被設(shè)置為10 kHZ和 50 kHZ。通過(guò)上述方式,實(shí)驗(yàn)系統(tǒng)在 11種模式下總共采集到11 880段聲音信號(hào)和11 880段振動(dòng)信號(hào)。
為不失一般性,本實(shí)驗(yàn)僅以振動(dòng)信號(hào)作為齒輪箱數(shù)據(jù)采集樣本。對(duì)于齒輪箱所有振動(dòng)信號(hào),以50 000次連續(xù)采樣點(diǎn)對(duì)原始數(shù)據(jù)進(jìn)行切分,并對(duì)切分后的每段振動(dòng)信號(hào)變換到頻域空間取幅值譜。每段幅值譜均線性歸一化到0~1區(qū)間。對(duì)于每一種失效模式,隨機(jī)打亂不同工況下的頻譜信號(hào),并等量均分后分別作為訓(xùn)練集和測(cè)試集。經(jīng)過(guò)上述處理,在總共11種失效模式下,訓(xùn)練集和測(cè)試集均具有2035個(gè)樣本數(shù)據(jù),每個(gè)樣本數(shù)據(jù)具有25 001維。在所有訓(xùn)練集均具有全部失效模式標(biāo)簽的情況下,對(duì)CVAE模型進(jìn)行故障診斷分類性能測(cè)試。測(cè)試結(jié)果如圖3所示。
圖3 CVAE模型測(cè)試集分類準(zhǔn)確率Fig.3 Classification accuracy of CVAE model test set
從圖3可見(jiàn),CVAE模型取得了優(yōu)異的分類性能,在測(cè)試數(shù)據(jù)集上綜合平均分類正確率達(dá)到 98.88%,且部分故障類別模式下的分類正確率達(dá)到 100%。表明模型擁有很高的故障分類精度。
為了和傳統(tǒng)基于特征提取的故障診斷方法進(jìn)行對(duì)比,文中分別選取具有代表性的四種模型進(jìn)行故障分類實(shí)驗(yàn):基于策略的統(tǒng)計(jì)學(xué)習(xí)模型K近鄰(KNN);基于時(shí)間序列建模的長(zhǎng)短期記憶網(wǎng)絡(luò)模型(LSTM);經(jīng)典非線性分類器支持向量機(jī)(SVM);現(xiàn)代數(shù)據(jù)驅(qū)動(dòng)模型深度神經(jīng)網(wǎng)絡(luò)(DNN)。在原始振動(dòng)信號(hào)特征提取方面,選取時(shí)域11個(gè)特征量、頻域13個(gè)特征量以及14個(gè)小波包能量特征,共計(jì)38個(gè)工程信號(hào)特征組成38維向量作為上述模型的單個(gè)訓(xùn)練樣本。KNN、LSTM、SVM、DNN、CVAE模型的分類準(zhǔn)確率分別為83.93%、94.05%、65.48%、69.64%、98.88%。由此可見(jiàn),CVAE模型在故障診斷分類準(zhǔn)確率上大大領(lǐng)先于其余模型,表明其能夠有效對(duì)齒輪箱振動(dòng)信號(hào)頻譜空間概率分布進(jìn)行建模,不僅具有更好的通用性,也取得了更好的效果。
文中提出了一種基于條件變分自編碼器的齒輪箱振動(dòng)信號(hào)故障診斷模型。以原始信號(hào)幅值譜作為特征向量,并從理論上闡述了CVAE模型在故障分類任務(wù)上的有效性。最后通過(guò)實(shí)驗(yàn)進(jìn)一步證明了CVAE模型在齒輪箱振動(dòng)信號(hào)故障分類任務(wù)上具有優(yōu)異的性能,故障分類準(zhǔn)確度比其余模型更為優(yōu)越,且無(wú)需復(fù)雜的特征提取,具有更少的數(shù)據(jù)依賴性及更強(qiáng)的通用性。對(duì)比其余模型,表現(xiàn)出了其在齒輪箱故障分類診斷任務(wù)上的優(yōu)越性。