黃克康,武 兵,2,張志偉
(1.太原理工大學(xué)機(jī)械電子工程研究所,山西 太原 030024;2.太原理工大學(xué)新型傳感器與智能控制教育部重點(diǎn)實(shí)驗(yàn)室,山西 太原 030024)
行星齒輪箱是旋轉(zhuǎn)機(jī)械的重要部件之一,在實(shí)際運(yùn)行過程中,行星齒輪箱承受動(dòng)態(tài)重載、復(fù)雜的運(yùn)行環(huán)境和條件,這些環(huán)境和條件會(huì)導(dǎo)致太陽齒輪、行星齒輪、齒圈和其他關(guān)鍵部件發(fā)生故障[1]。而行星齒輪箱的振動(dòng)信號(hào)復(fù)雜,通常受到噪聲和干擾的污染。此外,行星齒輪箱故障診斷的故障樣本也很少。這些都增加了行星齒輪箱故障診斷的難度[2]。因此,針對(duì)行星齒輪箱故障采取有效診斷方法非常重要。
自深度學(xué)習(xí)方法被提出以來[3],其中最經(jīng)典的卷積神經(jīng)網(wǎng)絡(luò),由于其特征提取性能較好,所以被廣泛應(yīng)用在機(jī)械故障診斷領(lǐng)域。但是,卷積神經(jīng)網(wǎng)絡(luò)也存在一定的問題;診斷輸出不穩(wěn)定。為了解決這個(gè)問題,我們引入了集成學(xué)習(xí)。在集成學(xué)習(xí)中Boosting[4]算法運(yùn)用最廣泛,而AdaBoost[5]算法讓Boosting從理論方法變成具有實(shí)踐意義的實(shí)用算法,可以應(yīng)用于各種實(shí)際問題,是集成學(xué)習(xí)技術(shù)中非常重要的算法之一。
因此,為了適應(yīng)原始時(shí)域振動(dòng)故障信號(hào)的處理以及解決卷積神經(jīng)網(wǎng)絡(luò)診斷輸出不穩(wěn)定,提出了一種基于AdaBoost集成學(xué)習(xí)的一維深度卷積神經(jīng)網(wǎng)絡(luò)故障診斷模型。首先,使用一維卷積從齒輪的原始時(shí)域振動(dòng)信號(hào)中提取特征,然后通過使用兩個(gè)弱學(xué)習(xí)器分類的性能來更新權(quán)重,根據(jù)調(diào)整權(quán)重集后的訓(xùn)練來訓(xùn)練弱分類器,如此重復(fù),最后通過集合策略整合弱分類器,形成集成卷積神經(jīng)網(wǎng)絡(luò);來建立一個(gè)穩(wěn)定的用于行星齒輪箱的智能故障診斷的模型。
該模型由特征提取部分由輸入層,一維卷積層以及池化層三個(gè)部分組成。通過多個(gè)卷積層和池化層的交替來提取原始信號(hào)的特征信息,之后連接兩部分全連接層來進(jìn)行弱學(xué)習(xí)器的故障分類。實(shí)驗(yàn)結(jié)果表明:集成卷積神經(jīng)網(wǎng)絡(luò)能夠行星齒輪原始振動(dòng)信號(hào)進(jìn)行快速診斷。
相對(duì)于傳統(tǒng)卷積神經(jīng)網(wǎng)絡(luò)對(duì)齒輪原始故障的診斷,集成卷積神經(jīng)網(wǎng)絡(luò)具有更強(qiáng)的辨識(shí)能力和更快的收斂速度;所建立的智能診斷模型可以有效地診斷齒輪不同的故障狀態(tài)。
由于原始時(shí)域振動(dòng)信號(hào)是一維數(shù)據(jù),而一般卷積網(wǎng)絡(luò)所處理的數(shù)據(jù)是二維圖片數(shù)據(jù)。所以采用一維卷積網(wǎng)絡(luò)減少了信號(hào)預(yù)處理的工作量并可以更好地完成的特征提取工作[6]。該模型通過三個(gè)交替的卷積層來完成特征提取過程,最終通過全連接層來完成行星齒輪箱的故障診斷。
該模型由特征提取部分,以及分類器部分組成。由輸入層,一維卷積層以及池化層三個(gè)部分組成特征提取部分。之后全連接層部分連接softmax分類器作為分類器部分,如圖1所示。
圖1 基于集成學(xué)習(xí)的一維深度卷積神經(jīng)網(wǎng)絡(luò)故障診斷模型Fig.1 One-Dimensional Deep Convolutional Neural Network Fault Diagnosis Model Based on Ensemble Learning
其針對(duì)振動(dòng)信號(hào)主要改進(jìn)如下:
(1)為了更好的提取一維振動(dòng)時(shí)域信號(hào)的特征,采用一維卷積網(wǎng)絡(luò)。一方面可以減少原始信號(hào)的特征丟失,另一方面不需對(duì)原始信號(hào)進(jìn)行其它的預(yù)處理。
(2)由于所提出的模型為三層一維卷積,所以通過對(duì)卷積網(wǎng)絡(luò)選用不同的卷積核尺寸情況下的分類性能分析進(jìn)行篩選;以找到最適合的尺寸。
(3)采用Batch Normalization[7],而Batch Normalization就是通過一定的規(guī)范化手段,把各層網(wǎng)絡(luò)的特征輸入值的數(shù)值范圍縮放到標(biāo)準(zhǔn)正態(tài)分布(均值為0方差為1),使線性函數(shù)對(duì)輸入更加敏感,從而對(duì)輸入信號(hào)的變化更加敏感。一方面能加快訓(xùn)練速度,另一方面可以解決梯度消失問題。
2.1.1 Dropout
使用Dropout[8]是防止模型過擬合。我們隨機(jī)讓50%的神經(jīng)元停止工作,降低對(duì)局部特征的依賴,增強(qiáng)模型的泛化性,可以明顯地減少過擬合現(xiàn)象。
2.1.2 小批量隨機(jī)算法和歸一化
這里模型使用小批量隨機(jī)算法和歸一化處理策略,先用小批量隨機(jī)算法進(jìn)行訓(xùn)練,把數(shù)據(jù)分為若干個(gè)批次,并且參數(shù)按批次更新,使得相同批次中的一組數(shù)據(jù)共同決定了本次梯度的方向,降低了局部最優(yōu)的可能性,也降低了計(jì)算量。批量歸一化使用歸一化步驟來確定訓(xùn)練期間確定的各層輸入的均值和方差,從而減輕了內(nèi)部協(xié)變量偏移的問題,同時(shí)減少了梯度對(duì)參數(shù)的依賴性,降低了梯度發(fā)散的可能性,并且改善這提高了學(xué)習(xí)速度并減少了Dropout的需求。
2.1.3 softmax分類器
所提出的模型使用softmax[9]回歸方法。softmax分類器是多分類任務(wù)中邏輯回歸的擴(kuò)展,分類標(biāo)簽為yi∈{1,2,…,k},K—要分的類別數(shù);hk—全連接層的激活值;Wki—連接softmax層和全連接層的權(quán)重,則softmax的輸入表示為:
概率的定義為:
在做多分類問題時(shí),通過計(jì)算各個(gè)類別占全部的比例,輸出向量的第幾維最大,就表示屬于哪個(gè)類別的概率最大,由此分類。
將原始振動(dòng)信號(hào)輸入第一層卷積網(wǎng)絡(luò)。為了使網(wǎng)絡(luò)可以初始化權(quán)重和偏差。該層網(wǎng)絡(luò)使用卷積加上池化層對(duì)輸入信息特征進(jìn)行采樣,執(zhí)行小批量和歸一化處理后,使用激活函數(shù)RELU。三層卷積網(wǎng)絡(luò)原始參數(shù)相同,使用核函數(shù)大小都為為(3×1)、步長(zhǎng)為1,池化層核函數(shù)大小為(3×1)、步長(zhǎng)為1的卷積核對(duì)輸入數(shù)據(jù)進(jìn)行特征提取。
第二部分是由兩個(gè)分別更新參數(shù)的全連接部分(兩部分設(shè)置相同),來自池化之后的8192個(gè)神經(jīng)元輸入第一層全連接層,同時(shí)輸出節(jié)點(diǎn)數(shù)3072個(gè),上一層的3072個(gè)神經(jīng)元輸入第二層全連接層,同時(shí)輸出節(jié)點(diǎn)數(shù)2048個(gè),上一層的2048個(gè)神經(jīng)元輸入第三層全連接層,同時(shí)輸出節(jié)點(diǎn)數(shù)10個(gè),形成緊湊和穩(wěn)健的特征。之后將降維后的特征輸入到softmax分類函數(shù)中,最終完成分類工作。網(wǎng)絡(luò)結(jié)構(gòu)中使用的參數(shù),如表1所示。
表1 網(wǎng)絡(luò)結(jié)構(gòu)Tab.1 Network Structure
我們訓(xùn)練一個(gè)一維卷積網(wǎng)絡(luò)C,該網(wǎng)絡(luò)接收輸入樣本數(shù)據(jù),以及分類器網(wǎng)絡(luò)F1和F2,這些網(wǎng)絡(luò)從C獲取特征。F1和F2將它們分類為K類,為它們輸出對(duì)數(shù)的維數(shù)向量。我們通過將softmax函數(shù)應(yīng)用于向量來獲得分類概率。我們使用公式p1=(y|x),p2=(y|x)分別表示由F1和F2獲得的輸入x的K維概率輸出。
為了對(duì)樣本數(shù)據(jù)正確分類,首先我們假設(shè)這兩個(gè)分類器可以正確分類源樣本。然后我們利用兩個(gè)分類器在目標(biāo)樣本預(yù)測(cè)上的差異來同時(shí)更新參數(shù)。我們通過測(cè)量?jī)蓚€(gè)分類器之間的差異并將其最大化。
在這里,我們考慮使用以下等式d(p1(y|x),p2(y|x))測(cè)量目標(biāo)樣本的差異,其中d表示測(cè)量?jī)蓚€(gè)概率輸出之間的差異的函數(shù)。此后,我們稱該術(shù)語為差異。我們的目標(biāo)是獲得一個(gè)可以將目標(biāo)樣本分類效果最大化的分類器。
在這里我們將網(wǎng)絡(luò)分為兩個(gè)模塊:卷積部分(C)和分類器(F1,F(xiàn)2)。分類器學(xué)會(huì)在目標(biāo)樣本上最大化差異步驟B,而生成器學(xué)會(huì)在目標(biāo)步驟最小化差異步驟C。請(qǐng)注意,我們采用了訓(xùn)練步驟A,以確保源樣本具有區(qū)別特征。
對(duì)于集成學(xué)習(xí)來說,我們有兩個(gè)目標(biāo):
(1)我們訓(xùn)練該模型對(duì)齒輪數(shù)據(jù)集進(jìn)行正確的診斷,我們訓(xùn)練網(wǎng)絡(luò)以最小化softmax交叉熵。如下:
(2)我們將F1、F2訓(xùn)練為C的分類器。其中我們將F1、F2之間的概率輸出的差的絕對(duì)值用作差異損失。通過增加F1、F2的差異損失,我們可以對(duì)兩個(gè)分類器進(jìn)行不同優(yōu)化,獲取不同的參數(shù),使F1、F2同時(shí)進(jìn)行不同權(quán)重的診斷;以提高準(zhǔn)確率和診斷速度。優(yōu)化目標(biāo)如下:
式中:p1k、p2k—類別K的F1和F2的概率輸出。
所以,總來說,我們需要訓(xùn)練兩個(gè)分類器,它們從一維卷積中獲取輸入并最大化d(p1(y/x),p2(y/x))。其中分類器F1和F2都必須正確地對(duì)測(cè)試集樣本進(jìn)行分類。所以我們總的優(yōu)化目標(biāo)如下:
實(shí)驗(yàn)中采用試驗(yàn)臺(tái)為HD-CL-012X行星齒輪箱,如圖2所示。
圖2 HD-CL-012X行星齒輪箱Fig.2 HD-CL-012X Planetary Gear Box
在實(shí)驗(yàn)過程中,選用1500r/min的轉(zhuǎn)速,負(fù)載設(shè)為3N·m,采集頻率設(shè)為5kHz,傳感器安裝在軸承座豎直徑向上。
本次試驗(yàn)所采集的狀態(tài)數(shù)據(jù)樣本齒輪的狀態(tài)共分四種:(1)正常;(2)點(diǎn)蝕;(3)磨損;(4)裂紋。
其中裂紋狀態(tài)各包含寬度為0.01mm、0.02mm 和0.05mm 三種程度的故障,深度均為0.1mm.磨損和點(diǎn)蝕都為輕度,中度以及重度三種狀態(tài)[11]。
采樣時(shí)間設(shè)為70s,最終獲取了齒輪在穩(wěn)定工況下對(duì)應(yīng)4種狀態(tài)下的x、y、z方向上的原始振動(dòng)信號(hào),如圖3所示。
圖3 不同缺陷的齒輪Fig.3 Gears with Different Defects
實(shí)驗(yàn)需要多次更換故障件,單次數(shù)據(jù)采集時(shí)間70s,采集完成后修改電機(jī)以及負(fù)載參數(shù),再次采集。
采集完故障齒輪再不同運(yùn)行情況的數(shù)據(jù)后,更換下一組故障齒輪,重復(fù)上述步驟。采集到的數(shù)據(jù)共有四種健康狀況,如表2所示。
表2 行星齒輪箱齒輪健康狀態(tài)數(shù)據(jù)集Tab.2 Planetary Gearbox Gear Health Data Set
本實(shí)驗(yàn)菜蔬的數(shù)據(jù)一共有10組,從每組數(shù)據(jù)中取2000個(gè)樣本,共計(jì)樣本集20000個(gè)樣本,如表2所示。利用分層采樣原理來將各部分樣本分成相同的10個(gè)等分?jǐn)?shù)據(jù)集集,每個(gè)子集取80%用于訓(xùn)練,20%用于測(cè)試。
實(shí)驗(yàn)過程為以下幾個(gè)步驟:
首先,安裝傳感器,完成信號(hào)傳輸通路的構(gòu)建。第二步,完成對(duì)軟件相關(guān)參數(shù)的設(shè)置。第三步,啟動(dòng)電機(jī),設(shè)置電機(jī)參數(shù)。第四步,采集數(shù)據(jù),并存儲(chǔ)數(shù)據(jù)。第五步,更改負(fù)載參數(shù),重復(fù)第四步第五步,直至三種負(fù)載信號(hào)采集完成。第六步,更改電機(jī)轉(zhuǎn)速,重復(fù)第三、四、五、六步,直至所需多種轉(zhuǎn)速遍歷。第七步,設(shè)置負(fù)載為空載,停止電機(jī)工作,切斷電源,更換不同狀態(tài)零件,重復(fù)上述操作,最后完成行星齒輪箱所有故障模式下的數(shù)據(jù)采集工作,如圖4所示。
圖4 實(shí)驗(yàn)步驟流程圖Fig.4 Experimental Procedure Flowchart
通過分析在同一數(shù)據(jù)集下,卷積核的大小和對(duì)模型分類結(jié)果影響的實(shí)驗(yàn),并將各種實(shí)驗(yàn)數(shù)據(jù)分類數(shù)據(jù)整理如下。其中通過多次診斷后,將學(xué)習(xí)率設(shè)定為0.0005,并測(cè)試卷積核的大小對(duì)集成卷積神經(jīng)網(wǎng)絡(luò)的分類效果的影響,將三層卷積核的采樣寬度設(shè)置為1,3,5,7,9,其中以分類準(zhǔn)確度和迭代次數(shù)作為算法的評(píng)價(jià)標(biāo)準(zhǔn)[12]。先預(yù)設(shè)三層卷積網(wǎng)絡(luò)的卷積核為都為3,并分別測(cè)試十次后取平均值。并將第一層卷積收集到的數(shù)據(jù)整理,如圖5所示。
圖5 第一層卷積核對(duì)比Fig.5 The First Layer of Convolution Kernel Comparison
經(jīng)過對(duì)比可知,隨著卷積核大小先減小而后增大。其中第一層卷積核為7時(shí),準(zhǔn)確率可在76 epoch時(shí)達(dá)到99%.所以取第一層卷積核大小為7。同上,將第二層卷積以及第三層卷積收集到的數(shù)據(jù),如圖6、圖7所示。
圖6 第二層卷積核對(duì)比Fig.6 The Second Layer of Convolution Kernel Comparison
圖7 第三層卷積核對(duì)比Fig.7 Comparison of the Third Layer Convolution Kernel
經(jīng)過對(duì)比可知,隨著卷積核大小先減小而后增大。其中第二層卷積核為5時(shí),準(zhǔn)確率可在38epoch時(shí)達(dá)到99%.所以取第一層卷積核大小為5。訓(xùn)練樣本數(shù)據(jù)的分類準(zhǔn)確率均可達(dá)到99%以上,說明分類器的診斷能力很強(qiáng),能夠?qū)X輪的不同故障模式及程度做出區(qū)分,如圖7所示。通過對(duì)實(shí)驗(yàn)結(jié)果的分析,為了達(dá)到更好的分類效果和更少的訓(xùn)練時(shí)間,將三層卷積核按照順序分別設(shè)為7、5、3。
最終模型診斷結(jié)果,如圖8所示。
圖8 診斷準(zhǔn)確率和差異損失Fig.8 Diagnostic Accuracy and Loss of Variance
由圖8可知,相對(duì)于單個(gè)分類器F1和F2的收斂速度以及診斷的穩(wěn)定性較差,相對(duì)于總的分類準(zhǔn)確率來說,由基于集成學(xué)習(xí)的一維卷積神經(jīng)網(wǎng)絡(luò)診斷的速度更快,且更加穩(wěn)定,具有更好的診斷能力。
為了比較本研究算法與一維卷積分類算法的診斷效果,通過實(shí)驗(yàn)數(shù)據(jù)對(duì)比本研究方法與一維卷積分類算法的識(shí)別性能,如圖9所示。
圖9 算法診斷正確率及損失對(duì)比Fig.9 Algorithmic Diagnosis Accuracy and Loss Comparison
對(duì)比算法同所提模型同樣將原始振動(dòng)信號(hào)作為一維卷積神經(jīng)網(wǎng)絡(luò)的輸入特征,通過對(duì)比兩種算法在相同振動(dòng)數(shù)據(jù)集下的診斷情況,分別進(jìn)行10次實(shí)驗(yàn),并將故障診斷率和較穩(wěn)定的診斷時(shí)epoch的數(shù)值的均值作為評(píng)價(jià)標(biāo)準(zhǔn),得到的對(duì)比結(jié)果。
由圖9可知,本研究算法故障識(shí)別率高達(dá)98%,優(yōu)于對(duì)比算法。對(duì)比算法診斷性能表現(xiàn)一般,在收斂速度和正確率方面識(shí)別效果與所提算法有一定差距。這說明本研究算法比對(duì)比算法更穩(wěn)定。考慮到本研究算法的故障診斷率波動(dòng)較小,進(jìn)一步驗(yàn)證了本研究算法應(yīng)用于齒輪故障診斷的優(yōu)越性。
針對(duì)行星齒輪箱診斷中,所存在的采集的數(shù)據(jù)需要預(yù)處理,準(zhǔn)確率低、耗費(fèi)時(shí)間過長(zhǎng)的問題,給出了一種基于集成學(xué)習(xí)一維卷積神經(jīng)網(wǎng)絡(luò)的故障診斷方法。
通過分析卷積核大小、學(xué)習(xí)率對(duì)集成卷積神經(jīng)網(wǎng)絡(luò)準(zhǔn)確度的影響,得出最終模型。實(shí)驗(yàn)結(jié)果表明一維卷積集成學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)模型能夠較好地應(yīng)用于原始振動(dòng)數(shù)據(jù)故障診斷領(lǐng)域,故障診斷的平均準(zhǔn)確率達(dá)98%,顯著提高了齒輪箱原始振動(dòng)數(shù)據(jù)集的故障診斷的準(zhǔn)確率和可操作性。
這里所設(shè)計(jì)的卷積神經(jīng)網(wǎng)絡(luò)模型具有以下優(yōu)點(diǎn):(1)去除了原始信號(hào)處理的步驟,直接對(duì)原始振動(dòng)信號(hào)行處理,避免了信號(hào)預(yù)處理的復(fù)雜過程;(2)進(jìn)行算法優(yōu)化后的模型有了較好的收斂能力,能夠較好地完成特征提取及智能故障診斷,實(shí)用性強(qiáng)。