孫燦飛,王友仁,夏裕彬
(1.故障診斷與健康管理技術航空科技重點實驗室 上海,201601)(2.南京航空航天大學自動化學院 南京,211106)
行星傳動輪系作為直升機傳動系統(tǒng)主減速器的最后一級,是整個主減速器的核心部件。相比于其他工業(yè)領域,惡劣的噪聲環(huán)境、多變的工況條件使直升機行星傳動輪系更容易發(fā)生齒面磨損及局部損傷等故障現(xiàn)象。因此,開展行星傳動輪系故障診斷對提高直升機飛行安全與出勤率、減少維護費用等方面具有重要意義,是直升機健康和使用監(jiān)測系統(tǒng)(health and usage monitoring system,簡稱HUMS)的重點和難點[1]。
獨特的行星結構使行星齒輪箱的振動信號成分復雜,具有強烈的非平穩(wěn)性和耦合調制特征,增加了故障診斷的難度。目前,科研人員在行星齒輪箱的故障診斷上開展了基于數學模型、信號處理以及模式識別等方面的研究[2]?;谀P偷姆椒m然表征了輸出響應與模型參數之間的關系,有助于了解行星齒輪箱工作原理和故障機理,但由于存在許多假設與簡約化,導致仿真數據與真實情況存在一定差距,故障診斷精度有待提高[3‐4]?;谛盘柼幚淼姆椒ㄊ苤朴谛行驱X輪箱復雜的振動信號,提取與判別出微弱的故障信息仍存在許多不確定因素,影響了診斷的準確度[5‐6]。另外,基于傳統(tǒng)的模式識別方法由于其淺層學習機制的限制,對工況波動、強噪聲背景下的故障診斷魯棒性與泛化能力不足[7‐8]。
近年來,深度學習廣泛應用于旋轉機械系統(tǒng)的特征提取與故障診斷。文獻[9]采用深度置信網絡(deep belief networks,簡稱DBN)融合多個傳感器的有效信息,實現(xiàn)航空發(fā)動機及電力變壓器故障診斷。文獻[10]在堆棧自動編碼器(stacked autoen‐coders,簡稱SAE)中融入去噪編碼,結合多個編碼器的診斷信息融合實現(xiàn)了行星齒輪箱故障診斷。文獻[11]采用深度梯度提升模型逐層學習振動信號特征,對航空發(fā)動機5 類軸承故障進行診斷,并與支持向量機、K‐近鄰及隨機森林等機器學習方法對比驗證了方法的健壯性。相比于淺層學習機制,深度學習通過建立深層模型來映射信號與故障狀態(tài)之間復雜的內在關系,非常適合于大數據背景下多樣性、非線性和高維數據的分析。在直升機行星傳動輪系故障診斷中,應用深度學習進行故障診斷存在兩方面困難:①深度學習模型的診斷精度依賴大量樣本的訓練,在樣本較少的情況下診斷效果較差,而由于實驗條件限制,直升機行星傳動輪系很難獲取大量樣本的故障數據;②直升機行星傳動輪系往往工作在復雜的環(huán)境中,比如強烈的背景噪聲和擾動的工況等,需要深度學習模型在樣本數據波動情況下仍具有較好的健壯性和適應性。
為解決以上問題,筆者結合堆棧收縮自動編碼器[12](SCAE)與輔助分類生成式對抗網絡[13](AC‐GAN)提出了基于SCAE‐ACGAN 的直升機行星傳動輪系故障診斷方法。SCAE 可以從樣本數據擾動情況下提取出更具魯棒性的故障特征,提高了模型的健壯性;而ACGAN 基于對抗學習方式,捕捉真實樣本的內在分布,實現(xiàn)樣本集的擴充,解決樣本較少情況。因此,結合兩者各自優(yōu)勢,SCAE‐ACGAN方法利用ACGAN 生成器產生與真實樣本具有近似分布的生成樣本,擴充樣本數量;利用SCAE 作為判別器,對擴充后的輸入樣本進行真?zhèn)闻袆e與故障分類?;趯箤W習方式,對生成器與判別器交替優(yōu)化,提高樣本生成質量和故障識別能力,最終實現(xiàn)在樣本數量不足和樣本數據波動情況下的直升機行星傳動輪系的故障診斷。
自動編碼器(autoencoder,簡稱AE)是一種具有3 層對稱結構的神經網絡,由編碼網絡和解碼網絡所構成。編碼網絡將輸入矢量映射為編碼矢量,解碼網絡將編碼矢量再映射為輸出矢量。AE 的目標是實現(xiàn)輸出矢量對輸入矢量的重構,在此過程中,編碼矢量作為中間層實現(xiàn)了對輸入矢量特征表達的提取。
其中:θ為編碼參數集;W為編碼權重矩陣;b為編碼偏置向量;f(?)為激活函數。
解碼網絡通過激活函數反向將hm轉換為輸入向量的重構表達
其中:θ′為解碼參數集;W′為解碼權重矩陣;b'為解碼偏置向量。
通過最小化代價函數,即原始樣本輸入xm與重構輸出之間的誤差L,進行自動編碼網絡訓練
為了提高編碼學習的健壯性,收縮自動編碼器(contractive autoencoder,簡稱CAE)在自動編碼器基礎上引入一個正則項,懲罰對輸入樣本擾動的敏感度,這樣CAE 的目標函數是重構誤差和收縮罰項(正則項)的總和,通過最小化該目標函數使學習到的隱層表達盡量對輸入擾動保持不變
其中:J(?)為對編碼函數相關偏導數的Jacobian矩陣。
參數λ用于權衡代價函數的魯棒性和重構誤差,在保證重構誤差最小化的同時,由于懲罰項的限制,CAE 對輸入數據中的小擾動敏感性較小。
為形成深度學習隱含層網絡,將CAE 層層堆疊,將前1 個CAE 的隱含層表達輸入至下1 個CAE,實現(xiàn)隱含層表達的層層提取,最后增加Soft‐max 分類器構成輸出層,構成堆棧收縮自動編碼網絡SCAE,如圖1 所示。
圖1 SCAE 組成示意圖Fig.1 Schematic diagram of SCAE structure
首先;CAE1將輸入樣本xm編碼為其 次,將輸入至CAE2,編碼為;重復以上步驟,直至最后的CAEN,此時輸出隱層表達
預訓練階段實現(xiàn)了多個CAE 的層層連接,逐層提取隱含層表達作為特征向量。預訓練結束后,在輸出層增加Softmax 分類器對樣本分類,輸出類別標簽ym為
其中:θN+1為分類層參數集;g(*)為分類層激活函數。
SCAE 基于交叉熵的代價函數為
其中:Θ={θ1,θ2,…θN+1}為SCAE 參數集;cm為樣本xm的類別標簽。
SCAE 通過最小化?SCAE(Θ)完成網絡參數的微調。
生成式對抗網絡[14](generative adversarial net‐works,簡稱GAN)基于博弈論中雙人零和博弈的啟發(fā),由單個生成器和單個判別器構成。任意可微分的函數都可以用來表示GAN 的生成器D 和判別器G,其結構如圖2(a)所示。其中:xm采樣于原始數據樣本;zr為生成器輸入,采樣于隨機噪聲(例如高斯隨機噪聲);G(zr)為G 生成的盡量服從原始數據分布的生成樣本。
圖2 GAN 與ACGAN 的結構框圖Fig.2 The structure diagram of GAN and ACGAN
GAN 的訓練過程中,D 的目標是判別輸入樣本是真實樣本xm還是生成樣本G(zr);G 的目標是盡量捕捉真實樣本的內在分布,使生成的生成樣本G(zr)在D 上的表現(xiàn)與真實樣本xm一致。基于對抗學習方式,G 和D 不斷優(yōu)化自身性能,直至兩者實現(xiàn)納什均衡,優(yōu)化目標函數為
GAN 的訓練結束后,G 實現(xiàn)了對真實樣本的內在分布的近似估計,同時D 提升了判別能力。
輔助分類生成式對抗網絡ACGAN 結構如圖2(b)所示,生成器G 的輸入除了噪聲外還有指定的類別標簽c,引導生成類條件樣本G(c,zr),以增強現(xiàn)有的生成模型。判別器D 除了分辨出樣本的真?zhèn)蔚母怕史植?,還通過一個softmax 分類器具體給出屬于類別標簽的概率分布。在對抗過程中,判別器目標是盡可能區(qū)分出真實數據和生成數據并且能準確對數據進行分類,而生成器是生成數據能盡可能被判別為真實數據且能被有效分類。
針對樣本數量少、樣本數據波動情況下直升機行星傳動輪系故障診斷的難題,筆者將SCAE 與ACGAN 相結合,提出基于SCAE‐ACGAN 的直升機行星傳動輪系故障診斷方法。方法采用SCAE 作為判別器,BP 神經網絡作為生成器,如圖3 所示。
圖3 SCAE-ACGAN 故障診斷模型Fig.3 Diagnostic model based on SCAE-ACGAN
其中:θz分別為生成網絡的輸入層與輸出層的參數集,且θz={Wz,bz},Wz與為權重矩陣;bz與為偏置向量。
2.1.1 判別器訓練
SCAE‐ACGAN 通過最小化真?zhèn)螛撕炁c類別標簽的代價函數誤差,完成判別器SCAE 的訓練?;诮徊骒卮鷥r函數?SCAE‐ACGAN_G為
其中:?c為類別標簽的交叉熵代價函數誤差;?d為真?zhèn)螛撕灥慕徊骒卮鷥r函數誤差。
其中:Θ為參數集,Θ={θ1,θ2,…,θN+1}。
2.1.2 生成器訓練
其中:?SCAE-ACGAN_G為生成器的代價函數;?g為真?zhèn)螛撕灥慕徊骒卮鷥r函數誤差。
其中:Θ′為參數集,Θ′={θz,θ′z}。
2.1.3 對抗學習方式
基于SCAE‐ACGAN 的直升機行星傳動輪系故障診斷方法的實現(xiàn)流程見圖4,具體步驟如下:
圖4 SCAE‐ACGAN 故障診斷方法流程Fig.4 Algorithm of fault diagnosis based on the SCAE‐ACGAN
1)采集直升機行星傳動輪系振動信號,計算信號頻譜,并將頻譜分為訓練樣本與測試樣本;
2)將訓練樣本輸入至參數設置后的SCAE‐AC‐GAN 故障診斷模型,基于對抗學習方式,不斷交替優(yōu)化SCAE‐ACGAN 的生成器與判別器,直至兩者實現(xiàn)納什均衡,最終完成SCAE‐ACGAN 的訓練。
3)基于訓練后的模型,測試樣本輸入至SCAE‐ACGAN 的判別器,進行行星傳動輪系故障診斷,輸出診斷結果。
方法在直升機行星傳動輪系實驗平臺進行驗證,如圖5 所示,主要由大功率電機、直升機主減速器、負載以及采集設備等組成,其中主減速器含有1個單級行星傳動輪系。
圖5 直升機行星傳動輪系實驗驗證平臺Fig.5 Helicopter planetary gear train experimental verifi‐cation platform
實驗中設置了4 種行星輪裂紋故障,分別為0.5,1,2,4 mm 齒根裂紋故障,如圖6 所示。在齒圈外部安裝加速度傳感器檢測振動信號,采樣頻率為5 kHz,時域波形如圖7 所示。
圖6 行星齒輪齒根裂紋故障Fig.6 Planetary gear root crack fault models.
圖7 原始時域信號Fig.7 The original signals
實驗中,為與直升機實際情況一致,采用額定轉速,并在正常與故障情況下設置了4 種負載等級,分別為無負載和滿負載的25%,50%以及75%。同時在采集的實驗條件下振動信號加入標準的NoiseX‐92 艙內噪聲,信號噪聲比為-5 dB,數據樣本及分配情況如表1 所示。
表1 實驗樣本集Tab.1 Experimental dataset
實驗中,首先確定判別器SCAE 的初始網絡模型參數。通過采用樣本集對SCAE 網絡模型結構參數進行測試,以平均分類準確率最高的參數作為最終結果,確定SCAE 網絡模型結構為1 000‐300‐25‐5,即網絡共有4 層,每層神經元個數為1 000,300,25 和5。
3.2.1 特征可視化分析
為驗證SCAE‐ACGAN 從輸入信號樣本中提取深度特征的有效性,利用主成分分析(principal component analysis,簡稱PCA)從中提取兩個主成分,并與原始頻譜特征提取的兩個主成分進行可視化對比,形成的散點圖如圖8 所示。從圖中可知,在進入SCAE‐ACGAN 模型前,振動信號的原始頻譜特征交叉重疊,難以區(qū)分。經過SCAE‐ACGAN 提取深度特征后,行星輪的不同裂紋故障可有效地被區(qū)分開,而同一裂紋故障很好地聚集在一起,顯示了SCAE‐ACGAN 提取的深度特征的有效性。
圖8 兩種方法提取特征的PCA 可視化對比結果Fig.8 PCA visualization results of features extracted by two methods
3.2.2 診斷準確率分析
圖9 為SCAE‐ACGAN 在不同負載等級下對正常以及裂紋故障模式下的診斷結果。從圖中可以看出,誤判主要發(fā)生在0.05 mm 裂紋故障與正常狀態(tài)之間,主要因為微弱的初始裂紋故障由于振動信號幅值較小,在復雜信號背景下容易受到干擾,尤其是在低載情況下;但隨著負載增大,故障行星齒輪與太陽輪、齒圈嚙合過程產生的振動幅值增加,出現(xiàn)誤判的樣本減少。在相鄰裂紋故障之間也出現(xiàn)了少量誤判,由于都是裂紋故障,不同裂紋長度引起的振動幅值在復雜信號背景下微弱的幅值差異容易引起混淆,在不同負載等級下這種情況都存在。但整體而言,在4 種負載條件下,SCAE‐ACGAN 的平均診斷準確率達到98.15%。
圖9 不同負載等級下SCAE‐ACGAN 故障診斷結果Fig.9 The diagnosis results of the SCAE‐ACGAN under different load levels
應用深度學習進行直升機行星傳動輪系故障診斷面臨著樣本數量少、樣本數據波動兩方面的困難,為了突出SCAE‐ACGAN 在這兩種條件下的診斷性能,引入SCAE,SAE 與DBN 深度學習模型進行對比實驗分析。其中,各深度學習模型主要的網絡參數與SCAE‐ACGAN 相同。為減少隨機因素的影響,實驗重復運行5 次取平均結果進行對比。
在直升機健康管理系統(tǒng)中衡量故障診斷性能需同時考慮漏警率PMAR和虛警率QFAR,因此,筆者采用F1[15](無量綱)來綜合評價不同方法的故障診斷能力,F(xiàn)1越接近1,說明分類器對不同狀態(tài)模式的診斷能力越強,其計算公式為
3.3.1 不同樣本數量下性能對比
由圖10 可知,深度學習方法的故障診斷性能隨著樣本數的增加而逐步提升,而淺層學習方法的故障診斷性能沒有出現(xiàn)變化,依舊維持在較低的診斷水平。這表明深度學習通過大量數據樣本的訓練,能挖掘出頻譜信號中隱含的故障敏感信息,實現(xiàn)高質量的故障診斷。另一方面,相比于其他深度學習方法,由于SCAE‐ACGAN 有機地結合生成器的生成能力與判別器的分類能力,在生成對抗過程中提升了整個模型的質量,因此在面對樣本量較少的情況下,依然可以獲得較高的診斷性能。
圖10 不同樣本數量下的診斷結果Fig.10 The diagnosis results under different sample sizes
3.3.2 樣本數據波動條件下性能對比
樣本數據波動主要來自工況條件的變化:①背景噪聲變化;②負載的波動。為了更好地驗證方法診斷性能,實驗分別在不同的信噪比條件下以及負載波動情況下進行對比分析。
1)不同信噪比條件下性能對比。為了模擬直升機行星傳動輪系運行的噪聲環(huán)境,在采集的振動信號中加入標準的NoiseX‐92 艙內噪聲,形成不同信噪比進行實驗分析,結果如圖11 所示。信噪比在0 dB 及以上,基于深度學習的診斷模型具有較為優(yōu)異的診斷性能,原因在于深層的無監(jiān)督學習網絡結構對輸入數據與故障類別之間的復雜非線性映射具有更強的學習能力。隨著信噪比的進一步降低,各方法的診斷性能均有所降低,而相比于SAE 與DBN,由于SCAE 增加收縮懲罰項,使特征提取函數能抵抗輸入擾動,并通過深層學習把握了數據的流行結構,在信噪比變化情況下依然維持較高的診斷性能。另外,相比于單獨的SCAE,SCAE‐AC‐GAN 通過生成對抗學習,進一步增強了SCAE 模型的穩(wěn)定性,挖掘出更具魯棒性的深度特征,因此獲得更優(yōu)的診斷性能。
圖11 不同信噪比下的診斷結果Fig.11 The fault diagnosis results under different signal-tonoise ratios
2)負載波動情況下性能對比。用原數據集中50% 滿負載下的樣本訓練各學習模型,然后在40%,45%,50%,55%,60%滿負載下重新采集測試樣本對各方法進行測試,實驗結果如圖12 所示。從圖中得知,無論從單個F1結果還是整體數據穩(wěn)定性,SCAE‐ACGAN 都優(yōu)于其他的學習模型。說明通過收縮自動編碼,提高了深度模型的抗擾動能力,同時利用生成器生成與真實樣本不同但分布相似的生成樣本,與真實樣本同時輸入至判別器進行分類,并基于對抗學習的訓練機制,交替迭代優(yōu)化訓練生成器與分類器,加強了模型的泛化能力,提高了診斷性能。
圖12 負載波動下的診斷結果Fig.12 The diagnosis result under load fluctuation
提出了基于SCAE‐ACGAN 的直升機行星傳動輪系裂紋故障診斷方法。SCAE‐ACGAN 有效利用了判別器SCAE 的抗數據擾動能力,提取到了具有優(yōu)異魯棒性的深度特征,提高了方法的健壯性和適應性。同時通過ACGAN 生成與真實樣本具有近似分布的生成樣本,擴充了訓練樣本集。生成器與判別器基于對抗學習方式交替優(yōu)化,逐步提高了模型的故障診斷性能與泛化能力。在真實的直升機傳動輪系實驗平臺注入了5 種裂紋故障模式,在模擬真實運行環(huán)境情況下,對SCAE‐ACGAN 的診斷性能進行了驗證,并與淺層學習模型和其他深度學習模型進行了對比分析,驗證了SCAE‐ACGAN 在樣本數量少及樣本數據波動等情況下相比于其他方法的優(yōu)異性能。