趙榮珍,薛 勇,吳耀春
(蘭州理工大學 機電工程學院,甘肅 蘭州 730050)
隨著人工智能技術和工業(yè)互聯(lián)網(wǎng)的快速發(fā)展,工業(yè)智能化已成為當前流程工業(yè)裝備制造業(yè)發(fā)展的重要趨勢.同時,隨著工業(yè)智能化程度的不斷提高,機械設備在運行過程中的狀態(tài)監(jiān)測數(shù)據(jù)量與日俱增,促使關于旋轉機械的智能故障診斷技術必須加快步入工業(yè)大數(shù)據(jù)的新時代[1-3].由此帶來的關鍵性問題之一是如何從價值密度較低的海量高維信息資源中挖掘出有價值的故障狀態(tài)信息,這已成為當前基于數(shù)據(jù)驅動的智能旋轉機械故障診斷領域的前沿熱點問題.滾動軸承是旋轉機械中最常用的部件之一,其輕微缺陷就可能導致整個機械系統(tǒng)發(fā)生故障.因此,對滾動軸承開展智能決策技術的故障降維與分類問題研究具有重要的科學研究意義與工程應用參考價值.
然而在對滾動軸承進行故障診斷時,為了盡可能更加全面地描述出典型故障的狀態(tài),通常需要從時域、頻域以及時頻域等多角度提取出能夠全方位描述故障狀態(tài)的量化故障特征.由此產(chǎn)生的問題是故障特征中通常包含著大量的相關信息和冗余特征.很顯然,這些不利因素將會導致人工智能自動辨識結果的準確性降低[4-6].因此,探究消除相關信息和冗余特征、降低高維故障數(shù)據(jù)集維數(shù)的有效方法,對于挖掘出能夠反映旋轉機械運行狀態(tài)的有價值故障狀態(tài)信息,從而降低故障分類的難度,提高故障的辨識準確率尤為重要.
流形學習自提出以來,在故障診斷領域引起了廣泛的關注.流行學習的原理是假設所有數(shù)據(jù)都位于某光滑流形上,然后將高維數(shù)據(jù)在流形中的幾何結構特征保留至低維特征中[5-6].經(jīng)典的非線性流形學習算法,如等距映射(isometric mapping,ISOMAP)[7]、隨機近鄰嵌入(stochastic neighbor embedding,SNE)[8]和t分布隨機近鄰嵌入(t-distributed stochastic neighbor embedding,t-SNE)[9]等,都能夠有效地處理高維非線性數(shù)據(jù).其中,t-SNE算法是Ven der Maaten等學者于2008年在SNE算法基礎上提出并改進的新型流形學習降維算法,具有較好的降維和可視化效果[9-10].目前,基于t-SNE算法的滾動軸承故障診斷方法層出不窮.于重重等[11]將t-SNE算法與時間卷積網(wǎng)絡相融合,提出了新的軸承狀態(tài)檢測方法,該方法計算t-SNE算法降維后得到的特征子集樣本熵,以樣本熵為特征,將其輸入時間卷積網(wǎng)絡中預測軸承的退化趨勢.姜戰(zhàn)偉等[12]提出了多尺度時不可逆振動信號復雜度測量方法,用來計算軸承復雜信號的故障特征,利用t-SNE算法對新的故障特征進行降維,并通過粒子群優(yōu)化支持向量機對低維故障特征進行故障模式辨識,從而實現(xiàn)故障診斷.
但是在t-SNE算法的降維過程中,隨著待處理數(shù)據(jù)集維數(shù)的持續(xù)升高,歐氏距離會降低數(shù)據(jù)樣本點之間距離的可區(qū)分度.由此導致的不利后果是數(shù)據(jù)點到其近鄰點與遠鄰點之間的距離近似相等,難以通過距離對數(shù)據(jù)點進行有效區(qū)分.而測地距離指標(geodesic distance,GD)則能夠利用鄰域圖中的最短路徑長度來逼近數(shù)據(jù)點之間的真實距離,從而提供比歐氏距離更大的距離區(qū)分度[13-14].
基于上述分析,本研究擬對測地距離與t-SNE算法相結合的滾動軸承故障數(shù)據(jù)集降維方法進行探討.欲為更好地保持原始高維故障數(shù)據(jù)集局部與全局幾何結構特征,降低滾動軸承故障數(shù)據(jù)集的分類難度,提供理論參考依據(jù).
該指標是指利用最短路徑(Dijkstra)算法,通過數(shù)據(jù)近鄰點之間的局部鄰域距離對真實距離進行估計的距離度量公式,示意圖如圖1所示.假設數(shù)據(jù)點位于某流形上,點A、C為該流形上的任意兩點,則它們之間的歐氏距離可表示為直線段AC,測地距離可表示為繞流形表面的曲線段ABC.由圖1可以看出,在高維空間中,測地距離比歐式距離能夠更好地描述數(shù)據(jù)點之間的真實距離,增大數(shù)據(jù)點之間距離的可區(qū)分度,從而更好地描述數(shù)據(jù)的幾何結構特征.
圖1 測地距離示意圖Fig.1 Schematic diagram of geodesic distance
Dijkstra[14]是經(jīng)典的單源最短路徑算法,用于求解從起點開始到其他所有節(jié)點的最短路徑.它的基本思路是從起點開始逐層向外擴展,直到擴展至所有點為止.該算法尋找最短路徑的方式為:將帶權圖中的所有節(jié)點存入集合S、T中,兩集合中分別存放的是已確定為最短路徑的節(jié)點和未確定為最短路徑的節(jié)點,需按照最短路徑長度遞增的順序逐個把T中的節(jié)點選入S中,直到S中包含所有節(jié)點為止.該算法的主要步驟如下:
(1)
在圖G中利用最短路徑算法計算任意兩點間的最短路徑,其距離尋優(yōu)經(jīng)過的路徑記為PG[14],即
pG(xi,xj)={xi,xi+1,…,xj-1,xj}
(2)
則數(shù)據(jù)點i、j之間的測地距離可表示為
(3)
該算法作為流形學習算法通常被用于非線性數(shù)據(jù)的降維過程中,其高維數(shù)據(jù)的可視化效果較好.它的核心思想是:假設高維數(shù)據(jù)和低維數(shù)據(jù)分別服從高斯分布和t分布,則通過歐氏距離構造高維數(shù)據(jù)的概率分布,通過t分布構造低維數(shù)據(jù)的概率分布;利用損失函數(shù)使得高維概率分布與低維概率分布盡可能相似,從而得到降維結果.步驟如下[9]:
(1) 假設高維輸入樣本為X={x1,x2,…,xi,…,xn|xi∈RD},高維空間的概率分布定義為pj|i,表示xj可能成為xi近鄰點的概率,即
(4)
式中:pi|i=0;pj|i≠pi|j;γi為中心點是xi的高斯方差,可通過二分法搜索指定的復雜度prep得到,復雜度的定義為prep(Pi)=2H(Pi),H(Pi)為香農(nóng)信息熵,表達式為
(5)
(2) 高維空間中具有對稱性的聯(lián)合概率分布為
(6)
其中,對任意的i、j都有pij=pji.
(3) 設Y={y1,y2,…,yn}為高維數(shù)據(jù)集的低維初始嵌入坐標,則低維服從t分布的聯(lián)合概率分布為
(7)
(4) 構建損失函數(shù)KL(Kullback-Leibler)散度,它是用來測量高維與低維概率分布之間差異性大小的.其值越小,說明高維和低維之間的概率分布越相似;其值越大,說明高維和低維之間的概率分布差異性越大.即
(8)
(5) 為了獲得低維特征,通過梯度下降法最小化KL散度,即
(9)
對其進行迭代更新,即
(10)
式中:ξ代表學習率;η(t)代表第t次迭代系數(shù).
(6) 重復式(7~10),可得到低維映射結果Y={y1,y2,…,yi,…,yn|yi∈Rm,m 上述t-SNE算法的目的是保持降維前、后數(shù)據(jù)集的局部與全局幾何結構特征基本一致,但該算法保持后者基本一致的能力較弱[10,15].此外,該算法還會出現(xiàn)在高維空間中距離較遠的兩數(shù)據(jù)點之間計算距離反而變小,近鄰點與遠鄰點之間的可區(qū)分度降低.這將導致經(jīng)降維運算得到的低維數(shù)據(jù)集仍然存在著不利于實施分類運算的數(shù)據(jù)擁擠問題. 鑒于t-SNE算法是通過低維概率分布模擬高維概率分布從而實現(xiàn)降維的,那么高維故障數(shù)據(jù)集的幾何結構特征保留得越完整,則后續(xù)的降維效果以及故障分類準確率也就越高.從對t-SNE算法的介紹可知,隨著待處理數(shù)據(jù)集維數(shù)的升高,該算法會導致近鄰點與遠鄰點之間的距離區(qū)分度逐漸降低,無法有效保持降維前、后數(shù)據(jù)集的局部與全局幾何結構特征基本一致,而且該算法對全局幾何結構特征的保持能力較弱.從對測地距離的介紹可知,該方法能夠通過計算最短路徑的方法近似求得數(shù)據(jù)點間的真實距離,增大數(shù)據(jù)點之間的距離區(qū)分度,有效地保持高維數(shù)據(jù)的局部與全局幾何結構特征.因此,將2種方法的優(yōu)點進行結合.本研究擬設計新的流形學習降維算法,即通過測地距離改進t-SNE算法的D-t-SNE(dijkstra-t-distributed stochastic neighbor embedding)故障數(shù)據(jù)集降維方法,并將其用于滾動軸承高維故障數(shù)據(jù)集降維處理中.算法的原理描述如下: 輸入 高維故障數(shù)據(jù)集X={x1,x2,…,xi,…,xn|xi∈RD; 輸出 低維特征子集Y. Step1 輸入高維故障數(shù)據(jù)集,構建鄰域圖G,根據(jù)式(3)計算其測地距離. Step2 根據(jù)式(6)和式(7)分別構建高維聯(lián)合概率分布和低維聯(lián)合概率分布,設定復雜度大小. Step3 根據(jù)式(8)建立損失函數(shù),通過梯度下降法對其求解. Step4 利用式(10)進行更新迭代,獲得低維特征子集Y. D-t-SNE算法的主要思路包括:首先,構建能夠全面描述故障狀態(tài)的多域高維故障數(shù)據(jù)集,通過k近鄰法構建出能夠正確表達數(shù)據(jù)幾何結構特性的鄰域圖,在鄰域圖中利用最短路徑算法近似求得與真實距離較為接近的測地距離;隨后,用測地距離替代歐氏距離計算高維故障特征數(shù)據(jù)集的聯(lián)合概率分布,再通過t分布建立低維聯(lián)合概率分布;最后,通過最小化高維和低維概率分布之間的損失函數(shù)E,獲得最佳的低維特征. 該算法中所提出的復雜度屬于變參數(shù)[16],它的作用是調節(jié)算法降維過程中保持全局信息與局部信息的比例.值越小,算法更傾向于保留局部信息;值越大,算法更傾向于保留全局信息.按經(jīng)驗復雜度通常取5~50. 由式(11~13)可知,Sb越大,Sw越小,γ也就越大,表明低維敏感數(shù)據(jù)集的聚類與分類效果越好. 故障診斷的目標是在實現(xiàn)故障分類的基礎上實現(xiàn)故障的自動辨識,故通過KNN[18](k-nearest neighbor)、支持向量機[19](support vector machine,SVM)和BP[20](back propagation)這3種分類器來驗證低維敏感特征子集的分類準確率.分類準確率越高,表明相應算法的降維效果越好,辨識準確率越高. 本研究所提方法的故障診斷流程圖如圖2所示,它的具體應用步驟如下: 圖2 D-t-SNE的故障診斷流程圖Fig.2 The fault diagnosis flow chart of the D-t-SNE Step1 采集機械設備的振動信號,消噪后計算多域的量化故障特征,構建高維故障數(shù)據(jù)集. Step2 對高維故障數(shù)據(jù)集進行歸一化處理. Step3 計算測地距離GD,設置近鄰數(shù)k=12. Step4 計算高維空間聯(lián)合概率分布pij和低維空間聯(lián)合概率分布qij,復雜度prep設為50,通過最小化KL散度求得降維結果. Step5 將特征子集分為訓練集和測試集,利用多種分類器分別驗證測試集的模式辨識效果,確定測試集的故障類別. 在本研究中,滾動軸承故障模擬實驗是在如圖3所示的厚德儀表HZXT-DS-001型轉子實驗臺上進行的.所選故障軸承是型號為6308的深溝球軸承,模擬了如圖4所示的滾動體破裂、保持架破裂、內(nèi)圈裂紋、外圈裂紋和正常共5種狀態(tài)故障.為能夠全面地進行分析,分別用1個加速度傳感器和2個電渦流傳感器采集故障軸承的振動響應,每次采集1種故障軸承.設置采樣頻率為8 000 Hz.在轉速為3 000 r/min時采集5種故障狀態(tài)各80組樣本供本研究使用.將每種故障數(shù)據(jù)以40∶40的比例分為訓練集和測試集,5種狀態(tài)下的訓練集和測試集均為200組樣本.為能夠從多視角相對比較全面地描述出故障軸承不同故障狀態(tài)之間的差異性,最終確定使用如表1所列的時域、頻域和時頻域共32個特征描述單個通道信號的特征,用5個通道信號的特征構建出能夠描述滾動軸承運行狀態(tài)的高維原始故障數(shù)據(jù)集,共由32×5=160個特征組成. 圖3 雙跨轉子實驗臺Fig.3 Double span rotor test bench 圖4 故障軸承Fig.4 Fault bearings diagram 表1 故障特征參數(shù)Tab.1 Fault characteristic parameters 為驗證D-t-SNE算法的有效性,本研究選擇了t-SNE和SNE算法進行降維性能對比.在使用期間,上述3種算法的復雜度均設為prep=50;D-t-SNE算法的近鄰數(shù)設為k=12.最終經(jīng)SNE、t-SNE和D-t-SNE這3種算法降維后得到的低維特征子集可視化效果如圖5所示.其中,圖5a是原始高維故障數(shù)據(jù)集的分布狀況,圖5b~5d分別是經(jīng)SNE、t-SNE和D-t-SNE算法降維后得到的低維特征子集可視化效果. 由圖5d可以看出,使用D-t-SNE算法降維后的可視化效果明顯優(yōu)于其他2種算法,此時軸承的5種狀態(tài)可以有效地被分離開.很顯然,此結果呈現(xiàn)的特點是類內(nèi)距離較小,類間距離較大,不同類之間無混疊現(xiàn)象.由圖5c可以看出,經(jīng)t-SNE算法降維后,滾動體破裂與內(nèi)圈裂紋的類間距離較小,外圈裂紋與正常狀態(tài)之間產(chǎn)生了一定的混疊現(xiàn)象,各故障狀態(tài)之間無法完全有效地被分離開.由圖5b可以看出,經(jīng)SNE算法降維后得到的結果最差,類間較為聚集,類內(nèi)較為分散,各狀態(tài)之間均存在著較為嚴重的混疊現(xiàn)象,類間因擁擠嚴重呈現(xiàn)出難以實施分類的狀況. 圖5 各算法的降維效果Fig.5 Dimensionality reduction effect of each algorithm 為衡量各方法的降維效果,在研究中使用衡量指標Sb、Sw以及可分性指標γ=Sb/Sw對3種算法的降維效果進行評價,結果如圖6所示,各算法的3項指標分別按照從左至右的順序進行排列. 圖6 各方法降維后測試樣本的評價結果Fig.6 Evaluation results of test samples after dimensionality reduction by each method 因故障診斷的目標是模式辨識,故為了進一步衡量各算法的降維效果,還利用KNN、SVM和BP這3種分類器分別驗證經(jīng)各算法降維后測試樣本的分類準確率,結果如表2所列.此時,設置KNN的k=12;SVM采用高斯徑向基核函數(shù),通過網(wǎng)格搜索法[21]對其核參數(shù)和懲罰因子進行尋優(yōu);BP分類器的隱含層神經(jīng)元個數(shù)設為10. 表2 各方法的分類準確率Tab.2 The classification accuracy of each method 由圖6和表2對比分析可以看出:1) 經(jīng)SNE算法降維得到的低維特征子集降維效果與分類準確率最差,原因是非對稱的條件概率導致算法效果較差,同時高斯分布使得該算法對離群點較為敏感,從而產(chǎn)生擁擠問題;2) 經(jīng)t-SNE算法降維得到的低維特征子集降維效果與分類準確率較差,原因是歐式距離會降低高維數(shù)據(jù)點間距離的可區(qū)分度,導致數(shù)據(jù)點間的距離不易區(qū)分,在一定程度上影響算法的降維效果與分類準確率;3) 而經(jīng)D-t-SNE算法降維得到的低維特征子集降維效果與分類準確率最好,原因是該方法能夠利用測地距離有效地逼近了高維空間中數(shù)據(jù)點間的真實距離,增大了距離的可區(qū)分度,有效地提高了低維概率分布對高維概率分布模擬的準確性,從而優(yōu)化降維效果,提高故障的分類精度.上述分析充分表明,本研究提出的D-t-SNE算法在用于滾動軸承故障診斷時,具有更好的降維效果與故障分類準確率. 1) 為驗證D-t-SNE算法在小樣本情況下是否具有穩(wěn)定性,本研究以改變訓練樣本與測試樣本比例的方式,通過KNN、SVM和BP分類器分別驗證了不同比例下各算法降維后測試樣本的分類準確率.訓練樣本與測試樣本的比例分別設為10∶70、20∶60、30∶50、40∶40、50∶30、60∶20、70∶10,得到的識別效果如圖7所示.由圖7可以看出:隨著訓練樣本的增多,所獲得的有價值故障狀態(tài)信息也就越多,因此,各方法的平均識別率整體呈上升趨勢;而隨著訓練樣本的減少,SNE和t-SNE算法降維后得到的低維特征子集識別率下降比較明顯,此時D-t-SNE算法仍然能夠保持較高的平均識別率,且在任意分類器中的識別效果均優(yōu)于其他2種算法.這說明,D-t-SNE算法具有更高的穩(wěn)定性和更強的信息挖掘能力. 圖7 變訓練樣本對應的平均識別率Fig.7 The average recognition rate corresponding to the variable training sample 2) 為驗證D-t-SNE算法的抗噪性能,本研究參考文獻[22]的評價方法,設置每種故障狀態(tài)的訓練和測試樣本均為40組,分別設置系數(shù)α=0、0.5、1、1.5、2的隨機噪聲對測試樣本進行擾動,之后再利用KNN、SVM和BP這3種分類器分別驗證3種算法在不同干擾情況下的分類準確率,結果如圖8所示.由圖8可以看出,隨著噪聲干擾程度的增加,3種算法的平均識別率均有所下降,但D-t-SNE算法在不同的噪聲干擾下均能夠保持較高的平均識別率,且在任意分類器中的識別率準、確率均最高.由此說明,D-t-SNE算法具有相對比較高的抗噪性能,即魯棒性較強,更適應復雜的動態(tài)工作環(huán)境. 圖8 不同噪聲干擾下各算法的平均識別率Fig.8 The average recognition rate of each algorithm under different noise interference 3) 因旋轉機械在工作狀態(tài)下轉速具有一定的波動性,故通過變工況實驗驗證D-t-SNE算法對速度波動的適應性.實驗選擇用2 600、2 800、3 000 r/min這3種不同轉速的混合數(shù)據(jù)模擬變工況環(huán)境下的速度波動情況.分別在3種不同轉速的每類故障中選取20組數(shù)據(jù)(共60組)混合后作為訓練樣本,另取各轉速下每類故障中不重復的20組數(shù)據(jù)(共60組)混合后作為測試樣本.通過KNN、SVM、BP這3種分類器驗證變工況條件下經(jīng)各算法降維后測試樣本的故障辨識效果,結果如表3所列.由表3可以看出,在變工況條件影響下,3種算法降維后得到的測試樣本平均識別率均有所下降,但SNE和t-SNE算法的識別率下降較為明顯,識別效果較差,而D-t-SNE算法的識別率下降幅度較小,識別效果明顯優(yōu)于其他2種算法.由此說明,D-t-SNE算法可以在復雜工況條件下獲得較高的識別率,適應性較強. 表3 變工況條件下各算法的平均識別率Tab.3 Average recognition rate of each algorithm under variable working conditions 4) 通過降維過程所需時間對算法的耗時性能進行分析.實驗電腦的配置為Intel Corei7-8750H、2.20GHz CPU、RAM 8GB、Windows10 64位操作系統(tǒng),安裝的軟件為MATLAB R2018b.3種算法降維過程所需時間如表4所列.由表4可以看出,D-t-SNE算法降維過程所需時間相比t-SNE和SNE算法有微弱的增加.然而,相對其降維效果與模式辨識準確率的巨大提升,所需時間在同一數(shù)量級的增加在可接受范圍內(nèi),因此滿足要求. 表4 各算法降維所需時間Tab.4 The time required of each algorithm to reduce dimension 1) 本研究以t-SNE算法為基礎,通過引入測地距離指標,建立了新的D-t-SNE故障數(shù)據(jù)集降維算法.該算法能夠通過測地距離近似計算數(shù)據(jù)點間的真實距離,增大數(shù)據(jù)點間距離的區(qū)分度,可有效地保持高維數(shù)據(jù)的局部與全局幾何結構特征. 2) 相比其他算法,本研究提出的D-t-SNE算法具有更好的降維效果與更高的故障辨識精度,可為旋轉機械非線性高維故障數(shù)據(jù)集更好地保留其局部與全局幾何結構特征的降維和可視化工作提供全新的解決方案.下一步值得注意的應該是考慮如何自適應選擇算法復雜度的問題.2 D-t-SNE降維算法
2.1 建立的D-t-SNE算法
2.2 參數(shù)對算法降維效果的影響分析
2.3 降維效果衡量指標
2.4 基于D-t-SNE算法的故障診斷模型
3 實驗驗證
3.1 實驗數(shù)據(jù)說明
3.2 降維結果的可視化情況
3.3 降維效果的衡量
3.4 算法的性能評價情況
4 結論