安 煌,趙榮珍
(蘭州理工大學(xué) 機(jī)電工程學(xué)院,蘭州 730050)
在借助于海量數(shù)據(jù)驅(qū)動(dòng)實(shí)施智能決策技術(shù)中,初期遇到的首要問(wèn)題之一是通過(guò)各種特征提取手段剔除無(wú)用冗余數(shù)據(jù),提取有效特征子集[1]。在轉(zhuǎn)子故障診斷過(guò)程中,如何在故障數(shù)據(jù)集中有效地提取出有利于分類的特征子集,一直是以數(shù)據(jù)驅(qū)動(dòng)的轉(zhuǎn)子機(jī)械故障診斷研究領(lǐng)域面臨的挑戰(zhàn)。因此,探討消除冗余信息、降低故障數(shù)據(jù)集維數(shù)的有效方法,對(duì)于全面挖掘出敏感且本質(zhì)的故障特征信息矢量、降低故障分類的復(fù)雜度、提高故障識(shí)別準(zhǔn)確率尤為關(guān)鍵[2]。
流形學(xué)習(xí)的顯著特征是利用局部幾何學(xué)習(xí)獲得高維數(shù)據(jù)蘊(yùn)含的潛在低維結(jié)構(gòu),具有良好的非線性信息處理能力[3]。流形結(jié)構(gòu)可分為局部流形結(jié)構(gòu)和多流形判別結(jié)構(gòu)兩大類,其中從局部流形結(jié)構(gòu)學(xué)習(xí)的典型方法如:拉普拉斯特征映射(Laplacian eigenmapas,LE)[4],局部線性嵌入(locally linear embedding,LLE)[5],局部結(jié)構(gòu)保持(locality preserving projections,LPP)[6],核局部保持投影(kernel locality preserving projection,KLPP)[7]等。KLPP是在LPP基礎(chǔ)上通過(guò)引入核函數(shù),解決了LPP難以提取非線性數(shù)據(jù)近鄰結(jié)構(gòu)的問(wèn)題,其在保持局部近鄰結(jié)構(gòu)的同時(shí)實(shí)現(xiàn)線性計(jì)算。但是KLPP本質(zhì)上是一種線性無(wú)監(jiān)督算法,在面對(duì)各類流形相近的情況時(shí)難以獲得具有強(qiáng)辨識(shí)能力的低維矢量。而面向分類的多流形學(xué)習(xí)成為當(dāng)前流形學(xué)習(xí)發(fā)展的一個(gè)主流方向,典型的如邊緣判別分析(marginal Fisher analysis,MFA)[8],最大間距標(biāo)準(zhǔn)(maximum marginal criterion,MMC)[9],非參判別多流形學(xué)習(xí)(nonparametic discriminant multi-manifold learning,NDML)[10]等。其中,NDML從多流形學(xué)習(xí)的角度構(gòu)造了一種基于異類近鄰的判別結(jié)構(gòu),使獲得的潛在低維嵌入具有較好的分類識(shí)別性能,但是它對(duì)非線性數(shù)據(jù)難以得到較好的分類效果。
傳統(tǒng)的流形學(xué)習(xí)方法多數(shù)采用歐氏距離,當(dāng)處理非線性或存在離群點(diǎn)數(shù)據(jù)時(shí)容易導(dǎo)致近鄰誤判,嚴(yán)重限制了它在轉(zhuǎn)子故障數(shù)據(jù)分類中的應(yīng)用,相關(guān)熵作為一種相似性度量方式,能很好地拒絕離群點(diǎn),對(duì)處理非線性數(shù)據(jù)具有較好的魯棒性[11-12]。
受核局部保持投影算法(KLPP)和非參判別多流形學(xué)習(xí)算法(NDML)的啟發(fā),本文提出了相關(guān)熵測(cè)度核局部保持多流形判別投影算法(correntropy kernel locality preserving multi-manifold discriminant projection,CKLPMDP)。CKLPMDP主要從兩個(gè)方面來(lái)提高原始KLPP算法的降維效果:一是采用相關(guān)熵測(cè)度度量樣本間的相似性,使樣本近鄰關(guān)系判斷更準(zhǔn)確,提高算法的降維效果;二是尋求原始高維數(shù)據(jù)集的低維映射時(shí),通過(guò)將原始空間統(tǒng)一映射到更高維的核空間,在保持?jǐn)?shù)據(jù)局部流形結(jié)構(gòu)的同時(shí),融入多流形判別結(jié)構(gòu)信息,最大化各流形間的距離,使嵌入在高維的低維流形具有更多的分類信息。預(yù)期目標(biāo)是通過(guò)將該算法應(yīng)用于轉(zhuǎn)子故障數(shù)據(jù)集的降維,為降低故障診斷難度提供理論參考依據(jù)。
給定兩個(gè)樣本x=(x1,…,xn)和y=(y1,…,yn)。相關(guān)熵測(cè)度可以表示為
D(x,y)=E[Kσ(x-y)]
(1)
式中:Kσ(·)是一個(gè)核函數(shù);E是一個(gè)求期望運(yùn)算。它利用核方法將輸入空間向高維空間做非線性映射,不同于傳統(tǒng)的核方法,它只與樣本對(duì)有關(guān)。實(shí)際應(yīng)用中,樣本x和y的聯(lián)合概率密度函數(shù)通常是未知的,只有有限的數(shù)據(jù)可以使用。因此,相關(guān)熵被估算為
(2)
Kσ(·)可以取滿足MERCER理論的函數(shù)。本文取高斯核函數(shù)
(3)
傳統(tǒng)的歐氏距離在度量高維非線性樣本距離時(shí),對(duì)不同屬性同等對(duì)待,當(dāng)某一屬性值有噪聲時(shí),樣本距離也會(huì)隨之突增。而相關(guān)熵距離度量更注重局部相似的屬性,它的值主要由與x=y呈正相關(guān)的核函數(shù)決定[13],比歐氏距離度量樣本相似性更穩(wěn)定。
相關(guān)熵測(cè)度局部保持多流形判別投影算法采用相關(guān)熵測(cè)度度量樣本的相似性,避免了流形學(xué)習(xí)對(duì)含有噪聲特征敏感的缺點(diǎn),并借鑒了核局部保持投影算法可以保持局部非線性流形結(jié)構(gòu)的優(yōu)點(diǎn)和非參判別多流形學(xué)習(xí)中構(gòu)建的異類近鄰判別結(jié)構(gòu)可以拉大不同流形間距離的思想。其基本思想:設(shè)原始空間中的樣本集X=(x1,x2,…,xN),定義從原始空間到高維核空間的非線性映射φ,相關(guān)熵測(cè)度核局部保持多流形判別投影算法的目標(biāo)就是在核空間中尋求投影矢量W∈RD×d(d 借鑒核局部保持投影算法的思想,并針對(duì)該算法容易受含有噪聲特征的影響,導(dǎo)致局部鄰圖失真的缺點(diǎn),本研究采用相關(guān)熵測(cè)度度量樣本的相似性,監(jiān)督樣本近鄰圖的構(gòu)建。該算法通過(guò)保持核空間中樣本的近鄰關(guān)系,實(shí)現(xiàn)數(shù)據(jù)的低維映射,使局部非線性流形結(jié)構(gòu)得以保持。目標(biāo)函數(shù)定義如下:當(dāng)φ(xi)與φ(xj)為近鄰,則yi=WTφ(xi)與yj=WTφ(xj)也是近鄰關(guān)系,從而實(shí)現(xiàn)近鄰結(jié)構(gòu)的保持。相關(guān)熵測(cè)度核局部保持算法的目標(biāo)函數(shù)為 (4) 特征空間φ(X)=(φ(x1)φ(x2)…φ(xN)),并根據(jù)核再生理論,存在一組系數(shù)A=(α1,α2,…αN)T滿足W=φ(X)A,Si,j作為近鄰圖中的權(quán)重系數(shù),其大小表示兩點(diǎn)的相近程度??臻g中樣本點(diǎn)越相近相關(guān)熵取值越大,因此定義Si,j取值為 (5) 引入核矩陣K=(K(i,j))=φ(xi)Tφ(xj),則局部結(jié)構(gòu)保持投影目標(biāo)函數(shù)表示為 (6) KLPP通過(guò)保持核空間中數(shù)據(jù)點(diǎn)的近鄰關(guān)系實(shí)現(xiàn)對(duì)原始數(shù)據(jù)集局部結(jié)構(gòu)的提取,但是KLPP對(duì)于相近流形的低維投影仍然會(huì)出現(xiàn)混疊問(wèn)題,導(dǎo)致算法的分類性能較差。 2WTφ(xi)φ(xik)TW) (7) 引入核矩陣K=(K(i,j))=φ(xi)Tφ(xj),且存在一組系數(shù)A=(α1,α2,…,αN)T滿足W=φ(X)A,則改進(jìn)的核化多流形判別投影目標(biāo)函數(shù)表示為 (8) 改進(jìn)的核化多流形判別投影目標(biāo)函數(shù)的求解能夠使非線性數(shù)據(jù)集經(jīng)過(guò)投影后,不同流形之間的距離拉大,但是對(duì)于局部流形結(jié)構(gòu)難以得到保持。 結(jié)合本文相關(guān)熵測(cè)度核局部保持算法和改進(jìn)的核化多流形判別投影算法的優(yōu)缺點(diǎn),構(gòu)造相關(guān)熵核局部保持多流形判別投影目標(biāo)函數(shù),使得到的特征空間中,局部近鄰結(jié)構(gòu)得到保持,不同流形之間的距離拉大,其目標(biāo)函數(shù)定義如下 (9) 將目標(biāo)函數(shù)轉(zhuǎn)化為廣義特征值的問(wèn)題求解。采用拉格朗日乘子法,令分母為非零常數(shù),即ATKLKA=C≠0,定義朗格朗日函數(shù)為 L(A,λ)=AT(KK+K′K′-2KK′)A-λ(KLKA-C) (10) 式中,λ為拉格朗日乘子。 將式(7)對(duì)A求偏導(dǎo)得 (11) 令偏導(dǎo)為零,即 (KK+K′K′-2KK′)A=λKLKA (12) 通過(guò)求解該廣義特征方程的前r個(gè)最大的特征值對(duì)應(yīng)的特征向量得到最佳投影矩陣A=(α1,α2,…,αr)。 結(jié)合本文改進(jìn)的相關(guān)熵測(cè)度核局部保持算法和核化多流形判別投影算法的優(yōu)缺點(diǎn),設(shè)計(jì)融合的CKLPMDP降維算法,其具體實(shí)現(xiàn)步驟如下。 步驟1數(shù)據(jù)集X∈Rd通過(guò)核函數(shù)映射到高維核空間H(X)∈Rh(h≥d),并采用式(1)為距離度量構(gòu)建局部近鄰圖和異類近鄰圖。 步驟2根據(jù)式(6)構(gòu)造相關(guān)熵測(cè)度核局部保持目標(biāo)函數(shù)Jl(α),其中權(quán)重系數(shù)Si,j作為近鄰圖中兩點(diǎn)的相近程度。 步驟3根據(jù)式(8)構(gòu)造核化多流形判別投影目標(biāo)函數(shù)Jg(α)。 步驟4由式(9)計(jì)算整體目標(biāo)函數(shù)J(α),并根據(jù)式(12)計(jì)算得到低維特征空間的r個(gè)基矢量A=(α1,α2,…,αr)T,并按照Y=AK計(jì)算數(shù)據(jù)集的r維投影。 步驟5對(duì)于新樣本,計(jì)算其與訓(xùn)練樣本的核函數(shù)Kt,并按Y=AKt計(jì)算新樣本的低維投影。 相關(guān)熵測(cè)度核局部保持多流形判別投影算法的流程設(shè)計(jì)如圖1所示。具體實(shí)施步驟如下。 圖1 CKLPMDP的故障診斷流程圖Fig.1 The flow chart of the fault diagnosis of CKLPMDP 步驟1對(duì)機(jī)械振動(dòng)信號(hào)進(jìn)行采集,并對(duì)其進(jìn)行小波消噪處理。 步驟2對(duì)消噪后的振動(dòng)信號(hào)進(jìn)行時(shí)域、頻域的特征提取,組成訓(xùn)練集和測(cè)試集 步驟3將訓(xùn)練集輸入CKLPMDP進(jìn)行訓(xùn)練,得到低維映射矩陣A。 步驟4通過(guò)得到的映射矩陣A對(duì)訓(xùn)練集及測(cè)試集進(jìn)行維數(shù)約簡(jiǎn),再將得到的低維敏感特征子集Y輸入KNN,進(jìn)行故障模式辨識(shí)。 使用的原始數(shù)據(jù)來(lái)源于文獻(xiàn)[14]中的雙跨度轉(zhuǎn)子試驗(yàn)臺(tái),實(shí)驗(yàn)振動(dòng)信號(hào)通過(guò)布置在轉(zhuǎn)子實(shí)驗(yàn)臺(tái)上的12個(gè)電渦流傳感器進(jìn)行采集,在主軸轉(zhuǎn)速為2 800 r/min、采樣頻率為5 000 Hz的情況下,對(duì)該轉(zhuǎn)子實(shí)驗(yàn)平臺(tái)分別進(jìn)行了正常轉(zhuǎn)動(dòng)、質(zhì)量不平衡、軸系不對(duì)中、動(dòng)靜碰摩及軸承松動(dòng)實(shí)驗(yàn),分別得到以上五種狀態(tài)振動(dòng)信號(hào)各80組,數(shù)據(jù)樣本長(zhǎng)度為2 048,選取每類狀態(tài)中的50組作為訓(xùn)練樣本,剩余的30組作為測(cè)試樣本。提取樣本集每個(gè)通道(共12個(gè)通道)的6個(gè)時(shí)域特征和10個(gè)頻域特征組成初始訓(xùn)練特征集和測(cè)試集,其中時(shí)域特征包括均值,峰值,方根幅值,偏度指標(biāo),峭度指標(biāo)和方差,頻域特征包括反映頻域振動(dòng)能量大小的均值頻率,反映頻帶位置變化的頻譜二階矩和中心頻率等,反映頻譜分或集中程度的特征矢量等,各參數(shù)的計(jì)算公式參考文獻(xiàn)[15]。 為了驗(yàn)證本文所提方法的特征提取效果,對(duì)本文所提方法進(jìn)行仿真實(shí)驗(yàn),將特征壓縮提取出的前三維特征量,分別與KPCA、KLPP、MFA及采用歐氏距離度量方法的局部保持多流形判別投影降維方法(EKLPMDP)進(jìn)行對(duì)比,如圖2所示(圖中符號(hào)“*”,“□”,“◇”,“Δ”,“○”,分別代表正常、不平衡、不對(duì)中、碰摩、松動(dòng)),并將上述算法降維后得到的特征子集輸入到KNN中,得到的辨識(shí)準(zhǔn)確率如表1所示。 (a) KPCA 表1 各降維算法及其KNN辨識(shí)準(zhǔn)確率Tab.1 Classification indentification method and the KNN recognition accuracy 為了更好地說(shuō)明本文所提CKLPMDP算法的可行性,本文引入文獻(xiàn)[15]中的評(píng)價(jià)指標(biāo)Je來(lái)定量描述類間與類內(nèi)散度。Je越大,則說(shuō)明維數(shù)約減后類間樣本距離越大,類內(nèi)樣本越聚集。類間散度Sb和類內(nèi)散度Swi及兩者的比值Je計(jì)算公式如下 (13) (14) (15) 從圖2和表1、2中可知KPCA降維效果最差,因?yàn)槿址讲钭畲蠡慕Y(jié)構(gòu)保持方法應(yīng)用到非線性分布數(shù)據(jù)時(shí)存在局限性;KLPP通過(guò)在核空間保持局部近鄰關(guān)系的方法對(duì)非線性數(shù)據(jù)得到較好的降維和識(shí)別效果,其中質(zhì)量不平衡,軸系不對(duì)中,動(dòng)靜碰摩樣本聚類效果很好,但軸系不對(duì)中和質(zhì)量不平衡的類間距較小,軸承松動(dòng)和正常轉(zhuǎn)動(dòng)的樣本交叉耦合,沒(méi)有有效地分離;MFA同樣對(duì)軸承松動(dòng)和正常轉(zhuǎn)動(dòng)的樣本沒(méi)有有效分離,其它三種狀態(tài)分離效果較好;本文方法由于綜合考慮了局部流形結(jié)構(gòu)和多流形判別結(jié)構(gòu)信息,采用歐氏距離度量方法和相關(guān)熵測(cè)度的降維效果都優(yōu)于其他降維算法,而且采用相關(guān)熵測(cè)度時(shí),很好地將正常轉(zhuǎn)動(dòng)、質(zhì)量不平衡、軸系不對(duì)中、動(dòng)靜碰摩及軸承松動(dòng)五種狀態(tài)有效分離,且類內(nèi)聚類效果最好,類間距離進(jìn)一步拉開(kāi),評(píng)價(jià)指標(biāo)Je達(dá)到了16.978,因此本文方法具有一定優(yōu)勢(shì),為轉(zhuǎn)子故障診斷提供依據(jù)。 表2 各個(gè)算法降維后的類間類內(nèi)評(píng)價(jià)指標(biāo)Tab.2 Each dimension reduction algorithm using the evaluation index in the classes 為進(jìn)一步對(duì)比特征提取的效果,在不同轉(zhuǎn)速下采集五種狀態(tài)的振動(dòng)數(shù)據(jù),分別利用上述五種方法提取特征,采用KNN辨識(shí)準(zhǔn)確率。各轉(zhuǎn)速的識(shí)別結(jié)果如表3所示。 表3 不同算法在不同轉(zhuǎn)速下的KNN辨識(shí)準(zhǔn)確率Tab.3 KNN identification accuracy of different algorithms at different speeds 從表3可以看出,在不同轉(zhuǎn)速下,CKLPMDP降維方法的平均診斷準(zhǔn)確率都明顯優(yōu)于其他四種降維方法,說(shuō)明本文方法具有良好的適用性。 為了進(jìn)一步說(shuō)明本文方法的通用性、有效性,在圖3所示的雙跨雙轉(zhuǎn)子實(shí)驗(yàn)臺(tái)進(jìn)行研究分析。12個(gè)加速度傳感器通過(guò)布置在每個(gè)軸承座的兩個(gè)徑向方向(X,Y)和一個(gè)軸向方向(Z)測(cè)取振動(dòng)信號(hào),2個(gè)非接觸式的電渦流傳感器測(cè)取轉(zhuǎn)軸的徑向振動(dòng)信號(hào)。在該實(shí)驗(yàn)臺(tái)上模擬轉(zhuǎn)速為2 800 r/min,采樣頻率為20 000 Hz的五種不同程度的不平衡狀態(tài),圖3從左起第一個(gè)質(zhì)量盤命名為負(fù)載盤1,第二個(gè)質(zhì)量盤命名為負(fù)載盤2,在盤上添加若干質(zhì)量為12 g的不平衡質(zhì)量塊模擬不同程度的不平衡狀態(tài),各狀態(tài)所加質(zhì)量塊數(shù)量如表4所示。采集每種狀態(tài)的數(shù)據(jù)樣本80組,其中50組作為訓(xùn)練樣本,30組作為測(cè)試樣本。針對(duì)每個(gè)通道的傳感器采集的振動(dòng)信號(hào)分別提取時(shí)域、頻域共16個(gè)特征。 表4 不平衡狀態(tài)Tab.4 Unbalanced state 圖3 雙跨雙轉(zhuǎn)子綜合故障模擬平臺(tái)Fig.3 The double-span double-rotor integrated fault simulation platform 通過(guò)本文方法對(duì)轉(zhuǎn)子故障特征集進(jìn)行降維,將特征壓縮后的前三維特征矢量三維可視化,如圖4(圖中符號(hào)“*”,“□”,“◇”,“Δ”,“○”,分別代表不平衡1,不平衡2、不平衡3、不平衡4、不平衡5),與其他降維算法對(duì)比KNN故障辨識(shí)準(zhǔn)確率如表5(表中符號(hào)“b1”,“b2”,“b3”,“b4”,“b5”,分別代表不平衡1,不平衡2、不平衡3、不平衡4、不平衡5)。 圖4 測(cè)試樣本的降維效果Fig.4 Test sample reduction method result 從圖4可以看出,采用本文方法降維后的不平衡1與不平衡3故障樣本存在較小范圍的交叉混疊,其他不平衡故障分離狀態(tài)較好。從表5可知本文算法在不同程度的不平衡故障辨識(shí)過(guò)程中,傳統(tǒng)的降維算法故障辨識(shí)準(zhǔn)確率較低,而本文CKLPMDP算法只有在第三種不平衡故障辨識(shí)率為96.7%,其余故障辨識(shí)準(zhǔn)確率都是100%,說(shuō)明本文算法具有較強(qiáng)的通用性和有效性。 表5 各降維算法及其KNN辨識(shí)準(zhǔn)確率Tab.5 Classification indentification method and the KNN recognition accuracy 為實(shí)現(xiàn)高維非線性數(shù)據(jù)集的局部流形結(jié)構(gòu)和多流形判別結(jié)構(gòu)信息的全面提取,提出了一種CKLPMDP新算法,在傳統(tǒng)KLPP局部流形保持的基礎(chǔ)上融合了核化多流形判別結(jié)構(gòu)信息,使降維后的特征空間包含更多分類信息。引入相關(guān)熵測(cè)度,樣本近鄰關(guān)系判斷更準(zhǔn)確,使算法聚類效果更好。通過(guò)雙跨轉(zhuǎn)子實(shí)驗(yàn)臺(tái)模擬數(shù)據(jù)集的實(shí)驗(yàn)驗(yàn)證表明,與其他方法相比,本文提出的相關(guān)熵測(cè)度核局部保持多流形判別投影算法(CKLPMDP)具有更強(qiáng)的降維能力和更高的故障辨識(shí)精度,為轉(zhuǎn)子故障診斷提供了新的解決思路。2.1 改進(jìn)的相關(guān)熵測(cè)度核局部保持算法
2.2 改進(jìn)的核化多流形判別投影算法
2.3 目標(biāo)函數(shù)
2.4 CKLPMDP算法的具體實(shí)現(xiàn)步驟
3 CKLPMDP算法故障診斷流程
4 實(shí)驗(yàn)與分析
4.1 實(shí)驗(yàn)數(shù)據(jù)
4.2 改進(jìn)算法的參數(shù)設(shè)定情況
4.3 降維效果的可視化對(duì)比與結(jié)果
4.4 算法的通用性實(shí)驗(yàn)
5 結(jié) 論