李寶慶,楊路航,楊宇,程軍圣
(湖南大學(xué)機械與運載工程學(xué)院,湖南長沙,410082)
滾動軸承是機械設(shè)備的關(guān)鍵部件,長期在復(fù)雜多變載荷環(huán)境下高速運行,工作環(huán)境惡劣,極易發(fā)生故障,直接影響機械系統(tǒng)的總體性能[1].因此,滾動軸承故障診斷研究具有重要意義,已得到許多學(xué)者的廣泛關(guān)注[2-3].
滾動軸承智能故障診斷的核心是模式識別,隨著近年來人工智能技術(shù)的快速發(fā)展,滾動軸承智能故障診斷方法的研究也迅速發(fā)展[4].人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network,ANN)、支持向量機(Sup?port Vector Machine,SVM)等方法被廣泛應(yīng)用于滾動軸承故障識別,取得了良好的效果[5-6].特別是深度學(xué)習(xí)(Deep Learning,DL)可以利用深層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)直接從原始信號中提取特征,近幾年已在滾動軸承智能故障診斷領(lǐng)域獲得廣泛應(yīng)用[7-8].但是,這些智能診斷方法也存在一些問題,其中:神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)需要大量的訓(xùn)練樣本,而工程實際故障大多為小樣本[9];SVM 方法對核的選取不敏感,確定核參數(shù)和懲罰系數(shù)需要花費較多的時間,另外,由于引入核函數(shù)計算,當(dāng)處理大樣本或者樣本數(shù)據(jù)本身維度相對較高時,會遇到核函數(shù)計算緩慢的問題.
多面體錐函數(shù)(Polyhedral Conic Function,PCF)是一種新的分類函數(shù),具有線性可分特性.Cevikalp等基于PCF 提出了多面體錐分類器(Polyhedral Conic Classifiers,PCC),并將其成功應(yīng)用于目標(biāo)監(jiān)測和人臉識別[10-11].PCC 是一種基于幾何模型的模式識別方法,通過?1范數(shù)錐的超平面截面投影來定義正類的可接受范圍,所約束的正類區(qū)域類似一個凸包,凸包區(qū)域側(cè)重于對正類分布進行嚴(yán)格的劃分,更適用于開放集的訓(xùn)練.但是,PCC 所形成的凸包區(qū)域無法進行不同尺度的伸縮,針對該問題,Cevikalp 等對PCC 的?1范數(shù)項進行向量維度擴展,提出了擴展形式的多面體錐分類器(Extended Polyhedral Cone Classifier,EPCC)[12].雖然EPCC 可以使得分類決策的凸包邊界能夠在每個維度上實現(xiàn)不同權(quán)重的伸縮,但是分類邊界的條數(shù)始終等于向量維度的2 倍,有限的分類邊界數(shù)目無法保證對所有正類樣本進行充分地擬合,從而導(dǎo)致分類精度相對較低.
為提高EPCC的分類精度,本文在對?1范數(shù)向量化的基礎(chǔ)上增加旋轉(zhuǎn)因子,提出旋轉(zhuǎn)多面體錐分類器(Rotated and Extended Polyhedral Conic Classifier,REPCC).REPCC 運用高維空間坐標(biāo)旋轉(zhuǎn)思想,對EPCC 的原始坐標(biāo)空間進行旋轉(zhuǎn)變換后重新融合,實現(xiàn)分類邊界的不同尺度伸縮以及分類邊界域的增加,從而使得分類器決策的凸包邊界能夠更好地擬合正類區(qū)域.本質(zhì)上,REPCC 等基于PCF 的分類模型具有與線性SVM 相似的性質(zhì)和復(fù)雜性,都是基于統(tǒng)計學(xué)習(xí)理論的有監(jiān)督機器學(xué)習(xí)方法,可以使用與SVM 相關(guān)聯(lián)的凸二次規(guī)劃問題進行最大邊距訓(xùn)練求解.但是,REPCC 等分類模型不需要引入核函數(shù),并能夠保證較高的識別率,在參數(shù)選擇上比SVM 更加便捷.
當(dāng)滾動軸承出現(xiàn)故障時,其振動信號的時頻分布與正常情況不同,振動信號的時域和頻域統(tǒng)計參數(shù)通常被用作滾動軸承故障診斷的特征[13].本文將REPCC 應(yīng)用于滾動軸承故障診斷,首先提取振動加速度信號的時域和頻域特征作為候選故障特征;然后采用距離評估技術(shù)[14](Distance Evaluation Tech?nique,DET)篩選候選故障特征中的敏感特征,DET通過有效因子來評估特征在樣本類別變化時的敏感程度,選擇類間變化明顯和類內(nèi)變化小的特征,評估因子越大特征越敏感;最后將篩選后的敏感特征作為分類器的輸入特征,輸入到REPCC 進行故障識別.
在兩種不同的滾動軸承數(shù)據(jù)集上開展實驗驗證,分析REPCC 的識別精度、魯棒性和泛化能力.通過對比實驗,與PCC 和EPCC 相比,REPCC 具有更高的識別精度、更好的抗干擾能力、更好的泛化能力.REPCC可以有效識別滾動軸承的工作狀態(tài)和故障類型,在小樣本情況下具有更優(yōu)越的故障識別性能.
在n維向量空間Rn中,PCF 可以用來分割不相交的兩個點集,對于測試樣本x∈Rn,分類函數(shù)定義如下:
式中:w,a∈Rn,w′x=w1x1+w2x2+…+wnxn,為向量的點積,‖x‖1表示向量x的?1范數(shù),結(jié)果為‖x‖1=|x1|+|x2|+…+|xn|,ξ,γ為實數(shù),ξ代表?1范數(shù)的權(quán)重,γ為偏置.
式(1)所示的函數(shù)是一個多面體錐,其頂點位于(a,-γ) ∈Rn×R,PCF 的每個水平截面都是凸多邊形.三維向量空間下的PCF示意圖如圖1所示.
圖1 PCF的三維空間示意圖Fig.1 Three-dimensional diagram of PCF
從圖中可以看出,在平面g=0 上,多面體錐的四個錐面將平面分為內(nèi)部區(qū)域和外部區(qū)域,由四條線性邊界包圍構(gòu)成,這四條邊界包圍的區(qū)域可以看作是一個封閉的二維凸包,此時在凸包內(nèi)部區(qū)域的點映射到超平面上的值g小于0,外部區(qū)域的點映射到超平面上的值g大于0,實現(xiàn)線性可分.因此,當(dāng)一個二分類數(shù)據(jù)集樣本特征維度為2,且其正類分布較為緊湊,負(fù)類分布較為分散時,一個二維PCF 就能夠很好地對其實現(xiàn)分類擬合.當(dāng)樣本特征維度大于2時,與二維類似,PCF 會在特征空間形成封閉凸包,并在更高維空間形成決策項來實現(xiàn)分類.
多面體錐分類器是基于PCF 提出的,PCC 通過?1范數(shù)錐的超平面截面投影來定義正類的可接受范圍,并且截面投影是線性的,這樣的方式優(yōu)化了一個緊湊的凸包邊界,能夠較好地區(qū)分局部正類和更廣泛的負(fù)類,其決策函數(shù)可以定義為:
為直觀表示PCC 的分類特點,隨機生成二維數(shù)據(jù)樣本點,方框點為正類,圓圈點為負(fù)類,然后使用PCC 進行優(yōu)化分類,分類結(jié)果如圖2 所示.從圖中可以看出,分類邊界完全線性,實現(xiàn)了對隨機樣本點的正確分類.
圖2 二維樣本的PCC分類結(jié)果Fig.2 Classification results of two-dimensional samples by PCC
PCC 所形成的凸包區(qū)域只能進行整體縮放,無法進行不同尺度的伸縮,難以對所有樣本進行完整擬合,影響了PCC的分類精度.針對此問題,Cevikalp等人對PCC 的?1范數(shù)項進行向量維度擴展,得到EPCC,如式(3)所示.
式中,|u|=(|u1|,|u2|,…,|un|)′.向量的?1范數(shù)為向量各個分量的絕對值之和,計算結(jié)果是一個常數(shù).把?1范數(shù)進行向量維度的擴展,以|u|進行表示,為一個向量各個分量的模,結(jié)果是一個n維向量.ξ為其對應(yīng)的權(quán)重向量,其他變量與PCC相同.
EPCC 中的ξ是一個屬于Rn空間的向量,其幾何意義為:分類截面所形成的凸包頂點在n個維度上的不同伸縮因子.因此,PCC中的ξ為常數(shù),只能實現(xiàn)分類截面整體尺度的縮放,而EPCC的分類邊界則更加靈活,可以調(diào)整凸包邊界實現(xiàn)對正類樣本的更好擬合.當(dāng)ξ向量的每個值都相等時,EPCC 就退化成了PCC.
對于測試樣本x,g(x) <0 屬于正類,g(x) >0 屬于負(fù)類.對PCC進行最大邊界訓(xùn)練,對于正類樣本強制g(x) <-1,負(fù)類樣本g(x) >+1.為了實現(xiàn)這種方式的訓(xùn)練,對樣本特征向量和目標(biāo)函數(shù)進行向量維度的擴展,對于PCC 而言,將特征向量擴展為如下形式:
權(quán)重向量擴展為:
由于權(quán)重變化為負(fù)的,所以對于正類樣本f>0,負(fù)類樣本f<0.
同樣地,對于EPCC 而言,將特征向量擴展為如下形式:
權(quán)重向量擴展為:
雖然EPCC 可以使得分類決策的凸包邊界能夠在每個維度上實現(xiàn)不同權(quán)重的伸縮,改善了原始分類區(qū)域擬合正類樣本的精度,但是EPCC的分類邊界數(shù)量始終等于向量維度的2 倍,以二維特征向量分類為例,形成的分類邊界是四邊形,分類邊界只有4條,有限的分類邊界仍然無法保證對所有正類樣本進行充分地擬合,來實現(xiàn)更高的分類精度.
為了擴大分類截面多邊形的邊數(shù),從而使得分類截面能夠更好地擬合正類區(qū)域,將坐標(biāo)軸進行旋轉(zhuǎn),然后融合重新繪制在原始的坐標(biāo)軸中,形成新的凸包區(qū)域,得到旋轉(zhuǎn)多面體錐函數(shù)(Rotated Poly?hedral Conic Function,RPCF).三維向量空間下,RPCF 截面區(qū)域的旋轉(zhuǎn)融合過程如圖3 所示.從示意圖中可以看出,原始錐面形成的凸包邊界只有4條,融合后的凸包邊界增加到了8 條,并且對于新的凸包區(qū)域,凸包上的8 個頂點同時能夠在四個方向維度上進行不同比例的伸縮,從而更好地擬合正類區(qū)域.
圖3 RPCF截面區(qū)域旋轉(zhuǎn)融合示意圖Fig.3 Rotational fusion diagram of RPCF section
基于RPCF 定義REPCC,公式如式(9)所示.式中,A是維數(shù)為n的旋轉(zhuǎn)變換矩陣,即旋轉(zhuǎn)因子,μ是一個權(quán)重向量,ξ和μ控制四個維度方向的伸縮尺度.
在高維空間進行坐標(biāo)旋轉(zhuǎn)須保證旋轉(zhuǎn)因子A是正交矩陣[15].在二維笛卡爾坐標(biāo)系中,旋轉(zhuǎn)因子A的形式如式(10)所示.坐標(biāo)繞原點的旋轉(zhuǎn)可以通過原始坐標(biāo)向量和坐標(biāo)變換矩陣相乘得到,如式(11)所示.其中,0 ≤θ≤π,xnew表示在原坐標(biāo)系中x逆時針旋轉(zhuǎn)θ弧度得到的新坐標(biāo).
在n維空間中,在兩個特征維度的坐標(biāo)系上的旋轉(zhuǎn)因子A可以采用一個n維的單位方陣表示,如式(12)所示.
由于是在n維空間進行旋轉(zhuǎn),需要兩兩組成子坐標(biāo)空間進行旋轉(zhuǎn),共有組子空間,因此需要將每個子空間的旋轉(zhuǎn)矩陣進行左乘.旋轉(zhuǎn)因子的計算流程如表1所示.
表1 旋轉(zhuǎn)因子的計算步驟Tab.1 Calculation flow of rotation factor
選擇一個初始的旋轉(zhuǎn)角度θ,根據(jù)表1 計算相對應(yīng)的旋轉(zhuǎn)因子A.確定旋轉(zhuǎn)因子后,與PCC 和EPCC的變換策略相同,REPCC 將特征向量擴展為式(13)所示的形式,將權(quán)重向量擴展為式(14)所示的形式.
同樣,令偏差,得到?jīng)Q策函數(shù):
REPCC變換后的特征向量和權(quán)重向量的維度是原始的3 倍,屬于R3n空間.分類截面的邊界數(shù)量是原始邊界數(shù)量的2 倍,并且繼承了EPCC 的優(yōu)點,可以實現(xiàn)分類截面在2n個維度上的不同尺度伸縮,可以擬合出更為合理的正類區(qū)域,從而提高分類精度.
為直觀表示,根據(jù)式(1)給出一個二維特征的分類函數(shù),具體參數(shù)如式16 所示,該仿真信號的三維空間示意圖如圖4所示.根據(jù)REPCC,給定一個初始旋轉(zhuǎn)角度后計算旋轉(zhuǎn)因子,其三維空間示意圖如圖5所示.
圖5 RPCF的三維空間示意圖Fig.5 Three-dimensional diagram of RPCF
從圖4 中可以看出,PCF 在平面g=0 形成的二維凸包區(qū)域存在4 條線性邊界,分別為:0.44x1+0.44x2-2.76≤0,0.22x1-0.22x2-0.12≤0,0.44x1-0.22x2-1.44≤0,-0.22x1+0.44x2-1.44≤0.
圖4 PCF的三維空間示意圖Fig.4 Three-dimensional diagram of PCF
從圖5 中可以看出,經(jīng)過旋轉(zhuǎn)融合后的多面體錐函數(shù)在平面g=0 形成的凸包區(qū)域存在8 條線性邊界,RPCF 能夠以更加合理的尺度形成新的凸包邊界來擬合正類樣本.
根據(jù)決策函數(shù),PCC、EPCC 和REPCC 三種分類器的±1 邊距都轉(zhuǎn)化為類似SVM 方法的±1 邊距,采用凸二次規(guī)劃算法進行最大邊距訓(xùn)練,可以得到支持向量,然后根據(jù)決策函數(shù)逆變換獲得權(quán)重向量.目標(biāo)函數(shù)如式(17)所示.
式中:yi為樣本的類別標(biāo)簽,對于正類yi=1,負(fù)類yi=-1,ζi為松弛變量,為對應(yīng)新的特征點不滿足約束的程度,C為懲罰因子,m為訓(xùn)練集總樣本數(shù).
經(jīng)過變換后的凸二次規(guī)劃目標(biāo)函數(shù)求解后,對于每種二分類器,只需要為每個分類器確定權(quán)重向量、錐點a和偏差,其中,錐點a為正類樣本的均值.訓(xùn)練模型的保存和最后新樣本的預(yù)測都不需要考慮核函數(shù)的計算.然后,可以預(yù)測新的測試樣本類別,如式(18)所示.
采用一對多的策略將二分類問題推廣到多分類模型,對于m類問題,以當(dāng)前類為正類樣本,其他類為負(fù)類樣本,構(gòu)造m個分類器進行訓(xùn)練[16].當(dāng)進行新樣本的預(yù)測時,將樣本輸入到每個分類器中,以輸出值最大的那個分類器對應(yīng)的正類類別作為新樣本的最終決策.決策函數(shù)如式(19)所示.
選取滾動軸承振動信號的時域和頻域統(tǒng)計參數(shù)作為故障診斷的特征.時域統(tǒng)計參數(shù)選取16 個,具體有:均值、方根幅值、均方根值、峰值、標(biāo)準(zhǔn)差、偏斜度、峭度、峰度指標(biāo)、裕度指標(biāo)、波形指標(biāo)、脈沖指標(biāo)、方差、最大值、最小值、峰峰值、絕對平均值.頻域統(tǒng)計參數(shù)選取8 個,具體有:頻率均值、頻率均方根值、頻率斜度、頻率峭度、頻率方差、頻率標(biāo)準(zhǔn)差、中心頻率、重心頻率.時域和頻域統(tǒng)計參數(shù)共計24個.
不是所有的特征都對區(qū)分不同的滾動軸承故障敏感,因此在進行分類訓(xùn)練時,需要從候選特征中選擇對故障敏感的顯著特征.DET 方法通過有效因子來評估特征在樣本類別變化時的敏感程度,可以有效提取候選特征中的敏感特征.
基于REPCC 的滾動軸承故障診斷的主要步驟如下:
1)采集滾動軸承不同故障狀態(tài)的振動加速度信號,并將每種故障狀態(tài)的數(shù)據(jù)分為訓(xùn)練樣本和測試樣本,訓(xùn)練樣本和測試樣本各占50%;
2)提取振動加速度信號的時域和頻域統(tǒng)計參數(shù),共計24 個特征參數(shù),進行歸一化處理后構(gòu)建候選特征集;
3)采用DET 方法從候選特征集中篩選敏感特征,評估因子的閾值設(shè)置為全部特征評估因子的均值,選擇大于評估因子閾值的敏感特征作為故障特征,構(gòu)建新的特征集;
4)將經(jīng)過DET 篩選后的特征集輸入REPCC 中進行訓(xùn)練和測試,進行滾動軸承故障診斷.
為驗證基于REPCC 的滾動軸承故障診斷方法的有效性和優(yōu)越性,采用數(shù)據(jù)集A 和B 兩個實驗數(shù)據(jù)集進行分析驗證,具體如表2所示.
表2 實驗數(shù)據(jù)集Tab.2 Experimental data set
數(shù)據(jù)集A 的數(shù)據(jù)來源為美國凱斯西儲大學(xué)軸承數(shù)據(jù)中心,實驗軸承為型號6205-2RS 的SKF 深溝球軸承,采用電火花加工設(shè)置單點損傷,本文采用的數(shù)據(jù)是驅(qū)動端軸承的振動加速度測試數(shù)據(jù),采樣頻率為48kHz,電機轉(zhuǎn)速為1 797 r/min、1 772 r/min、1 750 r/min、1 730 r/min,以每12 000 個數(shù)據(jù)點劃分為一個樣本,總共400個樣本.
數(shù)據(jù)集B 的數(shù)據(jù)來源于旋轉(zhuǎn)機械故障實驗臺的實際測試數(shù)據(jù),實驗滾動軸承型號為6205-2RSSKF,實驗臺如圖6 所示.所有的故障均采用激光切割加工,故障深度為0.2 mm,電機轉(zhuǎn)速為986.1 r/min,采樣頻率10 kHz,以6 000 個數(shù)據(jù)點作為一個樣本,總共400個樣本.
圖6 旋轉(zhuǎn)機械故障試驗臺Fig.6 Failure test device of rotating machinery
為更加客觀地體現(xiàn)REPCC 的分類性能,不對采集得到的振動加速度信號進行處理,直接提取其時域和頻域統(tǒng)計參數(shù)作為候選特征集.然后,采用DET方法從候選特征集中篩選敏感特征構(gòu)建新的特征集.在進行敏感特征篩選時,選擇大于評估因子閾值的敏感特征作為故障特征,評估因子的閾值設(shè)置為全部特征評估因子的均值,有效因子的計算方法參照文獻[14].
數(shù)據(jù)集A 和數(shù)據(jù)集B 經(jīng)過時域和頻域特征提取并進行歸一化后,各個特征的評估因子及其均值如圖7~圖8所示.
圖7 數(shù)據(jù)集A的評估因子Fig.7 Evaluation factors of dataset A
圖8 數(shù)據(jù)集B的評估因子Fig.8 Evaluation factors of dataset B
在圖7-8 中,黑色虛線為平均值,是評估因子閾值,選擇評估因子位于黑色虛線上方的特征構(gòu)建新的故障特征集.從兩圖中可以看出,篩選后重新構(gòu)建的特征集的維數(shù)下降,數(shù)據(jù)集A 的特征維數(shù)從24 下降為14,數(shù)據(jù)集B 的特征維數(shù)從24 下降為11.由于數(shù)據(jù)集A 和數(shù)據(jù)集B 的故障尺寸設(shè)置以及電機轉(zhuǎn)速等試驗工況不同,因此經(jīng)DET 篩選后構(gòu)建的故障特征集不同.
將經(jīng)過DET篩選構(gòu)建的新特征集輸入分類器進行滾動軸承智能故障診斷.為驗證REPCC 的有效性和優(yōu)越性,在表2 所示的兩個數(shù)據(jù)集上采用SVM、PCC、EPCC 和REPCC 進行分類識別,考察不同分類器的識別精度、魯棒性和泛化能力.
3.4.1 分類器的識別精度
在使用不同的分類器時,需要確定分類器所需的相關(guān)參數(shù).SVM 需要確定的參數(shù)為高斯核參數(shù)δ和懲罰系數(shù)C,采用網(wǎng)格搜索法獲取最優(yōu)參數(shù).PCC和EPCC無須進行核計算,需要確定的參數(shù)為懲罰系數(shù)C.由于引入了旋轉(zhuǎn)因子A,REPCC需要確定的參數(shù)為懲罰系數(shù)C和旋轉(zhuǎn)弧度θ,采用控制變量法,旋轉(zhuǎn)弧度θ在EPCC的懲罰系數(shù)C基礎(chǔ)上進行優(yōu)化選擇.
在數(shù)據(jù)集A 和數(shù)據(jù)集B 上,對DET 篩選后的數(shù)據(jù)特征集進行五折交叉驗證實驗,獨立重復(fù)30 次,統(tǒng)計測試數(shù)據(jù)30 次的平均準(zhǔn)確率.PCC 和EPCC的識別精度隨懲罰系數(shù)C的變化如圖9 所示.對于REPCC,在EPCC 懲罰系數(shù)C的基礎(chǔ)上,REPCC 的識別精度隨旋轉(zhuǎn)弧度θ的變化如圖10 所示.利用圖9和圖10 選擇最優(yōu)化參數(shù),各分類器確定的最優(yōu)化參數(shù)如表3所示.
圖9 PCC和EPCC的準(zhǔn)確率隨懲罰系數(shù)的變化Fig.9 Accuracy of PCC and EPCC varies with the penalty coefficient
圖10 REPCC的準(zhǔn)確率隨旋轉(zhuǎn)弧度的變化Fig.10 Accuracy of REPCC varies with the rotation radian
表3 不同分類器的最優(yōu)化參數(shù)Tab.3 Optimization parameters of different classifiers
為分析REPCC 的識別精度,在表3 所示的最優(yōu)化參數(shù)下,隨機獨立重復(fù)30 次實驗,得到平均識別準(zhǔn)確率如表4 所示.從表4 中可以看出,在兩個滾動軸承實驗數(shù)據(jù)集上,REPCC的識別準(zhǔn)確率最高,優(yōu)于改進前的PCC 和EPCC 的識別準(zhǔn)確率,也優(yōu)于SVM的識別準(zhǔn)確率.實驗結(jié)果表明,REPCC 具有更高的識別精度.
從表2 中可以知道,與數(shù)據(jù)集A 相比,數(shù)據(jù)集B的試驗工況更加單一.從表4 中還可以看出,各分類器在數(shù)據(jù)集B上的分類精度都高于數(shù)據(jù)集A,符合實際情況.
表4 不同分類器的識別準(zhǔn)確率Tab.4 Recognition accuracy of different classifiers %
3.4.2 分類器的魯棒性
為分析REPCC 的魯棒性,在兩個滾動軸承實驗數(shù)據(jù)集上進行添加離群點實驗,從其他類的訓(xùn)練樣本中隨機選擇m個樣本作為離群點,添加到當(dāng)前類的訓(xùn)練樣本集中再進行訓(xùn)練,然后驗證測試樣本的識別準(zhǔn)確率.對于不同的m值,每次都隨機獨立重復(fù)30 次,然后統(tǒng)計測試樣本的平均識別精度.實驗結(jié)果如圖11和圖12所示.
圖11 測試集的準(zhǔn)確率隨離群點個數(shù)的變化(數(shù)據(jù)集A)Fig.11 Accuracy of test set varies with the outlier number(dataset A)
圖12 測試集的準(zhǔn)確率隨離群點個數(shù)的變化(數(shù)據(jù)集B)Fig.12 Accuracy of test set varies with the outlier number(dataset B)
從圖11 和圖12中可以看出,在兩個滾動軸承實驗數(shù)據(jù)集上,隨著訓(xùn)練集中混雜的離群點個數(shù)增加,測試集的識別準(zhǔn)確率都出現(xiàn)下降,SVM 的下降程度最嚴(yán)重.圖11 和圖12 對比分析可以看出,對于不同的數(shù)據(jù)集,PCC 和EPCC 的下降趨勢變化較大,REPCC 的下降趨勢基本一致.整體來看,REPCC 的下降趨勢最低,表明REPCC具有更好的魯棒性.
3.4.3 分類器的泛化能力
為分析REPCC 的泛化能力,在兩個滾動軸承實驗數(shù)據(jù)集上,以不同的數(shù)量樣本作為訓(xùn)練集,分析測試樣本集的識別準(zhǔn)確率隨訓(xùn)練集樣本數(shù)量的變化情況.對于兩個實驗數(shù)據(jù)集,每種故障狀態(tài)的數(shù)據(jù)分為訓(xùn)練樣本和測試樣本,隨機選取其中一半為訓(xùn)練樣本,其余的為測試樣本.在訓(xùn)練樣本中根據(jù)不同比例構(gòu)建不同數(shù)量樣本的訓(xùn)練集.在最優(yōu)參數(shù)下,不同樣本數(shù)量的訓(xùn)練集每次隨機獨立重復(fù)30 次,然后統(tǒng)計測試樣本的平均識別精度.實驗結(jié)果如圖13和圖14所示.
圖13 測試集的準(zhǔn)確率隨訓(xùn)練集樣本數(shù)量的變化(數(shù)據(jù)集A)Fig.13 Accuracy of test set varies with the sample size of training set(dataset A)
圖14 測試集的準(zhǔn)確率隨訓(xùn)練集樣本數(shù)量的變化(數(shù)據(jù)集B)Fig.14 Accuracy of test set varies with the sample size of training set(dataset B)
從圖13-14 中可以看出,兩個數(shù)據(jù)集的趨勢基本一致,隨著訓(xùn)練樣本數(shù)量的增加,各分類器的識別準(zhǔn)確率也增加;REPCC 的識別準(zhǔn)確率最高,而且在訓(xùn)練樣本較少的情況下REPCC 的優(yōu)勢更加明顯,識別準(zhǔn)確率大于其他分類器.REPCC 不僅提高了PCC 和EPCC 的分類精度,而且具有更好的泛化能力.
本文在EPCC 的基礎(chǔ)上引入旋轉(zhuǎn)因子,提出了REPCC 模式識別方法,并將其用于滾動軸承智能故障診斷.REPCC 增加了分類邊界數(shù)量,并且分類邊界可以在每個維度上自適應(yīng)伸縮,改進了分類精度,并且具有更好的抗干擾性能和泛化能力.在兩個滾動軸承數(shù)據(jù)集上進行實驗驗證,結(jié)果表明REPCC 可以準(zhǔn)確識別滾動軸承的工作狀態(tài)和故障類型,REPCC可以用于滾動軸承智能故障診斷.
REPCC 是一種二分類約束算法,但是其分類模型也可以作為一種單分類模型,在后續(xù)的研究中可以尋找一種在只有單一樣本分布下的模型優(yōu)化求解算法,實現(xiàn)單分類.