張 建,潘海洋,鄭近德,潘紫微
(安徽工業(yè)大學(xué) 機(jī)械工程學(xué)院,安徽 馬鞍山 243032)
模式識(shí)別方法是人工智能的一個(gè)重要應(yīng)用領(lǐng)域,是通過(guò)計(jì)算的方法根據(jù)樣本的特征對(duì)樣本進(jìn)行分類,在機(jī)械設(shè)備的故障診斷中得到廣泛應(yīng)用,并且發(fā)揮著重要的作用,但是不同的模式識(shí)別方法在分類精度和準(zhǔn)確性上存在較大的差異。
目前應(yīng)用比較廣泛的模式識(shí)別方法有人工神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)(Support Vector Machine,簡(jiǎn)稱SVM),但人工神經(jīng)網(wǎng)絡(luò)需借助經(jīng)驗(yàn)或先驗(yàn)知識(shí)進(jìn)行參數(shù)設(shè)置,并且只有在訓(xùn)練樣本趨于無(wú)窮多時(shí)才收斂于真實(shí)模型[1];SVM需要嚴(yán)格的核函數(shù)及參數(shù)調(diào)整,并且SVM是一個(gè)尋優(yōu)的過(guò)程,當(dāng)樣本的數(shù)目很大時(shí),計(jì)算量也相當(dāng)大[2]。另外,人工神經(jīng)網(wǎng)絡(luò)和SVM并沒(méi)有考慮特征值之間的相互關(guān)系?;诖耍琑aghuraj等提出了一種基于多變量預(yù)測(cè)模型(Variable Predictive Model Based Class Discriminate,簡(jiǎn)稱VPMCD)的模式識(shí)別方法,該方法根據(jù)特征值之間的內(nèi)在關(guān)系建立對(duì)應(yīng)的數(shù)學(xué)預(yù)測(cè)模型,利用得到的數(shù)學(xué)模型對(duì)待測(cè)樣本的各個(gè)特征值進(jìn)行預(yù)測(cè),然后把預(yù)測(cè)結(jié)果作為分類依據(jù),從而完成分類識(shí)別[3–4]。楊宇等人已將VPMCD方法及其改進(jìn)算法引入機(jī)械故障診斷中[5–6],并且取得了較好應(yīng)用效果。但是VPMCD方法及其改進(jìn)算法并沒(méi)有考慮特征數(shù)據(jù)中存在“異常值”的情況,然而工程實(shí)際中采集的信號(hào)往往比較復(fù)雜,使得實(shí)測(cè)數(shù)據(jù)包含各種噪聲信號(hào)以及測(cè)量誤差,所提取的特征值也不可避免地出現(xiàn)“異常值”,上述模式識(shí)別方法并沒(méi)有考慮數(shù)據(jù)中存在“異常值”的情況,導(dǎo)致建立的模型失真。因此,本文提出了一種基于特征評(píng)價(jià)的優(yōu)化加權(quán)代理判別模型(Agent Discriminate Model Based Optimization Weighted,簡(jiǎn)稱ADMOW)模式識(shí)別方法。
ADMOW方法是利用數(shù)據(jù)間的對(duì)應(yīng)關(guān)系建立Kriging代理判別模型代替數(shù)據(jù)間的真實(shí)關(guān)系,Kriging代理判別模型是由回歸模型和相關(guān)模型組合而成,通過(guò)兩類模型的不同組合,建立一系列真實(shí)模型的近似模型,從不同的組合模型中選出最接近真實(shí)模型的一個(gè)組合作為最佳預(yù)測(cè)模型,使之能充分反映特征值之間的對(duì)應(yīng)關(guān)系[7–8],并且針對(duì)“異常值”導(dǎo)致模型參數(shù)出現(xiàn)嚴(yán)重偏差的情況,利用特征評(píng)價(jià)加權(quán)的方法,賦予每項(xiàng)特征值一個(gè)權(quán)值系數(shù)。從而削弱異常值對(duì)代理判別模型的影響,建立更加真實(shí)的代理判別模型,達(dá)到模式識(shí)別的目的。
綜上所述,本文基于VPMCD思想,將Kriging模型和特征加權(quán)相結(jié)合,提出了基于特征評(píng)價(jià)的優(yōu)化加權(quán)的代理判別模型模式識(shí)別方法,并將該方法應(yīng)用到滾動(dòng)軸承故障診斷中,首先將所提取的特征值進(jìn)行特征評(píng)價(jià),根據(jù)評(píng)價(jià)指標(biāo)對(duì)特征值進(jìn)行加權(quán)處理,削弱異常值的影響,然后采用Kriging代理模型中的回歸模型和相關(guān)模型依次組合建立數(shù)學(xué)代理判別模型,并以最小預(yù)測(cè)相對(duì)誤差平方和為判據(jù)選擇最佳代理判別模型,從而建立基于特征評(píng)價(jià)的ADMOW預(yù)測(cè)模型用來(lái)進(jìn)行模式識(shí)別。
ADMOW方法是利用數(shù)據(jù)間的對(duì)應(yīng)關(guān)系建立代理判別模型代替數(shù)據(jù)間的真實(shí)關(guān)系模型并完成分類,這種內(nèi)在關(guān)系的真實(shí)模型可以用具體模型近似替代,只要分類精度達(dá)到要求即可。ADMOW選取Kriging函數(shù)作為代理模型,Kriging函數(shù)作為一種估計(jì)方差最小的無(wú)偏估計(jì)模型,其函數(shù)是由回歸模型和相關(guān)模型組合而成?;貧w模型是預(yù)測(cè)函數(shù)模型的主體框架,而相關(guān)模型則是用來(lái)校正回歸模型在整體函數(shù)模型上產(chǎn)生的偏差,使得所建立的模型更加接近真實(shí)模型。此外,他們之間的不同組合也會(huì)對(duì)結(jié)果產(chǎn)生很大的影響,從不同的組合模型中選取最優(yōu)的組合作為最佳預(yù)測(cè)模型,從而建立一個(gè)描述特征值間內(nèi)在關(guān)系的代理預(yù)測(cè)模型。
為了削弱“異常值”對(duì)代理判別模型產(chǎn)生的影響,本文采用一種根據(jù)類相似度評(píng)價(jià)指標(biāo)進(jìn)行特征加權(quán)的方法,賦予每項(xiàng)特征值一個(gè)權(quán)值系數(shù)。該權(quán)值系數(shù)根據(jù)特征評(píng)價(jià)指標(biāo)的不同,權(quán)值大小隨之不同,評(píng)價(jià)指標(biāo)反映了特征值的顯著度,即特征值數(shù)據(jù)中異常點(diǎn)的個(gè)數(shù)及離群程度。異常點(diǎn)個(gè)數(shù)越多、離群程度越大,則該特征值的顯著度越低,反之則顯著度越高。根據(jù)顯著度的高低賦予特征值不同的權(quán)值。
第i類的類內(nèi)離差矩陣表達(dá)式為[9]
式中:Ni為第i類的樣本數(shù)目為i類中的第z個(gè)樣本;m(i)為i類的平均矢量。
類內(nèi)離差S(i)越小,表明同一類對(duì)象之間的相似度越大,異常點(diǎn)數(shù)量以及離群程度越小,這樣的特征參數(shù)顯著度就越高,所加的權(quán)值也越大。
類相似度評(píng)價(jià)指標(biāo)
將類相似度評(píng)價(jià)指標(biāo)歸一化
式中:p為特征值個(gè)數(shù)為第i類第l個(gè)特征值的評(píng)價(jià)指標(biāo)。
對(duì)于g種類別的分類問(wèn)題,各選取n1、n2、…、ng個(gè)樣本作為訓(xùn)練樣本。根據(jù)所采用的特征值對(duì)每個(gè)訓(xùn)練樣本提取特征,假設(shè)提取p個(gè)特征值,即為Y=[Y1,Y2,…,Yp]。計(jì)算各類各項(xiàng)特征的評(píng)價(jià)指標(biāo)J,然后將各類各特征對(duì)應(yīng)的評(píng)價(jià)指標(biāo)J作為權(quán)值系數(shù)w賦予該項(xiàng)特征,得到新的特征向量X=[w1?Y1,w2?Y2,…,wp?Yp]=[X1,X2,…,Xp],然 后 建立預(yù)測(cè)模型,此時(shí),各種狀態(tài)類別的樣本特征值的數(shù)量分別為n1×p、n2×p、…、ng×p。
用X=[X1,X2,…,Xp]表示一種狀態(tài)類別,由于同一類別中的不同特征值之間具有對(duì)應(yīng)關(guān)系,即Xi=f(Xj)(j≠i),并且在不同的類別中,這種對(duì)應(yīng)關(guān)系有所不同。為確定系統(tǒng)的狀態(tài)類別,以Kriging模型為基礎(chǔ),為特征值Xi建立一個(gè)線性或者非線性的代理判別模型ADMi。Kriging代理判別模型ADMi可表示成如下形式
式中:g(x)表示模型的確定性函數(shù),即Kriging函數(shù)中的回歸模型,該模型一般分為常數(shù)模型、一次回歸模型和二次回歸模型。這些模型構(gòu)成了Kriging函數(shù)的主體框架。u(x)表示模型的不確定性部分,它可以提供模型對(duì)局部模擬偏差的近似值,即Kriging函數(shù)中的相關(guān)模型。只有選擇合適的相關(guān)函數(shù),才能保證模型具有較高的識(shí)別精度。
對(duì)Kriging代理判別模型ADMi中的g(x)采用特征值Xj(j≠i)對(duì)Xi進(jìn)行預(yù)測(cè),可以得到
其中:Xi為被預(yù)測(cè)變量;Xj(j≠i)為預(yù)測(cè)變量;e為預(yù)測(cè)誤差;b0、bj、bjj、bjk為模型參數(shù),通過(guò)訓(xùn)練樣本對(duì)代理判別模型進(jìn)行訓(xùn)練得到。這個(gè)過(guò)程實(shí)際上就是用訓(xùn)練樣本對(duì)b0、bj、bjj、bjk等模型參數(shù)進(jìn)行估計(jì)的過(guò)程。
(1)對(duì)第k(1≤k≤g)類訓(xùn)練樣本選擇被預(yù)測(cè)變量Xi(i=1,2,...,p),剩下的Xj(j≠i)作為預(yù)測(cè)變量。
(2)令回歸模型的類型為t=1(1≤t≤T()用1、2、3分別標(biāo)記常數(shù)模型、一次回歸模型、二次回歸模型),相關(guān)模型類別為r=1(1≤r≤R()用1到7分別標(biāo)記 Exponential、Generalized exponential、Gaussian、Linear、Spherical、Cubic、Spline),分別用T個(gè)回歸模型和R個(gè)相關(guān)模型的不同組合對(duì)Xi建立nk=T×R個(gè)數(shù)學(xué)模型。
(3)把第k類的訓(xùn)練樣本特征值進(jìn)行函數(shù)回代,得到Xi的預(yù)測(cè)量Xip。
(4)分別計(jì)算nk個(gè)變量代理判別模型的相對(duì)預(yù)測(cè)誤差平方和為第v個(gè)訓(xùn)練樣本為Xiv的平均值。選擇最小的SSE所對(duì)應(yīng)的模型作為第k類訓(xùn)練樣本中Xi的變量代理判別模型
(5)令k=k+1,循環(huán)步驟(2)至步驟(4),直至g個(gè)類別的所有特征量分別建立變量代理判別模型這些變量代理判別模型構(gòu)成一個(gè)大小為g×p的ADM矩陣。
(6)將所有訓(xùn)練樣本作為測(cè)試樣本對(duì)ADM矩陣回代測(cè)試,把分類結(jié)果最好的ADM模型對(duì)應(yīng)的回歸以及相關(guān)模型類型選擇為最佳的變量預(yù)測(cè)模型。
提取待測(cè)試樣本的特征值,用對(duì)應(yīng)的權(quán)值w對(duì)特征值加權(quán)處理,得到新的特征向量用建立的變量代理判別模型分別對(duì)待測(cè)樣本的特征值Xi進(jìn)行預(yù)測(cè),得出預(yù)測(cè)值把相同類別的全部特征值計(jì)算出來(lái)的相對(duì)預(yù)測(cè)誤差平方和值進(jìn)行求和,得到并且把SSEk值最小作為判別函數(shù)對(duì)測(cè)試樣本分類,即在g個(gè)類別中,以SSEk最小將測(cè)試樣本識(shí)別為第k類。
對(duì)于模式識(shí)別問(wèn)題來(lái)說(shuō),特征選擇和特征提取是決定識(shí)別效果的關(guān)鍵步驟。在滾動(dòng)軸承的故障診斷中,選擇合適的特征才能對(duì)故障類別進(jìn)行準(zhǔn)確區(qū)分。為了描述系統(tǒng)的非線性特性,并降低噪聲的影響,采用局部特征尺度分解(Local Characteristic Scale Decomposition,LCD)方法,該方法可以同時(shí)在時(shí)域和頻域提供非平穩(wěn)信號(hào)的局部信息[11],將樣本信號(hào)通過(guò)LCD分解,得到若干一維單分量信號(hào),再提取前四個(gè)分量的奇異值[12]作為特征值?;谔卣髟u(píng)價(jià)的ADMOW方法的滾動(dòng)軸承故障診斷步驟如下:
(1)以一定的采樣頻率對(duì)軸承的正常狀態(tài)、內(nèi)圈故障、外圈故障以及滾動(dòng)體故障進(jìn)行數(shù)據(jù)采集,各采集N組振動(dòng)信號(hào)樣本。
(2)對(duì)采集的樣本進(jìn)行LCD分解,并提取前四個(gè)分量的奇異值作為特征值組成特征向量,得到各種狀態(tài)下的特征值矩陣。
(3)對(duì)每種狀態(tài)各選取若干訓(xùn)練樣本進(jìn)行ADMOW訓(xùn)練,建立數(shù)學(xué)預(yù)測(cè)模型。
(4)把剩余的樣本采用訓(xùn)練好的預(yù)測(cè)模型進(jìn)行分類測(cè)試,根據(jù)測(cè)試的結(jié)果確定軸承的工作狀態(tài)和故障類別。
為了檢驗(yàn)ADMOW方法的效果,本文采用美國(guó)凱斯西儲(chǔ)大學(xué)的滾動(dòng)軸承振動(dòng)數(shù)據(jù)[13]進(jìn)行驗(yàn)證,選用6205-2RS型深溝球軸承,電機(jī)的轉(zhuǎn)速為1 730 r/min,采樣頻率為48 kHz,電機(jī)負(fù)載為2.24 kW。選取正常軸承、內(nèi)圈故障、外圈故障和滾動(dòng)體故障的振動(dòng)信號(hào)各200組數(shù)據(jù)作為樣本,取前100組用于訓(xùn)練,后100組用于測(cè)試。四種狀態(tài)下的滾動(dòng)軸承振動(dòng)加速度信號(hào)如圖1所示。
首先對(duì)采集的信號(hào)樣本進(jìn)行LCD分解,并提取前四個(gè)分量的奇異值作為特征值。各樣本特征值提取完成后,將訓(xùn)練樣本通過(guò)特征評(píng)價(jià)得到各特征的類相似度評(píng)價(jià)指標(biāo),如圖2所示。
圖1 滾動(dòng)軸承各狀態(tài)的振動(dòng)信號(hào)時(shí)域波形
將各類各特征對(duì)應(yīng)的評(píng)價(jià)指標(biāo)作為權(quán)值系數(shù)對(duì)該項(xiàng)特征值進(jìn)行加權(quán)處理,得到新的特征向量。建立ADM模型,分別用未加權(quán)和加權(quán)的訓(xùn)練樣本對(duì)所建立的ADM模型進(jìn)行訓(xùn)練,得到ADM和ADMOW預(yù)測(cè)模型,表1給出了外圈故障下各特征變量通過(guò)訓(xùn)練得到的變量預(yù)測(cè)回歸模型,表中ADMOW模型的Xi為經(jīng)過(guò)特征加權(quán)處理后的值。將剩余的數(shù)據(jù)作為測(cè)試樣本分別代入ADM模型和ADMOW模型進(jìn)行分類測(cè)試,測(cè)試結(jié)果如表2所示。
圖2 ADMOW的特征類可分性評(píng)價(jià)指標(biāo)
ADM模型和ADMOW模型在測(cè)試中的分類精度如圖3和圖4所示。
圖中橫坐標(biāo)為隨機(jī)選取的各類測(cè)試樣本的序號(hào),縱坐標(biāo)為該類別的測(cè)試樣本分別在各個(gè)類別最佳變量預(yù)測(cè)模型中的相對(duì)預(yù)測(cè)誤差平方和的對(duì)數(shù)值。
由于分類器是以特征值的相對(duì)預(yù)測(cè)誤差平方和最小為分類依據(jù)進(jìn)行分類,所以在對(duì)某一類故障樣本進(jìn)行分類測(cè)試時(shí),在該類預(yù)測(cè)模型下的相對(duì)預(yù)測(cè)誤差平方和與其他類預(yù)測(cè)模型下的相對(duì)預(yù)測(cè)誤差平方和相差越大、沒(méi)有交叉,則分類精度越高,分類結(jié)果越準(zhǔn)確。
表1 外圈故障下ADM模型與基于特征評(píng)價(jià)的ADMOW模型對(duì)比
表2 ADM和基于特征評(píng)價(jià)的ADMOW模型分類結(jié)果對(duì)比
圖3 ADM在滾動(dòng)軸承各狀態(tài)下的識(shí)別精度
通過(guò)表1的對(duì)比可以看出,未加權(quán)的ADM模型對(duì)軸承的外圈故障識(shí)別能力較弱,正確識(shí)別率只有82%,總識(shí)別率為95%;而基于特征評(píng)價(jià)的ADMOW模型對(duì)各類別的識(shí)別率均達(dá)到100%。結(jié)合圖3和圖4,圖3中正常軸承和內(nèi)圈故障信號(hào)在對(duì)應(yīng)預(yù)測(cè)模型下的預(yù)測(cè)結(jié)果與其他預(yù)測(cè)模型下的預(yù)測(cè)結(jié)果無(wú)明顯交叉點(diǎn),能夠區(qū)分,但分類效果一般。外圈故障信號(hào)在外圈、內(nèi)圈和滾動(dòng)體故障預(yù)測(cè)模型中的預(yù)測(cè)結(jié)果有大量交叉重疊,難以準(zhǔn)確分類。滾動(dòng)體故障信號(hào)在外圈、內(nèi)圈和滾動(dòng)體故障預(yù)測(cè)模型中的預(yù)測(cè)結(jié)果有少量交叉,分類效果較差;圖4中除內(nèi)圈故障信號(hào)分類效果一般外,其余狀態(tài)信號(hào)均能以比較明顯的差別進(jìn)行準(zhǔn)確分類。因此基于特征評(píng)價(jià)的ADMOW方法在分類能力及分類精度上均明顯高于未加權(quán)的ADM方法。
圖4 ADMOW在滾動(dòng)軸承各狀態(tài)下的識(shí)別精度
為了檢驗(yàn)基于特征評(píng)價(jià)的ADMOW方法在各種檢驗(yàn)法下的識(shí)別精度,分別采用Re-substitution(RS)檢驗(yàn)法、Jack-knife(JK)檢驗(yàn)法和K-fold cross-Validation(K-CV)檢驗(yàn)法對(duì)加權(quán)和未加權(quán)的ADM模型進(jìn)行比較。其中RS檢驗(yàn)法是用來(lái)驗(yàn)證算法的自相容性,K-CV交叉檢驗(yàn)法用來(lái)測(cè)試算法的準(zhǔn)確性,JK檢驗(yàn)法是統(tǒng)計(jì)學(xué)中比較客觀和嚴(yán)格的交叉檢驗(yàn)法,反映了算法的外推能力。另外,再引入一種計(jì)算分類精度的Kappa系數(shù),Kappa系數(shù)值越大,表示分類精度越高,檢驗(yàn)結(jié)果如表3所示。
通過(guò)表3中兩種分類方法的對(duì)比,無(wú)論是總的識(shí)別率還是Kappa系數(shù),基于特征評(píng)價(jià)的ADMOW方法均優(yōu)于未加權(quán)的ADM方法,ADMOW方法在分類精度上有明顯的優(yōu)勢(shì)。
(1)本文將特征評(píng)價(jià)和特征加權(quán)方法融合到模式識(shí)別中,弱化了異常數(shù)據(jù)對(duì)模型的影響,建立更加真實(shí)的代理判別模型,從而達(dá)到獲得準(zhǔn)確的模式分類目的。
(2)ADMOW預(yù)測(cè)模型建立過(guò)程實(shí)質(zhì)上是參數(shù)估計(jì)的過(guò)程,根據(jù)具體的回歸模型和相關(guān)模型的不同組合,自動(dòng)選擇最優(yōu)的組合作為最佳預(yù)測(cè)模型,它不受先驗(yàn)知識(shí)和主觀因素的影響,使得分類結(jié)果更加客觀、準(zhǔn)確。
表3 三種檢驗(yàn)法的ADM和ADMOW分類性能對(duì)比
(3)對(duì)滾動(dòng)軸承4種狀態(tài)分析的結(jié)果表明,基于特征評(píng)價(jià)的ADMOW模型可以準(zhǔn)確高效地對(duì)軸承工作狀態(tài)和故障類型進(jìn)行分類,為滾動(dòng)軸承的故障診斷提供了新的方法,同時(shí)對(duì)其它的模式識(shí)別問(wèn)題也有一定的參考價(jià)值。