玄兆燕,封紅梅
(河北聯(lián)合大學(xué) 機(jī)械工程學(xué)院,河北 唐山 063000)
礦井風(fēng)機(jī)是礦下作業(yè)的重要機(jī)械之一,對(duì)正常生產(chǎn)有很重要的作用,但其振動(dòng)問題一直給人們?cè)斐珊艽罄_。同一種征兆往往與多種故障相對(duì)應(yīng),故障通常是多種原因并發(fā)形成的復(fù)合故障[1],由于故障環(huán)境大都是不確定的,各種故障征兆值具有模糊性,因此在進(jìn)行故障診斷時(shí)必須將檢測(cè)數(shù)據(jù)轉(zhuǎn)化為模糊數(shù)據(jù),即模糊化。長(zhǎng)期以來(lái)對(duì)于風(fēng)機(jī)的振動(dòng)故障診斷方法常采用基于振動(dòng)頻譜特征來(lái)實(shí)現(xiàn),但振動(dòng)的頻譜特征只是反映了風(fēng)機(jī)故障的部分信息,這就需要引入其它征兆進(jìn)行判別,因此,如何既能充分利用振動(dòng)的頻譜特征這一重要故障征兆作為故障診斷的重要證據(jù),又能綜合利用反映故障不同方面信息的不同類型的故障征兆,從而可以更準(zhǔn)確的進(jìn)行故障識(shí)別,成為本文所要解決的問題,以此獲得一個(gè)更簡(jiǎn)潔的診斷規(guī)則表,為專家診斷系統(tǒng)提供更有效的診斷規(guī)則庫(kù)。
模糊C均值聚類(FCM),是用隸屬度確定每個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度的一種聚類算法[2]。1973年,Bezdek提出了該算法,作為早期硬C均值聚類(HCM)方法的一種改進(jìn)。
若對(duì)論域(研究的范圍)U中的任一元素x,都有一個(gè)數(shù)A(u)∈0,1與之對(duì)應(yīng),則稱A為U上的模糊集,A(u)稱為u對(duì)A的隸屬度。
μA(u)的大小反映了元素u對(duì)于模糊集A的隸屬程度,μA(u)的值越接近1,表示u隸屬于A的程度越高;μA(u)的值越接近0,表示u隸屬于A的程度越低。
FCM把n個(gè)向量xi(i=1,2,…,n)分為c個(gè)模糊組,并求每組的聚類中心,使得非相似性指標(biāo)的價(jià)值函數(shù)達(dá)到最小。FCM使得每個(gè)給定數(shù)據(jù)點(diǎn)用值在0,1間的隸屬度來(lái)確定其屬于各個(gè)組的程度。不過(guò),加上歸一化規(guī)定,一個(gè)數(shù)據(jù)集的隸屬度的和總等于1:
1982年,波蘭數(shù)學(xué)家Z.Pawlak首次提出了一種處理不確定性現(xiàn)象的數(shù)學(xué)理論——粗糙集理論。粗糙集理論與其他處理不確定和不精確問題理論顯著的區(qū)別是它無(wú)需提供問題所需處理的數(shù)據(jù)集合之外的任何先驗(yàn)信息所以對(duì)問題的不確定性的描述或處理可以說(shuō)是比較客觀的,由于這個(gè)理論未能包含處理不精確或不確定原始數(shù)據(jù)的機(jī)制,所以這個(gè)理論與概率論和模糊數(shù)學(xué)等其他處理不確定或不精確問題的理論有很強(qiáng)的互補(bǔ)性[3]。
設(shè)有一所需研究的對(duì)象組成的非空有限集合即論域U。給定一個(gè)論域U和U上的一簇等價(jià)關(guān)系S,稱二元組K=(U,S)是關(guān)于論域U的知識(shí)庫(kù)或近似空間。在該等價(jià)關(guān)系S當(dāng)中,若P∈S,且P≠?,則U∩P仍然是論域U上的一個(gè)等價(jià)關(guān)系,稱為P上的不可分辨關(guān)系,記做IND(P)。其中,U/IND(P)為知識(shí)庫(kù)K中關(guān)于U的基本知識(shí)。
若S=(U,R)為一知識(shí)表達(dá)系統(tǒng),若R可劃分為條件屬性集C和決策屬性集D,即C∪D=R,C∩D=?,則稱為CD決策表,其中IND(C)的等價(jià)類稱為條件類,IND(D)的等價(jià)類稱為決策類。
首先引入熵的概念:設(shè)知識(shí)(屬性集合)P是論域上的等價(jià)關(guān)系簇,根據(jù)不可分辨關(guān)系Xi∈U/IND(P)可以得到k類對(duì)象的組成,即{X1,X2,…Xk},根據(jù)概率公式可得到k類對(duì)象的概率則P的熵定義為:
其中:log取以n為底的對(duì)數(shù),H(P)表示了信息源P的信息量。
在熵的概念上引入屬性熵的定義。在概率論當(dāng)中聯(lián)合概率密度為,根據(jù)聯(lián)合概率密度公式,則此處知識(shí)(屬性集合)Q相對(duì)于知識(shí)(屬性集合)P的條件熵H(Q|P)定義為[4]:
其中:U/IND(P)={X1,X2,…,Xn}
U/IND(P)={Y1,Y2,…,Ym}
條件熵H(Q|P)是對(duì)所有P分類下不確定的等價(jià)類進(jìn)行再劃分的熵,它體現(xiàn)了用P對(duì)論域劃分所形成的結(jié)果的不確定性。
步驟1:根據(jù)粗糙集的不可分辨關(guān)系將知識(shí)庫(kù)進(jìn)行k類劃分。
步驟2:去除劃分結(jié)果當(dāng)中的等價(jià)屬性,所謂等價(jià)屬性是指劃分結(jié)果相同的屬性。
步驟3:根據(jù)條件熵方法求得屬性的重要度,在數(shù)據(jù)龐大的情況下還需找出核心屬性,以便去除冗余屬性。
步驟4:根據(jù)核心屬性的重要度最大值對(duì)知識(shí)庫(kù)決策表進(jìn)行化簡(jiǎn)。
步驟5:以此類推,繼續(xù)根據(jù)次最大值進(jìn)行化簡(jiǎn),直到得出最終結(jié)論。
步驟6:根據(jù)最小約簡(jiǎn)表再進(jìn)一步消除該表當(dāng)中的冗余屬性得到最小規(guī)則表。
在故障診斷過(guò)程中,使用聚類分析法可以根據(jù)相似故障之間的某些共同之處對(duì)故障類型進(jìn)行分類。常見的礦井風(fēng)機(jī)故障常是基于故障發(fā)生的位置和零件的不同位置來(lái)進(jìn)行分類的,本文根據(jù)故障征兆當(dāng)中的特征頻率對(duì)故障進(jìn)行分類,然后根據(jù)其它的故障征兆進(jìn)行進(jìn)一步分析,從而降低故障源的數(shù)量。對(duì)故障基于特征頻率進(jìn)行模糊C均值聚類分析的劃分故障樹如圖1所示。
圖1 風(fēng)機(jī)故障分類
最大隸屬原則:設(shè)給定的論域U為全體被識(shí)別對(duì)象構(gòu)成的論域,A1,A2,…An是U的n個(gè)模糊子集,u∈U是一個(gè)識(shí)別對(duì)象,若μAt(u)=max{μA1(u),μA2(u),…μAn(u)},則認(rèn)為u優(yōu)先隸屬于At,即u優(yōu)先屬于模式At所代表的那一類[5]。對(duì)于振動(dòng)故障頻譜特征采用最大隸屬原則進(jìn)行提取,這是因?yàn)轭l譜特征參數(shù)之間存在著很強(qiáng)的相關(guān)性,使用該方法可以剔除變量之間的相關(guān)性以及冗余性,降低數(shù)據(jù)源的分析個(gè)數(shù),然后再對(duì)縮小的數(shù)據(jù)進(jìn)行決策表分析,這樣不但可以剔除干擾信息影響,而且可以降低聚類分析時(shí)輸入變量的維數(shù),簡(jiǎn)少?zèng)Q策表分析的計(jì)算量,根據(jù)圖1當(dāng)中故障樹的分類以及各個(gè)故障特征頻率的定位,將通頻段分為了七個(gè)部分,表1為某次實(shí)現(xiàn)的基頻故障現(xiàn)象表。
根據(jù)表1可得,風(fēng)機(jī)的某工作狀態(tài)下各個(gè)段的頻率的幅值的隸屬度,其中:基頻的隸屬度為:
表1 故障特征頻率幅值
128/(128+32)=0.8
2倍頻的隸屬度為:
32/(128+32)=0.2
其它幅值的隸屬度都為0,由最大隸屬原則可知,該風(fēng)機(jī)的故障類型應(yīng)屬于基頻故障。特征頻率為基頻的礦井風(fēng)機(jī)故障可能有轉(zhuǎn)子不平衡(3類)、轉(zhuǎn)子彎曲(2類)以及支撐系松動(dòng)這三種情況,根據(jù)這三種 情況可得到如圖2所示的基頻故障樹[6]。
圖2 基頻故障
在該系統(tǒng)當(dāng)中,主要采用的風(fēng)機(jī)故障征兆有特征頻率、常伴頻率、時(shí)域波形、振動(dòng)穩(wěn)定性、振動(dòng)方向、相位特征和軸心軌跡七個(gè)參數(shù),由故障常規(guī)分析子系統(tǒng)中的頻譜分析可知,特征頻率和常伴頻率總是同時(shí)知道的,也就是說(shuō)當(dāng)進(jìn)行頻譜分析時(shí),知道了特征頻率,那么常伴頻率也隨之知道了,因此在此同時(shí)去掉常伴頻率。各特征頻率為基頻的故障和故障征兆之間的關(guān)系如表2所示,其中前五列為條件屬性,最后一列為決策屬性。
將表2的內(nèi)容進(jìn)行數(shù)據(jù)的模糊離散化有助于對(duì)數(shù)據(jù)進(jìn)行詳細(xì)的分析,表3為離散化后的數(shù)據(jù)表。
表2 故障征兆表
表3 離散數(shù)據(jù)表
將表3進(jìn)行條件熵計(jì)算,首先根據(jù)不可分辨關(guān)系,按照條件屬性和決策屬性對(duì)6類對(duì)象進(jìn)行分類:
在上述計(jì)算當(dāng)中可以看到U/IND(a)=U/IND(e),也就是說(shuō)a屬性和e屬性為重復(fù)等價(jià)屬性,在此略去e屬性即可,接著根據(jù)式(3)計(jì)算屬性熵:
由以上數(shù)據(jù)可知屬性重要度a>b>d>c,再根據(jù)粗糙集的屬性約簡(jiǎn)規(guī)則對(duì)故障征兆表進(jìn)行約簡(jiǎn),最終約簡(jiǎn)規(guī)則效果見表4所示。
表4 最小規(guī)則表
根據(jù)表4可將所得的規(guī)則集描述為(部分):if時(shí)域波形為疊加波形then支撐系松動(dòng)故障;if時(shí)域波形為正弦波and振動(dòng)方向?yàn)閺较騛nd相位特征突變后穩(wěn)定then突發(fā)不平衡故障。
本文以基頻特征的故障現(xiàn)象為例,最終獲得了如表4所示的最小規(guī)則表,從表4中可以看到約簡(jiǎn)了的故障征兆表可以為專家系統(tǒng)提供更加有效的診斷規(guī)則庫(kù)。
聚類分析是數(shù)據(jù)挖掘和模式識(shí)別中一種重要的分析方法,屬性約簡(jiǎn)作為粗糙集理論的核心部分 是數(shù)據(jù)處理過(guò)程中的一個(gè)關(guān)鍵環(huán)節(jié)。本文提出了一種基于聚類分析法和條件熵分析法相結(jié)合的方式對(duì)多故障征兆進(jìn)行分類并進(jìn)行屬性的約簡(jiǎn),利用FCM算法構(gòu)建故障樹來(lái)縮減搜索范圍,利用條件熵的屬性約簡(jiǎn)形成故障診斷的規(guī)則庫(kù)并實(shí)現(xiàn)推理。該方法既充分利用了振動(dòng)的頻譜特征這一重要故障征兆作為故障診斷的初步判斷依據(jù),又綜合利用了反映故障不同方面信息的不同類型的故障征兆,從而做到更好的實(shí)現(xiàn)對(duì)大量數(shù)據(jù)的分類約簡(jiǎn),縮小故障源的種類,進(jìn)而能夠更加準(zhǔn)確地進(jìn)行故障識(shí)別。
[1] 胡友林.基于粗糙集的風(fēng)機(jī)故障診斷專家系統(tǒng)研究[D].武漢:武漢科技大學(xué),2006.
[2] 徐 天,鄧廷權(quán).基于FCM的相似關(guān)系粗糙集屬性約簡(jiǎn)方法[J].計(jì)算機(jī)工程與應(yīng)用,2012(32):132-135
[3] 李 菊.基于屬性重要性的啟發(fā)式屬性約簡(jiǎn)算法[J].煤炭技術(shù),2012,31(3):201-203.
[4] 馮晶晶,等.一種基于條件熵的決策表屬性約簡(jiǎn)算法[J].計(jì)算機(jī)應(yīng)用與軟件,2011(9):109-113.
[5] 孫 芳.基于模式識(shí)別的機(jī)械設(shè)備故障智能診斷方法研究[D].保定:華北電力大學(xué),2007.
[6] 郭富源.故障樹理論在遠(yuǎn)程診斷系統(tǒng)中的應(yīng)用研究[D].大連:大連理工大學(xué),2007.