石新發(fā) 邢廣笑 賀石中 謝小鵬
(1.廣州機械科學(xué)研究院有限公司 廣東廣州 510530;2.中國人民解放軍92001部隊 山東青島 266000;3.華南理工大學(xué)機械與汽車工程學(xué)院 廣東廣州 510640)
船舶柴油機集成化、自動化程度以及功率密度不斷提升,其運行可靠性、安全保障難度加大[1]。磨損是柴油機主要故障源之一,對其進行監(jiān)測診斷,能夠保證柴油機正常運行,延長其使用壽命[2]。油液監(jiān)測作為船舶柴油機等往復(fù)式機械潤滑磨損故障診斷的主要技術(shù)之一[3],隨著船舶柴油機運行可靠性要求的增高,磨損監(jiān)測與診斷需求增大,且特征屬性數(shù)量的增加,使得油液監(jiān)測多技術(shù)手段所獲取的信息特征無論從量級、單位、粒度等均有很大的不同[4],因而在診斷過程中易受到無用或冗余數(shù)據(jù)的干擾,造成診斷決策過程的復(fù)雜程度增高[5]。特征約簡是將大量無關(guān)和冗余的特征屬性去除的有效方法[6-7],當(dāng)前在對油液監(jiān)測數(shù)據(jù)屬性約簡中,大都使用的是有監(jiān)督方法,例如石新發(fā)和劉東風(fēng)[8]應(yīng)用的粗糙集理論,徐啟圣等[9]應(yīng)用的支持向量機,存在依賴專家經(jīng)驗的問題。同時,實現(xiàn)潤滑磨損故障診斷智能化也是油液監(jiān)測發(fā)展的重要趨勢[12],BP神經(jīng)網(wǎng)絡(luò)作為相對成熟的模式識別與分類算法,具有結(jié)構(gòu)設(shè)計簡單、識別速度快的特點。
本文作者基于熵理論和BP神經(jīng)網(wǎng)絡(luò)組合,構(gòu)建了一種能夠?qū)崿F(xiàn)診斷屬性無監(jiān)督約簡和磨損故障模式智能識別的融合算法模型,并以某型船舶柴油機44個磨損監(jiān)測數(shù)據(jù)樣本為應(yīng)用對象,對模型進行了應(yīng)用驗證,結(jié)果表明該模型在保證數(shù)據(jù)集分類特性的基礎(chǔ)上,有效降低了冗余數(shù)據(jù)的干擾,提升了故障診斷的準確性。
在對一個系統(tǒng)狀態(tài)數(shù)據(jù)進行分析時,一般需要對數(shù)據(jù)進行預(yù)處理,保留有用或者信息量較大的特征。文中應(yīng)用信息熵方法對該型柴油機磨損診斷數(shù)據(jù)進行一次約簡篩選。
(1)
則系統(tǒng)總信息熵值為
(2)
為了更好地實現(xiàn)系統(tǒng)狀態(tài)數(shù)據(jù)特征的優(yōu)化選擇,同時保留系統(tǒng)樣本間的分類特性,引入熵度量理論,對能夠表征系統(tǒng)分類特性的數(shù)據(jù)集優(yōu)化,實現(xiàn)數(shù)據(jù)的二次約簡降維。熵度量法是一種基于特征重要度的特征約簡,以樣本間的距離作為熵計算的基本要素,以此實現(xiàn)特征選擇[12-13]。
熵度量算法基于一個相似性度量,該度量與樣本之間的距離成反比[14],具體表示為
Sgh=e-aDgh
(3)
其中:g,h=1,2,…,N。
式(3)中Sgh表示樣本Yg和Yh之間的相似度;Dgh為樣本Yg和Yh之間的距離,一般用標準化的歐氏距離計算,其計算式為
(4)
式中:k=1,2,…,n,n為樣本維數(shù),maxYk和minYk分別表示樣本集第k個屬性的標準化數(shù)據(jù)最大值和最小值。
式(3)中a是一個參數(shù),其計算式為
a=-(ln0.5)/D
(5)
對于包含N個數(shù)據(jù)樣本的數(shù)據(jù)特征集,其熵按照式(6)計算。
(6)
當(dāng)系統(tǒng)移除屬性元素ci后引起已知數(shù)據(jù)集的信息熵的變化為
ΔE(ci)=|Eci-E(ci-{ci})|
(7)
ΔE(ci)是屬性ci重要度的一個量化值,其值越大,說明屬性ci對原始數(shù)據(jù)集越重要。
(8)
約簡集合C′中最優(yōu)約簡子集C″定義為
(9)
磨損診斷屬性集合經(jīng)過2次約簡后,所產(chǎn)生的新子集能夠有效保留系統(tǒng)信息量和分類特性,降低后續(xù)診斷識別過程中的工作量和復(fù)雜程度。
依據(jù)構(gòu)建的潤滑磨損特征選擇方法,設(shè)計特征子集優(yōu)選流程如圖1所示。按照設(shè)計的流程,柴油機磨損故障診斷原始屬性集經(jīng)過2次特征屬性約簡,并按照自己選取條件優(yōu)選新的特征集合。
圖1 磨損故障診斷特征子集優(yōu)選流程
在第一次約簡中,參照主成分特征提取的特征約簡規(guī)則,以新特征集中屬性的信息熵值和大于或等于原始特征集信息熵值的80%為選擇規(guī)則,對屬性集進行第一次選擇。
選擇用于某型船舶柴油機磨損故障診斷研究的44個油樣的磨損監(jiān)測數(shù)據(jù),其數(shù)據(jù)集可表示為
C={cs1,cs2,…,csp,…,cz1,cz2,…,czt}
其中:數(shù)據(jù)集包含發(fā)射光譜的Fe、Cr、Pb、Cu、Al、Si、Na、Mg、Ca、P、Zn等11種元素指標(屬性),DL(大鐵磁性顆粒)、DS(小鐵磁性顆粒)、DL+DS、DL-DS、Is等5個直讀鐵譜指標(屬性)。按照式(1)計算每個監(jiān)測指標的信息熵,具體見圖2。
圖2 某型船舶柴油機磨損故障診斷指標信息熵值
按照各磨損指標信息熵值從大到小累加,當(dāng)累加至某個指標時,累加的信息熵值大于等與原監(jiān)測數(shù)據(jù)集信息熵的80%時,選擇用于累加的指標作為新的數(shù)據(jù)指標(屬性)集,從原始數(shù)據(jù)集中選擇10個指標構(gòu)成新的數(shù)據(jù)集,具體如下:
C1={Fe,Cr,Cu,Al,Na,Mg,DL,DL+
DS,DL-DS,Is}
按照式(5)—式(8)對經(jīng)過一次約簡的新子集C1進行二次約簡,計算篩選過程中的各磨損診斷指標的熵重要度EI結(jié)果見表1。表中約簡第一、二、三維表示將C1依次減少一維的計算過程,表中的EI是約簡過程中計算的各熵重要度。按照式(9)選擇每減少一維的最優(yōu)子集,進入下一步約簡優(yōu)化。
表1 特征約簡過程中各指標的熵重要度
按照專家提供的約簡規(guī)則,對C1約簡3維后獲得的新子集為
C″={Fe,Cu,Al,Na,Mg,DL-DS,Is}
新的子集各指標數(shù)據(jù)見圖3、圖4,分別為原子發(fā)射光譜數(shù)據(jù)和直讀鐵譜數(shù)據(jù)。
圖3 油樣原子發(fā)射光譜數(shù)據(jù)
圖4 油樣直讀鐵譜數(shù)據(jù)
BP神經(jīng)網(wǎng)絡(luò)是多層前向傳播的網(wǎng)絡(luò),由輸入層、隱含層(可能有多層)、輸出層構(gòu)成,3層神經(jīng)網(wǎng)絡(luò)可以很好地解決一般的模式識別問題[15]。由于該網(wǎng)絡(luò)被大量應(yīng)用,文中不再對網(wǎng)絡(luò)的基本結(jié)構(gòu)、算法過程等贅述。經(jīng)過2次約簡,獲取的該型柴油機磨損診斷指標(屬性)集為7維。按照網(wǎng)絡(luò)構(gòu)建的規(guī)則,一般隱含層神經(jīng)元的個數(shù)為2,因此,將神經(jīng)網(wǎng)絡(luò)的層數(shù)設(shè)計為3層,網(wǎng)絡(luò)輸入層神經(jīng)元數(shù)為7個,輸出層神經(jīng)元數(shù)為6個,則隱含層神經(jīng)元個數(shù)為15個,網(wǎng)絡(luò)輸入向量范圍為[0,1],隱含層傳遞函數(shù)選擇tansig,輸出層傳遞函數(shù)選擇logsig,訓(xùn)練函數(shù)選擇trainlm,最大訓(xùn)練次數(shù)為100,網(wǎng)絡(luò)誤差0.001,網(wǎng)絡(luò)結(jié)構(gòu)見圖5。
圖5 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
文中研究的柴油機在使用中故障模式主要有以下幾種類型:①主軸承異常磨損S2;②活塞異常磨損S3;③潤滑油進海水S4;④鐵質(zhì)摩擦副異常磨損S5;⑤綜合磨損狀態(tài)較差S6等5種。
通過希爾變量(0或者1)來實現(xiàn)故障模式征兆的表達,加上正常狀態(tài),故障模式向量由6個元素組成,即為V={S1,S2,S3,S4,S5,S6},如果某種故障模式存在,則向量對應(yīng)的元素為1,其余為0。由此以上故障模式可以表達為
正常狀態(tài):S1={1,0,0,0,0,0};
主軸承異常磨損:S2={0,1,0,0,0,0};
活塞異常磨損:S3={0,0,1,0,0,0};
潤滑油進海水:S4={0,0,0,1,0,0};
鐵磁性顆粒較多:S5={0,0,0,0,1,0};
綜合磨損狀態(tài)較差:S6={0,0,0,0,0,1};
對于多種故障現(xiàn)象的存在,則需要將故障模式表征向量對應(yīng)的元素同時為1,例如同時存在活塞異常磨損征兆和潤滑油進海水故障時,表示為
S多={0,0,1,1,0,0}
該型柴油機磨損診斷數(shù)據(jù)集,經(jīng)過特征選擇與優(yōu)化后得到的特征子集為
C″={Fe,Cu,Al,Na,Mg,DL-Ds,Is}
將該型柴油機的44個油樣的磨損監(jiān)測數(shù)據(jù)通過故障診斷專家分類,進行故障類別標識。將標識后的樣本選取30個作為訓(xùn)練樣本,14個作為測試樣本,應(yīng)用選擇的子集和設(shè)計的BP神經(jīng)網(wǎng)絡(luò)驗證文中構(gòu)建的識別模型的有效性。被識別的14個磨損故障測試樣本的神經(jīng)網(wǎng)絡(luò)類編碼見表2。
表2 測試樣本識別的神經(jīng)網(wǎng)絡(luò)編碼
將測試樣本的神經(jīng)網(wǎng)絡(luò)編碼與該型柴油機故障模式表達的希爾變量對應(yīng),雖然部分油樣識別編碼的希爾變量表征存在不足1,在數(shù)值上為0.8、0.75,但也可基本認定為屬于對應(yīng)的故障模式。
為驗證特征約簡對潤滑磨損故障識別效能的提升,應(yīng)用所構(gòu)建的BP神經(jīng)網(wǎng)絡(luò)直接對以上44個樣本的原始數(shù)據(jù)集進行訓(xùn)練與測試,結(jié)果見表3。
表3 未進行特征約簡的測試樣本識別的神經(jīng)網(wǎng)絡(luò)編碼
表3給出了未進行特征選擇的14個磨損故障測試樣本的神經(jīng)網(wǎng)絡(luò)識別編碼。與表2相比,測試樣本識別結(jié)果的準確性和識別編碼的規(guī)則性均較差。例如:9號樣本,表2中的識別結(jié)果為主軸承異常磨損,而表3中的識別結(jié)果在3個故障模式的編碼均為0.9以上,造成了識別混亂,實際反饋9號樣本對應(yīng)的設(shè)備確實發(fā)生了主軸承異常磨損。
從與專家給出的故障分類對比整體上看,表2中的測試樣本油樣神經(jīng)網(wǎng)絡(luò)編碼對應(yīng)的故障模式與故障診斷專家的分類標識基本一致,說明了所構(gòu)建的特征屬性約簡和BP神經(jīng)網(wǎng)絡(luò)組合模型的有效性。
(1)應(yīng)用熵理論,構(gòu)建了某型船舶柴油機磨損故障診斷特征無監(jiān)督約簡算法,該算法經(jīng)過基于信息熵值的特征集一次約簡和基于度量熵的特征子集二次約簡,在保證數(shù)據(jù)集分類特性的基礎(chǔ)上,有效降低磨損故障識別的特征指標維度。
(2)在特征約簡的基礎(chǔ)上,應(yīng)用設(shè)計BP神經(jīng)網(wǎng)絡(luò)和磨損故障模式識別規(guī)則對某型船舶柴油機44個油樣磨損監(jiān)測數(shù)據(jù)進行磨損故障識別分析,以其中的30個油樣數(shù)據(jù)為訓(xùn)練樣本,以剩余14個為測試樣本,識別結(jié)果與專家的分類基本一致。
(3)經(jīng)過對實施特征約簡前后的識別結(jié)果對比驗證,所構(gòu)建的柴油機磨損故障識別模型,實現(xiàn)了從特征集選擇到故障模式識別的融合應(yīng)用,有效降低了模型構(gòu)建的復(fù)雜程度和無用數(shù)據(jù)的干擾,提升了故障識別的準確性。