趙俊超, 汪佳彪, 艾麥提布拉丁, 王起碩, 毛冬麟
(上海船舶設(shè)備研究所, 上海 200030)
當(dāng)前,隨著科技的不斷進(jìn)步,機(jī)械設(shè)備正朝著精密化、自動化和智能化方向發(fā)展,這些先進(jìn)設(shè)備在提高生產(chǎn)效率、提升產(chǎn)品質(zhì)量和節(jié)約生產(chǎn)成本的同時,也帶來了高昂的維護(hù)和保障成本[1]。傳統(tǒng)的船用柴油發(fā)電機(jī)組診斷基本上為故障診斷,即根據(jù)機(jī)組出現(xiàn)異常時的參數(shù)和狀態(tài),或在機(jī)組發(fā)生故障之后對其進(jìn)行拆檢,判斷引發(fā)故障的原因并進(jìn)行處理,這種方式效率低、成本高,無法提前判斷機(jī)組的運(yùn)行狀態(tài)并預(yù)防故障發(fā)生。若機(jī)組在運(yùn)行過程中發(fā)生故障,輕則導(dǎo)致機(jī)組停機(jī),重則影響船舶的正常運(yùn)行。
本文以船用柴油發(fā)電機(jī)組為研究對象,采集功率、轉(zhuǎn)速和滑油溫度等大量機(jī)組運(yùn)行參數(shù),采用統(tǒng)計學(xué)方法分析數(shù)據(jù)特征,采用專家經(jīng)驗(yàn)法分析故障類型及相應(yīng)特征,通過機(jī)器學(xué)習(xí)進(jìn)行相應(yīng)訓(xùn)練,得到一套機(jī)組故障識別算法。在此基礎(chǔ)上,搭建一套機(jī)組健康診斷系統(tǒng),對機(jī)組的運(yùn)行狀態(tài)進(jìn)行監(jiān)測、分類和識別,實(shí)現(xiàn)對機(jī)組的健康狀態(tài)診斷、故障預(yù)測和故障報警。
統(tǒng)計學(xué)的基本原理是基于概率論思維建立一種數(shù)學(xué)模型,通過收集與所觀察系統(tǒng)有關(guān)的數(shù)據(jù),對其進(jìn)行數(shù)理分析和歸納總結(jié),找出主要規(guī)律和特征,為制訂相關(guān)決策提供科學(xué)依據(jù)。隨著科技的飛速發(fā)展,當(dāng)前統(tǒng)計學(xué)不斷吸收和融合新理論,已在很多領(lǐng)域得到應(yīng)用[2]。
本文以實(shí)驗(yàn)室現(xiàn)有的某型船用柴油發(fā)電機(jī)組為試驗(yàn)對象,采集機(jī)組的功率、轉(zhuǎn)速、排氣溫度、滑油溫度、滑油壓力、冷卻水溫度、冷卻水壓力、海水溫度和罩內(nèi)空氣溫度等參數(shù)。數(shù)據(jù)采集頻率為1 Hz,1個工作周期為8 h。對采集到的參數(shù)進(jìn)行歸一化處理,并繪制成曲線圖,結(jié)果見圖1。從圖1中可看出機(jī)組運(yùn)行時其基本參數(shù)的變化趨勢。
圖1 機(jī)組運(yùn)行參數(shù)統(tǒng)計
由圖1可初步分析出機(jī)組參數(shù)具有以下表象特征:
1) 轉(zhuǎn)速隨功率的升高而下降;
2) 排氣溫度、罩內(nèi)空氣溫度和冷卻水溫度分別與功率成正相關(guān)關(guān)系;
3) 滑油溫度的升高相較冷卻水溫度的升高有所延遲;
4) 海水泵壓力幾乎沒有變化,與功率和轉(zhuǎn)速無關(guān);
5) 柴油機(jī)滑油壓力與轉(zhuǎn)速成正相關(guān)關(guān)系,轉(zhuǎn)速越高,壓力越大;
6) 海水泵后溫度幾乎不變;
7) 冷卻水壓力與轉(zhuǎn)速成正相關(guān)關(guān)系;
8) 部分缸排溫偶爾出現(xiàn)異常波動。
以上表象特征可關(guān)聯(lián)柴油發(fā)電機(jī)組的運(yùn)行原理和內(nèi)部特性,如:1)為機(jī)組的下垂特性;2)和3)是熱擴(kuò)散導(dǎo)致的;4)的原因?yàn)楹K糜赏獠抗╇姡皇軝C(jī)組運(yùn)行的影響;5)和6)的原因?yàn)榛捅煤偷镁鶠闄C(jī)帶泵,受機(jī)組轉(zhuǎn)速的影響;7)的原因?yàn)樵囼?yàn)用海水為外部水源,其泵后溫度僅受外部環(huán)境溫度的影響;8)為傳感器故障導(dǎo)致的數(shù)據(jù)采集波動。
因此,可簡單地將以上關(guān)聯(lián)變量擬合為一個具體的公式。例如,可采用最小二乘法將排溫均值與功率擬合為圖2所示的曲線。
圖2 柴油發(fā)電機(jī)組排溫均值與功率擬合曲線
擬合曲線的函數(shù)表達(dá)式為
y=8.12×10-9x3-6.45×10-5x2+0.22x+b
(1)
式(1)中:b為不同氣缸的修正值。因此,可根據(jù)該曲線和機(jī)組當(dāng)前運(yùn)行功率計算出排溫理論值,通過設(shè)置合適的b值限定排溫上下限,將實(shí)際測量的排溫與計算出的排溫范圍相比較,判斷機(jī)組氣缸運(yùn)行是否異常。
類似地,可采用相同的方法對機(jī)組其他參數(shù)進(jìn)行判斷。
在對機(jī)組運(yùn)行參數(shù)進(jìn)行分析的基礎(chǔ)上,進(jìn)行機(jī)組健康評分計算。機(jī)組結(jié)構(gòu)復(fù)雜,健康構(gòu)成參數(shù)眾多,不同傳感器提供的信息都存在局限性和不確定性,單獨(dú)根據(jù)某臺傳感器檢測的參數(shù)判斷設(shè)備的健康狀態(tài)會出現(xiàn)較大的誤差。因此,需對不同傳感器的數(shù)據(jù)進(jìn)行整理、分析和判斷,根據(jù)某種優(yōu)化準(zhǔn)則將互補(bǔ)、冗余的信息組合起來,產(chǎn)生對觀測對象的一致性解釋和描述,由此提高信息的可信度和系統(tǒng)的容錯能力[3]。
本文采用層次分析法進(jìn)行機(jī)組健康評分計算,統(tǒng)一量化各項指標(biāo),根據(jù)不同指標(biāo)對決策目標(biāo)的影響程度和實(shí)際情況分配權(quán)重[4],在綜合分析各參數(shù)在保證機(jī)組正常運(yùn)行方面的重要性之后,合理選擇最能反映機(jī)組運(yùn)行狀態(tài)的指標(biāo)。本文選用的柴油發(fā)電機(jī)組運(yùn)行狀態(tài)評估指標(biāo)見圖3。
圖3 柴油發(fā)電機(jī)組性能綜合評估指標(biāo)體系
機(jī)組健康評分的計算式為
P=u1+u2+u3
(2)
u1=u11+…+u17
(3)
u14=u14A1+…+u14An+u14B1+…+u14Bn
(4)
式(2)~式(4)中:P為機(jī)組實(shí)際健康評分;u1為柴油機(jī)評分;u2為發(fā)電機(jī)評分;u3為電品質(zhì)評分;u11為轉(zhuǎn)速評分;u17為滑油壓力評分;u14為排溫評分;u14An為An排溫評分;u14Bn為Bn排溫評分。
同時,引入?yún)?shù)劣化度g(劣化度即機(jī)組某參數(shù)實(shí)際狀態(tài)與故障狀態(tài)相比的劣化程度),其取值范圍為[0, 1]。當(dāng)參數(shù)在正常范圍內(nèi)時,劣化度為0,此時的健康值為100;當(dāng)參數(shù)的取值逐漸接近并超過報警限值時,劣化度由0逐漸變?yōu)?,此時的健康值變?yōu)?或60(具體數(shù)值根據(jù)參數(shù)的重要程度確定,例如:當(dāng)停機(jī)類故障劣化度為1時,健康值為0;當(dāng)不影響機(jī)組短時間正常運(yùn)行的故障劣化度為1時,健康值為60)。若某個因素是由若干個子因素構(gòu)成的,為提高系統(tǒng)的安全性,該因素的劣化度取其子因素的劣化度的最大值。
機(jī)組設(shè)備結(jié)構(gòu)復(fù)雜,參數(shù)繁多,其綜合評價由多個參數(shù)共同決定,若單純對多個參數(shù)的健康值求平均值,將其作為系統(tǒng)的健康值,則當(dāng)某個參數(shù)發(fā)生劣化時,系統(tǒng)評分可能會被其他健康評分平均掉,從而無法顯示系統(tǒng)真實(shí)的健康狀態(tài)。因此,機(jī)組健康評分應(yīng)采用某種合適的權(quán)重分配。
本文采用隨劣化度變化的動態(tài)權(quán)重分配法對機(jī)組健康評分進(jìn)行權(quán)重分配:當(dāng)某一運(yùn)行參數(shù)在正常范圍內(nèi)時(此時劣化度為0),其權(quán)重為初始權(quán)重;當(dāng)參數(shù)的運(yùn)行狀態(tài)發(fā)生變化時,其權(quán)重開始增加;當(dāng)參數(shù)的取值超出報警限值時,其權(quán)重變?yōu)?。如此便可將故障直觀地顯示在機(jī)組的綜合評估結(jié)果中。同時,權(quán)重值不呈線性變化,其在參數(shù)開始劣化時緩慢變化,當(dāng)劣化度較大(如大于0.6)時,權(quán)重增長速度變快,迅速變?yōu)?,將故障參數(shù)的變化迅速體現(xiàn)在整體系統(tǒng)中[5]。
機(jī)組健康評估原理見圖4,將機(jī)組參數(shù)作為輸入變量,可實(shí)時得到機(jī)組在當(dāng)前狀態(tài)下運(yùn)行的健康指數(shù)。圖5為某時段機(jī)組健康狀態(tài)評分變化曲線與同時段采集到的機(jī)組部分設(shè)備參數(shù)變化曲線對比。
圖4 機(jī)組健康評估原理
圖5 某時段機(jī)組健康狀態(tài)評分變化曲線與同時段采集到的機(jī)組部分設(shè)備參數(shù)變化曲線對比
在得到健康評分之后,預(yù)測機(jī)組健康評分下降的原因,即在機(jī)組出現(xiàn)異常時,能通過異常參數(shù)判斷出機(jī)組發(fā)生故障的原因,從而實(shí)現(xiàn)健康診斷。故障判斷方法有很多,其中專家系統(tǒng)是近幾年設(shè)備故障診斷領(lǐng)域廣泛采用的方法之一,內(nèi)容包括診斷知識的表達(dá)、診斷推理方法、不確定性推理和診斷知識的獲取等。隨著計算機(jī)科學(xué)和人工智能的不斷發(fā)展,基于專家系統(tǒng)的故障診斷方法克服了基于模型的故障診斷方法對模型的過度依賴,是開展故障檢測的有效方法,已在很多領(lǐng)域得到應(yīng)用[5]。
基于專家系統(tǒng)的故障診斷方法的原理為:當(dāng)系統(tǒng)發(fā)生故障時,相關(guān)領(lǐng)域的專家可根據(jù)故障發(fā)生前后系統(tǒng)的運(yùn)行參數(shù)和設(shè)備狀態(tài),根據(jù)對系統(tǒng)結(jié)構(gòu)及相關(guān)歷史故障的深刻了解迅速作出判斷,確定故障發(fā)生的原因和部位。對于復(fù)雜系統(tǒng)的故障診斷而言,這種方法尤其有效。
在前期對機(jī)組的運(yùn)行參數(shù)進(jìn)行整理之后發(fā)現(xiàn)其中存在很多異常數(shù)據(jù),對這些異常數(shù)據(jù)進(jìn)行提取和歸納,根據(jù)專家經(jīng)驗(yàn)和歷史故障,將這些異常數(shù)據(jù)分為幾種類型,分別對應(yīng)不同故障,其中特征明顯的4種故障及其數(shù)據(jù)特征如下。
1) 故障A:當(dāng)機(jī)組功率發(fā)生變化時,某一參數(shù)劇烈抖動,持續(xù)一段時間之后恢復(fù)正常。
2) 故障B:在機(jī)組平穩(wěn)運(yùn)行過程中,某一參數(shù)突然增大(或變小),持續(xù)一段時間之后恢復(fù)正常。
3) 故障C:在機(jī)組平穩(wěn)運(yùn)行過程中,某一參數(shù)持續(xù)出現(xiàn)瞬間突變(尖峰)的情況。
4) 故障D:在機(jī)組平穩(wěn)運(yùn)行過程中,某一參數(shù)出現(xiàn)次數(shù)極少的偶發(fā)突變(尖峰)的情況。
上述4種典型故障的機(jī)組故障類型特征曲線見圖6。
圖6 4種典型故障的機(jī)組故障類型特征曲線
在對故障進(jìn)行分類之后,需研究一種故障識別算法,使系統(tǒng)能在參數(shù)發(fā)生變化時準(zhǔn)確識別出對應(yīng)故障并做出相應(yīng)提示。已有研究證明,機(jī)器學(xué)習(xí)算法在解決分類問題方面的效果優(yōu)于傳統(tǒng)算法,尤其是在解決非線性分類問題方面[6]。因此,本文采用機(jī)器學(xué)習(xí)算法對數(shù)據(jù)進(jìn)行訓(xùn)練,得到一套機(jī)組故障識別算法,根據(jù)前期采集的參數(shù)對機(jī)組性能的描述情況,對不同數(shù)據(jù)進(jìn)行規(guī)約,形成500組模型訓(xùn)練數(shù)據(jù)集和模型測試數(shù)據(jù)集(訓(xùn)練數(shù)據(jù)集中的數(shù)據(jù)占總數(shù)據(jù)的70%)。采用不同的機(jī)器學(xué)習(xí)算法對訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,得到相關(guān)模型函數(shù),采用測試數(shù)據(jù)集對模型函數(shù)進(jìn)行驗(yàn)證,并將驗(yàn)證結(jié)果作為反饋優(yōu)化訓(xùn)練模型。
在綜合分析比較多種機(jī)器學(xué)習(xí)算法的特點(diǎn)和適用范圍之后,選用決策樹、KNN(K-Nearest Neighbor)和樸素貝葉斯網(wǎng)絡(luò)搭建機(jī)器學(xué)習(xí)模型。
1) 決策樹的原理為:類比樹狀結(jié)構(gòu)的形式對數(shù)據(jù)進(jìn)行分類,樹的每個葉節(jié)點(diǎn)對應(yīng)1個分類,非葉節(jié)點(diǎn)對應(yīng)某種屬性的劃分。決策樹的優(yōu)點(diǎn)是可讀性好,對人工分析很有幫助[7]。本文在進(jìn)行決策樹模型訓(xùn)練時,將決策樹準(zhǔn)則選為基尼系數(shù),最大深度設(shè)為默認(rèn)不限,分裂策略選擇最優(yōu)的分裂策略,每個葉子節(jié)點(diǎn)需要的最少樣本數(shù)設(shè)為1個,并使各類別的權(quán)重相等。
2) KNN為限定半徑最近鄰近法,通過計算選擇最近質(zhì)心來分類[8]。本文在進(jìn)行KNN模型訓(xùn)練時,將K值設(shè)定為5,近鄰樣本的權(quán)重選用uniform模式,限定半徑最近法算法選用auto模式,權(quán)衡選擇較優(yōu)的算法。
3) 樸素貝葉斯的原理為:基于概率思想對數(shù)據(jù)進(jìn)行分類,分別為先驗(yàn)為高斯分布的樸素貝葉斯、先驗(yàn)為多項式分布的樸素貝葉斯和先驗(yàn)為伯努利分布的樸素貝葉斯[9]。由于本文中的數(shù)據(jù)認(rèn)為是連續(xù)的,因此選用先驗(yàn)為高斯分布的樸素貝葉斯算法,先驗(yàn)率采用默認(rèn)值,對模型進(jìn)行訓(xùn)練。
KNN算法常用于對非正態(tài)分布且密度函數(shù)未知的數(shù)據(jù)進(jìn)行分類,對異常值不敏感;決策樹算法對數(shù)據(jù)處理的要求較高,需對數(shù)據(jù)進(jìn)行分類,分類過程需面向問題本身,當(dāng)數(shù)據(jù)量較大時,預(yù)測的準(zhǔn)確度會下降;樸素貝葉斯算法對數(shù)據(jù)的要求較高,預(yù)測的準(zhǔn)確度較高,通常在數(shù)據(jù)較少的情況下應(yīng)用。
分別運(yùn)用上述3種算法模型對訓(xùn)練數(shù)據(jù)集進(jìn)行訓(xùn)練,采用測試數(shù)據(jù)集進(jìn)行測試,得出3種機(jī)器學(xué)習(xí)算法在本文故障分類中的應(yīng)用效果,選取其中3種故障的測試結(jié)果進(jìn)行比較,結(jié)果見表1。
表1 3種機(jī)器學(xué)習(xí)算法應(yīng)用效果比較
由表1可知:KNN算法的準(zhǔn)確度約為65%,相對較低;決策樹算法和樸素貝葉斯算法的應(yīng)用效果較好,準(zhǔn)確度均在90%以上,符合算法的應(yīng)用特性,滿足項目設(shè)計技術(shù)的需求,其中樸素貝葉斯算法的準(zhǔn)確度在96%左右,效果最佳。
最終將前期得到的機(jī)組健康評分系統(tǒng)與故障識別算法相結(jié)合,建立完整的機(jī)組健康診斷系統(tǒng)(見圖7),將機(jī)組參數(shù)作為輸入變量,可實(shí)時得到機(jī)組在當(dāng)前狀態(tài)下運(yùn)行時的健康指數(shù),若發(fā)生故障,則可自動通過故障識別算法對故障數(shù)據(jù)進(jìn)行判斷,并在界面顯示相應(yīng)故障。
圖7 柴油發(fā)電機(jī)組健康診斷系統(tǒng)
當(dāng)前,受使用環(huán)境復(fù)雜、空間狹小等因素影響,船用柴油發(fā)電機(jī)組檢修較為困難,維護(hù)和維修成本高昂。若設(shè)備在運(yùn)行過程中發(fā)生故障,且因無相關(guān)預(yù)警系統(tǒng)而未能及時發(fā)現(xiàn)并作相應(yīng)處理,輕則導(dǎo)致設(shè)備停機(jī),重則影響整個生產(chǎn)系統(tǒng)的正常運(yùn)行。
本文研究的船用柴油發(fā)電機(jī)組健康診斷系統(tǒng)可對機(jī)組的運(yùn)行狀態(tài)進(jìn)行實(shí)時監(jiān)測,實(shí)現(xiàn)對機(jī)組的健康狀態(tài)診斷、故障預(yù)測及故障報警,在實(shí)際應(yīng)用之后,可建立一套通用型故障預(yù)測算法解決方案,為各類機(jī)械類設(shè)備、電力設(shè)備提供完整的故障診斷、故障預(yù)測智能化功能開發(fā)解決方案,從而降低企業(yè)的運(yùn)營成本,提高設(shè)備的自動化程度。