許小偉,嚴(yán)運(yùn)兵,王小輝
(1.武漢科技大學(xué)汽車與交通工程學(xué)院,湖北 武漢,430081; 2.武漢理工大學(xué)能源與動(dòng)力工程學(xué)院,湖北 武漢,430063)
支持張量機(jī)在柴油機(jī)故障預(yù)測(cè)中的應(yīng)用研究
許小偉1,嚴(yán)運(yùn)兵1,王小輝2
(1.武漢科技大學(xué)汽車與交通工程學(xué)院,湖北 武漢,430081; 2.武漢理工大學(xué)能源與動(dòng)力工程學(xué)院,湖北 武漢,430063)
為了解決柴油機(jī)故障預(yù)測(cè)中大樣本、非線性以及高維數(shù)據(jù)的數(shù)據(jù)預(yù)測(cè)問題,避免以向量輸入帶來的結(jié)構(gòu)信息丟失和數(shù)據(jù)相關(guān)性被破壞等現(xiàn)象,結(jié)合支持向量機(jī)(SVM)的學(xué)習(xí)框架和交替投影的思想,研究基于在線支持張量機(jī)(OSTM)的柴油機(jī)故障預(yù)測(cè)算法和流程,并以測(cè)試精度、學(xué)習(xí)時(shí)間和均方根誤差作為評(píng)價(jià)指標(biāo),利用遠(yuǎn)程監(jiān)測(cè)系統(tǒng)采集的數(shù)據(jù),分別應(yīng)用在線支持向量機(jī)(OSVM)和OSTM進(jìn)行故障預(yù)測(cè)和分析。結(jié)果表明,與OSVM方法相比,OSTM方法測(cè)試精度較高,學(xué)習(xí)時(shí)間大幅縮短,預(yù)測(cè)模型的收斂速度較快,能有效在線預(yù)測(cè)柴油機(jī)故障。
柴油機(jī);在線支持向量機(jī);在線支持張量機(jī);故障預(yù)測(cè)
柴油機(jī)是集機(jī)、電、液、氣于一體的多部件復(fù)雜混聯(lián)系統(tǒng),具有信號(hào)源多、運(yùn)動(dòng)部件多等特點(diǎn),監(jiān)測(cè)信號(hào)眾多且多為非平穩(wěn)信號(hào),相互干擾較大且?guī)в蟹蔷€性和復(fù)雜耦合的特征,導(dǎo)致故障信號(hào)的幅值、頻率難以掌握,很難建立準(zhǔn)確的數(shù)學(xué)模型描述其故障的發(fā)生機(jī)理。同時(shí),柴油機(jī)各零部件的劣化方式各不相同,不僅各種預(yù)測(cè)的方法不能通用,而且依靠單一預(yù)測(cè)模型也難以準(zhǔn)確進(jìn)行故障預(yù)測(cè)。另外,柴油機(jī)企業(yè)逐漸重視視情維修,在柴油機(jī)中安裝了大量的監(jiān)控裝置和設(shè)備,采集的大量數(shù)據(jù)使故障預(yù)測(cè)的計(jì)算過程過于繁瑣,導(dǎo)致傳統(tǒng)的預(yù)測(cè)模型無(wú)法滿足柴油機(jī)維護(hù)與管理的需要。因此,為了解決柴油機(jī)故障預(yù)測(cè)中的超大樣本、非線性以及高維復(fù)雜數(shù)據(jù)等問題,研究者結(jié)合傳統(tǒng)的故障診斷和預(yù)測(cè)方法,引入了壽命消耗監(jiān)控(Life Consumption Monitoring,LCM)[1]、粒子濾波(Particle Filter,PF)[2]、貝葉斯網(wǎng)絡(luò)[3]以及支持向量機(jī)(Support Vector Machine,SVM)[4]等機(jī)器學(xué)習(xí)工具進(jìn)行柴油機(jī)的故障預(yù)測(cè)分析。
傳統(tǒng)的機(jī)器學(xué)習(xí)往往采用批量或離線式學(xué)習(xí)方法,但在柴油機(jī)故障預(yù)測(cè)的工程應(yīng)用中,學(xué)習(xí)機(jī)的數(shù)據(jù)是以序列的方式獲取的,數(shù)據(jù)被源源不斷地送往學(xué)習(xí)系統(tǒng)。在這種情況下,對(duì)大規(guī)模樣本進(jìn)行訓(xùn)練的代價(jià)較高、耗時(shí)較長(zhǎng)、精度較低,因此需要采用在線學(xué)習(xí)算法進(jìn)行分析[5]。其中,常見的在線學(xué)習(xí)算法包括在線支持向量機(jī)(Online Support Vector Machine,OSVM)[6]、雙重更新在線學(xué)習(xí)(Double Updating Online Learning,DUOL)[7]等。
同時(shí),在柴油機(jī)故障診斷與預(yù)測(cè)中,監(jiān)測(cè)參數(shù)包括飛輪段瞬時(shí)轉(zhuǎn)速信號(hào)、氣缸蓋振動(dòng)信號(hào)、油底殼油液信號(hào)以及潤(rùn)滑系統(tǒng)、冷卻系統(tǒng)溫度和壓力信號(hào)等數(shù)據(jù)源,通常被表示成多維數(shù)組,即張量。但是在工程應(yīng)用中,傳統(tǒng)的機(jī)器學(xué)習(xí)算法多采用向量輸入模式。對(duì)于復(fù)雜的柴油機(jī)狀態(tài)參數(shù),為了滿足當(dāng)前學(xué)習(xí)機(jī)的要求,通常假設(shè)各參數(shù)之間相互獨(dú)立,或者采用加權(quán)平均的方式將高維數(shù)據(jù)簡(jiǎn)化為一維或者低維數(shù)據(jù),并以向量的模式作為模型的輸入。將張量數(shù)據(jù)向量化解決了高維數(shù)據(jù)的模型輸入問題,但同時(shí)會(huì)導(dǎo)致數(shù)據(jù)之間的結(jié)構(gòu)信息丟失和相關(guān)性被破壞等問題[8-9]。因此,本文基于支持向量機(jī)的學(xué)習(xí)框架和交替投影的思想,分析以序列方式獲取張量數(shù)據(jù)的在線二分類問題,并針對(duì)柴油機(jī)監(jiān)測(cè)的原始數(shù)據(jù)進(jìn)行應(yīng)用分析。
在模式識(shí)別、機(jī)器學(xué)習(xí)、計(jì)算機(jī)視覺和圖像處理等研究領(lǐng)域中,如人臉圖像被表示成二階張量,步態(tài)輪廓序列[10]和多光譜影像[11]通常被表示成三階張量。而在工程實(shí)際應(yīng)用中,數(shù)據(jù)一般采用向量模式表示,即無(wú)論原始數(shù)據(jù)是一維向量、兩維矩陣還是高階張量,幾乎總是轉(zhuǎn)換成對(duì)應(yīng)的向量模式來處理。將張量向量化可能出現(xiàn)破壞原始數(shù)據(jù)的結(jié)構(gòu)和內(nèi)在相關(guān)性,掩蓋數(shù)據(jù)原本存在的冗余信息和高階依賴性,以及維數(shù)災(zāi)難和過擬合等問題[9]。為了避免出現(xiàn)上述問題,基于支持向量機(jī)的學(xué)習(xí)框架和交替投影的思想,Tao[8]把經(jīng)典的線性C-SVM、V-SVM和最小二乘支持向量機(jī)(Least Squares Support Sector Machine,LS-SVM)擴(kuò)展到一般的張量模式,進(jìn)而擴(kuò)展了支持張量機(jī)(Support Tensor Machine,STM)的應(yīng)用領(lǐng)域。
1.1 支持張量機(jī)
基于支持張量機(jī)的柴油機(jī)故障診斷與預(yù)測(cè)是利用支持張量機(jī)的模型對(duì)高維的樣本進(jìn)行分類或者回歸,判斷其工作狀態(tài)為正常還是故障,即確定其樣本標(biāo)簽為+1或者-1,屬于樣本的二分類問題。
(1)
構(gòu)建式(1)的拉格朗日方程:
(2)
式中:αi、βi為L(zhǎng)agrange乘子,αi≥0,βi≥0。
L(ω,b,α,β,ε)對(duì)各變量的偏導(dǎo)數(shù)為:
(3)
(4)
(5)
(6)
1.2 在線支持張量機(jī)
先前討論的STM都是批量學(xué)習(xí)(batchlearning),在算法執(zhí)行之前所有樣本的細(xì)節(jié)都很清楚,根據(jù)所有的樣本學(xué)習(xí)出故障預(yù)測(cè)函數(shù);而在線支持張量機(jī)(OnlineSupportTensorMachine,OSTM)在算法設(shè)計(jì)階段或執(zhí)行之前無(wú)完全信息可用,輸入的樣本往往是實(shí)時(shí)到達(dá)的,根據(jù)每個(gè)新來的樣本,邊學(xué)習(xí)邊給出結(jié)果。
根據(jù)樣本獲得的先后順序,將樣本定義為(x1,y1),(x2,y2),…,(xi,yi),…,(xm,ym)。OSTM算法對(duì)于新獲得樣本,利用預(yù)測(cè)函數(shù)給出其類別標(biāo)簽yi的預(yù)測(cè)值,然后對(duì)比樣本標(biāo)簽yi的真實(shí)值,如果預(yù)測(cè)值與真實(shí)值相同,則接受該預(yù)測(cè)函數(shù),否則優(yōu)化模型參數(shù),確定新的預(yù)測(cè)函數(shù)。整個(gè)過程是重復(fù)迭代的過程,直至所有樣本完成運(yùn)算。
本文以某鋼鐵企業(yè)內(nèi)部運(yùn)輸機(jī)車的16缸柴油機(jī)動(dòng)力系統(tǒng)為例,利用遠(yuǎn)程監(jiān)測(cè)與管理系統(tǒng),實(shí)時(shí)采集與燃油系統(tǒng)相關(guān)的狀態(tài)參數(shù),包括振動(dòng)信號(hào)、瞬時(shí)轉(zhuǎn)速、油液參數(shù)和熱工參數(shù)等,并結(jié)合傳統(tǒng)的故障診斷和預(yù)測(cè)方法,引入機(jī)器學(xué)習(xí)工具OSTM進(jìn)行柴油機(jī)工作狀態(tài)的故障預(yù)測(cè)分析。
2.1 試驗(yàn)平臺(tái)
根據(jù)柴油機(jī)動(dòng)力系統(tǒng)的工作特點(diǎn),結(jié)合現(xiàn)有動(dòng)力系統(tǒng)的狀態(tài)監(jiān)測(cè)技術(shù),設(shè)計(jì)了柴油機(jī)工作狀態(tài)監(jiān)測(cè)的功能結(jié)構(gòu)示意圖,如圖1所示。
通過采集柴油機(jī)動(dòng)力系統(tǒng)的狀態(tài)參數(shù),進(jìn)行初步的狀態(tài)監(jiān)測(cè)與故障診斷,并將診斷的結(jié)果及狀態(tài)參數(shù)通過3G/GPRS無(wú)線通信模塊發(fā)送到柴油機(jī)遠(yuǎn)程監(jiān)測(cè)與管理中心,再進(jìn)行柴油機(jī)動(dòng)力系統(tǒng)的故障預(yù)測(cè)與健康管理。其中,故障預(yù)測(cè)分析試驗(yàn)平臺(tái)以Visual C++6.0作為可視化集成開發(fā)環(huán)境,MATLABR2010a為數(shù)據(jù)分析工具,Microsoft SQL Server 2008為后端數(shù)據(jù)庫(kù)管理系統(tǒng),所使用電腦的CPU為Intel T2400 1.83 GHz,內(nèi)存為2.50 GB,操作系統(tǒng)為Windows 7。
Fig.1 Schematic diagram of the functional structure of the monitoring system
2.2 試驗(yàn)數(shù)據(jù)的采集及分析流程
該柴油機(jī)平均每天工作20 h。在數(shù)據(jù)采集的試驗(yàn)中,將柴油機(jī)的工作狀態(tài)分為怠速、低速、中速、高速和空載5種工況。柴油機(jī)運(yùn)行時(shí),每小時(shí)采集10組振動(dòng)信號(hào)和轉(zhuǎn)速信號(hào),每天采集1組油液信號(hào),每分鐘采集1組熱工參數(shù),共采集了3個(gè)月。
故障分析數(shù)據(jù)樣本集的參數(shù)如表1所示。在每組數(shù)據(jù)中,振動(dòng)信號(hào)包括16個(gè)氣缸、三維空間的3項(xiàng)數(shù)據(jù),每項(xiàng)1024個(gè)點(diǎn);轉(zhuǎn)速信號(hào)包括16個(gè)氣缸分別發(fā)生故障以及全部正常工況下的17項(xiàng)數(shù)據(jù),每項(xiàng)1024個(gè)點(diǎn);油液信號(hào)包括油底殼中潤(rùn)滑油的溫度和壓力以及不同成分磨粒的密度等共計(jì)25項(xiàng)數(shù)據(jù),每項(xiàng)100個(gè)點(diǎn);熱工參數(shù)包括冷卻水、潤(rùn)滑油、燃油的溫度和壓力等共計(jì)25項(xiàng)數(shù)據(jù),每項(xiàng)100個(gè)點(diǎn)。利用OSTM進(jìn)行數(shù)據(jù)分析時(shí),若對(duì)于某一空間的狀態(tài)參數(shù)沒有更新,則用上一組數(shù)據(jù)替代。
在試驗(yàn)完成后查閱機(jī)車數(shù)據(jù)記錄日志,發(fā)現(xiàn)該燃油系統(tǒng)從第72 天開始柴油機(jī)出現(xiàn)冒黑煙、機(jī)體偶爾有異常振動(dòng)的現(xiàn)象;第86天進(jìn)行拆裝檢修時(shí),發(fā)現(xiàn)主機(jī)第5缸的噴油嘴針閥燒蝕而導(dǎo)致噴油嘴卡死的現(xiàn)象。
為了驗(yàn)證在線支持張量機(jī)在柴油機(jī)故障預(yù)測(cè)應(yīng)用中的可行性,以預(yù)測(cè)精度、學(xué)習(xí)時(shí)間和均方根誤差作為評(píng)價(jià)標(biāo)準(zhǔn),采用OSTM和OSVM兩種算法進(jìn)行對(duì)比分析,其分析流程如圖2所示。
2.3 結(jié)果與分析
在柴油機(jī)的故障預(yù)測(cè)分析時(shí),將樣本集的前60%作為訓(xùn)練集,剩下的40%作為測(cè)試集。由于數(shù)據(jù)量較大,故每間隔15 天取一組數(shù)據(jù),共取6組進(jìn)行數(shù)據(jù)分析。
兩種算法下預(yù)測(cè)精度隨時(shí)間的變化趨勢(shì)如圖3所示。從圖3中可以看出,二者的預(yù)測(cè)精度均較高,滿足工程應(yīng)用的要求。在樣本采集時(shí)間的前75 天,隨著樣本采集時(shí)間的延長(zhǎng),分析的樣本數(shù)量增多,兩種算法的預(yù)測(cè)精度都逐漸提高,但其增幅逐漸減小,預(yù)測(cè)模型和參數(shù)逐漸趨于穩(wěn)定;當(dāng)出現(xiàn)故障樣本時(shí),預(yù)測(cè)精度會(huì)稍微下降,其原因在于先前的正常樣本數(shù)目遠(yuǎn)大于故障樣本的數(shù)目,即存在數(shù)據(jù)偏移現(xiàn)象,導(dǎo)致預(yù)測(cè)結(jié)果與實(shí)際工況存在一定的偏差,需要通過對(duì)不同類別的樣本采用不同的懲罰因子,調(diào)節(jié)因數(shù)據(jù)偏移造成的分類誤差。因此,可以預(yù)計(jì)經(jīng)過一定的參數(shù)調(diào)整后,其預(yù)測(cè)精度將會(huì)繼續(xù)上升至穩(wěn)定狀態(tài)。而根據(jù)機(jī)車日志中的數(shù)據(jù)記錄,可以發(fā)現(xiàn)該燃油系統(tǒng)在第72天之后開始出現(xiàn)故障,即出現(xiàn)了故障樣本,從而導(dǎo)致預(yù)測(cè)精度的變化曲線出現(xiàn)拐點(diǎn),即柴油機(jī)的實(shí)際運(yùn)行工況與數(shù)據(jù)分析的結(jié)果比較一致。
Fig.3 Variation of prediction accuracy with sample collecting time
另外從圖3中還可看出, OSTM的預(yù)測(cè)精度總體上高于OSVM的預(yù)測(cè)精度,其原因在于將張量向量化可能出現(xiàn)破壞原始數(shù)據(jù)的結(jié)構(gòu)和內(nèi)在相關(guān)性,掩蓋數(shù)據(jù)原本存在的冗余信息和高階依賴性以及維數(shù)災(zāi)難和過擬合等問題;當(dāng)突然出現(xiàn)故障樣本時(shí),OSVM曲線的變化速率要快于OSTM,這是因?yàn)槠淠P拖鄬?duì)簡(jiǎn)單,更容易遭受數(shù)據(jù)偏差的影響。
圖4所示為兩種算法下學(xué)習(xí)時(shí)間隨樣本采集時(shí)間的變化趨勢(shì)。從圖4可以看出,隨著樣本采集時(shí)間的增加,OSTM的學(xué)習(xí)時(shí)間遠(yuǎn)小于OSVM的學(xué)習(xí)時(shí)間,其原因在于將張量向量化的過程中,需要使用交叉投影以及主成分分析等方法降維,運(yùn)算時(shí)間較長(zhǎng),且樣本數(shù)量越大耗時(shí)越長(zhǎng)。另外,采用OSVM和OSTM的在線學(xué)習(xí)算法,其學(xué)習(xí)時(shí)間在理想情況下應(yīng)該是穩(wěn)定不變或者是緩慢增長(zhǎng)的,而圖4中兩種方法的學(xué)習(xí)時(shí)間均按一定斜率的斜線形式增長(zhǎng),表明本文所使用的故障預(yù)測(cè)模型需要繼續(xù)優(yōu)化。
Fig.4 Variation of learning time with sample collecting time
圖5所示為兩種算法下的均方根誤差隨樣本采集時(shí)間的變化趨勢(shì)。從圖5可以看出,OSTM的均方根誤差較小,預(yù)測(cè)模型的收斂速度較快;但當(dāng)出現(xiàn)故障樣本時(shí),其均方根誤差也會(huì)出現(xiàn)一段上升的過程,其原因同預(yù)測(cè)精度的變化原因一致。
本文結(jié)合SVM的學(xué)習(xí)框架和交替投影的思想,研究了基于OSTM的柴油機(jī)故障預(yù)測(cè)算法和流程,并利用遠(yuǎn)程監(jiān)測(cè)系統(tǒng)采集的柴油機(jī)瞬時(shí)轉(zhuǎn)速和熱工參數(shù)等數(shù)據(jù),分別采用OSVM和OSTM兩種方法進(jìn)行故障預(yù)測(cè)的應(yīng)用分析。以預(yù)測(cè)精度、學(xué)習(xí)時(shí)間和均方根誤差作為3個(gè)評(píng)價(jià)指標(biāo),對(duì)比分析兩種算法下的故障預(yù)測(cè)結(jié)果,發(fā)現(xiàn)OSTM充分利用了數(shù)據(jù)更充分的結(jié)構(gòu)信息及其相關(guān)性,預(yù)測(cè)精度較高,學(xué)習(xí)時(shí)間大幅降低,預(yù)測(cè)模型的收斂速度較快,而且其故障預(yù)測(cè)結(jié)果與實(shí)際記錄一致。因此,數(shù)據(jù)分析和試驗(yàn)結(jié)果都證明了基于OSTM進(jìn)行柴油機(jī)故障預(yù)測(cè)具有可行性和有效性,有一定的推廣價(jià)值。
[1] Vincent Rouet , Frédéric Minault, Guillaume Diancourt, et al. Concept of smart integrated life consumption monitoring system for electronics[J]. Microelectronics Reliability, 2007,47(12):1921-1927.
[2] 林國(guó)語(yǔ),賈云獻(xiàn),孫磊,等. 基于粒子濾波的非線性設(shè)備狀態(tài)估計(jì)[J]. 現(xiàn)代制造工程, 2014(1):97-101.
[3] 蔡志強(qiáng),孫樹棟,司書賓,等.基于FMECA的復(fù)雜裝備故障預(yù)測(cè)貝葉斯網(wǎng)絡(luò)建模[J].系統(tǒng)工程理論與實(shí)踐,2013,33(1):187-193.
[4] 別鋒鋒,劉揚(yáng),周國(guó)強(qiáng),等. 基于局域波法和SVM模型的往復(fù)機(jī)械故障預(yù)測(cè)方法研究[J]. 中國(guó)機(jī)械工程, 2011,22(6):687-691.
[5] Cavallanti G, Cesa-Bianchi N, Gentile C. Tracking the best hyperplane with a simple budget perceptron[J]. Machine Learning, 2007, 69(2/3): 143-167.
[6] Orabona F, Castellini C, Caputo B, et al. On-line independent support vector machines [J]. Pattern Recognition, 2010, 43(4): 1402-1412.
[7] Zhao Peilin, Hoi S C H, Jin Rong. Double updating online learning[J]. Journal of Machine Learning Research, 2011, 12: 1587-1615.
[8] Tao Dacheng, Li Xuelong, Wu Xindong, et al. Supervised tensor learning[J]. Knowledge and Information Systems, 2007, 13(1): 1-42.
[9] 周蓉,楊曉偉,吳廣潮. 在線支持張量機(jī)[J]. 計(jì)算機(jī)科學(xué)與探索,2013,7(7):611-619.
[10] Lu Haiping, Plataniotis K N, Venetsanopoulos A N. MPCA: multilinear principal component analysis of tensor objects[J]. IEEE Transactions on Neural Networks, 2008, 19(1): 18-39.
[11]張樂飛,黃昕,張良培.高分辨率遙感影像的支持張量機(jī)分類方法[J]. 武漢大學(xué)學(xué)報(bào):信息科學(xué)版,2012, 37(3): 314-317.
[12]Kolda T G, Bader B W. Tensor decompositions and applications[J]. SIAM Review, 2009, 51(3): 455-500.
[責(zé)任編輯 鄭淑芳]
Prediction of diesel engine failure based on OSTM
XuXiaowei1,YanYunbing1,WangXiaohui2
(1. College of Automobile and Traffic Engineering, Wuhan University of Science and Technology, Wuhan 430081, China;2. School of Energy and Power Engineering, Wuhan University of Technology, Wuhan 430063, China)
To resolve the prediction problems with giant sample size, nonlinear and high dimensional data for diesel engines, this paper, aided by the framework of support vector machine (SVM) and the alternating projection method, studied the algorithm and process of diesel engine failure prediction on the basis of online support tensor machine (OSTM) to avoid loss of structural information and damage to data correlation resulting from vector input. Prediction accuracy, learning time and mean square error (MSE) were employed as evaluation indicators, and data collected by distant monitoring system were used in diesel engine failure prediction on the basis of OSVM and OSTM, respectively. The results show that compared with OSVM, OSTM is more accurate in failure prediction, boasting less learning time, higher convergence speed and greater efficiency.
diesel engine; OSVM; OSTM; failure prediction
2014-12-11
許小偉(1983-),男,武漢科技大學(xué)講師,博士.E-mail:xxw15@163.com
TK428
A
1674-3644(2015)02-0106-05