肖 黎,羅 嘉,歐陽春明
?
基于半監(jiān)督學(xué)習(xí)方法的磨煤機(jī)故障預(yù)警
肖 黎1,羅 嘉1,歐陽春明2
(1.廣東電科院能源技術(shù)有限責(zé)任公司,廣東 廣州 510080; 2.廣東電網(wǎng)有限責(zé)任公司電力科學(xué)研究院,廣東 廣州 510080)
火電機(jī)組磨煤機(jī)運(yùn)行環(huán)境惡劣,故障頻發(fā),對(duì)磨煤機(jī)故障進(jìn)行預(yù)警,評(píng)估設(shè)備在相關(guān)故障狀態(tài)下的剩余可用時(shí)間,對(duì)提高火電機(jī)組運(yùn)行安全具有重要意義。本文提出一種基于半監(jiān)督學(xué)習(xí)方法的磨煤機(jī)故障預(yù)警技術(shù)。首先采用DBSCAN聚類將磨煤機(jī)的歷史運(yùn)行數(shù)據(jù)劃分為正常狀態(tài)和故障狀態(tài),分配類標(biāo)記并統(tǒng)計(jì)設(shè)備剩余可用時(shí)間,然后采用隨機(jī)森林方法建立基于類標(biāo)記序列的磨煤機(jī)運(yùn)行狀態(tài)分類預(yù)警模型,對(duì)磨煤機(jī)運(yùn)行數(shù)據(jù)進(jìn)行狀態(tài)預(yù)測(cè),根據(jù)類標(biāo)記序列判斷故障類別和對(duì)應(yīng)的設(shè)備剩余可用時(shí)間。將此方法用于某火電廠磨煤機(jī)實(shí)際運(yùn)行數(shù)據(jù),并與k-近鄰算法、樸素貝葉斯和線性判別分析的預(yù)警模型進(jìn)行比較,結(jié)果表明:本文方法優(yōu)于其他預(yù)警模型,可準(zhǔn)確標(biāo)記磨煤機(jī)不同故障發(fā)展階段,也能較準(zhǔn)確地給出磨煤機(jī)剩余可用時(shí)間。
磨煤機(jī);DBSCAN聚類;故障預(yù)警;隨機(jī)森林;半監(jiān)督學(xué)習(xí)方法;預(yù)測(cè)
火電廠中磨煤機(jī)因結(jié)構(gòu)復(fù)雜、運(yùn)行環(huán)境惡劣多變,導(dǎo)致其故障頻發(fā)。中國(guó)電力企業(yè)聯(lián)合會(huì)2016年全國(guó)電力可靠性指標(biāo)報(bào)告中指出:與給水泵、送風(fēng)機(jī)、引風(fēng)機(jī)和高壓加熱器相比,磨煤機(jī)因發(fā)生故障而停運(yùn)的時(shí)間偏多。磨煤機(jī)故障類型較多,按照故障成因磨煤機(jī)故障可分為兩類:一類是磨煤機(jī)發(fā)生磨損和老化造成;另一類是磨煤機(jī)運(yùn)行參數(shù)偏離正常值造成,這是磨煤機(jī)停運(yùn)的主要原因。對(duì)于因參數(shù)偏離正常運(yùn)行狀態(tài)產(chǎn)生的故障進(jìn)行預(yù)警,對(duì)提高火電機(jī)組安全生產(chǎn)具有重要的工程價(jià)值。
現(xiàn)有故障預(yù)警方法可分為基于系統(tǒng)模型的故障預(yù)警技術(shù)、基于統(tǒng)計(jì)方法和基于數(shù)據(jù)驅(qū)動(dòng)的故障預(yù)警技術(shù)。在基于系統(tǒng)模型的故障預(yù)警方面,Cai等人[1]建立對(duì)象的微分方程模型,通過比較殘差來實(shí)現(xiàn)線性分布參數(shù)系統(tǒng)的故障預(yù)警;薛涵磊等[2]結(jié)合模型預(yù)測(cè)和溯因推理網(wǎng)絡(luò)方法預(yù)測(cè)電網(wǎng)故障。在基于統(tǒng)計(jì)方法的故障預(yù)警方面,Abdenour Soualhi等[3]利用2個(gè)隱馬爾可夫模型(hidden Markov models)來預(yù)測(cè)迫近的故障;Ding等人[4]則利用粒子濾波(particle filter)和非線性回歸(nonlinear regression)監(jiān)測(cè)非線性隨機(jī)系統(tǒng)(nonlinear stochastic system)的早期故障,避免故障進(jìn)一步發(fā)展?;跀?shù)據(jù)驅(qū)動(dòng)的故障預(yù)警方面,Ma等人[5]和陳園藝等[6]使用支持向量機(jī)(support vector machine,SVM)分別對(duì)Tennessee Eastman過程和風(fēng)電機(jī)組齒輪箱的故障進(jìn)行預(yù)測(cè);Zhang等人[7]結(jié)合信度規(guī)則(belief rule base)和證據(jù)推理(evidential reasoning)來訓(xùn)練故障預(yù)警模型;Tian等人[8]使用灰色時(shí)間序列模型來預(yù)測(cè)化工過程的趨勢(shì),實(shí)現(xiàn)故障預(yù)警;陸寧云等[9]根據(jù)工程系統(tǒng)自身固有的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),構(gòu)建多層貝葉斯網(wǎng)絡(luò)模型,從而實(shí)現(xiàn)故障預(yù)警?;谙到y(tǒng)模型和統(tǒng)計(jì)方法的故障預(yù)警方法存在自身固有的缺點(diǎn),如預(yù)測(cè)效果受限于模型的精度等,而基于數(shù)據(jù)驅(qū)動(dòng)的故障預(yù)警方法直接采用設(shè)備的歷史數(shù)據(jù)和在線數(shù)據(jù),使數(shù)據(jù)模型與實(shí)際設(shè)備相近,故障預(yù)警精度較高。同時(shí)現(xiàn)有故障預(yù)警方法側(cè)重故障類型預(yù)測(cè)研究,對(duì)于故障檢出后設(shè)備能繼續(xù)工作的時(shí)間則研究較少。
目前對(duì)磨煤機(jī)故障預(yù)警方面研究較少。Rakic[10]使用自組織映射(self organizing map,SOM)實(shí)現(xiàn)了磨煤機(jī)的故障預(yù)警和故障隔離;Chen等人[11]使用基于證據(jù)k-近鄰(k-nearest neighbour classifier,kNN)算法對(duì)包含磨煤機(jī)的火電設(shè)備進(jìn)行故障早期報(bào)警;Liu等人[12]使用SVM預(yù)測(cè)磨煤機(jī)相關(guān)變量的變化趨勢(shì),進(jìn)一步對(duì)故障進(jìn)行預(yù)測(cè)。這些方法都能實(shí)現(xiàn)磨煤機(jī)故障預(yù)警,但無法進(jìn)一步估算磨煤機(jī)的剩余可用時(shí)間。
本文提出一種基于半監(jiān)督學(xué)習(xí)方法的磨煤機(jī)故障預(yù)警系統(tǒng),采用基于密度的有噪聲聚類(density-based spatial clustering of applications with noise,DBSCAN)方法對(duì)磨煤機(jī)歷史運(yùn)行數(shù)據(jù)進(jìn)行正常狀態(tài)和故障狀態(tài)的聚類,采用隨機(jī)森林(random forest,RF)分類方法建立磨煤機(jī)運(yùn)行狀態(tài)分類預(yù)警模型,在預(yù)測(cè)故障類別的同時(shí)實(shí)現(xiàn)磨煤機(jī)剩余可用時(shí)間的估算。
磨煤機(jī)故障可分成設(shè)備故障和工藝故障兩大類[13]。設(shè)備故障包括磨煤機(jī)振動(dòng)、磨煤機(jī)漏粉、主軸承過熱、一次風(fēng)管堵塞、磨煤機(jī)出力不足、磨煤機(jī)自燃和靜壓軸承油壓異常。工藝故障包括磨煤機(jī)滿煤和磨煤機(jī)斷煤。磨煤機(jī)斷煤、磨煤機(jī)堵煤、磨煤機(jī)自燃和一次風(fēng)管堵塞故障屬于運(yùn)行參數(shù)偏離正常值造成的故障。其中,磨煤機(jī)斷煤故障與磨煤機(jī)自燃故障在磨煤機(jī)多個(gè)過程參數(shù)的變化趨勢(shì)相似,僅通過磨煤機(jī)的過程參數(shù)難于區(qū)分。
落煤管或給煤管堵塞、給煤機(jī)斷煤或一次風(fēng)管堵塞、一次風(fēng)量過小等均會(huì)造成進(jìn)煤量減小,磨煤機(jī)內(nèi)存煤量降低,最終導(dǎo)致磨煤機(jī)斷煤故障。故障發(fā)生過程中,少量濕煤無法吸收一次風(fēng)中過量的熱,導(dǎo)致磨煤機(jī)出口溫度上升。在系統(tǒng)自動(dòng)運(yùn)行時(shí),給煤機(jī)轉(zhuǎn)速較高,但進(jìn)煤較少,一次風(fēng)量隨給煤機(jī)轉(zhuǎn)速信號(hào)而增大,導(dǎo)致排粉機(jī)功耗上升,而磨煤機(jī)中煤少,造成功耗下降。
磨煤機(jī)出口溫度過高可能導(dǎo)致磨煤機(jī)發(fā)生自燃故障。造成磨煤機(jī)出口溫度過高的原因較多,主要有:1)磨煤機(jī)入口熱風(fēng)過多,冷熱風(fēng)比失配;2)磨煤機(jī)斷煤導(dǎo)致磨煤機(jī)無法有效吸收一次風(fēng)熱量;3)停磨或啟磨時(shí)沒有充分吹掃,殘留煤粉導(dǎo)致自燃;4)煤質(zhì)發(fā)生變化,如煤水分降低但未及時(shí)調(diào)整控制參數(shù),導(dǎo)致一次風(fēng)熱量無法完全吸收,磨煤機(jī)出口溫度超溫。磨煤機(jī)自燃故障發(fā)生后,磨煤機(jī)出口溫度快速升高,系統(tǒng)自動(dòng)運(yùn)行時(shí)熱風(fēng)門開度關(guān)至0,冷風(fēng)門全開,導(dǎo)致一次風(fēng)流量降低,磨煤機(jī)出入口風(fēng)壓降低,磨煤機(jī)差壓降低。
以某1 000 MW火電機(jī)組HP1163/Dyn中速磨煤機(jī)為研究對(duì)象。圖1和圖2分別為磨煤機(jī)發(fā)生斷煤故障和自燃故障時(shí)相關(guān)參數(shù)的變化趨勢(shì)。由圖1和圖2可見,磨煤機(jī)發(fā)生斷煤故障或自燃故障時(shí),磨煤機(jī)過程參數(shù)存在相似變化趨勢(shì),磨煤機(jī)出口溫度均會(huì)上升,同時(shí)冷風(fēng)門會(huì)增大開度,熱風(fēng)門減小開度,一次風(fēng)入口壓力降低。磨煤機(jī)發(fā)生斷煤故障時(shí),一次風(fēng)量先增大后減小;磨煤機(jī)發(fā)生自燃故障時(shí),一次風(fēng)量降低。發(fā)生斷煤和自燃故障時(shí)參數(shù)變化趨勢(shì)相似,給磨煤機(jī)故障類型判斷造成困擾,這也是難題之一。
圖1 磨煤機(jī)斷煤故障中各參數(shù)變化趨勢(shì)
圖2 磨煤機(jī)自燃故障中各參數(shù)變化趨勢(shì)
針對(duì)磨煤機(jī)的故障預(yù)警問題,本文提出一種基于半監(jiān)督學(xué)習(xí)的磨煤機(jī)故障預(yù)警方法,使用DBSCAN聚類方法建立磨煤機(jī)的故障預(yù)警模型,采用隨機(jī)森林方法實(shí)現(xiàn)故障預(yù)警和剩余可用時(shí)間的估算。磨煤機(jī)故障預(yù)警方法分離線訓(xùn)練和在線預(yù)警2個(gè)階段,結(jié)構(gòu)如圖3所示。
圖3 磨煤機(jī)故障預(yù)警過程
離線訓(xùn)練階段主要包括:
1)從歷史數(shù)據(jù)庫中提取與磨煤機(jī)運(yùn)行狀態(tài)相關(guān)的歷史數(shù)據(jù);
2)對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化預(yù)處理;
3)根據(jù)運(yùn)行日志和運(yùn)行經(jīng)驗(yàn),提取磨煤機(jī)不同故障的歷史數(shù)據(jù),并加上相應(yīng)的狀態(tài)標(biāo)簽;
4)采用DBSCAN聚類算法對(duì)歷史數(shù)據(jù)進(jìn)行聚類分析,結(jié)合狀態(tài)標(biāo)簽,對(duì)不同故障分配類標(biāo)記序列和統(tǒng)計(jì)不同故障的發(fā)生時(shí)間;
5)建立隨機(jī)森林模型,實(shí)現(xiàn)故障預(yù)警分類。
在線預(yù)警階段主要包括:
1)對(duì)在線數(shù)據(jù)進(jìn)行預(yù)處理;
2)預(yù)處理后的數(shù)據(jù)作為隨機(jī)森林的輸入,通過分類計(jì)算給出磨煤機(jī)的運(yùn)行狀態(tài)標(biāo)記序列,如果給出的標(biāo)記序列對(duì)應(yīng)某類磨煤機(jī)故障,則進(jìn)一步給出設(shè)備的剩余可用時(shí)間;
3)如果故障預(yù)警系統(tǒng)給出的預(yù)估狀態(tài)與運(yùn)行人員判斷不一致,則利用新數(shù)據(jù),重新訓(xùn)練故障預(yù)警模型。
DBSCAN聚類算法是一種基于密度的聚類,根據(jù)數(shù)據(jù)樣本在樣本空間中的緊密程度將樣本分成不同的簇,該方法聚類速度快,可以有效處理異常數(shù)據(jù)。
在DBSCAN聚類算法中,給定數(shù)據(jù)集D={1,2, …,x}相關(guān)定義如下:
定義2 密度直達(dá) 若x位于x的∈鄰域中,且x為核心對(duì)象,則稱x由x密度直達(dá);
定義3 密度可達(dá) 對(duì)于x與x,若存在樣本序列{1,2, …,p},其中1=x,p=x,且p1由p密度直達(dá),則稱x由x密度可達(dá)。
DBSCAN聚類算法先根據(jù)給定的鄰域參數(shù)∈和MinPts找出所有核心對(duì)象,然后以任一核心對(duì)象為出發(fā)點(diǎn),找出由其密度可達(dá)的樣本,生成聚類簇,直到所有核心對(duì)象均被訪問為止。
磨煤機(jī)的大部分故障存在一個(gè)逐步發(fā)展的過程,當(dāng)故障征兆比較微弱時(shí),磨煤機(jī)的相關(guān)過程參數(shù)開始偏離正常運(yùn)行值?,F(xiàn)有大多數(shù)故障預(yù)警方法偏重研究故障檢測(cè)方法,而針對(duì)不同的故障類型對(duì)設(shè)備剩余的可用時(shí)間缺少相應(yīng)的研究。不同的故障下,設(shè)備的過程參數(shù)在時(shí)間和空間上都存在一定的差異。考慮到故障發(fā)展通常需要一定的時(shí)間,可利用不同故障在發(fā)展過程中的不同演變趨勢(shì),對(duì)故障類型和設(shè)備剩余可用時(shí)間進(jìn)行估計(jì)。
從歷史數(shù)據(jù)庫中提取磨煤機(jī)的正常運(yùn)行狀態(tài)和故障狀態(tài)的歷史數(shù)據(jù),選取合適變量并進(jìn)行標(biāo)準(zhǔn)化處理。利用DBSCAN聚類對(duì)故障數(shù)據(jù)進(jìn)行故障分離。在劃分不同故障階段后,對(duì)每個(gè)故障分配類標(biāo)記序列,統(tǒng)計(jì)不同階段的設(shè)備剩余可用時(shí)間。類標(biāo)記序列為某一故障的不同階段的類標(biāo)記按照時(shí)間變化組成的序列。不同故障應(yīng)有不同的類標(biāo)記序列,即使同一故障,也可能出現(xiàn)不同的類標(biāo)記序列。
通過DBSCAN聚類對(duì)磨煤機(jī)的歷史數(shù)據(jù)的分析,得到帶有類標(biāo)記的歷史數(shù)據(jù)。隨機(jī)森林分類通過對(duì)帶類標(biāo)記的歷史數(shù)據(jù)進(jìn)行學(xué)習(xí),區(qū)分不同標(biāo)記的數(shù)據(jù),并且對(duì)新的數(shù)據(jù)預(yù)測(cè)類標(biāo)記。通過隨機(jī)森林對(duì)實(shí)時(shí)數(shù)據(jù)進(jìn)行類標(biāo)記預(yù)測(cè),可以判斷磨煤機(jī)當(dāng)前所處的狀態(tài)。訓(xùn)練時(shí)將歷史數(shù)據(jù)分成訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集用于建立預(yù)警模型,模型的性能通過測(cè)試數(shù)據(jù)進(jìn)行評(píng)估和驗(yàn)證。
關(guān)于訓(xùn)練數(shù)據(jù),首先應(yīng)用z-score標(biāo)準(zhǔn)化方法進(jìn)行數(shù)據(jù)預(yù)處理,然后提取與設(shè)備健康狀況相關(guān)的有用特性,選取的特征子集,以實(shí)現(xiàn)更低的維度和更少的冗余。在在線預(yù)警階段,先對(duì)在線數(shù)據(jù)預(yù)處理。預(yù)處理后的數(shù)據(jù)作為隨機(jī)森林的輸入,計(jì)算給出磨煤機(jī)的預(yù)測(cè)狀態(tài),如果給出故障預(yù)測(cè),則進(jìn)一步給出設(shè)備的剩余可用時(shí)間。如果故障預(yù)警系統(tǒng)給出的狀態(tài)估計(jì)與運(yùn)行人員判斷不一致,則利用新的數(shù)據(jù),重新訓(xùn)練故障預(yù)警模型。
從某1 000 MW火電機(jī)組的歷史數(shù)據(jù)中提取與磨煤機(jī)運(yùn)行相關(guān)的過程參數(shù)。根據(jù)文獻(xiàn)[13]中總結(jié)的磨煤機(jī)不同故障下過程參數(shù)變化趨勢(shì),選取與故障相關(guān)的變量,具體結(jié)果見表1。從1年的歷史數(shù)據(jù)中選取磨煤機(jī)正常運(yùn)行和故障運(yùn)行的數(shù)據(jù),采樣時(shí)間為1 s。根據(jù)運(yùn)行經(jīng)驗(yàn)選取了合計(jì)123 min的數(shù)據(jù),包括1組典型正常運(yùn)行數(shù)據(jù)、3組斷煤故障、 1組自燃故障。不同故障的發(fā)展時(shí)間存在一定的差異,以磨煤機(jī)電機(jī)電流開始下降到停機(jī)為故障數(shù)據(jù)的時(shí)間范圍。數(shù)據(jù)集基本信息見表2。
表1 磨煤機(jī)故障預(yù)警系統(tǒng)選取的相關(guān)變量
Tab.1 The variables selected for the coal mill fault prediction system
表2 數(shù)據(jù)集基本信息
Tab.2 Basic information of the coal mill dataset
首先,將1組正常運(yùn)行數(shù)據(jù)和3組故障數(shù)據(jù)(斷煤故障I、II和1組自燃故障)作為訓(xùn)練數(shù)據(jù)集,建立預(yù)警模型。將斷煤故障III數(shù)據(jù)作為測(cè)試數(shù)據(jù)集。訓(xùn)練數(shù)據(jù)集占數(shù)據(jù)集的84%,用來建立磨煤機(jī)故障預(yù)警模型;測(cè)試數(shù)據(jù)集占數(shù)據(jù)集的16%,用來評(píng)價(jià)預(yù)警模型。
DBSCAN聚類的相關(guān)參數(shù)∈和MinPts無通用確定方法,通常根據(jù)所分析數(shù)據(jù)的特征進(jìn)行選取。MinPts取值過小會(huì)導(dǎo)致過多的簇,可采用ln()來確定[15],其中為數(shù)據(jù)點(diǎn)數(shù)?!实娜≈蹈鶕?jù)實(shí)際的聚類效果確定。本文仿真中∈和MinPts的取值分別為0.55和20。
在磨煤機(jī)故障數(shù)據(jù)集中,最終簇類數(shù)為9,用類標(biāo)記序列來描述各故障的類標(biāo)記分配情況。其中異常數(shù)據(jù)1類,類標(biāo)記為–1;正常運(yùn)行數(shù)據(jù)1類,類標(biāo)記為0;斷煤故障I數(shù)據(jù)3類,類標(biāo)記序列為(1,2,3);斷煤故障II數(shù)據(jù)為3類,類標(biāo)記序列為(1,6,7);自燃故障數(shù)據(jù)2類,類標(biāo)記序列為(4,5)。同時(shí)統(tǒng)計(jì)各故障下設(shè)備的剩余可用時(shí)間和各類數(shù)據(jù)包含的樣本數(shù)見表3,聚類結(jié)果如圖4所示。由表3和圖4可以看出,即使是相同的斷煤故障,其趨勢(shì)變化也有一定的區(qū)別。
表3 聚類數(shù)據(jù)包含的樣本數(shù)和對(duì)應(yīng)的剩余可用時(shí)間
Tab.3 The sample numbers in clustering data and the corresponding remaining usable time
磨煤機(jī)斷煤故障和自燃故障的初始階段(類標(biāo)記分別為1和4)包含的樣本數(shù)比其他階段更多。說明磨煤機(jī)的緩變故障在初期的變化緩慢,且會(huì)維持較長(zhǎng)的一段時(shí)間。當(dāng)磨煤機(jī)的故障經(jīng)過初始階段后,變化迅速,在特定階段維持時(shí)間較短。因此,若能在磨煤機(jī)故障的初始階段預(yù)測(cè)到故障的種類,讓現(xiàn)場(chǎng)人員有充足時(shí)間做出反應(yīng),則可以有效提升磨煤機(jī)運(yùn)行的安全性。
圖4 DBSCAN在數(shù)據(jù)集上的聚類結(jié)果
3.2.1評(píng)價(jià)指標(biāo)
對(duì)于二分類問題,可將樣本根據(jù)真實(shí)類別和分類器預(yù)測(cè)類別的組合劃分為真正例(true positive)、假正例(false positive)、真反例(true negative)、假反例(false negative)4種情形,4種類別的數(shù)量分別表示為P、P、N、N。分類結(jié)果的混淆矩陣(confusion matrix)見表4。
表4 混淆矩陣
Tab.4 The confusion matrix
為驗(yàn)證故障分類準(zhǔn)確性,定義
式中,為查準(zhǔn)率,為查全率,1值綜合考慮了查準(zhǔn)率和查全率。1值越高,則查準(zhǔn)率和查全率越高。
3.2.2預(yù)測(cè)結(jié)果和討論
各分類器在訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的1值見表5。由表5可見:在訓(xùn)練數(shù)據(jù)集,kNN預(yù)警模型和LDA預(yù)警模型的1值均小于0.9,顯著低于隨機(jī)森林預(yù)警模型和NB預(yù)警模型,說明隨機(jī)森林預(yù)警模型和NB預(yù)警模型在訓(xùn)練數(shù)據(jù)集上的學(xué)習(xí)能力更強(qiáng)。在測(cè)試數(shù)據(jù)集,隨機(jī)森林預(yù)警模型的1值高于其他3個(gè)分類器預(yù)警模型,表明隨機(jī)森林預(yù)警模型的泛化能力更強(qiáng)。
表5 各分類器在訓(xùn)練數(shù)據(jù)集和測(cè)試數(shù)據(jù)集的F1值
Tab.5 The F1 value of each classifier in training dataset and test dataset
圖5為各分類器預(yù)警模型在訓(xùn)練數(shù)據(jù)的預(yù)測(cè)結(jié)果。隨機(jī)森林預(yù)警模型和kNN預(yù)警模型在斷煤故障I的預(yù)測(cè)標(biāo)記序列為(1,2,3),在自燃故障的預(yù)測(cè)標(biāo)記序列為(4,5),在斷煤故障II上的預(yù)測(cè)標(biāo)記序列為 (1,6,7)。與實(shí)際一致。NB預(yù)警模型在斷煤故障I中出現(xiàn)誤報(bào),將斷煤故障預(yù)測(cè)成自燃故障,同時(shí)在自燃故障中存在嚴(yán)重的“跳躍”現(xiàn)象。LDA預(yù)警模型也存在誤報(bào)和“跳躍”現(xiàn)象,將斷煤故障II預(yù)測(cè)成自燃故障,在斷煤故障1中有短時(shí)間的來回“跳躍”??梢钥闯?,隨機(jī)森林預(yù)警模型相較于其他分離器預(yù)警模型,不僅準(zhǔn)確率高,也更加穩(wěn)定,沒有誤報(bào)和“跳躍”的情形。
圖5 各分類器預(yù)警模型在訓(xùn)練數(shù)據(jù)集的預(yù)測(cè)結(jié)果
3.2.3運(yùn)行數(shù)據(jù)驗(yàn)證
采用斷煤故障III作為驗(yàn)證數(shù)據(jù),檢驗(yàn)隨機(jī)森林預(yù)警模型的有效性。對(duì)于基于不同方法的磨煤機(jī)故障預(yù)警模型,當(dāng)磨煤機(jī)發(fā)生斷煤故障,其預(yù)測(cè)的標(biāo)記序列應(yīng)為(1,2,3)或(1,6,7)。若出現(xiàn)其他類標(biāo)記,如4或者5,則認(rèn)為出現(xiàn)了誤報(bào)。若中間樣本的類標(biāo)記預(yù)測(cè)為–1,表明該樣本受到噪音干擾,可繼續(xù)維持前一時(shí)刻的預(yù)測(cè)標(biāo)記,不認(rèn)為是誤報(bào)。
依次提取斷煤故障數(shù)據(jù)的相關(guān)變量,標(biāo)準(zhǔn)化后送入各分類器預(yù)警模型,最終的預(yù)測(cè)結(jié)果如圖6所示。由圖6可見,NB預(yù)警模型和LDA預(yù)警模型存在誤報(bào)現(xiàn)象和“跳躍”現(xiàn)象,而kNN預(yù)警模型在磨煤機(jī)斷煤故障早期存在“跳躍”現(xiàn)象。隨機(jī)森林預(yù)警模型的預(yù)測(cè)標(biāo)記序列為(0,1,2,3),預(yù)測(cè)該磨煤機(jī)斷煤故障數(shù)據(jù)屬于斷煤故障I,且不存在誤報(bào)和“跳躍”現(xiàn)象??梢钥闯觯疚奶岢龅碾S機(jī)森林預(yù)警模型,在實(shí)際應(yīng)用中優(yōu)于其他分類器預(yù)警模型。
圖6 各分類器預(yù)警模型對(duì)磨煤機(jī)斷煤故障的預(yù)測(cè)結(jié)果
隨機(jī)森林預(yù)警模型估計(jì)的設(shè)備剩余可用時(shí)間見表6。在斷煤故障類標(biāo)記為1的階段,實(shí)際的設(shè)備剩余可用時(shí)間在模型估計(jì)的剩余可用時(shí)間范圍內(nèi)。但是在斷煤故障類標(biāo)記為2和3的階段,實(shí)際設(shè)備剩余可用時(shí)間大于模型估計(jì)的設(shè)備剩余可用時(shí)間,但是量級(jí)一致,預(yù)測(cè)較為保守。
表6 隨機(jī)森林預(yù)警模型估計(jì)的磨煤機(jī)剩余可用時(shí)間
Tab.6 The remaining usable time of each cluster label for coal breakdown fault
1)利用DBSCAN方法對(duì)磨煤機(jī)故障進(jìn)行聚類分析,可以將故障發(fā)展過程劃分為不同的類,方便描述故障發(fā)展的不同階段。仿真結(jié)果表明磨煤機(jī)斷煤和自燃故障在初始階段變化較緩慢,后期變化迅速。
2)與基于k-近鄰算法、樸素貝葉斯和線性判別分析的預(yù)警模型相比,隨機(jī)森林預(yù)警模型可準(zhǔn)確標(biāo)記磨煤機(jī)不同故障發(fā)展階段,對(duì)磨煤機(jī)剩余可用時(shí)間也能給出較準(zhǔn)確的預(yù)估
[1] CAI J, FERDOWSI H, SARANGAPANI J. Model-based fault detection, estimation, and prediction for a class of linear distributed parameter systems[J]. Automatica, 2016, 66: 122-131.
[2] 薛涵磊, 劉曉琴. 基于模型預(yù)測(cè)方法的電網(wǎng)故障預(yù)測(cè)[J]. 遼寧石油化工大學(xué)學(xué)報(bào), 2017, 37(2): 60-65. XUE Hanlei, LIU Xiaoqin. Power grid fault forecast based on model prediction method[J]. Journal of Liaoning University of Petroleum & Chemical Technology, 2017, 37(2): 60-65.
[3] SOUALHI A, CLERC G, RAZIK H, et al. Hidden Markov models for the prediction of impending faults[J]. IEEE Transactions on Industrial Electronics, 2016, 63(5): 3271-3281.
[4] DING B, FANG H. Fault prediction for nonlinear stochastic system with incipient faults based on particle filter and nonlinear regression[J]. ISA Transactions, 2017, 68: 327-334.
[5] MA J, XU J. Fault prediction algorithm for multiple mode process based on reconstruction technique[J]. Mathematical Problems in Engineering, 2015, 1: 1-8.
[6] 陳園藝, 孫建平. 基于PSO-SVR和SPC的風(fēng)電機(jī)組齒輪箱故障預(yù)警研究[J]. 電力科學(xué)與工程, 2016, 32(5): 43-48. CHEN Yuanyi, SUN Jianping. Research on fault early warning of wind turbine gear box based on PSO-SVR and SPC[J]. Electric Power Science and Engineering, 2016, 32(5): 43-48.
[7] ZHANG B, YIN X, WANG Z, et al. A BRB based fault prediction method of complex electromechanical systems[J]. Mathematical Problems in Engineering, 2015, 1: 1-8.
[8] TIAN W, HU M, LI C, et al. Fault prediction based on dynamic model and grey time series model in chemical processes[J]. Chinese Journal of Chemical Engineering, 2014, 22(6): 643-650.
[9] 陸寧云, 何克磊, 姜斌, 等. 一種基于貝葉斯網(wǎng)絡(luò)的故障預(yù)測(cè)方法[J]. 東南大學(xué)學(xué)報(bào)(自然科學(xué)版), 2012, 42(增刊1): 87-91. LU Ningyun, HE Kelei, JIANG Bin, et al. A fault prognosis method using Bayesian network[J]. Journal of Southeast University (Natural Science Edition), 2012, 42(Suppl.1): 87-91.
[10] RAKI? A ?. Early fault detection and isolation in coal mills based on self-organizing maps[C]//10th Symposium on Neural Network Applications in Electrical Engineering. Belgrade: IEEE, 2010: 45-48.
[11] CHEN X, WANG P, HAO Y, et al. Evidential KNN-based condition monitoring and early warning method with application in power plant[J]. Neurocomputing, 2018, 315: 18-32.
[12] LIU J, GENG G. Fault prediction for power plant equipment based on support vector regression[C]//International Symposium on Computational Intelligence and Design. Hangzhou: IEEE, 2016: 461-464.
[13] 劉暢. 電站設(shè)備輔機(jī)狀態(tài)監(jiān)測(cè)與故障診斷[D]. 北京: 華北電力大學(xué), 2017: 13-17. LIU Chang. Condition monitoring and fault diagnosis of auxiliary equipment in power plant[D]. Beijing: North China Electric Power University, 2017: 13-17.
[14] BREIMAN L. Random forests[J]. Machine Learning, 2001, 45(1): 5-32.
[15] ESTER M, KRIEGEL H P, XU X. A density-based algorithm for discovering clusters in large spatial databases with noise[C]//The 2nd International Conference on Knowledge Discovery and Data Mining. California: AAAI Press, 1996: 226-231.
Research on coal mill fault prediction based on semi-supervised learning method
XIAO Li1, LUO Jia1, OUYANG Chunming2
(1. Guangdong Diankeyuan Energy Technology Co., Ltd., Guangzhou 510080, China; 2. Electric Power Research Institute of Guangdong Power Grid Co., Ltd., Guangzhou 510080, China)
In thermal power plants, the operating environment of coal mills is harsh and faults in coal mills occur frequently. Early warning of the coal mill failures and evaluating remaining usable time of the devices under relevant fault conditions is of great significance to improving the safety of thermal power plants. This paper proposes a novel coal mill fault prediction technology based on semi-supervised learning method. Firstly, the DBSCAN clustering is applied to divide the history data of the coal mill into normal states and fault states. Different class labels are assigned to different states and the remaining usable time of the equipment is counted. Then, the random forest classifier is used to establish a fault prediction model for the coal mill according to the class label sequence, the state of the coal mill operating data is predicted, and the fault category and corresponding equipment remaining usable time are determined. Finally, this method is applied in a thermal power unit by using the actual running data of the coal mills, and the prediction result is compared with that of the early warning models of other classification algorithms such as k- nearest neighbor algorithm, naive Bayes and linear discriminant analysis. The experimental results show that, this method is superior to other early warning models, which can accurately mark the different development stages of the mill faults and give the remaining available time of the mills more accurately.
coal mill, DBSCAN clustering, fault prediction, random forest, semi-supervised learning method, prediction
Science and Technology Project of China Southern Power Grid Co., Ltd. (GDKJQQ20152014)
TK223; TP273
B
10.19666/j.rlfd.201807134
肖黎, 羅嘉, 歐陽春明. 基于半監(jiān)督學(xué)習(xí)方法的磨煤機(jī)故障預(yù)警[J]. 熱力發(fā)電, 2019, 48(4): 121-127. XIAO Li, LUO Jia, OUYANG Chunming. Research on coal mill fault prediction based on semi-supervised learning method[J]. Thermal Power Generation, 2019, 48(4): 121-127.
2018-07-21
中國(guó)南方電網(wǎng)有限責(zé)任公司科技項(xiàng)目(GDKJQQ20152014)
肖黎(1989—),男,博士,主要研究方向?yàn)殡姀S熱工自動(dòng)控制,361944474@qq.com。
(責(zé)任編輯 杜亞勤)