景亞杰, 董鴻霖, 韋志康, 楊 旭
(1. 江蘇方天電力技術(shù)有限公司, 南京 211102; 2. 東南大學(xué) 能源與環(huán)境學(xué)院, 南京 210096)
由于熱工過(guò)程數(shù)據(jù)具有高維度、高噪聲、高時(shí)滯性、多擾動(dòng)的特點(diǎn),目前熱工過(guò)程數(shù)學(xué)模型的故障檢測(cè)方法常用于穩(wěn)態(tài)熱工過(guò)程的故障檢測(cè)及診斷,對(duì)于動(dòng)態(tài)過(guò)程沒(méi)有特別好的檢測(cè)效果。對(duì)熱工過(guò)程的故障檢測(cè)及診斷一般采用基于數(shù)據(jù)驅(qū)動(dòng)的算法。主成分分析(PCA)法是一種簡(jiǎn)單高效的多元統(tǒng)計(jì)方法,并被廣泛應(yīng)用于工業(yè)過(guò)程的過(guò)程監(jiān)控和故障診斷中。KU W F等[1]考慮到傳統(tǒng)PCA法往往難以滿(mǎn)足熱工過(guò)程的動(dòng)態(tài)特性影響,提出了動(dòng)態(tài)主成分分析(DPCA)法,通過(guò)用帶有時(shí)滯性的變量構(gòu)造出動(dòng)態(tài)數(shù)據(jù)矩陣后,利用PCA技術(shù)提取相關(guān)主成分及殘差的方法以提高故障診斷及檢測(cè)的精確度。
在PCA法中,大量的非零元素出現(xiàn)在主成分向量及殘差向量中,不利于特征值的解釋和提取,并且熱工數(shù)據(jù)中噪聲的影響也較難剔除。雖然DPCA法能夠捕捉熱工過(guò)程的動(dòng)態(tài)特性,但是其通過(guò)構(gòu)造出高維矩陣,進(jìn)一步增加了主成分向量中噪聲的影響,降低了故障診斷及檢測(cè)的精確度。稀疏主成分分析(SPCA)法是在PCA法的基礎(chǔ)上,通過(guò)稀疏化PCA的主成分向量降低噪聲的影響,并增加主成分的可解釋性,從而提高故障的檢測(cè)正確率。
筆者結(jié)合DPCA法的動(dòng)態(tài)優(yōu)點(diǎn)和SPCA法的降噪特性,提出一種基于動(dòng)態(tài)稀疏主成分分析(DSPCA)的熱工過(guò)程故障檢測(cè)方法。DSPCA法先通過(guò)計(jì)算動(dòng)態(tài)熱工數(shù)據(jù)的滯后因子,構(gòu)造其增廣矩陣,再通過(guò)彈性網(wǎng)懲罰函數(shù)獲取稀疏主成分。筆者通過(guò)建立檢驗(yàn)統(tǒng)計(jì)量進(jìn)行故障診斷及檢測(cè),對(duì)仿真數(shù)據(jù)和現(xiàn)場(chǎng)數(shù)據(jù)進(jìn)行驗(yàn)證。
PEARSON K[2]于1901年提出PCA的概念,其基本思想是以有限長(zhǎng)度的多維變量時(shí)間序列構(gòu)成的數(shù)據(jù)矩陣為基礎(chǔ),進(jìn)行矩陣運(yùn)算后確定若干正交向量,歷史數(shù)據(jù)在正交向量上的投影反映數(shù)據(jù)變化最大的若干方向,舍去變化較小的幾個(gè)方向,便可將高維數(shù)據(jù)降維表示。采集正常工況下的過(guò)程數(shù)據(jù)組成的矩陣X為:
(1)
式中:xij為第j個(gè)樣本的第i次測(cè)量,i=1,2,…,n(n為測(cè)量次數(shù)),j=1,2,…,m(m為樣本數(shù))。
對(duì)X進(jìn)行標(biāo)準(zhǔn)化處理,得到標(biāo)準(zhǔn)化矩陣Xs為:
(2)
xav=(xav,1,xav,2,…,xav,m)
式中:xav,j為第j個(gè)樣本的測(cè)量平均值;sj為xav,j對(duì)應(yīng)的標(biāo)準(zhǔn)差。
計(jì)算系數(shù)矩陣R為:
(3)
求出X的m個(gè)特征值,并將特征值按照從大到小的順序排列為λ1,λ2,…,λm,得到排列后的特征值矩陣Λm為:
Λm=diag(λ1,λ2,…,λm)
(4)
根據(jù)特征值可以求出特征值對(duì)應(yīng)的特征向量。在實(shí)際應(yīng)用中,根據(jù)方差的累積貢獻(xiàn)率來(lái)選取主成分?jǐn)?shù)。
對(duì)Xs進(jìn)行分解得到:
Xs=T×PT+Es
(5)
T=X×P
式中:P為主成分子空間負(fù)荷矩陣;T為得分矩陣;Es為殘差矩陣。
動(dòng)態(tài)系統(tǒng)的狀態(tài)變量是時(shí)間函數(shù),系統(tǒng)狀態(tài)由其狀態(tài)變量隨時(shí)間變化的信息來(lái)描述,狀態(tài)變量具有持續(xù)性。但是,熱工過(guò)程的大部分?jǐn)?shù)據(jù)是動(dòng)態(tài)或準(zhǔn)穩(wěn)態(tài)的,DPCA法可彌補(bǔ)PCA法在捕捉動(dòng)態(tài)數(shù)據(jù)關(guān)系上的不足。DPCA法將采樣數(shù)據(jù)的變量作為新的增廣矩陣的變量,然后用PCA法降維,以減弱變量間的相關(guān)性。
將X的m維降為t維后,可得到降維后的矩陣Xt為:
(6)
將Xt擴(kuò)展為滯后因子為h的增廣矩陣Xt-h,得到:
(7)
通過(guò)假設(shè)求出的靜態(tài)關(guān)系數(shù)為:
(8)
式中:r(·)為靜態(tài)關(guān)系數(shù);rnew(·)為更新后的靜態(tài)關(guān)系數(shù);a為迭代計(jì)算次數(shù)。直到rnew(h)≤0,對(duì)應(yīng)的h即為所選擇的滯后因子。
ZOU H等[3]將主成分的求解問(wèn)題轉(zhuǎn)化為L(zhǎng)asso回歸問(wèn)題,并引入彈性網(wǎng)作為其懲罰結(jié)構(gòu),并提出了SPCA法。SPCA法在傳統(tǒng)的PCA法的基礎(chǔ)上進(jìn)一步稀疏化載荷矩陣,在準(zhǔn)確提取數(shù)據(jù)信息的前提下使主成分向量每一列中非零元素最少。目前,共有3種主流的SPCA法模型[4],即基于嶺回歸的SPCA法模型,基于彈性網(wǎng)回歸的SPCA法模型和基于Lasso回歸的SPCA法模型。
基于彈性網(wǎng)回歸的SPCA法模型比基于Lasso回歸和嶺回歸的SPCA法模型具有更好的性能,其稀疏主成分具有唯一解,不會(huì)陷入到局部最小,提高了模型的精度,同時(shí)收斂速度快,易于實(shí)現(xiàn)在線(xiàn)監(jiān)測(cè),所以筆者使用基于彈性網(wǎng)回歸的SPCA法模型,具體算法可參考文獻(xiàn)[4]。
關(guān)于SPCA法中每個(gè)主成分向量的非零元素的確定,目前多數(shù)研究者認(rèn)為當(dāng)SPCA法與PCA法計(jì)算出的每個(gè)主成分的解釋方差相近時(shí),非零元素可以在此基礎(chǔ)上適當(dāng)增加以最大化稀疏主成分,筆者選擇了GAJJAR S等[5]提出的前向選擇算法來(lái)確定每個(gè)主成分向量的非零元素的數(shù)目。
在進(jìn)行工業(yè)過(guò)程監(jiān)測(cè)時(shí),T2統(tǒng)計(jì)量、Q統(tǒng)計(jì)量及綜合指標(biāo)f常被用于故障檢測(cè),T2統(tǒng)計(jì)量衡量樣本向量在主空間投影的變化,Q統(tǒng)計(jì)量衡量樣本向量在殘差子空間投影的變化,綜合指標(biāo)是T2統(tǒng)計(jì)量和Q統(tǒng)計(jì)量的綜合體現(xiàn),具體計(jì)算公式為:
(9)
Λ=diag(λ1,λ2,…,λk)
(10)
ei=xsi-PPTxsi
式中:QSPE,i為數(shù)據(jù)集第i次的Q統(tǒng)計(jì)量構(gòu)成的矩陣;ei為觀(guān)測(cè)向量的殘差向量。
(11)
綜合指標(biāo)的控制限fucl為:
(12)
式中:Kα為卡方分布在置信度為α下的閾值;I為m行m列的單位矩陣。
結(jié)合DPCA法的動(dòng)態(tài)優(yōu)點(diǎn)和SPCA法的降噪特性,提出一種基于DSPCA的熱工過(guò)程故障診斷及檢測(cè)方法,該方法先通過(guò)計(jì)算動(dòng)態(tài)熱工數(shù)據(jù)的滯后因子,構(gòu)造其增廣矩陣,再通過(guò)基于彈性網(wǎng)回歸的SPCA法獲取稀疏主成分,通過(guò)Q統(tǒng)計(jì)量、T2統(tǒng)計(jì)量及綜合指標(biāo)對(duì)測(cè)試數(shù)據(jù)進(jìn)行故障診斷及檢測(cè)。DSPCA法步驟為:
(1) 對(duì)X進(jìn)行標(biāo)準(zhǔn)化處理得到Xs,按列對(duì)其進(jìn)行零均值和標(biāo)準(zhǔn)方差處理。
(2) 求滯后因子,得到Xs的增廣矩陣。
(3) 計(jì)算增廣矩陣的協(xié)方差矩陣。
(4) 計(jì)算協(xié)方差矩陣的特征向量和特征值。
(5) 根據(jù)方差的累積貢獻(xiàn)率計(jì)算其主成分?jǐn)?shù),一般選擇方差的累積貢獻(xiàn)率為85%(有時(shí)也取80%和90%,視實(shí)際情況而定)。
(6) 根據(jù)基于彈性網(wǎng)回歸的SPCA法以及前向選擇算法算出P。
(7) 求出Q統(tǒng)計(jì)量、T2統(tǒng)計(jì)量及綜合指標(biāo),即可得到DSPCA法的故障檢測(cè)模型。
仿真數(shù)據(jù)采用文獻(xiàn)[1]中的模型,系統(tǒng)輸入變量為:(1)均值為0、方差為1的白噪聲;(2)均值為0、方差為0.1的白噪聲。輸入矩陣和輸出矩陣均為可測(cè)二維變量矩陣。采集模型在正常情況下的100個(gè)樣本用于建模。在測(cè)試數(shù)據(jù)的第11個(gè)數(shù)據(jù)引入故障,故障1為在輸入矩陣的第1行添加1個(gè)單位階躍,故障2為在輸入矩陣的第2行添加1個(gè)幅度為3的階躍。數(shù)據(jù)的測(cè)試結(jié)果見(jiàn)圖1,曲線(xiàn)U1和U2代表輸入矩陣的第1行和第2行數(shù)據(jù),曲線(xiàn)Y1和Y2代表輸出矩陣的第1行和第2行數(shù)據(jù)。第1~100個(gè)測(cè)試數(shù)據(jù)為正常情況下的數(shù)據(jù),第101~200個(gè)測(cè)試數(shù)據(jù)對(duì)應(yīng)故障1的作用范圍,第201~300個(gè)測(cè)試數(shù)據(jù)對(duì)應(yīng)故障2的作用范圍。
圖1 數(shù)據(jù)的測(cè)試結(jié)果
取方差的累積方差貢獻(xiàn)率為85%,得到主成分?jǐn)?shù)為3,分別使用PCA法、DPCA法和SPCA法對(duì)測(cè)試數(shù)據(jù)進(jìn)行故障檢測(cè),具體結(jié)果見(jiàn)圖2(虛線(xiàn)為檢測(cè)的控制限,下同)和表1。
圖2 PCA法、DPCA法和SPCA法的檢測(cè)結(jié)果
表1 PCA法、DPCA法和SPCA法的檢測(cè)正確率對(duì)比
由表1可得:SPCA法的Q統(tǒng)計(jì)量和綜合指標(biāo)的檢測(cè)正確率相較于PCA法和DPCA法大大提高。為進(jìn)一步捕捉數(shù)據(jù)動(dòng)態(tài)特性,最后使用DSPCA法進(jìn)行檢測(cè),結(jié)果見(jiàn)圖3和表2。
圖3 DSPCA法的故障檢測(cè)結(jié)果
表2 DSPCA法的檢測(cè)正確率
從表1和表2可以看出:與PCA法、DPCA法和SPCA法相比,DSPCA法更進(jìn)一步提高了故障檢測(cè)正確率,對(duì)于動(dòng)態(tài)數(shù)據(jù)的故障檢測(cè)具有最優(yōu)的效果。
高壓加熱器位于給水泵和省煤器之間,是回?zé)崾狡啓C(jī)最重要的組成之一。利用汽輪機(jī)的部分抽汽對(duì)給水進(jìn)行加熱,可提高汽輪機(jī)組運(yùn)行效率。高壓加熱器發(fā)生故障會(huì)導(dǎo)致回?zé)嵯到y(tǒng)傳熱效率下降,嚴(yán)重時(shí)會(huì)對(duì)機(jī)組安全運(yùn)行造成影響。為了保障機(jī)組運(yùn)行的經(jīng)濟(jì)性和安全性,需要時(shí)刻對(duì)高壓加熱器運(yùn)行狀態(tài)進(jìn)行監(jiān)視,當(dāng)高壓加熱器發(fā)生故障時(shí)能及時(shí)發(fā)現(xiàn)并進(jìn)行有效的檢測(cè),防止損失擴(kuò)大。目前,高壓加熱器最常見(jiàn)的故障為高壓加熱器管系泄漏及高壓加熱器管結(jié)垢堵塞。筆者針對(duì)發(fā)生率更高、危害更大的高壓加熱器管系泄漏故障進(jìn)行研究。
采用某電廠(chǎng)600 MW機(jī)組高壓加熱器運(yùn)行過(guò)程中的相關(guān)數(shù)據(jù)[6]進(jìn)行仿真建模,并用發(fā)生泄漏前后的數(shù)據(jù)對(duì)模型準(zhǔn)確性進(jìn)行驗(yàn)證。以某級(jí)高壓加熱器為例,相關(guān)測(cè)點(diǎn)參數(shù)包括:鍋爐給水流量,該級(jí)高壓加熱器的進(jìn)口給水的溫度、壓力及出口給水的溫度、壓力,該級(jí)高壓加熱器對(duì)應(yīng)的抽汽壓力和抽汽溫度,該級(jí)高壓加熱器液位高度,上一級(jí)高壓加熱器的疏水溫度和疏水流量,汽輪機(jī)功率。
高壓加熱器泄漏分為凝結(jié)段泄漏、疏水冷卻段泄漏和蒸汽冷卻段泄漏,高壓加熱器發(fā)生泄漏后,都會(huì)導(dǎo)致疏水流量顯著增大。該機(jī)組的3號(hào)高壓加熱器曾發(fā)生泄漏,檢修后發(fā)現(xiàn)有6根管道泄漏,隨后對(duì)其進(jìn)行了封堵。從廠(chǎng)級(jí)監(jiān)控信息系統(tǒng)(SIS)數(shù)據(jù)庫(kù)中提取在3號(hào)高壓加熱器泄漏前,相關(guān)測(cè)點(diǎn)在5日內(nèi)的數(shù)據(jù),采樣時(shí)間間隔是5 min。采樣時(shí)間間隔太短,會(huì)增加運(yùn)營(yíng)成本,采樣時(shí)間間隔太長(zhǎng),無(wú)法準(zhǔn)確提取到每個(gè)時(shí)刻傳感器所測(cè)變量的狀態(tài),所以采樣時(shí)間間隔應(yīng)該綜合考慮經(jīng)濟(jì)性和測(cè)量有效性后進(jìn)行選取。對(duì)于600 MW機(jī)組,合適的采樣時(shí)間間隔一般為5 min。經(jīng)過(guò)動(dòng)態(tài)判定后獲得部分連續(xù)數(shù)據(jù),共有300組,對(duì)其進(jìn)行建模,以發(fā)生故障當(dāng)天的數(shù)據(jù)作為故障樣本,基于DSPCA對(duì)模型進(jìn)行驗(yàn)證,該案例模型的滯后因子為1、主成分?jǐn)?shù)為3,得到的故障檢測(cè)結(jié)果見(jiàn)圖4。
圖4 現(xiàn)場(chǎng)試驗(yàn)基于DSPCA的故障檢測(cè)結(jié)果
由圖4可得:在電廠(chǎng)檢測(cè)到高壓加熱器泄漏并對(duì)其進(jìn)行切除檢修之前,該模型就已經(jīng)檢測(cè)到了較為明顯的故障,即在電廠(chǎng)檢測(cè)到該故障發(fā)生6 h前就檢測(cè)到了該故障,表明筆者所建立的故障檢測(cè)模型具有較強(qiáng)的故障敏感性和準(zhǔn)確性,能夠在早期檢測(cè)出高壓加熱器管系泄漏。
筆者提出了基于DSPCA的熱工過(guò)程故障檢測(cè)方法,最大程度降低噪聲的影響,提取出歷史數(shù)據(jù)中最有用的信息。仿真算例結(jié)果表明:該方法對(duì)熱工過(guò)程數(shù)據(jù)具有較強(qiáng)的針對(duì)性,針對(duì)高壓給水加熱器常見(jiàn)的管系泄漏故障有較高的檢測(cè)正確率。