王印松,吳軍超
(華北電力大學控制與計算機工程學院,河北 保定 071003)
氣動調節(jié)閥是工業(yè)控制回路中應用十分廣泛的終端執(zhí)行設備,其主要功能是根據(jù)控制回路中控制器的輸出信號,調節(jié)工藝中流經調節(jié)閥介質的流量或壓力。氣動調節(jié)閥具有結構簡單、性能穩(wěn)定、維修方便、價格便宜等優(yōu)點,被廣泛的應用于電力、化石、冶金等行業(yè)。氣動調節(jié)閥與生產工藝緊密相關,自身由于頻繁的機械運動及常年工作在高壓、高溫、強腐蝕、易漏或易堵等惡劣工況下,經常會出現(xiàn)各種異常和故障。在氣動調節(jié)閥的維護中,如果僅僅根據(jù)經驗進行維修或者替換,費時費力,所以亟需采用智能診斷方法對氣動調節(jié)閥進行故障診斷,使得維護更加具有針對性,提高維修效率[1]。
多位學者對氣動調節(jié)閥的故障診斷進行了深入研究,目前對氣動調節(jié)閥的故障診斷研究主要可以分為兩類,基于機理模型的方法和基于數(shù)據(jù)驅動的方法。基于機理模型的方法是通過系統(tǒng)辨識為調節(jié)閥建立動態(tài)的數(shù)學模型,當調節(jié)閥出現(xiàn)故障時,模型的輸入輸出變量就會改變,通過觀測模型參數(shù)的變化就能判斷是否有故障發(fā)生以及故障發(fā)生的位置。文獻[2]從動力學、熱力學、機械運動等數(shù)學角度出發(fā)對氣動調節(jié)閥進行建模,運用狀態(tài)估計的方法重構調節(jié)閥的運行狀態(tài),將估計值與測量值進行比較構成殘差序列,通過對殘差值的統(tǒng)計分析判斷是否有故障發(fā)生?;跈C理模型的方法一般存在較大的困難,如果建模對象是非線性的,那么不易對其建模,并且模型的精確度也得不到保證??紤]氣動調節(jié)閥存在粘滯特性,并且包含多種非線性因素,在進行數(shù)學機理建模時涉及到很多參數(shù)的動態(tài)特性,很難建立較精確的氣動調節(jié)閥數(shù)學模型?;跀?shù)據(jù)驅動的方法運用各種方法對過程現(xiàn)場的數(shù)據(jù)進行建模分析,從而達到故障診斷的目的。文獻[3]提出了基于神經網(wǎng)絡的氣動調節(jié)閥故障診斷方法,文獻[4]提出了基于最小二乘支持向量機的氣動調節(jié)閥故障診斷方法。由于基于數(shù)據(jù)驅動的氣動調節(jié)閥故障診斷算法不需要建立精確的數(shù)學模型,可直接根據(jù)采集的數(shù)據(jù)進行分析,但文獻[3-4]中的方法均需要訓練大量的數(shù)據(jù),且算法復雜。貝葉斯分類方法根據(jù)貝葉斯公式計算得出后驗概率,把具有最大后驗概率的類作為該屬性的類,這種方法巧妙地把先驗概率和后驗概率聯(lián)系起來,根據(jù)先驗信息和樣本集確定分類。貝葉斯分類算法原理簡單,計算過程中所需的參數(shù)易計算,文獻[5-6]將這種方法應用于巖性分類中,文獻[7]將其應用于光譜分類中,均取得較好的分類效果。
基于以上分析,本文從數(shù)據(jù)驅動角度出發(fā),將貝葉斯分類方法與PCA結合,對所監(jiān)測的信號數(shù)據(jù)集經過PCA處理,降低數(shù)據(jù)集的維度,采用貝葉斯分類方法判斷每個測試集數(shù)據(jù)樣本所屬的故障類型,將所提方法與SVM和k-NN這兩種方法進行對比,驗證了所提方法的可行性。
DAMADICS仿真平臺是在實際氣動調節(jié)閥的研究基礎上開發(fā)出來,用于評價故障檢測與故障診斷算法的一個平臺[8],該平臺考慮到工業(yè)現(xiàn)場典型氣動調節(jié)閥詳細的物理和電器結構特性,充分仿真氣動調節(jié)閥的工作狀態(tài)。如圖1所示,該平臺的氣動調節(jié)閥由氣動執(zhí)行機構、調節(jié)結構、閥門定位器和一些附件組成。執(zhí)行機構將控制器輸出信號轉換成控制閥的推力,由推力力矩進一步轉化為角位移信號。調節(jié)機構將位移信號轉換為流通面積的變化,從而影響流體流量。閥門定位器可以改善控制系統(tǒng)功能,與閥桿位移量組成副回路控制,克服摩擦力、不平衡力和回差干擾。
圖1中主要有6種信號,分別為控制器的輸出信號CV、閥門入口處壓強P1、閥門出口處壓強P2、流體溫度T1、流體流速F和閥桿位移x。文中主要采集這6種信號進行故障診斷,簡化后如圖2所示。
圖1 氣動調節(jié)閥基本結構
圖2 簡化后的調節(jié)閥模型
氣動調節(jié)閥內部結構較為復雜,組成氣動調節(jié)閥的執(zhí)行機構、閥體、定位器以及與之相連的附件裝置均有可能發(fā)生故障。故障發(fā)生時,氣動調節(jié)閥動作會發(fā)生異常,這些異常主要表現(xiàn)為閥位、流量等信號的異常。利用DAMADICS仿真平臺可以仿真氣動調節(jié)閥19種故障,具體見表1。本文研究的故障類型的選取主要考慮兩個方面:1)考慮到氣動調節(jié)閥衰減型故障和快變型故障包含許多不確定性,并處于不穩(wěn)定狀態(tài),不適合進行故障診斷,因此在之后的故障診斷中只考慮突變型故障;2)考慮每種故障實際生產中發(fā)生可能性的大小。因此,本文主要研究f1閥門堵塞故障、f7流體過熱蒸發(fā)或臨界流故障、f8執(zhí)行機構推桿扭曲故障、f10膜頭穿孔故障和f15定位器反饋故障這5種故障。
PCA是一種常用的數(shù)據(jù)集降低維度的方法[9]。當選取的數(shù)據(jù)集維數(shù)較高,可以通過PCA方法將其向低維數(shù)轉化。
假設進行故障診斷需要監(jiān)測m種信號,其中第k種監(jiān)測信號為xk,則組成的監(jiān)測信號數(shù)據(jù)集的單個樣本x可以表示為:
表1 故障描述
每單個樣本x均對應著氣動調節(jié)閥的故障類型,如閥門堵塞故障、定位器反饋故障。假設數(shù)據(jù)集中選取了n個樣本,進而組成了樣本矩陣X:
目標將數(shù)據(jù)集維度由m維降低到d維度,其中m>d。首先按照下式對所有樣本進行中心化:
樣本矩陣中心化處理后,計算處理后的樣本矩陣的協(xié)方差矩陣XTX,并對協(xié)方差矩陣XTX做特征值分解,獲取協(xié)方差矩陣的特征值對角矩陣和特征向量矩陣。取最大的d個特征值所對應的特征向量w1,w2,…,wd,組成降維完成后的投影矩陣W*:
其中,d的選取可根據(jù)累計方差百分比方法確定。
貝葉斯分類方法是概率框架下進行類別判斷的基本方法,對于分類任務來說,通過似然概率和先驗概率取推斷后驗概率,根據(jù)后驗概率的大小來進行分類[10]。
假設氣動調節(jié)閥中有q種故障類型,第i種故障類型為:mi(1≤i≤q)。則所有的故障類型可以組成集合M:
氣動調節(jié)閥故障診斷的主要任務是:對于輸入進故障診斷模型的測試集樣本x*,計算出后驗概率P(mi|x*),其中mi∈M。
根據(jù)貝葉斯定理,P(mi|x*)可以寫為:
其中,P(mi)為故障類型的先驗概率;P(x*|mi)為信號樣本x*相對于故障類型mi的條件概率,或者稱似然概率;P(x*)為用于歸一化的縮放因子。對于給定樣本,縮放因子與所屬故障類型mi無關,因此先驗概率P(mi)估計P(mi|x*)的問題就轉化為如何估計先驗概率P(mi)和似然概率P(x*|mi)。
對于先驗概率P(mi),氣動調節(jié)閥中有q種故障類型,假設第i種故障類型mi的訓練數(shù)據(jù)集樣本個數(shù)為numi,則有:
對于似然概率P(x*|mi),連續(xù)屬性可考慮概率密度函數(shù),假設經過PCA處理后的氣動調節(jié)閥特征信號符合多元高斯分布,根據(jù)訓練數(shù)據(jù)集來估計所滿足的多元高斯分布的均值和協(xié)方差。
若訓練數(shù)據(jù)集中有n個訓練數(shù)據(jù)樣本x,對應似然函數(shù)為:
其中:
所需要求取的參數(shù)為:
應用極大似然估計,可得:
根據(jù)訓練數(shù)據(jù)集估計出μ*和Σ?后,計算測試數(shù)據(jù)集中的每一個測試樣x*相對于故障類型mi的條件概率P(x*|mi):
計算得出故障類型的先驗概率和似然概率,根據(jù)式(6),便可以得到后驗概率,其中后驗概率值最大所對應的mi即為x*對應的故障類型。
基于PCA和貝葉斯分類方法的具體流程如圖3所示。
圖3 故障診斷流程圖
首先,在DAMADICS仿真平臺上獲取各種故障的監(jiān)測信號數(shù)據(jù)集。仿真過程中,所有的輸入輸出信號均摻雜了有限帶寬的白噪聲干擾,白噪聲中還疊加了電磁干擾,使得仿真過程更能模擬一個相對真實的噪聲環(huán)境,具體參數(shù)設置如表2所示。
各種故障的仿真結果經過歸一化處理后,用于故障診斷的各個監(jiān)測信號變化情況如圖4所示,受故障發(fā)生的影響,不同故障模式下的監(jiān)測信號表現(xiàn)出不同的特征。
利用DAMADICS仿真平臺,產生5種故障的訓練集和測試集,其中每種故障中,訓練集選取200個樣本,測試集選取500個樣本。將數(shù)據(jù)進行PCA處理后,原始6維的數(shù)據(jù)被降為2維時,其成分總和在所有成分中的貢獻率總和為91.163 5%,表明原始6維數(shù)據(jù)可以用2維數(shù)據(jù)來表示。經過PCA處理后的訓練數(shù)據(jù)集的二維分布如圖5所示。
表2 仿真參數(shù)設置
圖4 各種故障發(fā)生時監(jiān)測信號變化情況
圖5 PCA處理后訓練集分布情況
將PCA處理后的訓練數(shù)據(jù)集用來訓練貝葉斯分類器,獲取每種故障訓練數(shù)據(jù)集的均值和協(xié)方差。將測試數(shù)據(jù)集的樣本輸入貝葉斯分類診斷模型,由于每種故障選取的訓練數(shù)據(jù)集樣本個數(shù)是相等的,故每種故障發(fā)生的先驗概率相同。計算測試數(shù)據(jù)集中每個樣本相對于故障類型的似然概率,似然概率越高,對應的故障類型發(fā)生的可能性就越大。以故障f10為例,隨機選取故障f10測試集中的10個樣本,似然概率如圖6所示,其中P1、P7、P8、P10、P15分別為樣本發(fā)生故障f1、f7、f8、f10、f15的似然概率。
圖6 故障f10部分測試樣本的似然概率
將所有測試集進行診斷,多種方法的故障診斷結果如表3所示。
從表中可以看出,與SVM、k-NN相比,整體上,基于貝葉斯分類方法的診斷性能較高,故障f8執(zhí)行機構推桿扭曲故障的預測準確度較低,而故障f7流體過熱蒸發(fā)或臨界流的診斷準確度達到了100%。究其原因,是因為故障f8與其他故障的癥狀類似,不易分離。而故障f7與其他故障的癥狀極易分離。從圖6中可以看出,隨機選取的故障10部分測試樣本中,大部分的診斷結果正確。而在樣本4、7、9中,診斷結果最有可能發(fā)生的故障為故障f1,其次為故障f10。雖然診斷結果錯誤,但按照方法可確定檢查故障的次序,檢查出氣動調節(jié)閥未發(fā)生故障f1,接下來可檢查是否發(fā)生故障f10,大大提高了確定故障源的速度。
表3 結果準確度對比 %
分析以上3種算法的原理,SVM算法[11]應用于多故障分類中,需要構造多個分類器,計算時間長;k-NN算法[12]中因為對每一個待分類的文本都要計算它到全體已知樣本的距離,才能求得它的k個最近鄰點,計算量大、內存開銷大,而貝葉斯分類方法從統(tǒng)計學角度對數(shù)據(jù)進行分析處理,模型訓練過程中只需求取各種故障信號的均值和協(xié)方差,對于輸入診斷系統(tǒng)的測試樣本根據(jù)貝葉斯公式進行后驗概率的計算,計算量小,易于現(xiàn)場進行實時故障診斷。
本文應用DAMADICS仿真平臺仿真工業(yè)過程中氣動調節(jié)閥5種典型故障,獲取用于進行故障診斷的訓練集和測試集。然后,利用主成分分析將維數(shù)較高的數(shù)據(jù)集轉化為維數(shù)較低的數(shù)據(jù)集,獲取數(shù)據(jù)集中的有用信息。最后將處理后的訓練集用來訓練貝葉斯分類模型,通過測試集來測試準確度。將本方法與SVM、k-NN進行對比,結果表明,本方法的診斷準確度較高,方法可行。貝葉斯分類方法還能輸出各個故障發(fā)生的概率大小,即使在故障診斷中發(fā)生誤判,依然可以根據(jù)診斷結果排列出各個故障發(fā)生的可能性大小,這在實際應用中具有十分重要的現(xiàn)實意義。