趙龍
(安徽皖能電力運營檢修有限公司 安徽合肥 230000)
基于數(shù)據(jù)挖掘的火電廠設(shè)備狀態(tài)檢修研究
趙龍
(安徽皖能電力運營檢修有限公司 安徽合肥 230000)
設(shè)備狀態(tài)檢修管理關(guān)系著火電廠的高效平穩(wěn)運行,是火電廠安全生產(chǎn)的關(guān)鍵環(huán)節(jié),同時設(shè)備狀態(tài)的好壞決定了發(fā)電企業(yè)的長久安全運行,對企業(yè)的效益也會有很大的影響。隨著新興技術(shù)的發(fā)展,數(shù)據(jù)挖掘技術(shù)能夠被用來對火電廠的發(fā)展趨勢做出可能的預(yù)測,提供有效的決策來對設(shè)備狀態(tài)進行檢測。本文著重研究了數(shù)據(jù)挖掘技術(shù)和電廠設(shè)備狀態(tài)檢修工作,并分析了利用支持向量機技術(shù)在設(shè)備故障診斷中的應(yīng)用。
設(shè)備狀態(tài)檢修;數(shù)據(jù)挖據(jù)技術(shù);支持向量機
火力發(fā)電廠作為電力行業(yè)的主流軍,在大力發(fā)展火電技術(shù)的同時對于設(shè)備狀態(tài)的檢修管理是發(fā)電廠安全運行的重中之重。良好的設(shè)備狀態(tài)檢修可以在設(shè)備運行中節(jié)能降耗、提高生產(chǎn)效率、減少安全事故的發(fā)生。但由于設(shè)備結(jié)構(gòu)復(fù)雜,占地空間比較大,同時設(shè)備檢修項目的逐漸增多,傳統(tǒng)的檢修方式難以高效準(zhǔn)確的進行檢修。在設(shè)備狀態(tài)檢修中關(guān)鍵是進行狀態(tài)監(jiān)測以及故障診斷,近年來新興的數(shù)據(jù)挖掘技術(shù)在結(jié)合了計算智能、模式識別以及數(shù)據(jù)庫和統(tǒng)計規(guī)律等相關(guān)技術(shù),通過對數(shù)據(jù)進行分類和處理分析等,進而挖掘出隱藏的有價值的信息。將數(shù)據(jù)挖據(jù)技術(shù)應(yīng)用在設(shè)備狀態(tài)檢修方面,能夠高效快捷的對設(shè)備進行故障診斷處理,對于火電廠的經(jīng)濟和社會效益都帶來了巨大的提升。
數(shù)據(jù)挖掘是指從大量不完全的,有噪聲的或模糊隨機的數(shù)據(jù)中,提取隱含的有用的人們事先不知道的而又潛在有用的知識的過程[1]。數(shù)據(jù)挖掘的功能在不同的領(lǐng)域有不同的表達方式,如圖1概括了數(shù)據(jù)挖掘的主要功能。
圖1 數(shù)據(jù)挖掘的功能概圖
1.1 數(shù)據(jù)挖掘的過程
數(shù)據(jù)挖據(jù)即是一種知識的發(fā)現(xiàn)過程,多用于在數(shù)據(jù)庫、數(shù)據(jù)分析以及統(tǒng)計規(guī)律等方面的應(yīng)用。數(shù)據(jù)挖掘在數(shù)據(jù)處理的過程中大致可分為數(shù)據(jù)的準(zhǔn)備階段、數(shù)據(jù)挖掘階段以及結(jié)果分析階段。其具體的挖掘過程如圖2所示。
圖2 數(shù)據(jù)挖掘的基本過程和主要步驟
數(shù)據(jù)選取是為了選擇適用于數(shù)據(jù)挖掘運用中的從數(shù)據(jù)庫中選擇和提取的某些有用數(shù)據(jù);數(shù)據(jù)預(yù)處理即是在消除噪聲和不匹配的數(shù)據(jù)以及清楚數(shù)據(jù)集成的基礎(chǔ)之上,可以有效的保證選取的數(shù)據(jù)質(zhì)量,使得數(shù)據(jù)挖掘過程更加高效簡便,提升了數(shù)據(jù)挖掘結(jié)果的可靠性;數(shù)據(jù)變換有效的降低了數(shù)據(jù)維數(shù),縮減了挖掘過程中數(shù)據(jù)信息的特征和變量數(shù),節(jié)省了數(shù)據(jù)分析的時間。數(shù)據(jù)挖掘階段在確定挖掘的任務(wù)和目的之后,選擇合適的挖掘算法對解決的實際問題進行處理,使得得到的分析結(jié)果具有一定的穩(wěn)健性。數(shù)據(jù)結(jié)果分析階段即是對數(shù)據(jù)挖掘得到的結(jié)果進行評估和闡釋,通過適當(dāng)?shù)姆椒▽⒃u估結(jié)果進行匯總,進而給出對于實際問題的決策方案。
1.2 支持向量機
隨著各種機器算法的不斷成熟,人工智能技術(shù)也在隨之不斷提升。支持向量機(Support Vector Machine)是Vaonik等人提出的一種新的通用學(xué)習(xí)方法[2],其根據(jù)統(tǒng)計學(xué)規(guī)律,建立在理論的VC維理論和結(jié)構(gòu)風(fēng)險最小院里的基礎(chǔ)上,目前仍在理論研究發(fā)展階段。SVM在已非線性映射為理論基礎(chǔ)的背景下,能夠解決諸如小樣本、局部極小點和高維數(shù)等一些實際遇到的問題。同時SVM方法在用于解決問題的過程中,有很好的“魯棒”性,降低了計算難度,簡化了算法的復(fù)雜性。如圖3所示,給出了支持向量機的網(wǎng)絡(luò)結(jié)構(gòu)圖,判別函數(shù)形式上輸出M個中間結(jié)點的線性組合,類似于一個神經(jīng)網(wǎng)絡(luò),每個中間結(jié)點對應(yīng)一個支持向量。同時SVM可以進行實時的線上監(jiān)測,使得其在用做故障診斷時能夠被用在小樣本決策方面,這是其在設(shè)備故障診斷的應(yīng)用中的很大優(yōu)勢。
圖3 支持向量機網(wǎng)絡(luò)結(jié)構(gòu)圖
汽輪機是火力發(fā)電中的重要設(shè)備,其產(chǎn)生故障時通常會發(fā)出噪聲或異響,其故障發(fā)生主要集中在:輪子不對中、旋轉(zhuǎn)機械中輪子質(zhì)量不平衡、轉(zhuǎn)軸振動過大產(chǎn)生摩擦以及零部件松動等。通過在故障狀態(tài)下檢測汽輪機組的振動信號的幅度特征等,來確定故障發(fā)生的具體原因,對于發(fā)電廠的安全運行具有重要的參考價值。
在應(yīng)用向量機進行汽輪機組的故障診斷過程中,需對數(shù)據(jù)進行深入挖掘才能獲取到比較有用的潛在信息,具體步驟如下:
(1)在火力發(fā)電廠的信息中心數(shù)據(jù)庫收集關(guān)于汽輪機組的相關(guān)故障信息;
(2)對數(shù)據(jù)進行預(yù)處理,進行歸一化操作,清除無用數(shù)據(jù),建立屬性決策表;
(3)通過相關(guān)數(shù)據(jù)挖掘算法,對采樣數(shù)據(jù)進行選擇得到最簡屬性集;
(4)建立SVM多分類器,對相關(guān)參數(shù)尋優(yōu),訓(xùn)練SVM分類器并測試;
(5)對分析結(jié)果進行評估。
首先,通過對火電廠數(shù)據(jù)庫中采集到的30組數(shù)據(jù)信息進處理,去掉缺失的數(shù)據(jù)等,通過對預(yù)處理的數(shù)據(jù)進行歸一化操作,得到如圖4所示的初始屬性決策表。
圖4 初始屬性決策表
在對數(shù)據(jù)進行特征選擇時,采用最值聚類算法,結(jié)合關(guān)聯(lián)分析方法,求出各屬性的相關(guān)系數(shù)rA,B,在用于比較的情況下一般評定變量相關(guān)性強弱標(biāo)準(zhǔn)的取值范圍如:0.0-0.2為幾乎無關(guān);0.2~0.3為弱相關(guān);0.3~0.5為中等相關(guān);0.5~0.8為較強相關(guān);0.8~1.0為強相關(guān)。設(shè)定閾值T為0.45。結(jié)合聚類算法,選擇一組頻段值Xn作為第一聚類中心,然后將與第一聚類中心關(guān)聯(lián)度最低的作為第二聚類中心,以此計算各頻段值并確定全部聚類中心之間的相關(guān)性,確定相關(guān)系數(shù)。在構(gòu)造SVM多類分類器時,為了得到良好的分類效果,可以采取一對一的多類分類方法,此方法避免了分類中兩個屬性間樣本數(shù)據(jù)差距過大造成的分類偏移等問題,大大減低了誤判率。采用一對一的多類分類法時,將收集到的30組數(shù)據(jù)分成兩部分,一部分用來做訓(xùn)練,一部分用來做測試,建立6個多分類模型。根據(jù)以上分類后,來建立PSO-SVM分類器[3],其參數(shù)優(yōu)化步驟主要包括:初始化粒子群速度調(diào)節(jié)參數(shù)C1,C2和慣性權(quán)重w,以及最大進化迭代次數(shù);根據(jù)初始化的的位置和速度得到新的參數(shù)信息,調(diào)用算法進行SVM的學(xué)習(xí)和分類訓(xùn)練;計算各粒子適應(yīng)度;對比各粒子,找出其經(jīng)過最佳位置時的適應(yīng)度取值,找出其自身適應(yīng)度的取值,并比對將更好地適應(yīng)度值進行更新;比較各粒子適應(yīng)度值和群體粒子的最佳位置適應(yīng)度值,并更新群體經(jīng)歷最佳位置時的適應(yīng)度值;若滿足最佳位置或最大迭代數(shù),則返回最優(yōu)懲罰系數(shù)和和函數(shù)寬度,進而得到PSO-SVM分類器。如圖5所示,給出了在初始化速度調(diào)節(jié)參數(shù)C1=1.5,C2=1.7時的參數(shù)優(yōu)化圖。由圖可知最佳適應(yīng)度大部分集中在坐標(biāo)100處,可以作出判斷即最佳分類達到了100%。
圖5 PSO-SVM參數(shù)優(yōu)化效果圖
在對SVM參數(shù)優(yōu)化選取進行評估時,當(dāng)采取網(wǎng)格搜索和交叉驗證的方法進行尋優(yōu),在進行反復(fù)試驗之后,得到的最小參數(shù)范圍變化始終不大。本文在進行汽輪機組故障診斷的過程中,采用了最值聚類算法和相關(guān)分析的方法相結(jié)合,從實際應(yīng)用角度來講,能夠更加滿足樣本的代表性,在對數(shù)據(jù)樣本進行處理的過程中能夠降低數(shù)據(jù)維數(shù),這樣做可以極大的簡化聚類算法的復(fù)雜性并且降低了相關(guān)分析方法的難度。使得SVM分類更加容易實現(xiàn)并且得到更加顯著的分類效果。同時,在用于設(shè)備故障診斷的過程中,主要是解決了小樣本的學(xué)習(xí)問題。汽輪組設(shè)備的故障診斷好壞很大程度上決定了火電廠能夠安全的運行,鑒于支持向量機方法能夠很好的進行小樣本學(xué)習(xí),因此在用作汽輪組故障診斷時,使得對于處理故障數(shù)據(jù)更加的靈活,也使得得到的故障樣本數(shù)據(jù)更加具備代表性,為后期分析故障原因提供了有價值的數(shù)據(jù)信息等。利用粒子群優(yōu)化方法,避免了支持向量機的過學(xué)習(xí),在提高分類的準(zhǔn)確性的基礎(chǔ)上可以尋找最有參數(shù),使得在對設(shè)備進行故障分析時,能夠更加快速、高效的得到準(zhǔn)確的診斷方法,更加方便的應(yīng)用在工業(yè)設(shè)備的故障診斷方面。
在電廠設(shè)備中,對汽輪機組故障的診斷至關(guān)重要。由于支持向量機可以很好的適用于小樣本學(xué)習(xí),本文采用支持向量機方法對汽輪機故障進行診斷。分別從特征選擇和參數(shù)優(yōu)化來分析研究,將數(shù)據(jù)挖掘技術(shù)用于電廠設(shè)備狀態(tài)檢修管理具有一定的理論和現(xiàn)實意義,可以為電廠帶來巨大的經(jīng)濟效益和社會效益。
[1]郭海濤,段禮祥,等.數(shù)據(jù)挖掘方法綜述[J].計算機科學(xué),2009,36(4B):323~326.
[2]顧亞祥,丁世飛.支持向量機研究進展[J].計算機科學(xué),2011,38(2):14~16.
[3]姚全珠,蔡婕.基于PSO的LS-SVM特征選擇與參數(shù)優(yōu)化算法[J].計算機工程與應(yīng)用,2010,46(1):134~136.
TM621
A
1004-7344(2016)20-0086-02
2016-7-1