林樂麒
摘 要:針對水口電站水輪機振擺度振動數(shù)據(jù),運用決策樹模型,完成對機組振擺度的分析。
關鍵詞:水電站;水輪機;狀態(tài)檢修;回歸決策樹
1、概述
目前,水口電站的監(jiān)控系統(tǒng)、狀態(tài)監(jiān)測系統(tǒng)已經(jīng)運行了十幾年,它們已經(jīng)積累了海量設備運行的數(shù)據(jù)。倘若采用傳統(tǒng)分析方法對這海量的設備數(shù)據(jù)分析和處理,不僅費時費力并且難以從海量的數(shù)據(jù)中發(fā)現(xiàn)真正具有價值的信息。近年來,隨著大數(shù)據(jù)、云計算技術的快速發(fā)展以及一些主流大數(shù)據(jù)算法框架的開放,大數(shù)據(jù)技術在日常生產(chǎn)中的運用已經(jīng)逐漸成熟,利用大數(shù)據(jù)技術對水輪發(fā)電機組進行故障分析診斷已經(jīng)十分必要。傳統(tǒng)的方法只是通過機組定值的方式對機組工況進行簡單的判定判定,但通過大數(shù)據(jù)分析可以分析機組各組特征數(shù)據(jù)的潛在規(guī)律,提前發(fā)現(xiàn)水輪發(fā)電機組運行工況的微妙變化,及早發(fā)現(xiàn)設備存在的缺陷及變化趨勢。
2、基礎數(shù)據(jù)
本文所用數(shù)據(jù)是由水口電站狀態(tài)監(jiān)測系統(tǒng)采集水口1號機組從2018年6月1日至2020年7月4日71031條穩(wěn)態(tài)數(shù)據(jù)。監(jiān)測變量包括上導X向擺度,上導Y向擺度,推力X向擺度,推力Y向擺度,水導X向擺度,水導Y向擺度,上機架X向水平振動,上機架Y向水平振動,上機架Z向垂直振動,頂蓋X向水平振動,頂蓋Y向水平振動,頂蓋Z向垂直振動,定子X向水平振動,定子Y向水平振動,蝸殼差壓,蝸殼進口壓力,導葉出口壓力,頂蓋下水壓力,尾水管出口壓力,有功功率,導葉開度,槳葉開度,轉(zhuǎn)速,工作水頭,水導X向擺度6X,水導Y向擺度6X,頂蓋X向水平振動6X,頂蓋Y向水平振動6X,頂蓋Z向垂直振動6X。由于數(shù)據(jù)參數(shù)過多,本文僅以上導X向擺度、推力X向擺度、水導X向擺度和蝸殼差壓,有功功率,無功功率,等參數(shù)建立數(shù)據(jù)模型進行分析。
3、數(shù)據(jù)預處理
首先,進行數(shù)據(jù)清理,主要對數(shù)據(jù)中的缺失值以及異常值進行處理。由于機器學習算法對于數(shù)據(jù)的正確率要求比較高,噪聲會對模型造成較大的影響。由于通信或者采集模塊故障等原因造成有些采集值為空,對于這一類數(shù)據(jù),因為占總樣本比例比較小,所以以丟棄的方式處理。其次,由于數(shù)據(jù)中包含機組異常運行時數(shù)據(jù),所以通過機組定值,刪除包含異常值的數(shù)據(jù)。
4、數(shù)據(jù)建模
由于觀察各個參數(shù)與振擺度不符合線性回歸模型,所以采用決策樹模型搭建預測分析模型。
4.1決策樹模型原理
決策樹是一種通過大數(shù)據(jù)訓練,然后生產(chǎn)數(shù)據(jù)模型,對數(shù)據(jù)進行分類預測和回歸預測的方法。通過的特征值的“是否”區(qū)分左右兩個分支,不斷迭代二分每個特征后而生成的模型。
假設X與y分別是輸入矩陣和結果,并且y是連續(xù)變量,給定訓練數(shù)據(jù)集
一個回歸樹對應著輸入空間(即特征空間)的一個劃分以及在劃分的但單元上的輸出值。假設已將輸入空間劃分為M個單元 ,并且在每個單元上有一個固定的輸出值,于是回歸樹模型可表示為
決策樹算法就是要不斷找到信息熵最小的那個維度上(特征)值,這個值可以把目標值劃分的類別信息熵最小。
Entropy代表信息熵,i 表示數(shù)據(jù)總類別數(shù),P(i) 表示類別 i 樣本數(shù)量占所有樣本的比例
最后通過R^2進行模型正確率的評估
4.2決策樹建模
本文選取的特征值比較少,只建立簡單的決策樹回歸模型,并不進行參數(shù)調(diào)優(yōu)的過程。
首先,將所有數(shù)據(jù)分為80%的訓練集,以及20%的測試集。將80%的訓練集訓練生成決策樹模型如下圖:
4.3模型分析
由表1所示,上導X向擺度模型正確率明顯低于推力X向、水導X向擺度模型。分析原因可能是由于引入特征量相對較少、上導X向傳感器精確度相對較低造成數(shù)據(jù)誤差較大。
從三個數(shù)據(jù)模型結果來看,機組不同地點震動的影響因素也不大相同。
a、上導X向擺度主要受到蝸殼壓差蝸殼差壓 <= 13.961這個主要條件進行影響,其次受到導葉開度與槳葉開度的影響。
b、推力X向擺度主要受到有功功率有功功率 <= 108.333這個主要條件影響,然后再根據(jù)有功功率 <= 25.699,有功功率 <=195.975兩個條件進行劃分。
c、水導X向擺度主要由受到蝸殼壓差蝸殼差壓 <= ?0.615這個主要條件進行影響,其次主要受到槳葉開度的影響。
5、結語
生產(chǎn)大數(shù)據(jù)在水口電站機組振擺度分析中具有巨大的作用,通過大數(shù)據(jù)技術可以發(fā)掘海量數(shù)據(jù)中的潛在價值,打破傳統(tǒng)分析手段的限制,多維度的對機組機組工況、振擺度進行精確的分析。通過大數(shù)據(jù)技術對海量的數(shù)據(jù)進行分析,可以得到水輪機組運行中的客觀規(guī)律,為故障判斷、預測分析以及輔助決策提供更有價值的信息。通過大數(shù)據(jù)技術可以有效的降低事故的發(fā)生,做到防范于未然。從而有效降低水電站的運營成本,為企業(yè)創(chuàng)造更高效益。
(福建水口發(fā)電集團有限公司 ?350000)