• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多層架構的油中溶解氣體數(shù)據清洗與異常識別方法研究

    2022-02-18 05:37:36劉云鵬許自強劉一瑾和家慧
    關鍵詞:監(jiān)測數(shù)據準則趨勢

    劉云鵬, 王 權, 許自強, 劉一瑾, 和家慧, 韓 帥

    (1.華北電力大學 河北省輸變電設備安全防御重點實驗室,河北 保定 071003;2.新能源電力系統(tǒng)國家重點實驗室(華北電力大學), 北京 102206;3.國網南京供電公司,江蘇 南京 210019;4.中國電力科學研究院有限公司, 北京 100192)

    0 引 言

    電力變壓器的運行狀態(tài)關乎電網運行安全與社會用電穩(wěn)定,油色譜在線監(jiān)測技術是反映變壓器運行狀態(tài)的重要手段。油中溶解氣體的數(shù)據信息通過監(jiān)測裝置的采集、傳輸后形成按照時間先后順序排列的的時間序列,但受環(huán)境等因素的影響,監(jiān)測數(shù)據中不可避免的出現(xiàn)異常。為確保狀態(tài)評估的數(shù)據質量,異常檢測與數(shù)據清洗發(fā)揮著關鍵性作用。

    根據電力變壓器和監(jiān)測設備的運行特征,數(shù)據異常通常包含有不同模式[1]。包括由傳感裝置或通信系統(tǒng)受到運行環(huán)境干擾、記錄失誤等因素影響而產生的缺失數(shù)據值、偏離數(shù)據期望的孤立噪聲值、不變數(shù)據值、暫時性遷移數(shù)據等。為保證后續(xù)狀態(tài)評估工作的數(shù)據質量,此類與變壓器自身無關的異常需要進行數(shù)據清洗;以及由變壓器設備異常引起的長時間趨勢變化、關聯(lián)性序列同時出現(xiàn)突變數(shù)據值、關聯(lián)性序列同時出現(xiàn)暫時性遷移數(shù)據、高噪聲或高方差數(shù)據等。由于包含數(shù)據狀態(tài)變化的關鍵信息,是設備運行狀態(tài)的真實表現(xiàn),此類異常不屬于數(shù)據清洗的范疇。

    在輸變電設備的異常檢測與數(shù)據清洗領域,國內外開展了一系列的探索研究,文獻[2]采取雙向KL距離代替?zhèn)鹘y(tǒng)歐式距離度量的聚類方法實現(xiàn)變壓器異常數(shù)據識別,提高了度量精度;文獻[3]利用T2、SPE統(tǒng)計量特性,結合PCA構造異常檢測模型,實現(xiàn)對變壓器油色譜異常值的有效檢測;文獻[4]面向輸變電設備的離群數(shù)據點通過LOF方法實現(xiàn)異常識別,并在電網預警平臺得到了實例驗證;文獻[5]分階段采用LOF算法、Canopy聚類、K-means聚類完成異常數(shù)據的篩選清洗,在結合多種異常檢測模型的基礎上利用SMOTE方法補全數(shù)據;文獻[6]運用K-means聚類提取序列中的異常數(shù)據,在考慮序列關聯(lián)性的基礎上結合WNN構建了數(shù)據清洗框架;文獻[7]結合SAX和相似度量識別配電網數(shù)據中的異常,隨后通過相似序列調整的方法實現(xiàn)數(shù)據清洗。

    已有的研究對于未發(fā)生趨勢變化的平穩(wěn)序列中的離群點有較好的識別效果,但難以有效識別清洗非平穩(wěn)序列中的離群點、孤立點,難以對監(jiān)測序列中的持續(xù)趨勢性異常數(shù)據進行準確的異常檢測。因此,本文基于變壓器油色譜監(jiān)測數(shù)據提出了一種多層級的數(shù)據清洗與異常識別方法,首先利用變分模態(tài)分解去除監(jiān)測序列中的趨勢項,使數(shù)據中的孤立噪聲值、短時突變值得到更好的反映,并通過3σ準則檢測并剔除序列中的異常數(shù)據;為保證時序數(shù)據的完整連續(xù),在關聯(lián)規(guī)則分析結果對異常模式準確區(qū)分的基礎上,利用長短期記憶神經網絡進行清洗重構;最后通過時間序列分段結合改進符號聚合近似(Symbolic Aggregate Approximation, SAX)算法實現(xiàn)對時序數(shù)據的趨勢異常檢測。

    1 基于變分模態(tài)分解與3σ準則的異常數(shù)據識別

    當前常用于異常數(shù)據識別的方法,如孤立森林,DBSCAN聚類,3σ準則等對于平穩(wěn)監(jiān)測數(shù)據具有較好的識別效果,但對于存在趨勢變動的非平穩(wěn)監(jiān)測序列則難以準確地檢測識別。因此引入變分模態(tài)分解方法對原始監(jiān)測數(shù)據進行分解,以削弱不同尺度信息間的相互影響,利用原始監(jiān)測序列減去表征趨勢變動的低頻分量,得到殘差序列,使噪聲值、突變值在殘差序列中得到更好的表征,進而利用3σ準則對殘差序列進行異常檢測。

    1.1 變分模態(tài)分解

    變分模態(tài)分解(variational mode decomposition, VMD)是一種自適應的信號分解方法[8]。能夠將非平穩(wěn)的復雜信號分解為k個不同中心頻率的模態(tài)分量(bandlimited intrinsic mode functions, BIMF)[9-11]。VMD的主要步驟如下:

    (1) 構造受約束的變分模型。輸入信號f經VMD分解為k個模態(tài)分量,各模態(tài)的估計帶寬之和最小作為約束條件,即

    (1)

    式中:K為模態(tài)函數(shù)總個數(shù);δ(t)為狄拉克函數(shù);{uk}為分解后的k個分量;{ωk}為各分量的頻率中心。

    (2) 拉格朗日變換。引入二次懲罰因子α和增廣拉格朗日函數(shù)以消除變分模型的約束性,表達式為

    L({uk},{ωk},λ)=

    (2)

    (3) 交替更新。通過以下2個更新方程求解:

    (3)

    (4)

    1.2 3σ準則

    3σ準則又稱為拉依達準則,通過以監(jiān)測序列的總體位置參數(shù)和總體尺度參數(shù)組成控制函數(shù),來對監(jiān)測量Xi進行識別[12],當監(jiān)測量Xi不滿足控制函數(shù)時,判斷Xi為異常值。正態(tài)分布中,數(shù)值分布于式(5)區(qū)間內的概率為0.997 4,根據3σ準則,將超過上述區(qū)間的數(shù)據判斷為異常值。

    μ-3σ≤Xi≤μ+3σ

    (5)

    式中:μ為均值;σ為標準差。

    對于平穩(wěn)序列中的異常數(shù)據,3σ準則可以很好的識別,但監(jiān)測數(shù)據中存在明顯的趨勢變化時,μ和σ會嚴重偏離正常狀態(tài),導致異常漏判的現(xiàn)象。因此,采用變分模態(tài)分解結合3σ準則,通過去除趨勢項的影響,以達到更好的異常識別效果。

    2 基于關聯(lián)規(guī)則分析與LSTM的異常數(shù)據清洗

    考慮到異常數(shù)據的產生既可能由變壓器運行狀態(tài)不穩(wěn)定造成,也可能由通信端口異常、傳感裝置失效等與變壓器自身無關的因素產生。因此,文中結合關聯(lián)規(guī)則分析,將數(shù)據異常模式進行區(qū)分。具體地,對于存在關聯(lián)狀態(tài)量的監(jiān)測數(shù)據,在某一時刻或短時出現(xiàn)異常數(shù)據,若相關序列在同時或相近時刻發(fā)生異常,表明設備狀態(tài)出現(xiàn)異常,為不可清洗數(shù)據;若關聯(lián)序列中,只有某一序列存在異常,則判斷該異常數(shù)據點需要進行數(shù)據清洗。為保證數(shù)據流的連續(xù)完整,對異常數(shù)據剔除后采用基于LSTM預測的方法進行修復清洗。

    2.1 灰關聯(lián)算法

    本文引入灰關聯(lián)算法[13,14]分析各監(jiān)測序列間的關聯(lián)程度。算法通過定量分析動態(tài)發(fā)展趨勢,比較時間序列有關統(tǒng)計數(shù)據的幾何關系,進而求出各參量之間的關聯(lián)度。

    (6)

    然后計算各比較序列與參考序列對應元素的關聯(lián)系數(shù):

    (7)

    式中:ρ為分辨系數(shù),一般取0.5;a為兩級最大差,b為兩級最小差。

    通過綜合各時間點的灰關聯(lián)系數(shù),可得到參考序列與第d組比較序列之間的灰關聯(lián)度rd,rd值越大,表明該比較序列與待檢測序列的關聯(lián)性越強。

    (8)

    2.2 LSTM

    長短期記憶神經網絡(long-short term memory neural network, LSTM)[15]是由Hochreiter等人提出的具有時間遞推功能的循環(huán)神經網絡,LSTM通過在神經網絡隱藏層的神經節(jié)點中引入更為復雜的門結構,從而有效規(guī)避循環(huán)神經網絡梯度消失或者梯度爆炸而無法訓練的難題。

    LSTM神經元結構如圖1所示,每一個LSTM單元包含輸入門、遺忘門和輸出門,輸入門決定保存到記憶單元中的狀態(tài)信息,遺忘門控制從記憶單元中忘記無用的歷史信息,輸出門決定輸出信息[16,17]。LSTM單元有三個輸入量,xt代表當前t時刻的輸入,ht-1代表前一個LSTM單元的輸出,ct-1代表前一時刻的細胞狀態(tài)。

    ft=σ(wxfxt+whfht-1+bf)

    (9)

    it=σ(wxixt+whiht-1+bi)

    (10)

    c′t=tanh(wxcxt+whcht-1+bc)

    (11)

    ct=ftct-1+itc′t

    (12)

    ot=σ(wxoxt+whoht-1+bo)

    (13)

    ht=ottanh(ct)

    (14)

    圖1 LSTM單元結構Fig. 1 LSTM cell structure

    式中:wxf、wxi、wxc、wxo分別為輸入層與隱藏層各個門之間的連接權值,whf、whi、whc、who分別為上一時刻的隱藏層輸出與當前時刻隱藏層各個門之間的連接權值,bf、bi、bc、bo分別為隱藏層各個門的偏置向量。

    為驗證數(shù)據清洗算法的有效性,選擇某變壓器2018年12月11日至2019年4月19日采樣間隔為4小時的H2監(jiān)測數(shù)據為例進行重構清洗。原始監(jiān)測數(shù)據均為正常狀態(tài),通過添加噪聲點和缺失值構成需要清洗的異常序列。首先利用前述異常識別方法,可以準確識別出添加在第550、600采樣點處的缺失值、噪聲點以及第680~685處的連續(xù)異常值,如圖2所示。

    圖2 H2異常識別結果Fig. 2 H2 anomaly recognition results

    將異常數(shù)據剔除后,利用LSTM算法實現(xiàn)數(shù)據清洗重構,如圖3所示。并使用ANN、插值法和SVR回歸來重構上述異常點,與LSTM的預測結果進行對比,將均方根誤差(RMSE)和平均絕對百分比誤差(MAPE)作為評價指標,對比結果如表1所示,由對比結果可知,利用LSTM預測可以實現(xiàn)更加準確的清洗效果。

    表1 清洗方法對比Tab.1 Comparison of cleaning methods

    圖3 數(shù)據清洗結果Fig. 3 Data cleaning results

    (15)

    (16)

    3 變壓器趨勢異常狀態(tài)識別

    對于監(jiān)測數(shù)據中存在的孤立異常、短時異常值利用前述方法可以達到較好的異常檢測和數(shù)據清洗效果,但對于較長時間的趨勢變化異常則難以有效識別,本節(jié)采用時間序列分段結合改進SAX符號化表示的方法實現(xiàn)趨勢異常數(shù)據的準確分析。首先將時間序列等距分段并計算各子段之間距離,通過閾值比較對正常序列與異常序列進行區(qū)分[18],若距離計算結果超過閾值,進一步利用改進的SAX算法對存在的不同階段異常狀態(tài)進行分析。

    3.1 時間序列分段相似度計算

    以前文的H2序列為例,時間序列分段后,分別計算各子序列的均值、方差和樣本熵構成特征值向量,然后計算各向量間的相似度值,如圖4所示,相似度最大值為0.658,小于閾值,因此判斷其為正常序列。

    圖4 相似度計算結果Fig. 4 Similarity calculation results

    z-score標準化:

    (17)

    式中:μ為子序列的均值,σ為子序列的標準差

    歐式距離計算公式:

    (18)

    3.2 改進SAX算法

    通過上述度量結果可以對正常序列與存在趨勢異常的序列進行區(qū)分,對于異常序列中不同階段的數(shù)據增長或下降,利用SAX符號化表示可以實現(xiàn)更準確的表征。但SAX算法中的字符集大小通常由人為經驗設定,難以實現(xiàn)不同階段的準確劃分。因此,本文利用Mean-Shift聚類算法對原序列進行聚類,將得到的聚類簇個數(shù)作為字符集大小實現(xiàn)原序列的SAX表示,并計算各字符序列與原序列的Pearson相關系數(shù),選取相關性最強的SAX字符序列來表征原始序列。

    3.2.1 SAX算法原理

    SAX算法是一種對連續(xù)時間序列進行離散化符號表征的方法[20],通過利用標準正態(tài)分布的特性劃分數(shù)值,并對數(shù)值進行歸類,分別用不同符號表示,從而實現(xiàn)數(shù)值序列轉為符號序列。SAX共分為兩個階段[21],首先采用分段聚合近似(Piecewise Aggregate Approximation, PAA)以固定時間窗l(fā)分割標準化后的數(shù)據,將長度為n的原序列S= (s1,s2, …,sn)轉化為另一條長度為m的時間序列Q= (q1,q2, …,qm),Q中元素為

    (19)

    然后按照等概率分割原則對正態(tài)分布空間進行劃分,每個分布空間用不同的字符表示,得到時間序列的符號化特征表示。

    3.2.2 Mean-Shift聚類算法

    均值漂移(Mean-Shift, MS)算法是一種迭代搜索的聚類算法[22],與傳統(tǒng)的K-means聚類相比具有無需設定分類數(shù)量、迭代效率高、良好的數(shù)據適應性等特點[23,24]。該算法不需要任何先驗,但需要為各采樣點設定帶寬值h,本文通過調整Mean-Shift聚類算法的帶寬參數(shù),得到不同的聚類簇個數(shù),然后將其作為SAX算法的字符集大小對原序列進行符號化表征。

    3.2.3 Pearson相關系數(shù)

    Pearson相關系數(shù)是一種常用于比較時間序列相關程度的指標[25],通過計算各SAX字符序列與原序列的Pearson相關系數(shù),得到最優(yōu)的字符表示,其計算公式為

    (20)

    4 實例分析

    4.1 算法流程

    為檢驗本文算法的有效性,選擇變壓器實際監(jiān)測數(shù)據進行分析,前述多層級的數(shù)據清洗及異常識別架構如圖5所示。

    圖5 算法流程圖Fig. 5 Algorithm flow chart

    4.2 實例

    前述示例中選擇變壓器正常狀態(tài)的H2監(jiān)測數(shù)據實現(xiàn)了上述算法流程,通過對比驗證了清洗方法的有效性,并且實現(xiàn)其正常趨勢狀態(tài)的準確判斷。

    進一步采用存在趨勢異常狀態(tài)的序列進行分析驗證。選擇某變壓器乙烯在線監(jiān)測數(shù)據為例進行分析,原序列僅在537采樣點處存在一處數(shù)據異常,為驗證VMD去除趨勢項結合3σ準則識別異常方法的有效性,向原序列中添加了不同類型的異常值。運行本文方法,首先利用VMD對乙烯序列進行分解,去除其中的趨勢項,得到殘差序列,進一步利用3σ準則檢測殘差序列中是否存在異常。乙烯序列、序列趨勢項以及通過3σ準則檢測異常后的殘差序列如圖6所示,序列中存在的異常數(shù)據點均可實現(xiàn)有效的檢測。

    圖6 C2H4序列分解結果Fig. 6 Decomposition results of C2H4 sequence

    若直接采用3σ準則,其上下限值分別為517.3和41.5,難以檢測乙烯序列中全部的異常值;選擇兩種改進方法作為對比,方法一采用Box-Cox改進3σ準則檢測異常[26];方法二采用聚類有效性指標結合K-means進行異常檢測[27]。對比方法均只檢測出序列中的部分異常數(shù)據,3σ準則以及兩種對比方法的異常檢測結果如圖7所示。比較以上不同方法可以看出,通過去除時間序列中趨勢項的影響,使異常數(shù)據在殘差項中得到更好的表征,本文方法可以實現(xiàn)更好的異常檢測效果。

    計算乙烯序列與其余監(jiān)測量的灰關聯(lián)度,計算結果如表2所示。經過對其強關聯(lián)序列H2分析,在檢測出的異常數(shù)據點及相近時刻H2序列并未出現(xiàn)異常,因此判斷該序列需要進行數(shù)據清洗。

    利用LSTM預測算法對異常值進行修復清洗,清洗后的數(shù)據如圖8所示。

    將清洗后的乙烯序列分段,各子序列由均值、方差、樣本熵組成的特征向量表征,并計算各特征向量間的相似度。計算結果中最大值為2.651,大于閾值,因此判斷該序列中存在趨勢異常,見圖9。

    利用SAX算法對其不同階段的異常狀態(tài)進行分析。時間窗口大小取每日的監(jiān)測量,即t=6,通過Mean-Shift聚類結合Pearson相關系數(shù)確定字符集大小。首先調整聚類的帶寬參數(shù)h,得到不同的聚類簇個數(shù),如表3所示,分別以聚類簇數(shù)2和3作為字符集大小對原序列進行SAX符號化表示,標準化后的原序列與SAX字符序列如圖10所示,然后分別計算字符集大小為2和3的SAX字符序列與原序列的Pearson相關系數(shù),根據表4中的計算結果,選擇字符集為3的SAX字符序列來表征原序列。

    圖10 C2H4序列符號化表示Fig. 10 Symbolic representation of C2H4 sequence

    進一步地對該字符序列分析,在第283個采樣點和第343個采樣點處字符序列分別發(fā)生了兩次變化,對應該變壓器運行狀態(tài)分析,在相應時間段變壓器內部發(fā)熱,產生了階段性的氣體增長,造成了時間序列趨勢異常。因此,利用時間序列分段結合改進的SAX方法可以有效分析時間序列的趨勢狀態(tài)異常。

    5 結 論

    針對電力變壓器油色譜在線監(jiān)測數(shù)據受設備狀態(tài)、外界環(huán)境、通訊干擾等因素影響而產生異常數(shù)據的問題,本文提出一種多層級的異常數(shù)據清洗及趨勢異常識別方法。主要研究工作如下:

    (1)利用變分模態(tài)分解去除時間序列的趨勢項,結合3σ準則對時序數(shù)據中的噪聲值、缺失值、暫時性遷移數(shù)據等進行異常檢測,有效排除趨勢變化對3σ異常識別效果的影響。

    (2)利用關聯(lián)分析對不同異常模式進行了有效的區(qū)分,針對可清洗的異常數(shù)據利用長短期記憶神經網絡進行清洗重構,確保時序數(shù)據的連續(xù)完整。

    (3)結合時間序列分段以及改進SAX算法實現(xiàn)對時序數(shù)據趨勢異常的識別檢測,并通過實例分析驗證了本文數(shù)據清洗和趨勢異常識別方法的有效性。

    猜你喜歡
    監(jiān)測數(shù)據準則趨勢
    趨勢
    第一財經(2021年6期)2021-06-10 13:19:08
    具非線性中立項的二階延遲微分方程的Philos型準則
    GSM-R接口監(jiān)測數(shù)據精確地理化方法及應用
    初秋唇妝趨勢
    Coco薇(2017年9期)2017-09-07 21:23:49
    基于Canny振蕩抑制準則的改進匹配濾波器
    SPINEXPO?2017春夏流行趨勢
    一圖讀懂《中國共產黨廉潔自律準則》
    GPS異常監(jiān)測數(shù)據的關聯(lián)負選擇分步識別算法
    基于小波函數(shù)對GNSS監(jiān)測數(shù)據降噪的應用研究
    趨勢
    汽車科技(2015年1期)2015-02-28 12:14:44
    余姚市| 德化县| 甘谷县| 定边县| 仙居县| 循化| 六盘水市| 仪陇县| 屏东市| 江源县| 科技| 汤原县| 南华县| 稷山县| 漯河市| 岱山县| 通道| 永寿县| 阿克苏市| 师宗县| 临高县| 宁都县| 当雄县| 汾阳市| 介休市| 沂水县| 通辽市| 富锦市| 涟源市| 桦甸市| 上高县| 炎陵县| 民县| 遵化市| 武邑县| 绥滨县| 台北县| 前郭尔| 扎囊县| 南川市| 固镇县|