凌萬水,劉剛
(1.上海金智晟東電力科技有限公司,上海 200233;2.國網(wǎng)江蘇省電力有限公司宿遷供電分公司,江蘇 宿遷 223800)
作為一個高度復雜的網(wǎng)絡,智能電網(wǎng)在運行過程中需要先進的監(jiān)測系統(tǒng)維持其可靠性、安全性與可持續(xù)性地工作。隨著工業(yè)物聯(lián)網(wǎng)(internet of things,IoT)等概念的提出,智能電網(wǎng)將產(chǎn)生越來越海量的數(shù)據(jù),這也對快速有效的數(shù)據(jù)處理與挖掘提出更高要求[1]。此外,當今的智能電網(wǎng)體系正在連接越來越多樣化的基本單位,如各類可再生能源與高級計量設施(advanced metering infrastructure,AMI)等[2]。由于工業(yè)社會與電網(wǎng)的高度耦合,停電等電能質(zhì)量問題會造成重大損失。
在電能質(zhì)量監(jiān)測領域,電能質(zhì)量事件(power quality event,PQE)分類是一個關鍵問題。一般地,PQE分類分為特征提取與決策兩個階段。在特征提取階段,使用信號處理技術(shù)將電能質(zhì)量(PQ)信號轉(zhuǎn)換到特定的特征空間并提取特征,然后在決策階段基于特征使用各種分類模型完成分類。特征空間的形式取決于特征變換中使用的方法,如基本的快速傅里葉變換(fast Fourier transform,F(xiàn)FT)與均方根(root mean square,RMS)變差跟蹤等[3-4]。這兩類方法在時域分析問題中不適用,短時傅里葉變換(short-time FFT,STFFT)對此進行了改進,使FFT具備了時域分析能力[5]。更為復雜的方法包括卡爾曼濾波器、Hilbert-Huang變換與S變換等[5-7]。在決策階段,由于PQE檢測本質(zhì)上是分類問題,因此可以使用機器學習中常見的分類算法處理,如深度神經(jīng)網(wǎng)絡(deep neural network,DNN)與支持向量機(support vector machine,SVM)等[8-9]。
本文提出一種基于離散小波變換(discrete wavelet transform,DWT)與極限學習機(extreme learning machine,ELM)的PQE分類技術(shù)。在特征提取中,該方法將熵引入到小波變換的計算中,并結(jié)合直方圖表示可以更為快速地提取特征集合。在決策階段,建立非迭代的極限學習機模型,在保證模型性能的同時,通過省略迭代學習過程進一步提升效率。本文方法的優(yōu)勢包括:
1)在特征提取的效果上,在離散小波變換的基礎上,引入了熵和直方圖特征,進一步豐富了特征集;
2)在分類效率上,使用高效的極限學習機模型,該模型可以直接求解而無需梯度下降等迭代優(yōu)化過程,在計算速度上具有顯著優(yōu)勢。
小波變換的思想來源于ST-FFT,通過對信號進行自適應“時間-頻率”窗口大小的變換,克服了ST-FFT僅能以固定寬度的窗口探測信號的局限性,從而可以揭示信號的深層次細節(jié)特征[10]。這一特點使小波變換可以基于不同的分辨率級別對信號波形進行靈活的時-頻分析,即進行多尺度分析(multi-resolution analysis,MRA)。MRA易于在波形中發(fā)現(xiàn)事件的起點和終點,因此小波變換在PQE檢測與分類等問題中有豐富的潛在應用場景[11-12]。
與傅里葉變換類似,小波變換可以應用到離散信號(DWT)。DWT的形式為
式中:a為頻率縮放系數(shù);b為時間偏移常數(shù);y(t)為被處理的信號;ψ(t)為離散小波函數(shù)。
離散信號通過將信號劃分為多個頻段進行多尺度分析。但實際上信號會覆蓋無限寬度的頻率,因此一般只在一定頻率范圍內(nèi)處理。本文使用8級分解的DWT,選取的小波函數(shù)為“Daubechies 4”(db4)小波[13]。圖1給出了DWT在樣本信號上進行MRA的一個例子,其中s為原始信號,d1~d8為8級分辨率的檢測結(jié)果??梢钥闯?,d1~d4已經(jīng)可以清晰地檢測出PQE在時域上的范圍。
圖1 基于DWT的8級多尺度分析Fig.1 8-level multi-resolution analysis based on DWT
在將信號輸入分類器之前,需要對信號作規(guī)??s小處理。在這一步驟本文引入基于熵的方法。在信號處理中,熵可用于表征一個非平穩(wěn)信號的無序程度,常用于信號的熵定義包括香農(nóng)熵、閾值熵、規(guī)范化熵與對數(shù)能量等[14-15]。圖2僅以數(shù)據(jù)集中最典型的四種PQE類型(暫降(Sag)、暫升(Swell)、諧波(Harmonic)與中斷(Interruption))為例,給出了樣本PQE的熵的圖示,圖中橫軸為MRA的尺度級別,縱軸為對應的熵值??梢钥闯?,熵特征較好地對PQE進行了表征,并區(qū)分出不同類型的PQE。
對于信號y,其香農(nóng)熵的定義為
式中:yi為第i個分量。
對每個PQE的DWT系數(shù)向量計算熵,即可生成8個特征,見圖2。
圖2 樣本PQE的8級DWT熵特征Fig.2 8-level DWT-entropy feature of sample PQEs
直方圖可用于圖形化地表示一定長度范圍內(nèi)事件的計數(shù)。圖3以四種樣本PQE為例,說明直方圖可以直觀地體現(xiàn)各種PQE的分布情況,使其特征更為顯著。圖中橫軸為歸一化的幅度。
圖3 樣本PQE的直方圖Fig.3 Histogram of sample PQEs
本文使用Sturges規(guī)則確定直方圖中的每個區(qū)間并進行事件計數(shù)[16]。具體地,直方圖特征集由每個PQE的14個分量構(gòu)成,該值(記為C)由如下的經(jīng)驗公式確定:
式中:k為每個信號的樣本個數(shù)。
圖4給出了四種PQE的直方圖特征。
圖4 樣本PQE的直方圖特征Fig.4 Histogram features of sample PQEs
由圖4可以看出,直方圖特征可以有效地區(qū)分四種PQE,其中橫軸表示信號的各個分量。
極限學習機(ELM)最早作為單隱層前饋神經(jīng)網(wǎng)絡(single-hidden layer feedforward neural network,SLFN)的一種學習范式而被提出[17]。在ELM中,輸入層的權(quán)值與偏置都是隨機分配的,只有輸出值會被計算,因此,ELM的計算時間極短。此外,與傳統(tǒng)的前饋神經(jīng)網(wǎng)絡(feed forward artificial neural networks,F(xiàn)F-ANN)相比,ELM具有更強的泛化能力[18-19]。圖5展示了一個基本的SLFN結(jié)構(gòu),其中xj與yj分別表示網(wǎng)絡輸入與輸出。
圖5 單隱層前饋神經(jīng)網(wǎng)絡Fig.5 Single-hidden layer feedforward neural network
隱藏層包含M個結(jié)點,且激活函數(shù)為g(x)的SLFN可以表示為
式中:w為輸入層權(quán)值;b為輸入層偏置;β為輸出層偏置;o為網(wǎng)絡的預期輸出。
由于SLFN在理論上是零誤差的,因此可以直接用y替代o,即
這表明存在合適的權(quán)值與偏置使SLFN的實際輸出與真實值一致,上述過程簡化可得:
式中:Hij為隱藏層的輸出。
求解線性方程式(7)即可得到合適的權(quán)值與偏置,其中γ為類別標簽矩陣,H為隱藏層輸出構(gòu)成的矩陣。對于一般的神經(jīng)網(wǎng)絡,需要使用反向傳播等迭代算法求解參數(shù),但ELM僅需一次計算而無需任何迭代過程。其解決方案如下式:
本文使用的數(shù)據(jù)集采集自AMI設備在實際場景下檢測到的信號,除用于舉例的四類PQE之外,還包含了閃變(flicker)類樣本。再加上普通信號,數(shù)據(jù)集中一共包括6類事件樣本。經(jīng)過采樣,所有原始信號樣本的長度都為10001,在特征提取后,特征的維度相比原始數(shù)據(jù)大幅降低。因此分類器所處理的實際上是22維的特征集合。圖6給出了數(shù)據(jù)集中三個PQE信號的波形。
圖6 樣本PQE信號Fig.6 Sample PQE signals
使用小波-熵以及直方圖方法對數(shù)據(jù)集進行特征提取后,基于ELM進行PQE分類過程。22維的特征向量包括8級MRA提取的特征(記為E1~E8)與直方圖方法提取的14維特征(記為H1~H14)。
實驗中采用10折交叉驗證評估模型性能,用于對比實驗的模型為使用sigmoid激活函數(shù)的深度神經(jīng)網(wǎng)絡(deep neural network,DNN),所有實驗在一臺RAM為32 GB的工作站上進行。
表1給出了兩種模型在信噪比(signal-noise rate,SNR)分別為30 dB,20 dB,10 dB時的PQE分類準確率。在經(jīng)過充分的參數(shù)優(yōu)化后,兩種模型的準確性都達到了較高的水平,但ELM依然表現(xiàn)出優(yōu)勢。并且,由于ELM不需要迭代優(yōu)化過程,因此在訓練時間上大幅降低。值得注意的是,在20 dB噪聲時,兩種模型的性能相比10 dB噪聲與30 dB噪聲的情形都出現(xiàn)了下降,這可能是由于20 dB噪聲恰好處在模型在數(shù)據(jù)集上保持魯棒性的臨界點附近所致[20]。
表1 不同信噪比下的準確率比較Tab.1 Comparison of accuracy under different SNR
實驗同時分析了各個維度的特征對于模型分類過程的貢獻。在每個類別中隨機挑選100個樣本并按類別依此排列,即第1類占據(jù)第1到第100個樣本,第2類占據(jù)第101到第200個樣本,等等。圖7顯示了8個維度的小波-熵特征在各個類別上的變化,圖中的EC1~EC6分別指6個類別,依次為普通,暫降,暫升,諧波,中斷與閃變。
圖7 小波-熵特征在不同類別樣本上的變化Fig.7 Variation of DWT-entropy features on samples of different classes
從圖7中可以看出,與E6~E8相比,特征E1~E5值接近0,且變化不明顯,僅對EC4類別有微小響應,表2給出的使用不同特征子集時的模型性能驗證了這一現(xiàn)象??梢钥闯觯捎贓6~E8特征在各個類別的PQE上差異較大,波形變化明顯(E7最為顯著),因此僅僅基于E6~E8就可以使分類模型達到較高的準確性,特征E1~E5在結(jié)合E6~E8后,特征集對PQE的分辨力也顯著提升。
表2 不同小波-熵特征子集下的準確率比較(SNR=30 dB)Tab.2 Comparison of accuracy under different DWT-entropy feature subsets(SNR=30 dB)
表3進一步比較了小波-熵特征與直方圖特征的重要性。兩類特征提取方法在準確率上都較高,但小波變換所要求的計算量遠大于直方圖方法,因此特征提取耗時約為直方圖方法的15倍。在實際應用場景中,需要綜合準確率與效率兩個方面的考慮。
表3 不同特征子集下的準確率比較(SNR=30 dB)Tab.3 Comparison of accuracy under different feature subsets(SNR=30 dB)
本文提出了一種基于極限學習機的PQE分類器,結(jié)合小波-熵與直方圖方法對PQE信號進行分類。利用其MRA特性,DWT方法適用于對PQE信號的多分辨率時頻分析。通過引入熵,可以使降低數(shù)據(jù)維度并使信號特征更為顯著。本文進一步引入直方圖方法,在提取更為豐富的信號特征的同時,也可以大幅提升特征提取的效率,因此可用于嵌入式系統(tǒng)。在真實數(shù)據(jù)集上的實驗表明,本文方法在分類準確率上達到了較高水平。通過進一步比較兩類特征的重要性,可以指導實際應用場景下的特征選擇。