徐 超,孫金莉,楊 郡,劉穎彤,李韜睿
(1.國網(wǎng)湖北超高壓公司,湖北 武漢 430050; 2.國網(wǎng)湖北電力科學研究院,湖北 武漢 430050)
電力系統(tǒng)中拓撲誤差,由材料問題導致的通信線路缺陷、儀器故障、惡意攻擊等造成的測量數(shù)據(jù)不良將會影響電網(wǎng)狀態(tài)估計的準確性[1-2]。例如,許多通信線路供應商為獲取巨額利潤,有意忽視對通信線的質(zhì)量保障,采用劣質(zhì)材料制造通信線;當此類由劣質(zhì)材料制造的通信線被用作電力系統(tǒng)的通信線路時,可能成為電力系統(tǒng)的安全薄弱點,成為錯誤數(shù)據(jù)注入的主要攻擊點。不準確的狀態(tài)估計會誤導電網(wǎng)控制決策和引入電力系統(tǒng)控制平臺的數(shù)據(jù)流軟錯誤[3-4],造成災難性后果。因此,為了檢測電網(wǎng)中的錯誤數(shù)據(jù)注入,基于測量殘差統(tǒng)計檢驗的技術(shù)得到了廣泛的應用[5]。
為保證錯誤數(shù)據(jù)注入檢測的準確性,提出了大量的錯誤數(shù)據(jù)注入檢測方法[6-8]?,F(xiàn)有錯誤數(shù)據(jù)注入檢測方法多以殘差最小作為檢測目標,而錯誤數(shù)據(jù)注入是一種具有隱蔽性的惡意攻擊,可以繞過傳統(tǒng)的基于殘差的統(tǒng)計檢驗方法。為解決該問題并進一步對具有非線性分布特性的電力網(wǎng)絡錯誤數(shù)據(jù)注入檢測的準確性和更好地平衡計算復雜度與檢測準確性之間的關(guān)系,提出基于分布式支持向量機的電力網(wǎng)絡錯誤數(shù)據(jù)注入檢測新方法。
將電力網(wǎng)絡建模為一組非線性方程,表達式[9]:
Z=h(X)+e
(1)
式中:Z∈Rm為測量向量;X∈RN為狀態(tài)變量向量;h為系統(tǒng)狀態(tài)變量X∈RN與Z之間關(guān)系的函數(shù),h可實現(xiàn)X∈RN→Z∈Rm;e∈Rm為測量平均值為0的測量誤差向量,其標準差為σ,且服從高斯概率分布;N=2n-1為待估計的未知狀態(tài)變量個數(shù)(2n為電力系統(tǒng)的總線數(shù))。
(2)
ΔZ=HΔX+e
(3)
式中:H=?h/?x是h在X*處的雅可比矩陣;ΔZ=Z-h(X*)=Z-Z*為對測量向量的修正向量;ΔX=X-X*為對狀態(tài)向量的修正向量。
如果式(3)表示的系統(tǒng)是可觀測的,則測量值的向量空間Rm可分解為2個向量子空間的直接和,即:
Rm=R(H)⊕[R(H)]⊥
(4)
式中:由R(H)給出的H的范圍空間是一個滿足R(H)?Rm的N維向量子空;[R(H)]⊥為R(H)的正交補集,即如果u∈R(H)且v∈R(H),則〈u,v〉=uTR-1v=0。
(5)
求解該方程,可以得到:
(6)
P=H(HTR-1H)-1HTR-1
(7)
因此,在幾何上,基于最小二乘法的經(jīng)典狀態(tài)估計器可以解釋為一個投影矩陣P作用于測量向量ΔZ的校正,校正通過殘差實現(xiàn)。另一種可視化狀態(tài)估計的方法是觀察測量誤差的幾何位置與雅可比矩陣范圍空間R(H)的關(guān)系。然后,將測量值的向量空間分解為R(H)和[R(H)]⊥的直接和,就有可能將測量誤差向量e分解為2個分量——不可檢測(eU∈[R(H)]⊥)成分和可檢測(eD∈R(H))成分:
e=eD+eU,eD=(I-P)e,eU=Pe
(8)
故,
(9)
式中:前2個分量的區(qū)別在于它們屬于不同的空間,第1個分量屬于R(H),另一個分量屬于[R(H)]⊥,具有不同的性質(zhì)。
由于殘差eD和另一個誤差分量eU相互正交,可以組成第i次測量的測量誤差向量:
(10)
這個誤差矢量稱為組合測量誤差(CME)。為了找到測量的總誤差,使用文獻[10]所提出的創(chuàng)新指數(shù)Π:
(11)
創(chuàng)新指數(shù)Π反映的測量誤差的很大一部分沒有反映在基于最小二乘法的經(jīng)典狀態(tài)估計器的估計殘差中,能夠更好的識別錯誤數(shù)據(jù)注入。已知向量空間R(H)和[R(H)]⊥是正交的,那么就有可能估計第i次測量的組合誤差。因此,式(10)將變成:
(12)
(13)
式中:ri為第i次測量的殘差;Πi為第i次測量的創(chuàng)新指數(shù)。一旦選擇了初始狀態(tài),這2個量都是已知的。如果使用歸一化殘差,則得到組合歸一化誤差(CNE):
(14)
(15)
式中:σi是第i次測量的標準差。
所提方法通過蒙特卡羅模擬生成測量計劃,該測量計劃模擬多種類型的錯誤數(shù)據(jù)注入的粗差[11];基于創(chuàng)新指標概念的2個指標Π和CME將作為所提出檢測技術(shù)的輸入?yún)?shù)。為提高計算效率和避免不必要的資料浪費,使用主成分分析方法簡化數(shù)據(jù)庫。
測量計劃包括兩組測量:標準測量組(變電站現(xiàn)場測量)(SMS)和概率測量組(PMS)(蒙特卡羅模擬定義的測量)[12]。每個案例考慮400個蒙特卡羅樣本,它們被用來隨機確定一個測量計劃。
每個測量平均值的±3 dB內(nèi)的相關(guān)噪聲不被視為錯誤數(shù)據(jù)注入。為了建立數(shù)據(jù)庫,生成了3 000個具有以下特征的蒙特卡羅樣本:
(1)1 000個樣本考慮多個測量誤差 (數(shù)據(jù)輸入1)??紤]的粗差的測量集在3~20個測量值之間,集合及其大小隨機選擇,沒有臨界測量或臨界組的存在;
(2)1 000個樣本考慮參數(shù)誤差(數(shù)據(jù)輸入2),傳輸線的串聯(lián)阻抗在4~14 Ω變化。粗差直接添加到行串行參數(shù)的大小中;
(3)考慮拓撲排除誤差 (數(shù)據(jù)輸入3)的1 000個樣本,例如,排除一條線路;其中,被排除的輸電線路是隨機選擇的。
為通過Π和CME作為輸入?yún)?shù)識別發(fā)生的錯誤數(shù)據(jù)輸入,考慮Π和CME的平均值、最大和最小標準差;Π和CME的數(shù)據(jù)是通過具有2個測量平均值的蒙特卡洛模擬獲得。
所考慮的一個包含122個測量值的第1組完整測量計劃,測量結(jié)果如表1所示。其中,14個有功功率注入,14個無功功率注入,40個有功電流注入,40個無功電流注入和14個電壓值注入。
表1 所考慮的一個包含122個測量值的第1組完整測量計劃Tab.1 Analysis results of Group 1 measurement plan with 122 measurements
所考慮的一個包含81個測量值的第2組完整測量計劃,測量結(jié)果如表2所示。SMS為有功功率和無功功率的注入,以及節(jié)點1的電壓大小改變;PMS為由蒙特卡羅模擬定義的78個測量值,考慮有功和無功功率注入和功率流的正態(tài)分布函數(shù)。
表2 所考慮的一個包含81個測量值的第2組完整測量計劃Tab.2 Analysis results of group 2 measurement plan with 81 measurements
由表1、表2可知,其結(jié)果表明,Π和CME有潛力作為變量來檢測哪個數(shù)據(jù)輸入導致了粗差。因為最大值和最小值的平均值和標準差在2個測量平面上顯示出一定的模式。
為進行主成分分析,可在方陣的情況下使用特征向量分解(EDC)[13],在矩形矩陣的情況下使用奇異值分解(SVDC)[14]。
通過SVDC對復數(shù)值數(shù)據(jù)矩陣進行分解時,主成分分析中常用概念:
(1)組織數(shù)據(jù)集:定義一個維度為n×p的X矩陣,每列代表變量p的單個分組觀測;
(2)計算與平均值(B)的偏差:中心X減去列的平均值;
(3)求B的奇異值分解:[U,S,V]=SVDC(B)產(chǎn)生一個對角線矩陣S,其維數(shù)與B相同,具有按降序排列的非負對角線元素;通過單位矩陣U和V,使B=USVT;
(4)將COEFF=V定義為主分量的系數(shù),將SCORE =US定義為主要分量分數(shù),即X在主分量空間中的表示。SCORE行對應于觀測,列對應于主成分;
(5)通過Xnew=SCORE(:,1:z)×COEFF(:,1:z)T+mean(X)獲得近似重構(gòu)的向量。
分布式支持向量機是一套監(jiān)督機器學習方法,可用于數(shù)據(jù)模式分析和數(shù)據(jù)分類[15-16]。所使用的布式多分類支持向量機方法:
(1)一對一編碼設(shè)計,定義k(k-1)/2個支持向量機,其中k是唯一類標簽的數(shù)量;
(2)糾錯輸出碼模型,可減少3類或以上二進制分類器的分類問題。為此,定義一個編碼矩陣M∈{-1,0,1},其中零值表示類尚未對特定分類器的訓練進行分類,這就產(chǎn)生了不同的決策邊界,從而提高了多類問題分類的準確性;
(3)二進制丟失函數(shù)的解碼方案。使用Hinge損失函數(shù),它確定了二進制分類器的預測是如何聚合的[17],也就是說,將新的觀測結(jié)果分配給類C(控制裕度和訓練誤差之間轉(zhuǎn)換的參數(shù)),從而最大程度地減少所有k(k-1)/2支持向量機二進制的丟失聚合。
采用IEEE 57節(jié)點系統(tǒng)進行所提錯誤數(shù)據(jù)注入檢測方法的仿真實驗,并將所提方法對錯誤數(shù)據(jù)注入檢測效果與中基于矩陣分解算法的錯誤數(shù)據(jù)注入檢測方法(MST-FDJD)[18-20]進行了對比。
隨機誤差被添加到所有測量中。生成 3 000 個樣本用作訓練集(每種錯誤數(shù)據(jù)注入由1 000 個樣本組成)。生成150 000個樣本以測試訓練網(wǎng)絡 (每種錯誤數(shù)據(jù)注入由50 000個樣本組成)。
采用創(chuàng)新指標時,對IEEE 57節(jié)點系統(tǒng)錯誤數(shù)據(jù)注入的檢測準確率如表3所示。對IEEE 57節(jié)點網(wǎng)絡訓練,考慮具有339次測量的測量計劃(SMS為節(jié)點1、2、3的有功和無功能量注入及電壓幅度;PMS為由蒙特卡羅模擬定義的330次測量值,考慮有功、無功功率注入和能量流的正態(tài)分布函數(shù)以及功率流量和電壓幅度)。
由表3可知,不考慮網(wǎng)絡拓撲變化時所提方法對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)檢測的最大偏差為2.13%,MST-FDJD對IEEE-57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入檢測的最大偏差為3.0%;所提方法對所有錯誤數(shù)據(jù)注入的檢測準確率均高于MST-FDJD對該EG錯誤數(shù)據(jù)注入的檢測準確率。
表3 不考慮網(wǎng)絡拓撲變化時對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入的檢測準確率Tab.3 Detection accuracy of false data injection for IEEE 57-bus system without considering network topology changes
為驗證電力網(wǎng)絡拓撲變化時所提方法對電力網(wǎng)絡錯誤數(shù)據(jù)注入的識別準確率,考慮了線路拓撲的小重構(gòu)(在節(jié)點之間轉(zhuǎn)移分支或通過隔離器隔離分支)。采用創(chuàng)新指標時,考慮網(wǎng)絡拓撲變化時所提方法和MST-FDJD對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入的檢測準確率結(jié)果,具體如表4所示。
由表4可知,考慮網(wǎng)絡拓撲變化時所提方法對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入檢測的最大偏差為6.65%,MST-FDJD對IEEE-57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入的最大偏差為37.30%;所提方法對所有EG錯誤數(shù)據(jù)注入的檢測準確率均高于MST-FDJD對該EG錯誤數(shù)據(jù)注入的檢測準確率。
表4 考慮網(wǎng)絡拓撲變化時對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入的檢測準確率Tab.4 Detection accuracy of false data injection for IEEE 57-bus system considering network topology changes
采用創(chuàng)新指標或歸一化殘差指標時,對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入的檢測準確率結(jié)果,具體如表5所示。
表5 對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù) 注入的綜合檢測準確率Tab.5 Table Comprehensive detection accuracy of false data injection for IEEE 57-bus system
由表5可知,所提方法對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入的檢測準確率均超過99%,對IEEE 57節(jié)點系統(tǒng)的錯誤數(shù)據(jù)注入的檢測準確率均高于MST-FDJD,且使用創(chuàng)新指標時所提方法與MST-FDJD的對比效果更明顯。
以上對比結(jié)果表明,所提方法能夠準確檢測電力網(wǎng)絡的錯誤數(shù)據(jù)注入,且具有較好的泛化能力和較好的非線性數(shù)據(jù)分類能力。
提出基于分布式支持向量機的電力網(wǎng)絡錯誤數(shù)據(jù)注入檢測新方法。為驗證所提錯誤數(shù)據(jù)注入檢測方法的有效性,在IEEE 57節(jié)點系統(tǒng)上進行了錯誤數(shù)據(jù)注入檢測測試,并將檢測效果與基于矩陣分解算法的錯誤數(shù)據(jù)注入檢測方法進行了對比。結(jié)果表明,與已有方法相比,所提方法能夠更加準確地檢測電力網(wǎng)絡的錯誤數(shù)據(jù)注入,且具有較好的泛化能力和非線性數(shù)據(jù)分類能力。