王雅倩,周東國,胡文山
(武漢大學 電氣與自動化學院, 武漢 430072)
非侵入式電力負荷監(jiān)測(Non-intrusive Load Monitoring)技術的核心是辨識算法,主要包括優(yōu)化方法[1]、監(jiān)督學習方法[2-4]、非監(jiān)督學習方法[5-6]三類。優(yōu)化方法以整數(shù)規(guī)劃為依據(jù),建立負荷辨識模型;而監(jiān)督學習和非監(jiān)督學習以模式識別為理論支撐,其性能在一定程度上各具優(yōu)勢,成為目前研究的熱點。隨著國家電網(wǎng)、南方電網(wǎng)等電力單位的大力推進,如何開發(fā)和利用現(xiàn)有算法成為關注的焦點。為此,研究人員提出了各種性能評價測度來評估分解方法的性能。文獻[7]提出將準確識別電器負荷、開關事件的比例作為性能評價測度。文獻[8]根據(jù)精確度和召回率提出了F1度量的評價測度,精度是分解后的相關設備的功率值與分解后設備總的功率值的比率,召回率是分解后的相關設備的功率值與實際中設備的相關功率值的比率。文獻[9]用ROC曲線對非侵入式電力負荷分解算法進行性能評估。文獻[10]對該問題進行了較為系統(tǒng)的研究,建議分別考慮檢測準確度和分類準確度,提出了總體和個體負荷的誤檢率和漏檢率兩個測度,并給出了相應的檢測準確度、分解準確度和總體檢測度的計算公式。近年來,文獻[11]在2014年建立了ECO負荷數(shù)據(jù)庫,其采用召回率、準確率、精確率、總能耗相對誤差、均方絕對誤差等五項評價指標對各個非侵入式負荷算法模型在同一負荷數(shù)據(jù)集中進行評價。文獻[12]介紹了包括召回率、準確率、精確率、F1分數(shù)、NDE(Normalized Disaggregation Error)分數(shù)以及實時噪音等在內(nèi)的多種評價指標,并簡單闡述了各指標優(yōu)缺點和應用。
目前,準確率等直觀的單一效益性指標仍是衡量和驗證算法可行性和可靠性的主流方案,但是非侵入式負荷辨識易受訓練數(shù)據(jù)等因素的影響,單一的準確率等指標并不足以說明問題,甚至出現(xiàn)識別準確率畸高而實際辨識效果很差的情況。此時利用單一的準確率指標會出現(xiàn)決策失誤,不足以反映識別效果。此外,在實際應用中往往需要同時兼顧算法的多種性能,而同一算法在不同指標下的性能表現(xiàn)并不相同,因此,如何針對實際情況和側(cè)重需求建立綜合的評價體系也成為待解決的問題之一。
為此,文章提出一種基于融合決策的TOPSIS[13](Technique for Order Preference by Similarity to an Ideal Solution)模型評價非侵入式算法。它在傳統(tǒng)的TOPSIS模型上利用組合賦權(quán)法集AHP主觀賦權(quán)和變異系數(shù)法客觀賦權(quán)的優(yōu)點于一體,兼顧專家經(jīng)驗、工程實際以及客觀指標數(shù)據(jù)價值,避免了傳統(tǒng)TOPSIS模型中存在的權(quán)重確定單一易造成評價失真等問題。該模型基于TOPSIS方法集成其他方法的強大能力[15-17],采用融合權(quán)重為各指標賦權(quán)再通過TOPSIS法對有限負荷辨識算法進行決策排序,擇優(yōu)選擇,并將該方法應用于實際工程,為負荷辨識算法的綜合評價提供一種新的解決方案。
TOPSIS法[13-14]最初是由Hwang和Yoon在1981年提出,全稱為逼近于理想解的排序方法,其主要思想是通過計算評價對象與理想化目標和負理想化目標的接近程度對評價對象進行排序以確定其相對優(yōu)劣程度,從而選擇最佳方案。具體步驟如下:
(1)設某決策問題有M個評價對象構(gòu)成決策方案集{X1,X2,…,Xm};衡量方案屬性優(yōu)劣的n個評價指標,則M個評價對象的n個原始評價指標數(shù)據(jù)構(gòu)成矩陣X。
(1)
(2)將原始指標進行規(guī)范化處理得到規(guī)范化矩陣F。設xij為X矩陣中i個方案中第j個指標的值,其規(guī)范化后的值記為fij。
(3)
(3)構(gòu)造加權(quán)規(guī)范化矩陣。設由決策者給定的權(quán)重向量ω=[ω1,ω2,…,ωn]T,利用各指標權(quán)值和規(guī)范化矩陣F構(gòu)造加權(quán)規(guī)范化矩陣R。其中,rij為加權(quán)規(guī)范矩陣R中第i個方案中第j個指標的值。
rij=ωjfij(i=1,2,…,m;j=1,2,…,n)
(4)
(4)確定正、負理想解的集合R+、R-。指標中越大越好的為效益型指標,越小越好的為成本型指標。以效益型指標的最大值和成本性指標的最小值構(gòu)造R+、R-。
(5)
(5)計算各個方案分別與正、負理想解的距離D+、D-。
(6)
(6)計算各個方案與理想解的貼近度Wi,Wi值越大,該方案評價越優(yōu),反之越劣。
(7)
非侵入式算法評價過程實質(zhì)也是一個多指標綜合決策問題,TOPSIS方法對數(shù)據(jù)分布及樣本量、指標數(shù)無嚴格限制,原始數(shù)據(jù)的利用較充分,信息損失少且計算適中,是多目標決策分析中一種科學、常用的有效方法。TOPSIS法的重點是用于衡量方案的指標屬性權(quán)值的分配?,F(xiàn)有的權(quán)值確定方案有很多,主要包括兩類:主觀賦權(quán)法和客觀賦權(quán)法,但是單一權(quán)重都會造成評價結(jié)果失真。文獻[17]研究對比了TOPSIS與不同的權(quán)重確定方法進行集成組合后的優(yōu)劣性和原始數(shù)據(jù)的影響,建議集成TOPSIS與AHP兩種方法。AHP法允許人為決策,充分吸收專家經(jīng)驗,但主觀因素過強,很難直接應用于非侵入式算法評價。因此,為了保留評價指標的客觀信息,同時減低客觀賦權(quán)法對樣本數(shù)據(jù)的強依賴性,文章提出一種基于AHP和變異系數(shù)法的融合權(quán)重。
為了保留評價指標的客觀信息,同時減低客觀賦權(quán)法對樣本數(shù)據(jù)的強依賴性,文中提出一種基于AHP和變異系數(shù)法的融合權(quán)重。
(1)AHP
層次分析法[18-19](Analytic Hierarchy Process,簡稱AHP)由美國運籌學家T. L. Saaty教授于20世紀70年代初期提出。主要通過構(gòu)建遞階層次模型明確多指標之間的隸屬度關系,保證不同層元素的類別相似性和指標體系的排序合理性,非常適用于分析包含主觀信息的不確定性問題,是一種比較科學的確定權(quán)重的方法。其核心步驟為:
第一步:構(gòu)建遞階層次模型,劃分不同指標層次,確定隸屬關系;
第二步:明確下層元素對上層元素的相對重要性,利用二元對比法確定同層元素的比較矩陣;
第三步:通過歸一化確定下層指標對其上層指標的相對權(quán)重,逐層關聯(lián)遞進得到層次總權(quán)重。
設下層n個元素C1,C2,…,Cn對于上層某一元素的判斷矩陣為A:
(8)
式中cij表示元素i與元素j相對于上一層次因素重要性的比例標度值。采用二元對比法對同層指標兩兩比較,賦值依據(jù)為文獻[21]中T.L.Saaty提出的比例標度表,如表1所示。
表1 重要性比例標度表Tab.1 Scale of importance ratio
由矩陣A的數(shù)學性質(zhì)可知其為正定互反矩陣,存在最大特征根且唯一,因此,采用特征根法計算同層元素的相對權(quán)重。
AW=λmaxW
(9)
式中λmax是A的最大特征根;W是對應的特征向量,對W進行歸一化后即可作為權(quán)重向量ωA。
標準值2、4、6、8分別表示1、3、5、7、9之間的重要度賦值;且Wij=1/Wji,若矩陣A滿足:
cij×cjk=cik,i,j=1,2,…,n
(10)
稱矩陣A為一致陣。在判斷矩陣的構(gòu)造中,由于客觀事物的復雜性和主觀認識的多樣性,式(10)并不要求一定嚴格成立,但為了避免出現(xiàn)“元素甲比元素乙極端重要,元素乙比元素丙極端重要,而元素丙又比元素甲極端重要”的錯誤決策,對判斷矩陣進行一致性檢驗,計算一致性比率C.R.為:
(11)
式中R.I.表示平均隨機一致性指標,表2列出了1~14階矩陣計算1 000次得到的平均隨機一致性指標值;C.I.為一致性指標:C.I.=(λmax-n)/(n-1),n為矩陣A的階數(shù)。
表2 平均隨機一致性指標R.I.Tab.2 Average random consistency indicator R.I.
當C.R.小于閾值0.1[18,20]時,認為該判斷矩陣具有整體滿意的一致性,否則,需對判斷矩陣做出修正,如式(10)所示。
(2)變異系數(shù)法
變異系數(shù)法作為一種客觀賦權(quán)法主要通過評價指標的對比強度和變化幅度來衡量權(quán)值。在多指標決策過程中,若某一指標的值在不同待評價對象之間差異較大,說明該指標對待評價對象排序的貢獻較大,應當賦予相對更高的權(quán)值。
(12)
式中xij表示第j個評價對象的第i評價指標值。則指標變異系數(shù)Gi為:
(13)
歸一化后即可求得指標客觀賦權(quán):
(14)
采用基于理想點法的組合賦權(quán)法融合主觀權(quán)值ωA客觀權(quán)值ωB,使得指標賦權(quán)既能反應指標客觀規(guī)律,又能兼顧決策者的主觀需求和實際工程經(jīng)驗。
(15)
(16)
(17)
則融合權(quán)重:
(18)
由以上步驟得到非侵入式算法評價模型如圖1所示。
圖1 非侵入式算法評價模型Fig.1 Evaluation model of non-intrusive algorithm
針對現(xiàn)有單一準確率指標,精確度(pc)和召回率(rc)在樣本分布不均時可以提供補充的識別性能分析依據(jù);F1得分是pc和rc的調(diào)和均值,當兩者差距過大無法比較時,F(xiàn)1量度可以提供判斷依據(jù);此外,常用的能耗估值相對誤差等三個度量均是對功耗估值的誤差量度,都較為直觀。
在非侵入式負荷辨識算法中,效益型指標更為人們所關注。因此,結(jié)合實際工程應用的側(cè)重點,文章從負荷辨識結(jié)果和能耗分配過程兩個方面選擇六個效益型評價指標構(gòu)建評價模型,如表3所示。
表3 非侵入式算法評價指標Tab.3 Non-intrusive algorithm evaluation index
為了驗證文章方法的有效性,實驗一測試了DAE算法、RNN算法和DAE-RNN優(yōu)化算法在UK-DALE[22]公共數(shù)據(jù)集上對洗衣機、洗碗機、水壺、微波爐、冰箱共5種常用的電器設備的辨識,且只考慮單一狀態(tài)識別。表4列出了三種辨識方法對單一狀態(tài)設備的辨識分析結(jié)果[23-25],可以發(fā)現(xiàn),三種算法在不同的單一評價指標下排序差異較大,為了避免單一評價值的誤差干擾,綜合考慮多方評價因素,采用基于融合權(quán)重的TOPSIS法對算法進行優(yōu)劣排序。
表4 算法辨識結(jié)果Tab.4 Algorithm identification result
(1)AHP法:根據(jù)專家經(jīng)驗和實際側(cè)重,由表4得到判斷矩陣A,C1,C2,…,C6依次表示表4中的六種指標。由式(9)~式(11)計算得到一致性比率C.R.為0.004 6,經(jīng)驗證C.R.<0.1,通過一致性檢驗,求得主觀權(quán)重如表5所示。
(19)
(2)由式(12)~式(14)求得客觀權(quán)重ωB,由式(15)~式(18)組合賦權(quán)求得融合權(quán)重ω,如表5所示。
表5 融合權(quán)重Tab.5 Fusion weight
W3>W1>W2,即單狀態(tài)設備辨識中,DAE-RNN算法最優(yōu),DAE算法次之,RNN算法性能最差。根據(jù)訓練期間電器可見的數(shù)據(jù)和使用訓練期電器不可見的數(shù)據(jù)訓練優(yōu)化網(wǎng)絡的識別結(jié)果。DAE神經(jīng)網(wǎng)絡對單狀態(tài)負荷辨識性能優(yōu)于RNN網(wǎng)絡,在保持準確率和精確度優(yōu)勢上,能耗分配準確率也相對較高。DAE-RNN優(yōu)化結(jié)構(gòu)總體應用性能都在其他兩者之上,在保留了DAE網(wǎng)絡單狀態(tài)電器識別準確率優(yōu)勢的基礎上提高了F1得分,保證算法能更好地處理數(shù)據(jù)分布不均的情況,是辨識算法更加穩(wěn)定可靠,證明了基于融合權(quán)重的改進TOPSIS模型評價結(jié)果與實際工程性能相符,證明文章方法實際有效可行。
3.1.1 指標賦權(quán)對比分析
對比分析由主觀賦權(quán)AHP法、客觀賦權(quán)變異系數(shù)法、組合優(yōu)化賦權(quán)法所得的指標權(quán)重結(jié)果,如圖2所示。采用AHP賦權(quán)時能耗估值正確率和總功率正確分配率重要性相近,但原始數(shù)據(jù)中三種算法的能耗估值正確率差異較大;而單獨采用客觀賦權(quán)時會過分夸大數(shù)據(jù)波動性,對樣本數(shù)據(jù)依賴性較大,容易忽略實際工程需求,不能體現(xiàn)評估指標自身價值的重要性?;谧顑?yōu)組合賦權(quán)的融合權(quán)重可以對兩者進行適當調(diào)節(jié),實現(xiàn)優(yōu)勢互補,得到更為合理科學的評價結(jié)果。
3.1.2 指標個數(shù)及選擇對評價結(jié)果的影響
考慮到多指標決策過程中指標個數(shù)及選取對評價結(jié)果的影響,實驗測試了四個指標、五個指標共21種組合方式下上述三種算法的評價結(jié)果,所有實驗數(shù)據(jù)均相同,實驗結(jié)果如表6所示,其中F1,F(xiàn)2,F(xiàn)3依次從左至右表示表4中三種算法,C1、C2、C3、C4、C5、C6依次從上至下表示表4中6種評價指標。分析測試結(jié)果得到如下結(jié)論:
表6 指標組合與評價結(jié)果Tab.6 Indicator combination and evaluation results
(1)四個指標組合中排序正確率為2/3;五個指標組合中排序正確率為5/6,由于篇幅限制和文章旨在多指標評價,因此一、二、三個指標組合排序?qū)嶒灢⑽丛诖肆谐?。隨著指標的增加,排序正確率逐漸增大且趨近于正確排序;
(2)通過分析,主觀賦權(quán)權(quán)重最大的指標和不同方案間實際數(shù)據(jù)差異最大的指標會對評價結(jié)果產(chǎn)生一定影響;
(3)實際應用中可以通過統(tǒng)計學方法測試不同指標組合的評價結(jié)果確定適合的指標個數(shù)并判斷最終正確排序。
實驗二在某家庭用戶場景下測試了關聯(lián)RNN算法、LSTM以及Bi-LSTM(雙向長短期記憶網(wǎng)絡)算法對電采暖1,2,3檔、電燉鍋、泡腳桶、電吹風冷風、熱風檔、電磁爐、高壓鍋、打印機、電飯鍋、豆?jié){機、電視共13種用電狀態(tài)的辨識結(jié)果,如表7所示。按照案例一的評價步驟對三種算法進行排序,結(jié)果如表8所示。
表7 算法辨識結(jié)果Tab.7 Algorithm identification result
表8 融合權(quán)重Tab.8 Fusion weight
為了綜合評估電力負荷辨識算法的可靠性和可行性,避免單一評價指標造成辨識失誤等問題,選取六種互補的效益型評價指標,采用基于AHP和變異系數(shù)法融合賦權(quán)的TOPSIS模型,兼顧客觀數(shù)據(jù)信息和專家經(jīng)驗主觀決策,利用逼近于理想解的排序方法計算評價對象與正負理想解的接近程度,實現(xiàn)對非侵入式算法的評價。最后通過實際案例驗證文中方法有效性和可行性,為研究非侵入式電力負荷辨識領域算法的分類、評價及選取提供一種新的解決方案。