王鐵強(qiáng),魯鵬,曹欣,楊曉東,王維,呂昊,馮春賢,田潮,石皓巖,梁海平
(1. 國(guó)網(wǎng)河北省電力有限公司,石家莊市 050023;2. 國(guó)網(wǎng)北京市電力公司亦莊供電公司,北京市 100176;3. 華北電力大學(xué)電力工程系,河北省保定市 071003)
實(shí)際電網(wǎng)在運(yùn)行中,每5~15 min會(huì)整體記錄區(qū)域內(nèi)電網(wǎng)的運(yùn)行情況,包括保存這一時(shí)刻電網(wǎng)各節(jié)點(diǎn)電壓(幅值和相角)、母線和支路運(yùn)行狀態(tài)等各種運(yùn)行信息,以及在這一狀態(tài)下電網(wǎng)調(diào)度和控制的工作票信息。電網(wǎng)運(yùn)行多年來(lái),通過(guò)各種途徑和方式存儲(chǔ)了大量歷史數(shù)據(jù)和信息,然而這些歷史信息目前沒(méi)能在電力系統(tǒng)的運(yùn)行和控制中得到充分利用。隨著智能電網(wǎng)的不斷進(jìn)步,依靠電網(wǎng)工作人員的經(jīng)驗(yàn)配合“模型”輔助分析處理電網(wǎng)運(yùn)行數(shù)據(jù)的傳統(tǒng)模式已不能滿足電網(wǎng)安全穩(wěn)定運(yùn)行的需要[1]。新一代人工智能算法的進(jìn)步和多源異構(gòu)信息融合技術(shù)開(kāi)辟了“數(shù)據(jù)”替代“模型”的技術(shù)思路,并逐漸成為電力領(lǐng)域中的研究熱點(diǎn)[2]。
深度學(xué)習(xí)作為機(jī)器學(xué)習(xí)的一種類型,其主要應(yīng)用于大數(shù)據(jù)挖掘和智能控制技術(shù)領(lǐng)域,并使該領(lǐng)域得到迅猛發(fā)展。深度學(xué)習(xí)算法通過(guò)模仿人腦處理認(rèn)知的方式,將信息進(jìn)行多層提取,其在大數(shù)據(jù)領(lǐng)域展現(xiàn)出了突出的特征提取能力。深度學(xué)習(xí)在各類智能系統(tǒng)領(lǐng)域,如語(yǔ)義理解、圖像識(shí)別領(lǐng)域等,以歷史數(shù)據(jù)挖掘?yàn)榛A(chǔ),表現(xiàn)出良好的長(zhǎng)短期預(yù)測(cè)能力與分類識(shí)別能力,在專業(yè)領(lǐng)域中擁有著越來(lái)越深的影響力[3-4]。近年來(lái),電力領(lǐng)域與深度學(xué)習(xí)也正在加速融合,新一代人工智能算法在長(zhǎng)短期負(fù)荷預(yù)測(cè)[5-6]、安全態(tài)勢(shì)感知[7]、充電樁布局[8]、電力系統(tǒng)暫穩(wěn)態(tài)評(píng)估[9-10]等多個(gè)領(lǐng)域已具有一部分研究和應(yīng)用,并且以其深層架構(gòu)對(duì)高維數(shù)據(jù)特征提取的優(yōu)勢(shì)向業(yè)者展示了優(yōu)越性能。例如文獻(xiàn)[10]借助深度置信網(wǎng)絡(luò)的深層架構(gòu)提取特征的優(yōu)越性,將電網(wǎng)穩(wěn)定結(jié)果和系統(tǒng)特征之間的內(nèi)在聯(lián)系加以提取并訓(xùn)練相應(yīng)模型,建立了基于深度學(xué)習(xí)的電力系統(tǒng)暫態(tài)穩(wěn)定評(píng)估方法。文獻(xiàn)[11]介紹了深度學(xué)習(xí)的知識(shí)架構(gòu)和實(shí)踐基礎(chǔ),以圖像數(shù)據(jù)和時(shí)空數(shù)據(jù)為基礎(chǔ)綜述了深度學(xué)習(xí)在電力系統(tǒng)大數(shù)據(jù)處理中的重點(diǎn)應(yīng)用和技術(shù)展望。目前,電網(wǎng)系統(tǒng)研究人員已經(jīng)進(jìn)行了一定的探索,以使深度學(xué)習(xí)服務(wù)于電網(wǎng),提高電網(wǎng)規(guī)范化、自動(dòng)化和智能化管理[12-14],但通過(guò)總結(jié)發(fā)現(xiàn),現(xiàn)有研究中的“大數(shù)據(jù)”更多指的是當(dāng)前運(yùn)行狀態(tài)所具有的數(shù)據(jù),研究目的側(cè)重于某種模式或規(guī)則的提取,而非針對(duì)電網(wǎng)存儲(chǔ)大量歷史數(shù)據(jù)的深入探索和利用,尚未將歷史信息的價(jià)值最大化。
本文定義電網(wǎng)某一時(shí)刻的整體運(yùn)行狀態(tài)為一個(gè)電網(wǎng)運(yùn)行斷面,運(yùn)行斷面信息包括該時(shí)刻電網(wǎng)各部分的運(yùn)行數(shù)據(jù)。歷史運(yùn)行斷面作為一類電網(wǎng)大數(shù)據(jù),可用機(jī)器學(xué)習(xí)或深度學(xué)習(xí)算法進(jìn)行特征處理以及數(shù)據(jù)挖掘,匹配出有價(jià)值的歷史相似斷面。此外歷史工作票信息與歷史運(yùn)行斷面按照相同的時(shí)間戳進(jìn)行存儲(chǔ),其中包含運(yùn)行風(fēng)險(xiǎn)點(diǎn)、調(diào)度措施等有重要價(jià)值的信息。然而目前工作票及其方案制定需要大量校核工作,且嚴(yán)重依賴調(diào)度人員的工作經(jīng)驗(yàn)。本文期望通過(guò)歷史運(yùn)行斷面相似性匹配技術(shù),快速檢索到歷史上相對(duì)有效的運(yùn)行方式、檢修計(jì)劃、安全措施預(yù)案等信息,為電網(wǎng)運(yùn)行人員提供智能決策輔助奠定技術(shù)基礎(chǔ)。
現(xiàn)階段對(duì)電網(wǎng)運(yùn)行斷面的研究較少,文獻(xiàn)[15]采用改進(jìn)的K-means算法,構(gòu)造相似度評(píng)價(jià)體系,對(duì)電網(wǎng)運(yùn)行斷面進(jìn)行較為高效的匹配。而改進(jìn)K-means算法作為一種相對(duì)簡(jiǎn)單的機(jī)器學(xué)習(xí)算法,不能充分挖掘斷面的特征信息,匹配準(zhǔn)確率仍有提升空間。深度學(xué)習(xí)在特征提取方面性能更為優(yōu)越。常用的深度學(xué)習(xí)模型有深層神經(jīng)網(wǎng)絡(luò)(deep neural network, DNN)、卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network, CNN)、深度置信網(wǎng)絡(luò)(deep belief network, DBN)和堆疊自動(dòng)編碼器(stacked auto encoder, SAE)等[9]。其中SAE、CNN算法在數(shù)字圖像處理與模式識(shí)別方面被普遍應(yīng)用[16-17]。圖像在數(shù)據(jù)層面上可表示為像素點(diǎn)尺度的二維特征值矩陣,同時(shí)電網(wǎng)運(yùn)行斷面通常也易構(gòu)造為二維矩陣,采用深度學(xué)習(xí)算法時(shí)無(wú)需復(fù)雜的數(shù)據(jù)維度變換。此外,SAE以其多層自動(dòng)編碼器堆疊的特殊結(jié)構(gòu),和“無(wú)監(jiān)督預(yù)訓(xùn)練”加“監(jiān)督微調(diào)”的訓(xùn)練思路,具有結(jié)構(gòu)靈活可調(diào)、對(duì)樣本要求較低、特征提取能力強(qiáng)、訓(xùn)練難度小等優(yōu)點(diǎn),因此SAE算法能夠較好地適用于電網(wǎng)運(yùn)行斷面匹配問(wèn)題。
基于以上現(xiàn)狀分析和已有研究,本文利用深度學(xué)習(xí)算法展開(kāi)電網(wǎng)歷史運(yùn)行斷面相似性匹配研究。本文選取適當(dāng)?shù)奶卣髁考?,并將斷面以特征量矩陣的形式表現(xiàn)出來(lái),利用堆疊自動(dòng)編碼器,開(kāi)展電網(wǎng)運(yùn)行斷面相似性匹配研究。最后以IEEE 39節(jié)點(diǎn)系統(tǒng)為基礎(chǔ)構(gòu)建仿真算例,算例結(jié)果表明,堆疊自動(dòng)編碼器算法在電網(wǎng)運(yùn)行斷面相似性匹配領(lǐng)域有著十分優(yōu)越的性能和應(yīng)用價(jià)值。
自動(dòng)編碼器 (automatic encoder, AE)是一種無(wú)監(jiān)督的神經(jīng)網(wǎng)絡(luò),其核心作用是挖掘輸入數(shù)據(jù)的深層表示,并盡可能準(zhǔn)確地重建原始輸入,其主要應(yīng)用在兩方面:特征提取和非線性降維[18]。AE模型的結(jié)構(gòu)如圖1所示。
圖1 自動(dòng)編碼器結(jié)構(gòu)Fig.1 Structural diagram of automatic encoder
AE的整體結(jié)構(gòu)共分三層:輸入層、隱含層和輸出層,由編碼器和解碼器兩部分構(gòu)成。其中輸入層數(shù)據(jù)集x可表示為:
x=[x1,x2,…,xn]T
(1)
式中:xn為輸入x的元素;n為輸入向量的維度。首先,編碼器將輸入層x通過(guò)映射函數(shù)f(x)投影至隱含層,隱含層數(shù)據(jù)集h可表示為:
h=[h1,h2,…,hm]T
(2)
式中:hm為隱含層h的元素;m為隱含層的維度。其中映射函數(shù)f(x)可表示為:
h=f(x)=σ(wx+b)
(3)
式中:w是權(quán)重矩陣;b是偏差向量;σ(x)是解碼器的激活函數(shù),有sigmoid函數(shù)、tanh函數(shù)等多種選擇。
(4)
(5)
(6)
圖2 堆疊自動(dòng)編碼器結(jié)構(gòu)Fig.2 Structural diagram of stacked automatic encoder
由于SAE具有AE無(wú)監(jiān)督學(xué)習(xí)的特性,因此SAE的模型訓(xùn)練包含無(wú)監(jiān)督的預(yù)訓(xùn)練與有監(jiān)督的參數(shù)微調(diào)2個(gè)階段。以圖2所示結(jié)構(gòu)為例,在預(yù)訓(xùn)練階段,堆疊自動(dòng)編碼器網(wǎng)絡(luò)的訓(xùn)練獨(dú)立逐層進(jìn)行。第一層AE構(gòu)成的隱含層h(1)根據(jù)式(6)訓(xùn)練獲得第一級(jí)輸入的特征,然后以該隱含層的特征輸出作為隱含層新的輸入來(lái)訓(xùn)練第二層網(wǎng)絡(luò)h(2),以此形式多層疊加,后續(xù)的隱藏層以此類推。在微調(diào)階段,將SAE的所有層級(jí)視為一個(gè)整體網(wǎng)絡(luò)模型,使用有標(biāo)簽的訓(xùn)練集對(duì)其再次訓(xùn)練,對(duì)網(wǎng)絡(luò)的權(quán)重、偏差等參數(shù)再次微調(diào)。
由以上分析可以得知,SAE網(wǎng)絡(luò)因?yàn)榫哂芯幋a器的特性,相比于DNN而言隱藏層可以設(shè)置更少數(shù)量的神經(jīng)元。此外采用無(wú)監(jiān)督預(yù)訓(xùn)練以及有監(jiān)督的參數(shù)微調(diào)的兩階段訓(xùn)練模式,可以使用大量的無(wú)監(jiān)督的數(shù)據(jù)集進(jìn)行挖掘,突破了DNN僅能使用有監(jiān)督訓(xùn)練的限制。該網(wǎng)絡(luò)結(jié)構(gòu)具有強(qiáng)大的降維和特征表達(dá)能力,且隨著網(wǎng)絡(luò)結(jié)構(gòu)的增加,還能學(xué)習(xí)并提取出更加高階的特征,具有深度神經(jīng)網(wǎng)絡(luò)的所有優(yōu)點(diǎn)。本文所提運(yùn)行斷面相似性匹配的思路,需要將電網(wǎng)運(yùn)行斷面龐大的信息規(guī)模有效降維,且盡可能不丟失原有關(guān)鍵信息,由算法實(shí)現(xiàn)原理和網(wǎng)絡(luò)結(jié)構(gòu)可見(jiàn),該算法能較好地應(yīng)用于歷史運(yùn)行斷面的相似性匹配。
(7)
(8)
式中:ρ為一個(gè)接近于0的稀疏參數(shù)。
(9)
式中:β為DKL約束懲罰項(xiàng)的權(quán)重系數(shù);S2為單一隱藏層神經(jīng)元個(gè)數(shù)。
綜上,引入稀疏自編碼后,由于增加了稀疏約束項(xiàng),網(wǎng)絡(luò)的特征提取能力大大增強(qiáng),且在一定程度上增加了訓(xùn)練速度。
本文利用堆疊自動(dòng)編碼器開(kāi)展運(yùn)行斷面相似性匹配工作,雖然借助深層網(wǎng)絡(luò)可以挖掘輸入數(shù)據(jù)的各級(jí)特征,但由于現(xiàn)階段的電力系統(tǒng)數(shù)據(jù)仍然以不同形式儲(chǔ)存在不同部門,所以須將歷史信息進(jìn)行一定程度的初始化操作。
根據(jù)現(xiàn)有文獻(xiàn),可以得出電力領(lǐng)域數(shù)據(jù)挖掘的一般步驟為:1)對(duì)電網(wǎng)的數(shù)據(jù)進(jìn)行清理、整合;2)根據(jù)電力系統(tǒng)數(shù)據(jù)本身的特性,構(gòu)建能表征電網(wǎng)運(yùn)行信息的特征量庫(kù);3)對(duì)特征量按照統(tǒng)計(jì)特性以及算法特性進(jìn)行相應(yīng)調(diào)整,使其滿足算法的標(biāo)準(zhǔn);4)選用合適的機(jī)器學(xué)習(xí)算法進(jìn)行數(shù)據(jù)挖掘。根據(jù)上述技術(shù)路線,本文構(gòu)建了靜態(tài)物理量特征量庫(kù)。采用靜態(tài)物理量可充分刻畫電網(wǎng)運(yùn)行斷面特征,并省去電網(wǎng)暫態(tài)分析的復(fù)雜計(jì)算,提高算法訓(xùn)練效率。此外原始靜態(tài)特征量庫(kù)中,既包含了功率、電壓等直接反映運(yùn)行斷面狀態(tài)的物理量,也包含了系統(tǒng)脆弱節(jié)點(diǎn)[21]、系統(tǒng)網(wǎng)架結(jié)構(gòu)[22]等反映系統(tǒng)結(jié)構(gòu)復(fù)雜程度的指標(biāo)。
在實(shí)際電網(wǎng)數(shù)據(jù)中,由于各原始特征量之間的量綱、取值范圍均可能有較大差異,因此需用統(tǒng)計(jì)映射改進(jìn)原始特征量,在一定程度上提升訓(xùn)練模型的準(zhǔn)確性。電網(wǎng)改進(jìn)靜態(tài)特征量庫(kù)F中的第i個(gè)元素Fi可由式(10)表示:
Fi=gi(pi)
(10)
式中:gi為統(tǒng)計(jì)映射,gi∈G,G為統(tǒng)計(jì)映射集。在本文中,統(tǒng)計(jì)映射集G中包含取最大值、最小值、歸一化等統(tǒng)計(jì)運(yùn)算;pi為原始特征量,pi∈P,P為原始特征量庫(kù),如表1所示。
表1 原始靜態(tài)特征量庫(kù)Table 1 Original static feature library
按照上述方法,可在原始靜態(tài)特征量的基礎(chǔ)上獲得大量的改進(jìn)靜態(tài)特征量來(lái)表征運(yùn)行斷面。在改進(jìn)靜態(tài)特征量集中選取合適的特征量,并對(duì)其標(biāo)準(zhǔn)化,即構(gòu)成矩陣形式的電網(wǎng)運(yùn)行斷面樣本。
為說(shuō)明本文中運(yùn)行斷面樣本的形式,在此首先以3機(jī)9節(jié)點(diǎn)系統(tǒng)為基礎(chǔ)(見(jiàn)圖3),構(gòu)建該系統(tǒng)某一時(shí)刻運(yùn)行斷面的矩陣樣本,如表2所示。設(shè)樣本元素維度為ns,特征量維度為ms,則矩陣樣本維度為ns×ms。選取的特征量分別為機(jī)組有功出力、機(jī)組無(wú)功出力、節(jié)點(diǎn)有功負(fù)荷、節(jié)點(diǎn)無(wú)功負(fù)荷、節(jié)點(diǎn)電壓幅值(標(biāo)幺值表示)、節(jié)點(diǎn)電壓相角、線路有功潮流、無(wú)功潮流、機(jī)組開(kāi)停信息(開(kāi)機(jī)為1,停機(jī)為0),共9個(gè)特征量,構(gòu)成了9×9的訓(xùn)練樣本。其中線路潮流所對(duì)應(yīng)線路分別為1-2、1-3、2-4、3-6、4-5、5-6、9-1、7-4、8-6。
如表2所示,該系統(tǒng)的某一運(yùn)行斷面樣本即為表中數(shù)據(jù)所展示的9×9維矩陣。由此可見(jiàn),該矩陣包含了這一運(yùn)行斷面的大部分信息,匹配結(jié)果更加準(zhǔn)確可信。
圖3 3機(jī)9節(jié)點(diǎn)系統(tǒng)接線圖Fig.3 Connection diagram of 9-node test system
在構(gòu)建樣本數(shù)據(jù)后,將樣本劃分為有標(biāo)簽樣本集與無(wú)標(biāo)簽樣本集。針對(duì)樣本標(biāo)簽的生成,本文參考文獻(xiàn)[15]中的相似性評(píng)價(jià)體系評(píng)分方法,在向量指標(biāo)相似性度量、集合指標(biāo)相似性度量的基礎(chǔ)上,采用變異系數(shù)法對(duì)運(yùn)行斷面樣本進(jìn)行相似性評(píng)分,從0~100劃分10個(gè)分值區(qū)間將標(biāo)簽樣本集劃為10類,并生成標(biāo)簽。
由第2節(jié)分析可知,SAE的訓(xùn)練分為2個(gè)階段。因此在構(gòu)建訓(xùn)練集與測(cè)試集時(shí),處理好的樣本共被分成3組,其中,第1組T1為無(wú)標(biāo)簽樣本集,用于進(jìn)行第一階段的無(wú)監(jiān)督預(yù)訓(xùn)練;第二組T2為帶標(biāo)簽的訓(xùn)練樣本集,用于開(kāi)展第二階段的全網(wǎng)絡(luò)監(jiān)督微調(diào);第三組T3為測(cè)試樣本集,用于測(cè)試最終模型的匹配準(zhǔn)確度。按照以上方法構(gòu)建樣本集并進(jìn)行劃分,能夠有效地訓(xùn)練SAE模型,達(dá)到電網(wǎng)斷面匹配的效果。
本文采用IEEE 39節(jié)點(diǎn)系統(tǒng)為基礎(chǔ)構(gòu)建樣本數(shù)據(jù)集,對(duì)所提方法進(jìn)行驗(yàn)證。各負(fù)荷節(jié)點(diǎn)功率數(shù)據(jù)在原有潮流分布基礎(chǔ)上的±15%范圍內(nèi)隨機(jī)調(diào)整[23],機(jī)組出力在原有潮流分布前提下的±35%范圍內(nèi)隨機(jī)調(diào)整,且保證各節(jié)點(diǎn)電壓幅值處于0.95~1.05 pu的合理范圍內(nèi)?;A(chǔ)網(wǎng)架結(jié)構(gòu)如圖4所示。
圖4 IEEE 39節(jié)點(diǎn)系統(tǒng)接線圖Fig.4 Connection diagram of IEEE 39-node System
本文首先構(gòu)建10 000個(gè)運(yùn)行斷面樣本作為基礎(chǔ)樣本集,每一樣本內(nèi)包含節(jié)點(diǎn)電壓值、線路功率潮流、負(fù)荷節(jié)點(diǎn)功率、機(jī)組節(jié)點(diǎn)出力、機(jī)組功率因數(shù)等多方面數(shù)據(jù),從而構(gòu)成了一個(gè)28×28維的運(yùn)行斷面樣本。并將其分成無(wú)標(biāo)簽樣本集T1、訓(xùn)練樣本集T2和測(cè)試樣本集T3三組。標(biāo)簽的標(biāo)注按照參考文獻(xiàn)[15]的方法,按照樣本的負(fù)荷水平、電壓水平、關(guān)鍵節(jié)點(diǎn)等特征指標(biāo)構(gòu)建相似度評(píng)價(jià)體系。評(píng)分后將一部分樣本分為10類,標(biāo)簽為0,1,…,9,以此構(gòu)建有標(biāo)簽樣本集。
表2 3機(jī)9節(jié)點(diǎn)樣本示例Table 2 Sample of 9 nodes and 3 generators
整個(gè)網(wǎng)絡(luò)的訓(xùn)練分為2個(gè)步驟:
1)首先設(shè)置網(wǎng)絡(luò)初始參數(shù),構(gòu)建網(wǎng)絡(luò)結(jié)構(gòu)。選取激活函數(shù),本文選取sigmoid函數(shù),設(shè)置網(wǎng)絡(luò)學(xué)習(xí)率為1,并在訓(xùn)練的末尾縮減學(xué)習(xí)率,使更新的步長(zhǎng)逐漸變小,以控制學(xué)習(xí)速度;為避免模型過(guò)擬合,權(quán)值懲罰項(xiàng)選用L2型懲罰項(xiàng);稀疏項(xiàng)的神經(jīng)元平均激活度按式(7)計(jì)算。利用T1對(duì)SAE進(jìn)行無(wú)監(jiān)督預(yù)訓(xùn)練,通過(guò)這些樣本和逐層編碼器得到預(yù)訓(xùn)練階段的權(quán)重和偏差參數(shù)。本文所設(shè)定的網(wǎng)絡(luò)結(jié)構(gòu)為Ssize=[784,200,100,10]。
圖5 算例中堆疊自動(dòng)編碼器的網(wǎng)絡(luò)結(jié)構(gòu)Fig.5 Network structure of stacked self-encoder in the example
模型訓(xùn)練完成之后,用測(cè)試訓(xùn)練集T3驗(yàn)證模型優(yōu)化效果。首先將分類正確的樣本數(shù)量與測(cè)試樣本總數(shù)的比值定為匹配準(zhǔn)確率。反之,將錯(cuò)誤分類樣本數(shù)量與測(cè)試樣本總數(shù)的比值稱為匹配錯(cuò)誤率。為全面分析堆疊自動(dòng)編碼器的匹配性能,本文將不同算法的測(cè)試結(jié)果進(jìn)行對(duì)比。其中,CNN算法所用樣本與SAE一致。K-means算法相較于深度學(xué)習(xí)算法在數(shù)據(jù)處理步驟上較為繁瑣,采用大樣本計(jì)算難度較大,同時(shí)為了加強(qiáng)算法效果對(duì)比的直觀性,故采用與文獻(xiàn)[15]相同的260個(gè)樣本數(shù)量。K-means算法的聚類特征量篩選自第2節(jié)的特征量庫(kù),按照樣本間距離聚類,對(duì)比聚類結(jié)果與樣本標(biāo)簽得到該算法的匹配準(zhǔn)確率。樣本間距離計(jì)算公式為閔可夫斯基距離計(jì)算式,如式(11)所示。
(11)
式中:E1、E2為兩樣本特征量向量;E1m表示樣本1的第m個(gè)特征量;E2m表示樣本2的第m個(gè)特征量。本文通過(guò)算例驗(yàn)證得出不同算法匹配的準(zhǔn)確率情況如表3所示。
表3 不同算法的匹配準(zhǔn)確率Table 3 Matching accuracy of different algorithms
由表3可知,SAE算法以及CNN算法基于其深度架構(gòu)和大數(shù)據(jù)處理能力,匹配準(zhǔn)確率明顯高于K-means算法,均達(dá)到了90%以上,而K-means算法準(zhǔn)確率不足90%。但深度學(xué)習(xí)模型一般所需樣本數(shù)量較多,且需要大量帶有標(biāo)簽的樣本,這使得算法應(yīng)用難度和數(shù)據(jù)預(yù)處理難度都大大增加。為深入對(duì)比分析上述兩者的差別,本文從匹配錯(cuò)誤率隨迭代次數(shù)變化的角度出發(fā),通過(guò)多次測(cè)試,擬合出SAE和CNN匹配錯(cuò)誤率變化曲線(見(jiàn)圖6)。
圖6 匹配準(zhǔn)確率隨迭代次數(shù)的變化情況Fig.6 Changing of matching accuracy with iteration number
由圖6可知,SAE和CNN的匹配錯(cuò)誤率隨迭代次數(shù)的增加逐步降低,即分類器的參數(shù)在此過(guò)程中逐步優(yōu)化。其中,堆疊自動(dòng)編碼器的錯(cuò)誤率下降速度明顯高于卷積神經(jīng)網(wǎng)絡(luò),這是由于SAE第一階段的無(wú)標(biāo)簽預(yù)訓(xùn)練能夠?yàn)橄乱浑A段的有標(biāo)簽訓(xùn)練提供良好的初始權(quán)值,使得該方法的錯(cuò)誤率下降速度較快。
為了進(jìn)一步評(píng)價(jià)算法的實(shí)用性,本文對(duì)SAE算法以及CNN算法的訓(xùn)練收斂時(shí)間也進(jìn)行了統(tǒng)計(jì)。設(shè)SAE算法的收斂時(shí)間為預(yù)訓(xùn)練時(shí)間加整體網(wǎng)絡(luò)微調(diào)時(shí)間,CNN收斂時(shí)間為整體網(wǎng)絡(luò)訓(xùn)練時(shí)間。本次驗(yàn)證的硬件平臺(tái)為CPU:Intel Core i5-7300HQ (2.50 GHz),RAM:8 GB;軟件平臺(tái)為操作系統(tǒng):Windows10;深度學(xué)習(xí)框架:Python+Tensorflow。在以上條件下,SAE算法預(yù)訓(xùn)練時(shí)間73 min,參數(shù)微調(diào)時(shí)間為168 min,整體收斂時(shí)間為241 min。CNN算法收斂時(shí)間為197 min??梢钥闯?,SAE算法的整體耗時(shí)相比CNN算法更長(zhǎng)。本文認(rèn)為這一現(xiàn)象的原因在于SAE算法的2個(gè)階段訓(xùn)練形式,在一定程度上耗費(fèi)了更多的處理時(shí)間。盡管相較于CNN算法訓(xùn)練收斂更耗時(shí)一些,但是本文認(rèn)為該部分差異處在工程實(shí)踐中可以接受的范圍內(nèi)。
由上述分析可知,SAE算法相比于K-means算法以及CNN算法而言,具有更高的準(zhǔn)確率,更良好的數(shù)據(jù)挖掘能力,在電網(wǎng)運(yùn)行斷面相似性匹配領(lǐng)域性能表現(xiàn)良好,有較強(qiáng)的應(yīng)用價(jià)值。
本文提出了基于堆疊自動(dòng)編碼器的電網(wǎng)歷史運(yùn)行斷面相似性匹配的思路和方法。參考圖片分類和人臉識(shí)別技術(shù),首先開(kāi)展了運(yùn)行斷面特征化工作,使得訓(xùn)練樣本能夠從多種靜態(tài)物理量準(zhǔn)確表征運(yùn)行斷面,從而保證了匹配精度。然后在IEEE 39節(jié)點(diǎn)系統(tǒng)的基礎(chǔ)上,利用構(gòu)建的帶標(biāo)簽樣本數(shù)據(jù),對(duì)自動(dòng)編碼器進(jìn)行了訓(xùn)練,訓(xùn)練分為逐層無(wú)監(jiān)督預(yù)訓(xùn)練和監(jiān)督微調(diào)2個(gè)階段。訓(xùn)練完成后,利用測(cè)試樣本集對(duì)該模型的匹配性能進(jìn)行了評(píng)估,并與其他算法進(jìn)行了對(duì)比分析。算例結(jié)果表明,訓(xùn)練后的模型表現(xiàn)出良好的電網(wǎng)運(yùn)行斷面數(shù)據(jù)挖掘能力,相似性匹配的準(zhǔn)確率和匹配效率較高。這也證明,堆疊自動(dòng)編碼器在電網(wǎng)運(yùn)行斷面相似性匹配領(lǐng)域具有良好的性能和應(yīng)用價(jià)值。這一方法的實(shí)現(xiàn)可為電網(wǎng)工作者提供更有價(jià)值的歷史工作票信息,為實(shí)現(xiàn)電網(wǎng)智能化運(yùn)維奠定了基礎(chǔ)。