◆王璐 程曉榮
基于大數(shù)據(jù)的信息融合技術(shù)在電力系統(tǒng)中的應(yīng)用
◆王璐 程曉榮
(華北電力大學(xué)(保定) 控制與計算機(jī)工程學(xué)院 河北 071000)
伴隨著電力行業(yè)中系統(tǒng)和設(shè)備的不斷升級,出現(xiàn)了大量需要處理的數(shù)據(jù)集,電力行業(yè)進(jìn)入大數(shù)據(jù)時期。這使得傳統(tǒng)的電力系統(tǒng)無法滿足新的需求,所以引進(jìn)新的算法和框架。本文首先分析了傳統(tǒng)數(shù)據(jù)融合算法的缺點,然后分析了新的Hermite正交基前神經(jīng)網(wǎng)絡(luò)的算法,并且電力系統(tǒng)要處理大規(guī)模的數(shù)據(jù)集,因此加入MapReduce框架,將其與該算法相結(jié)合。通過對上述算法實驗的結(jié)果進(jìn)行分析,證實了該算法對于電力行業(yè)的大數(shù)據(jù)處理非常高效。
電力行業(yè);大數(shù)據(jù);神經(jīng)網(wǎng)絡(luò)
當(dāng)前的社會中,大數(shù)據(jù)技術(shù)發(fā)展很快速,并且對于大數(shù)據(jù)的技術(shù)應(yīng)用也非常的廣泛。在電力行業(yè)中,幾乎所有設(shè)備都趨于智能化,所以對于電力行業(yè)的系統(tǒng)和設(shè)備可能利用大數(shù)據(jù)技術(shù)的支持來進(jìn)行發(fā)展和升級。
因為電力系統(tǒng)是定時收集數(shù)據(jù),并且隨著設(shè)備種類越來越多,所以數(shù)據(jù)的種類和數(shù)量也越來越多。在大數(shù)據(jù)技術(shù)的基礎(chǔ)上進(jìn)行數(shù)據(jù)的分析和處理就很有必要,也就是數(shù)據(jù)融合[1]。數(shù)據(jù)融合在研究電力大數(shù)據(jù)中起著重要作用,它可以整合許多方面的數(shù)據(jù)信息,讓數(shù)據(jù)的特點一目了然。
電力系統(tǒng)中的數(shù)據(jù)有兩種:結(jié)構(gòu)化的數(shù)據(jù)和非結(jié)構(gòu)化的數(shù)據(jù)。結(jié)構(gòu)化數(shù)據(jù)可以通過數(shù)據(jù)庫進(jìn)行存儲和處理,但是使用數(shù)據(jù)庫去處理非結(jié)構(gòu)化的數(shù)據(jù)會比較難[2]。
數(shù)據(jù)融合的本質(zhì)是轉(zhuǎn)換和合并X的n塊信息,其中 X 是具有未知含義的實體。根據(jù)融合程度,它分為數(shù)據(jù)層、特征層、決策層。數(shù)據(jù)層的功能是從所有的監(jiān)測對象的數(shù)據(jù)集中提取出研究需要的特征狀態(tài)量。對于特征層,它的工作是對于數(shù)據(jù)層所提取的特征狀態(tài)量進(jìn)行分析,并且對于相同特征的狀態(tài)量進(jìn)行融合,就可以得到具有決定性的對于狀態(tài)的判斷和模式具有識別作用的特征向量。最后一部分,也就是決策層的作用是通過前兩部分所得到的決策向量與規(guī)定的算法結(jié)合,然后做出決策[3]。
傳統(tǒng)的數(shù)據(jù)融合算法主要利用反向傳播(Back Propagation, BP)網(wǎng)絡(luò)。它的網(wǎng)絡(luò)模型主要分為三個部分,如圖1的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)所示,分別是輸入層、隱含層和輸出層。
圖1 BP網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)
根據(jù)圖1的BP網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),可以觀察到一個簡單的模型。通過觀察模型,隱含層的每個神經(jīng)元都會收到輸入層中所有神經(jīng)元的輸入信號,并且這些輸入信號會經(jīng)過處理后通過連接傳遞到隱含層,這些連接都帶有權(quán)重。神經(jīng)元將接收到的總輸入值與設(shè)置的閾值進(jìn)行比較,只有大于閾值,才能通過“激活函數(shù)”來產(chǎn)生輸出,也是輸出層的輸入[4]。
這里使用的激活函數(shù)為如下公式:
第層第i個神經(jīng)元的輸入值為:
利用激活函數(shù)計算第層第個神經(jīng)元的輸出:
第層第個神經(jīng)元輸出的導(dǎo)數(shù):
在誤差逆向回傳時,設(shè)預(yù)期輸出是d,第層第個神經(jīng)元所得誤差為,其中∈[1,]。誤差為:
接下來就可以計算整個BP網(wǎng)絡(luò)的均方誤差:
由此可以得到權(quán)值調(diào)整式:
如果輸出值與預(yù)期輸出值不相符時,根據(jù)計算誤差,通過網(wǎng)絡(luò)的各層次將所得到的誤差值進(jìn)行反向傳遞[5]。經(jīng)過多次的調(diào)整,使得輸出值接近實際值(預(yù)期輸出值)。大部分情況下,對數(shù)據(jù)集進(jìn)行融合歸納都使用這種學(xué)習(xí)和訓(xùn)練的方法。
利用以下節(jié)點對BP算法進(jìn)行簡單的介紹,i1和i2為輸入節(jié)點,h1和h2為隱藏節(jié)點,o1和o2為輸出節(jié)點。引入初始權(quán)值,以及節(jié)點的數(shù)值,如圖2所示。
圖2 引入初始權(quán)值,以及節(jié)點的數(shù)值
如圖2所示,下面求解迭代過程,當(dāng)輸入樣本為0.05和0.10時(一個2維樣本數(shù)據(jù)),神經(jīng)網(wǎng)絡(luò)的期望輸出是與0.01和0.99接近。
首先來計算節(jié)點h1的輸入值,激活函數(shù)就是之前的Sigmoid函數(shù)。
Inh1=0.15*0.05+0.10*0.20+0.35*1=0.3775
根據(jù)上式得到h1的輸入值后,通過激活函數(shù)得到h1的輸出值:
Outh1=f(0.3775)=0.593269992
按照上述方法,計算h2的輸出值:
Outh2=0.596884378
可以通過上述計算方法,計算輸出層節(jié)點o1的輸出值:
Ino1=W5*Outh1+W6*Outh2+b2*1=1.105905967
Outo1=f(1.105905967)=0.75136507
同樣的方法計算o2的輸出值:
Outo2=0.772928465
得到輸出值后,計算輸出節(jié)點的誤差:
Eo1=(0.01-0.75136507)2/2=0.274811083
Eo2=(0.99-0.772928465)2/2=0.023560026
所以這個神經(jīng)網(wǎng)絡(luò)的總誤差為:
E=Eo1+Eo2=0.274811083+0.023560026=0.298371109
這就是前向傳播的整個過程,接下來就是后向傳播。后向傳播過程就是替換迭代網(wǎng)絡(luò)的權(quán)值,利用傳播所計算的誤差得到新的權(quán)值,再一次進(jìn)行前向傳播時,通過新的權(quán)值進(jìn)行計算,得到的誤差將會縮小,直到誤差接受范圍內(nèi)。
Hermite正交基前向神經(jīng)網(wǎng)絡(luò)算法,它的特殊之處為激勵函數(shù)是正交多項式,可以通過一步就計算出神經(jīng)網(wǎng)絡(luò)的最優(yōu)的權(quán)值[6]。
該神經(jīng)網(wǎng)絡(luò)模型如圖3所示。
圖3 Hermite 正交基前向神經(jīng)網(wǎng)絡(luò)模型
通過偽逆矩陣就可以一步得出其權(quán)值w(= 0,1,2,...,-1)。網(wǎng)絡(luò)的最優(yōu)權(quán)值計算公式如下:
MapReduce(分布式處理框架)由兩部分組成,一個是“Map”,它的作用是映射,一個是“Reduce”,它的作用是歸納[7]。主要是通過所有節(jié)點并行處理數(shù)據(jù),結(jié)點獨立執(zhí)行所分配的任務(wù)并且實時反饋其狀態(tài)。
圖4 結(jié)合 MapReduce模型的 Hermite 正交基前向神經(jīng)網(wǎng)絡(luò)算法的并行化處理流程圖
MapReduce框架可以將算法并行處理,而Hermite算法中的數(shù)據(jù)塊可以單獨處理并且執(zhí)行其工作。所以可以將兩者結(jié)合。
(1)離散數(shù)據(jù)。首先收集大量的相關(guān)數(shù)據(jù)。如果收集的數(shù)據(jù)為連續(xù)數(shù)據(jù),則先將數(shù)據(jù)離散化;如果收集的數(shù)據(jù)為離散數(shù)據(jù),則不用做處理。
利用多個設(shè)備在一定時間內(nèi)的收集的數(shù)據(jù)為矩陣:
(3)根據(jù)MapReduce與 Hermite 正交基前向神經(jīng)網(wǎng)絡(luò)算法相結(jié)合的網(wǎng)絡(luò)并行化算法進(jìn)行訓(xùn)練預(yù)測。
這個實驗就是基于對比上述MapReduce 與 Hermite相結(jié)合算法和BP算法神經(jīng)網(wǎng)絡(luò)算法產(chǎn)生的結(jié)果,通過對功率預(yù)測的準(zhǔn)確度比較的仿真實驗,利用MapReduce 與 Hermite相結(jié)合算法預(yù)測結(jié)果的曲線與BP算法的預(yù)測結(jié)果曲線及實際功率的曲線進(jìn)行對比。
圖5 不同算法下風(fēng)電場功率預(yù)測對比
從上面的三條曲線可以看出,MapReduce和Hermite相結(jié)合的算法所預(yù)測的結(jié)果與實際結(jié)果更接近,這是因為Hermite算法隱含層神經(jīng)元的激勵函數(shù)是正交多項式,一步就可以計算出神經(jīng)網(wǎng)絡(luò)連接最優(yōu)的權(quán)值,這保留了初始數(shù)據(jù)的信息特征,使算法預(yù)測得結(jié)果更接近實際值。
還可以通過計算誤差,對兩種算法進(jìn)行比較,表1為兩種算法的誤差。
表1 兩種算法標(biāo)準(zhǔn)誤差對比
結(jié)合本文,可以得出新融合算法的優(yōu)勢:
(1)新融合算法在步驟上進(jìn)行了簡化,提高了算法的工作效率,并且將誤差縮小,更易于在硬件上實現(xiàn)。
(2)根據(jù) MapReduce 模型,將算法并行,改進(jìn)后的算法比傳統(tǒng)方法更易于處理大數(shù)據(jù)[8]。
本文介紹了一種處理電力系統(tǒng)大數(shù)據(jù)的平臺結(jié)構(gòu),總結(jié)了其功能和必要的技術(shù)支持,并監(jiān)控數(shù)據(jù),可以為各種需求提供服務(wù)。
[1]劉青松,錢蘇翔,嚴(yán)拱標(biāo).基于多傳感器的信息數(shù)據(jù)融合技術(shù)在電力系統(tǒng)中的應(yīng)用[J].微計算機(jī)信息,2006(31):191-193.
[2]朱付保,徐顯景,霍曉齊,等.多源數(shù)據(jù)融合技術(shù)在后備干部管理系統(tǒng)中的應(yīng)用[J].微型電腦應(yīng)用,2014,30(01):10-12.
[3]肖慧靈.基于信息融合的港機(jī)健康診斷研究[J].中國設(shè)備工程,2021(10):162-163.
[4]李翀,劉林青,陶鵬,等.基于多源數(shù)據(jù)融合技術(shù)的輸電線路故障定位方法[J].水電能源科學(xué),2021,39(01):168-170+210.
[5]萬磊,陳洪勝,王曉婷,等.面向電力大數(shù)據(jù)的多源異構(gòu)數(shù)據(jù)融合技術(shù)研究[J].電子技術(shù)與軟件工程,2021(02):172-173.
[6]江友華,易罡,黃榮昌,等.基于多源信息融合的變壓器檢測與評估技術(shù)[J].上海電力大學(xué)學(xué)報,2020,36(05):481-485.
[7]林瑀,陳日成,金濤.面向復(fù)雜信息系統(tǒng)的多源異構(gòu)數(shù)據(jù)融合技術(shù)[J].中國測試,2020,46(07):1-7+23.
[8]Jitendra R. Raol Data Fusion Mathematics:Theory and Practice[B].CRC Press,2015.