程鵬
(國網(wǎng)廊坊供電公司,河北 廊坊 065000)
大數(shù)據(jù)挖掘技術目前已經(jīng)在電網(wǎng)企業(yè)及電力系統(tǒng)的運行管理中廣泛應用。但是如何利用大數(shù)據(jù)技術來深度挖掘這些數(shù)據(jù)的內在規(guī)律以及通過可視化技術來實現(xiàn)更好的電力系統(tǒng)管理是當前要解決的具有挑戰(zhàn)性的問題。將可視化技術應用到電力大數(shù)據(jù)挖掘之中,能夠突破傳統(tǒng)二維圖表在可視化及直觀性上的局限性,解決傳統(tǒng)可視化方法出現(xiàn)的重疊及密集區(qū)域[1-3]。為了能夠更好展現(xiàn)電力設備的地理空間特性及設備的運行狀態(tài),應當考慮引入數(shù)據(jù)挖掘智能算法,實現(xiàn)電力大數(shù)據(jù)的全景狀態(tài)數(shù)據(jù)展現(xiàn),深度挖掘不同空間位置數(shù)據(jù)之間的相互關系。
為了能夠獲得更快的刷新速度以及更快的場景繪制速度,需要利用場景漫游以及快速人際交互等多種技術[4]。在電力設備的三維模型構建中,由于這些電力設備大部分都具有多線圈結構且表面局部曲率很大,因而不能夠過度簡化,否則無法實現(xiàn)對場景重繪的目的效果[5-6]。在此情況下,考慮引入LOD(levels of detail)方法進行模型構建過程的簡化,提高場景繪制的速度。首先分析模型結構,采用三角網(wǎng)格(mesh)開展數(shù)學描述,即M=(K,V)。對模型的簡化,并非是進行E的簡化,而是要逐漸過渡到E,需要對E進行量化分析,從而確定其重要程度??梢岳媚芰亢瘮?shù)思想進行模型簡化的逼近程度,并不斷修正頂點數(shù)量變化權重。利用能量函數(shù)進行模型構建的時候,難以有理想減面效果,算法復雜,執(zhí)行率低,因而并不適用于場景復雜的變電站中。
E(K,V)=Edist(K,V)+Erep(K,V)+Fspring(K,V)
(1)
式中:E為三角網(wǎng)格的連接頂點基本元素,實際模型中替換為M=(E,V),表示三角網(wǎng)格模型;K,V分別為三個連接頂點基本元素和頂點;Edist為距離能量;Espring為彈性能量;Erep為代表性能量。因而提出LOD算法融入能量函數(shù)思想,結合統(tǒng)計方法加權進行K值重要性量化,對于邊E影響因子A有:
(2)
式中:W為邊E的影響因子權重函數(shù);n為影響因子數(shù)量;Fi為所有特征邊標識;Ai為i種不同的影響因子;wi為影響因子對應的權重 。在進行電力大數(shù)據(jù)可視化過程中,最主要是進行電力設備的構建,因而不能夠過度簡化[7]。綜合考慮之下,E選取影響因子A1、A2、A3、A4,分別對應的是邊長L、特征邊標識F、兩側三角形面積S和曲率C。
設邊E(V1,V2)兩側三角形如圖1中所示,四個點的坐標分別為V1(x1,y1,z1)、V2(x2,y2,z2)、V3(x3,y3,z2)、V4(x4,y4,z4),則有:
圖1 周圍相關頂點及法向量示意圖
(3)
(4)
(5)
C=cos-1n1·n2=
(6)
式中:F、L、S、C分別為特征邊標識、邊長、兩側三角形面積和曲率(后同);n1、n2為圖1中的兩個方向法向量。利用權重函數(shù)E=f(E)對影響因子加權計算,進一步設計基本權重函數(shù)。
W0=w1·L+w2·F+w3·S+w4·|C|
(7)
式中:w1、w2、w3、w4為L、F、S和|C|對應的權重系數(shù),其中C的值域區(qū)間為[0,π]。L、S值域是難以確定的,如果單純直接使用L、S原始值進行計算,可能會導致最終產(chǎn)生較大的誤差,因而需要對影響因子進行均衡化處理,使其能夠處于同一尺度空間中。將L、F、S值域線性映射至[0,π]區(qū)間中,設:
(8)
EFj=π·Fj
(9)
(10)
由此能夠得到均衡值域的權重函數(shù)計算公式:
W=w1·EL+w2·EF+w3·ES+w4·|C|
(11)
式中:C為曲率,值域為[0,π]。為了進行模型簡化,令w1=σEL,w3=σES,w4=σC,w2=α。對于給定任意邊E,可以得到權重函數(shù)方程為:
W=σEL·EL+α·EF+σES·ES+σC·|C|
(12)
由此可以保證影響因子貢獻比例的均衡,完善邊E的貢獻值。將其應用到電力可視化模型構建時,可以對權重系數(shù)按照線性縮放的原則進行調整。
利用式(10)可以計算出模型中每個E貢獻值,然而還需要進一步完成LOD計算方法的過程完善,還需要進一步定義模型構建過程中模型頂點列表的變換確認簡化比例,完成不同比例參數(shù)的分配等。在對E進行約減時,為了填補刪除后可能留下的縫隙,操作需要遍歷三角網(wǎng)格模型,因而消耗大量的計算時間。在此采用收縮方式代替刪除方式,對E進行收縮變換。
E(V1,V2)→E(V1,V3)
(13)
將簡化仿真算法應用于某個變電站數(shù)據(jù)分析系統(tǒng)之中,開展變電站的場景優(yōu)化,對其測試算法效率和效果進行分析。經(jīng)過初步的仿真模擬,對于不同簡化比例參數(shù)θ為0、70%、85%,對應的場景優(yōu)化效果效率曲線如圖2及表1所示。從圖2及表1可以看出,當處于初始化狀態(tài)時為0,對應的FPS(frames per second)=3.8幀/s;當簡化比例為70%時,F(xiàn)PS上升為15.4幀/s,對應的細節(jié)基本上沒有損失,能夠保持案例設備的完整性,實現(xiàn)最好的優(yōu)化效果;當簡化比例為85%時,損失了較多細節(jié),即便仍能夠保持有大致的設備外形,但是精度上有著顯著的降低,此時的FPS為18.1幀/s,對應的連續(xù)幀率閾值為24 FPS,能夠滿足人機交互及變電站的場景漫游需要。
圖2 場景優(yōu)化效率曲線圖
表1 場景繪制效率表
整體分析可以看出,當簡化比例參數(shù)在85%以上時,模型陷入扁平化,可能導致三體塌陷成為二維面,最終產(chǎn)生體積信息的損失,因而需要進一步提升扁平化閾值。
利用Amdahl定律,采用并行方式加快算法,運行速度存在極限,不能實現(xiàn)無限提高。具體計算公式為:
(14)
式中:S、a、n分別為加速比、串行比例和并行節(jié)點數(shù)。當a無限趨近于0時,才能夠實現(xiàn)n加速比。結合CUDA(computer unified device architecture)三層編程模型,可以將BP神經(jīng)網(wǎng)絡算法劃分為三個層次:第一層次是每個Grid對應的單個神經(jīng)網(wǎng)絡計算任務;第二層次是Block對上層節(jié)點的計算任務;第三層次是Thread對應的節(jié)點計算任務。對應的并行層次計算模式如圖3中所示。
圖3 BP神經(jīng)網(wǎng)絡的并行層次計算模式
為了進行基于BP神經(jīng)網(wǎng)絡改進后的并行算法的效果分析,此次選取95臺主變壓器的相關監(jiān)測數(shù)據(jù)來進行具體的仿真分析。在這個仿真體系中,每一臺變壓器就相當于一個神經(jīng)網(wǎng)絡,由此分別進行BP及BP Grid算法效率的對比分析,結果如表2所示。
表2 BP Grid算法的加速比
從表2可以看出,對于不融入并行算法大數(shù)據(jù)技術時,整個算法的效率非常低,單臺變壓器所需要消耗的時間要達到58.14 s,消耗的時間過多,難以達到實用要求。而融入了BP神經(jīng)網(wǎng)絡算法后,BP Grid算法單臺變壓器的消耗時間為7.14 s,與單純的神經(jīng)網(wǎng)絡訓練時間相比加速比為8.14。進一步分析可以看出,神經(jīng)網(wǎng)絡數(shù)量為1、2、4、8時,對應的加速比分別為8.14、7.69、7.32、7.51。
利用此次提出的可視化方法對三維場景的結果進行可視化展示。為了更好實現(xiàn)可視化的展現(xiàn),設計出一種三維平行坐標圖,用以展開時間序列數(shù)據(jù)對應的時間維度,能夠將多個時間點數(shù)據(jù)同時排列其中。為了緩解空間可能出現(xiàn)的緊促感,需要將曲線排列在三維空間之中。在三維空間之中,可以利用視點位置的改變以及場景漫游等解決二維平行坐標圖中可能出現(xiàn)的遮擋問題。根據(jù)此次可測試數(shù)據(jù)得到的結果集進行可視化展現(xiàn),具體如圖4~圖7所示。
圖4 三維平行坐標圖(1)
圖5 三維平行坐標圖(2)
圖6 三維平行坐標圖(3)
圖7 三維平行坐標圖(4)
數(shù)據(jù)集分析的結果可視化展現(xiàn)在圖8中,圖中的“★”為存在異常數(shù)據(jù),黑色點為最近數(shù)據(jù)采集結果的維度數(shù)值。將三維場景的實現(xiàn)和數(shù)據(jù)結合起來,能夠增強人機交互效率,讓人們更好了解到數(shù)據(jù)背后隱藏的規(guī)律。
圖8 變電站可視化三維虛擬現(xiàn)實場景
綜合分析可以看出,并行化BP神經(jīng)網(wǎng)絡的BP Grid算法能夠對輸入的時間序列數(shù)據(jù)實現(xiàn)高效快速的神經(jīng)網(wǎng)絡訓練。通過和傳統(tǒng)可視化的對比分析可以看出,BP神經(jīng)網(wǎng)絡輸出結果可以讓用戶在地理空間上實現(xiàn)快速的定位,便于其更好地理解數(shù)據(jù)。通過可視化分析方式,用戶能夠快速定位數(shù)據(jù)源,基于三維場景輔助可視化方式進行異常數(shù)據(jù)點的查找,有利于提高人機交互效率。
本文整合了大數(shù)據(jù)技術和可視化分析模型,通過數(shù)據(jù)挖掘并行優(yōu)化算法,實現(xiàn)漸進、動態(tài)和無損的模型簡化重建。通過仿真試驗數(shù)據(jù)的快速可視化分析模型構建可以看出,此次的分析模型能夠滿足電力企業(yè)的大數(shù)據(jù)業(yè)務需求,便于用戶對數(shù)據(jù)的人機交互需求和理解,極大提升了人機交互效率。當采用多分辨率快速渲染方法的時候,可以在不改變電力設備外觀的情況下快速實現(xiàn)異常設備點的定位,有助于電力系統(tǒng)的日常運維管理。