• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Spark環(huán)境變壓器故障并行診斷

    2016-07-13 07:01:08范賀明朱永利
    電力科學(xué)與工程 2016年6期
    關(guān)鍵詞:智能電網(wǎng)

    劉 成,?!′J,范賀明,許 靜,朱永利

    (1.華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,河北保定071003;2. 國網(wǎng)冀北電力有限公司 承德供電公司,河北承德067000)

    ?

    基于Spark環(huán)境變壓器故障并行診斷

    劉成1,牛銳1,范賀明2,許靜1,朱永利1

    (1.華北電力大學(xué) 控制與計(jì)算機(jī)工程學(xué)院,河北保定071003;2. 國網(wǎng)冀北電力有限公司 承德供電公司,河北承德067000)

    摘要:為處理海量的電力設(shè)備監(jiān)測(cè)數(shù)據(jù),滿足智能電網(wǎng)快速診斷檢修需求,以電力變壓器故障診斷為例,提出了基于Spark環(huán)境下電力變壓器監(jiān)測(cè)數(shù)據(jù)并行診斷方法。以油中溶解氣體數(shù)據(jù)作為實(shí)驗(yàn)輸入,利用并行樸素貝葉斯進(jìn)行故障分類。實(shí)驗(yàn)結(jié)果表明,并行樸素貝葉斯方法在變壓器故障診斷中診斷速度要快于傳統(tǒng)的單機(jī)環(huán)境下診斷速度, 基于Spark電力設(shè)備監(jiān)測(cè)數(shù)據(jù)并行診斷實(shí)驗(yàn)平臺(tái),能夠快速處理數(shù)據(jù)量規(guī)模巨大、模型復(fù)雜的場(chǎng)景;集群加速比隨著節(jié)點(diǎn)個(gè)數(shù)增加明顯提高,能夠適用電網(wǎng)大數(shù)據(jù)快速處理的需求。

    關(guān)鍵詞:Spark;變壓器故障診斷;樸素貝葉斯;智能電網(wǎng)

    0引言

    電力設(shè)備健康是電網(wǎng)運(yùn)行的關(guān)鍵。目前供電公司采取了形式多樣的監(jiān)測(cè)手段,對(duì)電力設(shè)備進(jìn)行監(jiān)測(cè)。傳感器技術(shù)、數(shù)字信號(hào)、專家系統(tǒng)等有機(jī)整合,可以實(shí)現(xiàn)智能化的在線監(jiān)測(cè)。目前,在電力設(shè)備監(jiān)測(cè)中有紅外、氣體、電流、濕度、震動(dòng)等傳感器可以實(shí)現(xiàn)對(duì)設(shè)備的多維度監(jiān)測(cè)[1]。隨著互聯(lián)網(wǎng)技術(shù)、傳感器技術(shù)、物聯(lián)網(wǎng)技術(shù)的快速發(fā)展,每天都會(huì)產(chǎn)生海量的電力設(shè)備監(jiān)測(cè)數(shù)據(jù)信息——結(jié)構(gòu)和非結(jié)構(gòu)化的數(shù)據(jù)信息。傳統(tǒng)的數(shù)據(jù)分析方法已經(jīng)不能滿足當(dāng)下智能電網(wǎng)要求。如何獲取隱藏在海量數(shù)據(jù)中的價(jià)值已經(jīng)成為亟待解決的問題[2]。Spark云平臺(tái)基于內(nèi)存一棧式大數(shù)據(jù)處理框架,在大數(shù)據(jù)快速處理表現(xiàn)出強(qiáng)大的生命力,可以實(shí)現(xiàn)對(duì)海量監(jiān)測(cè)數(shù)據(jù)的并行處理。

    對(duì)比Hadoop大數(shù)據(jù)技術(shù),Spark在處理迭代過程中產(chǎn)生中間結(jié)果都是存儲(chǔ)在內(nèi)存中,只有在內(nèi)存不足的時(shí)候中間迭代結(jié)果才會(huì)保存到磁盤中,利用有向無環(huán)圖(DAG)優(yōu)化迭代過程,可以減少處理分析數(shù)據(jù)的時(shí)間,避免了繁重的磁盤讀寫操作。其中彈性數(shù)據(jù)集(RDD)是Spark的核心數(shù)據(jù)結(jié)構(gòu),RDD的操作分為兩種:transformation和action。Spark 將作用于 RDD 的一系列轉(zhuǎn)換操作記錄下來構(gòu)建RDD 的依賴關(guān)系 Lineage,以保證 RDD 數(shù)據(jù)的魯棒性[3]。

    Spark發(fā)布的版本中包括以下幾個(gè)模塊:Spark SQL實(shí)現(xiàn)對(duì)結(jié)構(gòu)化數(shù)據(jù)查詢功能,對(duì)不同的數(shù)據(jù)源提供通用的訪問方法,Spark Streaming實(shí)現(xiàn)對(duì)大規(guī)模流式數(shù)據(jù)的處理,MLlib提供豐富的機(jī)器學(xué)習(xí)算法供相關(guān)人員直接調(diào)用使用,GraphX可以用來對(duì)圖形的并行運(yùn)算。目前,許多企業(yè)將Spark技術(shù)作為處理數(shù)據(jù)的首要選擇。亞馬遜在運(yùn)營(yíng)過程中,利用 Spark云計(jì)算快速計(jì)算能力和豐富的機(jī)器學(xué)習(xí)算法來分析數(shù)據(jù),降低運(yùn)行維護(hù)成本提高數(shù)據(jù)分析速度。淘寶利用Spark Streaming的實(shí)時(shí)流數(shù)據(jù)處理框架,結(jié)合歷史數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù),能夠?qū)τ脩舻慕灰讛?shù)據(jù)、瀏覽數(shù)據(jù)、收藏?cái)?shù)據(jù)等數(shù)據(jù)量進(jìn)行分析和處理。然而,在電力系統(tǒng)中負(fù)荷預(yù)測(cè)、故障診斷,在線監(jiān)測(cè)等具體應(yīng)用中還是以Hadoop技術(shù)為主,本文以電力變壓器監(jiān)測(cè)數(shù)據(jù)作為實(shí)驗(yàn)數(shù)據(jù),將Spark技術(shù)應(yīng)用在變壓器故障診斷當(dāng)中,實(shí)現(xiàn)了對(duì)電力設(shè)備監(jiān)測(cè)數(shù)據(jù)的快速診斷。

    1電力大數(shù)據(jù)發(fā)展

    在電力系統(tǒng)中數(shù)據(jù)分為內(nèi)部數(shù)據(jù)和外部數(shù)據(jù)。內(nèi)部數(shù)據(jù)來自與系統(tǒng)本身如電力營(yíng)銷系統(tǒng)、智能電表數(shù)據(jù)、電力設(shè)備監(jiān)測(cè)數(shù)據(jù)等,這些數(shù)據(jù)中大部分為非結(jié)構(gòu)化的數(shù)據(jù),如視頻、故障錄波等。存儲(chǔ)這些數(shù)據(jù)包括:原始數(shù)據(jù)、及時(shí)處理后的數(shù)據(jù),以及用于電力系統(tǒng)故障分析、負(fù)荷預(yù)測(cè)等業(yè)務(wù)最終建模結(jié)果。在文獻(xiàn)[4]中針對(duì)電力大數(shù)據(jù)種類多、分布廣、數(shù)據(jù)量大、價(jià)值密度低的特點(diǎn),提出了智能電網(wǎng)大數(shù)據(jù)多級(jí)存儲(chǔ)系統(tǒng)方案,對(duì)不同特點(diǎn)和要求的數(shù)據(jù)采用不同的存儲(chǔ)方法。文獻(xiàn)[5]通過分形理論降低數(shù)據(jù)緯度,利用密度聚類算法對(duì)樣本數(shù)據(jù)聚類劃分,提取不同數(shù)據(jù)聚類的特征。在電力系統(tǒng)具體應(yīng)用模型中,往往需要合并多個(gè)數(shù)據(jù)源,對(duì)數(shù)據(jù)進(jìn)行匯總。在文獻(xiàn)[6]中采用Hadoop大數(shù)據(jù)處理框架,選取負(fù)荷等內(nèi)部數(shù)據(jù)等信息以及外部數(shù)據(jù)如天氣、日期等,對(duì)用戶側(cè)并行負(fù)荷預(yù)測(cè)。在數(shù)據(jù)挖掘中,利用集群多節(jié)點(diǎn)對(duì)數(shù)據(jù)并行處理。在文獻(xiàn)[7]結(jié)合云平臺(tái)數(shù)據(jù)處理能力設(shè)計(jì)MapReduce并行算法,在狀態(tài)檢測(cè)和故障診斷方面具有一定的輔助作用。

    中國電科院和相關(guān)供電公司積極將大數(shù)據(jù)建設(shè)引入電力系統(tǒng)中。江蘇省電力公司從2013年初開始建設(shè)營(yíng)銷大數(shù)據(jù)智能分析系統(tǒng)。系統(tǒng)采用Hadoop分布式批處理技術(shù)處理數(shù)據(jù),半個(gè)小時(shí)可計(jì)算全省每日用電量。同時(shí),接入了氣象、統(tǒng)計(jì)部門數(shù)據(jù),建立多維數(shù)據(jù)分析模型。系統(tǒng)還設(shè)有電力用戶搜索引擎,可查詢用戶每日用電量情況,用于用電行為分析。北京市電力公司目前正在開展?fàn)I配數(shù)據(jù)集成工作,計(jì)劃從擴(kuò)大數(shù)據(jù)采集覆蓋面、高數(shù)據(jù)中心的接入率和交互能力、實(shí)現(xiàn)全網(wǎng)拓?fù)湄炌?、統(tǒng)一數(shù)據(jù)集成技術(shù)標(biāo)準(zhǔn)、開展業(yè)務(wù)信息系統(tǒng)功能完善能力提升。

    2基于Spark云計(jì)算電力設(shè)備故障并行診斷

    2.1常見的變壓器故障診斷方法

    電力變壓器油中溶解氣體分析(Dissolved Gas-in-oil Analysis,DGA)是變壓器故障診斷的一種有效方法。DGA監(jiān)測(cè)技術(shù)分為在線監(jiān)測(cè)和離線監(jiān)測(cè)兩種方法,對(duì)電力變壓器過熱和放電故障敏感有效,不受外界電廠和磁場(chǎng)的影響,DGA在線監(jiān)測(cè)技術(shù)最大優(yōu)點(diǎn)是無需停運(yùn)變壓器,并且可以查明變壓器發(fā)生的早起內(nèi)部故障。

    傳統(tǒng)的診斷方法有特征氣體法、羅杰斯比值法、三比值法等,這些傳統(tǒng)的方法大多局限閥值診斷,不能確切反映表現(xiàn)特征與故障之間的規(guī)律,難以分析發(fā)現(xiàn)潛伏性故障。針對(duì)傳統(tǒng)方法的缺陷,學(xué)者和專家提出了各種智能診斷方法如支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、PSO粒子群、深度學(xué)習(xí)等算法相繼應(yīng)用在變壓器故障診斷中[8-11]。支持向量機(jī)在數(shù)據(jù)樣本較小時(shí),具有良好的分類效果,但隨著樣本增加效果不會(huì)顯著提高,而且在核函數(shù)的選擇也比較困難,沒有有效理論支撐。神經(jīng)網(wǎng)絡(luò)也會(huì)陷入局部最優(yōu)解當(dāng)中,出現(xiàn)“震蕩”現(xiàn)象。深度學(xué)習(xí)算法模擬人腦對(duì)數(shù)據(jù)進(jìn)行訓(xùn)練,基于自編碼、深度信念網(wǎng)絡(luò)的方法都存在訓(xùn)練層數(shù)多、訓(xùn)練時(shí)間過長(zhǎng)等問題。而且上述方法都是在單個(gè)節(jié)點(diǎn)進(jìn)行數(shù)據(jù)分析,存在訓(xùn)練時(shí)間長(zhǎng)等問題,難以面對(duì)海量的數(shù)據(jù)和源源不斷的流式數(shù)據(jù)。Spark充分利用集群的計(jì)算優(yōu)勢(shì),依賴豐富的數(shù)據(jù)挖掘算法,可以對(duì)海量的變壓器監(jiān)測(cè)數(shù)據(jù)快速處理,Spark Streaming可以將流式數(shù)據(jù)分成短小的批處理作業(yè)。

    2.2樸素貝葉斯并行化

    在電力變壓器故障診斷中,樸素貝葉斯算法是一種簡(jiǎn)單高效的分類算法。樸素貝葉斯分類定義如下:設(shè)x={x1,x2,…,xn}為一個(gè)待分類項(xiàng),c={c1,c2,…,cn}對(duì)應(yīng)分類集合。對(duì)于元組x只需求出最高的后驗(yàn)概率Cmap即可。公式(1)、(2)給出了Cmap和樸素貝葉斯計(jì)算公式:

    (1)

    (2)

    又P(x)對(duì)于每個(gè)相應(yīng)的類都是常數(shù),在計(jì)算過程中可以當(dāng)作數(shù)值1簡(jiǎn)化處理。而在樸素貝葉斯中每個(gè)條件相互獨(dú)立,P(x|ci)可以通過累乘求出結(jié)果,具體如公式(3)所示:

    (3)

    根據(jù)公式(2)和(3),公式(1)可以變換為

    (4)

    為了避免多條件概率相乘造成的精度損失,引進(jìn)In函數(shù),將連乘轉(zhuǎn)變?yōu)槔奂?,故公?4)最終可以轉(zhuǎn)換為

    (5)

    并行樸素貝葉斯訓(xùn)練過程如圖1所示,構(gòu)建RDD partition。在局部運(yùn)算中map,reduce等算子操作計(jì)算出數(shù)據(jù)中每種故障類屬性的數(shù)據(jù)總數(shù)、含有屬性特征的數(shù)據(jù)總數(shù)。在全局運(yùn)算中通過map,combineByKey,collect等算子操作計(jì)算某類故障屬性出現(xiàn)的概率。在計(jì)算過程中,避免概率為0出現(xiàn),進(jìn)行Laplace平滑處理。Spark默認(rèn)按行處理數(shù)據(jù),每一行的數(shù)據(jù)格式為分類標(biāo)簽和特征值,每個(gè)數(shù)值之間用空格分開。Spark樸素貝葉斯訓(xùn)練步驟如下:

    圖1 并行樸素貝葉斯

    (1)讀取數(shù)據(jù),創(chuàng)建RDD數(shù)據(jù)切片。

    (2)進(jìn)行map操作成新的RDD,將原RDD中的元素在新RDD中都有且只有一個(gè)元素與之對(duì)應(yīng)。定義函數(shù)將行字符串映射成list(label,(1,features)),其中,label表示類別號(hào);1是出現(xiàn)的次數(shù);features表示特征值。

    (3)進(jìn)行reduceByKey操作,將相同的label對(duì)應(yīng)的(1,features)進(jìn)行相加,得到(label,(N,featuresSum)),其中N表示label類出現(xiàn)的次數(shù),featuresSum表示特征值出現(xiàn)的次數(shù)。

    (4)進(jìn)行collect觸發(fā)操作,得到結(jié)果。

    3實(shí)驗(yàn)

    3.1數(shù)據(jù)準(zhǔn)備與轉(zhuǎn)化階段

    變壓器發(fā)生故障時(shí)會(huì)伴隨多種氣體的產(chǎn)生,選取 H2、CH4、 C2H6、C2H2和C2H4氣體作為屬性,發(fā)生不同故障產(chǎn)生的氣體也有差異,因此根據(jù)DGA數(shù)據(jù)可以作為樸素貝葉斯分類的輸入。本文的DGA數(shù)據(jù)來自文獻(xiàn)[12]以及江蘇電力公司。經(jīng)過數(shù)據(jù)過濾,過濾掉數(shù)據(jù)缺失、不完整或有缺陷的數(shù)據(jù),選取600條作為訓(xùn)練和測(cè)試數(shù)據(jù),以HFDS文件格式存儲(chǔ)數(shù)據(jù),在這些數(shù)據(jù)中,變壓器故障主要分為下面6種,用C1到C6分為表示不同的故障類型。如表1所示。

    表1 常見變壓器故障類型

    在表2給出了部分DGA數(shù)據(jù)以及所對(duì)應(yīng)的故障類型。

    表2 部分變壓器DGA數(shù)據(jù) μL/L

    在多數(shù)情況下,可以將連續(xù)屬性特征離散化處理,然后在貝葉斯的假設(shè)下,計(jì)算離散值的概率。把復(fù)雜的分布特征轉(zhuǎn)化為簡(jiǎn)單的樸素貝葉斯模型。根據(jù)相關(guān)文獻(xiàn)[13-14]特征氣體離散化如表3所示。

    表3 DGA氣體數(shù)據(jù)離散化

    3.2環(huán)境搭建

    本文在實(shí)驗(yàn)室搭建一個(gè)spark集群系統(tǒng),對(duì)DGA數(shù)據(jù)并行分析與診斷,其中,Spark版本為spark-1.3.0-bin-hadoop2.4。集群共設(shè)置7個(gè)節(jié)點(diǎn),一個(gè)Master節(jié)點(diǎn)配置為處理器 i3-2120 3.30 GHz、內(nèi)存 3 GB、硬盤250 GB;6個(gè)Work節(jié)點(diǎn)配置為處理器 E5-2609 v2 2.50 GHz、內(nèi)存7 GB、硬盤 300 GB。通過交換機(jī)成一個(gè)內(nèi)部網(wǎng)絡(luò)。配置各個(gè)節(jié)點(diǎn)的Hadoop配置、修改Spark-env.sh配置文件。

    3.3樸素貝葉斯并行驗(yàn)證

    在樸素貝葉斯模型訓(xùn)練過程中,訓(xùn)練樣本和測(cè)試樣本按照比例2∶1劃分,結(jié)果如表4所示,平均準(zhǔn)確率達(dá)到84.6%。實(shí)驗(yàn)結(jié)果表明,基于Spark并行樸素貝葉斯方法具有良好的分類預(yù)測(cè)效果。

    表4 變壓器故障診斷結(jié)果

    為處理海量的電力設(shè)備監(jiān)測(cè)數(shù)據(jù),還需要增大樣本數(shù)量。由于條件限制,在實(shí)驗(yàn)中通過對(duì)已有的數(shù)據(jù)進(jìn)行動(dòng)態(tài)隨機(jī)復(fù)制,生成大規(guī)模的測(cè)試數(shù)據(jù)。在大小相同DGA數(shù)據(jù)集下,測(cè)試樸素貝葉斯在Spark平臺(tái)上和單機(jī)平臺(tái)上運(yùn)行時(shí)間,實(shí)驗(yàn)結(jié)果如表5所示。

    表5 測(cè)試時(shí)間對(duì)比

    從表5中可以看出,當(dāng)數(shù)據(jù)集較小的時(shí)候,單機(jī)測(cè)試時(shí)間要小于集群測(cè)試時(shí)間,因?yàn)樵赟park集群中節(jié)點(diǎn)之間交互信息,需要消耗一定的時(shí)間,當(dāng)數(shù)據(jù)集繼續(xù)擴(kuò)大時(shí),集群的測(cè)試時(shí)間要遠(yuǎn)遠(yuǎn)小于單機(jī)測(cè)試時(shí)間。加速比是衡量集群計(jì)算能力的一個(gè)重要指標(biāo)[15]。Spark技術(shù)能夠快速處理大數(shù)據(jù),處理能力與集群節(jié)點(diǎn)數(shù)和文件大小有關(guān)。繼續(xù)增大文件大小,同時(shí)改變集群節(jié)點(diǎn)個(gè)數(shù)。實(shí)驗(yàn)結(jié)果如圖2所示。

    圖2 并行貝葉斯加速比

    結(jié)果表明,當(dāng)數(shù)據(jù)量達(dá)到GB大小時(shí),基于Spark并行貝葉斯加速比隨著集群的節(jié)點(diǎn)數(shù)增加線性提高,在相同的數(shù)據(jù)規(guī)模下集群節(jié)點(diǎn)數(shù)增加,每個(gè)集群節(jié)點(diǎn)分的數(shù)據(jù)切片變小,算法計(jì)算時(shí)間越短,加速比越高。同時(shí),當(dāng)節(jié)點(diǎn)數(shù)確定,加速比隨著數(shù)據(jù)大小增加而提高,也體現(xiàn)了Spark處理大數(shù)據(jù)的優(yōu)越性能。

    4結(jié)論

    傳統(tǒng)的電力設(shè)備監(jiān)測(cè)與診斷方法難以處理海量的監(jiān)測(cè)數(shù)據(jù),不能滿足智能電網(wǎng)建設(shè)的要求,本文將Spark云計(jì)算框架應(yīng)用于電力設(shè)備監(jiān)測(cè)中,以DGA監(jiān)測(cè)數(shù)據(jù)作為處理樣本,并行實(shí)現(xiàn)樸素貝葉斯算法完成對(duì)變壓器故障診斷,隨著數(shù)據(jù)樣本的增加準(zhǔn)確率越來越高,通過對(duì)原數(shù)據(jù)的動(dòng)態(tài)復(fù)制,數(shù)據(jù)量到達(dá)GB時(shí),Spark并行處理數(shù)據(jù)時(shí)間要遠(yuǎn)遠(yuǎn)小于傳統(tǒng)的串行診斷方法。

    本文只是對(duì)電力設(shè)備監(jiān)測(cè)數(shù)據(jù)并行診斷做了實(shí)驗(yàn),在實(shí)驗(yàn)中處理的數(shù)據(jù)都是人為的收集整理,不是監(jiān)測(cè)設(shè)備傳回的流式實(shí)時(shí)數(shù)據(jù),而且樣本規(guī)模小,需要人為復(fù)制擴(kuò)充,應(yīng)用到具體工程實(shí)踐中還有許多工作,在后續(xù)工作中還需要優(yōu)化Spark處理性能,提高監(jiān)測(cè)數(shù)據(jù)診斷的速度和準(zhǔn)確率。

    參考文獻(xiàn):

    [1]王海霞, 李傳紅, 李玉珍,等. 無線傳感器電力設(shè)備監(jiān)測(cè)[J]. 化工管理, 2014(14):198-198.

    [2]甘櫪元. 基于云計(jì)算的數(shù)據(jù)挖掘算法的研究[J]. 電子技術(shù)與軟件工程, 2015(7):195-195.

    [3]薩初日拉,周國亮,時(shí)磊,等.Spark環(huán)境下并行立方體計(jì)算方法[J].計(jì)算機(jī)應(yīng)用,2016,36(2):348-352.

    [4]宋亞奇,周國亮,朱永利.智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)[J].電網(wǎng)技術(shù),2013,37(4):927-935.

    [5]周國亮,宋亞奇,王桂蘭,等.狀態(tài)監(jiān)測(cè)大數(shù)據(jù)存儲(chǔ)及聚類劃分研究[J].電工技術(shù)學(xué)報(bào),2013(S2):337-344.

    [6]王德文,孫志偉. 電力用戶側(cè)大數(shù)據(jù)分析與并行負(fù)荷預(yù)測(cè)[J].中國電機(jī)工程學(xué)報(bào),2015,35(3):527-537.

    [7]王德文,劉曉建. 基于MapReduce的電力設(shè)備并行故障診斷方法[J].電力自動(dòng)化設(shè)備,2014,34(10):116-120.

    [8]韓世軍, 朱菊, 毛吉貴,等. 基于粒子群優(yōu)化支持向量機(jī)的變壓器故障診斷[J]. 電測(cè)與儀表, 2014(11):71-75.

    [9]阮羚,謝齊家,高勝友,等. 人工神經(jīng)網(wǎng)絡(luò)和信息融合技術(shù)在變壓器狀態(tài)評(píng)估中的應(yīng)用[J].高電壓技術(shù),2014,40(3):822-828.

    [10]程聲烽,程小華,楊露. 基于改進(jìn)粒子群算法的小波神經(jīng)網(wǎng)絡(luò)在變壓器故障診斷中的應(yīng)用[J]. 電力系統(tǒng)保護(hù)與控制,2014(19):37-42.

    [11]石鑫,朱永利. 深度學(xué)習(xí)神經(jīng)網(wǎng)絡(luò)在電力變壓器故障診斷中的應(yīng)用[J].電力建設(shè),2015,36(12):116-122.

    [12]武中利. 電力變壓器故障診斷方法研究[D].保定:華北電力大學(xué),2013.

    [13]張敏. 淺析變壓器油中溶解氣體色譜分析與故障診斷[J]. 科技創(chuàng)新與應(yīng)用, 2015(23):96-97.

    [14]趙文清.基于數(shù)據(jù)挖掘的變壓器故障診斷和預(yù)測(cè)研究[D].保定:華北電力大學(xué),2009.

    [15]邵津生,管磊.Hadoop加速比性能模型研究[J]. 河南師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(2):152-157.

    Transformer Fault Diagnosis in Parallel Based on the Spark Platform

    LIU Cheng1,NIU Rui1,F(xiàn)AN Heming2,XU Jing1,ZHU Yongli1

    (1. School of Control and Computer Engineering, North China Electric Power University, Baoding 071003, China; 2. State Grid Jibei Electric Power Co., Ltd., Chengde Power Supply Company, Chengde 067000, China)

    Abstract:For dealing with the massive amounts of power equipment monitoring data and meeting the smart grid rapid diagnosis requirements, this paper takes power transformer fault diagnosis as an example and proposes a parallel method based on spark to diagnosis transformer monitoring data. The experiment chooses dissolved gas in oil as input data and uses parallel naive Bayesian classification for fault diagnosis. The results show that the parallel Bayesian method in transformer fault diagnosis is faster than that of the traditional stand-alone environment. The power equipment monitoring data parallel diagnosis platform based on Spark is able to quickly process a great quantity data and complex model scene; the speedup of cluster significantly improves with the nodes increasing, it can also meet for power grid big data quickly processing requirements.

    Keywords:Spark;transformer fault diagnosis;naive Bayesian;smart grid

    收稿日期:2016-04-16。

    基金項(xiàng)目:河北省自然科學(xué)基金(F2014502069);國家電網(wǎng)(2014MS129)。

    作者簡(jiǎn)介:劉成 (1990-),男,碩士研究生,研究方向?yàn)閟park并行計(jì)算,E-mail:1554720961@qq.com。

    中圖分類號(hào):TP391.9

    文獻(xiàn)標(biāo)識(shí)碼:A

    DOI:10.3969/j.issn.1672-0792.2016.06.006

    猜你喜歡
    智能電網(wǎng)
    美國與中國智能電網(wǎng)的發(fā)展模式比較與分析
    論大數(shù)據(jù)技術(shù)在智能電網(wǎng)中的應(yīng)用
    智能電網(wǎng)大數(shù)據(jù)處理技術(shù)現(xiàn)狀與挑戰(zhàn)
    智能電網(wǎng)高可靠通信系統(tǒng)探究
    智能電網(wǎng)信息與通信技術(shù)研究
    智能電網(wǎng)背景下的調(diào)度安全管理
    淺談智能電網(wǎng)的調(diào)控一體化發(fā)展
    高可靠的電網(wǎng)虛擬化云資源調(diào)度技術(shù)
    智能電網(wǎng)下電力網(wǎng)絡(luò)營(yíng)銷模式
    智能電網(wǎng)中光纖通信系統(tǒng)的可靠性分析
    安康市| 陕西省| 晴隆县| 通山县| 巫山县| 张北县| 开封县| 钟山县| 宜兰市| 隆德县| 湘西| 黔西| 石泉县| 吴川市| 紫金县| 永胜县| 日土县| 小金县| 仁寿县| 合江县| 沅江市| 获嘉县| 新宁县| 利川市| 葫芦岛市| 盱眙县| 青浦区| 肃宁县| 乳源| 淮安市| 龙州县| 洛宁县| 定兴县| 喜德县| 淳安县| 会理县| 精河县| 东至县| 久治县| 新乡市| 道孚县|