• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于GSA的用電信息采集異常精確定位研究

      2014-01-16 05:57:48左慶鄰慕福林
      電子設(shè)計工程 2014年14期
      關(guān)鍵詞:測數(shù)據(jù)精確定位數(shù)據(jù)挖掘

      左慶鄰,慕福林,冉 艷,朱 鸝,楊 歡

      (1.國網(wǎng)重慶市電力公司 客戶服務(wù)中心,重慶 400017; 2.國網(wǎng)重慶市電力公司 江北供電分公司,重慶 400017)

      在當(dāng)今經(jīng)濟(jì)的發(fā)展趨勢下,傳統(tǒng)電網(wǎng)已經(jīng)不能夠滿足電力行業(yè)的需求,智能電網(wǎng)成為發(fā)展方向。而就目前來說,電網(wǎng)已成為工業(yè)化、信息化社會發(fā)展的基礎(chǔ)和重要組成部分。隨著市場化改革的不斷推進(jìn),智能電網(wǎng)已成為現(xiàn)代電網(wǎng)技術(shù)發(fā)展的必由之路。其中,隨著電子技術(shù)的發(fā)展,用電信息采集系統(tǒng)為實現(xiàn)電量采集、數(shù)據(jù)統(tǒng)計分析及電量考核提供了切實可行的技術(shù)手段,從根本上克服了傳統(tǒng)人工抄表模式的弊端。隨著電網(wǎng)的結(jié)構(gòu)與運(yùn)行方式日趨復(fù)雜,人們對電網(wǎng)運(yùn)行的可靠性與電能質(zhì)量也提出了更高的要求。提高用戶信息采集數(shù)據(jù)準(zhǔn)確性,研究可行的異常數(shù)據(jù)辨識及異常點(diǎn)精確定位方法,對電力系統(tǒng)的安全和穩(wěn)定運(yùn)行意義重大。

      1 研究背景

      1.1 用電信息采集異常精確定位技術(shù)

      用電信息采集系統(tǒng)已在電力系統(tǒng)建設(shè)中起到重要作用,但與之相對應(yīng)的用電信息采集異常精確定位一直沒有良好的解決方案。如集抄系統(tǒng)雖然可以滿足負(fù)荷分析和低電壓監(jiān)測的要求,但難以滿足配網(wǎng)狀態(tài)檢修的需要。當(dāng)電能表發(fā)生故障時,只能靠用戶電話反饋才能確定電能表發(fā)生故障并確定故障位置。因此找到一種合理有效的用電信息采集異常精確定位解決方法,是我國發(fā)展“電網(wǎng)2.0”的必然要求。

      用電信息采集異常精確定位建設(shè)需要解決的是企業(yè)經(jīng)營活動所覆蓋區(qū)域內(nèi)復(fù)雜的、分布的、異構(gòu)的信息資源的交換、轉(zhuǎn)換、集成與共享。從采集的數(shù)據(jù)中獲取故障集中器、關(guān)口表或電能表的地址信息,確定故障出現(xiàn)的具體位置。

      1.2 數(shù)據(jù)挖掘在電力系統(tǒng)中的應(yīng)用

      用電信息采集異常精確定位的建設(shè)更重要的是從數(shù)據(jù)中獲取故障電能表的地址信息,不斷完善多種分析策略為電力生產(chǎn)服務(wù)。在電力系統(tǒng)中,數(shù)據(jù)挖掘技術(shù)可以用來完成電力系統(tǒng)的調(diào)度運(yùn)行、決策支持控制、電力系統(tǒng)建模、設(shè)備運(yùn)行狀態(tài)的監(jiān)視和電力系統(tǒng)負(fù)荷預(yù)測分類等決策任務(wù)。

      數(shù)據(jù)挖掘中聚類分析的一個主要的難題是估計聚類的最佳數(shù)量,聚類離散度與聚類個數(shù)的關(guān)系包含著最佳聚類個數(shù)的信息,基于GSA(Gap Statistic Algorithm)的數(shù)據(jù)挖掘是挖掘此類信息的方法之一。目前,國外對GSA方法的研究剛起步,Tibshirini R.和Walther G.于2000年提出這種方法[1],但許多方面仍有待進(jìn)一步完善,之后幾年在IEEE等期刊中陸續(xù)出現(xiàn)基于GSA方法的應(yīng)用論文,表明GSA方法具有其一定的應(yīng)用價值。本文將研究基于GSA的數(shù)據(jù)挖掘的方法,探索新的電力系統(tǒng)中異常數(shù)據(jù)檢測定位方法,并將之引入到電力系統(tǒng)異常數(shù)據(jù)定位的應(yīng)用中來。

      2 基于GSA的數(shù)據(jù)挖掘體系

      在應(yīng)用于電力系統(tǒng)異常數(shù)據(jù)定位時,并不是對電力系統(tǒng)原始量測數(shù)據(jù)直接進(jìn)行分析,而是建立在人工神經(jīng)網(wǎng)絡(luò)對量測數(shù)據(jù)的預(yù)處理的基礎(chǔ)上的。利用神經(jīng)網(wǎng)絡(luò)處理非線性輸入輸出關(guān)系的特性[2],從神經(jīng)網(wǎng)絡(luò)的輸入輸出數(shù)據(jù)中挖掘出有關(guān)量測誤差值的信息。聚類分析階段對接收到的已處理數(shù)據(jù)進(jìn)行自動定位,接著確定最佳聚類個數(shù),最終對應(yīng)定位原始數(shù)據(jù)中的異常數(shù)據(jù)。

      2.1 基于GSA的異常數(shù)據(jù)算法

      GSA算法主要由神經(jīng)網(wǎng)絡(luò)和聚類分析兩個模塊構(gòu)成,如圖1[3]。

      圖1 GSA算法模塊組成圖Fig.1 GSA algorithm module composition

      文中選用BP神經(jīng)網(wǎng)絡(luò),首先將獲取到的用戶信息采集數(shù)據(jù)對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,采樣200組實時量測數(shù)據(jù),取出現(xiàn)異常數(shù)據(jù)前的180組正常數(shù)據(jù)對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,完成后再代入余下的20組待測試數(shù)據(jù)進(jìn)行處理。訓(xùn)練調(diào)整網(wǎng)絡(luò)的權(quán)值后,量測值的估計值受外界的影響將會最小。這樣,量測值中如果存在異常數(shù)據(jù),則其與網(wǎng)絡(luò)輸出必然有較大差值。取期望輸出和實際輸出之差的平方和為誤差函如果實際輸出不滿足要求,反向傳回誤差信號,并修改每個隱含層的各個神經(jīng)元的權(quán)系數(shù),直至誤差函數(shù)值最小,可使得輸出滿足系統(tǒng)精度要求[4-5]。

      BP神經(jīng)網(wǎng)絡(luò)的輸出數(shù)據(jù)作為聚類分析模塊的待測數(shù)據(jù)輸入。聚類模塊采用的是K-means聚類算法[6-7]。對于每次輸入的聚類數(shù)k ,計算得到聚類離散度 Wk。

      2.2 GSA算法的流程

      圖2給出了基于GSA算法的程序流程圖[3]。

      圖2 GSA算法程序流程圖Fig.2 GSA algorithm program flow

      如圖所示,首先把聚類數(shù)量 置為1,然后執(zhí)行 直到確定最佳的聚類數(shù)量 為止。主要的計算過程有以下幾步[3]:

      1) 待檢測數(shù)據(jù)計算誤平方

      通過BP神經(jīng)網(wǎng)絡(luò)的工作,獲得每個輸入變量ei(系統(tǒng)中各節(jié)點(diǎn)的測量數(shù)據(jù)與安全可靠運(yùn)行數(shù)據(jù)之間的差值)相應(yīng)的輸出Qi。這一步得到的平方誤差數(shù)據(jù)(ei-Qi)2作為下一步的輸入數(shù)據(jù)。

      2) 平方誤差(ei-Qi)2進(jìn)行聚類

      這一步中,根據(jù)上一步獲得的數(shù)據(jù)通過K-means算法進(jìn)行聚類,聚類數(shù)據(jù)的聚類離散度

      3) 參考數(shù)據(jù)進(jìn)行聚類

      作為比較基準(zhǔn),參考數(shù)據(jù)集采用在待檢測數(shù)據(jù)范圍內(nèi)產(chǎn)生均勻分布的隨機(jī)值。對于每個W(k) ,產(chǎn)生F組參考數(shù)據(jù)集。參考數(shù)據(jù)集聚類離散度也同樣通過式(1)計算得到,稱為Wi,j(k) (j=1,2,…,F)。然后使用2)中的方法對參考數(shù)據(jù)進(jìn)行聚類。

      4)確定最佳的聚類個數(shù)這一步中,首先計算值

      接著,最佳聚類個數(shù)將等于 k-1,如果滿足下式:

      5)檢測和定位異常數(shù)據(jù)

      注意到當(dāng)最佳聚類數(shù)量為1時,意味著所有待檢測數(shù)據(jù)都可以被認(rèn)為是正常數(shù)據(jù),而一旦最佳聚類數(shù)量不為1時,所觀察的待檢測數(shù)據(jù)中存在異常數(shù)據(jù)。接著計算每個聚類的(ei-Oi)2的平均值,其中具有最小(ei-Oi)2平均值的聚類被認(rèn)為是正常數(shù)據(jù)的聚類,而其它的都被認(rèn)為是異常數(shù)據(jù)的聚類。查詢這些均值較大的聚類中元素,相應(yīng)地可以挑選出異常數(shù)據(jù)。通過上述流程,正常數(shù)據(jù)被歸并到一個類中,而異常數(shù)據(jù)被分離開來。

      本文利用C語言根據(jù)此流程圖編寫GSA算法程序,以下有關(guān)GSA算法的數(shù)據(jù)均由此程序計算得出。

      3 GSA算法仿真與分析

      3.1 數(shù)據(jù)集

      文中算法所用的數(shù)據(jù)選取連接500 kV、220 kV電網(wǎng)各變電站的聯(lián)絡(luò)線及變電站出線的有功值,共103條線路的有功測量值。仿真數(shù)據(jù)選取2013年3月15日至2013年3月18日SCADA所采集的用電信息實時數(shù)據(jù),間隔為15分鐘,每天共88組數(shù)據(jù)。

      3.2 算法仿真

      本節(jié)以狀態(tài)估計后的正常數(shù)據(jù)為基礎(chǔ),經(jīng)過人為設(shè)置異常數(shù)據(jù)后代入程序進(jìn)行驗證仿真,將對不含異常數(shù)據(jù)情況、含單個異常數(shù)據(jù)情況以及含多個異常數(shù)據(jù)情況等做進(jìn)一步的仿真與分析。采用2013年3月16日數(shù)據(jù),此日狀態(tài)估計系統(tǒng)共進(jìn)行264次估計計算,估計計算結(jié)果全部收斂。首先利用3月16日的前80組數(shù)據(jù)對BP神經(jīng)網(wǎng)絡(luò)算法進(jìn)行訓(xùn)練,81-83組數(shù)據(jù)為待測數(shù)據(jù),其中第81、82、83組數(shù)據(jù)分別為不含異常數(shù)據(jù)的正確數(shù)據(jù)、含有單個異常的數(shù)據(jù)、含有多個異常的數(shù)據(jù)。利用神經(jīng)網(wǎng)絡(luò)對數(shù)據(jù)進(jìn)行訓(xùn)練,完成后測試訓(xùn)練結(jié)果。

      1) 不含異常數(shù)據(jù)情況

      采用數(shù)據(jù)集中2013年3月16日第81組數(shù)據(jù)進(jìn)行測試,此組數(shù)據(jù)均為正常數(shù)據(jù),不含異常數(shù)據(jù)。將BP神經(jīng)網(wǎng)絡(luò)預(yù)處理后的數(shù)據(jù)代入GSA算法程序,各聚類參數(shù)結(jié)果如表1所示:

      根據(jù)GSA算法最佳聚類判定公式有g(shù)ap(k-1) ≥gap(k)-sk,當(dāng)聚類個數(shù)為2時,gap(2) -s2=4.519 2,小于gap(1)的值,則最佳聚類為 (k-1)=1類,程序結(jié)果表明最佳聚類為1類,無異常數(shù)據(jù),與實際情況相符。結(jié)果表明在無異常數(shù)據(jù)時,GSA算法能正確做出判定,將數(shù)據(jù)聚為一類,無異常數(shù)據(jù)。

      表1 不含異常數(shù)據(jù)情況各聚類參數(shù)Tab.1 Clustering parameters without abnormal nodes

      圖3 不含異常數(shù)據(jù)情況各聚類gap值折線圖Fig.3 Clustering gap values line graph without abnormal nodes

      2) 含單個異常數(shù)據(jù)情況

      采用數(shù)據(jù)集中2013年3月16日第82組數(shù)據(jù)進(jìn)行測試,此組數(shù)據(jù)為準(zhǔn)確數(shù)據(jù),人為設(shè)置一個誤差量,假設(shè)電力系統(tǒng)中節(jié)點(diǎn)34中出現(xiàn)用電信息采集異常數(shù)據(jù),歸一化處理后,對某一用電信息數(shù)據(jù)由0.867 4設(shè)置為1.305 6,為方便比較分析,表2列出了此類情況下聚類個數(shù)為1至5時所得的參數(shù)值:

      表2 含單個異常數(shù)據(jù)情況各聚類參數(shù)Tab.2 Clustering parameters with one abnormal node

      圖4 待測數(shù)據(jù)中含單個異常數(shù)據(jù)情況各聚類gap值折線圖Fig.4 Clustering gap values line graph with one abnormal node

      由圖可看出,當(dāng)聚類個數(shù)為2時,gap(2) -s2=8.297 4-0.095 7=8.201 7,大于gap(1)值5.768 6,則最佳聚類不是聚類為 (k-1)=1類,當(dāng)k=3時,gap(3) -s3=6.998 7-0.102 4=6.896 3,此結(jié)果小于gap(2)值8.297 4,表明(k-1)=2為最佳聚類。

      通過比較各聚類中數(shù)據(jù)平均值大小來確定異常數(shù)據(jù)所在的聚類。聚類結(jié)果中聚類元素平均值最小的被認(rèn)為是正常數(shù)據(jù)所在聚類,而均值較大的其他聚類都被認(rèn)為是異常數(shù)據(jù)所在的聚類。然后找出這些聚類內(nèi)的數(shù)據(jù),就能相應(yīng)地定位出異常數(shù)據(jù)。進(jìn)一步分析各聚類結(jié)果如表3所示。

      表3 含單個異常數(shù)據(jù)情況聚類元素及各聚類中心Tab.3 Clustering elements and centers with one abnormal node

      聚類1內(nèi)各數(shù)據(jù)均值:

      聚類2內(nèi)各數(shù)據(jù)均值:

      比較結(jié)果知,聚類1元素均值要大于聚類2元素,說明異常數(shù)據(jù)所在聚類為聚類1,第34個數(shù)據(jù)為異常數(shù)據(jù),結(jié)果符合預(yù)期,說明GSA算法能準(zhǔn)確定位出設(shè)定的異常數(shù)據(jù)。

      3)含多個異常數(shù)據(jù)情況

      電力系統(tǒng)中出現(xiàn)異常數(shù)據(jù)的概率較小,同時出現(xiàn)多個異常數(shù)據(jù)的概率更小,但為驗證GSA算法在多個異常數(shù)據(jù)定位方面也有較好表現(xiàn),此處采用2013年3月16日第83組數(shù)據(jù)進(jìn)行測試,異常數(shù)據(jù)設(shè)置位置于節(jié)點(diǎn)20、45、74、99,其中節(jié)點(diǎn)20數(shù)據(jù)由0.547 5設(shè)置為0.954 6,,節(jié)點(diǎn)45數(shù)據(jù)由0.354 9設(shè)置為0.567 6,節(jié)點(diǎn)74數(shù)據(jù)由0.493 5設(shè)置為0.156 7,節(jié)點(diǎn)99數(shù)據(jù)由0.986 4設(shè)置為0.643 8。將含有多個異常數(shù)據(jù)的數(shù)組代入程序,為方便比較分析,表4列出聚類數(shù)為1至5時所得的參數(shù)值:

      表4 含多個異常數(shù)據(jù)情況各聚類參數(shù)Tab.4 Clustering parameters with multiple abnormal nodes

      圖5 待測數(shù)據(jù)中含多個異常數(shù)據(jù)情況各聚類gap值折線圖Fig.5 Clustering gap values line graph with multiple abnormal nodes

      由圖可看出,當(dāng)聚類個數(shù)為2時,gap(2) -s2=4.600 6-0.078 5=4.522 1,大于gap(1)值4.265 4,則最佳聚類不是聚類為 (k-1)=1類,當(dāng)k=3時,gap(3) -s3=3.769 4-0.085 4=3.684 0,此結(jié)果小于gap(2)值4.600 6,表明(k-1)=2為最佳聚類。

      為確定異常數(shù)據(jù)所在的位置,計算各聚類中心以確定各聚類的平均誤差。

      表5 含多個異常數(shù)據(jù)情況聚類元素及各聚類中心Tab.5 Clustering elements and centers with multiple abnormal nodes

      聚類1內(nèi)各數(shù)據(jù)均值:

      聚類2內(nèi)各數(shù)據(jù)均值:

      比較結(jié)果知,聚類1元素均值要大于聚類2元素,說明異常數(shù)據(jù)所在聚類為聚類1,第20,45,74,99個數(shù)據(jù)為異常數(shù)據(jù),結(jié)果符合預(yù)期,說明在同時出現(xiàn)多個異常數(shù)據(jù)時,GSA算法也能準(zhǔn)確定位出異常數(shù)據(jù)。

      將假定異常點(diǎn)數(shù)量增加,仿真得到聚類結(jié)果出現(xiàn)多于兩個聚類數(shù)量的情況。

      3.3 結(jié)果分析

      從仿真結(jié)果中可以看出,GSA算法在不含異常數(shù)據(jù)和含有單個異常數(shù)據(jù)情況下能夠精確進(jìn)行定位,在出現(xiàn)多個異常數(shù)據(jù)定位過程中,若出現(xiàn)將異常數(shù)據(jù)聚為兩類及兩類以上的情況,這是由K均值算法固有特點(diǎn)決定的,這種情況也能精確定位出異常數(shù)據(jù)。

      可見GSA算法的檢測效果取決于神經(jīng)網(wǎng)絡(luò)以及聚類算法,只要神經(jīng)網(wǎng)絡(luò)構(gòu)造得好,訓(xùn)練精度高并且聚類分析算法選擇恰當(dāng),對于各種規(guī)模的電力系統(tǒng),不論異常數(shù)據(jù)的形式如何,GSA 算法都能夠?qū)⑵渚_定位。

      4 結(jié)束語

      GSA算法是一種新的異常數(shù)據(jù)檢測算法。它結(jié)合了神經(jīng)網(wǎng)絡(luò)技術(shù)與聚類算法在異常數(shù)據(jù)監(jiān)測方面的優(yōu)點(diǎn),為檢測異常數(shù)據(jù)提供了一個新的方法。本文研究基于GSA算法的用電信息采集中異常數(shù)據(jù)的精確定位,采用電力系統(tǒng)中采集到的用電信息進(jìn)行各種情況下的仿真,比較驗證了GSA算法在定位異常數(shù)據(jù)的優(yōu)越性,表明GSA算法具有更廣闊的應(yīng)用范圍。

      [1]Tibshirini R, Walther G, Hastie T. Estimating the Number of Cluster in a Dataset via the Gap Statistic[J]. Unpublished Technical Report: Stanford University. 2000: 1-18.

      [2]H. Salehfar, R. Zhao. A neural network pre-estimation filter for bad-data detection and identification in power system state estimation[J]. Electric power system research. 1995, 34(8): 127-134.

      [3]HUANG Shy-jier, LIN Jeu-min. Enhancement of Power System Data Debugging Using GSA-based Data-mining Technique[J].IEEE Trans on Power Systems, 2002, 17(4): 1022-1026.

      [4]聞新, 周露. Matlab神經(jīng)網(wǎng)絡(luò)仿真與應(yīng)用[M]. 北京:科學(xué)出版社, 2003.

      [5]邵峰晶, 于忠清. 數(shù)據(jù)挖掘原理與算法[M]. 北京:中國水利水電出版社, 2003.

      [6] 黃新波,王婭娜, 劉林,等. 變壓器油色譜在線監(jiān)測中BP神經(jīng)網(wǎng)絡(luò)算法分析[J]. 陜西電力,2013(6):56-60.HUANG Xin-bo,WANG Ya-na,LIU Lin,et al. Application of back propagation neural network in dissolved gas analysis based on transformer oil chromatographic on-line monitoring[J].Shaanxi Electric Power,2013(6):56-60.

      [7] 寧姍. 基于蟻群聚類的多目標(biāo)環(huán)形分類的方法研究[J]. 工業(yè)儀表與自動化裝置,2012(5):70-73.NING Shan. Research on annular sort of multi-objects based on ant colony clustering[J]. Industrial Instrumentation &Automation,2012(5):70-73.

      猜你喜歡
      測數(shù)據(jù)精確定位數(shù)據(jù)挖掘
      精確定位
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      基于SCADA和WAMS的線路參數(shù)辨識研究
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      基于PMU/SCADA混合量測數(shù)據(jù)兼容性的船舶系統(tǒng)狀態(tài)估計研究
      電測與儀表(2016年6期)2016-04-11 12:08:20
      精確定位
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      電力設(shè)備紅外測溫多點(diǎn)精確定位控制系統(tǒng)設(shè)計
      精確定位
      提高變電站基礎(chǔ)量測數(shù)據(jù)時間同步性的方法
      遵义县| 宿迁市| 崇礼县| 长丰县| 丰台区| 马尔康县| 德清县| 明溪县| 珲春市| 甘孜| 瑞丽市| 布拖县| 新邵县| 温宿县| 玛沁县| 崇左市| 武强县| 项城市| 德格县| 交城县| 东源县| 新蔡县| 花莲县| 太仓市| 易门县| 皮山县| 雷山县| 藁城市| 军事| 南丹县| 北京市| 松溪县| 定安县| 襄垣县| 德州市| 宣城市| 滦南县| 云霄县| 巩留县| 台湾省| 香港 |