• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于離群數(shù)據(jù)挖掘的多點(diǎn)電力負(fù)荷預(yù)測(cè)方法

      2022-01-22 02:16:12胡佳佳楊洪耕
      計(jì)算機(jī)仿真 2021年12期
      關(guān)鍵詞:離群結(jié)點(diǎn)數(shù)據(jù)挖掘

      胡佳佳,楊洪耕

      (四川大學(xué)電氣工程學(xué)院,四川 成都 610000)

      1 引言

      隨著社會(huì)的飛速進(jìn)步與電力的穩(wěn)步發(fā)展,電力生產(chǎn)部門重中之重的工作內(nèi)容之一就是電力負(fù)荷預(yù)測(cè),其判定依據(jù)主要是電力負(fù)荷的歷史數(shù)據(jù)與其它具有一定關(guān)聯(lián)性的因素。由于歷史數(shù)據(jù)在極大程度上會(huì)對(duì)預(yù)測(cè)精準(zhǔn)度產(chǎn)生影響,所以,眾多相關(guān)研究學(xué)者積極討論電力負(fù)荷預(yù)測(cè)的其他有效方法。文獻(xiàn)[1]提出一種基于Attention機(jī)制的卷積神經(jīng)網(wǎng)絡(luò)-GRU短期電力負(fù)荷預(yù)測(cè)方法,通過創(chuàng)建卷積神經(jīng)網(wǎng)絡(luò),對(duì)負(fù)荷動(dòng)態(tài)變化特征進(jìn)行提取,將其以時(shí)間序列形式作為GRU的網(wǎng)絡(luò)輸入,得到特征的動(dòng)態(tài)變化規(guī)律,采用映射加權(quán)與學(xué)習(xí)參數(shù)矩陣,獲取GRU不同狀態(tài)下的權(quán)值,從而使短期負(fù)荷預(yù)測(cè)得以完成;文獻(xiàn)[2]的負(fù)荷預(yù)測(cè)方法則是通過變分模態(tài)分解劃分初始電力負(fù)荷序列,采用螢火蟲算法改進(jìn)BP神經(jīng)網(wǎng)絡(luò)模型,根據(jù)樣本熵重組所有子序列,將取得的新分量輸入模型后,實(shí)現(xiàn)負(fù)荷預(yù)測(cè);文獻(xiàn)[3]提出的多任務(wù)負(fù)荷預(yù)測(cè)法中,依據(jù)預(yù)測(cè)模型的共享低維表示,建立多任務(wù)的相關(guān)性,根據(jù)不同任務(wù)的差異,達(dá)成負(fù)荷的最終預(yù)測(cè)。

      上述方法盡管能夠較快的得到預(yù)測(cè)結(jié)果,但是預(yù)測(cè)精準(zhǔn)度不夠理想,因此,提出一種基于離群數(shù)據(jù)挖掘的多點(diǎn)電力負(fù)荷預(yù)測(cè)方法,引入離群數(shù)據(jù)挖掘算法,采用隨機(jī)變量不確定性的度量,實(shí)現(xiàn)負(fù)荷異常數(shù)據(jù)的識(shí)別與校正,最終完成多點(diǎn)電力負(fù)荷預(yù)測(cè)。所提方法有效提升了預(yù)測(cè)精準(zhǔn)度,具有較好的去噪效果。

      2 離群數(shù)據(jù)挖掘算法分析

      2.1 離群數(shù)據(jù)的獲取

      已知一m維空間的時(shí)序點(diǎn)集合P,采用離散傅里葉[4]對(duì)該集合進(jìn)行轉(zhuǎn)換,則對(duì)應(yīng)的離群數(shù)據(jù)點(diǎn)集合C的求取步驟如下所示:

      1)將空值設(shè)定成離群數(shù)據(jù)點(diǎn)集合C的初始值,0為儲(chǔ)存Dk的極小值minDkDist初始值;

      2)在R-Tree中添加集合P的所有點(diǎn)p與極小邊界矩形MBR;

      3)求解集合P內(nèi)所有點(diǎn)p與第m個(gè)最近的鄰域點(diǎn)p之間的間距Dk(p);

      4)若儲(chǔ)存Dk的極小值minDkDist比點(diǎn)p的Dk(p)小,也就是minDkDist

      5)若離群數(shù)據(jù)點(diǎn)集合C內(nèi)的點(diǎn)個(gè)數(shù)比n大,那么,除去集合C里Dk(p)數(shù)值最小的點(diǎn),也就是集合C中相對(duì)靠前的點(diǎn);

      6)若C.numpoints()=n,則對(duì)集合C內(nèi)最靠前的點(diǎn)Dk(p)數(shù)值進(jìn)行更新,得到minDkDist后,返回第4)步;

      7)返回離群數(shù)據(jù)點(diǎn)集合C,終止運(yùn)算。

      2.2 點(diǎn)pDk(p)值的求取

      在獲取離群數(shù)據(jù)點(diǎn)集合的過程中,采用了下列求取策略對(duì)點(diǎn)p的Dk(p)值進(jìn)行計(jì)算,隨著運(yùn)算Dk值點(diǎn)數(shù)量的不斷增加,Dk值呈現(xiàn)單調(diào)遞減趨勢(shì),所以,按照Dk值的遞增順序,排列集合C里的離群數(shù)據(jù)點(diǎn),也就是說,集合C內(nèi)越靠前的數(shù)據(jù)點(diǎn),對(duì)應(yīng)的Dk值就越小。

      已知存在于時(shí)序點(diǎn)集合P內(nèi)的點(diǎn)p及其最小Dk值minDkDist和相關(guān)根結(jié)點(diǎn),為了取得DkDist值,也就是點(diǎn)p與第k個(gè)最近的鄰域點(diǎn)p之間的間距Dk(p),設(shè)計(jì)如下計(jì)算流程:

      1)創(chuàng)建一個(gè)鏈表[5],設(shè)定為nodelist;

      2)對(duì)p.DkDist=∞執(zhí)行初始化操作,令點(diǎn)p第k個(gè)最近的鄰域點(diǎn)集合是空集;

      3)在鏈表nodelist是非空的情況下,如果結(jié)點(diǎn)屬于葉子結(jié)點(diǎn)[6],那么,可以得到結(jié)點(diǎn)內(nèi)的所有點(diǎn)q;

      4)若點(diǎn)p與點(diǎn)q之間的長度dist(p,q)比點(diǎn)p的Dk(p)小,也就是,dist(p,q)

      5)在點(diǎn)p第k個(gè)最近的鄰域點(diǎn)集合Ck中引入點(diǎn)q,若集合Ck里的點(diǎn)數(shù)量Ck.points大于k值,則將集合Ck里最靠前的點(diǎn)進(jìn)行去除;若集合Ck里的點(diǎn)數(shù)量Ck.points與k值相等,那么,p.DkDist=dist(p,Ck.Top());

      6)若minDkDist

      7)如果結(jié)點(diǎn)屬于非葉子結(jié)點(diǎn)類型,那么,在鏈表nodelist中添加子結(jié)點(diǎn)后,對(duì)結(jié)點(diǎn)鏈表按照MinDist的順序進(jìn)行排序;

      8)關(guān)于鏈表nodelist內(nèi)所有結(jié)點(diǎn),若p.DkDist≤MinDist(p,Node),那么,將鏈表里的該結(jié)點(diǎn)進(jìn)行去除,并返回第3)步。

      3 多點(diǎn)電力負(fù)荷預(yù)測(cè)模型架構(gòu)

      在多點(diǎn)電力負(fù)荷預(yù)測(cè)的結(jié)構(gòu)里,存在若干個(gè)具有互斥性能的節(jié)點(diǎn),其集合所組成的上一級(jí)形式就叫做整體,圖1所示即為多點(diǎn)電力負(fù)荷預(yù)測(cè)的框架結(jié)構(gòu),其分支形狀的順序是從上到下的,層級(jí)分類數(shù)是由分叉次數(shù)決定的,依據(jù)實(shí)際的負(fù)荷要求,對(duì)節(jié)點(diǎn)進(jìn)行單層或多層的設(shè)定。

      圖1 多點(diǎn)電力負(fù)荷預(yù)測(cè)框架結(jié)構(gòu)圖

      現(xiàn)實(shí)電力負(fù)荷中的10kV線路與35kV專線為上圖里最底層的白色圈。實(shí)際需要解決的電力負(fù)荷預(yù)測(cè)問題影響著整體與節(jié)點(diǎn)的選取策略,比如將節(jié)點(diǎn)選擇為省市級(jí)的電網(wǎng),整體則是區(qū)域電網(wǎng);或者將上圖中D1~D3的結(jié)構(gòu)部分設(shè)定成待預(yù)測(cè)范圍,整體選取為該部分中的最高等級(jí)節(jié)點(diǎn),節(jié)點(diǎn)則為該部分中次一級(jí)或者再次一級(jí)的節(jié)點(diǎn)。

      常用的負(fù)荷預(yù)測(cè)多為從節(jié)點(diǎn)至整體的形式,以單個(gè)節(jié)點(diǎn)的測(cè)量數(shù)據(jù)為出發(fā)點(diǎn),對(duì)所有節(jié)點(diǎn)法負(fù)荷變化進(jìn)行分布式預(yù)測(cè),經(jīng)過與部分結(jié)構(gòu)中全部節(jié)點(diǎn)的預(yù)測(cè)結(jié)果相結(jié)合,獲取整體負(fù)荷的預(yù)測(cè)結(jié)果,可以采用下列數(shù)學(xué)表達(dá)式對(duì)其實(shí)施概括

      (1)

      上式里,i=1,2,…,n。整體負(fù)荷預(yù)測(cè)算法表示為F,負(fù)荷預(yù)測(cè)輸入量表示為X1,X2,…,Xm;節(jié)點(diǎn)負(fù)荷預(yù)測(cè)算法為f;單節(jié)點(diǎn)預(yù)測(cè)輸入量個(gè)數(shù)為m;網(wǎng)絡(luò)內(nèi)第i個(gè)節(jié)點(diǎn)用i指代;節(jié)點(diǎn)的總個(gè)數(shù)用n進(jìn)行表示;節(jié)點(diǎn)i的負(fù)荷預(yù)測(cè)輸入量是xi,1,xi,2,…,xi,m;由線路損耗而生成的節(jié)點(diǎn)總和與整體值比例系數(shù)則表示為η。

      基于實(shí)際配網(wǎng)的工作要求,架構(gòu)離群數(shù)據(jù)挖掘算法下多點(diǎn)電力負(fù)荷預(yù)測(cè)方法,因?yàn)榕潆姽芾硐到y(tǒng)內(nèi)存在各類能夠造成下層或電網(wǎng)終端節(jié)點(diǎn)數(shù)據(jù)不完整以及無法及時(shí)采集的影響因素,因此,將傳統(tǒng)的預(yù)測(cè)形式轉(zhuǎn)換為從整體至節(jié)點(diǎn)的順序。盡管節(jié)點(diǎn)的實(shí)時(shí)數(shù)據(jù)丟失,仍然可以基于歷史的節(jié)點(diǎn)數(shù)據(jù),通過整體負(fù)荷預(yù)測(cè)輔助節(jié)點(diǎn)負(fù)荷預(yù)測(cè)的方法,達(dá)成所有節(jié)點(diǎn)的負(fù)荷預(yù)測(cè),因此,對(duì)式(1)進(jìn)行改寫,得到如下數(shù)學(xué)表達(dá)式

      f(xi,1,xi,2,…,xi,m)=βi×F(X1,X2,…,Xm)

      (2)

      上式內(nèi),i=1,2,…,n。節(jié)點(diǎn)負(fù)荷與整體負(fù)荷預(yù)測(cè)的占比對(duì)角矩陣[7]表示為βi。

      4 多點(diǎn)電力負(fù)荷預(yù)測(cè)

      在創(chuàng)建的多點(diǎn)電力負(fù)荷預(yù)測(cè)模型中引入離群數(shù)據(jù)挖掘算法,可以識(shí)別與校正電力負(fù)荷損壞數(shù)據(jù)與不良數(shù)據(jù),補(bǔ)足自然數(shù)據(jù)與剝離沖擊數(shù)據(jù)。電力負(fù)荷數(shù)據(jù)集合形狀呈現(xiàn)不規(guī)則性,而且存在異常數(shù)據(jù),所以,離群數(shù)據(jù)挖掘算法非常適用于完成多點(diǎn)電力的負(fù)荷預(yù)測(cè)。

      根據(jù)下列聚類過程的流程圖,采用信息熵[8]準(zhǔn)則,對(duì)聚類階段的代表性點(diǎn)與合并點(diǎn)進(jìn)行判定與選取,依據(jù)提取的負(fù)荷特征曲線,預(yù)測(cè)與校正其中的異常數(shù)據(jù)。

      圖2 聚類階段流程圖

      4.1 信息熵

      基于隨機(jī)變量不確定性的度量,將離散隨機(jī)變量X={x1,x2,…,xN}出現(xiàn)的概率設(shè)定為P(xi),I(xi)設(shè)定為單個(gè)離散隨機(jī)變量xi所擁有的信息量,采用下列公式對(duì)信息量I(xi)進(jìn)行描述

      (3)

      如果隨機(jī)變量X存在不同的運(yùn)動(dòng)狀態(tài),個(gè)數(shù)為N,若各狀態(tài)按照P(X)={p(x1),p(x2),…,p(xN)}的概率分布得以發(fā)生,那么,利用X附帶的信息熵H(X),對(duì)其具備的不確定性進(jìn)行表征,信息熵H(X)的表達(dá)式如下所示

      (4)

      4.2 異常數(shù)據(jù)識(shí)別與校正

      根據(jù)多點(diǎn)電力負(fù)荷數(shù)據(jù)的周期性與相似性,通過如下離散數(shù)據(jù)挖掘方法,對(duì)其進(jìn)行異常數(shù)據(jù)的識(shí)別:

      1)將含有s個(gè)目標(biāo)的負(fù)荷數(shù)據(jù)隨機(jī)劃分成n個(gè)部分,為了防止異常數(shù)據(jù)太過密集,導(dǎo)致識(shí)別難度的增加,各部分中相對(duì)均勻地分散著不同數(shù)量的異常數(shù)據(jù);

      2)聚類所有的劃分部分,得到子聚類s/(nq)個(gè),其中,各部分的首次聚類數(shù)量應(yīng)超過1個(gè),即q>1。令n與q滿足s/(nq)·(2~3)k,以確保劃分對(duì)聚類效果不產(chǎn)生任何影響,其中,最終的聚類數(shù)量表示為k;

      3)根據(jù)各數(shù)據(jù)點(diǎn)的本身屬性特征,將代表性點(diǎn)c的選取依據(jù)設(shè)定為聚類階段里各數(shù)據(jù)點(diǎn)的信息量變化,采用式(4)得到聚類前后的信息熵,聚類的代表性點(diǎn)即為附帶信息量較大的數(shù)據(jù)點(diǎn),而選取的數(shù)量將影響運(yùn)算復(fù)雜度和聚類特征;

      4)通過最小距離法合并聚類數(shù)據(jù)集合,生成初始聚類集合,依據(jù)信息熵準(zhǔn)則對(duì)合并點(diǎn)進(jìn)行選擇。采用下列公式對(duì)兩個(gè)聚類之間的間距進(jìn)行描述

      (5)

      基于與點(diǎn)p最近的點(diǎn)p′m,對(duì)其相應(yīng)的聚類信息熵進(jìn)行運(yùn)算,并將集合S的新合并點(diǎn)選取為具有最小信息熵的目標(biāo)點(diǎn),從而生成新的聚類集合。點(diǎn)p與p′m之間的信息增益Igain表達(dá)式如下

      Igain(Sp′m)=I(Sp+Sp′m)-I(Sp)

      (6)

      經(jīng)過合并的聚類類別選擇為信息增益極大的目標(biāo)點(diǎn)對(duì)應(yīng)的聚類類別,合并點(diǎn)則記錄成對(duì)應(yīng)的類別特征;

      5)如果聚類階段中的某一聚類呈慢速提升,那么,可以判斷有存在異常數(shù)據(jù)點(diǎn)的可能性;若存在,實(shí)施修正,并將系統(tǒng)信息做出標(biāo)記,留待以后參考;

      6)針對(duì)初始聚類,采用第3)步到第5)步的操作過程進(jìn)行重新聚類,獲取新的聚類中心,待達(dá)成一定的聚類數(shù)量,即可停止識(shí)別。

      如果在離群數(shù)據(jù)挖掘過程里,發(fā)現(xiàn)曲線Xd存在異常數(shù)據(jù)點(diǎn)p1到p2,將Xt設(shè)定為所提取的相關(guān)負(fù)荷特征曲線,Xr為經(jīng)過修正的特征曲線,則校正損壞數(shù)據(jù)的運(yùn)算公式如下所示

      (7)

      式中,i=p1,p1+1,…,p2。

      5 仿真研究

      仿真環(huán)境為MATLAB R2013版本,采用64位Windows10系統(tǒng),奔騰雙核3.2GHz處理器,8GB運(yùn)行內(nèi)存的計(jì)算機(jī)。

      5.1 數(shù)據(jù)預(yù)測(cè)偏差

      隨機(jī)采集某多點(diǎn)電力負(fù)荷數(shù)據(jù)后,分別采用變分模態(tài)分解優(yōu)化方法、低秩表示預(yù)測(cè)方法以及離群數(shù)據(jù)挖掘預(yù)測(cè)方法對(duì)其進(jìn)行電力負(fù)荷預(yù)測(cè),得到結(jié)果如下表所示。

      表1 預(yù)測(cè)結(jié)果統(tǒng)計(jì)表

      根據(jù)上表統(tǒng)計(jì)所得數(shù)據(jù),發(fā)現(xiàn)變分模態(tài)分解優(yōu)化方法的預(yù)測(cè)結(jié)果最大偏差數(shù)量竟高達(dá)11個(gè),最少時(shí)也有3個(gè);低秩表示預(yù)測(cè)方法的預(yù)測(cè)結(jié)果最大偏差數(shù)量最高可達(dá)8個(gè),最少時(shí)也有3個(gè);而本文方法預(yù)測(cè)結(jié)果的最大偏差個(gè)數(shù)只有1個(gè),最小偏差為0,與實(shí)際負(fù)荷情況更為吻合。

      5.2 噪聲去除效果

      為了驗(yàn)證離群數(shù)據(jù)挖掘預(yù)測(cè)方法的負(fù)荷預(yù)測(cè)性能,比較變分模態(tài)分解優(yōu)化方法、低秩表示預(yù)測(cè)方法以及離群數(shù)據(jù)挖掘預(yù)測(cè)方法的噪聲去除效果,結(jié)果如圖所示。

      圖3 不同方法下噪聲去除效果

      分析圖3可知,不同方法下噪聲去除效果不同,并且上圖中,變分模態(tài)分解優(yōu)化方法與低秩表示預(yù)測(cè)方法噪聲去除效果明顯較差,本文方法具有更為穩(wěn)定的信號(hào),波動(dòng)較為平緩,噪聲去除效果最佳。

      5.3 預(yù)測(cè)時(shí)長比較

      將三種不同方法的預(yù)測(cè)所用時(shí)長進(jìn)行對(duì)比分析,得到下列曲線圖。

      分析圖4可知,不同方法運(yùn)行時(shí)長不同。當(dāng)實(shí)驗(yàn)次數(shù)為5次時(shí),變分模態(tài)分解優(yōu)化方法的預(yù)測(cè)時(shí)間為18 s,低秩表示預(yù)測(cè)方法的預(yù)測(cè)時(shí)間為24s,離群數(shù)據(jù)挖掘預(yù)測(cè)方法的預(yù)測(cè)時(shí)間為3 s,群數(shù)據(jù)挖掘預(yù)測(cè)方法的預(yù)測(cè)時(shí)間最短。當(dāng)實(shí)驗(yàn)次數(shù)為40次時(shí),變分模態(tài)分解優(yōu)化方法的預(yù)測(cè)時(shí)間為19 s,低秩表示預(yù)測(cè)方法的預(yù)測(cè)時(shí)間為29s,離群數(shù)據(jù)挖掘預(yù)測(cè)方法的預(yù)測(cè)時(shí)間為5s,群數(shù)據(jù)挖掘預(yù)測(cè)方法的預(yù)測(cè)時(shí)間始終保持最短,預(yù)測(cè)效率最佳。

      圖4 不同方法運(yùn)行時(shí)長對(duì)比

      6 結(jié)論

      為了從根本上解決常用方法預(yù)測(cè)準(zhǔn)度不太理想的問題,本文得出一種基于離群數(shù)據(jù)挖掘的多點(diǎn)電力負(fù)荷預(yù)測(cè)方法,通過實(shí)驗(yàn)得出以下結(jié)論:

      1)離群數(shù)據(jù)挖掘預(yù)測(cè)方法的數(shù)據(jù)偏差最小,明顯低于其它兩種傳統(tǒng)方法。

      2)本文方法具有更為穩(wěn)定的信號(hào),波動(dòng)較為平緩,噪聲去除效果最佳。

      3)當(dāng)實(shí)驗(yàn)次數(shù)為40次時(shí),離群數(shù)據(jù)挖掘預(yù)測(cè)方法的預(yù)測(cè)時(shí)間僅為5s,預(yù)測(cè)效率最佳。

      猜你喜歡
      離群結(jié)點(diǎn)數(shù)據(jù)挖掘
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢(shì)
      Ladyzhenskaya流體力學(xué)方程組的確定模與確定結(jié)點(diǎn)個(gè)數(shù)估計(jì)
      基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
      電力與能源(2017年6期)2017-05-14 06:19:37
      離群數(shù)據(jù)挖掘在發(fā)現(xiàn)房產(chǎn)銷售潛在客戶中的應(yīng)用
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
      離群的小雞
      應(yīng)用相似度測(cè)量的圖離群點(diǎn)檢測(cè)方法
      一種基于核空間局部離群因子的離群點(diǎn)挖掘方法
      基于GPGPU的離散數(shù)據(jù)挖掘研究
      基于Raspberry PI為結(jié)點(diǎn)的天氣云測(cè)量網(wǎng)絡(luò)實(shí)現(xiàn)
      德保县| 固原市| 来凤县| 平原县| 格尔木市| 宁晋县| 台北市| 喀喇沁旗| 临城县| 民乐县| 灌南县| 临夏县| 临城县| 开原市| 公安县| 永安市| 高青县| 乌拉特后旗| 左贡县| 鲁甸县| 凉山| 长兴县| 赣榆县| 邮箱| 顺义区| 大冶市| 徐汇区| 姜堰市| 密云县| 濮阳县| 肥西县| 天镇县| 尼木县| 额尔古纳市| 湖北省| 北票市| 宣化县| 三原县| 乌苏市| 太保市| 长顺县|