田 拯 李新原 李連峰
(1.河南金榮電子科技有限公司,河南 鄭州 450000;2.國(guó)網(wǎng)烏魯木齊市供電公司,新疆 烏魯木齊 830000)
數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)中的應(yīng)用
田 拯1李新原2李連峰2
(1.河南金榮電子科技有限公司,河南 鄭州 450000;2.國(guó)網(wǎng)烏魯木齊市供電公司,新疆 烏魯木齊 830000)
目前,大部分電力管理系統(tǒng)只停留在業(yè)務(wù)處理層,這一模式不能為電力企業(yè)提供更加便利、智能的決策。一直以來(lái),我國(guó)電力企業(yè)已經(jīng)在行業(yè)信息化建設(shè)中積累了大量歷史數(shù)據(jù),將數(shù)據(jù)挖掘技術(shù)引入到電力行業(yè)中來(lái),進(jìn)行電力分析決策,為電力企業(yè)提供更加科學(xué)的管理決策,對(duì)防范、控制和化解電力企業(yè)生產(chǎn)風(fēng)險(xiǎn)具有現(xiàn)實(shí)的意義。本文詳細(xì)介紹了數(shù)據(jù)挖掘的具體方法及其在電能質(zhì)量分析、輸變電管理、負(fù)荷預(yù)測(cè)以及電網(wǎng)智能調(diào)度中的應(yīng)用。
數(shù)據(jù)挖掘;負(fù)荷預(yù)測(cè);輸變電;電能質(zhì)量
數(shù)據(jù)挖掘(Data Mining,DM)目前已經(jīng)被應(yīng)用于各個(gè)不同的領(lǐng)域,其中包括電力行業(yè)。數(shù)據(jù)挖掘通過(guò)整合歷史數(shù)據(jù),利用各種分析工具發(fā)現(xiàn)模型和數(shù)據(jù)間關(guān)系的過(guò)程,其可以幫助決策者尋找數(shù)據(jù)間潛在的某種關(guān)聯(lián)[1],通過(guò)發(fā)現(xiàn)被隱藏的、被忽略的因素,就能夠在數(shù)據(jù)存儲(chǔ)和管理過(guò)程中,挖掘出重要的情報(bào)信息,作為決策和行動(dòng)的依據(jù)。
1.1 國(guó)外研究現(xiàn)狀
1995年,國(guó)際知識(shí)發(fā)現(xiàn)(Knowledge Discovery inDa?tabases,KDD)組織委員會(huì)在加拿大蒙特利爾市召開了首屆KDD國(guó)際學(xué)術(shù)會(huì)議。近年來(lái),KDD在數(shù)據(jù)挖掘的研究和應(yīng)用上發(fā)展很快,尤其是在商業(yè)和銀行領(lǐng)域。目前,國(guó)外數(shù)據(jù)挖掘的研究方向及趨勢(shì)主要集中在對(duì)數(shù)據(jù)挖掘方法研究的進(jìn)一步提高優(yōu)化上,如Bayes方法和Boosting方法的研究和提高;傳統(tǒng)統(tǒng)計(jì)學(xué)回歸法在數(shù)據(jù)挖掘中的應(yīng)用;KDD與數(shù)據(jù)庫(kù)的緊密結(jié)合等。
1.2 國(guó)內(nèi)研究現(xiàn)狀
與國(guó)外相比,國(guó)內(nèi)在數(shù)據(jù)挖掘方面的研究起步晚且不成熟。國(guó)內(nèi)的最新發(fā)展有:在分類技術(shù)研究中建立集合理論體系,對(duì)海量數(shù)據(jù)進(jìn)行處理;基于粗糙集和模糊集理論,并將二者融合用于KDD,構(gòu)造模糊系統(tǒng)辨識(shí)方法和知識(shí)模型,建立智能專家系統(tǒng);研究中文文本的數(shù)據(jù)挖掘的理論與實(shí)現(xiàn)方法;利用概念格式進(jìn)行文本挖掘。目前,我國(guó)數(shù)據(jù)挖掘技術(shù)主要應(yīng)用在互聯(lián)網(wǎng)、金融服務(wù)及農(nóng)業(yè)等領(lǐng)域,在電力系統(tǒng)中的應(yīng)用也逐年增加,尤其在火力發(fā)電方面,部分系統(tǒng)已經(jīng)率先得到應(yīng)用,而在其他領(lǐng)域的應(yīng)用亦在逐步進(jìn)步??梢哉f(shuō),數(shù)據(jù)挖掘技術(shù)在我國(guó)還是有相當(dāng)大的發(fā)展?jié)摿Α?/p>
數(shù)據(jù)挖掘主要包括數(shù)據(jù)準(zhǔn)備、數(shù)據(jù)挖掘及對(duì)挖掘結(jié)果的評(píng)估與表示3個(gè)階段。
①數(shù)據(jù)準(zhǔn)備階段。在進(jìn)行數(shù)據(jù)分析前,需要從相關(guān)數(shù)據(jù)源中選取所需的數(shù)據(jù)進(jìn)行數(shù)據(jù)預(yù)處理,整合成有利于進(jìn)行數(shù)據(jù)挖掘的數(shù)據(jù)集。對(duì)此階段進(jìn)行詳細(xì)劃分,可分為選擇、預(yù)處理和轉(zhuǎn)化。
②數(shù)據(jù)挖掘階段。將數(shù)據(jù)準(zhǔn)備階段整合的數(shù)據(jù)集用某種方法找出其所暗含的規(guī)律。此階段可細(xì)化為確定數(shù)據(jù)挖掘的目標(biāo)、選擇算法、數(shù)據(jù)挖掘等。
③結(jié)果評(píng)估與表示。找出數(shù)據(jù)集暗含的規(guī)律后,數(shù)據(jù)挖掘得到的模式或方法并不是真正的知識(shí),需要盡可能以簡(jiǎn)單明了、用戶可理解的方式將找出的規(guī)律表示出來(lái),并對(duì)其進(jìn)行評(píng)估后才能形成實(shí)際知識(shí)。最終形成的結(jié)果或者知識(shí)才是數(shù)據(jù)挖掘的目的所在,能被用戶理解且能用于實(shí)際生產(chǎn)。
國(guó)內(nèi)外對(duì)數(shù)據(jù)挖掘技術(shù)的研究歷經(jīng)20年,期間提出了不少算法,最主要、應(yīng)用最廣泛的方法主要有以下幾個(gè)。
3.1 分類分析法
分類分析法常用包括神經(jīng)網(wǎng)絡(luò)分類、貝葉斯分類算法及決策樹歸納等算法。分類就是找出一個(gè)類別的概念描述,其代表了這類數(shù)據(jù)的整體信息,即該類的內(nèi)涵描述,并用這種描述來(lái)構(gòu)造模型。
3.2 時(shí)序分析法
時(shí)序分析法常用包括灰色模型GM(1,N)和Arima模型等算法。按時(shí)間序列搜索出重復(fù)、高概率發(fā)生的模式,用歷史數(shù)據(jù)預(yù)測(cè)趨勢(shì)、發(fā)現(xiàn)周期或前后數(shù)據(jù)之間的遞進(jìn)關(guān)系。
3.3 聚類分析法
聚類分析法[2]常用的算法包括DBscan密度算法、K-均值算法及EM最大期望算法等。聚類是找出數(shù)據(jù)的相似性并歸納成若干類別,不同類中的數(shù)據(jù)相異。聚類分析可以發(fā)現(xiàn)數(shù)據(jù)的分布模式,構(gòu)建宏觀概念,得出數(shù)據(jù)屬性之間可能的相互關(guān)系。
3.4 關(guān)聯(lián)分析法
關(guān)聯(lián)分析法常用的算法包括FP-樹頻集算法、Apriori算法及基于劃分的算法等。關(guān)聯(lián)是指兩個(gè)以上變量的取值之間可能暗含某種規(guī)律。關(guān)聯(lián)分析法的最終目標(biāo)是找出數(shù)據(jù)間的關(guān)聯(lián)。
3.5 決策樹
決策樹分析法最大優(yōu)點(diǎn)是直觀,能有效解決高維數(shù)據(jù)分類問(wèn)題。國(guó)際上最有影響和最早的決策樹方法是由J.R.Quinlan提出的ID3方法,后人又延伸至如ID4、ID5和C4.5等算法。但此算法存在隨著數(shù)據(jù)復(fù)雜性的提高,分支數(shù)將增加,管理的難度越來(lái)越大的局限及數(shù)據(jù)的缺失值處理問(wèn)題。
除上述幾種算法外,粗糙集方法、神經(jīng)網(wǎng)絡(luò)法等也是當(dāng)前數(shù)據(jù)挖掘的主要方法之一。數(shù)據(jù)挖掘在近年來(lái)越來(lái)越受到人們的關(guān)注。
近年來(lái),數(shù)據(jù)挖掘在電力系統(tǒng)應(yīng)用中取得了一定的發(fā)展成果,從電力設(shè)施規(guī)劃、系統(tǒng)安全動(dòng)態(tài)評(píng)估、線網(wǎng)負(fù)荷預(yù)測(cè)、故障診斷及電力調(diào)度等方面開展數(shù)據(jù)挖掘和分析,并在發(fā)電廠設(shè)備、變配電設(shè)備及高壓輸電線路的檢修中都得到廣泛應(yīng)用[3-7]。例如,分析汽輪機(jī)軸系振動(dòng)的數(shù)據(jù),采用模糊聚類和粗糙集理論,進(jìn)而輔助機(jī)組的故障診斷;高壓輸電線路的故障診斷采用粗糙集技術(shù);在變電站的電氣設(shè)備在線監(jiān)測(cè)中可使用決策樹算法[8]分析。
在電力系統(tǒng)中,數(shù)據(jù)挖掘處理及分析要求工作人員具有扎實(shí)的電力系統(tǒng)理論指導(dǎo)和知識(shí),這樣才能使設(shè)備設(shè)施狀態(tài)檢修和挖掘算法密切結(jié)合,使數(shù)據(jù)挖掘更加有效[9-12]。
根據(jù)研究成果的對(duì)比來(lái)看,電廠的發(fā)電設(shè)備具備較完善的檢測(cè)系統(tǒng),是數(shù)據(jù)挖掘應(yīng)用集中所在?,F(xiàn)在主要介紹數(shù)據(jù)挖掘的具體應(yīng)用。
4.1 數(shù)據(jù)挖掘在負(fù)荷預(yù)測(cè)中的應(yīng)用
為更好地安排電力生產(chǎn),電力部門日常最關(guān)鍵的工作就是對(duì)電力的負(fù)荷進(jìn)行預(yù)測(cè),傳統(tǒng)的負(fù)荷預(yù)測(cè)方法存在很多局限和不足,一般很難真實(shí)地反映系統(tǒng)負(fù)荷的變化規(guī)律。數(shù)據(jù)挖掘技術(shù)可以從海量的電力系統(tǒng)信息和數(shù)據(jù)中發(fā)現(xiàn)有價(jià)值的規(guī)律并進(jìn)行系統(tǒng)實(shí)際負(fù)荷的特性分析,選用合適的算法,構(gòu)建準(zhǔn)確的模型,以此得出精確的預(yù)測(cè)結(jié)果。
楊靜[13]提出了利用數(shù)據(jù)挖掘技術(shù)來(lái)實(shí)現(xiàn)負(fù)荷預(yù)測(cè)的方法,揭示了在海量相關(guān)數(shù)據(jù)后隱藏的一些規(guī)律,并對(duì)其建立了相應(yīng)的模型,進(jìn)而實(shí)現(xiàn)可靠預(yù)測(cè)。數(shù)字化、智能化及現(xiàn)代化是現(xiàn)今電力系統(tǒng)發(fā)展的主流趨勢(shì),將數(shù)據(jù)挖掘技術(shù)有效應(yīng)用于電力負(fù)荷預(yù)測(cè)有助于電力部門克服各種困難,更準(zhǔn)確、更高效地實(shí)現(xiàn)經(jīng)濟(jì)和社會(huì)價(jià)值。
胡士[14]針對(duì)數(shù)據(jù)挖掘技術(shù)在神經(jīng)網(wǎng)絡(luò)方法的優(yōu)化及預(yù)測(cè)電力負(fù)荷關(guān)鍵屬性的選擇等方面做出改進(jìn)和嘗試,并在此基礎(chǔ)初步建立了一套行之有效、功能完善的負(fù)荷預(yù)測(cè)系統(tǒng)。
4.2 數(shù)據(jù)挖掘在輸變電管理系統(tǒng)中的應(yīng)用
電力輸變電系統(tǒng)時(shí)刻都會(huì)產(chǎn)生海量數(shù)據(jù),而其中隱藏了很多規(guī)律規(guī)則,分析這些數(shù)據(jù)規(guī)則,能對(duì)電力企業(yè)制定生產(chǎn)決策提供諸多助力。在輸變電系統(tǒng)管理中應(yīng)用數(shù)據(jù)挖掘技術(shù),自動(dòng)分析、歸類系統(tǒng)產(chǎn)生的數(shù)據(jù),得出利于生產(chǎn)的信息和規(guī)律,可以大大提高電力生產(chǎn)的效率和效益。
張勤[15]主要介紹了數(shù)據(jù)挖掘技術(shù)常用算法的概念和基本原理,包括關(guān)聯(lián)規(guī)則分析技術(shù)、粗糙集方法及決策樹方法等,還著重闡述了數(shù)據(jù)挖掘技術(shù)在輸變電管理系統(tǒng)中包括設(shè)備故障診斷、缺陷預(yù)測(cè)等方面的應(yīng)用。
當(dāng)前,數(shù)據(jù)挖掘技術(shù)主要應(yīng)用于發(fā)電廠設(shè)備檢修、變壓器檢修、高壓輸電及配電設(shè)備等方面。何友全[4]論述了電力變壓器油中溶解氣體分析通過(guò)粗糙集數(shù)據(jù)挖掘?qū)崿F(xiàn)的方法,可以有效地對(duì)電力變壓器進(jìn)行故障診斷。在電力系統(tǒng)中,多數(shù)電力變壓器的數(shù)據(jù)及信息等存在不完備性和復(fù)雜性,采用粗糙集理論可以為這種情況建立一種較好的變壓器故障診斷模型[16]。
廖志偉和孫雅明[17]主要探究粗糙集和神經(jīng)網(wǎng)絡(luò)組合在故障診斷模型方面的容錯(cuò)性能,掌握各種不同組合模型的關(guān)聯(lián)關(guān)系、互補(bǔ)性及存在的局限性。同時(shí),對(duì)構(gòu)造出的組合診斷模型進(jìn)行詳細(xì)闡述,基于定位診斷配電網(wǎng)故障的研究目標(biāo),仿真測(cè)試了所構(gòu)造的5類診斷模型,進(jìn)行了結(jié)果比較和評(píng)估。
在輸電線系統(tǒng)的故障診斷及實(shí)時(shí)輸入信息的畸變方面,李凡生和陳慶吉[6]提出利用基于粗糙集理論的數(shù)據(jù)挖掘模型來(lái)處理和實(shí)現(xiàn)。
4.3 數(shù)據(jù)挖掘在電能質(zhì)量分析中的應(yīng)用
電能質(zhì)量分析環(huán)節(jié)一般需要對(duì)電能的質(zhì)量數(shù)據(jù)進(jìn)行數(shù)據(jù)壓縮和去噪等預(yù)處理,目的是提高質(zhì)量分析的效率[18]。當(dāng)前,基于小波信號(hào)分析是質(zhì)量分析的主要方法。隨著技術(shù)的發(fā)展,數(shù)據(jù)挖掘?qū)⒈恢饾u應(yīng)用到電能質(zhì)量數(shù)據(jù)去噪和分析環(huán)節(jié)。
在現(xiàn)有的數(shù)據(jù)挖掘分析技術(shù)中,信號(hào)相關(guān)性處理可以為跨小波尺度空間去噪,交叉驗(yàn)證方法實(shí)現(xiàn)質(zhì)量信號(hào)的白噪聲抑制[19]。利用電能質(zhì)量信號(hào)的二階導(dǎo)數(shù)的似然比判決準(zhǔn)則可以判決突變點(diǎn)[20]。陳紅坤和黃娟[21]研究了應(yīng)用模糊C均值聚類和粗糙集理論中的屬性與屬性值約簡(jiǎn)算法,以此獲得判斷電能質(zhì)量分類的核心規(guī)則知識(shí)。
數(shù)據(jù)挖掘是集統(tǒng)計(jì)學(xué)、數(shù)據(jù)自動(dòng)分析處理和數(shù)據(jù)庫(kù)技術(shù)及人工智能和相關(guān)應(yīng)用領(lǐng)域等各門學(xué)科于一體的新興技術(shù)。該技術(shù)的發(fā)展使大量隱藏在數(shù)據(jù)背后的知識(shí)可以被人們觸及,人們還可以利用大量真實(shí)數(shù)據(jù)檢驗(yàn)驗(yàn)證相關(guān)假設(shè)或者是模型。數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)負(fù)荷預(yù)測(cè)、輸變電管理、電能質(zhì)量分析及電力決策系統(tǒng)中的應(yīng)用主要是預(yù)測(cè)和表述這兩方面。根據(jù)大量歷史數(shù)據(jù)來(lái)預(yù)測(cè)未知信息,著眼于找到一個(gè)可被理解的模型來(lái)描述數(shù)據(jù)之間的相互關(guān)系。從電力系統(tǒng)豐富的歷史數(shù)據(jù)中,經(jīng)過(guò)預(yù)處理挖掘出有用的信息并加以分析,為電力系統(tǒng)管理和決策提供參考,這是我們以后著重研究的方向。
[1]王光宏,蔣平.數(shù)據(jù)挖掘綜述[J].同濟(jì)大學(xué)學(xué)報(bào),2004(2):246-252.
[2]顧敏奕,杜海舟.數(shù)據(jù)挖掘技術(shù)在電網(wǎng)企業(yè)中的應(yīng)用需求分析[J].上海電力學(xué)院報(bào),2012(5):481-484.
[3]陳超金.基于數(shù)據(jù)挖掘的電力設(shè)備狀態(tài)檢修技術(shù)研究綜述[J].廣東電力,2009(9):21-24.
[4]何友全.數(shù)據(jù)挖掘方法及其在電力系統(tǒng)故障診斷中的應(yīng)用研究[D].成都:西南交通大學(xué),2004.
[5]仇曉智,喬宗良,邱鳳翔,等.火電廠數(shù)據(jù)分析系統(tǒng)的開發(fā)與應(yīng)用[J].華東電力,2009(4):669-671.
[6]李凡生,陳慶吉.決策樹分類算法在發(fā)電設(shè)備狀態(tài)檢修中的應(yīng)用研究[J].電網(wǎng)技術(shù),2003(12):67-70.
[7]陳星鶯,張曉花,瞿峰,等.數(shù)據(jù)挖掘在電力系統(tǒng)中的應(yīng)用綜述[J].電力科學(xué)與技術(shù)學(xué)報(bào),2007(3):51-56.
[8]王曉磊.淺析數(shù)據(jù)挖掘技術(shù)在電力行業(yè)中的應(yīng)用[J].新疆電力技術(shù),2007(4):67-68.
[9]高智,徐政.數(shù)據(jù)挖掘技術(shù)在電力系統(tǒng)中的應(yīng)用[J].華東電力,2001(12):4-7,73.
[10]紀(jì)懷猛.電力系統(tǒng)中的數(shù)據(jù)挖掘技術(shù)[J].長(zhǎng)春工業(yè)大學(xué)學(xué)報(bào)(自然科學(xué)版),2014(2):143-147.
[11]袁哲,王彥文.數(shù)據(jù)挖掘在電力系統(tǒng)負(fù)荷預(yù)測(cè)中的應(yīng)用[J].電子制作,2015(11):235-236.
[12]李耀池.數(shù)據(jù)挖掘技術(shù)在電力負(fù)荷預(yù)測(cè)系統(tǒng)中應(yīng)用的研究[D].阜新:遼寧工程技術(shù)大學(xué),2006.
[13]楊靜.數(shù)據(jù)挖掘在輸變電管理系統(tǒng)中的應(yīng)用研究[D].北京:華北電力大學(xué),2005.
[14]胡士.數(shù)據(jù)挖掘技術(shù)在電力設(shè)備狀態(tài)檢修中的應(yīng)用研究[D].北京:華北電力大學(xué),2007.
[15]張勤.基于數(shù)據(jù)挖掘技術(shù)的汽輪機(jī)性能分析系統(tǒng)的研究與實(shí)現(xiàn)[D].北京:華北電力大學(xué),2007.
[16]孫雅明,廖志偉.基于不同RS與NN組合的數(shù)據(jù)挖掘配電網(wǎng)故障診斷模型[J].電力系統(tǒng)自動(dòng)化,2003(6):31-35.
[17]廖志偉,孫雅明.基于數(shù)據(jù)挖掘模型的高壓輸電線系統(tǒng)故障診斷[J].電力系統(tǒng)自動(dòng)化,2001(15):15-19.
[18]楊耿煌,溫渤嬰.一種新的電能質(zhì)量擾動(dòng)信號(hào)去噪方法[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2008(1):89-94.
[19]李天云,陳昌雷,程汪劉.交叉驗(yàn)證方法在電能質(zhì)量信號(hào)白噪聲抑制中的應(yīng)用[J].電力系統(tǒng)自動(dòng)化,2007(16):75-78.
[20]唐良瑞,尚飛,祁兵.基于似然比判決準(zhǔn)則的電能質(zhì)量去噪算法[J].中國(guó)電機(jī)工程學(xué)報(bào),2006(23):49-54.
[21]陳紅坤,黃娟.數(shù)據(jù)挖掘及其在電能質(zhì)量分析中的應(yīng)用[J].電力系統(tǒng)及其自動(dòng)化學(xué)報(bào),2009(5):51-55.
The Application of Data Mining Technologyin Power System
Tian Zheng1Li Xinyuan2Li Lianfeng2
(1.Henan Jinrong Electronic Technology Co.,Ltd.,Zhengzhou Henan 450000;2.State Grid,Xinjiang Electric Power Company,Urumqi Power Supply Company,Urumqi Xinjiang 830000)
At present,most of the power management systems only stay in the business processing layer,which can not provide more convenient or intelligent decision-making for the power companies.All along,the Chinese power company has accumulated a lot of historical data,and introduced data mining technolo?gy into the power industry for the power analysis and decision-making.It provides a more scientific man?agement decision-making to the enterprises and is of practical significance to prevent,control and settle production risks in power enterprises.This paper introduced in detail the concrete method of data mining and its application in power quality analysis,transmission and distribution management,load forecasting and intelligent dispatching of power network.
data mining;load forecasting;power transmission;power quality
TM76
A
1003-5168(2017)12-0131-03
2017-11-01
田拯(1990-),男,本科,研究方向:電氣自動(dòng)化。