楊旭昕
(國網(wǎng)信息通信產(chǎn)業(yè)集團有限公司 北京市 100053)
我國經(jīng)濟的快速發(fā)展,使人們的生活水平追殲提高,在目前的發(fā)展情況下,我國電力行業(yè)的競爭月越來越激烈,如果電力企業(yè)不想在日益發(fā)展的情況下唄淘汰,就必要做到企業(yè)結(jié)構(gòu)的統(tǒng)一,同時要注重創(chuàng)新,積極引進新設備以及新技術,增加企業(yè)發(fā)展的步伐,提高企業(yè)的效率。企業(yè)只有整合內(nèi)外經(jīng)濟實力,才能實現(xiàn)最大程度的可持續(xù)發(fā)展。電力系統(tǒng)是最基本的建設,所有企業(yè)都必須對信息、數(shù)據(jù)、進行全面管理。為了保證有效的數(shù)據(jù)報告,必須改變原有的統(tǒng)計程序,對分析方法進行改革,以保證店里處理的穩(wěn)定性和安全性。
數(shù)據(jù)挖掘是高層次的過程,它從未知的人類預先發(fā)現(xiàn)的數(shù)據(jù)中提取有價值和潛在的知識信息,并提供人類可以通過技術手段理解的模型,從大量復雜的不完整數(shù)據(jù)和未知的新信息中發(fā)現(xiàn)信息的高層次過程。數(shù)據(jù)挖掘包括數(shù)據(jù)庫系統(tǒng)、數(shù)據(jù)可視化、自動學習和高新技術
數(shù)據(jù)挖掘技術是在機器學習的基礎上發(fā)展起來的,它的優(yōu)勢包括:
(1)傳統(tǒng)的機器學習是為了提高學習的能力,而數(shù)據(jù)挖掘技術能夠提供有價值的信息,使其更加實用;
(2)傳統(tǒng)的機器學習側(cè)重于小數(shù)據(jù)源,而數(shù)據(jù)挖掘側(cè)重于大數(shù)據(jù)庫,可以有效地處理大的、不完整的和有噪聲的數(shù)據(jù)元素,這種方法可以從多個方面總結(jié)學習知識,揭示理論和基本假設不能滿足的知識[1]。
(1)數(shù)據(jù)分類是指對數(shù)據(jù)類別進行分類,利用分類技術建立模型;
(2)數(shù)據(jù)評估,與數(shù)據(jù)分類類似,主要區(qū)別是評價是連續(xù)值處理的輸出;
(3)知識預測是對數(shù)據(jù)進行分類或評價,獲得數(shù)據(jù)模型,然后對未知變量進行預測。
數(shù)據(jù)挖掘技術主要分為資料準備、勘探、評價三個階段。數(shù)據(jù)準備主要包括數(shù)據(jù)過濾、轉(zhuǎn)換和預處理,主要任務是建立數(shù)據(jù)評價模型。
對于企業(yè)來說,數(shù)據(jù)挖掘可以幫助企業(yè)發(fā)現(xiàn)發(fā)展趨勢,揭示已知事實,預測未知結(jié)果,分析完成任務所需的關鍵因素。數(shù)據(jù)挖掘的目的是提供數(shù)據(jù)庫中隱藏的知識,從而發(fā)現(xiàn)數(shù)據(jù)庫的主要功能。
1.4.1 自動預測趨勢和行為
歷史數(shù)據(jù)用于尋找規(guī)則,建立模型,預測未來數(shù)據(jù)的類型和特征,一個典型的例子是市場預測,數(shù)據(jù)挖掘利用之前的推廣數(shù)據(jù)來尋找投資回報最高的用戶,包括預測破產(chǎn)和確定最有可能對某一事件做出反應的情況。
1.4.2 關聯(lián)分析
數(shù)據(jù)鏈接是理解數(shù)據(jù)庫的一個重要方面,如果兩個或兩個以上變量的值具有一定的規(guī)律性,可以是簡單相關、時間相關和因果相關。在數(shù)據(jù)庫中進行隱式連接分析的目的是找到我們有時無法連接到的數(shù)據(jù),關聯(lián)分析規(guī)則確定數(shù)據(jù)庫中數(shù)據(jù)的相關性。
1.4.3 聚類
數(shù)據(jù)庫記錄可以分為一系列重要的子集,即集合。分組有助于更好地理解客觀現(xiàn)實,分組技術主要包括傳統(tǒng)的模式識別和數(shù)學分類。概念分組技術的關鍵不僅是要考慮對象之間的距離,還要要求分類范疇具有一定的內(nèi)涵,以避免傳統(tǒng)技術的單向性。
1.4.4 概念描述
概念描述用于描述對象類型及其相關屬性,概念描述包括特征描述和差異描述,生成的對象類描述應用于對象類的所有屬性,生成函數(shù)描述的方法包括決策樹和遺傳算法[3]。
1.4.5 偏差檢測
數(shù)據(jù)庫中的數(shù)據(jù)通常都有異常記錄,將這些記錄與數(shù)據(jù)庫進行區(qū)分是非常有用的,差異識別包括許多基本技能,如分類差異、模型觀察與預測差異、某一時期的定量變化等,確定差異的基本方法是檢測預測差異。
傳統(tǒng)的電力負荷測試方法很多,應用復雜,相關技術人員應考慮實際要求,結(jié)合技術特點,選擇合適的方法,下面是對各種常用方法的簡要介紹。
電力彈性系數(shù)是平均能源增長率,彈性系數(shù)法的優(yōu)點是可以更好地了解能源負荷的增長趨勢和變化范圍,然而,由于近年來產(chǎn)業(yè)結(jié)構(gòu)自適應彈性系數(shù)的重要性,該方法更適合中長期負荷預測,預測數(shù)據(jù)更可靠。
該方法是上個世紀我國第一個實驗預測方法,經(jīng)過研發(fā),取得了良好的效果。在一段時間內(nèi),所有隨機過程都被認為是灰色的。該技術具有數(shù)據(jù)小、分布和方向變化大、操作舒適、預測時間短、識別更舒適等優(yōu)點。缺點是不利于多年能源系統(tǒng)的長期預測。
該方法基于模糊理論,首先,以規(guī)則的形式對,歷史資料進行分析,模糊預測方法能清晰地描述專家的想法和系統(tǒng)中的不規(guī)則現(xiàn)象,適用于中長期負荷預測。同時模糊預測法也存在著一定的不足,比如其容易受到外界環(huán)境的干擾。但模糊預測方法能夠把線性模型和聚類方法結(jié)合,應用于電力負荷預測中,于傳統(tǒng)的預測方法相比,模糊預測方法的預測精度較高,誤差較小。
數(shù)據(jù)挖掘,就是將大量隱藏的信息提取出來,并直觀地表達出來,它在處理大數(shù)據(jù)和消除冗余信息方面具有許多優(yōu)點。決策樹、神經(jīng)網(wǎng)絡、關聯(lián)規(guī)則、聚類分析、模糊統(tǒng)計數(shù)據(jù)集和原始數(shù)據(jù)集廣泛應用于數(shù)據(jù)挖掘的各個領域,該方法根據(jù)相似時間序列數(shù)據(jù)挖掘原理,在電力負荷預測的基礎上,具有良好的應用效果,判別聚類區(qū)間和單調(diào)約簡閾值函數(shù)應使用正確的負荷曲線和網(wǎng)絡時間數(shù)據(jù);降低了數(shù)據(jù)處理速度,提高了測量速度和計算精度[4]。
回歸分析方法有兩種,分別為線性和非線性,回歸分析方法是通過對所預測的電力以往的趨勢,來預測未來邊涼去濕的過程。線性回歸又分為一維線性回歸和多維線性回歸,兩者的區(qū)別在與負荷預測過程中所受影響因素的多少,影響因素為一個時,稱為一維線性回歸,影響因素在一個以上時成為多維線性回歸,然而在實際負荷預測過程中,影響因素是不斷變化的,因此回歸分析方法不能夠精確的反映出負荷與多個因素之間的關系。
將負荷數(shù)據(jù)視為時間序列隨時間變化,如小時、日、周、季等。實際負荷數(shù)據(jù)與預測負荷數(shù)據(jù)之間的差異是一個隨機過程。在實際應用中,負荷的變化受到與荷載因素的影響。時間序列不是一個固定的隨機過程,而是一個不確定的隨機過程,因此,該方法有一定的局限性,不能準確預測。
負荷預測方法有很多,如基于實測信號頻率的波動預測,通過頻譜分析和處理,捕獲弱信號和任意分量,得到負荷預測值,波浪預報可以有效地應用于各種預報系統(tǒng),功率因數(shù)法是利用平均能源增長率與增長率之比,將電網(wǎng)彈性系數(shù)與增長率相結(jié)合的一種有效的負荷預測方法。
當前負荷預測是基于對現(xiàn)有和當前數(shù)據(jù)的提取,所以即使未來的能源負荷是不確定的,也有一定的規(guī)律,基于正確軌跡的預測是評價未來發(fā)展趨勢和條件的基本原則。
(1)可見性原則。預測對象具有一定的規(guī)律性,可以把握預測對象的發(fā)展趨勢,所以可以通過總結(jié)預測對象的過去和現(xiàn)在來推斷預測對象的未來,可見性原理是預測活動的基本依據(jù)。
(2)概率原理。要預測一個具體指標,就要根據(jù)未來負荷發(fā)展的各種可能性,預測各種假設。
(3)追溯性原則。也就是說,預測值與實際值的差值可以用來進一步調(diào)整預測精度[5]。
影響負荷變化的因素有很多,如宏觀經(jīng)濟的發(fā)展和經(jīng)濟結(jié)構(gòu)的調(diào)整,能源使用結(jié)構(gòu)的變化,人們收入和生活水平的提高,消費觀念的變化,管理和相關政策的影響,影響短期負荷的主要因素包括負荷組成、時間變化、氣候變化和隨機波動。
傳統(tǒng)的負荷預測是根據(jù)已有的歷史數(shù)據(jù)對未來某一時期的負荷進行預測(即固定預測模型),在一定程度上,它忽略了大量的歷史負荷及相關數(shù)據(jù),其中包含了許多有價值的負荷預測信息和知識。
數(shù)據(jù)挖掘,對于發(fā)現(xiàn)隱藏的信息是必要的,但目前數(shù)據(jù)提取技術在負荷預測系統(tǒng)中的應用還處于實驗階段,這方面的研究還處于起步階段,但前景廣闊。
電力系統(tǒng)的性能主要與系統(tǒng)中電氣設備的總能耗有關,供電預測主要是指社會、經(jīng)濟和氣象數(shù)據(jù)。通過對電力系統(tǒng)歷史數(shù)據(jù)的分析,對電力系統(tǒng)的點能分配和利用方案進行評價和預測,對提高供電的經(jīng)濟效益和社會效益具有重要意義。
5.2.1 利群數(shù)據(jù)分析
對采集到的數(shù)據(jù)進行預處理是進行電力負荷預測的前提,數(shù)據(jù)預處理主要是糾正和識別錯誤的數(shù)據(jù),通過補充自然數(shù)據(jù)、分解影響數(shù)據(jù)或糾正不必要的數(shù)據(jù),數(shù)據(jù)挖掘應用于電力系統(tǒng)負荷預測,可以準確地發(fā)現(xiàn)異常數(shù)據(jù),獲取可能產(chǎn)生異常數(shù)據(jù)的設備故障,為決策提供信息。
5.2.2 確定負荷模式
不同工況下,負荷可能有不同的模式,但總負荷循環(huán)的趨勢是相似的,有一定的規(guī)律性。在相應的負荷條件下,可以發(fā)現(xiàn)類似的峰值和負荷曲線數(shù)據(jù),在不同荷載條件下進行建模有助于發(fā)現(xiàn)不同荷載的相似之處。
5.2.3 電力負荷預測
目前,神經(jīng)網(wǎng)絡主要用于負荷預測,包括變量數(shù)據(jù)的類型、歷史負荷曲線和神經(jīng)網(wǎng)絡輸入數(shù)據(jù)。為了提高網(wǎng)絡計算機的速度和效率,選擇一個合理的學習對象,確定輸入對象非常重要。通過對輸入變量的處理和分析,提高了神經(jīng)網(wǎng)絡預測的性能和準確性,提高了工作效率。
5.2.4 典型負荷預測模型
典型負荷預測模型是能源系統(tǒng)負荷預測的主要內(nèi)容,通常包括負荷數(shù)據(jù)和氣象數(shù)據(jù)。氣象數(shù)據(jù)更加準確真實,并經(jīng)過當?shù)貧庀缶值尿炞C,能源系統(tǒng)負荷預測對能源系統(tǒng)的正常運行具有重要意義,此外,典型的負荷預測具有一定的特殊性、高效率,這也是傳統(tǒng)電力數(shù)據(jù)挖掘缺乏的原因。
5.2.5 數(shù)據(jù)預處理
數(shù)據(jù)預處理技術是現(xiàn)代能源信息綜合預測的主要技術,數(shù)據(jù)處理技術可以消除一些時間誤差數(shù)據(jù),在一定程度上避免這些數(shù)據(jù)對系統(tǒng)性能的影響。如果性能數(shù)據(jù)不正確,會對性能負載預測產(chǎn)生很大的影響。采用數(shù)據(jù)處理技術對數(shù)據(jù)進行清理,為能源系統(tǒng)負荷預測的正常運行奠定了堅實的基礎。除了數(shù)據(jù)處理技術,還必須注意負荷的變化。若數(shù)據(jù)加載出現(xiàn)異常變化,請及時停止加載,并將測試數(shù)據(jù)與其他內(nèi)容進行比較,判斷是否有疑點。因此,數(shù)據(jù)預處理在電力系統(tǒng)的發(fā)展中起著重要的作用,在實際負荷預測中,數(shù)據(jù)預處理是最重要的條件,只有明確數(shù)據(jù)預處理的重要性,才能更好地預測電力系統(tǒng)的負荷。
總之,與傳統(tǒng)技術相比,數(shù)據(jù)挖掘技術在電力系統(tǒng)中得到了廣泛的應用,并得到了企業(yè)的認可。專業(yè)供電系統(tǒng)科學預測的必要性是通過預測現(xiàn)有的市場和發(fā)展趨勢來規(guī)劃未來的市場。預測結(jié)果是電力系統(tǒng)規(guī)劃和建設的依據(jù),為保證電力系統(tǒng)的穩(wěn)定發(fā)展、科學管理和現(xiàn)代化,采取了重要措施。數(shù)據(jù)挖掘技術大大縮小了與原始技術的差距,提高了數(shù)據(jù)的完整性、及時性和預測結(jié)果,為電力系統(tǒng)行業(yè)的發(fā)展做出了突出貢獻。