王洪森,王廣府,黃 銳
(廣東電網(wǎng)揭陽普寧供電局有限責(zé)任公司,廣東 揭陽 525300)
為實現(xiàn)系統(tǒng)安全穩(wěn)定運行,且降低運營成本,電氣企業(yè)必須做好電力需求預(yù)測,尤其是短期負荷預(yù)測。隨著智能電網(wǎng)建設(shè)進程的加快,電力系統(tǒng)運行要求不斷提高,對電力短期負荷預(yù)測結(jié)果與效率的要求也大大提升。
電力系統(tǒng)向自動化、智能化發(fā)展,采集的用電信息日益完善,涉及電力系統(tǒng)的監(jiān)測數(shù)據(jù)、檢測數(shù)據(jù)、營銷數(shù)據(jù)及管理數(shù)據(jù)具有類型多、數(shù)量大及價值密度低的特點,與大數(shù)據(jù)典型特征相符。本文提出了基于大數(shù)據(jù)技術(shù)的短期負荷預(yù)測,通過特定的分析手段智能化挖掘海量數(shù)據(jù),從而提高短期負荷預(yù)測的精度和效率,具有實用意義。
大面積推廣應(yīng)用智能電表和用戶信息采集系統(tǒng)后,短期負荷預(yù)測要面對大量的信息。通過對用戶的用電規(guī)律和短期負荷的影響因素等進行基礎(chǔ)性分析,有助于短期負荷預(yù)測的有序開展。
電力用戶的用電數(shù)據(jù)與其用電行為習(xí)慣存在一定關(guān)聯(lián)。本文采用的是聚類分析法中簡明、實用的SOM算法,即通過假設(shè)輸入對象具有一定的順序和拓撲結(jié)構(gòu),可實現(xiàn)從n維到2維的降維映射,且映射的結(jié)果保持了拓撲性質(zhì),在理論上與大腦處理有較強的聯(lián)系[1]。例如,采用該算法對某電力用戶10-12月期間的負荷進行分析,發(fā)現(xiàn)聚類結(jié)果存在5種日負荷類型。第一類,因為包括國慶節(jié),所以負荷曲線明顯不同于其他形狀;第二類,穩(wěn)定用電模式,天數(shù)為51 d,比例接近50%;第五類,因為存在極端天氣致使用電異常,所以屬于異常模式;第三類和第四類因為與穩(wěn)定用電模式相比幅度波動較大,所以屬于波動模式。
電力用戶的用電模式為研究短期負荷的影響因素提供了基礎(chǔ),同時也為預(yù)測模型的設(shè)計提供了依據(jù)。如果用電負荷趨于穩(wěn)定或者波動較小的變化規(guī)律可選擇用時間序列等簡單模型,否則需要結(jié)合波動原因借助神經(jīng)網(wǎng)絡(luò)和支持向量機等模型加以分析。
短期負荷容易受到天氣變化、日期類型以及事件類型等諸多因素的影響,而且因為生產(chǎn)特性不一,所以不同用戶負荷之間差異明顯。這就需要分析兩者的相關(guān)性,篩選出主導(dǎo)影響因素,通過縮小考慮因素的范圍降低數(shù)據(jù)處理工作量。本文在Spearman方法的幫助下對某地區(qū)10-12月份用戶負荷數(shù)據(jù)進行了相關(guān)性分析。其中定序型數(shù)據(jù)包括溫度、風(fēng)速、降雨及濕度等數(shù)值。分析結(jié)果發(fā)現(xiàn),溫度和濕度在很大程度上可以決定負荷分類,而降雨和風(fēng)速則為間接影響,但因素對用戶負荷變化的影響具有優(yōu)先次序以及閾值。為判斷影響因素的重要程度,采用CRT決策樹算法進行了計算和分析,結(jié)果證明其具有良好的分析效果和較高的準確度[2]。影響規(guī)則的分析有助于進一步闡述聚類結(jié)果,可以幫助工作人員確定用電模式與影響因素之間的定量關(guān)系,進而為研究負荷特性、優(yōu)化預(yù)測參數(shù)及調(diào)整預(yù)測結(jié)果提高可靠參考和依據(jù)。
Hadoop是一個用于運行和處理大規(guī)模數(shù)據(jù)的軟件平臺,可對海量數(shù)據(jù)進行分布式計算,可適用于大量、復(fù)雜電力數(shù)據(jù)的提取和分析。因此基于Hadoop提出了短期負荷預(yù)測系統(tǒng)。該系統(tǒng)主要包括整合用戶用電數(shù)據(jù)、Hadoop處理數(shù)據(jù)以及分析與預(yù)測負荷三大層級和功能。其中,數(shù)據(jù)的整合指的是抽取、存儲及轉(zhuǎn)換采集的用戶用電信息,用戶涵蓋了居民、商業(yè)及工業(yè)等多種行業(yè)。經(jīng)整合后的數(shù)據(jù)會統(tǒng)一匯集至Hadoop的數(shù)據(jù)處理模塊,并以業(yè)務(wù)應(yīng)用為標準進行分別處理,形成多用戶、多日數(shù)據(jù)的分布式存儲與計算,實現(xiàn)個性化的用戶數(shù)據(jù)。由于Hadoop屬于大數(shù)據(jù)平臺,連接的分布式服務(wù)器不只一臺,所以處理效率非??捎^,具體流程圖1所示。
圖1 短期負荷預(yù)測基本流程
基于以上系統(tǒng)架構(gòu),需要借助一系列合理的大數(shù)據(jù)技術(shù)實現(xiàn)對短期負荷的預(yù)測。既要考慮用戶負荷需求,又要兼顧系統(tǒng)網(wǎng)損,以提高負荷分析與預(yù)測結(jié)果的真實性與準確性。具體地,可以選擇電力用戶用電模式的類型作為預(yù)測模型的基礎(chǔ),選擇用戶用電影響因素的分析結(jié)果為模型參數(shù),參數(shù)的設(shè)置需要參考實際情況。如果預(yù)測日中的氣溫、降水量及日類型等因素的累積效應(yīng)對用戶負荷有影響,則需要基于影響因素優(yōu)化預(yù)測參數(shù),并賦予其中主導(dǎo)因素以較大的權(quán)值[3]。為改善短期預(yù)測模型的適用條件和范圍,還應(yīng)切實考慮電力用戶之間用電模式的差異性。因此,對短期負荷預(yù)測系統(tǒng)設(shè)計了適用于平穩(wěn)序列的ARIMA(自回歸移動平均模型)以及適用于易受外界因素干擾的一元回歸、模式識別以及神經(jīng)網(wǎng)絡(luò)模型,共4個模型。
為驗證該短期負荷模型的預(yù)測結(jié)果,營造測試環(huán)境時選用了4臺內(nèi)存為500 G的PC服務(wù)器,配以Mapreduce程序改寫并分布至4個接點用于負荷分析與預(yù)測計算任務(wù)的并發(fā)執(zhí)行。設(shè)定某地區(qū)電力用戶為120萬,采集的用電負荷信息時間跨度為3年,基于15 min的采樣間隔獲得了1.2 T左右的數(shù)據(jù),其中典型任務(wù)如用電規(guī)律和影響因素離線分析以及用戶負荷在線預(yù)測的測試規(guī)模分別為120萬用戶3年和120萬用戶單戶,測試完成所需時間分別為24 min和110 s,具體計算流程如圖2所示。
圖2 用戶負荷分析與預(yù)測的具體流程
分析測試結(jié)果發(fā)現(xiàn),基于Hadoop架構(gòu)的分布式處理技術(shù),能夠很好地勝任大規(guī)模負荷數(shù)據(jù)的分析與預(yù)測,且隨著節(jié)點數(shù)量的增加,處理能力也在線性增長。同時,基于1個月內(nèi)用電數(shù)據(jù)的統(tǒng)計,日平均預(yù)測精度和最低精度分別為98.6%和97.4%,比傳統(tǒng)的預(yù)測方法結(jié)果穩(wěn)定且準確。這是由于全面考慮了短期負荷預(yù)測的影響因素,細化了預(yù)測對象,并使用了先進高效的數(shù)據(jù)挖掘技術(shù)。
合理預(yù)測短期負荷意義重大,但實際操作中卻面臨諸多影響因素。因此,需要工作人員與時俱進,借助大數(shù)據(jù)技術(shù)挖掘有效的價值信息,為短期負荷預(yù)測提供重要的數(shù)據(jù)支持。需注意結(jié)合實際,以大數(shù)據(jù)技術(shù)為媒介構(gòu)建適用性強、算法精確的短期負荷預(yù)測模型,實現(xiàn)快速、準確的預(yù)測,以保障精細化的電力調(diào)度和經(jīng)濟可靠的電網(wǎng)運行。