龐九鳳++陳亮
摘 要 智能電網(wǎng)作為電力系統(tǒng)的研究熱點和未來發(fā)展趨勢,實現(xiàn)電力流、信息流、業(yè)務流的高度融合,將帶來大量的生產(chǎn)、營銷、管理數(shù)據(jù)。本文提出了電力大數(shù)據(jù)處理平臺,從電力企業(yè)內部和外部的海量數(shù)據(jù)中洞察規(guī)律、提取知識,并通過宏觀經(jīng)濟、產(chǎn)值電耗、城鎮(zhèn)化三者與電力需求之間關系的案例分析,展示數(shù)據(jù)背后所蘊含的價值。
【關鍵詞】智能電網(wǎng) 大數(shù)據(jù)
電力工業(yè)作為國民經(jīng)濟的基礎產(chǎn)業(yè),也是重要的能源工業(yè),它的發(fā)展與經(jīng)濟的發(fā)展密切相關,一方面電力是國民經(jīng)濟發(fā)展的動力,電力供應不足會嚴重制約經(jīng)濟的健康發(fā)展,另一方面國民經(jīng)濟發(fā)展的速度和質量對電力需求的增長、電力供需的變化起著決定性的影響。
智能電網(wǎng)作為電力系統(tǒng)的研究熱點和發(fā)展趨勢,是以信息通信平臺作為支撐,具有信息化、自動化、互動化等特征,包含電力系統(tǒng)的發(fā)電、輸電、變電、配電、用電和調度各個環(huán)節(jié),實現(xiàn)電力流、信息流、業(yè)務流的高度一體化融合,是電網(wǎng)運行和管理的“中樞神經(jīng)系統(tǒng)”。海量的生產(chǎn)、營銷、管理數(shù)據(jù)將成為智能電網(wǎng)的核心資源,結合經(jīng)濟、政策、氣象、地理等外部數(shù)據(jù)源,充分發(fā)掘隱藏在這些數(shù)據(jù)背后的價值,將為企業(yè)的生產(chǎn)、營銷、管理提供輔助決策支撐。
本文結合電網(wǎng)的實際情況和業(yè)務需求,提出集數(shù)據(jù)預處理、數(shù)據(jù)分析與挖掘、知識庫生成于一體的數(shù)據(jù)分析平臺,并闡述了在宏觀經(jīng)濟、產(chǎn)值電耗、城鎮(zhèn)化三者與電力需求之間的關系分析中的應用。
1 電力大數(shù)據(jù)處理平臺
電力大數(shù)據(jù)處理平臺包括數(shù)據(jù)收集、數(shù)據(jù)預處理、數(shù)據(jù)挖掘與分析、解釋與決策支持等,平臺架構如圖 1所示。
1.1 數(shù)據(jù)來源及特點
電網(wǎng)數(shù)據(jù)大致分為三類:
(1)電力企業(yè)生產(chǎn)數(shù)據(jù),如裝機容量、發(fā)電利用小時數(shù)等數(shù)據(jù)。
(2)電力企業(yè)運營數(shù)據(jù),如階梯電價、用電客戶、全社會用電量等數(shù)據(jù)。
(3)電力企業(yè)管理數(shù)據(jù),如ERP、協(xié)同辦公等數(shù)據(jù)。電網(wǎng)數(shù)據(jù),尤其是生產(chǎn)數(shù)據(jù)大多來自于分布在各處的現(xiàn)場采集裝置,具有數(shù)據(jù)質量差、種類混雜、類型不一致的特點。
外部數(shù)據(jù)的來源更多,包括國民經(jīng)濟、宏觀政策、法律法規(guī)、氣象、地理、水文等對電力生產(chǎn)、運營和管理可能產(chǎn)生直接或間接影響的各個方面。外部數(shù)據(jù)源的統(tǒng)計口徑多樣,一些數(shù)據(jù)例如國家政策無法直接參與建模,在數(shù)據(jù)的收集和使用方面存在諸多挑戰(zhàn)。
1.2 數(shù)據(jù)預處理
針對數(shù)據(jù)質量問題,電力大數(shù)據(jù)處理平臺集成了數(shù)據(jù)預處理模塊,實現(xiàn)數(shù)據(jù)清理、數(shù)據(jù)集成與變換、數(shù)據(jù)規(guī)約與壓縮等功能。數(shù)據(jù)預處理作為各類數(shù)據(jù)源進入數(shù)據(jù)庫之前的必要環(huán)節(jié),不僅有效提高數(shù)據(jù)挖掘的質量,而且降低挖掘所需要的時間。
數(shù)據(jù)清理去除數(shù)據(jù)中的噪聲,糾正不一致。數(shù)據(jù)變換通過平滑、概化、規(guī)范化、屬性構造等方法將數(shù)據(jù)轉換成適合挖掘的形式。數(shù)據(jù)集成將多個數(shù)據(jù)源合并成一致的數(shù)據(jù)存儲。數(shù)據(jù)規(guī)約通過聚集、刪除冗余特性等方法來壓縮數(shù)據(jù)。
1.3 數(shù)據(jù)挖掘與分析
挖掘出信息、提煉成知識并入庫,是電力數(shù)據(jù)平臺發(fā)揮價值的關鍵所在。
(1)基礎統(tǒng)計分析功能:包括均值分析、頻率分析、參數(shù)檢驗等。
(2)高級數(shù)據(jù)挖掘功能:包括分類、聚類、預測、關聯(lián)分析、孤立點分析等。
數(shù)據(jù)挖掘與分析必須建立在對挖掘對象深刻認識的基礎上,結合電力生產(chǎn)、經(jīng)營、管理的實際需要,選擇合適的數(shù)據(jù)挖掘技術。通過對歷史數(shù)據(jù)的分析,可以實現(xiàn)對電網(wǎng)規(guī)模、全社會用電量等方面的趨勢預測;判斷全社會用電量是否與國民經(jīng)濟數(shù)據(jù)存在相關關系需要關聯(lián)分析;找出線損率與其他省份存在明顯差異的省份則采用孤立點分析。
2 電力大數(shù)據(jù)分析應用
2.1 宏觀經(jīng)濟與電力需求
全社會用電量與國家宏觀經(jīng)濟及宏觀政策調控息息相關。首先分析宏觀經(jīng)濟指標與用電量之間的相關系數(shù),篩選出相關性較強的宏觀經(jīng)濟因素指標,建立量化預測模型,預測年度用電量。
將1995~2011年的宏觀經(jīng)濟類指標與全國全社會用電量通過皮爾森(Pearson)相關系數(shù)算法進行相關性分析發(fā)現(xiàn),國民生產(chǎn)總值、社會消費品零售總額等經(jīng)濟指標與用電量之間的相關系數(shù)達到了0.99以上,并且呈現(xiàn)較強的線性關系。通過RBF神經(jīng)網(wǎng)絡和線性回歸建立全社會用電量預測模型,并對2012年和2013年用電量進行預測。在預測2012年用電量時,RBF-4*神經(jīng)網(wǎng)絡預測誤差為0.97%,線性回歸模型預測誤差率為0.19%。兩個模型在預測2013年全社會用電量時,誤差相差在6%以內。綜合兩個模型預測結果,可以得出2013年全社會用電量大約為54000億千瓦時。與2012年相比,預測2013年全社會用電量增長率保持在8%左右。
2.2 產(chǎn)值電耗
產(chǎn)值電耗是反映能源消費水平和節(jié)能降耗狀況的主要指標。1990年以來,我國產(chǎn)值電耗(單位GDP的全社會用電量,即GDP單耗)總體呈下降趨勢。2011年產(chǎn)值電耗為994kWh/萬元,比1990年的3301kWh/萬元(按當年價格計算)下降了70%,如圖 3所示。
第一產(chǎn)業(yè)單耗和第三產(chǎn)業(yè)單耗變化幅度不大,總體呈下降趨勢。第二產(chǎn)業(yè)單耗的變化趨勢與GDP單耗的變化趨勢基本一致,是決定GDP單耗變化的主要影響因素原因。1990年以來我國產(chǎn)值單耗總體分為三個階段:一是1990年~1999年快速下降期,雖然第二產(chǎn)業(yè)在GDP所占比重有所上升。但由于科技進步的力度較大,重工業(yè)等行業(yè)的生產(chǎn)效率明顯提升,促使GDP單耗顯著下降;二是2000年~2005年緩慢上升期,我國工業(yè)增長明顯轉型以重工業(yè)為主導的格局以化工、建材、鋼鐵冶煉、有色金屬為代表的高耗能行業(yè)得到較快發(fā)展,產(chǎn)值電耗有較大幅度的上升;三是2006年至今緩慢下降期,面對日益嚴峻的環(huán)境形勢,我國出臺節(jié)能減排政策,淘汰產(chǎn)能低下的設備,有效遏制了第二產(chǎn)業(yè)電耗上升趨勢,促使產(chǎn)值單耗呈逐年下降。
基于孤立點分析和單樣本均值校驗等數(shù)據(jù)統(tǒng)計分析方法,挖掘出產(chǎn)值單耗異常的重點省份。青海的歷年產(chǎn)值電耗與其他省份存在顯著差異。進一步剖析青海的產(chǎn)業(yè)結構,青海的第一和第三產(chǎn)業(yè)比重呈整體下降趨勢,而第二產(chǎn)業(yè)比重上升明顯(38.5%->58.4%),這主要源于青海省重工業(yè)和高耗能行業(yè)的快速發(fā)展。雖然第二產(chǎn)業(yè)單耗從1990年到2011年呈逐年總體下降趨勢,但仍遠遠高于同期全國平均水平,其中高耗能行業(yè)用電量位居全國前十。
2.3 城鎮(zhèn)化與電力需求
城鎮(zhèn)化水平的提高和人民消費水平的升級帶來了城鎮(zhèn)居民用電和商業(yè)用電的增加,同時帶動相關的原材料生產(chǎn)、制造行業(yè)快速發(fā)展,間接促進了工業(yè)用電的增長,促使全社會用電量的不斷增長,從而帶動人均電量的快速增長,如圖 4所示。因此,隨著城鎮(zhèn)化進程的不斷加快,城鎮(zhèn)化率的提高是促進經(jīng)濟發(fā)展、促進電力需求增長的動力之一。
基于電力大數(shù)據(jù)處理平臺對城鎮(zhèn)化率和全社會用電量進行相關性分析。城鎮(zhèn)化率同全社會用電需求具有正向相關性,其相關系數(shù)高達0.95(越接近于1,正相關程度越高)。在城鎮(zhèn)化率上升較快的時期,用電量增長也相應較快。2000~2011年全社會用電量年均增速高于1990~1999年年均增速。這一時期也是城鎮(zhèn)化水平快速提高的階段,城鎮(zhèn)化率由2000年的36.22%提高到2010年的49.95%,并且在2011年達到51.27%,城鎮(zhèn)人口首次超過農(nóng)村人口,這標志著我國的城鎮(zhèn)化進程已經(jīng)進入了新的歷史階段。
3 結論
在信息時代,面對智能電網(wǎng)的飛速發(fā)展,我們所缺少的不是數(shù)據(jù),而是處理數(shù)據(jù)的能力。本文介紹的電力大數(shù)據(jù)處理平臺是從電力企業(yè)內部和外部的海量數(shù)據(jù)中洞察規(guī)律、提取知識的工具,通過對宏觀經(jīng)濟、產(chǎn)值電耗、城鎮(zhèn)化等主題的統(tǒng)計分析與數(shù)據(jù)挖掘,使得對電力供需與外部影響因素有了較為明確和定量化的了解,有助于為電網(wǎng)發(fā)展規(guī)劃提供輔助決策支持。
參考文獻
[1]朱靖愷,章淵,陳明.基于數(shù)據(jù)挖掘技術的電網(wǎng)調度運行分析系統(tǒng)[J].上海電力,2008.
[2]仲紅,謝榮傳.基于Web的數(shù)據(jù)倉庫[J].安徽師范大學學報(自然科學版),2002(02).
[3]譚顯東,胡兆光,李存斌,丁偉,劉達.基于改進BP神經(jīng)網(wǎng)絡的全社會用電量預測模型研究[J].華北電力大學學報,2007(03).
[4]Jia Wei H M K.數(shù)據(jù)挖掘概念與技術[M].北京:機械工業(yè)出版社,2007.
[5]單葆國,胡兆光.國民經(jīng)濟用電單耗變化解析[J].中國電力,2007(09).
作者單位
國家電網(wǎng)公司信息通信分公司 北京市 100761