付繼承
中圖分類號:G203 文獻標識:A 文章編號:1674-1145(2018)2-000-02
摘 要 本文描述了大數(shù)據(jù)的概念和特征,分析了電網(wǎng)大數(shù)據(jù)的來源。在電網(wǎng)信息化工作中,電網(wǎng)大數(shù)據(jù)的應用、面臨的安全風險,以及應采取的安全應對措施
關鍵詞 大數(shù)據(jù) 智能電網(wǎng) 三集五大 數(shù)據(jù)安全
大數(shù)據(jù)時代,數(shù)據(jù)已成為企業(yè)的核心競爭力,是企業(yè)智商的最重要載體。隨著三集五大體系建立、智能電網(wǎng)建設和一體化運維檢修等,電網(wǎng)企業(yè)勢必產(chǎn)生更多的數(shù)據(jù),這些龐大的數(shù)據(jù)多種多樣、雜亂無章、相互關聯(lián)。如何處理好這些數(shù)據(jù),從中提取有用信息用于指導電網(wǎng)企業(yè)的生產(chǎn)運營和管理,已成為電網(wǎng)信息化工作的重要任務。
一、大數(shù)據(jù)的概念
大數(shù)據(jù)與信息技術的發(fā)展如影隨形,人類的工作、學習和生活等各種行為都可以以數(shù)據(jù)的形式存在于網(wǎng)絡,這些龐大的數(shù)據(jù)絕大多數(shù)是“非結構化數(shù)據(jù)”,通常不能為傳統(tǒng)的數(shù)據(jù)庫所用,具有顯著的4V特征。
一是數(shù)據(jù)體量龐大(Volume)。當前個人計算機硬盤的容量為TB量級,1T大約能存儲12萬張1800萬像素的JPG格式照片。權威機構預測到2020年,全球數(shù)字宇宙將會膨脹到40ZB(1ZB=2^30TB),這些數(shù)據(jù)均產(chǎn)生于我們的日常行為當中,多數(shù)顯得沒有那么重要,卻又有著千絲萬縷的關聯(lián)。
二是數(shù)據(jù)類型多樣(Variety)。相對于以往便于存儲的以文本為主的數(shù)據(jù),現(xiàn)在更多的是圖片、視頻、音頻、地理位置信息等多類型、個性化數(shù)據(jù)。
三是數(shù)據(jù)處理速度快(Velocity)。這是大數(shù)據(jù)區(qū)別于傳統(tǒng)數(shù)據(jù)挖掘的最顯著特征。數(shù)據(jù)處理是從大量的、雜亂無章的、難以理解的數(shù)據(jù)中抽取并推導出對于某些特定的人們來說是有價值、有意義的數(shù)據(jù);數(shù)據(jù)處理的效率就是企業(yè)的生命,在如此海量的數(shù)據(jù)面前快速獲得高價值的信息,必須具有更快的數(shù)據(jù)處理速度。
四是數(shù)據(jù)價值密度低(Value)。數(shù)據(jù)價值密度的高低與數(shù)據(jù)總量的大小成反比。以視頻為例,一部1小時的視頻,在連續(xù)不間斷的監(jiān)控中,有用數(shù)據(jù)可能僅有一兩秒。
基于此,大數(shù)據(jù)可以定義為“無法用現(xiàn)有軟件工具提取、存儲、搜索、共享、分析和處理的海量的、復雜的、無規(guī)律的數(shù)據(jù)集合”。
二、電網(wǎng)大數(shù)據(jù)的來源
隨著電力工業(yè)與信息化的深度融合,智能電網(wǎng)建設、“三集五大兩中心”體系建設的推進,產(chǎn)生了大量的數(shù)據(jù),電網(wǎng)信息化對電網(wǎng)企業(yè)的決策、運營、銷售的作用不斷增強。這種作用的提升,使電網(wǎng)企業(yè)具有大數(shù)據(jù)的時代特征,電網(wǎng)信息化勢將突破傳統(tǒng)運維,被賦予更多的職能,比如強大的數(shù)據(jù)挖掘、數(shù)據(jù)分析和決策能力,產(chǎn)生更多的增值服務,甚至催生管理模式的創(chuàng)新。
電網(wǎng)企業(yè)數(shù)據(jù)主要來源于生產(chǎn)運營業(yè)務數(shù)據(jù)和管理業(yè)務數(shù)據(jù)。生產(chǎn)運營業(yè)務數(shù)據(jù)既包括通過傳感器、智能化設備、視頻監(jiān)控設備、音頻通信設備和移動終端等各種數(shù)據(jù)采集設備收集到的電網(wǎng)運行狀態(tài)實時數(shù)據(jù),也包括交易電價、售電量、用電客戶等企業(yè)營業(yè)數(shù)據(jù),以及物聯(lián)網(wǎng)、云計算、新能源并網(wǎng)等技術帶來的新業(yè)務數(shù)據(jù),《中國電力大數(shù)據(jù)發(fā)展白皮書》指出,電力行業(yè)的數(shù)據(jù)由以往類型較為單一、增長較為緩慢的情況發(fā)生轉(zhuǎn)變,正逐漸步入由結構化、半結構化和非結構化的海量業(yè)務數(shù)據(jù)源廣泛存在和驅(qū)動的大數(shù)據(jù)時代;管理業(yè)務數(shù)據(jù)則包括電網(wǎng)的規(guī)劃、建設、運行等管理工作中產(chǎn)生的數(shù)據(jù),也包括 ERP、一體化平臺、協(xié)同辦公等應用系統(tǒng)產(chǎn)生的數(shù)據(jù),三集五大體系的建設,實現(xiàn)了人、財、物的集約化管理,構建了大規(guī)劃、大建設、大運行、大檢修、大營銷體系,將使數(shù)據(jù)更加集中、更加龐大。
三、電網(wǎng)大數(shù)據(jù)的應用
信息技術的推進和發(fā)展,使電網(wǎng)企業(yè)的數(shù)據(jù)成爆炸式增長,如何使用好大數(shù)據(jù),充分活化企業(yè)數(shù)據(jù)資產(chǎn),更好地服務電力事業(yè)發(fā)展和廣大用電客戶,已成為擺在電網(wǎng)企業(yè)面前值得思考的課題。
目前,電網(wǎng)大數(shù)據(jù)應用場景主要在以下方面:
1、規(guī)劃—提升電網(wǎng)布局能力。通過對大數(shù)據(jù)的分析,利用數(shù)據(jù)挖掘技術,更準確地掌握用電負荷的分布和變化規(guī)律,提高中長期負荷的預測準確度;利用大數(shù)據(jù)的數(shù)據(jù)挖掘技術提供給規(guī)劃人員支撐電站建設布局的決策數(shù)據(jù),實現(xiàn)項目建設的科學調(diào)配。
2、建設—提升現(xiàn)場安全管理能力。對現(xiàn)場照片進行批量比對分析,利用分布式存儲、并行計算、模式識別等技術,掌握施工現(xiàn)場的安全隱患,或者核查安全整改措施的落實情況。
3、運行—提升調(diào)度管理能力。利用機器學習、模式識別等多維分析預測技術,通過關聯(lián)降水、風速、光照、溫度等氣象因素,分析水電、火電、以及風電、光電等新能源的發(fā)電運行情況,更準確地對電網(wǎng)調(diào)度進行預測和管理。
4、檢修—提升狀態(tài)檢修管理能力。研究消缺、檢修、運行工況、氣候條件等因素對設備狀態(tài)的影響,以及設備運行的風險水平,利用并行計算等技術實現(xiàn)檢修策略優(yōu)化,指導狀態(tài)檢修的深入開展。
5、營銷—提升對用電行為的分析能力。擴展用電采集的范圍和頻次,開展對用電行為特征的深入分析,實施區(qū)別化的用戶管理策略,可以使客戶更有效地用電和合理管理用電成本,收集到的數(shù)據(jù)也有助于電網(wǎng)企業(yè)為客戶定制電力管理程序和提供個性化定制服務。
6、運監(jiān)—提升業(yè)務關聯(lián)分析能力。利用流式計算、可視化和并行處理等技術,實現(xiàn)全方位在線監(jiān)測、分析、計算,通過聚類和模式識別技術,解決對跨業(yè)務的關聯(lián)分析、數(shù)據(jù)因子分析、數(shù)據(jù)診斷規(guī)則和算法,提高數(shù)據(jù)質(zhì)量監(jiān)控和治理。
7、客服—提升服務效率。對客服錄音進行實時監(jiān)管,利用模式識別、機器學習等技術,對熱點問題的服務資源進行優(yōu)化分配,提升交互水平。
四、電網(wǎng)大數(shù)據(jù)的安全風險
人們的生活正在被數(shù)字化,大量數(shù)據(jù)產(chǎn)生的背后隱藏著巨大的經(jīng)濟利益和政治利益。大數(shù)據(jù)不僅為電網(wǎng)企業(yè)帶來了更多的機遇,同時也帶來了新的安全風險。
一是大數(shù)據(jù)成為網(wǎng)絡攻擊的顯著目標。在網(wǎng)絡空間,大數(shù)據(jù)是更容易被“發(fā)現(xiàn)”的大目標。一方面,大數(shù)據(jù)意味著海量的數(shù)據(jù),這些數(shù)據(jù)會吸引更多的潛在攻擊者;另一方面,數(shù)據(jù)的大量匯集,使得黑客成功攻擊一次就能獲得更多數(shù)據(jù),增加了“收益率”。
二是大數(shù)據(jù)加大隱私泄露風險。大量數(shù)據(jù)的匯集不可避免地加大了用戶隱私泄露的風險。一方面,數(shù)據(jù)集中存儲增加了泄露風險,這些數(shù)據(jù)不被濫用,也成為信息安全的一部分;另一方面,一些敏感數(shù)據(jù)的所有權和使用權并沒有明確界定,很多基于大數(shù)據(jù)的分析都未考慮到其中涉及的個體隱私問題。
三是大數(shù)據(jù)威脅現(xiàn)有的存儲和安防措施。數(shù)據(jù)大集中的后果是復雜多樣的數(shù)據(jù)存儲在一起,很可能會出現(xiàn)將某些生產(chǎn)數(shù)據(jù)放在經(jīng)營數(shù)據(jù)存儲位置的情況,致使企業(yè)安全管理不合規(guī)。安全防護手段的更新升級速度無法跟上數(shù)據(jù)量非線性增長的步伐,就會暴露大數(shù)據(jù)安全防護的漏洞。
四是大數(shù)據(jù)成為高級可持續(xù)攻擊(APT)的載體。APT攻擊是一個實施過程,無法被實時檢測,大數(shù)據(jù)的價值低密度性,使得安全分析工具很難聚焦在價值點上,黑客可以將攻擊隱藏在大數(shù)據(jù)中,給安全服務提供商的分析制造很大困難。
五、電網(wǎng)大數(shù)據(jù)安全措施
信息安全在任何信息發(fā)展階段都占有不可忽視的地位,在對大數(shù)據(jù)發(fā)展規(guī)劃的同時,必須確保數(shù)據(jù)的安全和規(guī)范使用。為此,保證大數(shù)據(jù)安全采取的措施有以下幾種:
一是重視大數(shù)據(jù)及其信息安全體系建設。建議加大對大數(shù)據(jù)信息安全形勢的宣傳力度,明確大數(shù)據(jù)的重點保障對象,加強對敏感和要害數(shù)據(jù)的監(jiān)管,加快面向大數(shù)據(jù)的信息安全技術的研究,培養(yǎng)大數(shù)據(jù)安全的專業(yè)人才,建立并完善大數(shù)據(jù)信息安全體系。
二是加強對重點領域敏感數(shù)據(jù)的監(jiān)管。海量數(shù)據(jù)的匯集加大了敏感數(shù)據(jù)暴露的可能性,對大數(shù)據(jù)的無序使用也增加了要害信息泄露的危險。在企業(yè)層面,建議加強企業(yè)內(nèi)部管理,制定設備特別是移動設備安全使用規(guī)程,規(guī)范大數(shù)據(jù)的使用方法和流程。
三是對數(shù)據(jù)進行標記。大數(shù)據(jù)類型繁多、數(shù)量龐大直接導致了大數(shù)據(jù)較低的價值密度。從海量數(shù)據(jù)中篩選出有價值的數(shù)據(jù),既能保證其安全性,又能實現(xiàn)大數(shù)據(jù)的快速運算,其實現(xiàn)方法是對大數(shù)據(jù)進行分類標識。
四是設置用戶權限。分布式系統(tǒng)架構適用于具有超大數(shù)據(jù)集的應用程序,可以對用戶訪問權限進行設置,為不同的用戶賦予不同的訪問權限,不允許任何用戶超過為其設定的最大權限。
五是增強加密系統(tǒng)。為了保證大數(shù)據(jù)傳輸?shù)陌踩?,需要對?shù)據(jù)進行加密處理。通過加密系統(tǒng)對要上傳的數(shù)據(jù)流進行加密,對要下載的數(shù)據(jù)同樣要經(jīng)過對應的解密系統(tǒng)才能查看。因此需要在客戶端和服務端分別設置一個統(tǒng)一的文件加/解密系統(tǒng)對傳輸數(shù)據(jù)進行處理。同時,為了增強其安全性,應該將密鑰與加密數(shù)據(jù)分開存放。
六是發(fā)現(xiàn)潛在的數(shù)據(jù)聯(lián)系。大數(shù)據(jù)的信息安全更加注重的是安全技術而不是對數(shù)據(jù)本身的保護,目前已有對數(shù)據(jù)的安全性保護措施,但這些技術對于大數(shù)據(jù)來說是否可以同樣使用還需要驗證。