呂洪波 樊家樹 馬旭東
(國網(wǎng)吉林省電力有限公司信息通信公司,吉林 長春130021)
電力工業(yè)通信網(wǎng)為電力生產(chǎn)經(jīng)營提供了傳輸和數(shù)據(jù)通道。根據(jù)業(yè)務屬性的分類可以大致分為兩大類:生產(chǎn)和管理。隨著太陽能、風能、生物質(zhì)能、潮汐能等新能源的迅速發(fā)展。分布式能源供應系統(tǒng)是[1]未來的發(fā)展趨勢。
分布式電源系統(tǒng)中存在著許多分散的分布式電源,且多種類趨向于一種以上。有了儲能裝置和功率的負載平衡裝置,結構會變得相當復雜。這將需要信息中心智能電網(wǎng)和能源互聯(lián)網(wǎng)[2]的發(fā)展。
為了反映電力通信網(wǎng)的現(xiàn)狀,本課題研究了電力通信網(wǎng)的信息采集、表示和業(yè)務流程分析預測技術[3]。主要解決電力通信網(wǎng)絡中的三個問題:
(1)網(wǎng)絡運行狀態(tài)不可知。包括網(wǎng)絡中有多少應用;哪個應用程序消耗了最多的帶寬資源。
(2)網(wǎng)絡無法有效控制。
(3)網(wǎng)絡瓶頸問題得不到有效解決。
近年來,隨著電網(wǎng)的不斷發(fā)展,作為電網(wǎng)管理、運行和控制信息的電力通信網(wǎng)發(fā)展迅速。由于電力通信網(wǎng)絡的建設主要是按照系統(tǒng)的規(guī)劃階段,施工階段,并不認為是網(wǎng)絡本身的特性和優(yōu)化設計,和不同的投資主體,在一定程度上影響整個電力通信網(wǎng)絡的性能,重復建設,設備落后的兼容性和風險分散點隱藏,網(wǎng)絡不能充分發(fā)揮作用。為了進一步提高通信網(wǎng)絡的可靠性和業(yè)務承載能力,電力通信網(wǎng)絡風險分析評估工作是必要的,通過評估,及時發(fā)現(xiàn)和預警網(wǎng)絡風險點,從而實現(xiàn)網(wǎng)絡資源的優(yōu)化配置,并進一步提高安全性、可靠性和網(wǎng)絡的傳輸效率。
目前電力通信網(wǎng)的現(xiàn)狀可以概括為:
(1)網(wǎng)絡運行的狀態(tài)未知。包括:不了解網(wǎng)絡上主要有哪些應用程序在運行;不知道有多少應用程序正在運行,哪個應用程序消耗了最多的帶寬資源;沒有網(wǎng)絡運行歷史數(shù)據(jù),也無法預測趨勢。
(2)網(wǎng)絡無法有效控制。包括:P2P 和流媒體應用消耗帶寬資源,但無法有效控制;關鍵業(yè)務不能保證;關鍵用戶的網(wǎng)絡質(zhì)量得不到有效保障。
(3)網(wǎng)絡瓶頸問題得不到有效解決。局域網(wǎng)規(guī)模越來越大,訪問速度越來越快。
但是廣域網(wǎng)的速度并不隨局域網(wǎng)的增加而增加。在廣域網(wǎng)中,用戶、應用和帶寬三個方面的矛盾并不能完全解決。在網(wǎng)絡流量的早期研究中,流量建模主要是基于泊松分布和馬爾可夫過程,使用公共交換電話網(wǎng)絡(PSTN)流模式和泊松模型來描述流量數(shù)據(jù)。隨著網(wǎng)絡技術的發(fā)展和網(wǎng)絡業(yè)務的增長,利蘭發(fā)現(xiàn)自相似特征廣泛存在于每個網(wǎng)絡流量中。由于網(wǎng)絡自相似特性的影響是非常巨大的,因此得到了研究人員的重視,建立了各種自相似模型來描述和仿真流量特性,如分形布朗運動模型、多重分形小波模型等。
平臺使用的關鍵技術是大數(shù)據(jù)分析技術、數(shù)據(jù)挖掘技術、基于業(yè)務流程分析策略的引擎技術、流量預測和預警機制。系統(tǒng)的技術創(chuàng)新點有:數(shù)據(jù)挖掘技術分析、業(yè)務流程預測技術等。該平臺可以通過深度數(shù)據(jù)挖掘,預測出一個階段的數(shù)據(jù)流與未來趨勢。
通過觀察和分析,發(fā)現(xiàn)實際流量具有以下幾個重要特征:
(1)突發(fā)性(也稱峰值),業(yè)務流量在小時間尺度上表現(xiàn)最為明顯。
(2)長關聯(lián)長依賴,隨著時間的推移,不同時間尺度下的業(yè)務流序列具有相同的統(tǒng)計特性,即理論具有統(tǒng)計特性。
(3)周期性,又稱季節(jié)性,長時間的流動序列也反映周期性變化。
(4)混沌的,看似沒有規(guī)律的類似隨機現(xiàn)象。
(1)網(wǎng)絡節(jié)點端口流量分析。即對網(wǎng)絡節(jié)點設備端口流入和流出數(shù)據(jù)包的信息進行統(tǒng)計。它包括包的數(shù)量、字節(jié)的數(shù)量、包的大小分布和包丟失的數(shù)量等大量的統(tǒng)計信息。通過對端口流量網(wǎng)絡節(jié)點的分析,可以了解網(wǎng)絡的基本狀態(tài)。
(2)端到端的IP 流量分析。在網(wǎng)絡層中從一個源到一個目的IP 包的統(tǒng)計信息。通過對它的分析,我們可以理解用戶訪問網(wǎng)絡的目的,這是網(wǎng)絡分析、規(guī)劃、設計和優(yōu)化的重要依據(jù)。
(3)業(yè)務層流程分析。對傳輸層端口信息的分析,以及類型信息的應用服務,利用這些信息可以做更詳細的分析。
(4)全面分析用戶業(yè)務數(shù)據(jù)流,提高網(wǎng)絡安全性。
設計了基于多模流量采集的流量測量方法。根據(jù)監(jiān)控網(wǎng)絡的特點,可以靈活地改變流量采集方式,支持包級、NetFlow、sFlow 等多種流量數(shù)據(jù)格式的采集。該系統(tǒng)采用采集流量測量方法,能夠高效、準確地采集網(wǎng)絡流量,分析網(wǎng)絡特性,掌握網(wǎng)絡運行狀態(tài)。利用數(shù)據(jù)挖掘技術,設計了基于P2P 網(wǎng)絡流量特征的流量識別方案。通過實時流量屬性特征計算系統(tǒng),計算了不同流量和基于數(shù)據(jù)包分析的統(tǒng)計特性。利用多個屬性的特征值,選擇有效檢測P2P 流量的方法,并應用基于流屬性選擇的數(shù)據(jù)挖掘算法進行驗證。
根據(jù)上述特點對流量預測進行研究,得到可靠、有效的數(shù)據(jù)、統(tǒng)計和模型分析。穩(wěn)態(tài)流動模型分為兩類:短期依賴和長期依賴。短依賴模型包括馬爾可夫過程和自回歸模型(AR)、自回歸移動平均(ARMA)模型、自回歸綜合移動平均(ARIMA)模型等。長期依賴模型包括分形自回歸移動平均模型(F-ARIMA)和分形布朗運動模型(FBM)等。
流量預測實例
基于流量突發(fā)特征,長距離相關,周期性和混沌性,通過對電力通信網(wǎng)絡中各種業(yè)務流程數(shù)據(jù)進行統(tǒng)計分析,得出各種業(yè)務的特點。根據(jù)各種復雜的業(yè)務場景,利用馬爾科夫過程、ARMA 模型、F-ARIMA 模型、FBM模型等方法,建立了電力通信服務系統(tǒng)的流量評價模型。建立并實現(xiàn)了業(yè)務流程需求、帶寬需求、QoS 需求、生存性指標建模、電力通信網(wǎng)絡流量預測模型。對現(xiàn)有業(yè)務的短期和長期依賴關系、業(yè)務穩(wěn)定性進行評估,以達到可接受的算法復雜度。仿真和實際軟件系統(tǒng)平臺驗證了該方法的有效性。摘要基于自相似流量數(shù)據(jù),區(qū)分流量數(shù)據(jù)的具體業(yè)務類型,結合不同的情景,采用智能預測模型和組合預測方法,建立了一種靈活的流量預測模型。現(xiàn)有的網(wǎng)絡流量管理平臺僅涉及歷史數(shù)據(jù)的可視化。數(shù)據(jù)為實時數(shù)據(jù),未來無預測,不涉及網(wǎng)絡的預測功能。通過項目的實施,可以實現(xiàn)數(shù)據(jù)的可視化,并通過對數(shù)據(jù)的深度挖掘,預測出一個階段的數(shù)據(jù)流的未來趨勢。左圖是流量預測實例。
從圖中可以看出網(wǎng)絡流的特征。第一個是流量突發(fā)特征。在23:00-7:00,突然產(chǎn)生一個數(shù)據(jù)流。第二個圖可以顯示出短期的相關性。流動趨勢在短時間內(nèi)相同,但在較長時間間隔內(nèi)發(fā)生變化。在0:00 和12:00 時,沒有連續(xù)的趨勢,發(fā)生了破斷。
通過對電力通信網(wǎng)網(wǎng)絡特點以及流量特性的分析,利用大數(shù)據(jù)分析技術實現(xiàn)了電力通信網(wǎng)的流量監(jiān)控以及流量預測。系統(tǒng)平臺是軟件部分,是為了顯示電力通信網(wǎng)絡的狀態(tài)而設計的,同時也討論了信息采集、表示和業(yè)務流程分析預測技術。