摘要:針對現(xiàn)行方法在網(wǎng)絡(luò)流量快速預測中應用存在預測誤差較高的問題,文章提出基于深度學習的網(wǎng)絡(luò)流量快速預測方法。該方法利用相空間對收集的網(wǎng)絡(luò)流量時間序列數(shù)據(jù)進行重構(gòu),描述網(wǎng)絡(luò)流量數(shù)據(jù)非線性結(jié)構(gòu);利用維度變換函數(shù)將網(wǎng)絡(luò)流量數(shù)據(jù)轉(zhuǎn)換為二維數(shù)據(jù)并通過提取數(shù)據(jù)自相似性特征,提取網(wǎng)絡(luò)流量自相似性數(shù)據(jù);利用深度學習對網(wǎng)絡(luò)流量時間特征提取并通過特征融合預測未來時間點網(wǎng)絡(luò)流量,實現(xiàn)基于深度學習的網(wǎng)絡(luò)流量快速預測。實驗證明,設(shè)計方法在網(wǎng)絡(luò)流量快速預測場景中RMSE不超過0.01,MAE不超過0.1,可以實現(xiàn)對網(wǎng)絡(luò)流量的精準快速預測。
關(guān)鍵詞:深度學習;網(wǎng)絡(luò)流量;預測;相空間;維度變換函數(shù);自相似性
中圖分類號:TP393.07
文獻標志碼:A
0 引言
隨著信息技術(shù)的飛速發(fā)展和互聯(lián)網(wǎng)的普及,網(wǎng)絡(luò)流量已成為衡量網(wǎng)絡(luò)性能、優(yōu)化網(wǎng)絡(luò)資源配置及確保網(wǎng)絡(luò)安全的關(guān)鍵因素之一。尤其是在5G、邊緣計算、網(wǎng)絡(luò)功能虛擬化(Network Functions Virtualization,NFV)等新興技術(shù)的推動下,網(wǎng)絡(luò)流量的復雜性和動態(tài)性顯著增加,給網(wǎng)絡(luò)管理和優(yōu)化帶來了前所未有的挑戰(zhàn)。因此,如何快速、準確地預測網(wǎng)絡(luò)流量成了一個亟待解決的重要問題。網(wǎng)絡(luò)流量預測是指根據(jù)歷史網(wǎng)絡(luò)流量數(shù)據(jù),利用一定的數(shù)學模型或算法,預測未來網(wǎng)絡(luò)流量的大小和趨勢。這項技術(shù)在網(wǎng)絡(luò)規(guī)劃、運營和管理中具有重要意義。通過預測網(wǎng)絡(luò)流量,網(wǎng)絡(luò)管理員可以更有效地分配網(wǎng)絡(luò)資源,避免資源浪費和擁塞,提高網(wǎng)絡(luò)性能和可靠性。近幾年,相關(guān)學者與專家針對網(wǎng)絡(luò)流量預測問題展開了一系列研究并取得了一定的研究成果。
黃冬妹等[1]提出了基于時空特征交叉融合的預測方法,綜合分析網(wǎng)絡(luò)流量變化時間特征、空間特征,預測網(wǎng)絡(luò)流量。田愛寶等[2]提出了基于Transformer的預測方法,利用Transformer模型的序列建模能力,處理網(wǎng)絡(luò)流量的時間和空間特征,預測未來網(wǎng)絡(luò)流量的變化趨勢。傳統(tǒng)方法在處理線性關(guān)系和簡單數(shù)據(jù)模式時表現(xiàn)良好,但在面對復雜多變的網(wǎng)絡(luò)流量數(shù)據(jù)時,難以有效處理數(shù)據(jù)中的非線性關(guān)系,導致預測結(jié)果不夠準確。為此,本文提出基于深度學習的網(wǎng)絡(luò)流量快速預測方法。
1 網(wǎng)絡(luò)流量相空間重構(gòu)
網(wǎng)絡(luò)流量的動態(tài)變化具有混沌特性,這一特性使得它成為一種復雜而多變的時間序列數(shù)據(jù)類型。為了準確捕捉并預測這種時間序列中的潛在規(guī)律與未來趨勢,本文引入相空間重構(gòu)技術(shù),揭示數(shù)據(jù)背后的非線性結(jié)構(gòu)。假設(shè)收集的一組服務器網(wǎng)絡(luò)流量時間序列數(shù)據(jù)為X,為了重構(gòu)這一序列,構(gòu)建一個相空間,其中的每個點由原始序列中相隔γ時間單位的m個連續(xù)值構(gòu)成,對收集的服務器網(wǎng)絡(luò)流量時間序列重構(gòu),公式表示為:
式中,X表示相空間重構(gòu)的服務器網(wǎng)絡(luò)流量;m表示數(shù)據(jù)嵌入維數(shù);γ表示延遲變量;n表示服務器網(wǎng)絡(luò)流量時間序列長度。在選定合適的嵌入維數(shù)和延遲變量采用C-C算法,通過遍歷不同的嵌入維數(shù)和延遲變量,計算一系列統(tǒng)計量來評估各組合的優(yōu)劣。其中,嵌入維數(shù)m從1開始遞增至某一預設(shè)的上限,而延遲變量則在一系列候選值中選取,引入一個基于時間序列標準差,用于定義局部鄰域的大小,進而計算平均統(tǒng)計量和差值統(tǒng)計量,公式表示為:
式中,S表示平均統(tǒng)計量;S表示關(guān)聯(lián)積分;ΔS表示差值統(tǒng)計量[3]。根據(jù)平均統(tǒng)計量和差值統(tǒng)計量綜合評分給定嵌入維數(shù)和延遲變量下相空間,用公式表示為:
s=S+ΔS(4)
式中,s表示給定嵌入維數(shù)和延遲變量下相空間綜合得分,利用s的局部極小值,確定一個最佳嵌入窗,該窗口大小與嵌入維數(shù)和延遲變量存在線性關(guān)系,用公式表示為:
smin=γ(m-1)(5)
式中,smin表示s的局部極小值[4]。利用以上公式反推出最佳的嵌入維數(shù)和延遲變量值,將其代入公式(1),實現(xiàn)對所有網(wǎng)絡(luò)流量相空間重構(gòu)。
2 數(shù)據(jù)維度轉(zhuǎn)化及自相似性數(shù)據(jù)提取
考慮到經(jīng)過相空間重構(gòu)的數(shù)據(jù)為三維數(shù)據(jù),而后續(xù)基于深度學習的流量變化特征提取單詞輸入數(shù)據(jù)為二維數(shù)據(jù),因此對數(shù)據(jù)維度轉(zhuǎn)換,用公式表示為:
V=Reshape[X](6)
式中,V表示轉(zhuǎn)換后的網(wǎng)絡(luò)流量時間序列數(shù)據(jù);Reshape表示維度變換函數(shù)[5]。網(wǎng)絡(luò)流量預測,本質(zhì)在于將網(wǎng)絡(luò)流量的動態(tài)變化視為一個隨時間演進的數(shù)據(jù)序列,因此將網(wǎng)絡(luò)流量特征在時間的維度上嵌入圖結(jié)構(gòu),同時保持原始圖的空間布局不變[6]。這種表示方式下,每一個特征節(jié)點映射網(wǎng)絡(luò)中不同頂點在特定時刻的流量交換強度,從而構(gòu)建出網(wǎng)絡(luò)流量數(shù)據(jù)圖譜。在限定的時間窗口內(nèi),即t個連續(xù)的時間步中,利用Zt來表示這一時間段內(nèi)圖信號的頂點集合[7]?;谶@一集合,當給定k個歷史流量數(shù)據(jù)記錄時,目標是預測未來b個時間點的流量狀況,具體表達為(Zt+1),…,(Zt+b)的預測值。為了保證預測精度,提取到(Zt+1)~(Zt+b)時間段內(nèi)流量數(shù)據(jù)的自相似性特征,將其在圖結(jié)構(gòu)的拓撲框架內(nèi)進行映射和表示,形成“自相似模式圖譜”,根據(jù)其自相似性剔除原始數(shù)據(jù)中的冗余數(shù)據(jù),提取自相似性數(shù)據(jù),用公式表示為:
Zt+1,…,Zt+b=arg((Zt+1)V,…,(Zt+b)V)(7)
式中,Zt+1,…,Zt+b表示網(wǎng)絡(luò)流量時間序列數(shù)據(jù)集中的自相似性數(shù)據(jù),將其用g表示,作為深度學習輸入向量。
3 基于深度學習的流量特征提取及預測
在流量預測任務中,捕捉并解析空間特征是提升預測精度的關(guān)鍵一環(huán)。本文創(chuàng)新性地將服務器網(wǎng)絡(luò)映射為圖結(jié)構(gòu),通過深度學習技術(shù)深度挖掘網(wǎng)絡(luò)流量中的空間依賴關(guān)系,進而在錯綜復雜的網(wǎng)絡(luò)架構(gòu)中實現(xiàn)流量預測。因此,在以上基礎(chǔ)上,本文將提取的自相似性數(shù)據(jù)作為深度學習網(wǎng)絡(luò)輸入數(shù)據(jù),深度學習以其強大的多層非線性映射能力,使用多層神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),通過組合低層特征形成更加抽象的高層表示屬性類別或特征,自動從高維、非線性的網(wǎng)絡(luò)流量數(shù)據(jù)中提取深層次特征。在此次研究中,圖信號矩陣作為節(jié)點特征的載體,通過多層神經(jīng)網(wǎng)絡(luò)進行圖卷積操作,實現(xiàn)節(jié)點間復雜交互模式的捕捉,公式表示為:
u=Uf.g⊙Up,g(8)
式中,u表示深度學習網(wǎng)絡(luò)卷積運算輸出網(wǎng)絡(luò)流量特征向量;Uf.g表示網(wǎng)絡(luò)流量時間序列圖信號矩陣行節(jié)點信號;Up,g表示網(wǎng)絡(luò)流量時間序列圖信號矩陣列節(jié)點信號;⊙表示卷積運算算子[8]。將提取到的特征向量通過深度學習網(wǎng)絡(luò)中的池化操作,對特征進行降維,公式表示為:
e=∑ε=1υT(u)(9)
式中,e表示池化操作后輸出的網(wǎng)絡(luò)流量特征;ε表示卷積核數(shù)量;υ表示深度學習網(wǎng)絡(luò)學習系數(shù);T表示深度學習網(wǎng)絡(luò)學習周期[9]。為了優(yōu)化預測性能,集成自編碼模塊與多層注意力機制,自編碼模塊通過無監(jiān)督學習的方式,提取并壓縮網(wǎng)絡(luò)流量數(shù)據(jù)中的關(guān)鍵信息,同時減少噪聲干擾[10]。而多層注意力模塊的引入,在全局空間范圍內(nèi)捕捉復雜的序列相關(guān)性,特別是通過全局注意力機制,跨區(qū)域預測隱藏時間序列,公式表示為:
ζ=u×ψ×χ+u(10)
式中,ζ表示深度學習網(wǎng)絡(luò)通道注意力模塊輸出的網(wǎng)絡(luò)流量隱藏時間特征;ψ表示通道注意力矩陣;χ表示自編碼矩陣。通道注意力模塊將提取的網(wǎng)絡(luò)流量隱藏時間特征輸入輸出層,在輸出層對所有網(wǎng)絡(luò)流量隱藏時間特征融合,預測出未來某一時間網(wǎng)絡(luò)流量,公式表示為:
h(t+1)=q[Wu(t-1)u(t)+b](11)
式中,h(t+1)表示下一時刻服務器網(wǎng)絡(luò)流量值;q表示服務器網(wǎng)絡(luò)流量時間特征相關(guān)性系數(shù);W表示深度學習網(wǎng)絡(luò)輸出層連接權(quán)重;b表示偏置項。通過以上公式計算預測到網(wǎng)絡(luò)流量,以此實現(xiàn)基于深度學習的網(wǎng)絡(luò)流量快速預測。
4 實驗論證
4.1 實驗指標及環(huán)境
通過對比實驗驗證本文提出的基于深度學習的網(wǎng)絡(luò)流量快速預測方法的性能,將本文方法與黃冬妹等[1]提出的基于時空特征交叉融合方法和田愛寶等[2]提出的基于Transformer的方法對比,對比指標選擇RMSE和MAE,分別表示預測均方根誤差和平均絕對誤差,可用以下公式計算。
RMSE=1n∑j=1|xj-x0,j|2(12)
MAE=1n∑j=1|xj-x0,j|(13)
式中,RMSE表示預測均方根誤差;MAE表示預測平均絕對誤差;n表示預測樣本數(shù)量;xj表示預測的第j個網(wǎng)絡(luò)流量值;x0,j表示實際值與預測值之間的偏差。均方根誤差和平均絕對誤差越小,則表示預測精度越高?;谝陨蠈嶒炘O(shè)計,搭建實驗環(huán)境:采用Inter Core i8 CPU,操作系統(tǒng)采用WindowsXP10,預測程序采用Python3.6.1版本編程語言編程。實驗中深度學習框架采用Tensor Flow1.25,學習率設(shè)置為0.01,批次大小設(shè)置為256,迭代次數(shù)設(shè)置為200次。實驗數(shù)據(jù)來源于8個服務器網(wǎng)絡(luò)2020—2021年流量數(shù)據(jù)庫,按照以上對數(shù)據(jù)處理和分析,預測未來2~16天網(wǎng)絡(luò)流量,記錄預測值和實際流量值。
4.2 實驗結(jié)果與討論
通過計算得到網(wǎng)絡(luò)流量預測RMSE和MAE,如表1—2所示。
如表1—2所示,本文設(shè)計方法RMSE不超過0.01,MAE不超過0.1,基于時空特征交叉融合的方法RMSE在0.1以上,MAE在0.2以上,而基于Transformer的方法RMSE在0.08以上,MAE在0.1以上,無論是均方根誤差還是平均絕對誤差本文設(shè)計方法均表現(xiàn)最佳。因此,實驗證明,本文設(shè)計方法可以實現(xiàn)對網(wǎng)絡(luò)流量的精準預測,具有良好的適用性與可行性。
5 結(jié)語
深度學習技術(shù)以其強大的數(shù)據(jù)處理能力和模型泛化能力,為網(wǎng)絡(luò)流量預測領(lǐng)域帶來了革命性的變革。本文通過構(gòu)建復雜而精細的神經(jīng)網(wǎng)絡(luò)模型,成功地捕捉了網(wǎng)絡(luò)流量數(shù)據(jù)中的時空特征、動態(tài)變化以及潛在模式,實現(xiàn)了對未來流量趨勢的快速而準確的預測。這不僅為網(wǎng)絡(luò)運營商提供了有力的決策支持,還促進了網(wǎng)絡(luò)資源的優(yōu)化配置和高效利用。展望未來,隨著深度學習技術(shù)的不斷發(fā)展和完善,相信基于深度學習的網(wǎng)絡(luò)流量預測方法將在保障網(wǎng)絡(luò)安全、提升用戶體驗、推動數(shù)字化轉(zhuǎn)型等方面發(fā)揮更加重要的作用。
參考文獻
[1]黃冬妹,寧芊.基于時空特征交叉融合的網(wǎng)絡(luò)流量預測[J].現(xiàn)代計算機,2024(8):95-99.
[2]田愛寶,魏嬌嬌,肖軍弼.基于Transformer的網(wǎng)絡(luò)流量預測研究[J].信息技術(shù),2024(4):156-160.
[3]高勇,陸錢春,李鋒.面向IP網(wǎng)絡(luò)擴容應用的復雜網(wǎng)絡(luò)流量預測方法[J].電信科學,2023(9):21-31.
[4]陸勤政,朱曉娟.基于并行多尺度卷積記憶殘差網(wǎng)絡(luò)的物聯(lián)網(wǎng)流量預測[J].廊坊師范學院學報(自然科學版),2024(1):33-41.
[5]蔣東浩,趙洪華,王真.基于EWT和NeuralProphet-MLP的蜂窩網(wǎng)絡(luò)流量長期預測方法[J].現(xiàn)代信息科技,2024(6):52-57.
[6]馬攀.基于ResNet-LSTM組合模型的網(wǎng)絡(luò)流量預測研究[J].蘭州文理學院學報(自然科學版),2024(2):45-50.
[7]劉洋,廉咪咪.基于深度學習的移動通信網(wǎng)絡(luò)流量預測方法研究[J].長江信息通信,2024(2):90-92.
[8]劉思曉,周明,鄭富中,等.一種融合多源動態(tài)時空特征的戰(zhàn)術(shù)互聯(lián)網(wǎng)流量預測模型[J].指揮控制與仿真,2024(1):138-146.
[9]何迎利,胡光宇,張浩,等.基于局部信息增強注意力機制的網(wǎng)絡(luò)流量預測[J].科學技術(shù)與工程,2023(30):13014-13022.
[10]聶宏新,馮傳奮,任帥.基于PSO-LSTM優(yōu)化模型的網(wǎng)絡(luò)流量預測研究[J].電信工程技術(shù)與標準化,2023(10):18-21.
(編輯 王雪芬)
Fast prediction method of network traffic based on deep learning
XU Yingchen
(Zhejiang ShineMo Technology Co., Ltd., Hangzhou 310013, China)
Abstract:In view of the problem of high prediction error in the current method of fast network traffic prediction, a fast network traffic prediction method based on deep learning is proposed. Using phase space to collect network traffic time series data reconstruction, describe the network traffic data non-linear structure, using the dimensional transformation function of network traffic data into two-dimensional data, and extract the data from the similarity data, using deep learning of network traffic time feature extraction, and through the feature fusion, network traffic prediction future network traffic fast prediction based on deep learning. The experiment proves that the design method can achieve RMSE of 0.01 and MAE of 0.1 in the network traffic fast prediction scenario, which can achieve accurate and fast prediction of network traffic.
Key words:deep learning; network traffic; prediction; phase space; dimension transformation function; self-similarity