周向軍
小波核函支持向量機的網(wǎng)絡(luò)流量預(yù)測模型
周向軍
為了提高網(wǎng)絡(luò)流量的預(yù)測精度,提出了一種小波核函數(shù)支持向量機的網(wǎng)絡(luò)流量預(yù)測模型。首先收集網(wǎng)絡(luò)流量歷史數(shù)據(jù),然后劃分訓(xùn)練樣本和測試樣本,將訓(xùn)練樣本輸入到小波核函數(shù)支持向量機進行學(xué)習(xí),最后采用測試樣本進行仿真實驗。實驗表明,本文模型加快了網(wǎng)絡(luò)流量建模的速度,提高了網(wǎng)絡(luò)流量的預(yù)測效率,而且可以獲得較高的預(yù)測精度,比傳統(tǒng)模型具有一定的優(yōu)勢,具有廣泛的應(yīng)用前景。
網(wǎng)絡(luò)流量;支持向量機;核函數(shù);預(yù)測模型
隨著網(wǎng)絡(luò)規(guī)模日益增大,網(wǎng)絡(luò)用戶日漸增多,網(wǎng)絡(luò)中的數(shù)據(jù)種類越來越多,流量急劇增加,網(wǎng)絡(luò)擁塞越來越頻繁[1]。網(wǎng)絡(luò)流量預(yù)測可以幫助管理人員提前了解網(wǎng)絡(luò)流量發(fā)展趨勢,是網(wǎng)絡(luò)管理的基礎(chǔ),因此如何建立性能優(yōu)異的網(wǎng)絡(luò)流量預(yù)測模型,提高網(wǎng)絡(luò)流量的預(yù)測精度,一直是人們關(guān)注的焦點[2]。
針對網(wǎng)絡(luò)流量預(yù)測問題,國內(nèi)外學(xué)者對網(wǎng)絡(luò)流量預(yù)測問題進行大量研究,傳統(tǒng)預(yù)測模型有多元線性回歸法、滑動平均法、差分自回歸移動平均法、指數(shù)平滑法等[3-5],由于網(wǎng)絡(luò)流量受到多因素影響,具有突變性,傳統(tǒng)線性模型難以建立準(zhǔn)確的預(yù)測模型[6]。針對網(wǎng)絡(luò)流量變化特點,一些學(xué)者將非線性理論引入到網(wǎng)絡(luò)流量預(yù)測中,出現(xiàn)支持向量機、神經(jīng)網(wǎng)絡(luò)等預(yù)測模型,它們較好描述了網(wǎng)絡(luò)流量變化趨勢,網(wǎng)絡(luò)流量的預(yù)測精度大幅度提高[7-9]。神經(jīng)網(wǎng)絡(luò)雖然具有非線性的建模能力,但訓(xùn)練樣本規(guī)模要求大,不然就會出現(xiàn)“過擬合”等缺陷,預(yù)測精度低[10]。支持向量機較好地解決了非線性預(yù)測問題,比神經(jīng)網(wǎng)絡(luò)取得了更優(yōu)的預(yù)測效果[11],在實際應(yīng)用中,支持向量機的性能與核函數(shù)選擇密切相關(guān),當(dāng)前核函數(shù)眾多,但是還沒有一個通用性強的核函數(shù)[12]。
小波核函數(shù)具有多尺度學(xué)習(xí)性能,可以反映復(fù)雜多變的網(wǎng)絡(luò)流量變化特性,為了提高網(wǎng)絡(luò)流量的預(yù)測精度,針對支持向量機的核函數(shù)構(gòu)建問題,提出一種小波核函數(shù)支持向量機的網(wǎng)絡(luò)流量預(yù)測模型(簡稱小波支持向量機)。首先收集網(wǎng)絡(luò)流量歷史數(shù)據(jù),然后劃分訓(xùn)練樣本和測試樣本,將訓(xùn)練樣本輸入到小波核函數(shù)支持向量機進行學(xué)習(xí),最后采用測試樣本進行仿真實驗。實驗表明,本文模型加快了網(wǎng)絡(luò)流量建模的速度,提高了網(wǎng)絡(luò)流量的預(yù)測效率,而且可以獲得較高的預(yù)測精度,比傳統(tǒng)模型具有一定的優(yōu)勢,具有一定的實際應(yīng)用價值。
SVM的回歸是對式(5)的問題進行求解如公式(2):
式中,ei為回歸誤差,C為懲罰參數(shù)。
引入拉格朗日函數(shù),將式(2)轉(zhuǎn)為無約束優(yōu)化問題,即公式(3):
式中,αi為拉格朗日乘子。
根據(jù)最優(yōu)化理論中的KKT理論,得到公式(4):
對公式(4)消去w和ei,得到公式(5):
其中E=[1,...,1]T,α=[α1,...,αl],y=[y1,...,yl]T,Ωij=φ(xi)T.φ(xj)。
根據(jù)Mercer條件,核函數(shù)定義如公式(6):
根據(jù)式(18)可以得到公式(7):
根據(jù)Q=Ω+γ-1I得到公式(8):
SVM的回歸函數(shù)可表示為公式(9):
式中,k(xi, x))表示核函數(shù)。
在支持向量機中,核函數(shù)避免了高維的特征空間,降低了計算復(fù)雜度,常用的核函數(shù)如表1所示:
表1 常用核函數(shù)
2.1小波核函數(shù)
小波分析既保留了傅立葉變換的優(yōu)點,又彌補了傅立葉變換的不足,設(shè)φ(x)是一個母波,a和b分別為尺度參數(shù)和平移參數(shù),若x,x'∈Rn,那么小波核函數(shù)為公式(10):
當(dāng)且僅當(dāng)k(x)的傅立葉變換為公式(11):
是非負(fù)的時候,平移不變核K(x, x')=k(x-x')是可以作為支持向量的核函數(shù)。此時,滿 足Mercer平移不變性核定理的小波核函數(shù)為公式(12):
2.2小波支持向量機
在小波支持向量機建模時,核函數(shù)運算時間要相較稱,這樣訓(xùn)練效率下降文,為了獲取更好的實時預(yù)測性能,將該在線訓(xùn)練算法與小波支持向量機相結(jié)融合,通過緩存矩陣用來保存重要的核函數(shù),提高小波支持向量機的訓(xùn)練效率。
(1)構(gòu)建四個矩陣K(Xn,XS),K(Xn,XE),K(Xn,XR)和K(Xn,Xc),它們的代表矩陣結(jié)構(gòu)為公式(13)、(14):
其中,G為M,S或E;j為G的樣本數(shù);i為E∪R∪M∪C的樣本數(shù);xGk∈G,xnk∈ERMc ,k=1,2,,i 。
(2)新樣本Xc分配到集合G,為公式(15):
(3)當(dāng)樣本xG1從集合G1進入集合G2時,按下式更新K(Xn,XG1)和K(Xn,XG2)為公式(16)、(17)、(18):
式中,xGli∈G1,i=1,2,…,m;m為集合Gl的樣本個數(shù)。
(4)當(dāng)Xc被淘汰出訓(xùn)練樣本集合時,按如下形式更新K(Xn,XS)、K(Xn,XE)、K(Xn,XR)為公式(19):
式中,xGi∈G,i=1,2,…,m;m為集合G 樣本個數(shù)。
當(dāng)更新樣本集時,利用這四個要矩陣儲存重要的核函數(shù)信息,提高AOSVM算法的計算效率。
3.1數(shù)據(jù)源
為了測試小波支持向量機的網(wǎng)絡(luò)流量預(yù)測模型的性能,選擇權(quán)威實測流量數(shù)據(jù)集作為研究對象,收集了路由器Incoming articles從2014年3月1日到2014年3月15日的每小時網(wǎng)絡(luò)流,得300個數(shù)據(jù),它們具體如圖1所示:
圖1 網(wǎng)絡(luò)流量數(shù)據(jù)
選擇平均相對誤差(MAE)、均方根誤差(RMSE)和預(yù)測時間t作為預(yù)測結(jié)果的評估指標(biāo),MAE和RMSE定義如公式(20)、(21):
式中,xk是樣本k的真實值,為樣本k的預(yù)測值。
3.2結(jié)果與分析
為了測試小波核函數(shù)的優(yōu)越性,選擇用Poly核函數(shù)和RBF核函數(shù)的支持向量機進行對比實驗,前900個數(shù)據(jù)作為訓(xùn)練集建立預(yù)測模型,后100個數(shù)據(jù)作為測試集進行預(yù)測檢驗。它們的預(yù)測結(jié)果如圖2所示:
圖2 與其它核函數(shù)的支持向量機結(jié)果對比
MAE、RMSE以及T的統(tǒng)計結(jié)果如表2所示:
表2 與其它核函數(shù)預(yù)測性能對比
從表2的結(jié)果可知,要對于對比核函數(shù)的支持向量機,小波支持向量機的預(yù)測精度略有提高,但是執(zhí)行時間大幅度減少,這主要是由于引入了緩沖矩陣,加速了訓(xùn)練時間,提高了預(yù)測效率,同時旨入小波核函數(shù)建立了更優(yōu)的支持向量機,提高了預(yù)測精度。
為了進一步分析小波支持向量機的優(yōu)越性,選擇經(jīng)典模型—ARMA進行對比實驗,ARIMA的預(yù)測結(jié)果如圖3所示:
圖3 ARMA的預(yù)測結(jié)果
MAE、RMSE以及T的統(tǒng)計結(jié)果如表3所示:
表3 與經(jīng)典模型預(yù)測性能對比
從表3中可以看出,ARMA的建模效率高,但預(yù)測精準(zhǔn)度低于小波支持向量機,這主要是由于ARMA模型依賴大量的樣本數(shù)據(jù)來進行擬合預(yù)測的,在小樣本數(shù)據(jù)的情況下,預(yù)測性能大大降低,則小支持向量機在樣本數(shù)量少,也可以獲得較高的預(yù)測精度,相對于預(yù)測精度,預(yù)測速率的微小損失是值得的。
為了提高網(wǎng)絡(luò)流量預(yù)測精度,提出了一種小波支持向量機的網(wǎng)絡(luò)流量預(yù)測模型。首先分析了當(dāng)前網(wǎng)絡(luò)流量的研究現(xiàn)狀,然后針對支持向量機的核函數(shù)構(gòu)建問題,提出利用小波核函作為支持向量機的核函數(shù),并采用具體的仿真實驗測試其有效性。實驗表明,相對于其它核函數(shù)的支持向量機,本文模型的預(yù)測精度更高,比傳統(tǒng)的流量預(yù)測算法相比,不僅加快了網(wǎng)絡(luò)流量的建模速度,而且預(yù)測精度更高。
[1] 張賓,楊家海,吳建平. Internet 流量模型分析與評述[J].軟件學(xué)報,2011, 22(1):115-131.
[2] Chuang L Y, Wei T S, Yhong Y C. Chaotic catfish particle swarm optimization for solving global numerical optimization problems [J]. Applied Mathematics and Computation, 2011, 217: 6900-6916.
[3] Callado A, Keu R J, Sadok D, et a1.Better network traffic identification through the independent combination of techniques [J]. Journal of Network and Computer Applications, 2010, 33(4):433-446.
[4] 李世銀,徐冬,劉瓊,等. 網(wǎng)絡(luò)自相似流量預(yù)測及擁塞控制研究[J]. 系統(tǒng)仿真學(xué)報,2009,21(21):6935-6939.
[5] 程光,龔儉. 大規(guī)模網(wǎng)絡(luò)流量宏觀行為周期性分析研究[J]. 小型微型計算機系統(tǒng), 2003, 24(6): 992-994.
[6] 姜明,吳春明,張曼,胡大民. 網(wǎng)絡(luò)流量預(yù)測中的時間序列模型比較研究[J]. 電子學(xué)報,2009,37(11):2353-2358.
[7] 鄔平,吳斌. 采用回歸方法優(yōu)化網(wǎng)絡(luò)流量管理模型處理性能[J]. 計算機工程與應(yīng)用,2012, 48(4): 104-106.
[8] 高波,張欽宇,梁永生. 基于EMD及ARMA的自相似網(wǎng)絡(luò)流量預(yù)測[J]. 通信學(xué)報,2011,(32)04-47-56
[9] 趙振江. 基于PSO-BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)流量預(yù)測與研究[J]. 計算機應(yīng)用與軟件,2009,26(1):218-221
[10] 熊南,劉百芬. 基于自適應(yīng)粒子群優(yōu)化LSSVM的網(wǎng)絡(luò)流量在線預(yù)測[J]. 計算機應(yīng)用與軟件, 2013,30(9):21-24,127
[11] 張文金,許愛軍. 混沌理論和LSSVM相結(jié)合的網(wǎng)絡(luò)流量預(yù)測[J]. 計算機工程與應(yīng)用,2013,49(15):101-104.
[12] 張穎璐. 基于遺傳算法優(yōu)化支持向量機的網(wǎng)絡(luò)流量預(yù)測[J].計算機科學(xué),2008,35(5):177-180.
Network Traffic Prediction Model Based on Wavelet Kernel Function Support Vector Machine
Zhou Xiangjun
(Department of Information Technology, Guangdong Teachers College of Foreign Language and Arts, Guangzhou 510507, China)
In order to improve the prediction accuracy of network traffic, a new network traffic prediction model based on wavelet kernel function support vector machine is proposed. First, the historical data of network traffic is collected, then the training samples and test samples are divided, and the training samples are input to the wavelet kernel function support vector machine to learn. Finally, the test samples are used to carry out simulation experiments. Experimental results show that this model accelerated the speed of network traffic modeling, improve the efficiency of the network traffic prediction, and can obtain higher prediction accuracy, has certain superiority compared to the traditional model, has a wide application prospect.
Network Traffic; Support Vector Machine; Kernel Function; Prediction Model
TP393
A
1007-757X(2016)06-0062-04
2016.01.26)
周向軍(1971-),男,漢族,汕頭人,廣東省外語藝術(shù)職業(yè)學(xué)院,信息技術(shù)系,副教授,碩士,研究方向:計算機網(wǎng)絡(luò)、數(shù)據(jù)庫、計算機多媒體,廣州,510507