丁春莉, 李林森
(陜西交通職業(yè)技術學院,西安 710021)
和聲搜索算法優(yōu)化支持向量機的網絡流量預測
丁春莉, 李林森
(陜西交通職業(yè)技術學院,西安 710021)
網絡流量受到外界因素作用,具有復雜的變化規(guī)律,為了改善了網絡流量的預測效果,設計了和聲搜索算法優(yōu)化支持向量機的網絡流量預測模型(HS-SVM)。首先對當前網絡流量預測研究現狀進行深入分析,并指出了網絡流量的混沌特性,然后采用混沌理論的相應方法確定網絡流量的延遲時間和嵌入維數,并對原始網絡流量數據進行重構,最后采用HS-SVM建立網絡流量預測模型,并與當前其它網絡流量預測模型進行了對照模擬測試。HS-SVM能夠挖掘和分析網絡流量的變化規(guī)律,網絡流量預測結果要明顯優(yōu)于其它網絡流量預測模型,測試結果驗證了HS-SVM的可行性和優(yōu)越性。
互聯網; 網絡流量; 混沌理論; 和聲搜索算法; 參數選擇
近些年來,隨著計算機技術、信息技術、網絡技術的不斷發(fā)展,網絡的應用范圍越來越廣,每天在互聯網上傳輸數據的種類和數量急劇增加,網絡擁塞呈上升趨勢,尤其是上網高峰時間,網絡擁塞十分嚴重[1,2]。為了保證網絡正常工作,網絡管理員提出了許多措施,其中流量預測可以提前知道網絡將來的狀態(tài),能夠提前制定防止網絡擁塞的措施,降低網絡擁塞的概率,保證網絡流的正常工作,因此流量的建模與預測引起了網絡公司、管理管理人員的高度重視[3]。
為了解決網絡流量的擁塞,人們采用各種方法對其進行分析,出現了許多性能良好的網絡流量預測模型。起初人們采用的預測模型主要有:線性回歸法、灰色理論、專家系統(tǒng)等[4,5],它們對于結構簡單的網絡,可以獲得較好的網絡流量預測結果,但它們需要事先知道網絡系統(tǒng)的先驗知識,而且認為網絡流量一直增長的,固定不變,這與現代復雜網絡,尤其是互聯網流量變化規(guī)律不符合,有時預測結果不可信,不能應用現代網絡流量管理中[6]。隨著網絡流量預測研究的不斷深入,人們發(fā)現網絡流量具有明顯周期性,也存在隨機性,甚至混沌性,為此人們采用神經網絡、極限學習機、貝葉斯網絡以及支持向量機(support vector machine,SVM)對網絡流量的將來變化態(tài)勢進行分析,取獲了比線性回歸等更優(yōu)的網絡流量預測結果[7,8]。網絡流量的變化十分復雜,神經網絡、極限學習機、要求收集大量的原始流量數據,當流量數據少時,網絡流量預測效果下降,應用范圍變小;貝葉斯網絡雖然可以獲得較好的網絡流最預測結果,但建模過程復雜,通用性差;相對于神經網絡等,SVM的要求樣本更少,建模過程更加簡單,成為當前網絡流量主要建模方法。SVM的網絡流量預測效果與核函數及參數選擇相關,當前采用隨機搜索算法如遺傳算法、粒子群算法等解決參數選擇問題,然而這些算法有各自的缺陷,網絡流量預測結果有待改善[9]。
為了改善了網絡流量的預測效果,提出和聲搜索算法優(yōu)化支持向量機的網絡流量預測模型(HS-SVM)。首先根據網絡流量的混沌特性確定網絡流量的延遲時間和嵌入維數,然后采用HS-SVM建立網絡流量預測模型,最后與其它網絡流量預測模型進行了對照實驗,結果表明,HS-SVM網絡流量預測結果明顯優(yōu)于其它網絡流量預測模型。
1.1 支持向量機
支持向量機是一種非線性分類和回歸算法,形式相當靈活,對于小樣本分類或者回歸問題,均可以獲得較好的結果,設樣本為:{(xi,yi),i=1,2,…,n}。由于網絡流量預測是一個回歸問題,因此采用支持向機的回歸[10],如式(1)。
(1)
式中,w表示權向量,b表示偏置向量[12]。
通常情況下,不是直接對(1)進行求解確定參數w和b,而對將其進行適當變換,成為凸二次規(guī)劃問題,然后進行求解,即有式 (2)。
(2)
式中,C表示預測誤差的懲罰參數;Remp(f)為預測結果的損失函數。
為了進一步簡化回歸的過程,提高支持向量機的工作效率,采用松弛因子對式(2)進行變換,得到相應的目標函數,為式(3)。
(3)
(4)
當一個回歸問題不是線性變化,而是非線性變化時,采用式(1)只能建立線性的回歸模型,而網絡流量具有典型的隨機性,因此需要采用映射函數φ將對網絡流數據映射到線性空間,把非線性問題變?yōu)榫€性問題進行預測,得到式(5)。
(5)
式(5)的約束條件,為式(6)。
(6)
支持向量機采用核函數k(xi,x)代替(φ(xi),φ(xj))減少支持向量的數量,降低計算時間復雜度,得到式(7)。
(7)
支持向量機的網絡流量預測函數,具體如式(8)。
(8)
本文選擇RBF核函數,其定義,為式(8)。
(9)
式中,σ為RBF的寬度。
1.2 HS算法
和聲搜索(HS)算法是一種模擬樂隊調音的隨機搜索算法,通過不斷調音操作找到最完美和聲,即問題的最優(yōu)解,其工作思想為:設初始解的數量為HM,隨機初始化并保存到和聲記憶庫中,對每一個解以HMCR概率在和聲記憶庫內搜索,其它在記憶庫外進行搜索,將它們合并在一起,得到問題的新解,根據相應規(guī)則到記憶庫的最差解進行更新,直到滿足結束為止[11]。HS算法的工作步驟具體如下:
(1) 初始HS算法的一些參數,如:HMCR、和聲記憶庫數量(HMS)、音調調節(jié)范圍和調節(jié)率BW和PAR。
(3) 根據相應問題的目標函數得到解的適應度函數值。
(5) 重新計算解的適應度函數值fit(X′),并與歷史最優(yōu)解進行比較,如果更優(yōu),就更新最優(yōu)解的值。
(6) 如果滿足算法結束條件,則輸入最優(yōu)解的值。
對一個網絡系統(tǒng),采用流量采集設備得到歷史數據為:{xi,i=1,2,…,n},那么i+1時刻的網絡流量的預測模型,為式(10)。
(10)
式中,f(·)表示回歸函數。
為了更好的捕捉網絡流量變化特點,本文采用支持向量機作為擬合函數,則需要支持向量機的參數進行優(yōu)化,采用和聲搜索算法選擇支持向量機的參數,網絡流量預測目標使預測誤差最小,從而得到目標函數,為式(11)。
(11)
基于HS-SVM的網絡流量建模過程具體如下:
(1) 初始化支持向量機參數,以及確定參數的范圍。
(2) 對網絡流量值進行歸一化預處理,即有式(12)。
(14)
式中,ymax和ymin分別為最大和最小值。
(3) 針對網絡流量的混沌性和隨機性,估計最優(yōu)延遲時間和嵌入維數,并對網絡流量原始數據進行重組。
(4) 采用支持向量機對訓練樣本進行學習,并采用10折交叉驗證計算參數組合的適應度函數值,并通過HS算法不斷搜索參數,找到最合理參數,構建立HS-SVM流量預測模型。
(5) 采用驗證樣本對HS-SVM可行性進行測試,并與其它模型進行對比實驗,驗證HS-SVM的優(yōu)越性。
3.1 源數據
為了測試HS-SVM的可行性,選擇一個大型網絡公司的網絡流量作為研究對象,得到720數據,最后200個數據作為驗證樣本,分析HS-SVM的泛化性能,其它數據用于HS對支持向量機的參數優(yōu)化,網絡流量數據,如圖1所示。
圖1 網絡流量數據
從圖1可以發(fā)現,該網絡流量數據具有一定的隨機,且混沌特征比較明顯,因此,通過混沌理論對圖1網絡流量數據進行延遲時間和嵌入維估計,結果如圖2所示。
(a) 延遲時間變化
(b) 嵌入維數變化
對圖2進行分析,可以發(fā)現該網絡流量的最延遲時間和嵌入維數分別為6和4,根據該值對圖1數據進行重組。
3.2 結果與分析
根據重組的流量數據對支持向量機進行訓練,采用HS算法估計最優(yōu)參數,得到驗證集的預測結果,如圖3所示。
(a) 預測結果
(b) 預測偏差
HS-SVM的網絡流量預測精度相當的高,實際值和預測幾乎完全重合,同時對預測偏差者分析可以知道,預測偏差小,值變化幅度小,說明HS-SVM的網絡流量預測誤差小。
采用文獻[12]和文獻[13]的網絡流量預測模型進行對照實驗,支持向量機的參數如表1所示。所有模型的流量預測精度見表1。
表1 模型參數以及預測精度
相對于文獻[12]和文獻[13]的網絡流量預測模型,HS-SVM的平均預測精度大約提高了4%,對比結果表明HS算法可以確定更優(yōu)的支持向量機參數,獲得了更優(yōu)的網絡流量預測效果型。
網絡流量受到外界因素的作用,具有復雜的變化規(guī)律,針對網絡流量的復雜性,提出了HS-SVM的網絡流量預測模型,在分析絡流量預測研究現狀的基礎上,建立網絡流量預測目標函數,然后根據網絡流量的延遲時間和嵌入維數重構網絡流量數據,最后HS-SVM建立網絡流量預測模型,測試結果表明,HS-SVM能夠挖掘和分析網絡流量的變化規(guī)律,獲得了比其它網絡流量預測模型更高的預測精度,預測結果可以為企業(yè)和管理員提供有用信息。
[1] 張賓,楊家海,吳建平. Internet 流量模型分析與評述[J]. 軟件學報, 2011, 22(1):115-131
[2] 邱婧,夏靖波,吳吉祥. 網絡流量預測模型研究進展[J]. 計算機工程與設計, 2012. 33(3): 865-869
[3] 鄒柏賢,劉強. 基于ARMA模型的網絡流量預測[J]. 計算機研究與發(fā)展, 2002, 39(12): 1645-1651.
[4] 姚萌,劉淵,周剛. 小波與神經網絡相結合的網絡流量預測模型[J]. 計算機工程與設計, 2007, 28(21): 5135-5137.
[5] 趙振江. 基于PSO-BP神經網絡的網絡流量預測與研究[J]. 計算機應用與軟件, 2009, 26(1): 218-221.
[6] 黨小超,郝占軍. 基于改進Elman神經網絡的網絡流量預測[J]. 計算機應用, 2010, 30(10): 2648-2652.
[7] 高波,張欽宇,梁永生. 基于 EMD及ARMA的自相似網絡流量預測[J]. 通信學報, 2011, 32(4); 47-56.
[8] 姚奇富,李翠風,馬華林,張森. 灰色系統(tǒng)理論和馬爾柯夫鏈相結合的網絡流量預測方法[J]. 浙江大學學報(理學版), 2007, 34(4):396-400.
[9] 李捷,候秀紅,韓志杰.基于卡爾曼濾波和小波的網絡流量預測算法研究[J].電子與信息學報,2007,29(3):725-725.
[10] 張浩然, 韓正之. 回歸支持向量機的改進序列最小優(yōu)化學習算法[J]. 軟件學報, 2003, 14(12): 2006-2013.
[11] Mahdavi M, Fesanghary M, Damangir E. An improved harmony search algorithm for solving optimization problems [J]. Applied Mathematics and Computation , 2007: 188:567-1579.
[12] 張穎璐. 基于遺傳算法優(yōu)化支持向量機的網絡流量預測[J]. 計算機科學, 2008, 35(5): 177-180.
[13] 羅赟騫,夏靖波,王渙彬. 混沌-支持向量機回歸在流量預測中的應用研究[J]. 計算機科學, 2009, 6(7): 244-246.
Network traffic predicting based on SVM optimized by harmony search algorithm
Ding Chunli,Li Linsen
(Shaanxi College of Communication Technology,Xi’an 710021,China)
Network flow is influenced by some external factors, and has complicated variation law. In order to improve prediction effect of network traffic, this paper puts forward a novel network traffic prediction model based on HS-SVM. First of all, current research status of network traffic prediction is analyzed deeply, and chaotic characteristics of network traffic are pointed out; Then, delay time and embedding dimension are determined by chaos theory to reconstruct original network traffic data; Finally, network traffic prediction model is established by HS-SVM and the simulation test is carried out compared with other network traffic prediction models. HS-SVM can mine and analyze the change law of network traffic, prediction results are better than that of other prediction models, and the test results verify feasibility and superiority of HS-SVM.
The Internet; Network traffic; Chaos theory; Harmony search algorithm; Parameter selection
丁春莉(1963-),女,陜西省臨潼縣人,副教授,研究方向:計算機軟件及應用,西安 710021 李林森(1990-),男,西安,助教,碩士研究生,研究方向:計算機軟件開發(fā)應用,西安 710021
1007-757X(2017)01-0067-04
TP391
A
2016.06.30)