王珂
摘 要
文章通過對比不同種類的預(yù)測模型,找到一種能夠適合預(yù)測寬帶網(wǎng)絡(luò)故障的方法。文中使用動態(tài)神經(jīng)網(wǎng)絡(luò)和自回歸移動平均法來預(yù)測非線性系統(tǒng),并對結(jié)果進行比較,并得到了比較滿意的結(jié)果。對于每個測試用例,相關(guān)參數(shù)都進行了調(diào)整以適應(yīng)相應(yīng)的精度要求。
【關(guān)鍵詞】網(wǎng)絡(luò)故障 神經(jīng)網(wǎng)絡(luò) 自回歸移動平均法 非線性系統(tǒng)
1 引言
寬帶電信網(wǎng)絡(luò)現(xiàn)已經(jīng)大規(guī)模的市場化,雖然網(wǎng)絡(luò)服務(wù)的質(zhì)量一直在不斷提高,但是網(wǎng)絡(luò)故障的不斷發(fā)生,仍然是電信運營商所必須關(guān)注的問題。網(wǎng)絡(luò)故障最常見的表現(xiàn)是:服務(wù)完全中斷,下行帶寬低,無法訪問網(wǎng)站,撥打VoIP電話時的噪音,無法建立一個電話呼叫等。最能夠反映網(wǎng)絡(luò)服務(wù)質(zhì)量的參數(shù)是MTBF(發(fā)生故障之間的平均時間),減少故障的發(fā)生也就是提高發(fā)生故障之間的平均時間是運營商對于網(wǎng)絡(luò)改進的重點。國內(nèi)外的運營商也正在開發(fā)中運營支持系統(tǒng)和業(yè)務(wù)支持系統(tǒng),目的為了分析大量來自網(wǎng)絡(luò)的可用數(shù)據(jù)。但是由于服務(wù)復(fù)雜度,較長的平均服務(wù)時間和更多終端設(shè)備的實例,與傳統(tǒng)的電話網(wǎng)絡(luò)相比,寬帶接入網(wǎng)絡(luò)的平均故障間隔時間(MTBF)比傳統(tǒng)的非寬帶網(wǎng)絡(luò)低2-6倍,也就是是說網(wǎng)絡(luò)故障發(fā)生的頻率遠高于傳統(tǒng)的電話網(wǎng)絡(luò)。另一方面,網(wǎng)絡(luò)的復(fù)雜性使得難以準確地診斷可能會導(dǎo)致更高的重復(fù)數(shù)的問題故障。同時在用戶被引入通過感知和報告故障的隨機分量的數(shù)量和復(fù)雜性的增加,一個寬帶網(wǎng)絡(luò)中發(fā)生的故障可以看作是一個時間序列。時間系列描述寬帶故障的特點是事件發(fā)生的隨機性,事件復(fù)雜性以及事件數(shù)量龐大,這就使得到的時間序列具有較高的過程噪聲。由于監(jiān)視系統(tǒng)的不完善性,時間序列中的噪聲是必然是很多沒有觀察到的變量所導(dǎo)致的。監(jiān)視系統(tǒng)的不完善性表明其預(yù)警的模糊性,不準確性,同時也可能導(dǎo)致在某些特定的網(wǎng)絡(luò)故障事件發(fā)生時,無法預(yù)警。通過測量噪聲的水平,我們確定了模型中所需的變量和其復(fù)雜度。描述時間序列有兩個相關(guān)的變量,即平穩(wěn)性和線性、非線性。描述寬帶網(wǎng)絡(luò)的時間序列是由于其特性,即高水平的波動多引起的非平穩(wěn)性所決定的。在系統(tǒng)中的變量都是線性的和非線性的,一個時間序列的線性/非線性決定哪種模型會更有效地預(yù)測時間序列的結(jié)果,最終確定的最終實施的最佳模式。線性的時間序列可以使用自回歸模型,例如ARMA或ARIMA來描述,而非線性的時間序列則更適合用神經(jīng)網(wǎng)絡(luò)的非線性激活函數(shù)來描述。本文的目的是為了找到最合適的模型來描述它表征的系統(tǒng)。
2 一個網(wǎng)絡(luò)故障時間序列實例
為了動態(tài)跟蹤和預(yù)測的故障發(fā)生,我們將故障的數(shù)量作為一個時間序列。它被認為是一個隨機序列而不是確定性的序列,也就是說未來的結(jié)果只能進行估計,而不能夠精確計算。數(shù)據(jù)收集的頻率依賴于時間序列的性質(zhì)和邏輯,也就是說結(jié)果依賴于所描述的現(xiàn)象。采樣的頻率利用每天,每周,每月和每年的時間序列。運營管理中,對于寬帶故障的短期預(yù)測是必不可少的,而長期的預(yù)測是與戰(zhàn)略和長期規(guī)劃相關(guān)。此外,正確選擇的數(shù)據(jù)采集頻率有助于確定數(shù)據(jù)的周期性。寬帶故障有兩個清晰可辨的周期性,每天每周一次。故障發(fā)生模式本質(zhì)上是動態(tài)的,并隨著時間和季節(jié)的變化。每日樣本反映住宅及商業(yè)客戶的工作活動以及之后形成每周模型。本文對每10分鐘,每小時,每天,每周序列進行了分析,為實際應(yīng)用提供了足夠的選擇。圖1顯示了一個例子系列描述的是故障發(fā)生在10分鐘的時間間隔,采樣的總時間為2000分鐘。一般情況下,該序列具有可識別的形式,然而像諸如如核心網(wǎng)元發(fā)生故障或雷雨可以顯著影響曲線的形狀和扭曲,使其不可識別。
3 神經(jīng)網(wǎng)絡(luò)模型
人工神經(jīng)網(wǎng)絡(luò)由于其十分強的自適應(yīng)、自學(xué)習(xí)功能,因此經(jīng)常用來預(yù)測不同種類的時間序列。人工神經(jīng)網(wǎng)絡(luò)是一個以有向圖為拓撲結(jié)構(gòu)的動態(tài)系統(tǒng),它通過對連續(xù)或斷續(xù)式的輸入作狀態(tài)響應(yīng)而進行信息處理。是一個高度復(fù)雜的非線性動力學(xué)系統(tǒng),不但具有一般非線性系統(tǒng)的共性,更主要的是它還具有自己的特點,比如高維性、神經(jīng)元之間的廣泛互連性以及自適應(yīng)性或自組織性等。
3.1 感知器神經(jīng)網(wǎng)絡(luò)
MLP網(wǎng)絡(luò)是神經(jīng)網(wǎng)絡(luò)中研究的一個重點,它們具有很強的分類能力,它能解決模式分布非常復(fù)雜的分類問題。它由三部分組成:一組感知單元(源節(jié)點)組成輸入層、一層計算節(jié)點的隱含層、一層計算節(jié)點的輸出層。第一層的激活函數(shù)為對數(shù)s形函數(shù),第二層激活函數(shù)為線性函數(shù)。如圖2所示。
3.2 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)是1986年由Rumelhart和McCelland為首的科學(xué)家小組提出,是一種多層前向型網(wǎng)絡(luò)。其神經(jīng)元的傳遞時S型函數(shù),輸出量為0-1的連續(xù)量,它可以實現(xiàn)輸入到輸出的任意非線性映射。BP神經(jīng)元的傳輸函數(shù)為非線性函數(shù),常用的函數(shù)為losig函數(shù)和tansig函數(shù),輸出層則采用線性函數(shù)purelin。如圖3所示。
3.3 NARX神經(jīng)網(wǎng)絡(luò)
NARX神經(jīng)網(wǎng)絡(luò)即Jordan神經(jīng)網(wǎng)絡(luò)是一個能表示動態(tài)系統(tǒng)的網(wǎng)絡(luò),它把輸入也反饋到網(wǎng)絡(luò)的輸出,這就使加入的狀態(tài)反饋反映到網(wǎng)絡(luò)的動態(tài)性能中。我們的想法得到進一步提高在非線性自回歸網(wǎng)絡(luò)與外部輸入,輸出的數(shù)據(jù)是保存在延遲存儲器線。Jordan網(wǎng)絡(luò)的輸出值存儲在網(wǎng)絡(luò)本身的狀態(tài)變量中,而NARX網(wǎng)絡(luò)中,他們存儲在延遲矢量中。如圖4所示。
3.4 ARIMA 模型
ARIMA模型全稱為差分自回歸移動平均模型,是由博克思和詹金斯于70年代初提出的一著名時間序列預(yù)測方法。所謂ARIMA模型,是指將非平穩(wěn)時間序列轉(zhuǎn)化為平穩(wěn)時間序列,然后將因變量僅對它的滯后值以及隨機誤差項的現(xiàn)值和滯后值進行回歸所建立的模型。ARIMA模型根據(jù)原序列是否平穩(wěn)以及回歸中所含部分的不同,包括移動平均過程(MA)、自回歸過程(AR)、自回歸移動平均過程(ARMA)以及ARIMA過程。ARIMA模型的基本思想是:將預(yù)測對象隨時間推移而形成的數(shù)據(jù)序列視為一個隨機序列,用一定的數(shù)學(xué)模型來近似描述這個序列。這個模型一旦被識別后就可以從時間序列的過去值及現(xiàn)在值來預(yù)測未來值。模型如下圖公式所示。
4 數(shù)據(jù)分析和對比
通過使用均方根誤差和判定系數(shù),對比實際的數(shù)據(jù)和預(yù)測的數(shù)據(jù)來估算預(yù)測模型的準確性。
圖5和圖6是對LRN模型和NARX模型預(yù)測的結(jié)果與實際數(shù)據(jù)的對比,從圖形可以直觀看出,這兩個模型具有相對可靠地準確性。
5 結(jié)束語
本文的主要目的是比較不同的預(yù)測方法對于寬帶網(wǎng)絡(luò)故障的短期和長期預(yù)測。研究的結(jié)果表明動態(tài)遞歸神經(jīng)網(wǎng)絡(luò)優(yōu)于靜態(tài)神經(jīng)網(wǎng)絡(luò)。此外,傳統(tǒng)的預(yù)測方法,ARIMA無法實現(xiàn)神經(jīng)網(wǎng)絡(luò)的準確性預(yù)測,這證實了在電信網(wǎng)絡(luò)中大多數(shù)故障的非線性特征的假說。未來的改進方向是應(yīng)用動態(tài)內(nèi)存模型,像NARX和LRN模行,調(diào)節(jié)相應(yīng)的網(wǎng)絡(luò)參數(shù),另外識別和輸入?yún)?shù)的引入,也將有利于提高模型的準確性。
參考文獻
[1]陸寧云,何克磊,姜斌,呂建華.一種基于貝葉斯網(wǎng)絡(luò)的故障預(yù)測方法[J].東南大學(xué)學(xué)報自然科學(xué)版,2012,42:87-91.
[2]艾紅,周東華.動態(tài)系統(tǒng)的故障預(yù)測方法[J].華中科大學(xué)學(xué)報:自然科學(xué)版,2009,37:222-225.
[3]吳昕慧.基于神經(jīng)網(wǎng)絡(luò)的鐵路客運量優(yōu)化預(yù)測[J].計算機仿真,2010(10):168-170.
[4]李楠,曾興雯.基于EMD和神經(jīng)網(wǎng)絡(luò)的時間序列預(yù)測[J].西安郵電學(xué)院學(xué)報,2007(01):51-54.
[5]汪遠征,徐雅靜.多元平穩(wěn)時間序列ARIMAX模型的應(yīng)用[J].統(tǒng)計與決策,2007(18):132-135.
[6]張德豐.MATLAB 神經(jīng)網(wǎng)絡(luò)應(yīng)用設(shè)計(第2版)[M].北京:機械工業(yè)出版社,2012.
[7]周開利,康耀紅.神經(jīng)網(wǎng)絡(luò)模型及其MATLAB仿真程序設(shè)計[M].北京:清華大學(xué)出版社,2005.