王博
摘要:針對傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的缺陷,本文提出了一種優(yōu)化的遺傳算法,將其引入BP網(wǎng)絡(luò),建立了GABP神經(jīng)網(wǎng)絡(luò)模型,以提高傳統(tǒng)神經(jīng)網(wǎng)絡(luò)的訓練速度、避免陷入局部極值。經(jīng)過使用KDDCUP99數(shù)據(jù)集的數(shù)據(jù)進行網(wǎng)絡(luò)訓練后發(fā)現(xiàn),本優(yōu)化的GABP模型可以有效提高效率。將此優(yōu)化后的遺傳神經(jīng)網(wǎng)絡(luò)引入到入侵檢測系統(tǒng)中,入侵檢測系統(tǒng)縮短了檢測時間、提高了檢測的精度。
關(guān)鍵詞:入侵檢測;神經(jīng)網(wǎng)絡(luò);遺傳算法
中圖分類號:TP18? ? ? ? 文獻標識碼:A? ? ? ? 文章編號:1009-3044(2018)34-0168-02
1 引言
當今社會,互聯(lián)網(wǎng)飛速發(fā)展,基于網(wǎng)絡(luò)的各種平臺復雜多樣,然而,計算機網(wǎng)絡(luò)在給人們帶來各種便利的時候,它帶來的安全問題也日益得到關(guān)注。安全問題主要包括網(wǎng)絡(luò)病毒和黑客攻擊,手段種類呈現(xiàn)越來越多樣的趨勢, 網(wǎng)絡(luò)入侵造成的威脅也越來越大, 互聯(lián)網(wǎng)中數(shù)據(jù)的安全性和保密性受到前所未有的挑戰(zhàn)。
傳統(tǒng)的安全防御系統(tǒng)是基于靜態(tài)、被動的基于規(guī)則的檢測技術(shù),該技術(shù)存在許多缺陷,比如難以建立統(tǒng)計模型、規(guī)則庫難以管理[1]。目前應(yīng)用比較廣泛的入侵檢測系統(tǒng),大多數(shù)采用的入侵檢測技術(shù)是對誤用的檢測,其基本原理是首先建立誤用網(wǎng)絡(luò)檢測模型, 并建立相關(guān)的網(wǎng)絡(luò)入侵特征庫, 然后在后續(xù)的檢測過程中, 將收集到網(wǎng)絡(luò)狀態(tài)數(shù)據(jù)與網(wǎng)絡(luò)入侵特征庫中的特征代碼進行模式匹配, 得出是否是網(wǎng)絡(luò)入侵的結(jié)論[2]。該入侵檢測系統(tǒng)的模型檢測過程原理方式與病毒檢測基本是相同的。這種算法模型的優(yōu)點是誤報率低,但是嚴重依賴于特征庫,無法自我學習、更新,如果特征庫數(shù)據(jù)更新不及時,則無法對新的攻擊進行檢測,并且,隨著攻擊連接數(shù)的增加,該模型算法耗費的時間會成倍增加,系統(tǒng)負荷很嚴重。針對此缺陷,人工神經(jīng)網(wǎng)絡(luò)被廣泛應(yīng)用到入侵檢測中。人工神經(jīng)網(wǎng)絡(luò)屬于非線性動力學系統(tǒng),具有自適應(yīng)、自動學習的特點,在模式識別領(lǐng)域尤其具有廣泛的應(yīng)用。而針對網(wǎng)絡(luò)入侵的檢測從原理上看就屬于模式識別問題,對網(wǎng)絡(luò)入侵檢測的過程就是對網(wǎng)絡(luò)數(shù)據(jù)流檢測的過程,分為兩種:正常、異常數(shù)據(jù)。因此,可以嘗試將人工神經(jīng)網(wǎng)絡(luò)引入傳統(tǒng)的入侵檢測系統(tǒng),彌補傳統(tǒng)入侵檢測系統(tǒng)的缺陷。實踐證明,這種方法也取得了良好的效果。與此同時,由于傳統(tǒng)神經(jīng)網(wǎng)絡(luò)使用的BP算法存在訓練速度慢, 并且容易陷入局部最小值的缺點,使得BP神經(jīng)網(wǎng)絡(luò)在網(wǎng)絡(luò)入侵中的應(yīng)用受到了限制[3]。
遺傳算法(GA),是一種智能啟發(fā)式的優(yōu)化算法, 具有非常強的全局搜索能力, 實現(xiàn)簡單, 優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的參數(shù)具有非常好的優(yōu)勢。為提高傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)的訓練效率、減小誤差,本文采用GA算法對BP神經(jīng)網(wǎng)絡(luò)初始權(quán)值進行優(yōu)化, 應(yīng)用于入侵檢測系統(tǒng)。最后使用Matlab對改進的模型進行實驗仿真,驗證優(yōu)化后模型的實際效果。
2 網(wǎng)絡(luò)入侵檢測原理
網(wǎng)絡(luò)入侵是指以破壞網(wǎng)絡(luò)資源的活動集合,這些活動包括獲取網(wǎng)絡(luò)機密性、破壞數(shù)據(jù)完整性、可用性。常見的入侵種類包括6種:偽裝攻擊、拒絕服務(wù)攻擊、安全控制系統(tǒng)滲透、惡意使用、嘗試性闖入、泄漏。網(wǎng)絡(luò)檢測原理由DARPA提出的, 其原理如圖1所示。
在網(wǎng)絡(luò)入侵檢測中,事件數(shù)據(jù)庫提供了各數(shù)據(jù)信息,采用一定的算法對這些數(shù)據(jù)信息進行分析,這就是事件分析器。事件分析器可判斷網(wǎng)絡(luò)入侵行為是否存在, 是入侵檢測系統(tǒng)中最重要、最核心的部分。模型中對數(shù)據(jù)分析時采用的算法優(yōu)劣直接決定了入侵檢測的準確度。
3 GABP模型
3.1 GABP神經(jīng)網(wǎng)絡(luò)模型
由于具有自主學習、自動更新的特點,人工神經(jīng)網(wǎng)絡(luò)在入侵檢測時發(fā)揮了越來越大的作用。將遺傳算法(GA)與引入傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò),建立GABP神經(jīng)網(wǎng)絡(luò)模型,克服傳統(tǒng)網(wǎng)絡(luò)的缺陷,提高入侵檢測的精確度,模型如圖2所示。
3.2 BP神經(jīng)網(wǎng)絡(luò)算法
BP神經(jīng)網(wǎng)絡(luò)是目前使用得最廣泛的一種神經(jīng)網(wǎng)絡(luò),屬于前饋式網(wǎng)絡(luò),包含了輸入層、隱含層和輸出層3個層次。具體模型結(jié)果如下圖3所示:
3.3? BP算法的缺陷
BP神經(jīng)網(wǎng)絡(luò)有著自主學習、自我調(diào)整的優(yōu)點,但是它也存在著明顯的缺陷:①網(wǎng)絡(luò)收斂時間長,容易導致訓練陷入癱瘓狀態(tài); ②容易陷入局部最小值,無法得到全局最優(yōu)解,因為BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)決定了輸入層和輸出層之間的關(guān)系是一種非線性關(guān)系,這決定了網(wǎng)絡(luò)訓練的誤差函數(shù)為多極點的非線性空間,與此同時,由于BP算法始終以追求網(wǎng)絡(luò)誤差為目標,這就導致了網(wǎng)絡(luò)容易陷入局部最優(yōu),無法得到全局最優(yōu)值。將遺傳算法引入神經(jīng)網(wǎng)絡(luò),對完善BP神經(jīng)網(wǎng)絡(luò)提供了新的思路。本文將遺傳算法對BP神經(jīng)網(wǎng)絡(luò)進行優(yōu)化,并建立GABP神經(jīng)網(wǎng)絡(luò)模型,并將此模型應(yīng)用于入侵檢測系統(tǒng),通過實驗證明改模型的有效性。
3.4 遺傳算法優(yōu)化模型
首先,對輸入數(shù)據(jù)進行歸一化處理,然后進行分組訓練,進行精度匹配,權(quán)值訓練引入遺傳算法,組成基因群體,如下圖所示:
4 實驗仿真
使用KDDCUP99中的數(shù)據(jù)集,此數(shù)據(jù)集中包含了常見的入侵行為方式,并且分為正常數(shù)據(jù)和異常數(shù)據(jù)。刪除重復、無效的數(shù)據(jù)后,本次實驗保留了13860條數(shù)據(jù)記錄,輸入遺傳神經(jīng)網(wǎng)絡(luò)模型進行學習和輸出。采用的步驟分為:輸入數(shù)據(jù)預處理、確定網(wǎng)絡(luò)結(jié)構(gòu)、訓練參數(shù)選取、識別入侵各種數(shù)據(jù)。經(jīng)過以上實驗步驟,得出下列表格結(jié)果:
表1? ?各算法模型訓練結(jié)果比較
[攻擊類型 傳統(tǒng)BP算法 遺傳算法 本文算法 DoS 0.8 0.77 0.61 PRO 0.9 0.84 0.77 U2R 0.56 0.52 0.49 R2L 0.22 0.21 0.18 混合攻擊 0.30 0.30 0.15 ]
由表1數(shù)據(jù)可知,本文采取的優(yōu)化遺傳算法建立的神經(jīng)網(wǎng)絡(luò)模型,在網(wǎng)絡(luò)綜合性能方面是表現(xiàn)最好的。將該模型引入入侵檢測系統(tǒng)中,可以提高檢測速度、降低誤報率,效果良好。
參考文獻:
[1] 劉春,馬穎.遺傳算法和神經(jīng)網(wǎng)絡(luò)結(jié)合的PSD非線性校正[J].電子測量與儀器學報,2015(8).
[2] 李偉,何鵬舉,楊恒,等.基于粗糙集和改進遺傳算法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的算法研究[J].西北工業(yè)大學學報. 2012(4).
[3] 蔡斌軍.基于GA+BP網(wǎng)絡(luò)速度辨識的直接轉(zhuǎn)矩控制[J].控制工程,2012(4).
[4] 張超群,鄭建國,錢潔.遺傳算法編碼方案比較[J].計算機應(yīng)用研究,2011(3).
[5] 彭基偉,呂文華,行鴻彥,等.基于改進GA-BP神經(jīng)網(wǎng)絡(luò)的濕度傳感器的溫度補償[J].儀器儀表學報,2013(1):
【通聯(lián)編輯:唐一東】