楊婉琳
(審計(jì)署計(jì)算機(jī)技術(shù)中心,北京 100073)
基于人們生活質(zhì)量不斷提高的趨勢,對計(jì)算機(jī)網(wǎng)絡(luò)的要求也在不斷提高,計(jì)算機(jī)網(wǎng)絡(luò)應(yīng)用能力的不斷增強(qiáng),滿足人們的實(shí)際需求。 在計(jì)算機(jī)科學(xué)領(lǐng)域,人工智能是未來發(fā)展的主要趨勢。 將人工智能引入計(jì)算機(jī)技術(shù)可以迅速實(shí)現(xiàn)計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)的質(zhì)的飛躍,使計(jì)算機(jī)運(yùn)行更加人工、高端等,從而最大限度地為用戶服務(wù)[1]。
信息技術(shù)的快速發(fā)展加快了人工智能的發(fā)展步伐,人工智能屬于計(jì)算機(jī)科學(xué)健康發(fā)展的產(chǎn)物。 其真實(shí)含義是希望掌握精髓,形成某種聰明的計(jì)劃可以模擬人類的思維模式,模仿人類的行為模式甚至高于人類并充分利用技術(shù)。 雖然尚未實(shí)現(xiàn)機(jī)器智能技術(shù),但人工智能可以模擬人類的思維計(jì)算作為一個較為合理的推測,需要在具體使用過程中不斷學(xué)習(xí),優(yōu)化自己的行為方式,有效處理有關(guān)問題[2]。
對于規(guī)則生成專家系統(tǒng),它在計(jì)算機(jī)網(wǎng)絡(luò)入侵系統(tǒng)中的重要性是不可低估的。 其原則通常使用計(jì)算機(jī)管理專家構(gòu)建相應(yīng)的數(shù)據(jù)庫管理經(jīng)驗(yàn),然后抓住指定數(shù)據(jù)庫的數(shù)據(jù)、并保持信息的計(jì)算機(jī)在計(jì)算機(jī)操作。人工智能的有效應(yīng)用不僅可以提高入侵檢測數(shù)據(jù)的可靠性,還可以有效維護(hù)計(jì)算機(jī)的正常運(yùn)行環(huán)境。
數(shù)據(jù)挖掘系統(tǒng)的原理通常與計(jì)算機(jī)程序的科學(xué)驗(yàn)證和數(shù)據(jù)的相關(guān)信息相結(jié),它可以對垃圾數(shù)據(jù)進(jìn)行科學(xué)判斷,利用數(shù)據(jù)挖掘系統(tǒng)有效攔截垃圾程序和軟件,促進(jìn)計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)運(yùn)行水平的全面提高。
數(shù)據(jù)融合在人工智能技術(shù)應(yīng)用于網(wǎng)絡(luò)計(jì)算技術(shù)中起著重要作用。 在信息深化和理解的基礎(chǔ)上,技術(shù)可以從數(shù)據(jù)中提取和合并信息獲得相應(yīng)的信息,提高系統(tǒng)傳感器的工作水平。 同時,還能正確處理入侵檢測系統(tǒng)的弱點(diǎn)以確保計(jì)算機(jī)程序和信息的可靠性和完整性。
人工智能Agent 技術(shù)的顯著功能是根據(jù)用戶的具體情況對信息進(jìn)行良好的處理,從而幫助用戶更有效地完成信息過濾,確保信息的可靠性和真實(shí)性。 根據(jù)相關(guān)實(shí)踐調(diào)查,這項(xiàng)技術(shù)在網(wǎng)上購物中得到了廣泛的認(rèn)可。
目前而言,人們進(jìn)入一個充滿了信息技術(shù)在大數(shù)據(jù)的時代,計(jì)算機(jī)所存儲的數(shù)據(jù)越來越多,實(shí)際使用過程中應(yīng)該利用電腦技術(shù)的優(yōu)化來提高數(shù)據(jù)處理的效率。 在處理信息時,需要完成數(shù)據(jù)收集,然后對收集到的數(shù)據(jù)進(jìn)行深入分析,在充分了解用戶具體需求的基礎(chǔ)上進(jìn)行過濾以獲得有用的信息。 在人工智能和網(wǎng)絡(luò)計(jì)算技術(shù)的應(yīng)用方面,需要建立相應(yīng)的專家知識數(shù)據(jù)庫,同時進(jìn)行分析和存儲以下兩點(diǎn):(1)專家知識的基本原則;(2)經(jīng)驗(yàn)的技術(shù)專家旨在充分保證信息管理水平,確保其正常運(yùn)行。
在粒子群優(yōu)化算法中,將最優(yōu)解視為算法中的一個粒子,對每個粒子進(jìn)行任意初始化,然后搜索解的范圍。 每個粒子對應(yīng)一個適應(yīng)度方程,其解是滿足問題條件的粒子的最優(yōu)值,問題條件通常由對象方程確定[3]。 當(dāng)粒子找到解時,比較適應(yīng)度函數(shù)。 如果新值比前一個值更適合目標(biāo)函數(shù),則新位置為粒子的臨時最優(yōu)解。 相反,單個最優(yōu)解保持不變。 一旦個體確定了最優(yōu)解,全局最優(yōu)解就最適合比較粒子本身的適應(yīng)度方程。 然后比較兩個適應(yīng)度方程的解,選擇最適合條件的一個。
假設(shè)粒子群優(yōu)化中存在粒子群m,且n為粒子優(yōu)化問題解的空間維數(shù),每個粒子改變單個粒子位置的規(guī)則包括:每個粒子在找到單個最優(yōu)位置時更新其位置。
在粒子群優(yōu)化中,通過對粒子群中粒子速度、位置的更換獲得新種群,進(jìn)一步提高種群多樣性、遍歷性。離子群優(yōu)化算法流程需經(jīng)過如圖1 所示的步驟完成。
圖1 粒子群PSO 優(yōu)化過程
圖1 顯示了 PSO 算法的近似過程,包括以下步驟[4]:
第一步:確定粒子的搜索頻率、位置和更新速度,并逐個初始化這些參數(shù);
第二步:逐個求解所有粒子的適應(yīng)度值;
第三步:分析粒子本身的最佳個體位置,如果后者更接近問題的最優(yōu)解,則用這個位置替換第一個位置;
第四步:根據(jù)前三步更新的數(shù)據(jù),再次確認(rèn)粒子群的最佳整體位置。 一旦個體確定了最優(yōu)解,全局最優(yōu)解就最適合比較粒子本身的適應(yīng)度方程。 然后比較兩個適應(yīng)度方程的解,選擇最適合條件的一個;
第五步:確定粒子的位置和速度;
第六步:如果不滿足終止條件,請返回步驟2。
輸出層屬于線性結(jié)構(gòu),可為神經(jīng)網(wǎng)絡(luò)輸入產(chǎn)生對應(yīng)的輸出。 隱含層能夠訓(xùn)練輸入層的樣本,并對不同數(shù)據(jù)進(jìn)行修訂,輸入層能夠識別從外面輸入的樣本來進(jìn)行訓(xùn)練[5]。 RBF 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖 2 所示。
圖2 RBF 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
RBF 神經(jīng)網(wǎng)絡(luò)擅長模仿學(xué)習(xí),而粒子群擅長進(jìn)行高效迅速地全局搜索,將二者有機(jī)結(jié)合,能夠大大提高算法的性能。 由于樣本數(shù)量不足,使用梯度法及線性最小二乘法時,RBF 神經(jīng)網(wǎng)絡(luò)的權(quán)值優(yōu)化能接近最強(qiáng)性能[6]。
假定1 臺服務(wù)器主機(jī)可能遭受的攻擊有以下幾個方面:CSRF 漏洞、CGI 漏洞、XSS 漏洞、應(yīng)用漏洞、SQL注入。 在權(quán)值優(yōu)化上,神經(jīng)網(wǎng)絡(luò)沒有求得一個適應(yīng)所有情況的最優(yōu)解,所以對其權(quán)值優(yōu)化進(jìn)行研究至關(guān)重要。 文章將RBF 神經(jīng)網(wǎng)絡(luò)權(quán)值進(jìn)行轉(zhuǎn)換,形成粒子群中粒子,在解空間中,讓粒子進(jìn)行全局最優(yōu)權(quán)值的尋找。 RBF 神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型如圖3 所示。
圖3 RBF 神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)模型
圖3 顯示了最優(yōu)解問題解的空間維度必須在五個維度中進(jìn)行優(yōu)化,通常有兩種編碼方法:一種是對向量進(jìn)行編碼,另一種是對矩陣進(jìn)行編碼。 第一個是將所有粒子一個一個地轉(zhuǎn)換成矢量。
利用基于粒子群優(yōu)化的神經(jīng)網(wǎng)絡(luò)RBF 來預(yù)測網(wǎng)絡(luò)的安全狀況。 在小樣本數(shù)據(jù)處理方面,粒子群優(yōu)化算法具有速度快、精度高的特點(diǎn)。 利用RBF 神經(jīng)網(wǎng)絡(luò)優(yōu)化粒子群的過程如圖4 所示。 優(yōu)化過程的具體步驟如下:
圖4 RBF 神經(jīng)網(wǎng)絡(luò)進(jìn)行粒子群優(yōu)化過程
第一步:對其重量進(jìn)行編碼,并對每個粒子進(jìn)行編碼;
第二步:確定粒子的搜索頻率、位置和更新速度,并逐個初始化這些參數(shù);
第三步:對RBF 神經(jīng)網(wǎng)絡(luò)的中心和半徑使用K -means 分組計(jì)算算法;
第四步:重新求解粒子群的適應(yīng)度值,更新相關(guān)數(shù)據(jù)參數(shù);
第五步:再次確認(rèn)不同粒子的位置和速度;
第六步:從以下兩個方面確定終止條件是否滿足:第一,確定全局最優(yōu)解是否在指定的誤差范圍內(nèi);第二,確定粒子群更新時間是否達(dá)到上限。 如果是,則完成整個優(yōu)化過程。 如果沒有,請返回步驟4 并繼續(xù)上述過程,直到符合要求。
在網(wǎng)絡(luò)安全態(tài)勢評估對象為6 臺服務(wù)器主機(jī)。 根據(jù)熵權(quán)理論風(fēng)險評估模型、多維云模型將其他5 臺服務(wù)器主機(jī)風(fēng)險值計(jì)算出來,分別為0.682 0,0.653 1,0.650 2,0.680 1,0.541 5。 因網(wǎng)絡(luò)系統(tǒng)主機(jī)全部為服務(wù)器主機(jī),服務(wù)器上架設(shè)不同網(wǎng)站具有同等重要作用。重要性權(quán)值均相等且6 個權(quán)值之和為1,每個服務(wù)器主機(jī)重要性權(quán)值等于1/6,進(jìn)行加權(quán)計(jì)算后風(fēng)險值為0.648 2,表明本系統(tǒng)網(wǎng)絡(luò)安全態(tài)勢屬于較高風(fēng)險。
在預(yù)測時,選用粒子群優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò)模型,利用其對訓(xùn)練樣本進(jìn)行處理,最終通過訓(xùn)練獲得有效預(yù)測模型。 預(yù)測模型的流程如圖5 所示。
圖5 網(wǎng)絡(luò)安全態(tài)勢預(yù)測流程
預(yù)測研究網(wǎng)絡(luò)安全方面的狀況可以兩方面入手:一是每次攻擊視為一個獨(dú)立事件并進(jìn)行單一的全面評估,同時價值進(jìn)行評估,評估不同強(qiáng)度的攻擊和相應(yīng)的不同時期的情況。 缺點(diǎn)是評價不同強(qiáng)度的攻擊通常受到評價者的主觀認(rèn)知;其次,確立一個時間序列的非線性模型是為了估算,認(rèn)真總結(jié)和分析歷史數(shù)據(jù)的內(nèi)部關(guān)系和共同的影響因素,以便估計(jì)網(wǎng)發(fā)展的未來方向。文章利用粒子群優(yōu)化(Particle Swarm Optimization,PSO)神經(jīng)網(wǎng)絡(luò)RBF 對國家網(wǎng)絡(luò)中心的大數(shù)據(jù)進(jìn)行預(yù)測和預(yù)處理。 選擇以下影響因素作為評估網(wǎng)絡(luò)安全狀況的規(guī)范指標(biāo):(1)新生人數(shù)在信息安全方面的脆弱性;(2)數(shù)家網(wǎng)站植入后門;(3)新的高危漏洞信息安全;(4)網(wǎng)絡(luò)病毒感染主機(jī)數(shù)量;(5)仿冒網(wǎng)站頁面數(shù)目;(6)數(shù)家網(wǎng)站在網(wǎng)絡(luò)篡改。 網(wǎng)絡(luò)安全狀況分為危險、壞、中、好、優(yōu)5 個級別。 6 個指標(biāo)的統(tǒng)計(jì)和數(shù)據(jù)分析以及5 個風(fēng)險級別的定量如表1 所示。
表1 安全等級表
通過文章方法對RBF 神經(jīng)網(wǎng)絡(luò)進(jìn)行優(yōu)化,從而高效迅速地預(yù)測網(wǎng)絡(luò)安全態(tài)勢。 通過對比RBF 神經(jīng)網(wǎng)絡(luò)優(yōu)化前后預(yù)測的數(shù)值與實(shí)際值的差異,表明粒子群優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò)具有準(zhǔn)確、快速的優(yōu)點(diǎn),具體如圖6 所示。
圖6 算法對應(yīng)的預(yù)測誤差
該方法預(yù)測網(wǎng)絡(luò)安全狀況的收斂速度比RBF 神經(jīng)網(wǎng)絡(luò)快。 預(yù)測結(jié)果的誤差圖曲線表明,當(dāng)進(jìn)化次數(shù)小于10 時,預(yù)測誤差迅速下降,然后在一個小誤差附近波動。 RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測誤差曲線表明,抽樣訓(xùn)練的預(yù)測誤差較大,這通常是由于練習(xí)或樣本數(shù)量不足造成的。 與RBF 神經(jīng)網(wǎng)絡(luò)相比,兩種方法預(yù)測誤差的波動較小。 由于網(wǎng)絡(luò)安全狀況數(shù)據(jù)具有復(fù)雜性、隨機(jī)性和模糊性3 個特點(diǎn),該方法可以更好地建立相應(yīng)的預(yù)測模型,并在較小程度上控制誤差波動。 即使樣本量不足,這種方法也能在全球范圍內(nèi)快速有效地鎖定最優(yōu)解。 采用這種權(quán)重優(yōu)化方法可以使神經(jīng)網(wǎng)絡(luò)的權(quán)重快速收斂,形成的網(wǎng)絡(luò)安全態(tài)勢預(yù)測模型更加有效。算法相應(yīng)的預(yù)測輸出如圖7 所示。
圖7 算法對應(yīng)的預(yù)測輸出
由圖7 可看出,在訓(xùn)練次數(shù)較少的情況下,文章算法的預(yù)測結(jié)果快速且與實(shí)際網(wǎng)絡(luò)安全態(tài)勢值接近,比RBF神經(jīng)網(wǎng)絡(luò)預(yù)測模型預(yù)測的網(wǎng)絡(luò)安全態(tài)勢更有效、更快速。表明文章算法預(yù)測結(jié)果更加擬合實(shí)際網(wǎng)絡(luò)態(tài)勢值。
基于人工智能的網(wǎng)絡(luò)運(yùn)維優(yōu)化算法利用優(yōu)化權(quán)重,神經(jīng)網(wǎng)絡(luò)的權(quán)重可以快速收斂,形成的網(wǎng)絡(luò)安全態(tài)勢預(yù)測模型更有效。 對比算法優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò)的預(yù)測結(jié)果蜂群微粒,實(shí)際價值網(wǎng)絡(luò)的狀況和RBF 神經(jīng)網(wǎng)絡(luò)的預(yù)測,結(jié)果表明優(yōu)化RBF 神經(jīng)網(wǎng)絡(luò)算法的粒子蜂群都快接近真實(shí)價值和網(wǎng)絡(luò)的安全局勢,這比RBF 神經(jīng)網(wǎng)絡(luò)預(yù)測模型預(yù)測的網(wǎng)絡(luò)安全情況更有效、更快。