張宇 賀長宇
摘要:分析了網(wǎng)絡(luò)靶場內(nèi)涵及對(duì)網(wǎng)絡(luò)靶場進(jìn)行評(píng)價(jià)面臨的問題和解決思路,按照自底向上、分層集成的原則構(gòu)建了一套完整的、客觀的、科學(xué)合理的網(wǎng)絡(luò)靶場評(píng)價(jià)指標(biāo)體系,設(shè)計(jì)了一種多級(jí)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),并采用遺傳算法優(yōu)化神經(jīng)網(wǎng)絡(luò)權(quán)值閾值,避免了由一個(gè)大型神經(jīng)網(wǎng)絡(luò)計(jì)算帶來的計(jì)算維度高、易陷入局部極小值、精細(xì)度差等問題。實(shí)驗(yàn)結(jié)果驗(yàn)證該方法的可行性,對(duì)未來網(wǎng)絡(luò)靶場的建設(shè)具有重要的指導(dǎo)意義。
關(guān)鍵詞:網(wǎng)絡(luò)靶場;指標(biāo)體系;神經(jīng)網(wǎng)絡(luò);多級(jí);綜合評(píng)價(jià)
中圖分類號(hào):TP391.4 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2018)19-0043-03
網(wǎng)絡(luò)靶場[1]是為了應(yīng)對(duì)日益嚴(yán)峻的網(wǎng)絡(luò)空間安全問題,應(yīng)對(duì)軍事領(lǐng)域革命性的變化,適應(yīng)網(wǎng)絡(luò)化、信息化武器裝備發(fā)展要求而設(shè)計(jì)和建設(shè)的網(wǎng)絡(luò)安全試驗(yàn)驗(yàn)證和測試評(píng)估環(huán)境。網(wǎng)絡(luò)靶場可以為各種網(wǎng)絡(luò)技術(shù)、攻防手段和裝備系統(tǒng)提供網(wǎng)絡(luò)安全方面的定量和定性評(píng)估,支撐開展網(wǎng)絡(luò)空間攻防對(duì)抗演練。建設(shè)網(wǎng)絡(luò)靶場已成為提升我國網(wǎng)絡(luò)空間攻防能力的重要戰(zhàn)略舉措,是將我國建設(shè)強(qiáng)大信息系統(tǒng)國度的安全保障。網(wǎng)絡(luò)靶場是一個(gè)集各種高新技術(shù)于一身的大型、復(fù)雜、異構(gòu)、動(dòng)態(tài)的特殊信息系統(tǒng),如何構(gòu)建一個(gè)覆蓋全面、可度量的網(wǎng)絡(luò)靶場評(píng)價(jià)指標(biāo)體系,如何客觀地、有效地對(duì)網(wǎng)絡(luò)靶場進(jìn)行評(píng)價(jià),是在建設(shè)網(wǎng)絡(luò)靶場過程中遇到的一個(gè)重要問題。
網(wǎng)絡(luò)靶場的評(píng)價(jià)指標(biāo)涉及諸多方面,為了能對(duì)網(wǎng)絡(luò)靶場進(jìn)行客觀、全面、有效地評(píng)價(jià),必須要設(shè)計(jì)一套相對(duì)完備的、系統(tǒng)化的指標(biāo)體系,采用科學(xué)合理的計(jì)算方法對(duì)網(wǎng)絡(luò)靶場進(jìn)行評(píng)價(jià)。當(dāng)前,國內(nèi)外設(shè)計(jì)并建設(shè)了多個(gè)網(wǎng)絡(luò)靶場,由于建設(shè)目標(biāo)不同,致使這些靶場規(guī)模不一,功能性能迥異,發(fā)揮的作用相差極大,缺乏對(duì)這些網(wǎng)絡(luò)靶場整體情況進(jìn)行全面、客觀評(píng)價(jià)的指標(biāo)體系和評(píng)價(jià)技術(shù),難以對(duì)網(wǎng)絡(luò)靶場的真實(shí)情況進(jìn)行綜合評(píng)價(jià),難以為用戶的選擇和比較提供參考依據(jù)。通過對(duì)該領(lǐng)域的指標(biāo)體系構(gòu)建和評(píng)價(jià)技術(shù)研究,有助于提升我們對(duì)網(wǎng)絡(luò)靶場的全面、深層次認(rèn)識(shí),從而指導(dǎo)靶場的設(shè)計(jì)和建設(shè)。
目前,網(wǎng)絡(luò)靶場的研究主要集中在如何建設(shè),在網(wǎng)絡(luò)靶場的評(píng)價(jià)指標(biāo)體系構(gòu)建方面,由于認(rèn)識(shí)不夠深入,普遍缺失對(duì)指標(biāo)體系的細(xì)致研究。在評(píng)價(jià)方法方面,對(duì)復(fù)雜信息系統(tǒng)的評(píng)價(jià)方法主要有主成分分析法、層次分析法、綜合評(píng)分分析法、德爾菲法、人工智能分析法等,這些方法在不同程度上均有一定的缺陷,如BP神經(jīng)網(wǎng)絡(luò)存在BP算法在學(xué)習(xí)過程中收斂速度緩慢、訓(xùn)練過程中容易陷入局部極小、具有不穩(wěn)定性等缺陷[2]。
本文針對(duì)當(dāng)前亟須測評(píng)網(wǎng)絡(luò)靶場的建設(shè)水平、指導(dǎo)靶場建設(shè)等迫切需求,從網(wǎng)絡(luò)靶場的定位出發(fā),按照自底向上、分層集成的原則,深入探索靶場的內(nèi)涵和作用,構(gòu)建一個(gè)網(wǎng)絡(luò)靶場評(píng)價(jià)指標(biāo)體系,并結(jié)合網(wǎng)絡(luò)靶場核心能力及自身特點(diǎn),設(shè)計(jì)了一種具有多級(jí)BP神經(jīng)網(wǎng)絡(luò)的網(wǎng)絡(luò)靶場評(píng)價(jià)的方法,采用遺傳算法實(shí)現(xiàn)對(duì)神經(jīng)網(wǎng)絡(luò)初始參數(shù)的優(yōu)化。本方法充分有效地利用了各類指標(biāo)信息,可避免采用一個(gè)大型BP神經(jīng)網(wǎng)絡(luò)所帶來的特征數(shù)量多、計(jì)算維度高、易陷入局部極小值、精細(xì)度差等缺陷,從而可全面、客觀、有效地評(píng)價(jià)網(wǎng)絡(luò)靶場的綜合情況,指導(dǎo)網(wǎng)絡(luò)靶場的設(shè)計(jì)與建設(shè)。
1 關(guān)鍵技術(shù)
1.1 網(wǎng)絡(luò)靶場評(píng)價(jià)指標(biāo)體系設(shè)計(jì)
網(wǎng)絡(luò)靶場指標(biāo)體系是對(duì)網(wǎng)絡(luò)靶場評(píng)價(jià)的前提和基礎(chǔ)。由于網(wǎng)絡(luò)靶場是一種創(chuàng)新的基礎(chǔ)設(shè)施,其內(nèi)部具有高度復(fù)雜性、非線性、不確定性等特點(diǎn),因此,對(duì)網(wǎng)絡(luò)靶場的優(yōu)劣需要多角度、多層次考慮[3]。隨著網(wǎng)絡(luò)安全技術(shù)的不斷發(fā)展,評(píng)價(jià)指標(biāo)也應(yīng)該具有可擴(kuò)展性和適應(yīng)性。
網(wǎng)絡(luò)靶場指標(biāo)體系的構(gòu)建主要是從網(wǎng)絡(luò)靶場的定位出發(fā),按照自底向上、分層集成的原則,深入探索靶場的內(nèi)涵和作用,梳理靶場應(yīng)具備的核心能力,分析得出細(xì)粒度、多層次的網(wǎng)絡(luò)靶場評(píng)價(jià)指標(biāo)體系,具體包括40個(gè)二級(jí)指標(biāo)、10個(gè)一級(jí)指標(biāo)。
網(wǎng)絡(luò)靶場評(píng)價(jià)指標(biāo)體系如圖1所示,采用指標(biāo)比選、耦合分析等方法,構(gòu)建了網(wǎng)絡(luò)靶場評(píng)價(jià)三層指標(biāo)體系。其中,底層是網(wǎng)絡(luò)靶場的二級(jí)指標(biāo),二級(jí)指標(biāo)由網(wǎng)絡(luò)靶場的基本功能和性能指標(biāo)組成,包括復(fù)現(xiàn)種類、復(fù)現(xiàn)規(guī)模、數(shù)據(jù)分析速度、數(shù)據(jù)采集種類、用戶管理能力、攻防過程回放等共40個(gè),這些指標(biāo)充分描述了網(wǎng)絡(luò)靶場的各個(gè)方面的;二級(jí)指標(biāo)向上是一級(jí)指標(biāo),由相關(guān)的二級(jí)指標(biāo)綜合計(jì)算得出,包括基礎(chǔ)能力、復(fù)現(xiàn)能力、數(shù)據(jù)采集分析能力、資源調(diào)度能力、攻防與測試能力、擴(kuò)展能力、安全保密能力、經(jīng)濟(jì)運(yùn)行能力、評(píng)估能力10個(gè)方面,這10個(gè)方面的指標(biāo)分別從不同刻面進(jìn)行描述和抽象,目的是為了更好地反映網(wǎng)絡(luò)靶場這樣一個(gè)復(fù)雜的信息基礎(chǔ)設(shè)施;最上層是網(wǎng)絡(luò)靶場的綜合評(píng)價(jià),由一級(jí)指標(biāo)按照相應(yīng)算法計(jì)算。
1.2 神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)模型
1.2.1 BP神經(jīng)網(wǎng)絡(luò)
BP神經(jīng)網(wǎng)絡(luò)也稱誤差反向傳播神經(jīng)網(wǎng)絡(luò),是由非線性變換單元組成的前饋型網(wǎng)絡(luò)[4]。其采用基于梯度的最速下降法,以誤差平方為目標(biāo)函數(shù)進(jìn)行全局搜索,因而具有較強(qiáng)的非線性映射能力、高度自學(xué)習(xí)自適應(yīng)能力和較強(qiáng)非泛化能力。由于其結(jié)構(gòu)簡單、可塑性強(qiáng),得到了非常廣泛的應(yīng)用,是目前發(fā)展最為成熟的網(wǎng)絡(luò)模型。本文采用的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)是具有一個(gè)隱含層的多輸入單輸出的三層BP神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)。
1.2.2 多級(jí)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)
采用多級(jí)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來評(píng)價(jià)網(wǎng)絡(luò)靶場的綜合能力主要有三方面原因:一是采用單一BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),則BP神經(jīng)網(wǎng)絡(luò)的輸入特征數(shù)量大,特征空間將是一個(gè)高維空間,需要大量的訓(xùn)練樣本進(jìn)行訓(xùn)練,增加訓(xùn)練難度;二是BP神經(jīng)網(wǎng)絡(luò)特征空間維數(shù)高將造成訓(xùn)練樣本構(gòu)造困難,專家很難綜合考慮大量特征(即性能指標(biāo))來給出一個(gè)系統(tǒng)評(píng)價(jià)值,從而造成訓(xùn)練樣本質(zhì)量難以保證;三是采用單一BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)將使網(wǎng)絡(luò)靶場評(píng)價(jià)系統(tǒng)完全變成一個(gè)黑盒,無法得出各級(jí)能力的具體情況,無法對(duì)網(wǎng)絡(luò)靶場進(jìn)行精細(xì)分析。
經(jīng)上分析,本文構(gòu)建了多個(gè)二級(jí)三層BP神經(jīng)網(wǎng)絡(luò)的計(jì)算結(jié)構(gòu),如圖2所示。其中,每個(gè)神經(jīng)網(wǎng)絡(luò)具有輸入層、隱含層和輸出層,第一級(jí)由10個(gè)獨(dú)立的BP神經(jīng)網(wǎng)絡(luò)組成,這樣就可以大大加快網(wǎng)絡(luò)的學(xué)習(xí)速度;第二級(jí)采用一個(gè)10輸入1輸出的BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。一級(jí)神經(jīng)網(wǎng)絡(luò)的輸出作為二級(jí)神經(jīng)網(wǎng)絡(luò)的輸入,最終實(shí)現(xiàn)對(duì)網(wǎng)絡(luò)靶場的綜合評(píng)價(jià)。
第一級(jí)BP神經(jīng)網(wǎng)絡(luò)主要實(shí)現(xiàn)對(duì)每個(gè)一級(jí)指標(biāo)的初步評(píng)價(jià)計(jì)算,依據(jù)指標(biāo)體系中二級(jí)指標(biāo)和一級(jí)指標(biāo)的對(duì)應(yīng)關(guān)系,建立起兩者的非線性關(guān)系,并且在這一級(jí)神經(jīng)網(wǎng)絡(luò)中,將二級(jí)指標(biāo)的異?;驘o效的輸入樣本進(jìn)行初步判斷,在進(jìn)行神經(jīng)網(wǎng)絡(luò)訓(xùn)練初期,可對(duì)異?;驘o效樣本根據(jù)剔除或降低該異?;驘o效樣本對(duì)后面的影響,為第二級(jí)BP神經(jīng)網(wǎng)絡(luò)提供可靠數(shù)據(jù)。
第二級(jí)BP神經(jīng)網(wǎng)絡(luò)是以第一級(jí)BP神經(jīng)網(wǎng)絡(luò)輸出的有效數(shù)值作為網(wǎng)絡(luò)輸入,學(xué)習(xí)算法與第一級(jí)相同,神經(jīng)網(wǎng)絡(luò)的輸出為目標(biāo)網(wǎng)絡(luò)靶場的綜合評(píng)價(jià)等級(jí)。
為進(jìn)一步提高模型的準(zhǔn)確度,需要對(duì)神經(jīng)網(wǎng)絡(luò)模型的參數(shù)進(jìn)行優(yōu)化:神經(jīng)網(wǎng)絡(luò)隱層神經(jīng)元數(shù)采用公式[s=m+n+a]確定(其中,S表示隱含層數(shù)目,m表示輸入層神經(jīng)元數(shù),n表示輸出層神經(jīng)元數(shù),a表示范圍在1-10之間的常數(shù));激勵(lì)函數(shù)選取Sigmoid函數(shù),函數(shù)參數(shù)取0.9;學(xué)習(xí)速率[η]采用一種動(dòng)態(tài)調(diào)整的方法,初步設(shè)為0.1,隨著學(xué)習(xí)過程逐步減少;學(xué)習(xí)精度[e]取0.025。為了使網(wǎng)絡(luò)快速收斂到全局最小,本文在常規(guī)BP算法權(quán)值修公式中加入動(dòng)量項(xiàng)[αΔωji(n-1)],即其中[α]是根據(jù)理論輸出與實(shí)際輸出的均方差[E]的不同而確定:[α=0.8(E≥1)];[α=0.4(E>0.5)];[α=0.1(E≤0.5)]。鑒于遺傳算法具有宏觀尋優(yōu)等特點(diǎn),本文利用遺傳算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)的連接權(quán)值和閾值。
1.2.3 算法具體實(shí)現(xiàn)
在確定了多級(jí)BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)后,首先通過遺傳算法對(duì)其進(jìn)行優(yōu)化,使連接權(quán)值接近全局最優(yōu),然后通過BP改進(jìn)算法進(jìn)行學(xué)習(xí)訓(xùn)練,獲得網(wǎng)絡(luò)的最佳權(quán)值等參數(shù),并應(yīng)用于網(wǎng)絡(luò)靶場的評(píng)價(jià)。算法流程如圖3所示。
算法流程主要分為兩個(gè)部分:
1) 執(zhí)行遺傳算法優(yōu)化權(quán)值閾值過程
①隨機(jī)初始化一組神經(jīng)網(wǎng)絡(luò)的連接權(quán)值閾值,并將其以實(shí)數(shù)的形式進(jìn)行編碼。
②輸入訓(xùn)練樣本,對(duì)神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練得到期望輸出與實(shí)際輸出之間的誤差平方和倒數(shù)作為適應(yīng)度函數(shù),并計(jì)算適應(yīng)度。并通過適應(yīng)度的大小來評(píng)價(jià)權(quán)值的優(yōu)劣,然后對(duì)適應(yīng)度大的權(quán)值進(jìn)行遺傳運(yùn)算,對(duì)當(dāng)前群體進(jìn)行進(jìn)化,產(chǎn)生一下代群體。
③不斷的重復(fù)第②步,通過反復(fù)的訓(xùn)練和遺傳操作使網(wǎng)絡(luò)的權(quán)值閾值不斷的優(yōu)化,直至最終達(dá)到滿意的結(jié)果為止。
2) 執(zhí)行BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程
①輸入訓(xùn)練樣本,我們將其對(duì)應(yīng)的歸一化指標(biāo)數(shù)據(jù)作為第一級(jí)BP神經(jīng)網(wǎng)絡(luò)模型的輸入,分別對(duì)應(yīng)于人工神經(jīng)網(wǎng)絡(luò)的輸入節(jié)點(diǎn),而該輸入樣本對(duì)應(yīng)的專家評(píng)價(jià)結(jié)果作為系統(tǒng)的期望輸出。
②正向傳播,記錄此次正向傳播的誤差[E(0)]。
③反向傳播,調(diào)整BP神經(jīng)網(wǎng)絡(luò)中各層(輸入層、隱含層、輸出層)之間的連接權(quán)值,對(duì)誤差對(duì)權(quán)重的梯度小于預(yù)設(shè)梯度最小值[ε],即[?E?wi<ε],則跳轉(zhuǎn)到步驟⑤。如果梯度大于預(yù)設(shè)梯度最小值[ε],[?E?wi>ε],則轉(zhuǎn)到步驟④。
④調(diào)整連接權(quán)值。采用最速梯度下降法,反向調(diào)整連接權(quán)值及閾值,正向傳播計(jì)算誤差[E(1)],比較[E(0)]與[E(1)],若網(wǎng)絡(luò)的誤差減小,增大學(xué)習(xí)率;若網(wǎng)絡(luò)的誤差增大,則降低學(xué)習(xí)率,重現(xiàn)反向計(jì)算調(diào)整連接值,正向傳播計(jì)算[E(1)],直到誤差不再減少。
⑤用新連接權(quán)值繼續(xù)正向傳播,更新誤差值[E(1)]。若誤差小于預(yù)置精度[e],則完成學(xué)習(xí)并停止傳播,進(jìn)入步驟⑥。若誤差大于預(yù)置精度[e],令[i=i+1],當(dāng)[i ⑥完成BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí),記錄最終各層間連接權(quán)值閾值。 第一級(jí)BP神經(jīng)網(wǎng)絡(luò)按照上述步驟訓(xùn)練結(jié)束后,將其連接權(quán)值閾值保存,再以一級(jí)指標(biāo)參數(shù)為輸入,進(jìn)入第二級(jí)BP神經(jīng)網(wǎng)絡(luò)模型,按照同樣的方式進(jìn)行學(xué)習(xí),訓(xùn)練結(jié)束后保存第二級(jí)神經(jīng)網(wǎng)絡(luò)各層間連接權(quán)值閾值。訓(xùn)練好的多級(jí)神經(jīng)網(wǎng)絡(luò)模型可用于對(duì)待評(píng)價(jià)的網(wǎng)絡(luò)靶場進(jìn)行實(shí)時(shí)評(píng)價(jià)。 2 結(jié)果分析 為減少專家提供訓(xùn)練樣本的主觀性,保證訓(xùn)練質(zhì)量,根據(jù)所設(shè)計(jì)的指標(biāo)體系,采用多位專家同時(shí)提供學(xué)習(xí)樣本的方法,形成一個(gè)較為完整的知識(shí)庫,以此作為BP神經(jīng)網(wǎng)絡(luò)模型的學(xué)習(xí)樣本,并按照本文提出的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和算法進(jìn)行學(xué)習(xí)。選用知識(shí)庫中的1000個(gè)樣本,1-980個(gè)樣本作為學(xué)習(xí)樣本, 980-1000樣本為測試數(shù)據(jù)。測試結(jié)果如圖4所示。 結(jié)果表明,采用本文提出的多級(jí)BP神經(jīng)網(wǎng)絡(luò)對(duì)網(wǎng)絡(luò)靶場評(píng)價(jià)與測試數(shù)據(jù)具有較高的擬合度,且收斂速度明顯,具有一定的實(shí)用價(jià)值。 3 結(jié)論 本文在構(gòu)建的網(wǎng)絡(luò)靶場評(píng)價(jià)指標(biāo)體系全面、客觀,能夠充分體現(xiàn)出網(wǎng)絡(luò)靶場的綜合能力,彌補(bǔ)了此部分研究的空白。在此基礎(chǔ)上,本文提出了一種基于多層神經(jīng)網(wǎng)絡(luò)算法的網(wǎng)絡(luò)靶場評(píng)價(jià)方法,在計(jì)算結(jié)構(gòu)上做了調(diào)整,將由一個(gè)BP神經(jīng)網(wǎng)絡(luò)計(jì)算分解成多個(gè)多級(jí)神經(jīng)網(wǎng)絡(luò)并行計(jì)算,避免了由一個(gè)大型神經(jīng)網(wǎng)絡(luò)計(jì)算帶來的訓(xùn)練難度大、耗時(shí)、無法做出精細(xì)分析等難題,使得網(wǎng)絡(luò)靶場評(píng)價(jià)模型的準(zhǔn)確性和實(shí)用性得以提高。然而,網(wǎng)絡(luò)靶場的綜合評(píng)價(jià)與很多因素有關(guān),隨著信息技術(shù)的發(fā)展和網(wǎng)絡(luò)攻防技術(shù)的演進(jìn),如何梳理出網(wǎng)絡(luò)靶場內(nèi)在因素之間的復(fù)雜關(guān)聯(lián)關(guān)系,以及與網(wǎng)絡(luò)靶場的應(yīng)用價(jià)值的關(guān)系還需要進(jìn)一步研究。 參考文獻(xiàn): [1] 方濱興,賈焰,李愛平,等.網(wǎng)絡(luò)空間靶場技術(shù)研究[J].信息安全學(xué)報(bào),2016,1(3):1-9. [2] 曹云忠,王超.多神經(jīng)網(wǎng)絡(luò)在高維數(shù)據(jù)分類中的應(yīng)用研究[J].計(jì)算機(jī)應(yīng)用與軟件,2007,24(7):146-149. [3] 史軍濤,周銘,張振坤.基于BP神經(jīng)網(wǎng)絡(luò)的戰(zhàn)場網(wǎng)絡(luò)攻擊效能評(píng)估[J].空軍雷達(dá)學(xué)院學(xué)報(bào),2012,26(2):127-129. [4] 吳川.基于神經(jīng)網(wǎng)絡(luò)的目標(biāo)識(shí)別及定位方法的研究[D].中國科學(xué)院長春光學(xué)精密機(jī)械與物理研究所,2005.