顧兆軍,辛 倩+
(1.中國(guó)民航大學(xué) 信息安全測(cè)評(píng)中心,天津 300300;2.中國(guó)民航大學(xué) 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,天津 300300)
信息系統(tǒng)安全評(píng)估方法主要分為定性評(píng)估、定量評(píng)估和綜合評(píng)估。由于信息系統(tǒng)的安全因素難以量化,大多數(shù)學(xué)者采用層次分析法、熵權(quán)法、模糊理論、故障樹等[1-4]定性與定量相結(jié)合的綜合評(píng)估方法建立信息系統(tǒng)安全評(píng)估模型,但計(jì)算復(fù)雜、評(píng)估結(jié)果受主觀因素影響較大,且無法解決非線性問題。為避免這些缺陷,國(guó)內(nèi)外學(xué)者采用DS證據(jù)理論、支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)、貝葉斯網(wǎng)絡(luò)等[5-7]人工智能算法構(gòu)建信息系統(tǒng)安全評(píng)估模型,取得了較好的評(píng)估結(jié)果。de Gusm?o A P H等[8]將事件樹與模糊理論相結(jié)合,但在確定事件發(fā)生時(shí)沒有統(tǒng)一的方法,導(dǎo)致不同方法設(shè)置事件發(fā)生的概率不同;趙剛等[9]使用熵權(quán)法計(jì)算指標(biāo)權(quán)重,使模糊合成中的權(quán)重更加客觀,但是當(dāng)信息系統(tǒng)有較多互相關(guān)聯(lián)的安全因素時(shí),缺乏學(xué)習(xí)和自適應(yīng)能力;馬麗儀等[10]采用模糊神經(jīng)網(wǎng)絡(luò)評(píng)估信息系統(tǒng)的安全風(fēng)險(xiǎn),將風(fēng)險(xiǎn)因子進(jìn)行模糊化后輸入到神經(jīng)網(wǎng)絡(luò)訓(xùn)練,提高了神經(jīng)網(wǎng)絡(luò)對(duì)模糊性的識(shí)別能力,但隸屬度矩陣和權(quán)重均采用專家評(píng)判,客觀性較差,在一定程度上影響整個(gè)模型的實(shí)用性;趙保華[11]采用層次分析法賦予指標(biāo)權(quán)重,但由于信息系統(tǒng)安全指標(biāo)較多,導(dǎo)致計(jì)算量大,且容易出現(xiàn)殘缺判斷矩陣。
為了進(jìn)一步提高評(píng)估的準(zhǔn)確性,針對(duì)當(dāng)前信息系統(tǒng)安全影響因素較多、且各因素之間相互關(guān)聯(lián)等特點(diǎn),本文提出了熵權(quán)法優(yōu)化BP神經(jīng)網(wǎng)絡(luò)(back-propagation neural network)的信息系統(tǒng)安全評(píng)估模型(熵權(quán)-BP),并通過具體實(shí)例對(duì)熵權(quán)-BP信息系統(tǒng)安全評(píng)估模型的性能進(jìn)行檢驗(yàn)。
信息系統(tǒng)安全評(píng)估是非常復(fù)雜的過程,影響信息系統(tǒng)安全的因素很多,各因素之間又相互關(guān)聯(lián),使得安全因素與信息系統(tǒng)安全評(píng)估結(jié)果之間呈現(xiàn)出一種復(fù)雜的非線性關(guān)系。信息系統(tǒng)安全評(píng)估模型可以表示為
Y=f(x1,x2,…,xn)
(1)
式中:Y是信息系統(tǒng)安全評(píng)估結(jié)果,xi表示信息系統(tǒng)的安全影響因素,f()為非線性函數(shù),所以信息系統(tǒng)安全評(píng)估結(jié)果的準(zhǔn)確性與安全因素的選取以及非線性函數(shù)f()直接相關(guān)。本文根據(jù)等保測(cè)評(píng)要求構(gòu)建評(píng)估指標(biāo)體系,選擇熵權(quán)法對(duì)評(píng)估指標(biāo)進(jìn)行重構(gòu),并采用具有高度非線性映射能力的BP神經(jīng)網(wǎng)絡(luò)建立信息系統(tǒng)安全評(píng)估模型,熵權(quán)-BP安全評(píng)估流程如圖1所示。
圖1 熵權(quán)-BP安全評(píng)估流程
評(píng)估信息系統(tǒng)的安全狀況首先是構(gòu)建評(píng)估指標(biāo),即安全影響因素。安全影響因素的選取是否科學(xué)合理,直接影響評(píng)估結(jié)果的真實(shí)性。本文根據(jù)《信息安全技術(shù) 信息系統(tǒng)安全等級(jí)保護(hù)測(cè)評(píng)要求》[12],從技術(shù)和管理兩大層面構(gòu)建了層次結(jié)構(gòu)的信息系統(tǒng)安全評(píng)估指標(biāo)體系,如圖2所示。其中技術(shù)層面包括物理安全、網(wǎng)絡(luò)安全和運(yùn)行安全,管理層面包括制度、機(jī)構(gòu)、人員、建設(shè)和運(yùn)維安全管理。
圖2 信息系統(tǒng)安全評(píng)估指標(biāo)體系
由于影響信息系統(tǒng)安全的因素眾多,必然存在對(duì)評(píng)估結(jié)果無影響的因素,為避免無用信息對(duì)BP神經(jīng)絡(luò)學(xué)習(xí)過程的干擾,應(yīng)提取重要指標(biāo)作為BP神經(jīng)網(wǎng)絡(luò)的輸入向量。在對(duì)信息系統(tǒng)安全評(píng)估時(shí),通常用權(quán)重來表示指標(biāo)的重要性。熵權(quán)法屬于客觀賦權(quán)法,通過實(shí)際數(shù)據(jù)利用嚴(yán)謹(jǐn)?shù)臄?shù)學(xué)理論得到較為客觀的指標(biāo)權(quán)重,避免了主觀方法確定權(quán)重的嚴(yán)重缺陷,使指標(biāo)權(quán)重更具有科學(xué)性和說服力。
信息論中的熵值反映了信息的無序化程度,可用來度量數(shù)據(jù)所提供信息量的大小。當(dāng)某項(xiàng)指標(biāo)在不同系統(tǒng)的變異度越大時(shí),熵值越小,說明該指標(biāo)傳遞的有效信息量就越大,在綜合評(píng)估中起的作用就越大,則該指標(biāo)的權(quán)重也應(yīng)該越大;反之某項(xiàng)指標(biāo)的變異度越小,該指標(biāo)的權(quán)重也應(yīng)越小。因此,本文利用同一評(píng)估指標(biāo)在不同信息系統(tǒng)的變異度,通過信息熵計(jì)算得到各指標(biāo)的權(quán)重。
2.2.1 構(gòu)建評(píng)估指標(biāo)矩陣
利用已完成安全測(cè)評(píng)的m個(gè)信息系統(tǒng)與其n個(gè)評(píng)估指標(biāo)形成評(píng)估指標(biāo)矩陣R=(rij)nm
(2)
式中:rij(i=1,2,…,n;j=1,2,…,m) 為第j個(gè)信息系統(tǒng)的第i個(gè)指標(biāo)的實(shí)際評(píng)估結(jié)果。
2.2.2 指標(biāo)權(quán)重計(jì)算
(1)根據(jù)指標(biāo)矩陣R,計(jì)算第i個(gè)指標(biāo)下第j個(gè)信息系統(tǒng)的指標(biāo)值的比重pij
(3)
(2)計(jì)算第i個(gè)指標(biāo)的熵權(quán)ei
(4)
(3)用lnm對(duì)各指標(biāo)的熵權(quán)進(jìn)行歸一化處理
(5)
(4)引入差異系數(shù)1-ei來正向度量指標(biāo)i的熵權(quán),得到指標(biāo)i的權(quán)重
(6)
BP神經(jīng)網(wǎng)絡(luò)即誤差反向傳播神經(jīng)網(wǎng)絡(luò),具有較強(qiáng)的自學(xué)習(xí)和自適應(yīng)能力,目前被廣泛用在綜合評(píng)估領(lǐng)域。由于信息系統(tǒng)安全因素較多,且因素之間相互關(guān)聯(lián),為了避免BP神經(jīng)網(wǎng)絡(luò)在學(xué)習(xí)過程中陷入過擬合,采用熵權(quán)法得到評(píng)估指標(biāo)權(quán)重,提取出重要指標(biāo)并將其輸入到BP神經(jīng)網(wǎng)絡(luò)中,從而提高評(píng)估指標(biāo)的質(zhì)量,消除無用指標(biāo)對(duì)BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)內(nèi)部知識(shí)的干擾。熵權(quán)-BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 熵權(quán)-BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
圖中u表示指標(biāo)體系的所有評(píng)估指標(biāo),x表示重要評(píng)估指標(biāo),y表示隱含層神經(jīng)元的輸出,z表示輸出層神經(jīng)元的網(wǎng)絡(luò)輸出值。wij和wj分別為傳遞層到隱含層與隱含層到輸出層之間的連接權(quán)值。l、n和m分別比為輸入層、傳遞層和隱含層神經(jīng)元的個(gè)數(shù)。
參照上圖,熵權(quán)-BP神經(jīng)網(wǎng)絡(luò)建模過程:
步驟1 第1層為輸入層,其神經(jīng)元的個(gè)數(shù)為評(píng)估指標(biāo)體系中的19個(gè)指標(biāo);
步驟2 第2層為指標(biāo)提取層,通過構(gòu)造指標(biāo)矩陣?yán)眯畔㈧赜?jì)算第1層各指標(biāo)的權(quán)重,并提取出重要指標(biāo);
步驟3 第3層為傳遞層,將第2層選取出重要指標(biāo)傳遞到BP神經(jīng)網(wǎng)絡(luò)中;
步驟4 第4層為隱含層,主要處理評(píng)估指標(biāo)到評(píng)估結(jié)果間的非線性映射,隱含層神經(jīng)元個(gè)數(shù)的選取是BP神經(jīng)網(wǎng)絡(luò)建模成功的關(guān)鍵,借助經(jīng)驗(yàn)公式
(7)
式中:n表示傳遞層神經(jīng)元個(gè)數(shù),β∈[1,10]的常數(shù)。
步驟5 第5層是輸出層,根據(jù)實(shí)際需要只設(shè)定一個(gè)神經(jīng)元,代表信息系統(tǒng)安全評(píng)估結(jié)果。
此時(shí),熵權(quán)-BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的構(gòu)建已完成,接下里就是第3層到第4層之間與第4層到第5層之間權(quán)值的學(xué)習(xí)過程。
BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)過程:
(1)隨機(jī)初始化BP神經(jīng)網(wǎng)絡(luò)所有的權(quán)值和閾值;
(2)BP神經(jīng)網(wǎng)絡(luò)正向傳遞信號(hào),傳遞層到隱含層神經(jīng)元樣本p的計(jì)算公式
(8)
隱含層到輸出層神經(jīng)元樣本p的計(jì)算公式
(9)
神經(jīng)元作用函數(shù)為
(10)
式中:θj表示隱含層神經(jīng)元j(j=1,2,…,m) 的閾值,θ表示輸出層神經(jīng)元的閾值;
(3)使用α-η聯(lián)合算法反向修正權(quán)值和閾值;
傳遞層到隱含層以及隱含層到輸出層之間的連接權(quán)值修正
(11)
隱含層和輸出層的閾值修正
(12)
其中,δ和δj為誤差項(xiàng),輸出層和隱含層神經(jīng)元誤差項(xiàng)
(13)
式中:f′表示對(duì)f求導(dǎo),η∈(0,1)為學(xué)習(xí)速率,加快網(wǎng)絡(luò)的收斂速度;α∈(0,1)為動(dòng)量因子,避免BP網(wǎng)絡(luò)陷入局部最優(yōu)。
(4)h組樣本擬合誤差函數(shù)為
ΔE=E(t+1)-E(t)
(14)
(15)
ΔE<ε
(16)
其中,ε為誤差精度,滿足(0≤ε<1),當(dāng)網(wǎng)絡(luò)誤差達(dá)到誤差要求或者達(dá)到學(xué)習(xí)的最大次數(shù)T(t≤T),BP網(wǎng)絡(luò)學(xué)習(xí)過程結(jié)束,否則轉(zhuǎn)向步驟(2),繼續(xù)學(xué)習(xí)直到滿足條件為止。
本文收集民航已完成安全測(cè)評(píng)的30個(gè)信息系統(tǒng)作為樣本數(shù)據(jù)。由于評(píng)估指標(biāo)單位不同,對(duì)評(píng)估指標(biāo)用最大最小法歸一化處理
(17)
式中:ui為第i個(gè)評(píng)估指標(biāo)的值,uimin和uimax分別為ui的最小值和最大值。
信息系統(tǒng)安全評(píng)估指標(biāo)歸一化后得到新數(shù)據(jù),見表1。選擇前22個(gè)作為熵權(quán)-BP模型的訓(xùn)練樣本,其余作為測(cè)試樣本,用于檢驗(yàn)熵權(quán)-BP模型的安全評(píng)估效果。
表1 信息系統(tǒng)安全評(píng)估數(shù)據(jù)
(1)使用已完成安全測(cè)評(píng)的30組指標(biāo)數(shù)據(jù)形成一個(gè)指標(biāo)矩陣R,即
(2)通過2.2.2節(jié)的計(jì)算步驟,得出各指標(biāo)的權(quán)重
W=(0.17,0.008,0.006,0.24,0.02,0.03,0.03,0.039,0.04,0.1,0.17,0.09,0.01,0.01,0.02,0.035,0.05,0.08,0.06)
對(duì)評(píng)估指標(biāo)權(quán)重進(jìn)行排序,經(jīng)驗(yàn)證改變權(quán)重小于0.05指標(biāo)的取值對(duì)整個(gè)評(píng)估結(jié)果沒有影響,可以作為數(shù)據(jù)噪聲將其剔除,剩下8個(gè)重要指標(biāo)
W′=(0.24,0.17,0.17,0.1,0.09,0.08,0.06,0.05)
8個(gè)重要指標(biāo)分別為網(wǎng)絡(luò)設(shè)備安全、物理設(shè)備安全、應(yīng)用軟件安全、終端設(shè)備安全、數(shù)據(jù)庫(kù)安全、人員安全管理、運(yùn)維安全管理和建設(shè)安全管理。
將重要指標(biāo)輸入到BP模型中進(jìn)行訓(xùn)練,BP神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)率η為0.5,動(dòng)量因子α為0.85,最大學(xué)習(xí)次數(shù)T為6000,預(yù)設(shè)誤差ε為0.001,根據(jù)經(jīng)驗(yàn)公式得到隱含層神經(jīng)元個(gè)數(shù)為6個(gè)。為了對(duì)比,同時(shí)對(duì)熵權(quán)-BP模型和BP模型兩個(gè)模型進(jìn)行訓(xùn)練,其訓(xùn)練過程如圖4所示。
圖4 BP神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程
由圖4可知,在相同學(xué)習(xí)目標(biāo)下,以重要指標(biāo)數(shù)據(jù)為輸入的BP模型的訓(xùn)練次數(shù)明顯比以原始指標(biāo)數(shù)據(jù)為輸入的BP神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練次數(shù)少。
訓(xùn)練結(jié)果表明,熵權(quán)-BP模型通過對(duì)重構(gòu)后的8個(gè)重要評(píng)估指標(biāo)數(shù)據(jù)進(jìn)行訓(xùn)練,既保留了重要指標(biāo)的特征,又減少了無用指標(biāo)對(duì)BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)的干擾,可以提高BP神經(jīng)網(wǎng)絡(luò)的訓(xùn)練速度。
為了檢驗(yàn)熵權(quán)-BP模型的評(píng)估結(jié)果,將測(cè)試樣本分別輸入到BPNN、AHP-BP和熵權(quán)-BP模型中進(jìn)行安全評(píng)估。評(píng)估結(jié)果和評(píng)估精度分析結(jié)果分別如圖5和表2所示。
圖5 各模型的網(wǎng)絡(luò)輸出值和期望值之間的對(duì)比
模型評(píng)估精度/%BPNN86.72AHP-BP91.39熵權(quán)-BP96.41
從圖5與表2可知,組合的熵權(quán)-BP和AHP-BP模型的評(píng)估精度高于單一BPNN模型的評(píng)估精度,因?yàn)檫@兩種組合模型都對(duì)評(píng)估指標(biāo)進(jìn)行了重構(gòu),提取出重要指標(biāo),使得BP神經(jīng)網(wǎng)絡(luò)在反向傳播過程中更加逼近真實(shí)權(quán)值;熵權(quán)-BP模型的評(píng)估精度高于AHP-BP模型的評(píng)估精度,因?yàn)殪貦?quán)-BP模型通過樣本數(shù)據(jù)計(jì)算得到指標(biāo)的權(quán)重更加客觀、真實(shí)地反映評(píng)估指標(biāo)的權(quán)重,而AHP-BP模型通過專家構(gòu)造判斷矩陣計(jì)算指標(biāo)權(quán)重,指標(biāo)的權(quán)重受主觀因素影響較大,可能會(huì)錯(cuò)誤刪除重要指標(biāo)。總之,熵權(quán)-BP模型優(yōu)于其它兩種模型,利用其進(jìn)行信息系統(tǒng)安全評(píng)估是可行的。
信息系統(tǒng)的安全狀況受眾多因素影響、且因素之間相互關(guān)聯(lián)。BP神經(jīng)網(wǎng)絡(luò)模型訓(xùn)練速度慢且容易出現(xiàn)過擬合現(xiàn)象,為了提高評(píng)估結(jié)果的精度,本文構(gòu)建了熵權(quán)神經(jīng)網(wǎng)絡(luò)的信息系統(tǒng)安全評(píng)估模型。采用熵權(quán)法提取出重要指標(biāo)作為BP模型的輸入,消除無用指標(biāo)的干擾,提高模型的訓(xùn)練速度,同時(shí)具有高度非線性處理能力的BP神經(jīng)網(wǎng)絡(luò)能有效解決各因素之間的關(guān)聯(lián)性,彌補(bǔ)傳統(tǒng)數(shù)學(xué)評(píng)估方法無法處理非線性關(guān)系的不足。但安全指標(biāo)體系的構(gòu)建還存在缺點(diǎn),本文只是從等保測(cè)評(píng)要求中選取了具有代表性的幾大類安全影響因素,而每類因素還包括許多具體的因子,不同安全等級(jí)的信息系統(tǒng)每個(gè)安全因素的具體因子會(huì)有些許不同。后續(xù)需要結(jié)合實(shí)際情況對(duì)各類因素進(jìn)行細(xì)分,使評(píng)估結(jié)果能夠?yàn)橄到y(tǒng)管理員提供更有效的參考依據(jù)。