周金磊 王丹妮 劉翀 孟勐
(國(guó)網(wǎng)遼寧省電力有限公司信息通信分公司 遼寧省沈陽(yáng)市 110000)
數(shù)字化及信息化時(shí)代的到來,不僅加快了各大領(lǐng)域發(fā)展速度,還轉(zhuǎn)變了人們的生活方式,提高了人們的生活水平。但同時(shí)也帶來了很多數(shù)據(jù)安全問題,既影響了數(shù)據(jù)信息安全,又影響了個(gè)人信息及隱私安全,增加個(gè)人信息及隱私泄露、公司機(jī)密文件被盜等數(shù)據(jù)安全問題發(fā)生率,故必須保護(hù)數(shù)據(jù)安全。全流量場(chǎng)景下能夠構(gòu)建各種智能化數(shù)據(jù)系統(tǒng),實(shí)現(xiàn)智能化操作,但各種智能系統(tǒng)數(shù)據(jù)的集中存儲(chǔ),也增加很多的潛在的數(shù)據(jù)風(fēng)險(xiǎn),諸如病毒攻擊目標(biāo)集中、數(shù)據(jù)風(fēng)險(xiǎn)集中化等,降低了智能化數(shù)據(jù)系統(tǒng)的運(yùn)營(yíng)效率。故作為相關(guān)工作人員,不僅要重視全流量場(chǎng)景的數(shù)據(jù)安全,還需要根據(jù)實(shí)際不斷完善數(shù)據(jù)安全評(píng)估方法,以快速發(fā)現(xiàn)和解決安全問題。對(duì)此,筆者根據(jù)相關(guān)文獻(xiàn)對(duì)全流量場(chǎng)景的數(shù)據(jù)安全分析及評(píng)估方法進(jìn)行了詳細(xì)分析。
數(shù)據(jù)來源的安全性直接影響大數(shù)據(jù)處理的難以程度及系統(tǒng)安全,在采集數(shù)據(jù)前需要仔細(xì)甄別數(shù)據(jù)來源,以減少不安全數(shù)據(jù)進(jìn)入全流量場(chǎng)景,降低各種數(shù)據(jù)安全問題發(fā)生率[1]。例如很多不法分子會(huì)通過修改數(shù)據(jù)采集軟件、篡改數(shù)據(jù)、ID克隆攻擊等方法來偽造數(shù)據(jù),當(dāng)數(shù)據(jù)中的關(guān)鍵信息被篡改后,就會(huì)出現(xiàn)錯(cuò)誤信息傳遞、數(shù)據(jù)信息真實(shí)性下降等現(xiàn)象。
全流量場(chǎng)景的實(shí)現(xiàn)都離不開數(shù)據(jù)信息存儲(chǔ)系統(tǒng),數(shù)據(jù)信息儲(chǔ)存系統(tǒng)能夠及時(shí)處理、分析、管理和存儲(chǔ)各種重要的數(shù)據(jù)信息,從而保證全流量場(chǎng)景數(shù)據(jù)信息安全性、真實(shí)性及全面性。但很多存儲(chǔ)系統(tǒng)并成熟,驗(yàn)證和鑒權(quán)機(jī)制等也比較薄弱,導(dǎo)致安全性難以保障,容易遭受暴力破解等惡意攻擊。
很多全流量場(chǎng)景的實(shí)現(xiàn)都離不開數(shù)據(jù)信息存儲(chǔ)系統(tǒng),因?yàn)閿?shù)據(jù)信息儲(chǔ)存系統(tǒng)能夠及時(shí)處理、分析、管理和存儲(chǔ)各種重要的數(shù)據(jù)信息,從而保證全流量場(chǎng)景數(shù)據(jù)信息安全性、真實(shí)性及全面性。但很多存儲(chǔ)系統(tǒng)并成熟,安全性也有待完善,并且相應(yīng)的驗(yàn)證和鑒權(quán)機(jī)制等也比較薄弱,導(dǎo)致數(shù)據(jù)庫(kù)容易遭受暴力破解、來自內(nèi)部的攻擊,增加數(shù)據(jù)被竊取、篡改和泄露發(fā)生率。
全流量場(chǎng)景的數(shù)據(jù)系統(tǒng),在構(gòu)建過程中需要應(yīng)用到各種各樣的分布式計(jì)算方法,所以分布式計(jì)算方法的選用也關(guān)系到數(shù)據(jù)安全。例如M-Reduce40數(shù)據(jù)分布式計(jì)算框架雖然能夠處理大數(shù)據(jù)量問題,也被很多行業(yè)應(yīng)用于數(shù)據(jù)系統(tǒng)中,但這種分布式計(jì)算方法應(yīng)用過程中可能被黑客修改、偽造,導(dǎo)致云架構(gòu)被攻擊、云數(shù)據(jù)被篡改等問題發(fā)生[2]。
數(shù)據(jù)挖掘是大數(shù)據(jù)的核心技術(shù),通過數(shù)據(jù)挖掘能夠獲取很多關(guān)鍵信息,然后基于這些信息構(gòu)建大數(shù)據(jù)信息系統(tǒng),很多企業(yè)都會(huì)利用數(shù)據(jù)挖掘技術(shù)構(gòu)建企業(yè)數(shù)據(jù)信息管理系統(tǒng),以實(shí)現(xiàn)對(duì)各種企業(yè)數(shù)據(jù)信息的實(shí)時(shí)監(jiān)控、更新和管理。但數(shù)據(jù)挖掘技術(shù)在應(yīng)用過程中也會(huì)出現(xiàn)隱私泄露、機(jī)密文件被盜等安全問題,例如某零售商通過銷售記錄推斷出一名年輕女子已經(jīng)懷孕,所以不斷向該女子推送各種廣告信息,使該女子的生活隱私受到了影響。
不管是個(gè)人還是企業(yè)都存在一定的“數(shù)據(jù)資產(chǎn)”,是個(gè)人信息及企業(yè)信息最具有價(jià)值的數(shù)據(jù),所以數(shù)據(jù)資產(chǎn)成為了數(shù)據(jù)安全分析主要內(nèi)容。而數(shù)據(jù)資產(chǎn)編目則是分析數(shù)據(jù)資產(chǎn)的主要方法,包括數(shù)據(jù)資產(chǎn)發(fā)現(xiàn)、識(shí)別、分析及編目。
數(shù)據(jù)資產(chǎn)編目過程中需要應(yīng)用到數(shù)據(jù)庫(kù)掃描技術(shù)、服務(wù)器掃描技術(shù)、終端掃描技術(shù)、終端監(jiān)控技術(shù)、網(wǎng)絡(luò)監(jiān)控技術(shù)、數(shù)據(jù)庫(kù)訪問監(jiān)控技術(shù)等,可通過分析元數(shù)據(jù)信息、內(nèi)容及格式等來確定數(shù)據(jù)準(zhǔn)確性。
本研究選擇“STRIDE安全威脅模型”,該模型的應(yīng)用頻率較高,在系統(tǒng)安全設(shè)計(jì)、數(shù)據(jù)安全分析等領(lǐng)域都得到了應(yīng)用?!癝TRIDE安全威脅模型”與統(tǒng) 一建模語言(UML)業(yè)務(wù)系統(tǒng)建模的結(jié)合能夠構(gòu)建功能齊全、安全防御水平非常高的數(shù)據(jù)安全信息系統(tǒng),能夠有效抵御數(shù)據(jù)被假冒、篡改、否認(rèn)、泄露等安全威脅,提高了數(shù)據(jù)安全信息系統(tǒng)的可靠性、保密性、抗抵賴性等[3]。盡管如此,STRIDE在應(yīng)用過程中已然還存在一些不足,很難同時(shí)應(yīng)對(duì)多種安全威脅,而結(jié)合威脅樹的形式系統(tǒng),則能夠描述數(shù)據(jù)安全攻擊場(chǎng)景,從而實(shí)現(xiàn)對(duì)多種安全威脅的同時(shí)抵御。
以“存儲(chǔ)數(shù)據(jù)泄露”為例,“STRIDE安全威脅模型”與威脅樹技術(shù)的結(jié)合形成“STRIDE威脅樹”(見圖1),STRIDE威脅樹的每個(gè)樹都能夠成為威脅行為節(jié)點(diǎn),從而抵御不同節(jié)點(diǎn)上的安全威脅。任何一種通過威脅樹節(jié)點(diǎn)或者葉子進(jìn)行攻擊都會(huì)被“STRIDE威脅樹”系統(tǒng)分析,從而達(dá)到抵御安全威脅、降低數(shù)據(jù)泄漏發(fā)生率[4]?!癝TRIDE威脅樹”的應(yīng)用還有效降低了全流量場(chǎng)景的數(shù)據(jù)安全系統(tǒng)建模難度,提高數(shù)據(jù)安全問題分析效率。
風(fēng)險(xiǎn)分析及量化是分析數(shù)據(jù)安全的核心方法,數(shù)據(jù)風(fēng)險(xiǎn)分析包括數(shù)據(jù)重要性、數(shù)據(jù)脆弱性和威脅性等內(nèi)容,涉及到了數(shù)據(jù)使用、數(shù)據(jù)存儲(chǔ)及傳輸?shù)拳h(huán)節(jié)。威脅建模、數(shù)據(jù)安全信息系統(tǒng)都是在數(shù)據(jù)安全風(fēng)險(xiǎn)分析及量化的基的基礎(chǔ)上構(gòu)建。通過數(shù)據(jù)安全風(fēng)險(xiǎn)分析及量化能夠?qū)I(yè)務(wù)系統(tǒng)面臨的威脅進(jìn)行綜合判斷,并找出系統(tǒng)自身脆弱性,然后通過相關(guān)公式計(jì)算出數(shù)據(jù)安全風(fēng)險(xiǎn)R[5]。
評(píng)估原理在于利用網(wǎng)絡(luò)模塊對(duì)重要因子進(jìn)行加權(quán)處理、求解,以得出無線網(wǎng)絡(luò)中的安全威脅指數(shù),然后根據(jù)安全威脅指數(shù)對(duì)數(shù)據(jù)安全進(jìn)行態(tài)勢(shì)量化評(píng)估[6]。相關(guān)計(jì)算公式及評(píng)估原理如下:
創(chuàng)建網(wǎng)絡(luò)預(yù)測(cè)基本模型:
RTM={Mj>|Ti∈SM}
“Mj”——計(jì)算機(jī)主機(jī)數(shù)量;
“Ti”——威脅指數(shù);
“SM”——模塊數(shù)量。
根據(jù)以上模型計(jì)算固定網(wǎng)絡(luò)威脅函數(shù)值,計(jì)算公式[7]如下:
“k” ——網(wǎng)絡(luò)威脅類別總數(shù)量;
“Ci” ——網(wǎng)絡(luò)內(nèi)部威脅可能性。
威脅指數(shù)和基礎(chǔ)模塊權(quán)重函數(shù)計(jì)算公式:
“Vi”——網(wǎng)絡(luò)主機(jī)安全系數(shù);
“i”——主機(jī)模塊數(shù);
“m”——模塊權(quán)重系數(shù)。
重要權(quán)重函數(shù)計(jì)算公式:
歸一化處理主機(jī)地位后:
計(jì)算整體危險(xiǎn)指數(shù),完成網(wǎng)絡(luò)數(shù)據(jù)安全態(tài)勢(shì)量化評(píng)估,公式如下:
絕大多數(shù)數(shù)據(jù)都是通過網(wǎng)絡(luò)進(jìn)行傳輸,所以網(wǎng)絡(luò)安全狀態(tài)直接關(guān)系到數(shù)據(jù)安全,通過構(gòu)建網(wǎng)絡(luò)安全狀態(tài)轉(zhuǎn)變矩陣能夠評(píng)估數(shù)據(jù)安全。在網(wǎng)絡(luò)安全狀態(tài)轉(zhuǎn)變矩陣下數(shù)據(jù)傳輸安全狀態(tài)能夠顯現(xiàn)出來,當(dāng)受到威脅時(shí)就能夠及時(shí)顯現(xiàn)警報(bào)信息,以提示相關(guān)工作人員及時(shí)處理安全問題。本文基于上述數(shù)據(jù)安全態(tài)勢(shì)量化評(píng)估原理,結(jié)合隱馬爾可夫模型(HMM)構(gòu)建網(wǎng)絡(luò)安全狀態(tài)轉(zhuǎn)變矩陣。
HMM模型由五元組構(gòu)建成,簡(jiǎn)稱“S、V、P、Q和π”,設(shè)模型元件組為“λ”,那么λ= {S,V, P,Q,π},具體如下:
(1)元件S為網(wǎng)絡(luò)狀態(tài)集合空間,S={S1, S2, ..., SN},Si為單獨(dú)狀態(tài)數(shù)量集,SN為多狀態(tài)數(shù)量集,但發(fā)出安全警告時(shí),集合S={G,R,B,C}。
(2)元件V為網(wǎng)絡(luò)狀態(tài)觀測(cè)向量集合空間,V={v1, v2, ...,vM},vi 為單獨(dú)狀態(tài)下的向量集合,vM為不同狀態(tài)下的向量值數(shù)量。
(3)元件P為網(wǎng)絡(luò)狀態(tài)轉(zhuǎn)移矩陣,是一種安全狀態(tài)轉(zhuǎn)換到另一種狀態(tài)的可能性分布,P={ρij},ρij=P(qt+1=Sj|qt=Sj),1≤i,j≤N 。
(4)元件 Q為向量概率分布矩陣,Q={qi(νk)},qi(νk)=ρ(o=νk|qi=Si),1≤i≤N,1≤k≤M。
(5)元件π為初始狀態(tài)概率分布矩陣,π=πi,πi=ρ(qi=Si),1≤i≤ N。
獲取確準(zhǔn)的HMM模型五元組后,可根據(jù)不同元件的觀測(cè)向量求解無線網(wǎng)絡(luò)在T 時(shí)內(nèi)的Si網(wǎng)絡(luò)狀態(tài),然后在該基礎(chǔ)上推算出可能性λt(i),最后計(jì)算風(fēng)險(xiǎn)損失向量 C(i),總風(fēng)險(xiǎn)為:
根據(jù)已經(jīng)建立的網(wǎng)絡(luò)安全狀態(tài)轉(zhuǎn)變矩陣計(jì)算威脅度及傳播概率,然后模型化相關(guān)數(shù)據(jù),并對(duì)各網(wǎng)絡(luò)節(jié)點(diǎn)進(jìn)行處理,以評(píng)估出不同網(wǎng)絡(luò)節(jié)點(diǎn)的安全狀況,最后計(jì)算網(wǎng)絡(luò)節(jié)點(diǎn)權(quán)重值。具體評(píng)估及計(jì)算過程如下:
網(wǎng)絡(luò)狀態(tài)攻擊選取可能性:
Pn=w1×Vos+w2×Vsor+w3×Vvul
w1、w2、w3——不同網(wǎng)絡(luò)狀態(tài)下的權(quán)重向量;
Vos、Vsor、Vvul——不同時(shí)間網(wǎng)絡(luò)發(fā)生危險(xiǎn)的影響等級(jí)。
威脅傳播的可能性:
rij=Pn(i,d)×Pn(d,l)…Pn(k,j)
l(i,d),l(d,l),…,l(k,l)=lmin(i,l)
Pn——網(wǎng)絡(luò)攻擊選取可能性。
節(jié)點(diǎn)受到網(wǎng)絡(luò)攻擊的計(jì)算值:
根據(jù)以上計(jì)算結(jié)果可評(píng)估出可能存在的安全威脅指數(shù),然后相加處理指數(shù)取值,最后計(jì)算出某節(jié)點(diǎn)遭受到威脅時(shí)的網(wǎng)絡(luò)安全態(tài)勢(shì)。具體計(jì)算結(jié)果為:
安全態(tài)勢(shì)值:
Saj=ej×aj
網(wǎng)絡(luò)受到的攻擊類型:
T={t1,t2,…,tn}
攻擊對(duì)象的關(guān)鍵特征:
KEYI=(keyi,1,keyi,2,…,keyi,3)
被攻擊后發(fā)生網(wǎng)絡(luò)威脅節(jié)點(diǎn)的可能性:
Pn=w1×Vos+w2×VSOT+w3×VCON
Vos、VSOT、VCON——不同網(wǎng)絡(luò)信息關(guān)聯(lián)度。
網(wǎng)絡(luò)節(jié)點(diǎn)重要性權(quán)值:
“c”——安全性等級(jí);
“i”——數(shù)據(jù)完整性;
“a和W=(w1,w2,w3)”——威脅等級(jí)及影響權(quán)重。
可根據(jù)上文計(jì)算出來的最終權(quán)重值量化和評(píng)估威脅態(tài)勢(shì),假設(shè)網(wǎng)絡(luò)威脅程度分級(jí)為St,那么威脅程度分為α、β、γ三種,總威脅為n=α + β + γ。n種權(quán)重值的白化函數(shù)矩陣如下:
D=[di,j]
結(jié)合灰色分類計(jì)算方法計(jì)算指標(biāo)層中每個(gè)網(wǎng)絡(luò)威脅之間的矩陣:
“n”——威脅態(tài)勢(shì)指數(shù)
“λ”——威脅態(tài)勢(shì)指標(biāo)權(quán)重值。
內(nèi)部威脅最終權(quán)重值:
基于安全態(tài)勢(shì)評(píng)估結(jié)果計(jì)算數(shù)據(jù)安全風(fēng)險(xiǎn),具體計(jì)算如下:
Value=R(A,T,V)
“R”——安全危險(xiǎn)計(jì)算函數(shù);
“A” 數(shù)據(jù)總資產(chǎn);
“T”——可能存在的威脅指數(shù);
“V”——網(wǎng)絡(luò)被攻擊的脆弱性。
本文結(jié)合國(guó)際安全風(fēng)險(xiǎn)計(jì)算方法及網(wǎng)絡(luò)警告信息特征計(jì)算出數(shù)據(jù)安全風(fēng)險(xiǎn),即:
R = W×G
“W”——安全風(fēng)險(xiǎn)影響因子;
“G”——安全風(fēng)險(xiǎn)權(quán)重參數(shù)。
在使用網(wǎng)絡(luò)傳輸數(shù)據(jù)信息時(shí)總會(huì)受到各種威脅,導(dǎo)致各種安全問題發(fā)生,增加數(shù)據(jù)信息泄漏、數(shù)據(jù)被篡改、數(shù)據(jù)造假等不良現(xiàn)象發(fā)生率,既影響數(shù)據(jù)信息系統(tǒng)正常運(yùn)行,有威脅到數(shù)據(jù)信息系統(tǒng)用戶的隱私安全、財(cái)產(chǎn)安全及人身安全,所以越來越多相關(guān)技術(shù)人員都提高了對(duì)數(shù)據(jù)安全評(píng)估及預(yù)防的重視度。因此,上文基于全流量場(chǎng)景,從網(wǎng)絡(luò)安全狀態(tài)轉(zhuǎn)變矩陣構(gòu)建、計(jì)算網(wǎng)絡(luò)節(jié)點(diǎn)權(quán)重值、基于最終權(quán)重值的威脅態(tài)勢(shì)量化評(píng)估和安全風(fēng)險(xiǎn)計(jì)算四大方面分析了數(shù)據(jù)安全評(píng)估方法。