張志宏,蘭 靜
(呂梁學院 計算機科學與技術系,山西 呂梁 033000)
云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘模型仿真
張志宏,蘭 靜
(呂梁學院 計算機科學與技術系,山西 呂梁 033000)
在云計算環(huán)境下,對高級持續(xù)威脅數(shù)據(jù)的準確挖掘可以提高云計算網(wǎng)絡的安全防御能力.高級持續(xù)威脅數(shù)據(jù)具有極值擾動非線性特征,傳統(tǒng)的線性處理方法難以實現(xiàn)對這類數(shù)據(jù)的準確挖掘.提出一種基于極值擾動非線性特征提取的云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘仿真模型,對系統(tǒng)載荷運行情況進行評估,得到云計算下的動態(tài)任務調(diào)配,分析高級持續(xù)威脅數(shù)據(jù)的極值擾動非線性特性,計算高級持續(xù)威脅數(shù)據(jù)的穩(wěn)態(tài)概率,得到極值擾動非線性特征,對非線性特征進行脈沖響應不變周期標記.實現(xiàn)了高級持續(xù)威脅數(shù)據(jù)極值擾動非線性特征的挖掘,構(gòu)建數(shù)據(jù)挖掘模型.仿真實驗表明,算法對持續(xù)威脅數(shù)據(jù)的正確檢測概率在95%以上,數(shù)據(jù)挖掘性能優(yōu)越,在云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)的檢測挖掘等領域應用價值較高,為網(wǎng)絡安全系統(tǒng)構(gòu)建等奠定基礎.
云計算;高級持續(xù)威脅數(shù)據(jù);數(shù)據(jù)挖掘;非線性特征;網(wǎng)絡安全
隨著網(wǎng)絡信息技術的發(fā)展和應用,云計算逐漸發(fā)展成現(xiàn)代網(wǎng)絡信息運算和處理的主要形式,云計算是近些年興起的一種計算概念,其基本思想是將網(wǎng)絡上閑置的、分布在其他地方的資源利用起來,如計算機硬件資源、軟件資源等,實現(xiàn)網(wǎng)絡信息資源的集中智能調(diào)度和信息處理.在云計算網(wǎng)絡環(huán)境中,“云”可以被看作是一個虛擬化的存儲與計算資源池,在這個計算資源池中,通過一定的數(shù)據(jù)挖掘算法,實現(xiàn)數(shù)據(jù)挖掘和智能數(shù)據(jù)管理調(diào)度,同時借助網(wǎng)絡平臺,為用戶提供的數(shù)據(jù)存儲和網(wǎng)絡計算服務.在云計算環(huán)境中,由于網(wǎng)絡Web數(shù)據(jù)的復雜性和多變性,給網(wǎng)絡攻擊者帶來了攻擊漏洞,導致了大量的高級持續(xù)威脅數(shù)據(jù)的入侵,對這類高級持續(xù)威脅數(shù)據(jù)的準確挖掘是保證云計算環(huán)境安全的重要因素,相關的算法研究和模型設計成為廣大專家研究的重點課題[1].
傳統(tǒng)算法中,對云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)的入侵檢測和數(shù)據(jù)挖掘算法主要采用的是線性信號處理的方法,其中,文獻[2]中,采用小波分解的方法,結(jié)合數(shù)據(jù)挖掘中盲解卷積算法,實現(xiàn)對高級持續(xù)威脅數(shù)據(jù)擾動自動分類,但算法沒有實現(xiàn)對高級持續(xù)威脅數(shù)據(jù)特征的自適應解卷積,挖掘效果不好,無法有效在云計算環(huán)境下實現(xiàn)高級持續(xù)威脅數(shù)據(jù)的自適應重寫.文獻[3]中提出一種基于語義相似度的高級持續(xù)威脅數(shù)據(jù)的線性自相關特征提取方法,對滿足松弛挖掘的Web異常數(shù)據(jù)進行自適應重寫挖掘,但算法采用基于統(tǒng)計分析的方法挖掘高級持續(xù)威脅數(shù)據(jù)的奇異特征,算法受經(jīng)驗約束較強,對攻擊威脅數(shù)據(jù)的特征挖掘效果不佳.文獻[4]提出采用粒子濾波的盲解卷積技術,從海量Web數(shù)據(jù)中恢復出奇異特征信號,實現(xiàn)在云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)的挖掘,但算法建立的粒子濾波器采用瞬時梯度下降法控制濾波加權(quán)系數(shù),無法徹底消除云計算網(wǎng)絡環(huán)境中的高級持續(xù)威脅數(shù)據(jù)盲解卷積效應,影響特征挖掘精度[5],并且存在計算量大,收斂性不好的問題.
事實上,在云計算環(huán)境中,高級持續(xù)威脅數(shù)據(jù)具有極值擾動非線性特征,傳統(tǒng)的線性處理方法難以實現(xiàn)對這類數(shù)據(jù)的準確挖掘.針對上述問題,筆者提出一種基于極值擾動非線性特征提取的云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘仿真模型,實現(xiàn)對挖掘算法的改進,提高對威脅數(shù)據(jù)的檢測和挖掘性能,仿真實驗驗證了算法的有效性.
1.1 云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)信號模型
本文研究云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘仿真模型,需要首先構(gòu)建信號模型.云計算環(huán)境中,云平臺多處理器根據(jù)網(wǎng)絡信號調(diào)度模型對每個任務的實時運算情況,進行數(shù)據(jù)信息管理和調(diào)度[6],采用進行云計算信息傳輸?shù)男盘枮椋?/p>
對系統(tǒng)載荷運行情況進行相應的評估,進行云計算下的動態(tài)任務調(diào)配,云平臺網(wǎng)絡中節(jié)點通過頻繁收集新的網(wǎng)絡拓撲信息,計算調(diào)度方案并傳送給每個節(jié)點,并按下式更新抽樣概率分布參數(shù):
其中,ni(1≤i≤L)為加性噪聲項,假設輸入云計算模型中的線性特征數(shù)據(jù)為單頻信號cos2πf0t.設計云網(wǎng)絡,在云計算節(jié)點則第m個中繼傳輸節(jié)點的接收數(shù)據(jù)可以表示為:
信號模型的左波束的輸出為:
其中
上式中,θ表示持續(xù)威脅數(shù)據(jù)的相位偏移,f0表示特征頻率,τm表示傳輸時延.得到在云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)的狀態(tài)空間固有模態(tài)函數(shù)為:
上式中,線性平穩(wěn)柯西主頻特征,為原始入侵信號,信號的特征時間尺度.由此得到了云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)信號模型,表達為:
根據(jù)上述信號模型構(gòu)建,計算2q階矩陣Q*QH的行列式的絕對值,得到進行相位特征挖掘的機器學習的迭代步數(shù)為f(θ)=‖Q(θ)QH(θ)‖.對于任意原始信號x(t),進行信號特征的時頻狀態(tài)轉(zhuǎn)移建模,得到高級持續(xù)威脅數(shù)據(jù)信號模型,為實現(xiàn)數(shù)據(jù)挖掘提供數(shù)據(jù)基礎[7-10].
1.2 高級持續(xù)威脅數(shù)據(jù)的極值擾動非線性特性
根據(jù)上述構(gòu)建的云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)信號模型,分析信號模型特征可見,對于任意原始信號x(t),高級持續(xù)威脅數(shù)據(jù)信號的頻譜特征包含兩部分組成,其任意數(shù)據(jù)項x如果滿足sup(x)>min-Support,其中minSupport為支持度閾值,那么可以對信號模型通過經(jīng)驗模態(tài)分解和Hilbert譜分析,分別描述為:
其中,vs表示具體網(wǎng)絡潛質(zhì)入侵行為下各狀態(tài)保持時間Xs與ωi的偏差,
在云計算環(huán)境下的網(wǎng)絡系統(tǒng)在遭受高級持續(xù)威脅數(shù)據(jù)攻擊下,網(wǎng)絡入侵模型在數(shù)學演化過程中入侵初始時間λ設定為a(t),由此,把復雜的高級持續(xù)威脅數(shù)據(jù)信號分解成IMF單頻信號組成,得到一個2M×2q階矩陣,此時信號具有極值擾動非線性特征,表示為:
為了實現(xiàn)對高級持續(xù)威脅數(shù)據(jù)的挖掘,在機器學習過程中,信號其傳遞給候選數(shù)據(jù)的閉頻繁項集Γi與Γj互質(zhì),其中1≤i≠j≤L,如果:N≤MΓ1Γ2LΓL,且M>4τ,在云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)的波達方向為θ1,θ2,…,θq,此時相位估計數(shù)據(jù)集S={n1},數(shù)據(jù)解向量(n1,ni)∈Si,綜上分析可見,把復雜的高級持續(xù)威脅數(shù)據(jù)信號分解成IMF單頻信號組成,實現(xiàn)對數(shù)據(jù)挖掘,高級持續(xù)威脅數(shù)據(jù)產(chǎn)生極值擾動非線性特性,這一特征示意圖如圖1所示.
圖1 高級持續(xù)威脅數(shù)據(jù)產(chǎn)生極值擾動非線性特性
分析圖1可見,在對云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘中,這種高級持續(xù)威脅數(shù)據(jù)具有極值擾動非線性特征,傳統(tǒng)的線性處理方法難以實現(xiàn)對這類數(shù)據(jù)的準確挖掘.提出一種基于極值擾動非線性特征提取的云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘仿真模型,并實現(xiàn)算法改進是很有必要的.
在上述云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)信號模型構(gòu)建的基礎上,提取極值擾動非線性特征,實現(xiàn)計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘仿真模型,算法實現(xiàn)的關鍵技術描述如下.
網(wǎng)絡系統(tǒng)在遭受高級持續(xù)威脅數(shù)據(jù)入侵狀態(tài)下,威脅數(shù)據(jù)被屏蔽的狀態(tài)節(jié)點個數(shù)越多時,得到威脅數(shù)據(jù)的極值擾動性越強,信號幅度為A,對輸入信號幅度調(diào)整系數(shù)為:
將ωk按照νk和ek的組成原則進行分解,則得到多項式相位信號特征分布為:
在云計算中,高級持續(xù)威脅數(shù)據(jù)的穩(wěn)態(tài)概率可以有下式計算得到:
其中,f表示信號的瞬時頻率,x*表示對原始信號取卷積,上式表示了網(wǎng)絡潛質(zhì)高級持續(xù)威脅數(shù)據(jù)的數(shù)學演化模型,在能量模型的時頻平面上,進行分布特性狀態(tài)模擬,通過上式構(gòu)建網(wǎng)絡潛質(zhì)入侵數(shù)學演化模型,可以得到云計算系統(tǒng)中遭受高級持續(xù)威脅數(shù)據(jù)的檢測系統(tǒng)的狀態(tài)轉(zhuǎn)移方程:
其中x(t)是信號平方可積函數(shù),ψ(t)是基波函數(shù).根據(jù)上述分析可知,云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)信號是時變非平穩(wěn)的,因此采用一個多項式來定義多項式相位情況下的瞬時頻率,令q為多項式的階數(shù),滿足的條件是:q≥p,通過高級持續(xù)威脅數(shù)據(jù)的數(shù)學演化變換可見,高級持續(xù)威脅數(shù)據(jù)信號兩個參數(shù)a和τ有關,式中a>0被稱為尺度因子,以此為基礎可以構(gòu)建高級持續(xù)威脅數(shù)據(jù)挖掘模型,采用粒子擾動方法進行極值擾動非線性特征的提取.使粒子群擺脫局部極值,增加了極值擾動算子,得到增強后的極值擾動算子為:
對高級持續(xù)威脅數(shù)據(jù)的極值擾動相位φ(t)進行均勻采樣,τ為時間采樣步長(相當于△t),bk是相位值差的權(quán)系數(shù)(b0=0),設計極值擾動的簡化脈沖響應不變算法,得到信號的非平穩(wěn)態(tài)瞬時頻率估計值,采用非線性信號特征分析算法,對云計算下的高級持續(xù)威脅數(shù)據(jù)進行非線性特征分析和本征波特參數(shù)特征分解,表達為:
上式中,vk=vk-d+1表示在色噪聲背景中的非線性信號特征,其中核函數(shù)取作多項式核時,得到極值擾動非線性特征,對非線性特征進行脈沖響應不變周期標記,得到數(shù)據(jù)挖掘的位置更新公式:
式中,t0和tg分別表示個體極值和全局極值進化停滯步數(shù);T0和Tg分別表示個體極值和全局極值需要擾動的停滯步數(shù)閾值.通過上述算法改進,有效實現(xiàn)了高級持續(xù)威脅數(shù)據(jù)具有極值擾動非線性特征的挖掘,提高對持續(xù)攻擊數(shù)據(jù)的檢測性能.
為了驗證本文算法在進行云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘的性能,基于Matlab平臺,進行仿真實驗.計算機仿真實驗平臺配置為:Intel Core i5處理器,主頻2.8 GHz;4 G內(nèi)存;Windows XP專業(yè)版32位SP2操作系統(tǒng),MATLAB 2013a版本.實驗的云平臺設計是建立在20臺PC機構(gòu)件基于Hadoop HDFS的云平臺計算環(huán)境中,構(gòu)成JDK1.6,a1Gbps交換網(wǎng),測試數(shù)據(jù)是來自互聯(lián)網(wǎng)采用CWT200G數(shù)據(jù)結(jié)合方式,采用隨機抽取的方法得到10萬余Web數(shù)據(jù),對這些數(shù)據(jù)中的高級持續(xù)威脅數(shù)據(jù)進行挖掘檢測,首先進行信號模型構(gòu)建,得到數(shù)據(jù)的原始信號波形如圖2所示.
以上述信號模型為基礎,進行信號檢測和數(shù)據(jù)挖掘?qū)嶒?,得到輸入的參考信號為兩個LFM信號,把持續(xù)威脅數(shù)據(jù)信號分解為LFM信號和正弦調(diào)頻信號,其中數(shù)據(jù)的樣本數(shù)為10 000,判決門限 ,恒虛警概率 ,根據(jù)本文設計的基于極值擾動非線性特征提取的云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘仿真模型,提取的極值擾動非線性特征如圖3所示.圖中,縱坐標表示歸一化幅度,為提取的威脅數(shù)據(jù)的幅值.
圖2 高級持續(xù)威脅數(shù)據(jù)的信號波形
圖3 極值擾動非線性特征提取結(jié)果
圖4 高級持續(xù)威脅數(shù)據(jù)挖掘性能對比
以提取的極值擾動非線性特征為測試樣本,得到高級持續(xù)威脅數(shù)據(jù)的挖掘結(jié)果如圖4所示,為對比性能采用文獻[3]中的線性特征挖掘算法進行對比,分析圖3和圖4結(jié)果可見,采用傳統(tǒng)方法,特征分布較散,無法有效挖掘準確的奇異特征,采用10 000次Monte-Carlo試驗對持續(xù)威脅數(shù)據(jù)進行檢測性能測分析,得到本文方法對持續(xù)威脅數(shù)據(jù)的正確檢測概率在95%以上,比傳統(tǒng)方法提高15.7%,展示了本文方法對高級持續(xù)威脅數(shù)據(jù)檢測的優(yōu)越性能.
在云計算環(huán)境中,由于網(wǎng)絡Web數(shù)據(jù)的復雜性和多變性,給網(wǎng)絡攻擊者帶來的攻擊漏洞,導致了大量的高級持續(xù)威脅數(shù)據(jù)的入侵,對這類高級持續(xù)威脅數(shù)據(jù)的準確挖掘是保證云計算環(huán)境安全的關鍵基礎.針對高級持續(xù)威脅數(shù)據(jù)具有極值擾動非線性特征,筆者提出一種基于極值擾動非線性特征提取的云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)挖掘仿真模型,通過研究得出,本文算法對持續(xù)威脅數(shù)據(jù)的正確檢測概率在95%以上,比傳統(tǒng)方法提高15.7%,挖掘性能優(yōu)越,算法在云計算環(huán)境下的高級持續(xù)威脅數(shù)據(jù)的檢測挖掘和網(wǎng)絡安全系統(tǒng)構(gòu)建等領域具有較好的應用價值.
[1]劉衍珩,付楓,朱建啟,等.基于活躍熵的DoS攻擊檢測模型[J].吉林大學學報(工學版),2011,41(4):1 059-1 063.
[2]江先亮,金光,楊建剛,等.面向自治域的DoS攻擊流抑制模型[J].通信學報,2013,34(9):132-141.
[3]王進,陽小龍,隆克平.基于大偏差統(tǒng)計模型的Http-FloodDDoS檢測機制及性能分析[J].軟件學報,2012,23(5):1 272-1 280.
[4]張永錚,肖軍,云曉春,等.DDoS攻擊檢測和控制[J].軟件學報,2012,23(8):2 258-2 072.
[5]夏秦,王志文,盧柯.入侵檢測系統(tǒng)利用信息熵檢測網(wǎng)絡攻擊的方法[J].西安交通大學學報,2013,47(2):14-19.
[6]周華,周海軍,馬建鋒.基于博弈論的入侵容忍系統(tǒng)安全性分析模型[J].電子與信息學報,2013,35(8):1 933-1 939.
[7]BIMAL K M,GHOLAM M A.Differential Epidemic Model of Virus and Worms in Computer Network[J].International Journal of Network Security,2012,14(3):149-155.
[8]ZHU Q Y,YANG X F,YANG L X,et al.Optimal Control of Computer Virus under a Delayed Model[J].Applied Mathematics and Computation,2012,218(23):11 613-11 619.
[9]張輝.自體集網(wǎng)絡入侵檢測中的高效尋優(yōu)算法仿真[J].計算機仿真,2013,30(8):297-300.
[10]饒雨泰,楊凡.網(wǎng)絡入侵攪動下的網(wǎng)絡失穩(wěn)控制方法研究[J].科技通報,2014,30(1):185-188.
(責任編輯 李健飛)
Mining Model Simulation of Advanced Persistent Threat Data in Cloud Computing Environment
ZHANG Zhi-hong,LAN Jing
(Department of Computer Science&Technology,Luliang College,Luliang,Shanxi 033000,China)
In the cloud computing environment,advanced persistent threat data accurate mining can improve security and defense capability of the cloud computing network.Advanced persistent threat data have nonlinear characteristics of disturbance linear extremum,and the traditional processing method is difficult to achieve accuracy for this class of data mining.An advanced persistent threat data mining simulation model is proposed based on extreme perturbation nonlinear feature extraction in cloud computing environment,and the system load operation is evaluated,so that the dynamic task allocation in cloud computing is obtained.Extreme value analysis of advanced persistent threat data characteristics of non linear disturbance is made,perturbed nonlinear characteristics are extracted,and the steady state probabilities of senior continued threat data are calculated,so that pulse response invariant cycle marker on the nonlinear characteristic is obtained,the advanced persistent threat data extreme value perturbation of the nonlinear characteristics is extracted,and the data mining model is constructed.Simulation results show that the algorithm for the continuing threat data has better correct detection probability of 95%above,and that data mining has superior performance.It has good application value in the cloud computing for advanced persistent threat data detection and mining,providing foundation for the network security system construction
cloud computing;advanced persistent threat data;data mining;nonlinear characteristic;network security
TP392
:A
:1673-1972(2014)06-0041-06
2014-07-26
張志宏(1981-),女,山西呂梁人,講師,主要從事數(shù)據(jù)挖掘研究.