摘 "要: 傳統(tǒng)的計(jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定性分析模型受制于大數(shù)據(jù)環(huán)境下的隨機(jī)性、突發(fā)性、有限性等弊端,分析結(jié)果偏差較大。提出基于模糊層次以及主元分析的大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)穩(wěn)定性測(cè)量模型,通過構(gòu)建符合大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)穩(wěn)定性評(píng)價(jià)指標(biāo)體系,采用主元分析法塑造大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)穩(wěn)定性檢測(cè)模型以及性能評(píng)估模型,以用戶行為為源數(shù)據(jù)模型,在用戶行為大數(shù)據(jù)環(huán)境下對(duì)網(wǎng)絡(luò)穩(wěn)定性進(jìn)行測(cè)量。實(shí)驗(yàn)以大型電子商務(wù)網(wǎng)絡(luò)為例進(jìn)行分析,測(cè)試網(wǎng)絡(luò)魯棒性結(jié)果顯示,該方法能夠較好地完成大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)魯棒性測(cè)試。
關(guān)鍵詞: 大數(shù)據(jù); 網(wǎng)絡(luò); 穩(wěn)定度; 主元分析
中圖分類號(hào): TP391.9 " " " " " " " " " " "文獻(xiàn)標(biāo)識(shí)碼: A " " " " " " " " " " " " " "文章編號(hào): 1004?373X(2015)06?0001?03
Research on network stability testing model under the environment of Big data communication
GONG Wei?zhi1, XU Jian?hong1, LIU Zeng?liang2
(1. School of Automation and Electrical Engineering, University of Science and Technology Beijing, Beijing 100083, China;
2. Teaching and Research Department of Information Command and fight, National Defense University PLA China, Beijing 100091, China)
Abstract: Traditional model for analyzing the stability of the computer network is subject to the big data communication under the environment of the randomness, sudden and finiteness, so the analysis deviation is bigger. The network stability measurement model based on fuzzy hierarchy and principal component analysis in large data environment is put forward. By building a network stability evaluation index system conforming to the big data environment, the principal component analysis method to establish network stability testing model and performance evaluation model under the environment of big data, which takes user behavior as the source data model, measures the network stability under the condition of big data in the user behavior. By taking large?scale e?commerce network as an example for experimental analysis, the network robustness was tested. The result indicates that the method can better accomplish robustness testing of the big data communication network.
Keywords: big data; network; stability; principal component analysis
0 "引 "言
隨著計(jì)算機(jī)技術(shù)的發(fā)展以及智能化程度的不斷增加,當(dāng)前計(jì)算機(jī)行業(yè)對(duì)網(wǎng)絡(luò)發(fā)展的貢獻(xiàn)作用逐漸增強(qiáng),相關(guān)行業(yè)的網(wǎng)絡(luò)化發(fā)展促進(jìn)了該地區(qū)經(jīng)濟(jì)的增長(zhǎng)。而不斷發(fā)生的網(wǎng)絡(luò)安全事件、入侵事件和不同網(wǎng)絡(luò)事故爆發(fā)的頻率明顯增加。這就對(duì)相應(yīng)的計(jì)算機(jī)網(wǎng)絡(luò)的穩(wěn)定性提出了更高的要求。在用戶行為大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò),需要具備快速通信能力、應(yīng)急反應(yīng)能力、對(duì)破壞的網(wǎng)絡(luò)進(jìn)行快速修復(fù)的能力。因?yàn)椋诖髷?shù)據(jù)的通信環(huán)境下,網(wǎng)絡(luò)突發(fā)事件往往具有不確定性,不同的數(shù)據(jù)流量對(duì)網(wǎng)絡(luò)的穩(wěn)定性要求也不同,因此需要準(zhǔn)確了解在用戶行為大數(shù)據(jù)環(huán)境下的通信網(wǎng)絡(luò)的穩(wěn)定性,確保計(jì)算機(jī)安全得到最大化的保護(hù)[1?2]。傳統(tǒng)的計(jì)算機(jī)網(wǎng)絡(luò)的穩(wěn)定性分析模型無法適應(yīng)大數(shù)據(jù)環(huán)境下入侵事件的隨機(jī)性、突發(fā)性、有限性等特征,對(duì)當(dāng)?shù)赜?jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定性測(cè)量結(jié)果偏差較大,具有一定的局限性[3?6]。
1 "大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)穩(wěn)定性評(píng)價(jià)體系
網(wǎng)絡(luò)穩(wěn)定性是指發(fā)生網(wǎng)絡(luò)入侵等突發(fā)性危機(jī)的過程中,計(jì)算機(jī)網(wǎng)絡(luò)抗干擾、抗毀性能力的大小。穩(wěn)定的計(jì)算機(jī)網(wǎng)絡(luò)能夠?yàn)榇笠?guī)模數(shù)據(jù)通信中的突發(fā)性事件提供幫助,確保時(shí)間效益最大化以及網(wǎng)絡(luò)損失最小化。對(duì)這種在用戶行為大數(shù)據(jù)環(huán)境下網(wǎng)絡(luò)穩(wěn)定性的評(píng)價(jià)需要從評(píng)價(jià)指標(biāo)、穩(wěn)定度等兩方面進(jìn)行分析。
1.1 "基于模糊層次的網(wǎng)絡(luò)評(píng)價(jià)指標(biāo)穩(wěn)定度計(jì)算
大數(shù)據(jù)通信下的網(wǎng)絡(luò)穩(wěn)定性評(píng)價(jià)指標(biāo)較多,一般采取相互直接關(guān)聯(lián)性較為有效。采用模糊層次分析方法得到不同指標(biāo)下的評(píng)價(jià)權(quán)重,采集的指標(biāo)中呈現(xiàn)了大數(shù)據(jù)通信下的網(wǎng)絡(luò)穩(wěn)定性分析層次性,同時(shí)大量檢測(cè)指標(biāo)又具有模糊性,可通過模糊層次分析法能夠得到不同指標(biāo)的權(quán)重:
[Y=WTX] " " " " " " " " " (1)
式中:[Y=y1,y2,…,yn]用于描述衡量在用戶行為大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)衡量指標(biāo)的權(quán)重集;[X=x1,x2,…,xn]表示專家對(duì)不同指標(biāo)的打分評(píng)價(jià)集,該集合可通過經(jīng)驗(yàn)得出;W用于描述模糊互補(bǔ)矩陣,且有[i=1nwi=1]。
之后,Y中不同數(shù)據(jù)量下,網(wǎng)絡(luò)穩(wěn)定度測(cè)試指標(biāo)的權(quán)重需要和達(dá)標(biāo)評(píng)估系數(shù)逐次相乘,求和獲取單個(gè)不同指標(biāo)的穩(wěn)定度:
[Ri=j=1nyjwj] " " " " " " "(2)
其中:[Ri]表示在用戶行為大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)單個(gè)指標(biāo)的穩(wěn)定度。
1.2 "網(wǎng)絡(luò)在多指標(biāo)下的關(guān)聯(lián)結(jié)構(gòu)分析
第1.1節(jié)敘述單個(gè)指標(biāo)下在用戶行為大數(shù)據(jù)環(huán)境下的網(wǎng)絡(luò)單個(gè)指標(biāo)的穩(wěn)定度計(jì)算過程。在多指標(biāo)大數(shù)據(jù)通信下的網(wǎng)絡(luò)穩(wěn)定性評(píng)價(jià)體系下,多指標(biāo)結(jié)構(gòu)評(píng)估是一個(gè)串聯(lián)同并聯(lián)融合的混合指標(biāo)評(píng)估過程,這種結(jié)構(gòu)的穩(wěn)定度用圖1所示。
lt;E:\a06\15年06期\Image\36T1.tifgt;
圖1 多指標(biāo)結(jié)構(gòu)下網(wǎng)絡(luò)穩(wěn)定度結(jié)構(gòu)圖
多指標(biāo)通信網(wǎng)絡(luò)通常由大數(shù)據(jù)通信子系統(tǒng)、數(shù)據(jù)協(xié)調(diào)通信系統(tǒng)以及漏洞修補(bǔ)子系統(tǒng)三個(gè)并聯(lián)系統(tǒng)以及一個(gè)串聯(lián)系統(tǒng)構(gòu)成,不同的子系統(tǒng)都包含多個(gè)評(píng)價(jià)指標(biāo),可得計(jì)算機(jī)網(wǎng)絡(luò)總體指標(biāo)的穩(wěn)定度的運(yùn)算公式為:
[R=j=131-i=1m(1-Ri)] " " (3)
通過上述分析的方法能夠?qū)υ谟脩粜袨榇髷?shù)據(jù)環(huán)境下的計(jì)算機(jī)網(wǎng)絡(luò)的穩(wěn)定性進(jìn)行計(jì)算,確保對(duì)其實(shí)時(shí)的穩(wěn)定程度有較好的了解。
1.3 "計(jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定性計(jì)算過程
為了分析該方法對(duì)于在用戶行為大數(shù)據(jù)環(huán)境下的計(jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定性分析的作用,應(yīng)構(gòu)建相應(yīng)的區(qū)域評(píng)估模型進(jìn)行測(cè)試。本文采用6個(gè)反映高風(fēng)險(xiǎn)大數(shù)據(jù)通信下網(wǎng)絡(luò)發(fā)展特征的主要指標(biāo),塑造計(jì)算機(jī)網(wǎng)絡(luò)性能評(píng)估指標(biāo)體系,指標(biāo)分別為:信道寬度[x1],緊急檢測(cè)[x2],安全檢測(cè)人員比例[x3],可承載的數(shù)據(jù)量[x4],信道可承載量[x5],調(diào)度能力[x6],這些指標(biāo)描述了大數(shù)據(jù)的通信環(huán)境中計(jì)算機(jī)網(wǎng)絡(luò)的評(píng)價(jià)指標(biāo),可通過主成分分析法進(jìn)行簡(jiǎn)化。
假設(shè)存在n個(gè)年度,假設(shè)n=10,p個(gè)評(píng)估指標(biāo),其中p=6。
(1) 塑造計(jì)算機(jī)網(wǎng)絡(luò)性能評(píng)估指標(biāo)體系的原始數(shù)據(jù)矩陣:
[X=X11X12...X1pX21X22...X2p? " " " "? " ? " "?Xn1Xn2...Xnp] " " " (4)
(2) 運(yùn)算相關(guān)系數(shù)矩陣:
[R=k11k12…k1pk21k22…k2p ? " " ? " ? " ?kp1kp2…kpp] " " "(5)
在式(5)中,[kij(i,j=1,2,…,p)]是原始變量[xi]以及[xj]的相關(guān)系數(shù),其運(yùn)算公式為:
[kij=k=1n(Xki-Xi)(Xkj-Xj)k=1n(Xki-Xi)2(Xkj-Xj)2] " (6)
如果對(duì)稱矩陣[rij=rji],則只運(yùn)算其上三角元素以及下三角元素即可。
(3)運(yùn)算特征值和特征向量,解特征方法[λ-R=0],獲取特征值[λi(i=1,2,…,p)]并確保其按照從大到小的順序進(jìn)行排列,則有[λ1≥λ2≥…≥λt≥0];再分別獲取對(duì)應(yīng)于特征值[λi]的特征向量[ei(i=1,2,…,p)]。
(4) 運(yùn)算主成分貢獻(xiàn)率[Zi]:[rik=1prki(i=1,2,…,p)];累計(jì)貢獻(xiàn)率[k=1γkk=2γi],通常設(shè)在累計(jì)貢獻(xiàn)率為85%~95%的特征值[λ1,λ2,…,λm]對(duì)應(yīng)為第一,第二,…,第[m(m≤p)]個(gè)主成分。
運(yùn)算主成分載荷為e,[ei=γkeki(i=1,2,…,p)。]
最后將不同主成分的方差貢獻(xiàn)率當(dāng)成權(quán)重,線性加權(quán)求和獲取綜合評(píng)價(jià)函數(shù):
[Zi=j=1meiyj] (7)
式中:[Zi]用于描述第i個(gè)數(shù)據(jù)流的計(jì)算機(jī)通信網(wǎng)絡(luò)的穩(wěn)定性,該值越高,表明第i個(gè)數(shù)據(jù)區(qū)域網(wǎng)絡(luò)穩(wěn)定性越強(qiáng),反之越弱。
2 "實(shí)驗(yàn)分析
實(shí)驗(yàn)采用具有高危險(xiǎn)性的云計(jì)算環(huán)境下的大數(shù)據(jù)通信網(wǎng)絡(luò)作為分析的對(duì)象,對(duì)本文模型控制下的計(jì)算機(jī)網(wǎng)絡(luò)的穩(wěn)定性能進(jìn)行評(píng)估,采用計(jì)算機(jī)仿真進(jìn)行數(shù)據(jù)處理。選取的指標(biāo)為第1節(jié)中的6個(gè)指標(biāo)。根據(jù)6個(gè)指標(biāo)計(jì)算公式計(jì)算的綜合得分能力,見表1。
表1 計(jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定能力的綜合得分
分析表1可得,從第一次實(shí)驗(yàn)開始,采用本文模型計(jì)算下的計(jì)算機(jī)網(wǎng)絡(luò)的穩(wěn)定性綜合得分呈現(xiàn)逐次遞增趨勢(shì),說明該區(qū)域的計(jì)算機(jī)網(wǎng)絡(luò)的通信能力逐漸增強(qiáng),這符合當(dāng)?shù)氐囊粋€(gè)網(wǎng)絡(luò)逐漸穩(wěn)定加強(qiáng)的基本情況,說明本文模型是有效的。
為了突出本文模型的優(yōu)勢(shì),選擇傳統(tǒng)的單指標(biāo)疊加的方法對(duì)以上數(shù)據(jù)中,在用戶行為大數(shù)據(jù)環(huán)境下的計(jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定性進(jìn)行測(cè)試,不同方法下獲取的網(wǎng)絡(luò)穩(wěn)定性能綜合分析值,并與真實(shí)數(shù)據(jù)進(jìn)行對(duì)比,統(tǒng)計(jì)誤差,如圖2所述。
分析圖2可得,從第一次2002年開始,本文模型計(jì)算出的結(jié)果誤差與傳統(tǒng)的單指標(biāo)疊加的方法相比較,誤差明顯較小。
lt;E:\a06\15年06期\Image\36T2.tifgt;
圖2 兩種模型下網(wǎng)絡(luò)穩(wěn)定性計(jì)算誤差
3 "結(jié) "語
本文提出基于模糊層次以及主元分析的計(jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定性測(cè)量模型,并應(yīng)用用戶行為大數(shù)據(jù)環(huán)境下的計(jì)算機(jī)網(wǎng)絡(luò)中。通過模糊層次方法構(gòu)建計(jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定性評(píng)價(jià)指標(biāo)體系,采用主元分析法塑造計(jì)算機(jī)穩(wěn)定分析模型以及性能評(píng)估模型,對(duì)云計(jì)算環(huán)境下的計(jì)算機(jī)網(wǎng)絡(luò)穩(wěn)定性進(jìn)行測(cè)量。實(shí)驗(yàn)以具體網(wǎng)絡(luò)為例進(jìn)行分析,對(duì)網(wǎng)絡(luò)的穩(wěn)定性能的時(shí)間序列數(shù)據(jù)進(jìn)行綜合分析和評(píng)估。
參考文獻(xiàn)
[1] 白曜銘,蔣建中,孫有銘,等.采用FFT方法的抗階數(shù)過估計(jì)信道盲辨識(shí)算法[J].信號(hào)處理,2014,30(1):65?71.
[2] BOUARFA L, DANKELMAN J. Workflow mining and outlier detection from clinical activity logs [J]. Journal of Biomedical Informatics, 2012, 45(6): 1185?1190.
[3] 張萌,張滬寅,葉剛.延遲時(shí)間和嵌入維數(shù)聯(lián)合優(yōu)化的網(wǎng)絡(luò)流量預(yù)測(cè)[J].計(jì)算機(jī)工程與應(yīng)用,2014,50(4):103?109.
[4] 徐曉斌,張光衛(wèi),孫其博,等.一種誤差可控傳輸均衡的 WSN 數(shù)據(jù)融合算法[J].電子學(xué)報(bào),2014,42(6):1205?1209.
[5] WANG J, LI M, CHEN J, et al. A fast hierarchical clustering algorithm for functional modules discovery in protein interaction networks [J]. IEEE/ACM Transactions on Computational Biology and Bioinformatics, 2011, 8(3): 607?620.
[6] NEPUSZ T, YU H, PACCANARO A. Detecting overlapping protein complexes in protein?protein interaction networks [J]. Nature Methods, 2012, 9(5): 471?475.