陳小娟,張慧萍,賀紅艷
(湖北工業(yè)大學(xué)工程技術(shù)學(xué)院,湖北武漢 430068)
通信網(wǎng)絡(luò)鏈路指的是網(wǎng)絡(luò)中各節(jié)點(diǎn)間的物理通道,通常情況下,數(shù)據(jù)中心通信網(wǎng)具有一定的隨機(jī)性。隨著網(wǎng)絡(luò)入侵形式的多樣化和入侵方式的不斷擴(kuò)展,會(huì)導(dǎo)致網(wǎng)絡(luò)傳輸信號(hào)的不穩(wěn)定[1]。非平穩(wěn)數(shù)據(jù)以一種無(wú)序的方式混入普通數(shù)據(jù),通過通信網(wǎng)絡(luò)傳送到接收端。接收方將接受數(shù)據(jù)分析,探測(cè)和追蹤。一般不能預(yù)測(cè)這些不穩(wěn)定數(shù)據(jù)產(chǎn)生的具體位置信息,以及它對(duì)整個(gè)通信網(wǎng)絡(luò)鏈路的危害[2,3]。因此,為解決通信網(wǎng)絡(luò)鏈路存在的問題,已有較多學(xué)者開展了關(guān)于這方面的研究。
目前,在數(shù)據(jù)修復(fù)領(lǐng)域中,常用的方法主要有艦船電子通信系統(tǒng)非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法、光纖傳感網(wǎng)絡(luò)鏈路故障自修復(fù)方法和艦船通信系統(tǒng)重復(fù)不完整數(shù)據(jù)智能修復(fù)方法,其中,艦船電子通信系統(tǒng)非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法預(yù)先對(duì)非平穩(wěn)數(shù)據(jù)進(jìn)行了自動(dòng)檢測(cè),然后對(duì)檢測(cè)后的數(shù)據(jù)進(jìn)行彌補(bǔ);光纖傳感網(wǎng)絡(luò)鏈路故障自修復(fù)方法預(yù)先對(duì)鏈路故障進(jìn)行分析,找到故障發(fā)生地點(diǎn)與所屬類型,實(shí)現(xiàn)對(duì)鏈路數(shù)據(jù)的修復(fù);艦船通信系統(tǒng)重復(fù)不完整數(shù)據(jù)智能修復(fù)方法對(duì)未修復(fù)的數(shù)據(jù)進(jìn)行了預(yù)處理,實(shí)現(xiàn)數(shù)據(jù)的自動(dòng)修復(fù)。上述方法均能夠?qū)νㄐ啪W(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)進(jìn)行修復(fù),但是存在修復(fù)率低、修復(fù)效率低以及修復(fù)耗時(shí)長(zhǎng)等問題,為此設(shè)計(jì)一個(gè)通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法。結(jié)果表明,該方法有效解決了傳統(tǒng)方法存在的問題,能夠滿足通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)需求,具備一定的實(shí)際應(yīng)用意義。
將此次研究的通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)原理抽象為3個(gè)層次,如下圖1所示。
圖 1 通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)修復(fù)原理示意圖
圖1中,信源層為通信網(wǎng)絡(luò)中的信源,文檔層為數(shù)據(jù)的壓縮包,物理層為數(shù)據(jù)的鏈路,可根據(jù)各個(gè)協(xié)議層特定的約束條件,進(jìn)一步系統(tǒng)地進(jìn)行數(shù)據(jù)修復(fù)工作。其修復(fù)原理是預(yù)先確定未修復(fù)數(shù)據(jù)的信息流,提取數(shù)據(jù)數(shù)量信息,然后對(duì)非平穩(wěn)數(shù)據(jù)進(jìn)行自動(dòng)修復(fù)。
在通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)過程中,需要預(yù)先對(duì)傳輸數(shù)據(jù)進(jìn)行采集,但是數(shù)據(jù)采集與傳輸過程中會(huì)受到噪聲[4]的影響,導(dǎo)致非平穩(wěn)數(shù)據(jù)修復(fù)準(zhǔn)確性降低,為此對(duì)其進(jìn)行處理。正常信號(hào)與噪聲信號(hào)特性不同,將傳輸數(shù)據(jù)噪聲用n表示,將噪聲瞬時(shí)值概率表示為
(1)
式(1)中,σn代表噪聲的平均功率,p(n)代表噪聲瞬時(shí)值概率。
則數(shù)據(jù)中心網(wǎng)絡(luò)傳輸數(shù)據(jù)噪聲的計(jì)算公式為
n(t)=p(n)+Pn(ω)
(2)
式(2)中,Pn(ω)代表噪聲功率譜。
基于上述構(gòu)建的通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)噪聲模型[5],采用下述公式消除數(shù)據(jù)噪聲
(3)
式(3)中,L(t)代表消除噪聲后的傳輸數(shù)據(jù),Tn代表通信鏈路數(shù)據(jù)采集的總耗時(shí),a代表平均斜率。
經(jīng)上述計(jì)算后,對(duì)通信網(wǎng)絡(luò)鏈路通信數(shù)據(jù)進(jìn)行擬合[6],計(jì)算表達(dá)式為
(4)
依據(jù)上述過程完成通信網(wǎng)絡(luò)鏈路數(shù)據(jù)的預(yù)處理,為非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)提供基礎(chǔ)。
依據(jù)上述過程完成對(duì)通信網(wǎng)絡(luò)鏈路數(shù)據(jù)的預(yù)處理,在這一部分主要對(duì)通信數(shù)據(jù)進(jìn)行無(wú)損檢測(cè)[7]。其過程如下圖2所示。
圖2 非平穩(wěn)數(shù)據(jù)自動(dòng)檢測(cè)流程
采用遺傳算法進(jìn)行檢測(cè),遺傳算法通常依賴變異、交叉和選擇等啟發(fā)算子,以產(chǎn)生高質(zhì)量的解,用于優(yōu)化和搜索問題[8]。主要在現(xiàn)有的群體中隨機(jī)選擇更適合的個(gè)體,對(duì)每個(gè)個(gè)體的基因組進(jìn)行修改,從而產(chǎn)生新的一代。接著新的候選解將用于算法的下一次迭代,當(dāng)?shù)螖?shù)達(dá)到最大值,或種群達(dá)到滿意適應(yīng)程度時(shí),算法即為結(jié)束。
具體過程如下所示:
1)建立一個(gè)規(guī)模為K的初始群體,當(dāng)初始群體K中樣本數(shù)據(jù)等于1時(shí),則判定其為平穩(wěn)數(shù)據(jù),當(dāng)初始群體K為0時(shí),則認(rèn)為其為非平穩(wěn)數(shù)據(jù)。
2)對(duì)通信網(wǎng)絡(luò)鏈路中傳輸數(shù)據(jù)的適應(yīng)度值進(jìn)行計(jì)算[9],假設(shè)數(shù)據(jù)共有m個(gè)屬性,{m1,m2,mi}。為方便計(jì)算,賦予數(shù)據(jù)權(quán)重值,將其記作{w1,w2,wi}。
計(jì)算總體方差[10],計(jì)算公式如下所示
(5)
3)將上述計(jì)算結(jié)果按照從小到大的序列進(jìn)行排序,進(jìn)行選擇操作,并對(duì)前一個(gè)樣本進(jìn)行交叉與變異操作,將最后一個(gè)樣本看作是最優(yōu)樣本。
4)判斷當(dāng)前結(jié)果是否符合最終的終止條件,若符合則完成檢測(cè),若不符合則返回步驟2。
在上述檢測(cè)后,會(huì)導(dǎo)致估計(jì)出的結(jié)果與測(cè)量值相差較大,在相差較大時(shí),可預(yù)先設(shè)定一個(gè)門限值,估計(jì)非平穩(wěn)網(wǎng)絡(luò)環(huán)境下鏈路丟包率,其流程如圖3所示。
圖3 鏈路丟包率流程圖
將上述過程與非平穩(wěn)數(shù)據(jù)檢測(cè)過程結(jié)合,完成非平穩(wěn)數(shù)據(jù)的檢測(cè)。
通過3.2節(jié)完成非平穩(wěn)數(shù)據(jù)的檢測(cè),然后對(duì)非平穩(wěn)數(shù)據(jù)進(jìn)行自動(dòng)修復(fù),在非平穩(wěn)數(shù)據(jù)中,主要包含兩種數(shù)據(jù)類型,分別為缺失數(shù)據(jù)與錯(cuò)誤數(shù)據(jù)。對(duì)于錯(cuò)誤數(shù)據(jù)可以直接對(duì)其刪除與丟棄,并對(duì)缺失數(shù)據(jù)進(jìn)行彌補(bǔ)[11]。在數(shù)據(jù)彌補(bǔ)上主要采用決策樹的方法進(jìn)行彌補(bǔ),其利用樹圖或決策模型[12]來(lái)描述隨機(jī)事件的結(jié)果,可以幫助決定最有可能實(shí)現(xiàn)目標(biāo)的策略。具體流程所示。
1)根據(jù)非平穩(wěn)數(shù)據(jù)檢測(cè)結(jié)果,確定數(shù)據(jù)屬性,生成測(cè)試樣本屬性集合A;
2)建立數(shù)據(jù)庫(kù)表,然后建立決策樹,并對(duì)決策樹中各個(gè)節(jié)點(diǎn)屬性的信息增益進(jìn)行計(jì)算,計(jì)算公式如下所示
(6)
式(6)中,?代表各個(gè)特征的熵,zk代表特征k的信息增益值。
3)選擇信息增益值最大的某一節(jié)點(diǎn)屬性,建立子決策樹,將子決策樹最右邊節(jié)點(diǎn)設(shè)置為當(dāng)前節(jié)點(diǎn),以生成一個(gè)以測(cè)試屬性為節(jié)點(diǎn)的決策樹;
4)利用該決策樹對(duì)非平穩(wěn)數(shù)據(jù)進(jìn)行彌補(bǔ),直至所有缺失的數(shù)據(jù)變?yōu)槠椒€(wěn)數(shù)據(jù),以此完成通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)。
對(duì)上述設(shè)計(jì)的通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法進(jìn)行測(cè)試,并為了保證實(shí)驗(yàn)的嚴(yán)謹(jǐn)性,將艦船電子通信系統(tǒng)非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法、光纖傳感網(wǎng)絡(luò)鏈路故障自修復(fù)方法與艦船通信系統(tǒng)重復(fù)不完整數(shù)據(jù)智能修復(fù)方法作為參考對(duì)比對(duì)象,對(duì)比這四種方法的性能,主要對(duì)比結(jié)果如下所示。
在非平穩(wěn)數(shù)據(jù)準(zhǔn)確性對(duì)比過程中,運(yùn)用不同方法獲取傳輸數(shù)據(jù)的基地噪聲,對(duì)比結(jié)果如下圖4所示。
圖4 非平穩(wěn)數(shù)據(jù)修復(fù)準(zhǔn)確性對(duì)比
由上圖4可知,采用艦船電子通信系統(tǒng)非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法、光纖傳感網(wǎng)絡(luò)鏈路故障自修復(fù)方法和艦船通信系統(tǒng)重復(fù)不完整數(shù)據(jù)智能修復(fù)方法得到的數(shù)據(jù)修復(fù)準(zhǔn)確率明顯低于通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法的準(zhǔn)確率,說(shuō)明傳統(tǒng)方法不能準(zhǔn)確描述和表征數(shù)據(jù)中心通信網(wǎng)絡(luò)傳輸數(shù)據(jù)的實(shí)際頻譜變化,易造成大量信號(hào)細(xì)節(jié)分量丟失。而此次研究方法的數(shù)據(jù)修復(fù)準(zhǔn)確率最高值達(dá)到了80%左右,優(yōu)勢(shì)明顯,由此證明此次研究的方法能夠準(zhǔn)確反映數(shù)據(jù)頻譜特征變化情況,能夠提高非平穩(wěn)數(shù)據(jù)修復(fù)的準(zhǔn)確性,并能夠保留傳輸數(shù)據(jù)的細(xì)節(jié)特征。
通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)修復(fù)率的計(jì)算公式如下所示
(7)
式中,P代表非平穩(wěn)數(shù)據(jù)修復(fù)率,a代表正確修復(fù)數(shù)據(jù)的數(shù)量,z代表實(shí)驗(yàn)次數(shù),b代表錯(cuò)誤修復(fù)數(shù)據(jù)數(shù)量,p′代表非平穩(wěn)數(shù)據(jù)的比率。
利用式(7)計(jì)算傳統(tǒng)方法與此次研究的方法的數(shù)據(jù)修復(fù)率,對(duì)比結(jié)果如表1所示。
表1 不同非平穩(wěn)數(shù)據(jù)比率下數(shù)據(jù)修復(fù)率對(duì)比結(jié)果
分析上表1可知,此次研究的通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法受到非平穩(wěn)數(shù)據(jù)比率增長(zhǎng)的影響較小,其數(shù)據(jù)修復(fù)率均高于99%,說(shuō)明此次研究的方法在修復(fù)過程中不易發(fā)生丟包現(xiàn)象。而傳統(tǒng)的艦船電子通信系統(tǒng)非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法、光纖傳感網(wǎng)絡(luò)鏈路故障自修復(fù)系統(tǒng)與艦船通信系統(tǒng)重復(fù)不完整數(shù)據(jù)智能修復(fù)方法受到非平穩(wěn)數(shù)據(jù)影響較大,修復(fù)效果受到了一定的影響,在修復(fù)過程中,修復(fù)范圍較低,存在遺漏缺失數(shù)據(jù)現(xiàn)象。將此次設(shè)計(jì)的修復(fù)方法與傳統(tǒng)修復(fù)方法對(duì)比可知,此次研究的修復(fù)方法能夠?qū)Ψ瞧椒€(wěn)數(shù)據(jù)進(jìn)行自動(dòng)修復(fù),修復(fù)覆蓋范圍更廣,能夠保證不遺漏缺失數(shù)據(jù),降低數(shù)據(jù)的丟包率,較傳統(tǒng)方法應(yīng)用效果更好。
對(duì)比此次研究的非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法與傳統(tǒng)修復(fù)方法的數(shù)據(jù)修復(fù)耗時(shí),其對(duì)比結(jié)果如圖5所示。
圖5 修復(fù)耗時(shí)對(duì)比
分析上圖5可知,此次研究的非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法在這四種修復(fù)方法中的耗時(shí)是最少的,其修復(fù)耗時(shí)始終低于0.4s,并且變化幅度不明顯,而傳統(tǒng)方法的數(shù)據(jù)修復(fù)時(shí)間最長(zhǎng)達(dá)到了1.5s。經(jīng)過對(duì)比可知,此次研究的非平穩(wěn)自動(dòng)修復(fù)方法較傳統(tǒng)的修復(fù)方法的修復(fù)效率更高。
綜上所述,此次研究的方法較傳統(tǒng)方法的非平穩(wěn)數(shù)據(jù)修復(fù)準(zhǔn)確性高、非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)效果好、修復(fù)耗時(shí)少,證明了此次研究的方法的有效性。原因是,此次研究的非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法預(yù)先對(duì)通信網(wǎng)絡(luò)鏈路數(shù)據(jù)進(jìn)行了采集與預(yù)處理,檢測(cè)出了鏈路中的非平穩(wěn)數(shù)據(jù),準(zhǔn)確對(duì)其進(jìn)行了自動(dòng)修復(fù),因此,具有較好的應(yīng)用效果,證明了此次研究的修復(fù)方法的有效性。
綜上所述,為解決數(shù)據(jù)修復(fù)率低、修復(fù)耗時(shí)長(zhǎng)等問題,設(shè)計(jì)了一個(gè)通信網(wǎng)絡(luò)鏈路非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法。通過非平穩(wěn)數(shù)據(jù)噪聲模型實(shí)現(xiàn)對(duì)數(shù)據(jù)的噪聲處理,降低了噪聲對(duì)數(shù)據(jù)修復(fù)的影響,提高了數(shù)據(jù)修復(fù)的準(zhǔn)確性,降低了修復(fù)用時(shí)。結(jié)果表明此次研究方法的數(shù)據(jù)修復(fù)率較高、耗時(shí)較短,且具備數(shù)據(jù)修復(fù)準(zhǔn)確性較高的優(yōu)勢(shì),有效提升了非平穩(wěn)數(shù)據(jù)的修復(fù)效果。
但是由于研究時(shí)間的限制,所設(shè)計(jì)的非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)方法還存在一定的不足,因?yàn)榫W(wǎng)絡(luò)規(guī)模是不停擴(kuò)大的,會(huì)使網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)變得更加復(fù)雜,同時(shí),除了噪聲這一干擾因素之外,冗余數(shù)據(jù)、非平衡數(shù)據(jù)等干擾因素也會(huì)對(duì)數(shù)據(jù)修復(fù)效果產(chǎn)生影響。因此,需要不斷優(yōu)化此次研究的方法,以不斷提高非平穩(wěn)數(shù)據(jù)自動(dòng)修復(fù)效果。