冀江瑀,陳秀波
(1. 北京郵電大學(xué)網(wǎng)絡(luò)空間安全學(xué)院,北京 102206;2. 北京郵電大學(xué)網(wǎng)絡(luò)空間安全學(xué)院信息安全中心,北京 102206)
隨著互聯(lián)網(wǎng)技術(shù)的不斷發(fā)展,網(wǎng)絡(luò)中多樣數(shù)據(jù)的呈現(xiàn)不斷增長(zhǎng)趨勢(shì)。這些數(shù)據(jù)的出現(xiàn)影響了網(wǎng)絡(luò)運(yùn)行速度以及數(shù)據(jù)挖掘的難度。其中,雙層網(wǎng)絡(luò)是采用物聯(lián)網(wǎng)和無(wú)線傳感組網(wǎng)進(jìn)行網(wǎng)絡(luò)組網(wǎng)設(shè)計(jì)的分布式網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),雙層網(wǎng)絡(luò)在實(shí)現(xiàn)數(shù)據(jù)傳輸中容易受到上行鏈路干擾,導(dǎo)致雙層網(wǎng)絡(luò)可靠性較低,需要對(duì)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)進(jìn)行挖掘,提升雙層網(wǎng)絡(luò)中心數(shù)據(jù)的可靠性。采用上行鏈路干擾抑制和特征提取方法,進(jìn)行雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘優(yōu)化,提高對(duì)雙層網(wǎng)絡(luò)中心數(shù)據(jù)的檢測(cè)和識(shí)別能力,相關(guān)雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘方法研究將在優(yōu)化網(wǎng)絡(luò)的傳輸性能,提高網(wǎng)絡(luò)輸出穩(wěn)定性對(duì)雙層網(wǎng)絡(luò)的優(yōu)化十分重要。為此,該領(lǐng)域相關(guān)研究者進(jìn)行了很多研究,并取得了一定成果。
文獻(xiàn)[3]提出復(fù)雜光纖網(wǎng)絡(luò)多來(lái)源數(shù)據(jù)深度挖掘方法。該方法通過(guò)優(yōu)化后的粒子群算法尋找到網(wǎng)絡(luò)中數(shù)據(jù)的特點(diǎn),將獲取的數(shù)據(jù)特征和網(wǎng)絡(luò)中多種其它數(shù)據(jù)流相融合,將數(shù)據(jù)集合中數(shù)據(jù)長(zhǎng)度進(jìn)行排列,然后對(duì)數(shù)據(jù)密度進(jìn)行解析和聚類,完成網(wǎng)絡(luò)中數(shù)據(jù)的挖掘。該方法有效分析了光纖網(wǎng)絡(luò)中數(shù)據(jù)特征,提取精度較高,但該方法未過(guò)多考慮多層次網(wǎng)絡(luò)環(huán)境中多種數(shù)據(jù),存在一定局限性。文獻(xiàn)[4]提出基于模糊神經(jīng)網(wǎng)絡(luò)的異常網(wǎng)絡(luò)數(shù)據(jù)挖掘方法。該方法首先獲取了網(wǎng)絡(luò)中異常數(shù)據(jù)之間存在的相似之處,將數(shù)據(jù)的屬性特征進(jìn)行有效的獲取,在此基礎(chǔ)上,引入聯(lián)合關(guān)聯(lián)規(guī)則將獲取的數(shù)據(jù)特征進(jìn)行模糊融合處理,將處理后的結(jié)果進(jìn)行混合加權(quán)和自適應(yīng)分塊匹配,完成網(wǎng)絡(luò)數(shù)據(jù)集的挖掘。該方法對(duì)異常數(shù)據(jù)的挖掘精度較好,但操作過(guò)程復(fù)雜且耗時(shí)較長(zhǎng)。
針對(duì)上述方法中存在的問(wèn)題,本文提出一種新的雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘方法。該方法通過(guò)對(duì)雙層網(wǎng)絡(luò)中心數(shù)據(jù)特征的獲取以及對(duì)雙層網(wǎng)絡(luò)中干擾數(shù)據(jù)的抑制等處理,完成了雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘方法的優(yōu)化。該方法研究了上行鏈路干擾情況下數(shù)據(jù)挖掘方法,與傳統(tǒng)方法相比具有數(shù)據(jù)挖掘精度高、耗時(shí)短等優(yōu)勢(shì),具有一定研究?jī)r(jià)值。
為了實(shí)現(xiàn)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘,首先構(gòu)建上行鏈路干擾下雙層網(wǎng)絡(luò)傳輸和分析模型,根據(jù)數(shù)據(jù)的數(shù)值屬性和分類屬性進(jìn)行模糊聚類和信息融合處理。
當(dāng)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)分布關(guān)聯(lián)映射存在Γ
:P
→Q
2+1,表示Γ
(v
)=[u
(v
),u
(φ
(v
)),…,u
(φ
2(v
))]為一個(gè)采樣節(jié)點(diǎn)分布集,上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)采集的標(biāo)簽分布集為(1)
根據(jù)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的種類屬性b
(j
=1,2,…,n
)進(jìn)行特征分類,令Y
={Y
,Y
,…,Y
}是混合屬性數(shù)據(jù)集U
上的一個(gè)向量分布集合,根據(jù)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)采樣的節(jié)點(diǎn)分布模型,雙層網(wǎng)絡(luò)中心數(shù)據(jù)的稀疏性特征分解模型為j
2π(η
-η
)[Ei
(j
2πf
(b
-η
))(2)
(3)
根據(jù)上述分析,此時(shí)需要提取上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的統(tǒng)計(jì)特征量和關(guān)聯(lián)規(guī)則特征量,并對(duì)該環(huán)境下網(wǎng)絡(luò)中的核心數(shù)據(jù)進(jìn)行獲取和保存,構(gòu)建的儲(chǔ)存模型如圖1 所示。
圖1 雙層網(wǎng)絡(luò)中心數(shù)據(jù)分布存儲(chǔ)模型
在上述構(gòu)建的雙層網(wǎng)絡(luò)中心數(shù)據(jù)存儲(chǔ)模型基礎(chǔ)上,將上述數(shù)據(jù)進(jìn)行有效的融合十分重要。本文采用分塊區(qū)域融合方法進(jìn)行網(wǎng)絡(luò)數(shù)據(jù)的分塊區(qū)域融合處理,結(jié)合特征提取結(jié)果進(jìn)行數(shù)據(jù)挖掘,在大規(guī)模數(shù)據(jù)集約束下,上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的關(guān)聯(lián)規(guī)則知識(shí)集為
(4)
其中,r
(t
)為上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的統(tǒng)計(jì)特征量模糊加權(quán)值。在模糊關(guān)聯(lián)度約束下,進(jìn)行上行鏈路干擾下雙層網(wǎng)絡(luò)的分布式融合處理,結(jié)合模糊質(zhì)心和均值進(jìn)行上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的自適應(yīng)融合,數(shù)據(jù)對(duì)象的統(tǒng)計(jì)特征值為
(5)
在混合屬性條件下,數(shù)據(jù)關(guān)聯(lián)規(guī)則點(diǎn)記為[n
,m
],在有限數(shù)據(jù)集內(nèi),相異度特征量滿足N
∈[n
,m
],數(shù)值屬性的屬性值為(6)
其中,φ
表示上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的能量分布幅值,為N
階方陣,即A
={a
,,0<i
,j
<N
},其中m
,為上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的魯棒特征分布矩陣,表示為R
×1。在上述提取的上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)基礎(chǔ)上,對(duì)其進(jìn)行數(shù)據(jù)挖掘優(yōu)化分析。構(gòu)建雙層網(wǎng)絡(luò)中心數(shù)據(jù)的多維尺度分解模型,采用射頻標(biāo)簽識(shí)別技術(shù)進(jìn)行上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的向量量化處理,構(gòu)建上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)多源分布模型
G
=[g
,g
,…,g
](7)
采用語(yǔ)義本體模型檢測(cè)方法,將上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)進(jìn)行多元?jiǎng)澐帧8鶕?jù)挖掘數(shù)據(jù)的維度特征,采用云計(jì)算方法進(jìn)行處理。將數(shù)據(jù)從高維降低到低維,構(gòu)建上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)融合模型,即
maxF
(X
)=(F
(X
),F
(X
),…,F
(X
))s.t.
g
(X
)≤0(j
=1,2,…,p
)h
(X
)=0(k
=1,2,…,p
)(8)
采用模糊關(guān)聯(lián)規(guī)則調(diào)度方法對(duì)獲取的雙層網(wǎng)絡(luò)中心數(shù)據(jù)進(jìn)行尋優(yōu)處理。獲取雙層網(wǎng)絡(luò)中任意節(jié)點(diǎn)的首要特征,在指定離散區(qū)間內(nèi)上行鏈路雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘的關(guān)聯(lián)規(guī)則集表達(dá)式為
(9)
(10)
(11)
其中,P
(X
)、P
(Y
)表示上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的關(guān)聯(lián)融合度,X
、Y
為混合屬性條件向量集量,P
(X
∩Y
)是上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)融合的交叉分布概念集。從數(shù)據(jù)集中隨機(jī)選擇k
個(gè)不同的數(shù)據(jù)進(jìn)行參數(shù)自適應(yīng)調(diào)節(jié),得到調(diào)節(jié)系數(shù),結(jié)合資源融合調(diào)度方法,對(duì)簇中心數(shù)值屬性進(jìn)行分類設(shè)計(jì),得到輸出為O
,數(shù)值屬性的模糊特征集為T
=N
O
。上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘的匹配度為(12)
設(shè)定上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)分布關(guān)鍵指標(biāo)特征分布為X
=(x
,x
………x
),在有限空間內(nèi),得到上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖關(guān)聯(lián)規(guī)則知識(shí)庫(kù)分布結(jié)構(gòu)滿足c
O
<O
,?j
∈[0,N
-1]。根據(jù)上述分析,實(shí)現(xiàn)對(duì)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘的干擾抑制。ψ
+1,計(jì)算式如下(13)
n
的數(shù)據(jù)集X
劃分C
個(gè)聚類簇,進(jìn)行上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的測(cè)度分解,得到測(cè)度分解矩陣為(14)
(15)
考慮等價(jià)語(yǔ)義映射,得到上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)分布的鏈路集滿足P
∈R
×、R
∈R
×和H
∈R
×,特征分布集滿足d
~p
(e
,q
),上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘的整合矩陣:(16)
根據(jù)上述分析,結(jié)合上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)整合的匹配指標(biāo)集E
∈E
(k
=1,2,…,t
),構(gòu)建數(shù)據(jù)挖掘的圖模型為P
∈P
(i
=1,2,…,m
),由此實(shí)現(xiàn)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘優(yōu)化。仿真在Matlab 7.2 軟件上進(jìn)行,操作系統(tǒng)為Windows XP 系統(tǒng),CPU 為3.6 GHz,運(yùn)行內(nèi)存為8 GB,上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)采樣的分塊長(zhǎng)度為800,對(duì)雙層網(wǎng)絡(luò)中心數(shù)據(jù)檢測(cè)的迭代次數(shù)為100,上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)采樣樣本的個(gè)數(shù)為1024,采樣的周期為T=0.04 s,雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘過(guò)程中,受到上行鏈路干擾下的強(qiáng)度為SNR=0~24 dB。雙層網(wǎng)絡(luò)中心數(shù)據(jù)的采樣結(jié)果如圖2所示。
圖2 雙層網(wǎng)絡(luò)中心數(shù)據(jù)的采樣結(jié)果
以圖2數(shù)據(jù)為測(cè)試對(duì)象,構(gòu)建雙層網(wǎng)絡(luò)中心數(shù)據(jù)的多維尺度分解模型,根據(jù)關(guān)聯(lián)知識(shí)的融合結(jié)果進(jìn)行雙層網(wǎng)絡(luò)中心數(shù)據(jù)的相關(guān)性融合,得到數(shù)據(jù)挖掘輸出如圖3所示。
圖3 數(shù)據(jù)挖掘輸出
分析圖3得知,采用本文方法能有效實(shí)現(xiàn)雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘,數(shù)據(jù)挖掘輸出的特征分辨力較好。隨著尺度系數(shù)的不斷改變,采用所提方法進(jìn)行數(shù)據(jù)挖掘后輸出的波形較為穩(wěn)定,且在規(guī)定時(shí)間范圍內(nèi)數(shù)據(jù)輸出的特征分辨率較為明顯,驗(yàn)證了所提方法的有效性。
為保證所提方法的有效性,仿真分析了所提方法、復(fù)雜光纖網(wǎng)絡(luò)多來(lái)源數(shù)據(jù)深度挖掘以及基于模糊神經(jīng)網(wǎng)絡(luò)的異常網(wǎng)絡(luò)數(shù)據(jù)挖掘?qū)ι闲墟溌犯蓴_下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘精度進(jìn)行了對(duì)比,為保證實(shí)驗(yàn)精度,進(jìn)行了多次迭代分析,且獲取的結(jié)果均為平均值,實(shí)驗(yàn)結(jié)果如圖4 所示:
圖4 不同方法數(shù)據(jù)挖掘精度分析
分析圖4 可以看出,隨著迭代次數(shù)的改變,所提方法、復(fù)雜光纖網(wǎng)絡(luò)多來(lái)源數(shù)據(jù)深度挖掘以及基于模糊神經(jīng)網(wǎng)絡(luò)的異常網(wǎng)絡(luò)數(shù)據(jù)挖掘方法在數(shù)據(jù)挖掘中的精度發(fā)生一定改變。其中,所提方法的數(shù)據(jù)挖掘精度最高約為98 %,復(fù)雜光纖網(wǎng)絡(luò)多來(lái)源數(shù)據(jù)深度挖掘的數(shù)據(jù)挖掘精度最高約為78 %,基于模糊神經(jīng)網(wǎng)絡(luò)的異常網(wǎng)絡(luò)數(shù)據(jù)挖掘方法的數(shù)據(jù)挖掘精度最高約為76 %,相比之下所提方法的挖掘精度最高。這是由于所提方法針對(duì)網(wǎng)絡(luò)中存在的干擾數(shù)據(jù)進(jìn)行抑制,提升了數(shù)據(jù)挖掘的精度,驗(yàn)證了所提方法的科學(xué)有效性。
為進(jìn)一步分析所提方法的有效性,仿真測(cè)試不同方法進(jìn)行數(shù)據(jù)挖掘的時(shí)間開銷,得到對(duì)比結(jié)果見表1所示:
表1 時(shí)間開銷對(duì)比(單位:s)
分析表1中數(shù)據(jù)得知,在相同實(shí)驗(yàn)環(huán)境下進(jìn)采用三種方法對(duì)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘的時(shí)間開銷存在一定差距。其中,所提方法的時(shí)間開銷最短約為0.34 s,而其它兩種方法的時(shí)間開銷始終高于所提方法,驗(yàn)證了所提方法的可行性。這是由于所提方法在進(jìn)行數(shù)據(jù)挖掘之前評(píng)估不同屬性數(shù)據(jù)度量值,獲取上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)的譜特征分布,根據(jù)關(guān)聯(lián)規(guī)則特征量構(gòu)建雙層網(wǎng)絡(luò)中心數(shù)據(jù)分布存儲(chǔ)模型,降低了數(shù)據(jù)挖掘的復(fù)雜程度,進(jìn)而降低了挖掘的耗時(shí)。
針對(duì)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘方法中存在的一定問(wèn)題,提出了一種全新的優(yōu)化方法。該方法首先獲取雙層網(wǎng)絡(luò)中心數(shù)據(jù)的特征及分布情況,然后將其數(shù)據(jù)特征進(jìn)行融合,對(duì)數(shù)據(jù)向量進(jìn)行量化處理,在雙層網(wǎng)絡(luò)中心數(shù)據(jù)中存在干擾時(shí),對(duì)其進(jìn)行有效的抑制,實(shí)現(xiàn)了上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘方法的優(yōu)化。與傳統(tǒng)方法相比所提方法具有以下優(yōu)勢(shì):
1)采用所提方法對(duì)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘進(jìn)行傳輸?shù)姆直媛市Ч^好,具有一定優(yōu)勢(shì);
2)采用所提方法對(duì)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘的精度最高約為98 %,具有一定可信度。
3)采用所提方法對(duì)上行鏈路干擾下雙層網(wǎng)絡(luò)中心數(shù)據(jù)挖掘進(jìn)行傳輸?shù)臅r(shí)間開銷最短約為0.34 s,其處理速度較快。
雖然本文方法在現(xiàn)階段取得了一定成果,但還存在一定不足,未來(lái)將對(duì)數(shù)據(jù)中干擾成分進(jìn)行詳細(xì)研究,以提升數(shù)據(jù)挖掘的性能。