沈文旭,武航宇,毛 重
(1. 空軍航空大學,吉林 長春 130022;2. 陸軍裝甲兵學院士官學校,吉林 長春 130051)
無線傳感網絡[1]依靠自身靈活性強、安裝簡易等特性被廣泛應用于智能交通、數(shù)據(jù)收集以及目標定位等高端領域。無線傳感網絡作為多跳數(shù)的自組織網絡,在運行過程中極易遭受網絡攻擊以及篡改隱私數(shù)據(jù)的威脅,造成不必要的帶寬浪費以及隱私泄露危險,由此網絡隱私數(shù)據(jù)[2]安全以及隱私數(shù)據(jù)融合成為人們一時間爭相熱議的話題。
文獻[3]提出基于云計算的社交網絡安全隱私數(shù)據(jù)融合方法。該方法依據(jù)敏感信息過濾模型對網絡隱私數(shù)據(jù)進行濾除,通過K匿名技術對濾除結果進行隱私保護處理;再使用均值聚類算法對隱私數(shù)據(jù)進行聚類處理;最后根據(jù)決策樹理論建立網絡隱私數(shù)據(jù)融合模型,通過該模型實現(xiàn)網絡隱私數(shù)據(jù)的融合。該方法由于未能在數(shù)據(jù)融合前對數(shù)據(jù)進行缺失值插補處理,導致該方法在數(shù)據(jù)融合時的網絡生命周期短。文獻[4]提出基于分布式壓縮感知和散列函數(shù)的數(shù)據(jù)融合隱私保護算法。該方法通過分布式的壓縮感知法對網絡數(shù)據(jù)進行稀疏性監(jiān)測,依據(jù)監(jiān)測結果去除冗余數(shù)據(jù);使用單向散列函數(shù)對數(shù)據(jù)監(jiān)測值進行計算,將數(shù)據(jù)集中的偽裝數(shù)據(jù)填充至數(shù)據(jù)監(jiān)測值中隱藏真實數(shù)據(jù);最后通過網絡節(jié)點獲取散列值,完成數(shù)據(jù)融合。該方法在進行監(jiān)測值計算時存在誤差,所以該方法在數(shù)據(jù)融合時的網絡延時高。文獻[5]提出改進型支持度函數(shù)的WSN水質監(jiān)測數(shù)據(jù)融合方法。該方法對數(shù)據(jù)進行一致性處理,保證數(shù)據(jù)準確性;使用動態(tài)時間的彎曲距離優(yōu)化支持度函數(shù);基于優(yōu)化后的支持度函數(shù)計算數(shù)據(jù)時間序列;最后使用加權法對計算結果進行加權處理,實現(xiàn)數(shù)據(jù)的融合。該方法在優(yōu)化支持度函數(shù)時存在問題,導致該方法的網絡延時高。
為解決上述數(shù)據(jù)融合過程中存在的問題,提出面向網絡隱私數(shù)據(jù)融合的蟻群算法優(yōu)化方法。
在對網絡隱私數(shù)據(jù)進行融合[6]前,需要對數(shù)據(jù)進行處理,從而提取網絡隱私數(shù)據(jù)特征。
2.1.1 網絡隱私數(shù)據(jù)缺失值插補
網絡在經過長時間運行后,隱私數(shù)據(jù)中會出現(xiàn)零值數(shù)據(jù)或空缺數(shù)據(jù),影響隱私數(shù)據(jù)特征提取效果,因此使用拉格朗日插值法對零值數(shù)據(jù)以及空缺數(shù)據(jù)進行插補處理。
首先將網絡中的隱私數(shù)據(jù)進行整合,建立網絡隱私數(shù)據(jù)集S={s1,s2,…,sn},并對其進行排序處理,找出其中的缺失數(shù)據(jù)確認數(shù)據(jù)因變量、自變量,選定缺失值前后10個隱私數(shù)據(jù)組成5組,進行網絡隱私數(shù)據(jù)的缺失值插補,過程如下式所示
(1)
式中,網絡隱私數(shù)據(jù)缺失值相應序號標記為a,非缺失值序號標記為bi,拉格朗日多項式標記為ci(a),插補結果標記為Cn(a)。
2.1.2 標準化處理
由于網絡隱私數(shù)據(jù)特征占比并不相同,所以小數(shù)值數(shù)據(jù)特征會被大數(shù)值特征替代掉,所以網絡隱私數(shù)據(jù)在缺失值插補后,要對數(shù)據(jù)集進行標準化[7]處理,將數(shù)據(jù)整合至[0,1]區(qū)間內,過程如下式所示
s′=s-smin/smax-smin
(2)
式中,原始網絡隱私數(shù)據(jù)標記為s,數(shù)據(jù)標準化前隱私數(shù)據(jù)集的最大、最小數(shù)據(jù)分別用smin和smax表示,數(shù)據(jù)的標準化結果標記為s′。
依據(jù)上述的網絡隱私數(shù)據(jù)標準化結果分析隱私數(shù)據(jù)的數(shù)據(jù)結構。
首先,采用語義特征分解法獲取網絡隱私數(shù)據(jù)語義相關特征分布集合A,使用屬性加權法建立數(shù)據(jù)加強函數(shù)f(w),獲取網絡隱私數(shù)據(jù)相似度分布系數(shù),結果如下式所示
(3)
式中,數(shù)據(jù)采樣區(qū)域分布幅值標記為b(wi),數(shù)據(jù)的特征匹配系數(shù)標記為η,數(shù)據(jù)的可靠特征量標記為z(x,y),數(shù)據(jù)的關聯(lián)信息匹配集標記為P,網絡隱私數(shù)據(jù)相似度分布系數(shù)標記為g(h)。依據(jù)上述獲取的g(h)獲取數(shù)據(jù)(p+q)階的相似度幾何矩,結果如下式所示
(4)
式中,網絡隱私數(shù)據(jù)融合參數(shù)標記為(x+y)形式,相似度系數(shù)總量標記為h,建立的相似度幾何矩用P(p+q)表述。
基于模糊聚類法[8]對上式進行轉化,獲取網絡隱私數(shù)據(jù)二階的特征分布矩陣,過程如下式所示
X=P(p+q)+f(n)+γ
(5)
式中,網絡隱私數(shù)據(jù)特征參數(shù)標記為f(n),檢測參數(shù)標記為γ,建立的二階分布矩陣用X表示。基于上述檢測結果,使用相關鄰域搜索方法,建立網絡隱私數(shù)據(jù)的自適應加權模型,獲取數(shù)據(jù)的自相關特征匹配集合,表述過程如下式所示
(6)
式中,網絡隱私數(shù)據(jù)的特征稀疏性分布集標記為Fxs,自適應加權模型標記為R,數(shù)據(jù)量化特征分布子集用(t1,t2,…tn)表示,自相關特征匹配集合標記為st(c)。
基于上述分析結果,結合信息的多維識別法[9]對網絡隱私數(shù)據(jù)進行重組、信息編碼處理,建立網絡隱私數(shù)據(jù)的線性編碼模型,通過模型分解數(shù)據(jù)獲取數(shù)據(jù)的模糊特征解,過程如下式所示
U(ω)=[Δv+ki]+st(a)
(7)
式中,隱私數(shù)據(jù)的控制參數(shù)標記為Δv,數(shù)據(jù)的信息識別函數(shù)標記為ki,數(shù)據(jù)的編碼模型標記為st(a),獲取的模糊特征解用U(ω)表述,特征解數(shù)量標記為ω。
依據(jù)上述的數(shù)據(jù)集模糊特征解獲取結果,結合相空間重構法[10]建立數(shù)據(jù)的鄰域特征加權模型,通過計算獲取網絡隱私數(shù)據(jù)的空間維數(shù)以及數(shù)據(jù)特征量,過程如下式所示
(8)
式中,隱私數(shù)據(jù)的鄰域加權模型標記為Q(ev),特征空間維度標記為Ji,提取的隱私數(shù)據(jù)特征標記為Z(h),隱私數(shù)據(jù)的可靠性特征分量標記為assoc(B,V),數(shù)據(jù)特征信息熵用f(g)表述,數(shù)據(jù)的加權門限值標記為Nth,隱私數(shù)據(jù)的特征向量分別標記為si、sj形式,最佳迭代次數(shù)標記為Δsi,網絡隱私數(shù)據(jù)融合參數(shù)標記為X,數(shù)據(jù)重構參數(shù)用φs表述,迭代增長標記為l。
最后基于獲取的網絡隱私數(shù)據(jù)特征值建立網絡隱私數(shù)據(jù)特征向量集。
使用優(yōu)化后的蟻群算法計算網絡隱私數(shù)據(jù)特征向量集,完成網絡隱私數(shù)據(jù)的融合。
蟻群算法[11]實質上就是通過模擬螞蟻覓食行為獲取組合優(yōu)化問題。網絡隱私數(shù)據(jù)融合過程就是螞蟻在固定范圍內的最佳路徑選擇過程。
設定螞蟻數(shù)量為n,自源節(jié)點開始進行搜索,路徑上的初始信息素濃度相等,過程中螞蟻依靠路徑上的信息素濃度以及啟發(fā)信息確定下一搜索節(jié)點。螞蟻移動規(guī)則如下式所示
(9)
式中,最大鄰域區(qū)間標記為([ζij(g)]α,[μij(g)]β),初始搜索概率標記為r0。依據(jù)獲取的螞蟻移動規(guī)則計算螞蟻的路徑選取概率,過程如下式所示
(10)
(11)
由于傳統(tǒng)蟻群算法在進行網絡隱私數(shù)據(jù)融合時,會使算法過早進入局部最優(yōu)解狀態(tài),所以要在蟻群算法中引入鄰域搜索算法[12],優(yōu)化傳統(tǒng)蟻群算法。
插入式領域結構是將位置i進行剔除處理,并將結果插進位置j當中去,設定路徑全局最優(yōu)解位置為(i,j),移動解標記ε′從而使ε=(ε(1),ε(2),…ε(m))。再以此為基礎使用反變異算子,對路徑進行反轉處理,由此便能使蟻群算法對整個解空間的最優(yōu)解進行搜索。算法具體流程如下:
1)初始化網絡節(jié)點連通圖,設定相關參數(shù)。
2)將螞蟻放至網絡源節(jié)點,制定禁忌表。
3)螞蟻移動搜索路徑,過程中若發(fā)現(xiàn)螞蟻所在位置為sink節(jié)點,螞蟻可停止移動;螞蟻進行下一路徑搜索時,需識別該節(jié)點是否為sink節(jié)點,若是就繼續(xù)移動至下一節(jié)點并將該節(jié)點加入禁忌表中。
4)計算螞蟻搜索路徑長度,執(zhí)行領域搜索變異算子,對路徑進行反轉處理。
5)依據(jù)式(10)和式(11)更新路徑信息素濃度。
6)設定相關約束條件,辨識算法是否滿足,若滿足輸出全局最優(yōu)解,若不滿足則返回流程2)繼續(xù)搜索。
在使用鄰域搜索蟻群算法[13]融合網絡隱私數(shù)據(jù)時,算法計算初期以及后期需選定較大的初始概率,而算法中期需選定較小的初始概率值。算法迭代至一定范圍時,使用鄰域搜索法搜索當前最小路徑,從而進一步優(yōu)化蟻群算法的最優(yōu)解搜索結果,從而獲取最佳的網絡隱私數(shù)據(jù)[14]融合值。
基于蟻群優(yōu)化算法的網絡隱私數(shù)據(jù)融合方法具體流程如下:
1)初始化
依據(jù)網絡隱私特征向量集生成一個連通圖,并對路徑信息素進行歸一化處理[15]。設定相關參數(shù)并制定相關約束條件以及最大迭代次數(shù)、確定鄰域搜索閾值。
2)投入螞蟻
在連通圖源節(jié)點位置放入若干螞蟻,建立禁忌表。
3)進入搜索
設定螞蟻當前所在位置為i,節(jié)點相鄰集合標記為allowedk,當螞蟻進行搜索時,判斷所在節(jié)點是否為sink節(jié)點,若是直接加入禁忌表中,停止搜索;同時對該節(jié)點位置的相鄰節(jié)點集合進行搜索,獲取轉移概率,為螞蟻移動做好準備。
4)迭代搜索
基于上述流程,對網絡節(jié)點進行搜索,并將搜索路徑添加至禁忌表中,直至搜索完成,計算螞蟻搜索路徑總長度。
5)判斷
對螞蟻搜索迭代次數(shù)進行判斷,是否開啟鄰域搜索模式。若開啟,則對搜索路徑進行反向變異操作。
6)將流程5)計算結果與螞蟻搜索結果進行對比,若低于螞蟻搜索路徑長度則對其進行替換處理。
7)更新信息素
對路徑的信息素進行更新,輸出路徑最優(yōu)解,獲取最佳融合值,完成網絡隱私數(shù)據(jù)融合。
為了驗證上述網絡隱私數(shù)據(jù)融合方法的整體有效性,需要對此方法進行測試。
分別采用面向網絡隱私數(shù)據(jù)融合的蟻群算法優(yōu)化方法(所提方法)、基于云計算的社交網絡安全隱私數(shù)據(jù)融合方法(文獻[3]方法)、基于分布式壓縮感知和散列函數(shù)的數(shù)據(jù)融合隱私保護算法(文獻[4]方法)進行測試;
網絡隱私數(shù)據(jù)在融合過程中,網絡生命周期的長短和網絡時延的高低都會影響數(shù)據(jù)融合算法的融合性能。采用所提方法、文獻[3]方法以及文獻[4]方法進行網絡隱私數(shù)據(jù)融合時,對上述影響指標進行測試。
1)網絡生命周期測試
網絡隱私數(shù)據(jù)在進行融合時,融合結果會影響網絡生命周期,融合方法的融合效果越好,網絡節(jié)點的負載均衡越穩(wěn)定,網絡生命周期越長。采用所提方法、文獻[3]方法以及文獻[4]方法融合網絡隱私數(shù)據(jù)時,測試三種方法網絡生命周期,結果如圖1所示。
圖1 不同融合方法的網絡生命周期測試結果
分析圖1可知,所提方法測試出的網絡生命周期高于文獻[3]方法以及文獻[4]方法測試結果,文獻[3]方法在測試次數(shù)為50時,所檢測出的網絡生命周期高于文獻[4]方法測試結果,但是當測試次數(shù)為100時,文獻[3]方法與文獻[4]方法檢測出的網絡生命周期一致,并隨著測試的進行文獻[4]方法超過文獻[3]方法的測試結果。由于所提方法測試出的網絡生命周期高,可以證明所提方法的數(shù)據(jù)融合性能好、網絡節(jié)點負載均衡。
2)網絡延時測試
進行網絡隱私數(shù)據(jù)融合時,網絡延時的高低是衡量數(shù)據(jù)融合性能的關鍵。數(shù)據(jù)在融合時,網絡延時越高說明數(shù)據(jù)融合方法的融合性能越差,反之則越好。采用所提方法、文獻[3]方法以及文獻[4]方法融合網絡數(shù)據(jù)時,測試三種方法的網絡延時,結果如圖2所示。
圖2 不同融合方法的網絡延時測試結果
分析圖2可知,所提方法在進行數(shù)據(jù)融合時,測試出的網絡延時低于其它兩種數(shù)據(jù)融合方法。這主要是因為所提方法在進行數(shù)據(jù)融合前對數(shù)據(jù)缺失值進行了插補處理,所以所提方法在進行數(shù)據(jù)融合時的網絡延時低,數(shù)據(jù)融合性能好。
近年來,隨著無線傳感技術的革新,無線傳感網絡結果愈加復雜多樣,網絡隱私數(shù)據(jù)融合的作用也變得更為重要。針對傳統(tǒng)數(shù)據(jù)融合方法中存在的問題,提出面向網絡隱私數(shù)據(jù)融合的蟻群算法優(yōu)化方法。該方法基于插補的缺失值提取網絡隱私數(shù)據(jù)特征;基于鄰域搜索算法優(yōu)化蟻群算法;最后通過優(yōu)化后的蟻群算法搜索網絡數(shù)據(jù)特征集,輸出最佳數(shù)據(jù)融合值,實現(xiàn)數(shù)據(jù)融合。由于該方法在提取數(shù)據(jù)特征時存在些許問題,今后會針對該項問題繼續(xù)優(yōu)化該融合方法。