梁鍾燁 曹奇英 沈士根
1(東華大學計算機科學與技術學院 上海 201620)2(紹興文理學院計算機科學與工程系 浙江 紹興 312000)3(嘉興學院數(shù)理與信息工程學院 浙江 嘉興 314001)
?
無線傳感網(wǎng)絡節(jié)點模糊信任演化模型
梁鍾燁1曹奇英1沈士根2,3
1(東華大學計算機科學與技術學院上海 201620)2(紹興文理學院計算機科學與工程系浙江 紹興 312000)3(嘉興學院數(shù)理與信息工程學院浙江 嘉興 314001)
針對無線傳感網(wǎng)絡中節(jié)點信任評估的模糊性以及信任決策動態(tài)演化問題,給出一種基于模糊理論的無線傳感網(wǎng)絡節(jié)點信任演化模型。該模型引入了節(jié)點的主觀信任模糊性,有效提高了信任值分類的精確度。以節(jié)點信任策略選擇的演化過程為基礎,推導出節(jié)點信任演化過程中的復制動態(tài)方程以及在某種條件下演化穩(wěn)定策略存在的定理,對傳感器節(jié)點的信任管理機制做出了改進。仿真說明了模糊信任值計算模型的健壯性,驗證了定理結(jié)論并分析了獎勵機制對穩(wěn)定狀態(tài)的影響。
無線傳感網(wǎng)絡模糊理論信任演化博弈獎勵機制
隨著現(xiàn)代通信技術的迅猛發(fā)展,隨著現(xiàn)代通信技術的飛速發(fā)展,無線傳感器網(wǎng)絡(WSNs)已成為近年來的學術熱點并廣泛應用于自動控制、生物醫(yī)療、信息檢索和人工智能等領域。WSNs由若干個可以感知外界的傳感器節(jié)點組成。通過轉(zhuǎn)發(fā)數(shù)據(jù)包的方式將傳感器節(jié)點監(jiān)測的數(shù)據(jù)從源節(jié)點開始以某條路徑逐步傳輸,傳輸中數(shù)據(jù)可能被多個節(jié)點處理,接力轉(zhuǎn)發(fā)匯聚到目的節(jié)點?,F(xiàn)有的傳感節(jié)點通過觀察節(jié)點的行為和特征,評估每個節(jié)點的可信程度以決定是否轉(zhuǎn)發(fā)數(shù)據(jù)包。因此,信任評估在數(shù)據(jù)包轉(zhuǎn)發(fā)中扮演著重要的角色,它決定了轉(zhuǎn)發(fā)的有效性、準確性,是得出最優(yōu)轉(zhuǎn)發(fā)機制的決定性因素之一。
對每個節(jié)點來講,選擇信任并轉(zhuǎn)發(fā)數(shù)據(jù)包可以提高信譽但會產(chǎn)生能耗,選擇不信任不轉(zhuǎn)發(fā)會影響信譽導致收益降低。因此,節(jié)點力求在信任與不信任中尋求最優(yōu)選擇機制,此理念與演化博弈求解目標一致。同時,節(jié)點的信任評估基于主觀信念,而“信任”概念本身就是模糊的,無法用一個準確的數(shù)字來刻畫該節(jié)點是可信任或不可信任的,這種不確定性使節(jié)點選擇信任機制上具有一定的模糊性。
傳統(tǒng)的節(jié)點信任模型對于節(jié)點信任選擇策略給出了不同的優(yōu)化方法。文獻[1]在節(jié)點信任度計算方法中引入了激勵機制;文獻[2]在節(jié)點信任演化模型中引入了反思機制;Crosby、Ganeriwal提出了基于古典概型、貝葉斯理論等概率理論的信任評估模型[3,4];文獻[5]描述了一種以數(shù)據(jù)為中心的信任評估機制(DTSN)。Yannis等人提出一種基于分布式信任管理系統(tǒng)的安全路由解決方案,它允許在一系列攻擊下進行快速檢測,并考慮了節(jié)能性[6]。Sakthidevi等人提出了一種基于模糊信任感知的路由框架,通過使用模糊化方法描述路由的節(jié)能性和信任的可靠性[7]。雖然上述模型在某種程度上優(yōu)化了節(jié)點信任選擇策略,但上述模型未考慮信任的主觀模糊性。
本文在文獻[1]的基礎上結(jié)合模糊理論,對節(jié)點信任程度進行量化定義,提高了信任值分類的精確度。以節(jié)點信任策略選擇的演化過程為基礎,推導出節(jié)點信任演化過程中的復制動態(tài)方程以及在某種條件下演化穩(wěn)定策略存在的定理,為傳感器節(jié)點信任管理機制的應用提供理論基礎。
1.1演化博弈論概述
演化博弈重點研究博弈理論的推導過程以及動態(tài)演化的推導過程。作為博弈論理論的新分支,演化博弈允許參與者具有不完全信息。因此,在重復動態(tài)博弈行為中,參與人可以根據(jù)自己的利益不斷修改自己的策略,最終在某一時刻下,整體結(jié)果達到穩(wěn)定狀態(tài),此狀態(tài)下即使某些個體發(fā)生突變,也不影響整體。博弈論研究了個體間競爭現(xiàn)象的數(shù)學理論和方法,預測它們的行為并優(yōu)化策略,其中演化博弈強調(diào)的是一種動態(tài)均衡?;谘莼┺牡膭討B(tài)理念,Taylor P等人提出了一種目前應用較廣泛的復制動態(tài)模型[8],它描述了獨立個體與群體的博弈過程,較好地呈現(xiàn)了群體在演化過程中的策略調(diào)整某些行為的變化趨勢。
1.2演化博弈與模糊理論的結(jié)合
無線傳感網(wǎng)絡中的節(jié)點信任度與傳感器的行為密切相關,節(jié)點間通過判斷節(jié)點信任度進行行為決策。各節(jié)點利用復制動態(tài)方程與群體進行博弈,通過不斷重復模擬交互過程,動態(tài)調(diào)整自己的信任選擇,以達到穩(wěn)定狀態(tài)。在Cantor的經(jīng)典集合論中,任何事物均需要明確其內(nèi)涵及外延。而在無線傳感網(wǎng)絡中,不能簡單地以二值邏輯將信任值分類。并且,某一區(qū)間內(nèi)的信任值可以同時屬于多個信任度子集并且對于每個信任度子集的隸屬度不一。這一問題就可以用模糊理論中提出的隸屬函數(shù)來描述。從本質(zhì)上來講,信任度隸屬函數(shù)會因為每個人對于信任概念的認知差異而不盡相同,無法找到一個統(tǒng)一的模式來準確地定義模糊集合,只能保證以最大程度優(yōu)化信任選擇結(jié)果而不能保證完美。顯然,若存在完美適應問題的隸屬函數(shù),那么模糊理論的“模糊性”也不復存在了。本文對模糊控制原理進行改造轉(zhuǎn)換,如圖1所示,根據(jù)模糊控制算法的幾個步驟對信任影響因素進行模糊控制。
圖1 模糊控制原理
2.1模型描述
我們知道信任博弈的建立有三個特性:傳感器節(jié)點行為具有有限理性、博弈的非零和性和重復性、傳感器節(jié)點策略決策時具有模仿性。因此節(jié)點信任的建立將在不斷地學習和變更策略中尋找最優(yōu)策略,這也意味著最終得出的結(jié)果不是一次選擇完成的,會在不斷地調(diào)節(jié)中趨于穩(wěn)定。為體現(xiàn)1.2節(jié)所描述的信任度主觀模糊性,結(jié)合演化博弈與模糊集相關知識對模型做如下定義:
定義1影響任意節(jié)點的信任度的信任因素都是通過數(shù)次交互得出來的精確值描述的。其中,可信度計算方法如下。
首先,定義變量。T表示節(jié)點的信任度集合;UT={t|t∈0,1]}為其論域;Tn表示模糊子集T={T1,T2,T3}={Distrust,Medium,Trust};μTn(t)為模糊子集隸屬函數(shù),也可表示為Tn(t)。μTn(t)的取值范圍為閉區(qū)間[0,1];μTn(t)的大小對應信任值t對于模糊子集Tn的隸屬度,μTn(t)從0變化到1,對應隸屬度從低到高。
其次,假設節(jié)點有m個信任因素(如轉(zhuǎn)發(fā)成功率,算法復雜度,丟棄篡改數(shù)據(jù)包行為統(tǒng)計,容錯能力等)Fi(i=1,2,…,m);ni表示第i個信任因素可分為n個模糊等級(如high,medium,low等);Li,n表示第i個信任因素的第n個等級對應的模糊子集;γi表示第i類信任因子;μLi,ni(γi)表示第i個信任因素的第n個等級對應模糊子集的隸屬函數(shù)。根據(jù)成堅在文獻[9]中提出的TEFL模型,羅列出每一個模糊等級可能對應的模糊子集,排列組合后,依據(jù)模糊規(guī)則重新將數(shù)據(jù)進分類。每個模糊子集的分類規(guī)則可根據(jù)信任因素的權重進行人為定義,例如,當半數(shù)以上的模糊因素的模糊等級對應的模糊子集為n,則經(jīng)推理規(guī)則分類后的模糊子集為T3。Q條模糊推理規(guī)則如下:
Rule 1ifF1isL1,1andF2isL2,1and…andFmisLm,1,thenTisT1;
Rule 2ifF1isL1,2andF2isL2,1and…andFmisLm,1,thenTisT1;
……
Rule QifF1isL1,n1 andF2isL2,n2 and…andFmisLm,n,thenTisT3;
最后,子集測度并運用模糊推論法對信任因子實際值進行推論,模糊輸出信任度值集合,利用高度法或重心法對模糊集合進行解模糊化,將推論所得模糊值轉(zhuǎn)換為明確的可信度T*:
(1)
定義2無線傳感網(wǎng)絡節(jié)點信任博弈模型為(N,S,U)。其中,N表示無線傳感網(wǎng)絡全部節(jié)點組成的參與者集合;S={S1,S2}={不轉(zhuǎn)發(fā),轉(zhuǎn)發(fā)}表示參與者策略集合,S由節(jié)點信任度T決定,二者之間關系如表1所示。值得注意的是,信任度為Medium時節(jié)點可以選擇S1或S2策略,具體根據(jù)定義1中的可信度計算方法自行定義選擇方式(不一定均分);U表示兩個參與者經(jīng)過一次博弈所得收益形成的支付矩陣。為敘述方便,記ET為節(jié)點選擇S2策略并成功轉(zhuǎn)發(fā)數(shù)據(jù)包帶來的收益,當節(jié)點選擇S1策略時收益為0;EC為節(jié)點因交互節(jié)點選擇S2策略并成功轉(zhuǎn)發(fā)數(shù)據(jù)包帶來的收益,當交互節(jié)點選擇S1策略時收益為0;C為節(jié)點自己發(fā)送數(shù)據(jù)包或轉(zhuǎn)發(fā)數(shù)據(jù)包而產(chǎn)生的開銷;W為節(jié)點選擇S1或交互節(jié)點選擇S1策略產(chǎn)生的損失;R為節(jié)點因選擇轉(zhuǎn)發(fā)得到的獎勵。
表1 信任度-策略表
假設所有節(jié)點數(shù)據(jù)包轉(zhuǎn)發(fā)成功的概率相同。任意兩個具有有限理性的節(jié)點進行交互時,可以根據(jù)信任度選擇轉(zhuǎn)發(fā)或不轉(zhuǎn)發(fā)。由于信任因素不同會導致每個節(jié)點的信任度不同,因此每次選擇的策略也會不同,形成的收益也會不同,下面以A、B節(jié)點的交互為例討論不同情況:
(1) A、B節(jié)點信任度都為Distrust或節(jié)點信任度為Medium的節(jié)點選擇S1策略,如表2中的情況1、2、5、6。此時,兩個節(jié)點皆選擇不轉(zhuǎn)發(fā)數(shù)據(jù)包,此時兩個節(jié)點收益均為-2W。
(2) A、B節(jié)點信任度都為Trust或節(jié)點信任度為Medium的節(jié)點選擇S2策略,如表2中的情況11、12、15、16。此時,兩個節(jié)點皆選擇轉(zhuǎn)發(fā)數(shù)據(jù)包,得到了轉(zhuǎn)發(fā)數(shù)據(jù)包帶來的收益ET以及獎勵R,又因為交互節(jié)點選擇轉(zhuǎn)發(fā)而得到了收益EC,另外,在自己發(fā)送或轉(zhuǎn)發(fā)數(shù)據(jù)包時產(chǎn)生開銷2C,此時,兩個節(jié)點收益均為ET+EC+R-2C。
(3) A、B節(jié)點因為信任度不同,一個選擇S1策略而另一個選擇S2策略,如表2中的情況3、4、7、8、9、10、13、14。此時,選擇S2策略的節(jié)點因轉(zhuǎn)發(fā)對方數(shù)據(jù)包而得到收益ET及獎勵R。同時,因轉(zhuǎn)發(fā)交互節(jié)點的數(shù)據(jù)包產(chǎn)生成本C,并且因交互節(jié)點選擇S1數(shù)據(jù)包無法送達而產(chǎn)生的損失為W。因此,節(jié)點的總收益為ET+R-C-W。選擇S1策略的節(jié)點因交互節(jié)點選擇S2策略而幫助自已轉(zhuǎn)發(fā)數(shù)據(jù)包得到了收益EC,同時自己發(fā)送數(shù)據(jù)包產(chǎn)生成本C,并且節(jié)點選擇S1導致數(shù)據(jù)包無法送達而產(chǎn)生損失W。此時,節(jié)點的總收益為EC-C-W。
表2 節(jié)點收益表
一次博弈的收益矩陣如表3所示。
表3 收益矩陣
2.2演化動力學分析
對于前面推出的微分方程,其均衡點須具有一定的穩(wěn)定性以及對微小擾動的抗干擾性,此時才能成為一個演化穩(wěn)定狀態(tài)x*,即須滿足條件F′(x*)<0。
本模型中,無線傳感網(wǎng)絡節(jié)點的信任度分為Distrust、Medium、Trust,對應可選擇的策略為S1(不轉(zhuǎn)發(fā))和S2(轉(zhuǎn)發(fā))。因此,設種群在h時刻的混合策略為x(h)={x1(h),x2(h)}。x(Distrust)表示在h時刻信任度為Distrust的節(jié)點的數(shù)量,x(MediumS1)表示在h時刻信任度為Medium的節(jié)點選擇S1的數(shù)量,x(MediumS2)表示在h時刻信任度為Medium的節(jié)點選擇S2的數(shù)量,x(Trust)表示在h時刻信任度為Trust的節(jié)點的數(shù)量。則,選擇S1策略的傳感器節(jié)點比例為:
(2)
選擇S2策略的傳感器節(jié)點比例為:
(3)
并有:
x1(t)+x2(t)=1
(4)
得出節(jié)點選擇S1策略的收益為:
u(S1,x(h))=x1(h)(-2W)+x2(h)(EC-C-W)
(5)
選擇S2策略的收益為:u(S2,x(h))=x1(h)(ET+R-C-W)+x2(h)(ET+EC+R-2C)
(6)
=x1(h)u(S1(h),x(h))+x2(h)u(S2(h),x(h))
(7)
因此,由文獻[10]給出的復制動態(tài)動力學方程可以得到節(jié)點模糊信任演化的復制動態(tài)動力學方程:
=x2(h)(1-x2(h))(ET+R-C+W)
(8)
令F(x) = 0,解出該模型的2個演化穩(wěn)定狀態(tài),分別為:
(9)
(10)
證明:
易得:
F′(x)=-2(ET+R-C+W)x+(ET+R-C+W)
(11)
F′(0)=ET+R-C+W
(12)
F′(1)=-(ET+R-C+W)
(13)
定理1表明唯一的納什均衡是雙方均選擇不轉(zhuǎn)發(fā)策略,無論參與交互的A節(jié)點選擇不轉(zhuǎn)發(fā)或轉(zhuǎn)發(fā)策略,B節(jié)點選擇不轉(zhuǎn)發(fā)的收益總是大于轉(zhuǎn)發(fā)的收益。當條件符合定理1時,無論演化過程如何,參與博弈的傳感器節(jié)點比例最終都會穩(wěn)定在不轉(zhuǎn)發(fā)策略,不信任策略都為節(jié)點達到穩(wěn)定狀態(tài)時的最終選擇。
定理2表明唯一的納什均衡是雙方均選擇轉(zhuǎn)發(fā)策略,無論參與交互的A節(jié)點選擇什么策略,B節(jié)點選擇轉(zhuǎn)發(fā)的收益總是大于不轉(zhuǎn)發(fā)的收益。當條件符合定理2時,無論演化過程如何,參與博弈的傳感器節(jié)點比例最終都會穩(wěn)定在轉(zhuǎn)發(fā)策略,信任策略都為節(jié)點達到穩(wěn)定狀態(tài)時的最終選擇,轉(zhuǎn)發(fā)策略成為無線傳感網(wǎng)絡信任博弈的嚴格占優(yōu)策略。
由定理1、定理2可知,為了保證無線傳感器網(wǎng)絡的穩(wěn)定性和安全性并盡量使節(jié)點選擇轉(zhuǎn)發(fā)策略,需最大化滿足定理2的條件。設計中加入的激勵機制,當交互中逐步增大滿足定理2條件的比例時,選擇不轉(zhuǎn)發(fā)策略的節(jié)點比例將逐漸降低,最終達到穩(wěn)態(tài)。定理1意味著節(jié)點在交互中會選擇不轉(zhuǎn)發(fā)策略的比例會遠大于選擇轉(zhuǎn)發(fā)策略的比例,這會導致無線傳感網(wǎng)絡處于不穩(wěn)定狀態(tài),操作時應盡量避免。
實驗基于Matlab 7.0平臺。首先分析模糊信任值計算模型,通過設置不同信任影響因素系數(shù)確定節(jié)點信任度,將節(jié)點信任度結(jié)果帶入演化博弈模型,接著設置ET、R、C、W的數(shù)值,模擬博弈過程,最后通過改變R值,模擬激勵機制對于整個博弈過程產(chǎn)生了什么影響。
3.1模糊信任值計算模型分析
為評估節(jié)點模糊信任度模型下對惡意節(jié)點的本地可信度t的影響,設置監(jiān)測區(qū)域為100×100 m2,節(jié)點數(shù)目100個,交互半徑為10 m隨機撒在區(qū)域內(nèi)。設惡意節(jié)點率為20%,丟包等惡意行為發(fā)生概率為0.70~0.99,本地信任值的更新周期為5 s。從圖2中可以分析出,當惡意節(jié)點進行信任補償時,可信度漸增;當網(wǎng)絡攻擊行為發(fā)生時,可信度驟降;惡意節(jié)點欺騙行為對節(jié)點的可信度有輕微影響,基本維持在0.1~0.2,說明該模型具有不錯的容錯性??梢?,模糊化有效地提升了節(jié)點信任度準確性,同時也降低了惡意攻擊所帶來的影響。
圖2 可信度變化
假設節(jié)點有2個信任因素,每個信任因素可分為3個模糊等級(high,medium,low)。如圖3所示,第i個信任因素的第n個等級對應模糊子集的隸屬函數(shù)為:
(12)
(13)
(14)
通過模糊蘊含關系與信任因子實際值推理合成可信度模糊輸出,再利用式(1)得出節(jié)點可信度T*,如圖3所示??梢钥闯鼋?jīng)模糊處理后的信任度較之前的更為精準,曲線更為平滑。由此得出的信任度數(shù)據(jù)在接下來的演化穩(wěn)定策略驗證試驗中會更可靠。
圖3 節(jié)點可信度
3.2演化穩(wěn)定策略數(shù)值驗證
為滿足定理1、定理2的條件,分別設定(1):ET=3、R=3、C=10、W=3;(2):ET=3、R=6、C=10、W=3。實驗結(jié)果如圖4所示。
圖4 信任演化曲線
3.3激勵機制的效果
圖5 激勵機制下的傳感器節(jié)點信任演化曲線
信任評估是無線傳感網(wǎng)絡中研究的重要方向之一,本文提出了一種基于模糊理論的無線傳感網(wǎng)絡節(jié)點信任演化模型。通過改進演化博弈的傳統(tǒng)的信任評估方式,利用模糊計算實現(xiàn)了對信任值的模糊分類。在此基礎上,施行獎勵機制,提高了模型演化中的收斂速率,使得模型更具有實際意義。引入模糊信任度計算可以提高信任分類及決策方案精確度,有利于提高無線傳感網(wǎng)絡節(jié)點互信度,使無線傳感網(wǎng)絡節(jié)點穩(wěn)定交互。給出的動態(tài)方程為尋找穩(wěn)定策略做了先決條件,在不同參數(shù)下,通過模擬節(jié)點博弈過程得出節(jié)點信任演化的規(guī)律,從而為網(wǎng)絡的管理與設計奠定了基礎。
[1] 沈士根,馬絢,蔣華,等.基于演化博弈論的 WSNs 信任決策模型與動力學分析[J].控制與決策,2012,27(8):1133-1138.
[2] 李紫川,沈士根,曹奇英.基于反思機制的 WSNs 節(jié)點信任演化模型[J].計算機應用研究,2014,31(5):1528-1531.
[3] Crosby G V,Pissinou N,Gadze J.A framework for trust-based cluster head election in wireless sensor networks[C]//Proceedings of IEEE Workshop on Dependability and Security in Sensor Networks and Systems,2006:13-22.
[4] Ganeriwal S,Balzano L K,Srivastava M B.Reputation-based framework for high integrity sensor networks[J].ACM Transactions on Sensor Networks,2004,4(3):66 - 77.
[5] Yu J,Buyya R.A taxonomy of workflow management systems for grid computing[J].Journal of Grid Computing,2005,3(3-4):171-200.
[6] Stelios Y,Papayanoulas N,Trakadas P,et al.A distributed energy-aware trust management system for secure routing in wireless sensor networks[J].LNICST,2009,13(1): 85-92.
[7] Sakthidevi I,Srievidhyajanani E.Secured fuzzy based routing framework for dynamic wireless sensor networks[C]//Proceedings of IEEE International Conference on Circuit,Power and Computing Technologies,2013: 1041-1046.
[8] Taylor P D,Jonker L B.Evolutionary stable strategies and game dynamics[J].Mathematical biosciences,1978,40(1): 145-156.
[9] 成堅,王宏新,鮑傳美,等.無線傳感器網(wǎng)絡中基于模糊邏輯的信任評估模型[J].測控技術,2012,31(4): 13-16.
[10] Fudenberg D.The theory of learning in games[M].MIT press,1998.
EVOLUTIONARY MODEL FOR FUZZY TRUST OF NODES IN WIRELESS SENSOR NETWORKS
Liang Zhongye1Cao Qiying1Shen Shigen2,3
1(CollegeofComputerScienceandTechnology,DonghuaUniversity,Shanghai201620,China)2(DepartmentofComputerScienceandEngineering,ShaoxingUniversity,Shaoxing312000,Zhejiang,China)3(CollegeofMathematics,PhysicsandInformationEngineering,JiaxingUniversity,Jiaxing314001,Zhejiang,China)
In order to solve the problems of trust evaluation fuzziness and dynamic evolution of trust decision for nodes in wireless sensor networks,this article presents a fuzzy theory-based evolutionary model for trust of nodes in WSNs.The model introduces the subjective trust fuzziness of nodes,and effectively improves the accuracy of trust value classification.On the basis of evolutionary process of trust strategy selection of sensor nodes,it deduces the replicator dynamic equation in sensor nodes’ trust evolution process and the theorem of evolutionary stable strategy existence under certain conditions,as well as improves the trust management mechanism of WSNs nodes.Simulation explains the robustness of fuzzy trust value calculation model,verifies the theorem conclusion and analyses the influence of incentive mechanism on steady-state.
Wireless sensor networks (WSNs)Fuzzy theoryTrustEvolutionary gameIncentive mechanism
2015-03-20。國家自然科學基金項目(61272034)。梁鍾燁,碩士生,主研領域:模式識別與人工智能、博弈論。曹奇英,教授。沈士根,教授。
TP393
A
10.3969/j.issn.1000-386x.2016.08.029