徐翔 沈士根 曹奇英
摘 要:如何有效優(yōu)化現(xiàn)有無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中DoS/DDoS攻擊的防御策略是當(dāng)前的研究熱點(diǎn)問(wèn)題之一。本文結(jié)合目前無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中的防御技術(shù),利用博弈論的方法建立模型。該模型通過(guò)優(yōu)化防火墻閥值和針對(duì)攻擊節(jié)點(diǎn)給予懲罰措施的方法,來(lái)降低攻擊節(jié)點(diǎn)的收益,使理性攻擊者放棄攻擊,從而達(dá)到了有效防御DoS/DDoS攻擊的目的。最后實(shí)驗(yàn)通過(guò)比較現(xiàn)有的防御策略與提出的優(yōu)化策略,驗(yàn)證了該防御優(yōu)化策略的有效性,從而達(dá)到了防御DoS/DDoS攻擊的目的。
關(guān)鍵詞:無(wú)線(xiàn)傳感器網(wǎng)絡(luò);DoS/DDoS攻擊;博弈論;防御策略?xún)?yōu)化
中圖分類(lèi)號(hào):TP393.0 文獻(xiàn)標(biāo)識(shí)號(hào):A
Abstract: In Wireless Sensor Networks(WSNs), how to defense DoS/DDoS attack efficiently is one of the challenging security problems. This paper combined with the current defense strategies in WSNs, establishes the model based on game theory. This model prevents malicious nodes from DoS/DDoS attack by optimizing the threshold of firewall and giving malicious nodes punishment, which lower the income of the malicious nodes. Finally, the experiments further verify the efficiency of the proposed optimized defense strategies by comparing the present defense strategies and the optimized ones, to achieve the purpose of preventing DoS/DDoS attack.
Keywords: WSNs; DoS/DDoS Attack; Game Theory; Defense Strategies Optimization
0 引言
近年來(lái),無(wú)線(xiàn)傳感器網(wǎng)絡(luò)(Wireless Sensor Networks,簡(jiǎn)稱(chēng)WSNs)在軍事、農(nóng)業(yè)、環(huán)境監(jiān)測(cè)等各個(gè)領(lǐng)域都有廣泛的應(yīng)用。這是一種全新的信息獲取、處理和傳輸技術(shù)。由于無(wú)線(xiàn)傳感器網(wǎng)絡(luò)具有組網(wǎng)快捷、靈活、不受有線(xiàn)網(wǎng)絡(luò)約束等特點(diǎn),使得無(wú)線(xiàn)傳感器網(wǎng)絡(luò)作為現(xiàn)代通信技術(shù)中一個(gè)新的研究領(lǐng)域,引起了學(xué)術(shù)界和工業(yè)界的高度重視。但是,又因?yàn)閃SNs具有通信能力有限,節(jié)點(diǎn)能量有限、動(dòng)態(tài)的網(wǎng)絡(luò)拓?fù)涞冉Y(jié)構(gòu)特點(diǎn),使得WSNs容易受到攻擊,因而網(wǎng)絡(luò)安全引起了人們的極大關(guān)注,各種預(yù)防網(wǎng)絡(luò)攻擊的安全措施相繼被提出。
在眾多的網(wǎng)絡(luò)攻擊中,拒絕服務(wù)攻擊(Denial of Service,簡(jiǎn)稱(chēng)DoS攻擊)的危害尤為嚴(yán)重[1]。當(dāng)攻擊者控制大量的節(jié)點(diǎn)進(jìn)行DoS攻擊時(shí),這種攻擊方式就被歸類(lèi)為分布式拒絕攻擊(Distributed Denial of Service,簡(jiǎn)稱(chēng)DDoS攻擊)。攻擊者在WSNs中發(fā)起DoS/DDoS攻擊時(shí),一般會(huì)通過(guò)持續(xù)發(fā)送重放或偽造的報(bào)文給網(wǎng)絡(luò)中的某些節(jié)點(diǎn)的方法,使這些節(jié)點(diǎn)不停的轉(zhuǎn)發(fā)數(shù)據(jù)包,從而導(dǎo)致有限的節(jié)點(diǎn)能量被迅速消耗殆盡,最后導(dǎo)致WSNs的癱瘓。
近年來(lái),大量學(xué)者對(duì)WSNs中的DOS/DDoS攻擊的防御策略的研究問(wèn)題表現(xiàn)出了極大的興趣,紛紛展開(kāi)了該領(lǐng)域的研究工作 [2-6]。針對(duì)無(wú)線(xiàn)傳感器網(wǎng)絡(luò)安全問(wèn)題,不少學(xué)者提出使用博弈論的方法來(lái)解決在WSNs中的DoS/DDoS防御問(wèn)題,這也是研究方向之一[7-10]。文獻(xiàn)[11]總結(jié)了如何用不同的博弈模型研究WSNs中的安全問(wèn)題。文獻(xiàn)[12]介紹了一種基于博弈論的DDoS入侵檢測(cè)防御策略。文獻(xiàn)[13]給出了在WSNs中Dos/DDoS攻擊的協(xié)議分析。本文在上述文獻(xiàn)的基礎(chǔ)上,提出了一種基于兩個(gè)參與者、非合作非零和博弈的模型,用來(lái)分析WSNs中DoS/DDoS的防御策略?xún)?yōu)化問(wèn)題?,F(xiàn)有的WSNs網(wǎng)絡(luò)防御技術(shù)分兩種比較普遍的方式。第一種方式就是建立防火墻,這是防御WSNs中DoS/DDoS攻擊最直接的策略,通過(guò)直接過(guò)濾速率較高的數(shù)據(jù)流來(lái)進(jìn)行防御;第二種方式是采用入侵檢測(cè)系統(tǒng),對(duì)檢測(cè)到的攻擊節(jié)點(diǎn)采取措施。本文針對(duì)WSNs的網(wǎng)絡(luò)拓?fù)涞奶攸c(diǎn),結(jié)合上述兩種防御方式,使用博弈模型進(jìn)行策略?xún)?yōu)化。
本文選擇的博弈模型優(yōu)點(diǎn)在于模型的靈活性高,可以在保持具體方法不變的前提下,根據(jù)不同的WSNs網(wǎng)絡(luò)環(huán)境調(diào)整對(duì)應(yīng)的參數(shù),這樣的模型適用于實(shí)際應(yīng)用。本文的創(chuàng)新點(diǎn)在于,利用簡(jiǎn)單的博弈模型將上述使用的兩種防御措施相結(jié)合;另外,本文提出了一種通用的防御優(yōu)化方式,在實(shí)際使用時(shí)可以根據(jù)具體的WSNs環(huán)境設(shè)置相應(yīng)的參數(shù),因此,該策略適用于不同的WSNs網(wǎng)絡(luò)環(huán)境。
1 背景知識(shí)
博弈論是研究存在利益沖突的參與者之間的行為和決策的理論和方法。博弈論也可以被理解為用于模擬兩個(gè)或兩個(gè)以上的決策者在一定條件下相互作用的關(guān)系[14]。具體就是通過(guò)嚴(yán)格的數(shù)學(xué)理論和模型推導(dǎo),在各種策略之間進(jìn)行利益權(quán)衡,從而選擇對(duì)參與者自身最有利的策略。本文將WSNs中DoS/DDoS攻擊看作是攻擊者和防御者的相互關(guān)系,攻擊者和防御者都會(huì)選擇對(duì)自己最有利的策略以實(shí)現(xiàn)自己的利益最大化。一般來(lái)說(shuō),決策者可以分為理性決策者和非理性決策者。理性決策者在選擇決策時(shí)會(huì)考慮他人的策略,而非理性決策者不會(huì)。在大多數(shù)的博弈模型中,決策者都是理性決策者。
在博弈過(guò)程中,每個(gè)決策者都以自己的利益最優(yōu)作為選擇決策的依據(jù),由于每個(gè)決策者做出的決策會(huì)影響其他的決策者的利益,所以納什均衡(Nash equilibrium)的概念就被提了出來(lái)。納什均衡又被稱(chēng)為非合作博弈均衡,是一種策略組合,使得每個(gè)參與者的決策是對(duì)其他參與者策略的最優(yōu)反應(yīng)。如果一個(gè)博弈存在納什均衡,而決策者沒(méi)有選擇納什均衡中的策略的話(huà),那么其收益一定低于選擇納什均衡中的策略帶來(lái)的收益。
博弈模型的類(lèi)型可以根據(jù)博弈的參與者之間是否存在約束性的條件或者一致達(dá)成堅(jiān)不可破的聯(lián)盟而被劃分為合作博弈和非合作博弈。決策者根據(jù)各自的策略集來(lái)判斷是否合作。在DoS/DDoS攻擊中,攻擊者和防御者沒(méi)有相互的合作關(guān)系,因此這個(gè)模型屬于非合作博弈。此外博弈模型又可以劃分為零和博弈與非零和博弈。當(dāng)決策者的總收益之和存在變化時(shí),這種博弈類(lèi)型稱(chēng)為非零和博弈。
2 基于博弈模型的防御策略?xún)?yōu)化
2.1 概述
本文基于WSNs現(xiàn)有的防御方式,利用博弈模型實(shí)現(xiàn)防御策略?xún)?yōu)化的目的。其中,博弈模型是一個(gè)基于兩個(gè)參與者的非合作一次零和博弈。為了更好地刻畫(huà)攻擊者和防御者之間的關(guān)系,該模型包括了DoS/DDoS攻擊者和防御者考慮的多個(gè)因素。在該博弈模型中,攻擊者的目標(biāo)是找到最優(yōu)的攻擊配置參數(shù),以此達(dá)到花費(fèi)最小,收益最大的目的;而另一方面,防御者的目的也是找到最優(yōu)的防御配置參數(shù),以此來(lái)降低攻擊者的收益。本文假定攻擊者是一個(gè)理性的攻擊者,也就是說(shuō)攻擊者總是以收益最大化作為自己的目的。由于本文的模型是一個(gè)一次博弈模型,這也就意味著雙方選定策略之后,將不會(huì)改變各自相應(yīng)策略直到博弈結(jié)束;而非零和博弈意味著,攻擊者與防御者的收益公式將分開(kāi)計(jì)算,并且攻擊者與防御者的收益之間沒(méi)直接的聯(lián)系。當(dāng)找到了博弈模型中的納什均衡點(diǎn)時(shí),就表示找到了優(yōu)化策略的最優(yōu)解。
2.2 網(wǎng)絡(luò)拓?fù)浼艾F(xiàn)有的防御措施
本文使用文獻(xiàn)[15]中的網(wǎng)絡(luò)拓?fù)洹D1中的網(wǎng)絡(luò)拓?fù)涫荳SNs中常見(jiàn)的網(wǎng)絡(luò)拓?fù)鋱D。圖1中間的部分就是WSNs,與其相連的可能有Internet以及其他的無(wú)線(xiàn)網(wǎng)絡(luò)。WSNs采取聚簇結(jié)構(gòu),每個(gè)簇中有一個(gè)Sink節(jié)點(diǎn)(Sink Node)以及一些傳感器節(jié)點(diǎn)(Sensor Node)。Sink節(jié)點(diǎn)監(jiān)控每一個(gè)傳感器節(jié)點(diǎn)的行為,并將傳感器的信息發(fā)送給基站(Base Station),最后通過(guò)基站與其他網(wǎng)絡(luò)連接。由于WSNs的資源有限性,Sink節(jié)點(diǎn)到基站的帶寬是存在瓶頸的,而WSNs與其他網(wǎng)絡(luò)連接時(shí),其帶寬可以假設(shè)不存在瓶頸。
圖2顯示了當(dāng)WSNs網(wǎng)絡(luò)中存在正常節(jié)點(diǎn)以及攻擊節(jié)點(diǎn)時(shí),防御措施是如何工作的。在Sink節(jié)點(diǎn)到基站中間中會(huì)有兩層防御設(shè)施。首先,第一層的防火墻會(huì)將數(shù)據(jù)包速率超過(guò)閾值的數(shù)據(jù)包丟棄。之后的第二層防御措施是一個(gè)入侵檢測(cè)系統(tǒng),當(dāng)有攻擊行為被檢測(cè)出來(lái)時(shí),系統(tǒng)會(huì)發(fā)出警告。
2.3優(yōu)化策略的引入
本文提出了兩種優(yōu)化策略:
(1)給出優(yōu)化的防火墻閥值,以達(dá)到最優(yōu)的防御效果。因?yàn)楝F(xiàn)有的防火墻措施是將速率超過(guò)一定閾值的數(shù)據(jù)包丟棄,然而,這個(gè)閾值如何設(shè)定比較合理,很難做出判斷。如果閾值設(shè)定得過(guò)高將使防御效果降低,但是過(guò)低的閾值也會(huì)導(dǎo)致正常的節(jié)點(diǎn)無(wú)法使用。
(2))針對(duì)檢測(cè)出的攻擊節(jié)點(diǎn)給予一個(gè)優(yōu)化的懲罰值。現(xiàn)有的入侵檢測(cè)系統(tǒng)缺乏懲罰措施,使得攻擊節(jié)點(diǎn)無(wú)須考慮攻擊行為對(duì)后續(xù)收益的影響[16]。
實(shí)際上,攻擊者的總收益取決于以下四個(gè)因素:
(1)被攻擊節(jié)點(diǎn)消耗的平均帶寬;(2)由于瓶頸的限制而導(dǎo)致正常節(jié)點(diǎn)數(shù)據(jù)包丟失的數(shù)量;(3)攻擊者使用的攻擊節(jié)點(diǎn)的數(shù)量[15];(4)被防御措施懲罰的時(shí)間。
其中,(1)和(2)中的收益是正收益,而(3)和(4)中的收益是負(fù)收益。如果攻擊節(jié)點(diǎn)在攻擊之后會(huì)得到懲罰,使得攻擊的成本大于收益,那么,一個(gè)理性的攻擊者將不采取攻擊的行為,從而有效地遏制攻擊行為。
2.4優(yōu)化策略的計(jì)算
本文的博弈模型中,參與者是攻擊者與防御者。攻擊者的行動(dòng)分為攻擊與不攻擊兩種,記為行動(dòng)集 。而對(duì)于防御者而言,由于WSNs的資源有限性以及開(kāi)啟防御措施的能量消耗,防御者在實(shí)際中并不一定需要時(shí)時(shí)刻刻地開(kāi)啟防御措施,因此,防御者的行動(dòng)為防御與不防御,記為行動(dòng)集 。最終的博弈行動(dòng)集記為 。由于攻防雙方選擇策略時(shí)均無(wú)限制,所以最終的博弈策略空間為 。
攻擊者與防御者每個(gè)人選擇一個(gè)策略,那么n維向量 稱(chēng)為一個(gè)策略組合,其中 是參與者i選擇的策略。用 表示參與者選擇其策略集j策略。對(duì)于特定的策略組合,參與者i的收益記為 。由于這里的博弈模型是非零和博弈,所以對(duì)于收益滿(mǎn)足如下公式:
2.4.1 WSNs網(wǎng)絡(luò)
假定在WSNs網(wǎng)絡(luò)中,包括正常節(jié)點(diǎn) 是正常節(jié)點(diǎn)數(shù))和攻擊節(jié)點(diǎn) 是攻擊節(jié)點(diǎn)數(shù))。DoS攻擊可以看作是攻擊節(jié)點(diǎn)數(shù)a為1的DDoS攻擊。所有的節(jié)點(diǎn)發(fā)送的都是基于UDP協(xié)議的數(shù)據(jù)包。在模擬UPD數(shù)據(jù)流時(shí),通常認(rèn)為UDP數(shù)據(jù)包的速率服從某一種確定的概率分布或者是多種概率分布的混合,比如正態(tài)分布、指數(shù)分布、對(duì)數(shù)分布等等。在本文的模型中,每一個(gè)合法節(jié)點(diǎn)以某一種速率發(fā)送數(shù)據(jù)包到基站,這種速率是服從泊松分布的,如公式(2)所示:
公式(2)中, 表示正常節(jié)點(diǎn)發(fā)送的數(shù)據(jù)包速率, 是正常節(jié)點(diǎn)發(fā)送數(shù)據(jù)包速率的數(shù)學(xué)期望。為了模擬合法的數(shù)據(jù)流的流率,攻擊節(jié)點(diǎn)也同樣地使自身的發(fā)包速率服從概率分布,這個(gè)概率分布 可能是泊松分布 ,或指數(shù)分布 ,或正態(tài)分布 。這里的 是攻擊節(jié)點(diǎn)速率的數(shù)學(xué)期望, 是攻擊節(jié)點(diǎn)速率的方差。之所以考慮指數(shù)分布和正態(tài)分布是為了考慮多種因素以更好地概括攻擊者的行為。
2.4.2 攻擊者收益
在計(jì)算攻擊者收益時(shí),需要考慮2.4概述中提到博弈空間的四種策略組合,必須結(jié)合防御者選擇的策略,然后才能分別進(jìn)行計(jì)算。本節(jié)將依次計(jì)算四種策略組合下的攻擊者收益。
(1)攻擊者選擇不攻擊,防御者選擇不防御時(shí):
由于攻擊者選擇不攻擊,所以攻擊者額外的消耗帶寬,沒(méi)有導(dǎo)致正常節(jié)點(diǎn)的數(shù)據(jù)包丟失,自身沒(méi)有消耗額外的能量,也不會(huì)被防御措施懲罰。在這種情況下,攻擊者的收益為0,可以用公式(3)表示:
(2)攻擊者選擇不攻擊,防御者選擇防御時(shí):
攻擊者的收益同情況(1)相同,如下所示:
(3) 攻擊者選擇攻擊,防御者選擇不防御時(shí):
由于防御者選擇不防御,防火墻與入侵檢測(cè)系統(tǒng)將不會(huì)影響攻擊節(jié)點(diǎn)。所以攻擊者的收益只受三部分影響: , 和 。定義 是被攻擊者消耗的平均帶寬, 是正常節(jié)點(diǎn)數(shù)據(jù)包丟失的比率, 是轉(zhuǎn)化的代價(jià)。 的計(jì)算方式如公式(6)所示:
在計(jì)算 時(shí),由于UPD協(xié)議為了保持通訊需要發(fā)送心跳包,所以為了保持協(xié)議,數(shù)據(jù)包的速率有一個(gè)最低值,低于該速率的數(shù)據(jù)包不能傳送到目的地。定義 是可以傳送數(shù)據(jù)包的最低速率, 是瓶頸處的帶寬上限,則 如公式(6)所示:
公式中, 表示 比 小的概率。定義 ,分別是被攻擊節(jié)點(diǎn)消耗的平均帶寬、正常節(jié)點(diǎn)的丟失比率和使用的僵尸節(jié)點(diǎn)數(shù)的權(quán)重系數(shù),攻擊者的收益如公式(7)所示:
(4) 攻擊者選擇攻擊,防御者選擇防御時(shí):
在計(jì)算該部分時(shí)需要考慮防火墻與入侵檢測(cè)系統(tǒng)。在實(shí)際過(guò)程中,由于防火墻的存在,無(wú)論是正常節(jié)點(diǎn)還是攻擊者,速率高的數(shù)據(jù)包將會(huì)被防火墻攔截。這個(gè)情況導(dǎo)致了正常節(jié)點(diǎn)的平均速率發(fā)生了改變;同時(shí),攻擊節(jié)點(diǎn)的平均速率也會(huì)因?yàn)榉阑饓Φ臄r截發(fā)生改變。假定防火墻攔截?cái)?shù)據(jù)包的速率閾值為 ,公式(8)和(9)表示了新的速率是如何計(jì)算的:
再考慮入侵檢測(cè)系統(tǒng),假設(shè)攻擊者的某一個(gè)攻擊節(jié)點(diǎn)在持續(xù)攻擊了 時(shí)間之后,以概率 被檢測(cè)出是攻擊節(jié)點(diǎn),那么在被檢測(cè)出是攻擊節(jié)點(diǎn)的基礎(chǔ)上,入侵檢測(cè)系統(tǒng)將會(huì)持續(xù) 段時(shí)間丟棄該節(jié)點(diǎn)的數(shù)據(jù)包,而這個(gè)主動(dòng)丟棄的措施對(duì)于攻擊者來(lái)說(shuō)是透明的,攻擊者在 段時(shí)間的攻擊就相當(dāng)于沒(méi)有任何收益的。假設(shè)攻擊節(jié)點(diǎn)在攻擊 時(shí)間之后恒定地以 的概率被檢測(cè)出來(lái),被懲罰 段時(shí)間,那么攻擊者在這段時(shí)間的收益可以用兩部分來(lái)表示,如公式(12)所示:
上述公式中, 是數(shù)據(jù)包的速率, 是縮放因子, 是影響參數(shù),是瓶頸處的帶寬上限。圖3給出了不同值的情況下,檢測(cè)率 的變化趨勢(shì)。從圖中可以分析得出,不一樣的影響參數(shù)將會(huì)得到不一樣的檢測(cè)率曲線(xiàn)。對(duì)于速率較低的數(shù)據(jù)包,檢測(cè)率將比較高;而對(duì)于速率較高的數(shù)據(jù)包,檢測(cè)率將會(huì)降低,但是由于防火墻的存在,所以速率較高的數(shù)據(jù)包有很大的可能性在第一層防御的時(shí)候就被攔截。
2.4.3 防御者收益
影響防御者的收益的主要因素有如下幾點(diǎn):
(1)正常用戶(hù)消耗的平均帶寬;(2)防御措施成功防御的攻擊;(3)防御措施自生消耗的能量;(4)防御措施將正常用戶(hù)攔截的數(shù)量。上述的這四點(diǎn)中,第一點(diǎn)與第二點(diǎn)均是啟用防御措施帶給防御者的正收益,而第三點(diǎn)與第四點(diǎn)則是負(fù)收益。
同攻擊者的收益計(jì)算方式相同的是,計(jì)算防御者收益時(shí)同樣必須按照策略的組合分四種情況進(jìn)行分析討論。
(1) 攻擊者選擇不攻擊,防御者選擇不防御時(shí):
在這種情況下,由于攻擊者沒(méi)有采取任何攻擊行為,所以防御者的收益只有正常用戶(hù)消耗的平均帶寬帶來(lái)的收益。定義 是正常節(jié)點(diǎn)消耗帶寬的權(quán)重系數(shù),防御者的收益如公式(17)所示:
(2) 攻擊者選擇不攻擊,防御者選擇防御時(shí):
定義 是啟用防御措施而帶來(lái)的消耗的權(quán)重系數(shù),是由于防御措施而導(dǎo)致受影響的正常節(jié)點(diǎn)數(shù)的權(quán)重系數(shù),則這種情況下防御者的收益如公式(18)所示:
(3) 攻擊者選擇攻擊,防御者選擇不防御時(shí):
在這種情況下,由于防御者沒(méi)有采取任何的防御措施,將不會(huì)有攻擊者被攔截。但是相對(duì)地,也沒(méi)有產(chǎn)生任何因防御措施帶來(lái)的消耗。由于瓶頸處的帶寬上限,將會(huì)有部分的正常節(jié)點(diǎn)被丟棄,這也會(huì)對(duì)防御者的收益產(chǎn)生影響。防御者的收益公式如下:
(4) 攻擊者選擇攻擊,防御者選擇防御時(shí):
由于攻擊者的攻擊,使得正常節(jié)點(diǎn)消耗的平均帶寬下降。啟用防御措施會(huì)帶來(lái)消耗,但是啟用了防御措施后,將使攻擊的數(shù)量下降,防火墻將攔截速率高的攻擊節(jié)點(diǎn),入侵檢測(cè)系統(tǒng)通過(guò)檢測(cè)將給予懲罰。另外,啟用防御措施帶來(lái)不利的一面就是會(huì)影響正常節(jié)點(diǎn)的工作。定義是成功防御攻擊節(jié)點(diǎn)的權(quán)重系數(shù),則防御者具體的收益公式如下:
2.4.4 納什均衡計(jì)算
本文中,非零和博弈的收益矩陣如表4所示。
在表1的基礎(chǔ)上,結(jié)合2.4.2與2.4.3中收益的計(jì)算公式,并根據(jù)攻擊者選擇的決策進(jìn)行討論。
由于該博弈是一個(gè)純策略博弈,那么在這種模型下,只需找到攻擊者與防御者的納什均衡,即能選擇防御者的策略。通過(guò)計(jì)算可以發(fā)現(xiàn),在防御者選擇防御時(shí),攻擊者選擇攻擊的收益大于不攻擊的收益,在防御者選擇不防御時(shí),攻擊者同樣是選擇攻擊的收益較高,所以攻擊者一定會(huì)選擇進(jìn)行攻擊;防御者的計(jì)算方式也是相同的,所以博弈中策略組合(攻擊,防御)是一個(gè)納什均衡。
由于該博弈是非合作博弈,所以防御者的目的是使自身的收益提高,對(duì)方的收益下降,也就是使雙方的收益變大。定義攻擊者的參數(shù)集是 ,防御者的參數(shù)集是( )。公式(21)是防御者參數(shù)集的計(jì)算方式。
綜上所述,防御者只需在特定的WSNs環(huán)境中,找到滿(mǎn)足公式(21)的參數(shù)組合,就是防御者最終得到的優(yōu)化策略。
3實(shí)驗(yàn)分析
為了更好地解釋實(shí)際情況中納什均衡的計(jì)算,本節(jié)將對(duì)WSNs中的參數(shù)進(jìn)行設(shè)置,并使用工具模擬在假定環(huán)境下的納什均衡解。
假設(shè)正常節(jié)點(diǎn)數(shù) ,節(jié)點(diǎn)發(fā)送的數(shù)據(jù)包速率服從泊松分布并且平均速率 ;Sink節(jié)點(diǎn)到基站的數(shù)據(jù)通訊瓶頸限制是5Mbps;使協(xié)議保持通訊至少需要的速率是 設(shè)定如下的限制: (僅限正態(tài)分布)。
首先討論在攻擊者選擇攻擊,防御者選擇防御的情況下,攻擊者的收益情況。由于最后的收益公式相對(duì)較為復(fù)雜,本文采取從簡(jiǎn)到繁的方法,一步一步討論。圖4表示的是攻擊者的收益,攻擊者發(fā)送的數(shù)據(jù)流服從泊松分布,。在這個(gè)例子中,攻擊者能調(diào)整的參數(shù)只有僵尸節(jié)點(diǎn)的數(shù)量,防御者能調(diào)整的參數(shù)只有閥值??梢钥吹剑?dāng)值低的時(shí)候,攻擊者的收益很高,這是因?yàn)檫^(guò)低的值提高了丟棄正常節(jié)點(diǎn)的數(shù)據(jù)包的概率。另一方面,當(dāng)防御者提高其閾值時(shí),攻擊者的收益降低了,這個(gè)是符合理論的事實(shí),因?yàn)殚撝堤岣撸^少的正常的節(jié)點(diǎn)被防火墻攔截。同時(shí)觀(guān)察到,當(dāng)攻擊者增加其僵尸節(jié)點(diǎn)數(shù)量時(shí),所收益降低,這也是符合事實(shí)的一點(diǎn)。納什均衡的點(diǎn)是攻擊者使用89個(gè)僵尸節(jié)點(diǎn),防火墻的值在128時(shí)。這時(shí)的收益是。
圖4是博弈中的一個(gè)子博弈,在圖4的基礎(chǔ)上,進(jìn)一步地模擬攻擊者的模型。在第2節(jié)中已提到,攻擊者發(fā)送的數(shù)據(jù)包的速率不是單一地服從泊松分布的,速率可以服從泊松分布,正態(tài)分布或者是指數(shù)分布,那么將這些情況都考慮進(jìn)來(lái),構(gòu)成包含多種分布的子博弈。具體的計(jì)算過(guò)程如算法1所示。
如圖5所示,具體顯示了不同概率分布,不同速率下的納什均衡點(diǎn)。在攻擊者選擇泊松分布的情況下,攻擊者的最高收益出現(xiàn)在速率為88Kbps時(shí),最高收益是504;在攻擊者選擇正態(tài)分布的情況下,攻擊者的最高收益出現(xiàn)在速率為99Kbps時(shí),最高收益是604;在攻擊者選擇指數(shù)分布的情況下,攻擊者的最高收益出現(xiàn)在速率為100Kbps時(shí),最高收益是630。從圖5中可以發(fā)現(xiàn),選擇指數(shù)分布在該WSNs環(huán)境中幾乎都是優(yōu)于其他分布的。
再計(jì)算防御方的收益,防御者在考慮攻擊者不同速率的情況下,防御者的自身最高收益如圖6所示。
從圖6可以看出,在攻擊者速率較低的時(shí)候,防御者的收益較大,同時(shí),隨著防火墻閥值的上升,防御者的收益不斷上升;而當(dāng)攻擊者速率上升的時(shí)候,防御者的收益有所下降,這是由于攻擊者占用的帶寬不斷上升的原因,并且此時(shí),隨著防火墻閾值的上升,防御者的收益不再是一直上升,而是到達(dá)某一個(gè)值之后就開(kāi)始出現(xiàn)下滑,說(shuō)明隨著閾值的上升,防御的效果變得不再明顯。假設(shè)當(dāng)攻擊者發(fā)送的數(shù)據(jù)包速率為100時(shí),防火墻設(shè)到70時(shí)將使防御者收益最高。
而最后真正決定防火墻閥值 與懲罰系數(shù) 應(yīng)該取何值,還是需要計(jì)算防御者與攻擊者收益的差值,圖7顯示了不同防火墻閥值與不同懲罰系數(shù) 的情況下,收益的差值情況。
從圖中可以看出,在懲罰系數(shù)選擇為0.83,并且防火墻閾值選擇在150時(shí),防御者與攻擊者的收益差值最大。表2顯示了攻防雙方最高收益下的參數(shù)配置:
綜上所述,在實(shí)驗(yàn)給定的WSNs環(huán)境下,防御者將防火墻的閥值設(shè)定在150Kbps,懲罰系數(shù) 的條件下,會(huì)使攻擊者收益降到最低。與現(xiàn)有的防御策略相比較,首先,現(xiàn)有的防火墻閾值如果沒(méi)有設(shè)定在最優(yōu)值,攻方雙方的收益差可能得到更高的收益,而將閾值設(shè)定在最優(yōu)值上,無(wú)論攻擊者如何更改攻擊參數(shù),在理論上攻防雙發(fā)的收益差降到最低;其次,現(xiàn)有的入侵檢測(cè)系統(tǒng)的警告作用并不能降低攻擊者的收益,而引入懲罰機(jī)制會(huì)使攻擊者的收益進(jìn)一步的降低。實(shí)驗(yàn)表明,提出的兩個(gè)防御優(yōu)化策略能使防御效果更加有效。
另外,本實(shí)驗(yàn)是在確定的參數(shù)下進(jìn)行分析,通過(guò)模擬分析防御策略?xún)?yōu)化的有效性。通過(guò)其他實(shí)驗(yàn)發(fā)現(xiàn),在本文的博弈模型基礎(chǔ)上,利用參數(shù)調(diào)節(jié)來(lái)設(shè)置不同的WSNs環(huán)境,提出的防御優(yōu)化策略同樣有效。
4 結(jié)束語(yǔ)
本文針對(duì)WSNs中DoS/DDoS攻擊防御的過(guò)程,利用博弈論的方法進(jìn)行建模。在現(xiàn)有的防御措施防火墻以及入侵檢測(cè)系統(tǒng)的基礎(chǔ)上,分別提出了如何合理有效地設(shè)置防火墻閾值,以及在入侵檢測(cè)系統(tǒng)中引入懲罰措施的優(yōu)化策略,使得攻擊節(jié)點(diǎn)的收益降低,從而達(dá)到有效防御的效果。本文提出的優(yōu)化策略可以適用于不同WSNs環(huán)境,為WSNs中DoS/DDoS攻擊防御策略?xún)?yōu)化提供了理論的基礎(chǔ)。
參考文獻(xiàn):
[1] FOUCHAL S, MANSOURI D, MOKDAD L, et al. Recursive-clustering-based approach for denial of service (DoS) attacks in wireless sensors networks[J]. International Journal of Communication Systems. 2015, 28(2): 309-324.
[2] RAJA K N, BENO M M. On securing Wireless Sensor Network-Novel authentication scheme against DOS attacks[J]. Journal of Medical Systems. 2014, 38(10):84-85.
[3] LEE S M, KIM D S, LEE J H. Detection of DDoS attacks using optimized traffic matrix[J]. Computers and Mathematics with Applications, 2012, 63(2): 501-510.
[4] 李晉,曹曉梅. WSN中抗DoS攻擊的廣播認(rèn)證方案[J]. 計(jì)算機(jī)應(yīng)用. 2014, (S1): 43-46.
[5] WANG H, JIA Q, DEN F. A moving target DDoS defense mechanism[J]. Computer Communications, 2014, 46(15): 10-21.
[6] SON Y H, HONG J K, BAE K S. Authentication masking code against DoS of T-MAC protocol[J]. Journal of Central South University, 2013, 20(7): 1889-1895.
[7] LIANG X, XIAO Y. Game theory for network security[J]. IEEE Communications Surveys and Tutorials, 2013, 15(1): 472-486.
[8] FALLAH M. A puzzle-based defence strategy against flooding attacks using game theory[J]. IEEE Transactions on Dependable and Secure Computing, 2010, 7:5-19.
[9] AMIRTHAVALLI K, SIVAKUMAR P. Comparison of AODV, Dos attack and Game theory in power conservation in wireless sensor networks[J]. IEEE Transactions on Communications and Mobile Computing, 2009, 3:507-511.
[10] WU Q, SHIVA S, ROY S, et al. On modeling and simulation of game theory-based defence mechanisms against DoS and DDoS attacks[J]. Society for Computer Simulation, 2010 (159):1-8.
[11] SHEN S, YUE G, CAO Q, et al. A survey of game theory in wireless sensor networks security[J]. Journal of Networks, 2011, 6( 3) : 521-532.
[12] MOOSAVI H, BUI F M. A game-theoretic framework for robust optimal intrusion detection in wireless sensor networks[J]. IEEE Transactions on Information Forensics and Security, 2014, 9(9): 1367-1379.
[13] MIHAJLOV B, BOGDANOSKI M. Analysis of the WSN MAC protocols under jamming DoS attack[J]. International Journal of Network Security, 2014, 16(4): 304-312.
[14] 李慧芳,姜?jiǎng)倜鳎f崗. 無(wú)線(xiàn)傳感器網(wǎng)絡(luò)中基于博弈論的路由建模[J]. 傳感技術(shù)學(xué)報(bào). 2007, 20(9): 1-3.
[15] SHAHABODDIN S, AHMED P, LAIHA M, et al. Cooperative game theoretic approach using fuzzy Q-learning for detecting and preventing intrusions in wireless sensor networks[J]. Engineering Applications of Artificial Intelligence, 2014(32): 228-241.
[16] 楊黎斌,慕德俊,蔡曉妍. 基于博弈理論的傳感器網(wǎng)絡(luò)拒絕服務(wù)攻擊限制模型[J]. 傳感技術(shù)學(xué)報(bào). 2009, (01): 90-94.
[17] SPYRIDOPOULOS T, KARANIKAS G, TRYFONAS T. A game theoretic defence framework against DoS/DDoS cyber attacks[J]. Computers and Security, 2013, 38: 39-50.