霍程程,黎忠凱,齊向偉
(新疆師范大學 計算機科學技術學院,新疆 烏魯木齊 830054)
在當前智慧城市建設推進過程中,伴隨著各類危安事件、暴力犯罪事件、生態(tài)安全等安全問題[1],城市公共安全管理面臨嚴峻挑戰(zhàn)。突發(fā)安全事件具有隨機性高、活動目標小、不可預知等非常規(guī)特征,無法及時、準確地預測事件發(fā)生的時間、地點。因此,研究安防部門與攻擊者在不同情報信息下的戰(zhàn)略決策十分有必要,這有利于提升城市公共安全預警防控能力,為實現(xiàn)智慧城市公共安全提供有效保障。
國內外有關社會安全問題的研究視角包括基于博弈論建模角度[2-10]、安全設施選址角度[11-16]、應急資源調配及路徑規(guī)劃角度[17-22]以及復雜網(wǎng)絡規(guī)劃建模角度[23-26]。其中,在博弈論建模角度,Zhuang 等人[9-11]分析了犯罪分子行動與政府防御措施互動行為之間的相互影響;Kyle Hunt[8]研究了單階段防御攻擊模型下,機場安防策略選取問題;王震等人[7]從算法可擴展性、算法魯棒性、實際應用等多個方面介紹了安全博弈論,并提出未來的發(fā)展方向。
綜上所述,現(xiàn)有文獻研究了設施選址、路徑規(guī)劃、資源調配等城市安防策略的仿真優(yōu)化問題,也強調了博弈論算法在社會安全領域中的重要性。但從信號博弈理論角度分析安防部門與襲擊者在不同信號策略條件下的戰(zhàn)略選擇,以及對雙方策略選擇的影響因素進行定量分析方面的研究較少。文章考慮安防部門與襲擊者之間的情報狀態(tài),以動態(tài)信號博弈為基礎,構建安防部門與襲擊者之間的攻防信號博弈模型,討論在安防部門在防御信息公開、隱藏的情況下博弈雙方的策略選擇,并通過數(shù)值分析法對均衡解進行穩(wěn)定性分析。
安全領域主要涉及安防部門與襲擊者之間的博弈,文章構建了具有信號隱藏機制的非合作動態(tài)信號博弈模型,相關組成要素如下:
參與者集合N ≡(D,A),參與人D代表安防部門即信號發(fā)送方,A代表攻擊者即信號接收方。
安防部門的行動策略I ≡(id,1 - id),即選擇是否花費更高的資金采用新技術實行高等防御;根據(jù)安防部的行動策略定義他的類型空間,θ ∈(θ1,θ2),θ1實行高等防御,θ2實行一般防御。
信號策略:sd∈(D,S),sd= D,安防部門通過公共信息平臺向公眾發(fā)布有關防御技術采用及其部署的詳細信息;sd= S,安防部門對防御策略實行保密信號策略,公眾無法通過有效途徑獲取相關防御信息。
攻擊者的行動策略集,Ia∈(ia,1 - ia),ia攻擊者選擇攻擊行動,1 - ia攻擊者選擇不攻擊。
安防部門和攻擊者的收益函數(shù)集合,U =(UA,UD),表示參與者的博弈收益,由博弈雙方的策略共同決定。
安防部門與攻擊者的博弈過程見圖1。安防部門是博弈的先行者,首先選擇信號策略,如果安防部選擇公開防御信號策略,那么博弈按順序博弈進行分析求解。安防部門選擇投入較高資金進行高等防御或者進行一般防御,攻擊者根據(jù)公開的情報信息選擇其攻擊策略。如果安防部門實行信號隱藏策略,博弈雙方在采取行動時不知道對方的決定,此時子博弈為同時進行博弈。博弈中,攻擊者成功攻擊的概率取決于安防部門的防御策略。
圖1 安防部門與攻擊者的信號博弈樹
文章模型相關參數(shù)定義見表1,當安防部門實行高等防御時,攻擊者成功攻擊的概率用p表示,當安防部門選擇一般防御時,攻擊者成功攻擊的概率用q表示。文章假設,攻擊者在安防部門進行高等防御時的攻擊成功率低于安防部實行一般防御時的攻擊成功率,即p<q.安防部門防御成本包括信號策略成本和防御技術成本,假設安防部門選擇公開信息的信號策略成本為0,實行保密信號策略的成本為c3,安防部實行高等防御的成本為c1,實行一般防御的成本為c2,且c2<c1.攻擊者進行攻擊時的成本為c4.如果攻擊者攻擊成功,安防部遭受的損失評估為vd,攻擊者獲得的損失評估為va.同時將安防部的反擊收益納入博弈雙方收益的計算中,實際攻擊行動中,無論安防部門能否成功抵御攻擊,都可以通過反擊行動獲得收益。
表1 相關參數(shù)、符號、函數(shù)表示
根據(jù)博弈樹(圖1)以及相關參數(shù)變量的定義(表1),文章得出不同情況下安防部門與攻擊者的收益(表2)。博弈雙方的行動策略在文章中用三維向量表示,D 代表安防部門實行公開防御信息信號策略,S表示安防部門實施信號隱藏策略;h代表安防部門實行高等防御行動策略,g代表安防部實施一般防御行動策略;w表示攻擊者攻擊成功,f表示攻擊者攻擊失敗,n表示攻擊者不攻擊。
表2 安防部門與攻擊分子不同博弈結果下的收益
本節(jié)中,安防部門選擇公開相關防御信息,攻擊者進行攻擊行動時可以通過安防部門的信號獲得部分信息。安防部門的目標是在公開防御信號策略下,選擇相應的防御技術(實行高等防御或一般防御)以最大化其預期收益。
攻擊者的目標是通過實行攻擊或不攻擊行動策略獲得最大預期效用。博弈雙方的最大預期收益如下:
攻擊者的最佳響應定義,
攻擊者的最佳響應函數(shù):攻擊者的最佳響應函數(shù)是獲得其最優(yōu)策略,以最大化其對安防部門選擇的策略(高等防御或一般防御)的預期效用。
根據(jù)逆向歸納法,文章計算出公開信息信號策略下的完美納什均衡解以及博弈雙方的最佳預期效用,是安防部門和攻擊者的采取均衡行動時的均衡收益(表3)。
表3 公開信息信號策略博弈的均衡解
安防部門和攻擊者有四種可能的納什均衡策略(表3),且均衡策略皆為純策略納什均衡。在第一、二種情況下,安防部門選擇高等防御,攻擊者的策略為攻擊、不攻擊。在三、四情況下安防部門選擇一般防御措施,攻擊者有攻擊、不攻擊兩種策略選擇。攻擊者攻擊時的收益與攻擊成功的概率、攻擊成本、安防部門的反擊收益相關。
本節(jié)研究在安防部門公開披露防御信息情況下,博弈雙方的均衡策略關于相關參數(shù)的穩(wěn)定關系。c1、c4、vd、va等相關參數(shù)值經(jīng)過官方報告和相關文獻分析得出[8,27-31]。高等防御成本c1= 450、一般防御成本c2=200、隱藏信號策略成本c3= 120、攻擊成本c4= 65、反擊收益k = 30、安防部門損失評估vd= 8000、攻擊者損失評估va= 420、高等防御時攻擊成功的概率p = 0.16、一般防御攻擊成功的概率q = 0.32.城市公共安全損失評估包括基礎設施相關物質損失、經(jīng)濟損失以及人員傷亡損失,大多數(shù)攻擊者的目的是造成人員傷亡,而襲擊后安防部不僅承擔人員傷亡損失,還承擔物質損失、交通中斷、災后重建的經(jīng)濟損失等,故在文章中假設va是遠遠小于vd的。
2.2.1 防御成本c1、c2、攻擊成本c4、反擊收益k對博弈雙方均衡策略的影響
圖2 表明在高等防御成本變化的條件下存在兩種博弈均衡策略。在防御成本不高的情況下,存在安防部門實行高等防御且攻擊者不攻擊的情況。但是隨著高等防御成本不斷增加,達到較高數(shù)值時,安防部門無法承擔高昂的防御費用,此時安防部門實行一般防御策略,攻擊者冒險攻擊,獲得收益。
圖2 高等防御的成本對均衡策略的影響
圖3表明一般防御成本對博弈雙方均衡策略的影響。在這種情況下,理論上存在兩種均衡策略(高等防御,不攻擊)(一般防御,攻擊)。文章從安防部門的收益角度進行分析,由于在一般防御情況下,攻擊者進行攻擊,此時安防部門的損失遠遠大于實行高等防御的成本花費,所以安防部門選擇實行高等防御策略威懾攻擊者放棄攻擊,從而降低損失。
圖3 一般防御成本對均衡策略的影響
圖4 表明攻擊者攻擊成本的變化對博弈雙方均衡策略的影響。當攻擊者的攻擊成本較低時,存在安防部門實行高等防御,攻擊者進行攻擊的情況。隨著攻擊成本不斷增加,攻擊者的策略開始變化,出現(xiàn)攻擊者不攻擊,安防部門依然實行高等防御的情況。當攻擊成本大于150 時,攻擊者必須付出高昂的攻擊成本,為了最大化其預期效用,攻擊者選擇放棄攻擊,此時安防部門決定采用成本較低的一般防御進行城市安防。
圖4 攻擊者的攻擊成本對策略的影響
圖5 表明安防部門的反擊收益對博弈雙方策略的影響。當反擊力度較小時,存在安防部門實行高等防御,攻擊者進行攻擊的情況。隨著反向打擊力度增強,反擊收益增加,攻擊者逐漸改變其攻擊策略,放棄攻擊,此時安防部門仍然實行高等防御策略。當反擊收益上升到一定程度時,鑒于攻擊者不會付出昂貴的代價進行攻擊,安防部門由高等防御轉換為一般防御策略。實際情況下,安防部門可以利用相關新技術進行反向追蹤,對攻擊者進行打擊、跟蹤,從而起到威懾作用。
圖5 安防部門的反擊收益對策略的影響
2.2.2 攻擊者與安防部門的損失評估va、vd,攻擊成功的概率q、p
圖6 反映了攻擊者的損失評估對博弈雙方策略的影響。在攻擊者的損失評估較小時,對攻擊者的誘惑力較小,存在攻擊者不攻擊,政府實行一般防御的情況。隨著攻擊者損失評估增加,攻擊者依然保持不攻擊的戰(zhàn)略,此時安防部門改變其防御策略,由一般防御轉變?yōu)楦叩确烙.敼粽叩膿p失評估值大于600 時,攻擊者決定攻擊,安防部門維持其高等防御策略。
圖6 攻擊者的評估損失對均衡策略的影響
圖7 反映了安防部門的損失評估對博弈雙方策略的影響。在損失評估較低時,存在安防部門實行一般防御策略,攻擊者進行攻擊的情況。隨著安防部門損失評估增加,博弈雙方策略均發(fā)生變化,政府開始實行高等防御,攻擊者放棄攻擊,證明安防部門實行高等防御對攻擊者有一定震懾作用。
圖7 安防部損失評估對均衡策略的影響
圖8 反映了一般防御下成功攻擊的概率對博弈雙方策略的影響。當攻擊成功的概率較低時,攻擊者不會承擔較大的失敗風險進行攻擊,安防部門選擇花費較少的資金進行一般防御,存在安防部門采用一般防御,攻擊者不攻擊的均衡策略。隨著攻擊成功的概率逐漸增加,安防部門改變防御策略進行高等防御,攻擊者保持其不攻擊狀態(tài)。
圖8 攻擊成功概率q對均衡策略的影響
圖9 反映了高等防御時攻擊成功的概率和博弈雙方收益的影響。在概率較低的情況下,攻擊者放棄攻擊,安防部門實行高等防御。隨著概率的增加存在安防部門采用高等防御而攻擊者進行冒險攻擊的情況。圖中表示當攻擊成功的概率增加到一定程度時,博弈雙方的戰(zhàn)略均發(fā)生變化。由于實行高等防御策略時,攻擊者成功攻擊的概率依然很大,所以安防部門選擇花費較小的一般防御,此時成功攻擊的誘惑力較大,攻擊者選擇攻擊獲取最大期望收益。但實際生活中,安防部門不會因為攻擊成功概率高而放棄花費更高的資金進行防御,攻擊者進行攻擊時不會獲得期望中的收益。
圖9 攻擊成功概率p對均衡策略的影響
通過以上分析,得出安防部門可以通過高等防御對攻擊者進行威懾,從而降低攻擊成功的概率甚至使攻擊者放棄攻擊。但是在攻擊成本較低、攻擊成功概率高的條件下,攻擊者依然會選擇冒險攻擊,以獲取最大期望收益。此種情況下,安防部門應該增強反擊力度,追蹤攻擊者,將其一網(wǎng)打盡,在獲得反擊收益的同時,震懾潛在的攻擊者,降低攻擊概率,減少城市安全事件的發(fā)生。
本節(jié)中,安防部門采用保密信號策略,這種狀態(tài)下攻擊者不知道安防部的防御措施,博弈視為同步進行。安防部門與攻擊者的目標函數(shù)如下:
為了得到均衡解,首先求解博弈雙方的最佳反應函數(shù),
安防部門最佳響應定義:
安防部門最佳策略函數(shù):
攻擊者的最佳響應定義為:
同理結合攻擊者的預期效用,解出攻擊者的最佳行動策略函數(shù),
在實行隱藏信號策略的博弈中,博弈雙方依然有四種可能的納什均衡(表4)。文章發(fā)現(xiàn)在安防部門實行高等防御時,不存在攻擊者不攻擊的均衡策略,相比較公開防御信號策略博弈,本博弈過程存在混合策略均衡。
表4 隱藏信號策略下的博弈均衡解
本小節(jié)通過數(shù)值分析法研究安防部門在隱藏防御信息的情形下,博弈雙方的均衡策略與相關參數(shù)的關系。有關參數(shù)的基準值見小節(jié)3.2.
3.2.1 防御成本c1、c2,采取保密信號的成本c3,攻擊成本c4
隱藏信號策略下高等防御的成本對博弈雙方均衡策略的影響(圖10),存在兩種均衡解的情形。在防御成本中等偏低時,存在安防部門和攻擊者都選擇混合策略的情況(表1)。隨著防御成本的增加超過中等值,安防部門放棄繼續(xù)投入更高的資金進行防御,此時,攻擊者攻擊的成功概率增加,攻擊者選擇攻擊。
圖10 高等防御的成本對均衡策略的影響
隱藏信號策略下一般防御的成本對博弈雙方均衡策略的影響(圖11)。圖中可以看出無論防御成本如何變化,安防部門始終采取一般防御策略進行防御,攻擊者始終采取攻擊策略。當防御成本較低時,攻擊者實行攻擊策略可以獲得少量收益,隨著防御成本的增加,攻擊者雖然進行攻擊但是一直處于負收益的情形,這種情況下攻擊者由于情報的缺失,造成收益斷層,不僅無法獲得期望收益,還會造成較大的損失。
圖11 一般防御的成本對均衡策略的影響
隱藏策略的成本對博弈雙方均衡策略的影響(圖12)。無論隱藏信號策略的成本如何變化,安防部門和攻擊者始終保持混合策略。在這種情況下,安防部門需要花費更多的防御資金去維持均衡,攻擊者收益不變。
圖12 采用隱藏信號策略的成本對均衡策略的影響
隱藏信號策略條件下,攻擊者的攻擊成本對博弈雙方均衡策略的影響(圖13)。當攻擊成本較低時,安防部門實行混合策略進行防御,攻擊者選擇最佳行動策略進行攻擊。隨著攻擊成本增加,安防部門保持混合策略不變,攻擊者不愿承擔高昂的攻擊成本,放棄攻擊純策略,實行混合策略。
圖13 攻擊成本對均衡策略的影響
3.2.2 反擊收益k、安防部損失評估vd,攻擊者損失評估va,攻擊成功的概率p、q
隱藏信號策略下,安防部門的反擊收益對博弈雙方的影響(圖14)。當反擊收益比較小時,安防部門實行混合策略進行防御,攻擊者進行攻擊,但是攻擊者收益浮動較大,無法保持最佳期望收益。隨著反擊力度增強,安防部門和攻擊者都采用混合策略來最大化其期望收益。
圖14 反擊收益對均衡策略的影響
隱藏信號策略下,安防部門的損失評估對博弈雙方均衡策略的影響(圖15)。圖中表示在vd變化的情況下,存在兩種納什均衡解。當安防部門的損失評估較小時,安防部門采取一般防御策略,此時攻擊者利用缺乏高等防御措施的情形,冒險實行攻擊獲得期望收益。隨著損失評估的增加,博弈雙方的策略均發(fā)生變化,安防部門實行混合策略進行防守,攻擊者實行混合策略獲得均衡策略下的期望收益。
圖15 安防部門的損失評估對均衡策略的影響
隱藏信號策略下,攻擊者的損失評估對博弈雙方均衡策略的影響(圖16)。圖中存在兩種均衡策略。當攻擊者的損失評估較小時,安防部門實行一般防御策略,攻擊者進行攻擊。隨著攻擊者損失評估增加,博弈雙方均實行混合策略維持博弈均衡。
圖16 攻擊者的損失評估對均衡策略的影響
隱藏信號策略下,實行高等防御攻擊成功的概率對博弈雙方均衡策略的影響(圖17)。當攻擊成功的概率比較低時,安防部門和攻擊者都實行混合策略。隨著攻擊成功的概率增加到接近30%時,攻擊者改變策略實行攻擊,獲得期望收益,此時安防部門實行高等防御。當攻擊成功概率繼續(xù)增加時,安防部門實行混合策略,攻擊者考慮到安防部門高投資防御放棄攻擊純策略,實行混合策略。
圖17 實行高等防御q對均衡策略的影響
隱藏信號策略下,實行一般防御攻擊成功的概率對博弈雙方均衡策略的影響(圖18)。當攻擊成功的概率較低時,安防部門保持警惕實行高等防御,攻擊者冒險采取攻擊行動,此時他的攻擊收益為負值,沒有達到預期。隨著攻擊成功的概率不斷增加,安防部門和攻擊者都改變行動策略,實行混合策略。在這種情況下,安防部門的防御成本由低到高,然后趨向于平衡,攻擊者混合策略收益不變。
圖18 一般防御攻擊成功的概率對博弈雙方均衡策略的影響
綜上所示,在防御策略信息隱藏的博弈情形下,安防部門可以通過實行高等防御降低攻擊成功的概率,使攻擊者承擔較大損失,但是不能阻止攻擊者攻擊行為。在信號隱藏策略下,博弈雙方均傾向于混合策略獲取最大期望收益。同時,安防部門可以通過數(shù)據(jù)分析、逆向追蹤、用戶畫像等技術進行反擊,識別攻擊者的身份或其團伙大本營,利用法律手段進行制裁,威懾潛在的攻擊者,降低攻擊事件的發(fā)生。
文章從城市公共安全管理的角度,以動態(tài)信號博弈為基礎,構建了安防部門與攻擊者之間的非合作攻防信號博弈模型,研究不同信號策略情況下,防御成本、攻擊成本、反擊收益、攻擊成功概率等因素對博弈雙方均衡策略的影響。研究結論表明,安防部門在公開防御信息情況下,博弈雙方存在純策略均衡,安防部門可以通過高等防御對攻擊者進行威懾,從而使攻擊者放棄攻擊或者降低攻擊成功的概率。但是在攻擊成本較低、攻擊成功概率高的條件下,攻擊者依然會選擇冒險攻擊,以獲取最大收益。在信號隱藏策略情形下,博弈雙方傾向于混合策略,安防部門不能通過高等防御技術完全震懾攻擊者。兩種均衡策略下,安防部門均可以通過數(shù)據(jù)分析、反向追蹤、身份識別等技術,利用法律手段追責或實施反制攻擊,降低攻擊威脅和攻擊收益。
文章研究還可以進行一些拓展,例如,文章沒有考慮信號動態(tài)變化對博弈雙方戰(zhàn)略的影響。此外,攻擊者不可能是完全理性的,基于有限理性假設的智慧城市安全管理博弈模型尚待進一步的研究和分析。