胡偉濤
摘要:資源分配規(guī)劃問(wèn)題在軍事防御領(lǐng)域起著重要的作用,受限條件下的軍事資源分配是實(shí)際存在的。以往該領(lǐng)域的規(guī)劃、決策問(wèn)題往往從期望效用理論入手,存在對(duì)敵方行為考慮不夠完全,不夠貼近現(xiàn)實(shí)情況等不確定性問(wèn)題。本文采用前景理論描述敵方面臨不確定性情境下的選擇行為,并利用Logit選擇模型估算敵方選擇概率。并以防守者期望損失最小為目標(biāo),建立資源分配模型。指導(dǎo)防守者對(duì)目標(biāo)進(jìn)行資源分配,增強(qiáng)目標(biāo)的防御能力。
一、引言
當(dāng)今世界是一個(gè)和平和發(fā)展,機(jī)遇與挑戰(zhàn)共存的世界,探究未來(lái)各國(guó)軍事上難以有大規(guī)模的對(duì)抗性戰(zhàn)爭(zhēng)發(fā)生,但局部地區(qū)沖突總是不可避免,恐怖分子襲擊事件時(shí)有發(fā)生[1,2]。同時(shí),各國(guó)應(yīng)對(duì)這些沖突的軍事經(jīng)費(fèi)又相對(duì)受限,因此如何在資源相對(duì)有限的條件下進(jìn)行防御外來(lái)襲擊相關(guān)問(wèn)題的研究,這是應(yīng)對(duì)軍事領(lǐng)域的發(fā)展過(guò)程中急待解決的問(wèn)題。
傳統(tǒng)的資源決策尤其是軍事防御資源分配方面一直以來(lái)都受著期望效用理論的影響,作戰(zhàn)雙方理想化的作為完全理性的決策者,但實(shí)際作戰(zhàn)對(duì)抗過(guò)程中決策者往往會(huì)表現(xiàn)出與期望效用理論不一樣的現(xiàn)象。1979年Tversky和Kahneman在此基礎(chǔ)上提出了前景理論[3],使用“前景”來(lái)替代“效用”。前景理論可以較好刻畫(huà)決策者在面臨不確定情境下的主觀行為。在由此特別歸納出了兩類模型,價(jià)值函數(shù)模型和決策權(quán)重模型。
價(jià)值函數(shù)模型有如下三個(gè)重要特征:
(一)參照點(diǎn)依賴:決策者更加看重結(jié)果的變化值而不是最終值;
(二)風(fēng)險(xiǎn)偏好逆轉(zhuǎn):決策者面對(duì)收益傾向于風(fēng)險(xiǎn)厭惡,面對(duì)損失傾向于風(fēng)險(xiǎn)追求;
(三)損失規(guī)避:決策者表現(xiàn)出對(duì)損失的規(guī)避程度要大于對(duì)收益的偏愛(ài)程度。
人們?cè)跊Q策時(shí)將事件發(fā)生的原始概率轉(zhuǎn)化為一個(gè)非線性的決策權(quán)重,并且時(shí)常表現(xiàn)為高估小概率事件和低估大概率事件。因此,Kahneman和Tversky分別得出了決策者預(yù)估行為的形如“S”形價(jià)值函數(shù)和倒“S”形的決策權(quán)重函數(shù)。
本文基于前景理論建立起軍事防御層面上的資源分配模型,結(jié)合價(jià)值函數(shù)模型和決策權(quán)重函數(shù)模型,通過(guò)Logit風(fēng)險(xiǎn)分析方法估計(jì)對(duì)手對(duì)目標(biāo)打擊的概率選擇。以防守者期望損失最小為目標(biāo),建立資源分配模型。
二、基于前景理論的資源分配模型
本節(jié)主要基于前景理論相關(guān)知識(shí)對(duì)不同事件的前景值進(jìn)行估算,研究在考慮敵方主觀風(fēng)險(xiǎn)態(tài)度的情況下對(duì)我方目標(biāo)打擊的前景值大小。刻畫(huà)決策者在面對(duì)不確定性情境下所表現(xiàn)出來(lái)的資源分配選擇與防御行為,并據(jù)此依據(jù)戰(zhàn)略Logit風(fēng)險(xiǎn)分析(SLRA)方法[4]想建立資源分配模型。
(一)敵方攻擊成功概率
在進(jìn)攻者攻擊目標(biāo)的概率確定上。假設(shè)目標(biāo)沒(méi)有任何防護(hù)資源,則進(jìn)攻者總可以成功攻擊目標(biāo),這在實(shí)際軍事對(duì)抗過(guò)程中也并非不可能,有時(shí)候?yàn)榱烁蟮男б婊蛘哒w上效益的最優(yōu)就必須要有所取舍;相反,如果存在無(wú)限多的防護(hù)資源,則進(jìn)攻者成功攻擊目標(biāo)的概率接近為0,即攻擊該目標(biāo)總不能達(dá)到預(yù)期的效果。由此,給出如下攻擊成功概率公式:
(1)
其中si表示對(duì)我方目標(biāo)i的攻擊成功概率;αi表示防御目標(biāo)i具有的防護(hù)效果,bi表示對(duì)目標(biāo)i投入的資源,且有(B為可分配的總資源)。
決策者在決策過(guò)程中經(jīng)常會(huì)對(duì)起始的概率進(jìn)行轉(zhuǎn)化,經(jīng)常會(huì)表現(xiàn)為對(duì)小概率事件因害怕?lián)p失而表現(xiàn)出高估的現(xiàn)象,在大概率事件因利益獲取有限而表現(xiàn)出低估的現(xiàn)象。
(二)不同事件下的前景值
假設(shè)考慮I個(gè)防御目標(biāo)上的防御性對(duì)抗問(wèn)題,且對(duì)應(yīng)每個(gè)防御目標(biāo)都可能有J個(gè)屬性的損失。防守者要將總數(shù)為B的資源分配到I個(gè)目標(biāo)上,以減少敵方對(duì)目標(biāo)各屬性上的傷害。假設(shè)ni為第i個(gè)前景可能的結(jié)果,xijk為第i個(gè)前景第k個(gè)可能結(jié)果上屬性j上的值,假設(shè)rj為屬性j的參考值,且由進(jìn)攻方?jīng)Q定。
首先,每個(gè)事件下對(duì)應(yīng)的收益值和損失值都要進(jìn)行歸一化,方便后續(xù)在不同屬性上對(duì)指標(biāo)值進(jìn)行加權(quán)聚合。假設(shè)為歸一化后的值,參考值的確定是由攻擊者確定的,故而一個(gè)事件的結(jié)果是收益型還是成本型,取決于進(jìn)攻者,而不是防守者。
采用下式對(duì)參考點(diǎn)值進(jìn)行歸一化,如下:
(2)
(3)
其中,表示歸一化后的某個(gè)目標(biāo)上第j個(gè)屬性上的參考值。
繼而,基于歸一化之后的參考點(diǎn)和不同屬性上的可能結(jié)果值,本文采取上文介紹到的價(jià)值函數(shù)來(lái)對(duì)每種情況下的得失情況進(jìn)行處理:
,(4)
其中λj 代表防守者針對(duì)屬性j的損失厭惡系數(shù),gj和 lj 分別是針對(duì)屬性j上的收益和損失的風(fēng)險(xiǎn)偏好。
由于防守者防守目標(biāo)可能面臨多個(gè)方面的損失,每涉及多個(gè)屬性。假設(shè)已經(jīng)按降序進(jìn)行排列,以的概率發(fā)生,屬性Aj有mj個(gè)收益可能,則事件i的前景值[5]為:
,(5)
和分別是針對(duì)屬性j收益和損失時(shí)候的決策權(quán)重,和是屬性j上針對(duì)收益和損失的概率決策函數(shù)。
(三) 最優(yōu)資源分配模型
采用SLRA方法來(lái)計(jì)算防守者的最佳資源分配模型。假設(shè)進(jìn)攻者攻擊目標(biāo)i的概率[4]為:
,(6)
其中pi為防守者對(duì)進(jìn)攻者攻擊目標(biāo)i的估計(jì)值,且取決于分配給目標(biāo)i的資源。
防守者會(huì)采取一定的分配策略,使得自己的期望損失最小,由下式給出:
,(7)
其中kj是屬性j的權(quán)重,表示敵方對(duì)目標(biāo)城市i發(fā)動(dòng)攻擊成功后對(duì)屬性j上所造成的損失歸一化后的值,表示敵方對(duì)目標(biāo)城市i發(fā)動(dòng)攻擊失敗后對(duì)屬性j上所造成的損失歸一化后的值。
三、示例分析
自20世紀(jì)60年代以來(lái),恐怖主義活動(dòng)日益頻繁,嚴(yán)重威脅著國(guó)際社會(huì)的安全和秩序。本小節(jié)開(kāi)展示例研究,旨在將所提出的資源分配模型應(yīng)用于軍事領(lǐng)域中的對(duì)恐怖分子攻擊的目標(biāo)防御問(wèn)題上。
假設(shè)一個(gè)場(chǎng)景:恐怖分子可能襲擊四個(gè)城市A,B,C和D中任一個(gè),意圖造成經(jīng)濟(jì)損失、人員傷亡和連鎖反應(yīng)這三個(gè)方面的影響。假定每次恐怖分子只會(huì)攻擊其中一個(gè)城市。不同城市的防護(hù)程度為和。針對(duì)三個(gè)屬性的參考點(diǎn)設(shè)置為20億,0.3,和0.4。其中人員傷亡和連鎖反應(yīng)這兩個(gè)屬性采用[0,1]區(qū)間內(nèi)的打分值進(jìn)行衡量。防守者的損失厭惡程度為。針對(duì)這三個(gè)屬性的權(quán)重設(shè)為值k1=0.25,k2=0.5和k3=0.25。防守者的資源約束為B=100億。
恐怖分子在不同城市上的攻擊可對(duì)我方造成的不同屬性上的損傷值。攻擊成功時(shí)在城市A,B,C,D上造成的損失分別是60,60,50,40;失敗時(shí)分別是10,10,5,5。造成的人員傷亡在攻擊成功時(shí)分別是0.6,0.6,0.75,0.75;失敗時(shí)分別是0.2,0.25,0.35,0.15。造成的連鎖反應(yīng)在攻擊成功時(shí)分別是0.7,0.65,0.65,0.6;失敗時(shí)分別是0.4,0.35,0.3,0.3。
實(shí)驗(yàn)結(jié)果基于前景理論的最優(yōu)資源分配方案為是分配到各個(gè)目標(biāo)城市的經(jīng)費(fèi)額度;具體來(lái)說(shuō),將30億分配給了目標(biāo)城市A,將25億分配給了目標(biāo)城市B,27億分配給了目標(biāo)城市C,以及剩余的18億分配給了目標(biāo)城市D。
實(shí)驗(yàn)結(jié)果同時(shí)顯示,在該資源分配方案下,恐怖分子進(jìn)攻城市D成功的概率最大,為0.7。但恐怖分子在不同目標(biāo)城市的進(jìn)攻選擇概率由高到低依次是目標(biāo)城市C,城市A,城市B,最后為城市D。防守者總體期望損失為0.278,而恐怖分子的期望收益為0.262。盡管恐怖分子進(jìn)攻城市D的概率最大,但依據(jù)本文建立考量恐怖分子主觀風(fēng)險(xiǎn)偏好及不確定性因素的資源分配模型來(lái)看,恐怖分子更有可能進(jìn)攻城市C,因?yàn)檫@種情況下恐怖分子收益最高,同時(shí)對(duì)我方造成的打擊效果最好。
四、結(jié)論
本文基于前景理論,研究了考慮敵方主觀風(fēng)險(xiǎn)偏好的資源分配對(duì)策模型。采用SLRA方法預(yù)測(cè)敵方對(duì)我方不同防御目標(biāo)的攻擊概率,并以此來(lái)指導(dǎo)我方資源分配模型的構(gòu)建,同時(shí)分別對(duì)敵方是否具有轉(zhuǎn)移行為進(jìn)行了分析與考慮,并通過(guò)示例分析驗(yàn)證了該模型的可行性。這也充分說(shuō)明了在考慮資源分配模型時(shí)候,需要考慮對(duì)手風(fēng)險(xiǎn)水平的重要性。
參考文獻(xiàn):
[1]Bai,C.,Sarkis,J.:Supplier development investment strategies:A game theoretic evaluation. J. Annals of Operations Research. 240(2),583--615 (2016)
[2]Golany,B.,Goldberg,N.,Rothblum,U.:A two-resource allocation algorithm with an application to large-scale zero-sum defensive games. J. Computers & Operations Research. 78,218-229 (2017)
[3]Kahneman,D.,Tversky,A.:Prospect theory,an analysis of decision under risk. J. Econometrica. 47(2),264-291 (1979)
[4]Kujawski,E.:Accounting for terrorist behavior in allocating defensive counterterrorism resources. J. Risk Analysis. 18(4),365-376 (2015)
[5]Bleichrodt,H.,Schmidt,U.,Zank,H.:Additive utility in prospect theory. J. Management Science. 55(5),863-873 (2009)