郁紅波,張 馳,楊少偉
(1. 海軍航空大學(xué),山東 煙臺 264001;2. 中國人民解放軍92810部隊,海南 三亞 572000; 3. 中國人民解放軍91388部隊,廣東 湛江 524000)
隨著潛艇建造技術(shù)的發(fā)展,潛艇下潛深度不斷增加,降噪技術(shù)越來越成熟,單基地設(shè)備搜潛已經(jīng)無法滿足現(xiàn)代復(fù)雜的搜潛任務(wù),因此艦機多設(shè)備組合搜潛技術(shù)是海軍反潛重要的發(fā)展方向。對于艦機多設(shè)備組合搜潛,在保證搜潛效能的同時,又要兼顧經(jīng)濟性和隱蔽性,因此選擇最優(yōu)的艦機設(shè)備組合搜潛方案勢在必行[1-3]。
艦機多設(shè)備組合方案博弈分析與確定性方案相比,具有復(fù)雜性,分析目標(biāo)具有不確定性等問題,不易獲得評價指標(biāo)的權(quán)重信息,因此難以用權(quán)重已知的決策方法對艦機多設(shè)備組合方案進行計算和決策。對于多方案指標(biāo)權(quán)重未知的問題,國內(nèi)外也已開展了很多研究工作。汪倫焰在文獻[4]中提出根據(jù)聯(lián)系數(shù)理論,通過公式計算出聯(lián)系數(shù)之間的距離,然后引進了相對相離度矩陣和相對相離度的定義,最后通過將區(qū)間數(shù)轉(zhuǎn)化為聯(lián)系數(shù)進行多屬性決策;郭子雪等在文獻[5]提出了基于離差最大化解決屬性權(quán)重未知的方法,基于區(qū)間直覺模糊加權(quán)平均算子給出了屬性權(quán)重未知情況下屬性信息為區(qū)間直覺模糊數(shù)的多屬性決策方法;代文鋒在文獻[6]中為了解決屬性權(quán)重未知的多屬性決策問題,運用前景理論得出了各個指標(biāo)的二元前景值,并且建立了決策矩陣,根據(jù)主客觀權(quán)重,計算得到指標(biāo)的綜合權(quán)重,基于擴展Multimoora算法對方案進行排序,最后運用占優(yōu)理論進行最終的方案排序。本文針對屬性權(quán)重未知多屬性決策問題,提出了一種基于粒子群算法的博弈理論,通過粒子群算法的不斷優(yōu)化,求出均衡策略剖面,可以讓各個屬性在博弈中均能獲得較好的收益,使得分析結(jié)果能夠全面地反映各個屬性包含的信息。
現(xiàn)代反潛過程中有很多搜潛設(shè)備,針對不同的戰(zhàn)場情況和敵我態(tài)勢,通常使用單一的搜潛設(shè)備或者將搜潛設(shè)備兩兩組合形成主被動聯(lián)合搜潛。主要的搜潛設(shè)備為聲吶浮標(biāo)(F),吊放聲吶(D),拖曳聲吶(S)。根據(jù)實際作戰(zhàn)要求,形成如下方案集:U=(u1,u2,u3,u4)。
其中,各方案表示如下:
u1={F}為反潛直升機單獨使用聲吶浮標(biāo)系統(tǒng)對潛艇進行搜索;
u2={D}為反潛直升機單獨使用吊放聲吶對潛艇進行搜索;
u3={F,D}表示拖曳聲吶與吊放聯(lián)合使用,通過吊放聲吶發(fā)射聲波,拖曳聲吶接收聲波進行主被動聯(lián)合搜潛;
u4={S,F}表示拖曳聲吶與聲吶浮標(biāo)主被動聯(lián)合搜潛,拖曳聲吶主動發(fā)射聲波,浮標(biāo)被動接收聲波形成多基地搜潛方案。
對于上述的方案集,需要建立指標(biāo)集對上述方案進行評價??紤]艦艇和航空反潛裝備的特點,本文將從以下4個方面進行評價,評價指標(biāo)集如下:P=(p1,p2,p3,p4)。
式中,p1為對潛搜索能力;p2為隱蔽能力;p3為跟蹤及定位能力;p4為經(jīng)濟性。
通過建立方案集U和指標(biāo)集P,可以得出艦機多設(shè)備組合搜潛方案決策結(jié)構(gòu),如圖1所示。
圖1 艦機多設(shè)備組合搜潛方案決策結(jié)構(gòu)
方案ui在指標(biāo)集pj上的指標(biāo)值為yij(i=1,2,3,4;j=1,2,3,4),由指標(biāo)值確定的矩陣為決策矩陣,記為A(yij)m×n,將矩陣A(yij)m×n規(guī)范化為矩陣R(rij)m×n,矩陣R(rij)m×n中的值蘊含著方案在各個指標(biāo)集pj上的優(yōu)劣順序。
為消除不同指標(biāo)集之間不同的量綱單位帶來的不可公度性,可按下述規(guī)則將決策矩陣A(yij)m×n轉(zhuǎn)變?yōu)橐?guī)范化矩陣R(rij)m×n[7]。
根據(jù)不同類型的指標(biāo)值屬性,可將指標(biāo)值屬性分為成本型、固定型、效益型、區(qū)間型指標(biāo)集。假設(shè)有m個方案,n個指標(biāo)。
1)效益型指標(biāo)
(1)
式中,ymax為指標(biāo)中的最大值;ymin為指標(biāo)中的最小值。
2)成本型指標(biāo)
(2)
式中,ymax為yij中的最大值;ymin為yij的最小值。
3)區(qū)間型指標(biāo)
(3)
式中,ymax為yij的最大值;ymin為yij的最小值;q11、q12分別為區(qū)間的上下限。
4)固定型指標(biāo)
(4)
式中,yj為目標(biāo)屬性的最佳穩(wěn)定值。
1)優(yōu)先序位v。假設(shè)有m種方案,對應(yīng)的m個優(yōu)先序位的集合記為v={v1,v2,…,vm}。根據(jù)優(yōu)先序位,可以判斷方案的優(yōu)先順序。在優(yōu)先關(guān)系ui1>ui2>…>uim中,uik在方案序列中稱為第k優(yōu)先序位。在優(yōu)先序位集合中,v1的優(yōu)先級最高,vm的優(yōu)先級最低。
2) 指標(biāo)方案序p·v。對于一個特定的指標(biāo)pj,方案集ui都有一個對應(yīng)的指標(biāo)值rij(i=1,2,…m)。根據(jù)yij確定的優(yōu)先關(guān)系ui1>ui2>…>uim,稱為指標(biāo)pj的指標(biāo)方案序。pj的指標(biāo)方案序可以表示為pj·v。其中,pj·vk=xik表示指標(biāo)pj確定的方案序中xik處在第k優(yōu)先序位。
4)有效策略剖面。有效策略剖面σ={w1,w2,…,wn},并且滿足約束條件[9-10]如下:
(5)
不符合約束條件的策略剖面稱為無效策略剖面,因此,規(guī)定無效策略剖面的收益為0。
根據(jù)上述定義,艦機多設(shè)備組合搜潛博弈模型可以表示為〈I,S,H〉。其中,I表示各方案中的指標(biāo),即Ii=Yi;博弈策略S是對指標(biāo)yi的權(quán)重wj進行賦值;H為博弈雙方的收益矩陣,記為hj(σ),hj(σ)是決策方案序w·v和指標(biāo)方案序p·v的相符度,記為Homo(w·v,pj·v)。
相同方案ui在序位v1和vm上對相符度的貢獻不同。為體現(xiàn)相同方案在不同序位上對相符度的貢獻,本文引入序位權(quán),序位v={v1,v2,…,vm}對應(yīng)的序位權(quán)為q={q1,q2,…,qm}。假設(shè)最低優(yōu)先級序位vm對應(yīng)的序位權(quán)為qm,則序位權(quán)的表達式為
(6)
序位權(quán)滿足約束條件如下:
(7)
5)均衡策略剖面。艦機多設(shè)備方案博弈均衡時的策略剖面為σ*,由σ*產(chǎn)生的決策方案序σ*·v與任何指標(biāo)方案序pj·v的相符度滿足:
Homo(σ*·v,pj·v)≥Homo(σ·v,pj·v)
(8)
艦機多設(shè)備組合搜潛博弈分析算法主要包括方案評估,求取決策矩陣,求解均衡策略剖面,利用相符度進行方案優(yōu)選4個步驟。
1) 方案評估。分析艦機多設(shè)備組合搜潛方案的優(yōu)缺點,獲得方案對應(yīng)的指標(biāo)值;
2) 求取決策矩陣。根據(jù)每個方案的指標(biāo)值求取決策矩陣A(yij)m×n,根據(jù)指標(biāo)集的屬性求取規(guī)范化矩陣R(rij)m×n,并根據(jù)R(rij)m×n,獲得指標(biāo)序pj·v;
3) 求解均衡策略剖面。利用粒子群優(yōu)化算法,求出均衡策略剖面σ*=w*=(w1*,w2*,…,wj*);
4) 利用相符度進行方案優(yōu)選。首先,使用均衡策略剖面σ*對規(guī)范矩陣R(rij)進行聚合,得出綜合指標(biāo)值,從而得出決策方案序ui1>ui2>…>uim;然后,計算由σ*得出的決策方案序σ*·v與指標(biāo)序pj·v的相符度Homo(σ*·v,pj·v)。
綜上所述,要想對艦機多設(shè)備組合搜潛方案進行決策分析,要求出均衡決策剖面σ*和相符度Homo(σ*·v,pj·v)。
2.1.1 求解相符度
1)方案ui和uj的相符度。
假設(shè)方案ui和uj在決策方案序w·v的序位分別為v1m和v2m。在指標(biāo)方案序中,pj·v的序位為v1k和v2k,則在決策方案序中w·v1m=ui,w·v2m=uj,在指標(biāo)序中pj·v1k=ui,pj·v2k=uj。若是在決策方案序w·v和指標(biāo)序中pj·v均有ui>uj,則稱決策方案序w·v和指標(biāo)序pj·v關(guān)于方案ui和uj相符,其相符度定義為sub-homow·v,pj·v(ui,uj)=1,即博弈中收益為1,反之,決策方案集w·v和指標(biāo)序中pj·v關(guān)于方案ui和uj不相符,sub-homow·v,pj·v(ui,uj)=0,即博弈中收益為0。
2)w·v和pj·v的相符度。
決策方案序w·v和指標(biāo)序中pj·v之間的相符度定義為w·v和pj·v關(guān)于pj·v中每個方案與其他低優(yōu)先級方案的相符度的加權(quán)和[8]:
(9)
式中,qk為方案pj·vk的所在序位的序位權(quán)。
2.1.2 求解均衡策略剖面
w·v和pj·v之間的收益反映了決策方案序w體現(xiàn)指標(biāo)pj包含信息量的大小,不同的w產(chǎn)生不同的決策方案序,決策方案序w·v不同,導(dǎo)致w·v和pj·v之間的相符度不同。均衡策略剖面σ*是指各個決策方案序w·v和指標(biāo)序pj·v之間具有較好的相符度,即收益。
(10)
粒子群優(yōu)化算法(Particle Swarm Optimization)是通過模擬群鳥尋找食物得出的一種基于群體合作的最優(yōu)搜索算法。優(yōu)化算法過程中每個優(yōu)化問題的解都是空間中的一個粒子,所有粒子都會通過適應(yīng)度函數(shù)解出當(dāng)前粒子位置的適應(yīng)度函數(shù)值,同時每個粒子還有一個速度決定粒子飛行的方向和距離,最后鳥群會根據(jù)全體最優(yōu)適應(yīng)值不停地更換飛行的速度和方向,在解空間中搜索得出最優(yōu)值。粒子群算法具有搜索速度快,搜索效率高,算法較為簡單,適合實值型等優(yōu)點。
求解均衡剖面σ*的粒子群算法的流程如下:
Step2: 定義適應(yīng)度函數(shù)fitness-gbest(σ),種群中單個粒子的適應(yīng)度便是剖面收益,即收益h(σj)=fitness-gbest(σj);
Step3: 初始化粒子群個體pop,計算各粒子歷史最佳適應(yīng)度,單個粒子的最佳歷史位置,種群最佳歷史位置,種群最佳歷史適應(yīng)度;
Step4:判斷迭代次數(shù)是否滿足設(shè)定的迭代次數(shù),是則停止搜索,輸出最優(yōu)的結(jié)果,否則繼續(xù)循環(huán);
Step5:繼續(xù)循環(huán),對速度進行更新:
(11)
(12)
粒子元素的位置變化范圍和速度變化是有一定的界限的,分別被限制在[Xdmin,Xdmax]和[Vdmin,Vdmax]中,若某一維粒子元素id或id超出邊界值,則把超出邊界的令其等于邊界值;
Step6:通過更新后的粒子位置空間和移動速度,得出每個粒子新的適應(yīng)度,通過與上一代適應(yīng)度進行比較,大于上一代適應(yīng)度,則對粒子最佳適應(yīng)度進行更新,同時更新粒子歷史最佳位置,如果小于上一代適應(yīng)度,則保留粒子歷史最佳適應(yīng)度和歷史最佳位置。同時求解種群最佳歷史位置和最優(yōu)適應(yīng)度;
Step7:跳轉(zhuǎn)至Step4。
在應(yīng)召反潛的背景下,分別使用方案u1、u2、u3、u4對海域中的敵方潛艇進行搜索,方案u2、u3以擴展圓陣為例,方案u1、u4以圓形包圍陣為例,利用Monte Carlo模型,仿真5 000次,得出了各個方案的搜潛效能,如表1所示。
表1 各方案的搜潛概率
通過表1可以發(fā)現(xiàn),搜索能力u3>u4>u2>u1。在搜潛能力、隱蔽能力、跟蹤及定位能力、經(jīng)濟性4個評價指標(biāo)中,對潛搜索能力可以根據(jù)各設(shè)備組合方案的搜潛概率作為衡量標(biāo)準(zhǔn),其他方案指標(biāo)值可由專家給出評價,表2為各個方案因素指標(biāo)。
表2 各方案因素指標(biāo)
為了對表2進行定量分析,便于后續(xù)的數(shù)學(xué)計算,本文引入評判標(biāo)度,將表2中的評判語言進行數(shù)字化轉(zhuǎn)換,評判標(biāo)度如表3所示。
表3 評判語言與評判標(biāo)度的對應(yīng)關(guān)系
通過表3的評判標(biāo)度將表2轉(zhuǎn)化為表4,表4也是決策矩陣A(yij)m×n。
表4 轉(zhuǎn)換結(jié)果
由于在求取相符度和均衡策略剖面時均是以收益為衡量標(biāo)準(zhǔn),因此將評估矩陣A(yij)m×n規(guī)范化為矩陣R(rij)m×n時,按照指標(biāo)集屬性為效益型來處理,根據(jù)效益型指標(biāo)集處理方法得到規(guī)范化矩陣R(rij)m×n,如表5所示。
1) 確定方案指標(biāo)序。對于規(guī)范化矩陣R(rij)m×n,可以得出最直觀的指標(biāo)方案序如下所示:
a) 指標(biāo)p1:指標(biāo)方案序為u3>u4>u2>u1;
b) 指標(biāo)p2:指標(biāo)方案序為u1>u3>u4>u2;
c) 指標(biāo)p3:指標(biāo)方案序為u3>u4>u2>u1;
表5 規(guī)范化矩陣R(rij)m×n
d) 指標(biāo)p4:指標(biāo)方案序為u2>u1>u3>u4。
2) 求解均衡策略剖面:利用粒子群優(yōu)化算法計算均衡策略剖面σ*時,相符度函數(shù)為適應(yīng)度函數(shù)。求取相符度函數(shù)值時需要序位權(quán)值,如表6所示。
表6 序位權(quán)值
經(jīng)過不斷的迭代,以指標(biāo)p1為例,得出了最佳適應(yīng)度和平均適應(yīng)度隨迭代次數(shù)變化情況,如圖2所示。
圖2 經(jīng)過500次迭代后的最優(yōu)解和種群均值
(13)
表7 不同指標(biāo)的相應(yīng)參數(shù)
4)計算決策方案序。使用均衡策略剖面σ*對矩陣R(rij)m×n進行聚合,獲得綜合指標(biāo)值z1=0.645,z2=0.427,z3=0.660,z4=0.410。根據(jù)綜合指標(biāo)值可以確定決策方案序w·v為u3>u1>u2>u4。
5)計算相符度。計算σ·v與指標(biāo)序pi·v之間的相符度:
a)指標(biāo)p1:Homo(σ·v,p1·v)=2.259;
b)指標(biāo)p2:Homo(σ·v,p2·v)=0.941;
c)指標(biāo)p3:Homo(σ·v,p3·v)=2.690 4;
d)指標(biāo)p4:Homo(σ·v,p4·v)=0.800。
根據(jù)決策方案序w·v,艦機多設(shè)備組合方案搜潛的最優(yōu)方案序為u3>u1>u2>u4,由4個指標(biāo)因素得出的指標(biāo)方案序中,指標(biāo)p3確定的方案序u3>u4>u2>u1與最優(yōu)方案序相符度較高,可作為艦機多設(shè)備組合搜潛的參考依據(jù)。在搜潛過程中,u3方案最佳,u1方案最差,因此優(yōu)先選擇u3組合進行搜潛。
在實際的搜潛過程中,吊放聲吶與拖曳聲吶組成的雙基地聯(lián)合搜潛模型可以提高搜潛效能,吊放聲吶單基地搜潛時,搜潛效能要低于雙基地搜潛。由于聲吶浮標(biāo)的被動工作方式,導(dǎo)致了其搜潛效能不佳,并且由于浮標(biāo)的不可回收性,導(dǎo)致了u1方案的經(jīng)濟性較差;u4方案雖然可以提高搜潛效能,但由于浮標(biāo)的不可回收性,導(dǎo)致其經(jīng)濟性不理想,而u3方案兼顧搜潛概率的同時,也具有很高的經(jīng)濟性,因此方案u3最佳。
本文根據(jù)現(xiàn)階段搜潛的具體情況,建立了艦機多設(shè)備組合的搜潛方案,并且根據(jù)實際搜潛狀況,給出了評價指標(biāo)集。基于博弈理論,研究了多設(shè)備組合搜潛博弈分析算法,給出了求解多設(shè)備組合搜潛方案博弈模型均衡剖面的粒子群優(yōu)化算法。以當(dāng)今主流的搜潛設(shè)備為例,通過計算得到了各方案未知權(quán)重下組合的排列順序,驗證了本次決策方法的可行性和正確性。博弈分析結(jié)果表明:艦機多設(shè)備組合搜潛方案分析方法能夠在權(quán)重等重要信息未知的情況下,通過博弈分析得出均衡策略剖面,然后根據(jù)均衡策略表面得出指標(biāo)間的收益,進一步確定多方案的優(yōu)先序列,為解決不確定條件下艦機多設(shè)備組合搜潛分析提供新的參考。