陳潔鈺,王 勃,王 勛,胡詩駿(空軍工程大學(xué)信息與導(dǎo)航學(xué)院,西安 710077)
基于SA-IGSO的它機協(xié)同制導(dǎo)-攻擊匹配*
陳潔鈺,王勃,王勛,胡詩駿
(空軍工程大學(xué)信息與導(dǎo)航學(xué)院,西安710077)
為增強協(xié)同空戰(zhàn)戰(zhàn)術(shù)的靈活性,提高目標(biāo)攻擊的及時性和有效性,重點研究“武器發(fā)射平臺-制導(dǎo)平臺-目標(biāo)”三者之間的優(yōu)化匹配問題。在分析了它機協(xié)同制導(dǎo)攻擊流程的基礎(chǔ)上,建立相應(yīng)的協(xié)同制導(dǎo)-攻擊匹配模型,設(shè)計一種模擬退火算法和改進螢火蟲算法相結(jié)合的混合優(yōu)化算法對模型進行求解。仿真實驗結(jié)果表明所設(shè)計的算法能在較短時間內(nèi)求解“武器發(fā)射平臺-制導(dǎo)平臺-目標(biāo)”三者之間的優(yōu)化匹配問題,且收斂性能較好,優(yōu)化精度較高。
協(xié)同制導(dǎo);螢火蟲算法;模擬退火算法;優(yōu)化匹配
文中在分析它機協(xié)同制導(dǎo)攻擊過程的基礎(chǔ)上,建立它機協(xié)同制導(dǎo)-攻擊優(yōu)化匹配問題的模型,根據(jù)所建模型特點設(shè)計了一種模擬退火算法和改進螢火蟲算法相結(jié)合的混合優(yōu)化算法對問題模型進行了求解。
多無人機超視距協(xié)同空戰(zhàn)中,各無人機合理分工、相互密切配合完成導(dǎo)彈發(fā)射與制導(dǎo)過程,從而完成對敵攻擊任務(wù),過程示意如圖1所示,為了便于區(qū)分,協(xié)同制導(dǎo)機和發(fā)射機分別用A-UAV、B-UAV表示,具體描述如下:
A-UAV完成對目標(biāo)的偵察探測跟蹤后,與 BUAV實時共享目標(biāo)信息、態(tài)勢數(shù)據(jù)等,B-UAV將收到的數(shù)據(jù)進行綜合處理并根據(jù)空戰(zhàn)態(tài)勢進行火控解算,保持無線電靜默接近目標(biāo),在進入武器發(fā)射范圍后發(fā)射空空導(dǎo)彈實施攻擊。導(dǎo)彈發(fā)射后,為了能對目標(biāo)進行有效打擊,考慮制導(dǎo)距離和精度等的影響,在共享空空導(dǎo)彈運動信息的基礎(chǔ)上,A-UAV在預(yù)定空域?qū)?dǎo)彈進行中制導(dǎo),隨后B-UAV撤離,直至空空導(dǎo)彈上末制導(dǎo)雷達開機并成功鎖定目標(biāo),完成目標(biāo)攻擊。
它機協(xié)同制導(dǎo)攻擊過程中,針對敵方每個目標(biāo),我方都能利用戰(zhàn)場態(tài)勢等數(shù)據(jù),計算分析確定與之匹配的發(fā)射機(B-UAV)和制導(dǎo)機(A-UAV)的臨時協(xié)作組合,稱之為發(fā)射制導(dǎo)匹配組合(launching guidance match,LGM),然后將決策方案傳回各參戰(zhàn)無人機。因此,為達成多無人機的一體化打擊和最佳協(xié)同、獲得最大作戰(zhàn)效能,應(yīng)先確定“武器發(fā)射平臺-制導(dǎo)平臺-目標(biāo)”三者之間的優(yōu)化匹配關(guān)系。
圖1 它機協(xié)同制導(dǎo)攻擊過程示意圖
它機協(xié)同制導(dǎo)-攻擊匹配問題本質(zhì)上屬于目標(biāo)分配范疇的問題,其模型的構(gòu)建是在參考超視距協(xié)同空戰(zhàn)中目標(biāo)威脅度和目標(biāo)殺傷概率兩者的基礎(chǔ)上進行的。
假設(shè)T={t1,t2,…,tNT}為我方無人機執(zhí)行攻擊任務(wù)的目標(biāo)集合,U={u1,u2,…,uNU}為導(dǎo)彈發(fā)射機B-UAV集合,G={g1,g2,…,gNG}為制導(dǎo)機A-UAV集合。根據(jù)待攻擊的目標(biāo)對LGM組合進行編號,則第i個匹配組合LGMi可表示為〈ti,uj,gk〉,其中,1≤i≤NT,1≤j≤NU,1≤k≤NG,即B-UAVuj負責(zé)發(fā)射導(dǎo)彈攻擊目標(biāo)ti,A-UAVgk負責(zé)對mj發(fā)射的空空導(dǎo)彈進行制導(dǎo)控制。發(fā)射機、制導(dǎo)機與目標(biāo)三者之間的幾何態(tài)勢關(guān)系示意如圖2所示。
圖2 發(fā)射機、制導(dǎo)機與目標(biāo)之間的幾何態(tài)勢關(guān)系圖
圖2中:Dji為發(fā)射機uj與目標(biāo)機ti的連線;vj為我機速度;vi為敵機速度;θ為我機Uj的方位角;φ為敵機Ti的方位角。上述角度的方向定為相對Dji右偏為正,左偏為負,則有0≤|φ|≤π,0≤|θ|≤π。
2.1模型假設(shè)
它機協(xié)同制導(dǎo)-攻擊優(yōu)化匹配問題是一個復(fù)雜的NP完全問題[2],為便于該問題的研究和建模,對該問題作如下假設(shè):
假設(shè)1:不考慮接力制導(dǎo),即編隊內(nèi)某一B-UAV發(fā)射空空導(dǎo)彈后,由編隊內(nèi)另一A-UAV一次性完成制導(dǎo)控制;
假設(shè)2:編隊內(nèi)各無人機之間能實現(xiàn)戰(zhàn)場態(tài)勢信息、目標(biāo)信息共享,同時各無人機之間、無人機與指控平臺之間的數(shù)據(jù)交換傳輸能力能夠滿足它機制導(dǎo)的要求;
假設(shè)3:發(fā)射制導(dǎo)指令的傳輸無延時,導(dǎo)彈發(fā)射和制導(dǎo)過程能夠?qū)崿F(xiàn)平滑銜接;
假設(shè)4:發(fā)射制導(dǎo)匹配過程中,在規(guī)定的某一決策時間內(nèi),目標(biāo)狀態(tài)信息相對不變,每完成一輪匹配,需根據(jù)當(dāng)前態(tài)勢對目標(biāo)信息及時進行更新;
假設(shè)5:我方各B-UAV的空間部署、掛載導(dǎo)彈的性能均能滿足對敵目標(biāo)實施攔截的條件,如導(dǎo)彈的射程能有效覆蓋目標(biāo)等;同時各A-UAV的部署位置、最大制導(dǎo)范圍、方位角、陣面朝向等均能滿足協(xié)同制導(dǎo)的要求。
2.2目標(biāo)函數(shù)
文中綜合考慮超視距協(xié)同空戰(zhàn)中的目標(biāo)威脅度和目標(biāo)殺傷概率兩方面,建立目標(biāo)函數(shù)。
1)目標(biāo)威脅度
式中:Tij為第i架敵機對第j架我機的威脅度;ωi(i= 1,…,5)為各威脅指數(shù)權(quán)重,表示各威脅指數(shù)對威脅度的重要性;Tic為空戰(zhàn)能力威脅指數(shù);Tiaj為角度威脅指數(shù);Tirj為距離威脅指數(shù);Tivj為速度威脅指數(shù);Tihj為高度威脅指數(shù)。
2)目標(biāo)殺傷概率
目標(biāo)殺傷概率表示發(fā)射導(dǎo)彈的B-UAV與協(xié)同制導(dǎo)的A-UAV攻擊目標(biāo)的能力,其值的大小與導(dǎo)彈的制導(dǎo)精度和導(dǎo)彈攔截次數(shù)有關(guān)。其中導(dǎo)彈的制導(dǎo)精度可用無人機攜帶單枚導(dǎo)彈對單一目標(biāo)的殺傷概率表示[3]。對于LGMi=〈ti,uj,gk〉,假設(shè) gk對 uj發(fā)射的導(dǎo)彈進行制導(dǎo),發(fā)射的導(dǎo)彈攔截目標(biāo)ti的次數(shù)為L,導(dǎo)彈第l次成功攔截ti的獨立概率為pijk(l)。則在整個超視距空戰(zhàn)過程中,ti被uj和gk組合成功毀傷的概率Pijk計算公式如式(2)所示。
求解最優(yōu)發(fā)射制導(dǎo)匹配組合的目的是發(fā)揮整體最佳作戰(zhàn)效能,即敵方損失最大或我方損失最小。文中以使敵方損失最大建立目標(biāo)函數(shù)為:
式中:Tij表示敵機對我發(fā)射機uj的威脅度;Pijk表示目標(biāo)殺傷概率;xijk為決策變量,表示ti、uj、gk之間的匹配關(guān)系,且xijk∈{0,1},xijk=1表示ti、uj、gk三者相匹配構(gòu)成臨時的LGMi,否則三者不構(gòu)成LGMi。
2.3約束條件
1)對?ti∈T,需分配一架發(fā)射機B-UAV發(fā)射空空導(dǎo)彈對其進行攔截,如式(4)所示:
2)對?ti∈T,需為其對應(yīng)的發(fā)射機uj分配一架制導(dǎo)A-UAV進行協(xié)同制導(dǎo)控制,即保證式(5)成立:
3)對于?uj∈U,其掛載導(dǎo)彈的總數(shù)NM應(yīng)滿足不少于其攻擊目標(biāo)總數(shù)ti的條件,如式(6)所示。
4)每架制導(dǎo)機A-UAV能夠同時控制多枚由同一架B-UAV或多架B-UAV發(fā)射的導(dǎo)彈。因此,空戰(zhàn)中,制導(dǎo)機A-UAV應(yīng)滿足制導(dǎo)容量約束,即對于?gk∈G,其最大制導(dǎo)容量NV應(yīng)滿足不小于可同時進行制導(dǎo)控制的導(dǎo)彈數(shù)量的條件,則約束條件如式(7)所示。
5)假設(shè)制導(dǎo)機A-UAV的制導(dǎo)總?cè)萘孔銐驗槊恳患馨l(fā)射機B-UAV所掛載的導(dǎo)彈提供協(xié)同制導(dǎo),即滿足式(18)的約束條件:
6)空間約束
首先,我方指揮控制平臺應(yīng)根據(jù)目標(biāo)航跡的預(yù)測結(jié)果,綜合考慮我方各B-UAV的空間位置和掛載導(dǎo)彈性能(導(dǎo)彈的射程能有效覆蓋目標(biāo))等參數(shù),判斷各B-UAV是否有條件對該目標(biāo)實施攔截。
其次,在滿足容量約束的條件下,一架A-UAV為多枚導(dǎo)彈提供制導(dǎo)控制時須滿足空間約束,即結(jié)合目標(biāo)航跡預(yù)測情況判斷其部署位置、最大制導(dǎo)范圍、方位角、陣面朝向等是否均能滿足協(xié)同制導(dǎo)的要求。
2.4問題的數(shù)學(xué)模型
以使敵方損失最大為目標(biāo),結(jié)合約束條件可得它機協(xié)同制導(dǎo)-攻擊優(yōu)化匹配問題的數(shù)學(xué)模型如式(9)所示。
它機協(xié)同制導(dǎo)-攻擊優(yōu)化匹配問題模型的決策變量為三維離散變量,其求解空間隨模型的增大呈指數(shù)級增長,極大的增加了計算時間,有時甚至無法求解。因此,針對模型三維離散決策變量及其非均勻、約束多等特點,提出一種混合優(yōu)化算法,該混合算法充分利用螢火蟲算法局部搜索能力強和模擬退火算法全局收斂速度快的特點,首先對螢火蟲算法進行改進并離散化處理,然后將模擬退火算法與改進型螢火蟲算法結(jié)合,對模型進行求解。
3.1模型求解思路
通常螢火蟲算法在迭代初期收斂速度較快,但隨著迭代次數(shù)的增加,使得群體喪失多樣性,收斂速度減慢,在沒搜索到全局最優(yōu)值前陷入停頓狀態(tài),進而產(chǎn)生早熟現(xiàn)象,易陷入局部最優(yōu)[4]。而模擬退火算法能以一定的概率跳出局部最優(yōu)解,避免早熟收斂現(xiàn)象。因此,設(shè)計一種SA與IGSO混合的優(yōu)化算法,當(dāng)IGSO算法搜索較優(yōu)的群體時,利用SA算法對部分較優(yōu)的個體進行局部搜索,從而求得最優(yōu)解。
綜合以上論述,SA-IGSO混合優(yōu)化算法的具體描述如下:
步驟1:初始化。令迭代次數(shù)z=0,在搜索空間內(nèi)生成滿足約束條件的螢火蟲群體,初始化N個螢火蟲個體的位置;根據(jù)式(10)計算每個個體適應(yīng)度值(目標(biāo)函數(shù)值),并根據(jù)所得結(jié)果初始化群體最優(yōu)位置X*及最優(yōu)適應(yīng)度值f(X*);初始化所有uj、gk上傳的參數(shù),得到所有目標(biāo)威脅度矩陣、uj與gk匹配組合下的目標(biāo)殺傷概率矩陣:
步驟2:在搜索空間內(nèi)對群體執(zhí)行離散化的IGSO算法進行全局搜索,確定種群的當(dāng)前最優(yōu)位置
步驟4:若滿足最大迭代次數(shù),搜索停止,得到群體最優(yōu)位置X*和最優(yōu)適應(yīng)度值f(X*),輸出當(dāng)前最優(yōu)的匹配方案,否則根據(jù)式(11)進行退溫操作,若T ≥0,z=z+1,返回執(zhí)行步驟2。
式中,λ表示退溫速率且0<λ<1。
3.2模擬退火算法的局部搜索策略
Step1:初始化參數(shù),確定初始溫度T=T0和每個T值的搜索次數(shù);
Step2:根據(jù)式(12)計算當(dāng)前溫度下螢火蟲個體i的適配值:
Step3:采用輪盤賭策略從所有個體位置Xi中確定全局最優(yōu)值X*,更新個體的位置;
Step4:重復(fù)執(zhí)行步驟Step2、3直至滿足停止條件,即達到預(yù)先設(shè)定的最大局部搜索次數(shù),輸出種群新的最優(yōu)位置X*,若不滿足停止條件,則轉(zhuǎn)到繼續(xù)執(zhí)行Step2。
由于算法初始溫度對算法有一定的影響,文中采用式(13)的初溫計算方式:
式中:fmax、fmin分別表示初始群體中螢火蟲個體的最大最小適應(yīng)度值;λ表示退溫速率且0<λ<1。
3.3改進的螢火蟲算法
螢火蟲優(yōu)化算法(glowworm swarm optimization,GSO)是通過模擬自然界中螢火蟲成蟲發(fā)光這一群體行為提出的一種新型的基于群體搜索的隨機優(yōu)化算法。該算法具有較強的全局尋優(yōu)能力和局部搜索能力[7-8],且實現(xiàn)簡單,但仍存在收斂速度慢、求解精度低等缺點,針對上述缺點,對基本 GSO算法進行改進。
基本GSO算法中,若螢火蟲個體的鄰域集合為空,螢火蟲個體會停止移動,從而減慢收斂速度;若鄰域集合不為空時,螢火蟲個體在決策范圍內(nèi)尋優(yōu)的過程中,隨著迭代次數(shù)不斷增加,又會出現(xiàn)個體與峰值間的距離逐漸縮小直至小于固定移動步長s的情況,從而引起峰值附近的震蕩,導(dǎo)致算法收斂速度減緩,求解精度降低。針對上述分析,提出以下改進:
首先,在個體鄰域為空時,以螢火蟲個體為中心按式(14)移動,若更新后的位置優(yōu)于移動前的位置,則保留更新后的位置,否則不更新。
其次,個體鄰域非空時,隨著迭代次數(shù)的增加,按式(15)計算個體與鄰域集合內(nèi)其他個體間的距離,若平均距離小于固定移動步長,則增加步長更新機制縮小步長,按式(16)更新步長;否則不更新。
式中,n為步長減小因子,0<n<1。
改進螢火蟲算法(improved GSO,IGSO)的執(zhí)行流程如圖3所示。
圖3 IGSO算法流程
3.4離散化IGSO算法的編碼和解碼策略
對于它機協(xié)同制導(dǎo)-攻擊優(yōu)化匹配問題模型中的三維決策變量xijk,設(shè)SA-IGSO的搜索空間內(nèi)隨機分布N只螢火蟲,NT、NU和NG分別為目標(biāo)、發(fā)射機和制導(dǎo)機的數(shù)量。發(fā)射機uj和制導(dǎo)機gk的組合對目標(biāo)ti的殺傷概率Pijk構(gòu)成的矩陣P(ti)階數(shù)為NU×NG。對于目標(biāo)ti,若分配發(fā)射機則必須對其分配一個對應(yīng)的協(xié)同制導(dǎo)機,故定義每個螢火蟲個體i的位置為NT×NU階的非負整數(shù)矩陣Xi為:
其中,xijk為非負整數(shù),且0≤xijk≤NG,xijk=0表示目標(biāo)ti、發(fā)射機uj、制導(dǎo)機gk三者不構(gòu)成LGMi;xijk≠0表示三者構(gòu)成臨時的LGMi,即對目標(biāo)ti,uj發(fā)射導(dǎo)彈后gk對uj進行制導(dǎo)控制,協(xié)同攻擊目標(biāo)ti,搜索空間為N ×NT×NU階的三維空間。
假設(shè)我方編隊內(nèi)進行發(fā)射攻擊的B-UAV和負責(zé)協(xié)同制導(dǎo)的A-UAV數(shù)量分別為NU=5、NG=6,需攻擊的敵方目標(biāo)數(shù)量NT=7,每架B-UAV掛載的空空導(dǎo)彈數(shù)NM=2,每架A-UAV的最大制導(dǎo)容量NV=2。每架B-UAV最多可攻擊兩個目標(biāo),每個目標(biāo)最多可被兩架B-UAV攻擊。設(shè)目標(biāo)威脅度矩陣為:
對于ti,不同的B-UAV和A-UAV的組合對其的攔截概率矩陣值P(ti)如下:
分別采用上述的離散化編碼解碼策略及局部搜索策略,運行SA-IGSO算法50次,最大迭代次數(shù)1 000,得出50次中的最優(yōu)適應(yīng)值對應(yīng)的“發(fā)射平臺-制導(dǎo)平臺-目標(biāo)”匹配方案見表1。
表1 SA-IGSO算法求解得到的匹配優(yōu)化方案
根據(jù)目標(biāo)序號對LGM進行編號,則形成的匹配組合LGMi為:
由此可得,該匹配方案使得它機協(xié)同制導(dǎo)多約束優(yōu)化問題的目標(biāo)函數(shù)值最大,即在一小段決策時間內(nèi),我方編隊B-UAV和A-UAV相互配合協(xié)同作戰(zhàn)的整體效能最佳,敵方損失達到最大。
分別運行SA-IGSO混合優(yōu)化算法、IGSO算法和文獻[9]中的GSO算法以及文獻[10]的NGA算法50次,最大迭代次數(shù)1 000次,基于 SA-IGSO、IGSO、GSO和NGA的求解過程進化曲線如圖4所示。
圖4 算法求解的適應(yīng)度值變化曲線
由圖4可知,相同條件下,文中提出的SA-IGSO算法在求解規(guī)模一般的它機協(xié)同制導(dǎo)多約束優(yōu)化問題模型時,與其他三種算法相比,在收斂性能和尋優(yōu)能力方面優(yōu)勢較明顯。文中算法經(jīng)過40次左右的迭代就能找到最優(yōu)解,能以較少的時間代價收斂于最優(yōu)適應(yīng)度值,有效的提高了尋優(yōu)速率。因此,文中提出的SA-IGSO算法能夠滿足中小規(guī)模多UAV協(xié)同空戰(zhàn)中“發(fā)射平臺-制導(dǎo)平臺-目標(biāo)”優(yōu)化配對的決策需求。
文中以超視距條件下的多無人機協(xié)同空戰(zhàn)為背景,研究它機協(xié)同制導(dǎo)-攻擊匹配問題。針對未來空戰(zhàn)中可能出現(xiàn)的協(xié)同制導(dǎo)的戰(zhàn)術(shù)措施,建立了關(guān)于目標(biāo)威脅度和目標(biāo)殺傷概率兩個參數(shù)變量的它機協(xié)同制導(dǎo)-攻擊匹配模型;針對模型特點提出了基于模擬退火算法和改進螢火蟲算法的問題求解算法,最后通過仿真算例分析并驗證了所提求解方法的有效性和適用性。
[1]肖冰松,方洋旺,胡詩國,等.多機空戰(zhàn)協(xié)同制導(dǎo)決策方法[J].系統(tǒng)工程與電子技術(shù),2009,31(3):610 -612.
[2]費愛國,張陸游,胡曉靜.基于改進拍賣算法的空空導(dǎo)彈制導(dǎo)權(quán)移交技術(shù)研究[J].上海航天,2013,30(1):18-23.
[3]陳正,王俊敏,李恒.超視距協(xié)同空戰(zhàn)火力打擊網(wǎng)絡(luò)協(xié)同目標(biāo)分配研究[J].科學(xué)與技術(shù)工程,2013,13 (14):4134-4140.
[4]KRISHNANAND K N,GHOSE D.Multimodal function optimization using a glowworm metaphor with applications to collective robotics[C]∥Proceedings of the Second Indian International Conference on Artificial Intelligence,2005:328-346.
[5] KRIKPATRICK S,GERLATT C D,VECCHI M P.Optimization by simulated annealing[J].Science,1983,220 (4598):671-680.
[6]SUMAN B,KUMAR P.A survey of simulated annealing as a tool for single and multi-objective optimization[J].Journal of the Operational Research Society,2006,57(10):1143-1160.
[7] KRISHNANAND K N,GHOSE D.Glowworm swarm optimization:A new method for optimizing multi-modal functions[J].International Journal of Computational Intelligence Studies,2009,1(1):93-119.
[8] KRISHNANAND K N,GHOSE D.Glowworm swarm optimization for simultaneous capture of multiple local optimal of multimodal functions[J].Swarm Intelligence,2009,3 (2):87-124.
[9] KRISHNANAND K N,GHOSE D.Glowworm swarm optimization for multimodal search spaces[M].SpringerBerlin Heidelberg:Handbook of Swarm Intelligence,2010:451-467.
[10]YU F L,TU F,PATTIPATI K R.A novel congruent organizational design methodology using group technology and a nested genetic algorithm[J].IEEE Transactions on Systems,Man,and Cybernetics-Part A:Systems and Human,2006,36(1):5-18.
A Cooperative Guidance by Other Aircraft-attack Matching Method Based on SA-IGSO
CHEN Jieyu,WANG Bo,WANG Xun,HU Shijun
(School of Information and Navigation,Air Force Engineering University,Xi’an 710077,China)
In order to improve flexibility of cooperative air combat,the timeliness and availability for target attack,the problem of how to confirm the matching relationship among the“weapon launch platform-guidance platform-target”was studied.On the basis of analysis the cooperative guidance process,a cooperative guidance-attack matching model was proposed for the problem and the hybrid optimization algorithm based on improved glowworm swarm optimization and simulated annealing algorithm was designed to solve the model.The experimental results show that the proposed algorithm can solve the matching and optimization problem among“weapon launch platform-guidance platform-target”in short restraint time and the algorithm has fine convergent and optimized capability.
cooperative guidance;glowworm swarm optimization algorithm;simulated annealing algorithm;optimization matching
TB391.9
A
10.15892/j.cnki.djzdxb.2016.01.036
2014-09-10
國家自然科學(xué)基金(61273048)資助
陳潔鈺(1989-),女,陜西銅川人,碩士研究生,研究方向:多無人機協(xié)同作戰(zhàn)指揮決策與控制、戰(zhàn)場態(tài)勢評估等。