朱光耀,張貞凱
(江蘇科技大學電子與信息學院,江蘇 鎮(zhèn)江 212003)
在現(xiàn)代的雷達防空體系中,目標類型多樣、數(shù)目較多,且機動性強,給雷達的跟蹤帶來了嚴峻的挑戰(zhàn)。而相控陣雷達利用波束可以進行快速照射,可以跟蹤掃描單一的目標,可是在實際中目標不只一個,當跟蹤目標數(shù)目達到上限時,精準快速地對目標威脅度進行評估,分辨重點目標和次要目標,使得雷達波束可以實時地調(diào)度多個目標,增強對探測區(qū)域的感知性能[1-2],這是目前進行雷達跟蹤所需解決的首要任務(wù)。
目前雷達跟蹤方法包含波束分配方法、波形等方向的研究[3]。在多目標跟蹤環(huán)境下,相控陣雷達的調(diào)度管理模塊決定執(zhí)行申請調(diào)度任務(wù)的順序,它之所以具有靈活性和自適應(yīng)性正是在于調(diào)度功能的實現(xiàn)。對于多個目標的波束調(diào)度,有規(guī)劃論、協(xié)方差控制、信息論、博弈論等研究方法。文獻[4]基于規(guī)劃論原理將波束調(diào)度問題描述成二元混合整數(shù)規(guī)劃問題;文獻[5]將協(xié)方差引入到雷達資源管理中,提出基于協(xié)方差最小準則的調(diào)度方法;依據(jù)此研究,文獻[6-8]提出一系列利用協(xié)方差進行波束分配的方法;文獻[9-10]利用信息增量來進行波束分配。
基于規(guī)劃論的方法雖然簡單且易于實現(xiàn),但是針對復雜度較高的問題求解速度較慢。 基于協(xié)方差控制的方法能夠?qū)崿F(xiàn)更精細的資源管理,但由于預先設(shè)定好了期望協(xié)方差,所以實時性較差,且在考慮決策目標時過于單一。而信息增量側(cè)重點在其機動性,不能依據(jù)期望的精度來分配波束,追求的是最高精度,不利于節(jié)約波束資源。在多目標跟蹤的情況下,目標的類型、目標高度、距離、目標速度、加速度、方位角等都影響著目標威脅度,目標是機動變化的,威脅度在實時變化,反映出雷達受到威脅的大小。BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)有著很強的適應(yīng)性和學習性能,對于實際環(huán)境下目標數(shù)據(jù)實時變化的特性,可以很好地解決該問題。文獻[11-12]將其用于氣象等目標威脅度的評估,缺點是收斂曲線緩慢,但與此同時為本文算法的實現(xiàn)提供了基礎(chǔ)理論的支持。
針對上述問題,本文利用混合遺傳粒子群優(yōu)化(Genetic Particle Swarm Optimization,GPSO)算法改善的BP 神經(jīng)網(wǎng)絡(luò),實現(xiàn)了波束分配。該方法首先給出目標威脅評估的因素,對其進行量化和歸一化處理,以運動狀態(tài)信息和目標威脅度分別作為神經(jīng)網(wǎng)絡(luò)的輸入和輸出,得到混合遺傳粒子群改進的BP網(wǎng)絡(luò)的威脅度評估方法。以執(zhí)行威脅率為性能指標,根據(jù)目標威脅值進行波束調(diào)度。仿真結(jié)果表明了本文算法的高效性。
BP 神經(jīng)網(wǎng)絡(luò)具有多層的結(jié)構(gòu)[13],利用誤差逆轉(zhuǎn)進行訓練。包括輸入層、數(shù)個隱含層和輸出層,是一種典型的多層結(jié)構(gòu),層間全互連,同層單元間沒有互聯(lián)。在本文中,輸入的目標威脅因素即為輸入層,隱含層節(jié)點數(shù)目沒有固定值,通常根據(jù)具體的模型進行選擇,輸出層取威脅度值。基本BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖1 所示。
圖1 BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)
BP 算法的樣本訓練包括正向和逆向傳播兩個過程。本文中,正向過程將經(jīng)過量化和歸一化處理的數(shù)據(jù)經(jīng)隱含層傳至輸出層,如果輸出層的威脅度值滿足期望,那么前向過程的訓練結(jié)束,否則根據(jù)輸出和預設(shè)定值的差,進入逆向過程,改變節(jié)點的權(quán)值與閾值,使期望值和輸出值之間的誤差盡可能小,當輸出層的誤差滿足結(jié)束條件時訓練終止,保存得到的權(quán)值與閾值。
粒子群優(yōu)化(Particle Swarm Optimization,PSO)算法[14]是一種經(jīng)典的群智能算法。每個個體有各自的飛行速度,歷史最佳位置包含個體和全局最佳位置,相應(yīng)的適應(yīng)值為個體最佳值和全局最佳值?;A(chǔ)PSO 算法中,第n 代個體,第d 維(1≤d≤D)元素的迭變?nèi)缡剑?)、式(2):
其中,n 表示當前處于第n 代;ω 為慣性權(quán)值;c1和c2都為正常數(shù),稱為加速系數(shù);r1和r2是兩個在[0,1]范圍內(nèi)變化的隨機數(shù)。慣性權(quán)值的選擇影響著算法的收斂精度,當慣性權(quán)值大時,收斂速度快,但會造成收斂精度的下降。
雖然該算法易于實現(xiàn),但也存在易陷入局部極值,穩(wěn)定性較差的缺陷。因此,為了盡量避免局部極值,改善預測精度,就需要對基本粒子群算法進行改善。
遺傳算法(Genetic Algorithm,GA)根據(jù)生物遺傳,得出的一種進行最優(yōu)化搜尋且具有隨機性的計算方法。由于PSO 容易得到局部極值,GA 不易陷入局部收斂但搜索速率慢,為此以PSO 為主體,將GA的交叉變異步驟加入到PSO 中[15],從而實現(xiàn)快速收斂,得到最優(yōu)解。
GA-PSO 算法描述及主要步驟如下:
1)種群初始化。包含群體規(guī)模,各個體的位置Xi、速度Vi和維數(shù)D,設(shè)定Vmax和Xmax,以及迭代量Tmax;
2)計算適應(yīng)值,初始化個體Pbest和全局最優(yōu)解Gbest;
3)粒子位置速度更新。其表達式如式(1)、式(2)所示。
搜索過程中ω 的變化公式為:
式中,T 為最大迭代次數(shù);ωstart與ωend分別為ω 取值范圍的邊界值。
4)對種群進行交叉變異操作。以交叉值Pc運算,用新組合的粒子代替原先個體。新個體的位置由式(4)、式(5)來計算,即:
根據(jù)變異概率pm選擇個體進行變異。
5)更新種群。對比粒子目前值與歷史值,若目前值較優(yōu),用其代替其歷史值;然后把單個粒子的最優(yōu)解與全局最優(yōu)解對比,若個體最優(yōu)值更優(yōu)則將此位置記錄為新的群體最優(yōu)解。
6)終止條件判斷。是否達到迭代值或滿足期望的目標值,若沒有,轉(zhuǎn)至3);反之,過程結(jié)束,輸出全局最優(yōu)。
空中威脅評估是一種NP(Non-Deterministic Polynomial)問題,對于空中目標威脅評估需要考慮的因素有很多,例如天氣地理及敵我情況等,在本文中,選取7 個典型因素指標來建立神經(jīng)網(wǎng)絡(luò)評估模型,如圖2 所示,并對其進行量化。
1)目標類型:大型目標、中型目標、小型目標的量化值為3、5、8;
2)目標高度:目標的威脅值隨著目標高度減小而變大。按超低、低、中、高、超高依次量化為9、7、5、3、1;
3)目標速度:目標速度直接影響到雷達防空的反應(yīng)時間。目標威脅度隨著速度的增加而減小。
圖2 目標威脅度指標
4)目標加速度:威脅值隨加速度的增大而增大。
5)目標航向角:目標威脅度隨著航向角的增加而減小。從0°~360°等間隔依次劃分為9、8、7、6、5、4、3、2、1;
6)目標距離:目標距離表現(xiàn)了目標威脅的概率。目標威脅度隨著距離的增大而減小。其隸屬度值由式(6)得到:
7)干擾程度:目標干擾性能越強,其對雷達的威脅也就越大。干擾程度按很強、強、中、弱、很弱分為9、7、5、3、1。
該模型的流程圖如圖3 所示。
圖3 模型流程圖
具體步驟如下:
1)數(shù)據(jù)預處理
運動狀態(tài)信息和目標威脅程度分別為輸入和輸出量。采用matlab 的歸一化模塊對各因素進行處理,取值在[0,1]之間。
2)BP 神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)的確定
依據(jù)上文得到的參數(shù),設(shè)定包含3 層結(jié)構(gòu)的模型。第1 層為輸入層,包含類型、高度、速度、航向角、距離、干擾程度、加速度這7 個節(jié)點,輸入的為其歸一化值。隱層有9 個點,隱含層的輸出使用Sigmoid 函數(shù)。輸出為威脅度值,為1 個節(jié)點。
3)最優(yōu)權(quán)值和閾值的確定
GPSO 的適應(yīng)度函數(shù)為
GPSO 每次在迭代過程中,根據(jù)式(7)計算各元素的值,并完成對個體位置和速率的更新。更新操作完成后,再次計算適應(yīng)度,直至獲取最佳解。
4)樣本的訓練與模型的實現(xiàn)
由GPSO 得到的最優(yōu)初始權(quán)值和閾值,采用訓練集對網(wǎng)絡(luò)進行訓練,計算訓練誤差,當誤差滿足要求或達到最大循環(huán)次數(shù),訓練結(jié)束。
5)預測輸出結(jié)果
網(wǎng)絡(luò)訓練收斂后,就確定了目標威脅評估模型。對訓練好的網(wǎng)絡(luò)進行測試。將測試樣本集經(jīng)過歸一化后的7 個評估因素作為輸入,輸出層則為預測的威脅度值。
執(zhí)行威脅率(Execution Threat Rate,ETR):成功調(diào)度的目標威脅值總和與總的目標威脅值總和的比值。執(zhí)行威脅率體現(xiàn)了對總體任務(wù)的調(diào)度能力。
式中,n 為雷達跟蹤目標的數(shù)目,K 為目標總威脅度值。
從某數(shù)據(jù)庫中采集315 組數(shù)據(jù),部分數(shù)值見表1,直升機、大型目標和小型目標均為105 組。訓練集選擇3 種類型,各100 組數(shù)據(jù),剩下的15 組用作測試集。BP 神經(jīng)網(wǎng)絡(luò)部分,設(shè)置學習因素為0.1,訓練期望為1×10-4。GPSO 算法部分,粒子群算法的權(quán)值依據(jù)式(3)動態(tài)變化,經(jīng)過多次試驗,wstart 與wend 分別取0.9 和0.3,加速系數(shù)c1和c2均取1.55,種群規(guī)模100,速度取值[-1,1],位置范圍取值[-3,3],最大尋優(yōu)次數(shù)設(shè)置250 次,交叉值Pc為0.3,變異值pm為0.1,基本BP 網(wǎng)絡(luò)和基本粒子群BP 網(wǎng)絡(luò)數(shù)值設(shè)置與本文方法相同。
比較本文算法和另兩種算法的預測輸出及其誤差。模擬雷達在跟蹤的某一時刻,2 個波束跟蹤4個目標,將按威脅度分配波束、隨機分配波束和基于信息增量分配波束進行效益對比,利用執(zhí)行威脅率(ETR)來進行性能評估。
表1 部分目標威脅值數(shù)據(jù)
目標主要參數(shù)如下:
目標1:初始位置(4 000,-8 000)m,初始速度為90 m/s,做勻速運動。
目標2:初始位置(-2 500,-10 000)m,初始速度為55 m/s,在1 s~50 s 內(nèi)做勻速直線運動,51 s~100 s 做加速度為-1 m/s2的勻減速直線運動。
目標3:初始位置(-8 000,0)m,初始速度為40 m/s,做加速度為1 m/s2的勻加速直線運動。
目標4:初始位置(0,4 000)m,初始速度為55 m/s,在1 s~80 s 內(nèi)做勻速直線運動,81 s~100 s 做加速度為2 m/s2的勻加速直線運動。
圖4 GPSO 適應(yīng)度曲線
圖5 真實值與預測值對比
表1 3 種方法的平均誤差
圖4 縱坐標的適應(yīng)度即為目標真實值和預測值之差。從中得出,和PSO 算法比較,GPSO 算法優(yōu)化BP 網(wǎng)絡(luò)迭代收斂速率相差不大,但最終運行結(jié)果得到顯著改善。由圖5 得出,GPSO 優(yōu)化BP 網(wǎng)絡(luò)模型的預測值最接近真實的數(shù)值。圖6 能夠清晰得到BP 的預測誤差最大,PSO 網(wǎng)絡(luò)的輸出值比BP 網(wǎng)絡(luò)的誤差小,但波動仍較大,本文提出的算法誤差最小,其絕對誤差明顯小于另兩種優(yōu)化模型,并且最穩(wěn)定。表2 為3 種方法的平均絕對誤差,可以清晰看出本文所提算法的平均誤差值最小,展現(xiàn)出較好的威脅評估能力。
圖6 3 種方法的絕對誤差
表2 3 種方法的平均誤差
仿真基于本文提出的威脅度評估模型與常規(guī)的隨機分配波束方法和依據(jù)信息增量分配波束方法進行了對比。如圖7 所示。
圖7 目標軌跡
圖8 依據(jù)威脅度的波束1 和2 分配
圖9 依據(jù)信息增量的波束1 和2 分配
表3 3 種波束調(diào)度方法對比
從圖8 可以看出,由于目標1 和目標2 初始時距雷達較近,目標3 和目標4 距雷達較遠,威脅較小,故初始時波束照射目標1 和目標2 較密集;在70 s~100 s 內(nèi),目標3 和目標4 朝著雷達運動,且有較大的加速度,機動性強,此時雷達受到的威脅度極高,故波束需要更多地分配給目標3 和目標4。與基于信息增量進行波束分配相比,基于威脅度進行波束分配,實現(xiàn)了對高威脅度目標的實時調(diào)度。表3可以看出,依照威脅值進行波束分配的執(zhí)行率要高于隨機分配波束和依據(jù)信息增量分配波束的執(zhí)行率,體現(xiàn)出對重要目標的調(diào)度性能要強于另兩種。在MATLAB R2014a 的運行環(huán)境下,運行100 步仿真的時間為0,276 s,與另兩種方法相比相差不大,能夠滿足系統(tǒng)的實時性要求。對于空中復雜環(huán)境下目標數(shù)據(jù)的動態(tài)多變性,本文所提模型不存在主觀性的偏差,有著較好的適應(yīng)性能、學習性能和線性非線性映射性能,且運行簡便,易于實現(xiàn),精度較高。
空中目標威脅度的評估是雷達波束調(diào)度需要解決的首要任務(wù),本文針對不同目標的特點,利用遺傳算法改進粒子群神經(jīng)網(wǎng)絡(luò),建立GPSO 優(yōu)化的BP 網(wǎng)絡(luò)目標威脅評估模型。選取目標威脅評估的7個典型因素用于仿真實驗。最后仿真結(jié)果顯示,本文算法的絕對誤差遠遠小于BP 神經(jīng)網(wǎng)絡(luò)、基本PSO 神經(jīng)網(wǎng)絡(luò)得到的誤差,有著良好的預測精準性能,可以有效地預測目標威脅值。實現(xiàn)了對高威脅目標的優(yōu)先調(diào)度,體現(xiàn)了相控陣雷達波束調(diào)度的實際情形,對雷達的波束分配起到了關(guān)鍵作用。