劉順利,陳亞生,陳 琳
(1防空兵指揮學院,鄭州 450052;2南京軍區(qū)軍訓和兵種部,南京 210000)
空中目標威脅度一般是指敵方對我方保衛(wèi)目標侵襲成功的可能性及侵襲成功時可能造成的破壞程度。對敵空中目標的威脅度評估和火力單元射擊有利度評估是指揮信息系統區(qū)分兵力、火力的基本依據。
目前對空中目標威脅度的評估模型較多[1-2],為了使模型在設定的場合有很強的適應能力,必須對一些因素作相應簡化,因此限定了模型在其他場合的適用性;加之新空中目標、新戰(zhàn)場情況等的不斷出現,因此使得空中目標威脅度評估模型總在不斷研究更新中。Agent[3-4]技術的發(fā)展為解決模型的適用性提供了有效方法。文中用Agent模型自下而上的建模方式把空中目標威脅度評估劃分為多個具有高度自治能力的Agent實體,通過對這些實體和知識庫的維護,實現空中目標威脅度評估的通用化、智能化,使空中目標威脅度評估更加精確、高效,且能適應不同的戰(zhàn)場環(huán)境。
基于Agent的目標威脅度評估模型通過和火力分配系統中其他Agent交互得到威脅度估計因素,并模擬人的思維方式對任務和進度進行分析,進行威脅度評估。根據空中目標威脅度評估的特點,建立目標威脅度評估模型體系結構如圖1所示,在動態(tài)環(huán)境中,模型以環(huán)境事件作為Agent反應的前提,在目標支配下,利用強化學習方法進行在線學習,產生最優(yōu)動作策略集,也就是空中目標威脅度。
空中目標威脅度評估的Agent模型可分為感知模塊、意圖模塊、執(zhí)行模塊和知識庫模塊。其中:
態(tài)勢感知模塊負責獲取當前環(huán)境以及自身內部狀態(tài)的認知,對目標威脅度評估因素和自身任務、進度的分析報告情況與火力分配系統中其他Agent進行通信和交互;
意圖模塊主要從知識庫中獲取威脅度評估的因素,并根據空情和影響空中目標威脅度的因素對空中目標威脅度產生認知,同時修正推理過程中相應的權重;
知識庫模塊主要存儲影響空中目標威脅度的因素知識,并通過自身學習改變各因素相應權重;
執(zhí)行模塊將系統對目標威脅度的認知狀態(tài)按照威脅度評估的最優(yōu)化原則生成符合戰(zhàn)場環(huán)境的空中目標威脅度評估策略,并對結果進行反饋和修正,根據自身意圖、動作策略以及對當前態(tài)勢的認知采取相應動作。
圖1 空中目標威脅度評估的Agent模型體系結構
1)天氣因素。天候對目標威脅度的影響主要是降雨、降雪及起霧等情況下。
2)被保衛(wèi)目標情況。根據空襲兵器目標選擇將其分為以下五個方面:領導機構與相關系統;關鍵的生產設施;與居民日常生產相關目標,包括供水系統,生產用品供應等;與防空力量相關的目標;與輿論相關的目標。不同的空襲兵器對不同的被保衛(wèi)目標威脅程度不同。
3)目標類型。將來襲目標按轟炸機、殲擊轟炸機、強擊機、武裝直升機、隱形飛機等類型層層細化到具體機型。
4)攜彈類型。目標攜帶彈藥類型不同其威脅度也不相同。
5)目標位置。目標位置包括目標高度、目標距離、目標相對于被保衛(wèi)目標的航路捷徑投影,這些因素都屬于越小威脅度越大的參數,即高度、距離、航路捷徑越小的目標威脅度越大,但都有一個下限值。因此在接收目標位置信息后,可以先行對其它因素加權求取威脅度。
6)目標速度??罩心繕怂俣却?,則可射擊時間短,其射擊誤差大,目標威脅度大;反之,空中目標速度小,威脅度小。
7)目標架數??罩心繕思軘翟蕉?,其威脅度越大;反之則越小。
空中目標威脅度評估知識庫中知識為認知模型的知識庫,作為初始知識使用,初始值由專家經驗及其它權威數據源得出,知識庫中內容還應該包括在之后自學過程中產生的新知識。知識庫之間為并行關系。這里主要構建天氣因素、被保衛(wèi)目標類型、空中目標相對位置知識庫。
2.2.1 空中目標在不同天氣條件下威脅度知識庫
空中目標在不同天氣條件下威脅度Wt[i]不同。將能見度較好、不影響空襲兵器作戰(zhàn)效能的天氣條件歸類為Wh1,將降雨、降雪、濃霧等能見度低、影響敵空襲兵器空襲效能的天氣條件歸類為Wh2;根據敵空襲兵器的不同作戰(zhàn)性能將其分為轟炸機Style1,戰(zhàn)斗機Style2,強擊機Style3,武裝直升機Style4,電子戰(zhàn)飛機Style5,從陸地或海面發(fā)射的巡航導彈Style6。由于目前戰(zhàn)斗機設計性能差距較大,將機型中具有全天候作戰(zhàn)能力的戰(zhàn)斗機、性能先進載彈量大的轟炸機等加注A,具有隱身性能的飛機加注Y;巡航導彈中為多彈頭的加注D,帶核彈頭的加注H;飛機攜彈種類分為一般對地攻擊炸彈、火箭彈As1,精確制導炸彈或導彈As2,集束炸彈As3,碳纖維彈As4,空對地導彈As5,從空中發(fā)射的巡航導彈為As6,反輻射導彈As7,核彈為As8。其詳細知識庫設計略。在這里天時、機型和彈藥類型由態(tài)勢感知A-gent中感知,經過Agent間通信機制具體將其分類。
2.2.2 空中目標對被保衛(wèi)目標的威脅度知識庫
敵空襲兵器對被保衛(wèi)目標的威脅度Wm[i]各不相同,目標類型根據敵空襲重點的選擇分為國家領導指揮機構Ob1;關鍵生產設施Ob2;居民生產設施Ob3;輿論通信設施Ob4;地面交通設施,其中公路、鐵路等地面設施為Ob5,機場為Ob6;軍事力量平臺,其中指揮機構為Ob7,武器平臺為Ob8,雷達系統為Ob9。其詳細知識庫設計略。
2.2.3 空中目標相對位置威脅度知識庫
空中目標在空中點坐標由空情報知獲得,其相對位置不同,威脅度Wp[i]也不相同。在這里主要考慮空中目標的高度、航路捷徑的影響??紤]這些位置函數是一種連續(xù)函數,因此,空中目標相對位置威脅度也采用連續(xù)函數表示,而該連續(xù)函數的系數采用知識庫表示。這里首先采用模糊數學的方法,構建威脅度的分布函數,再由分布函數構建出其隸屬函數。從分布函數角度而言,各種機型是一樣的,但它們有別于導彈。
1)空中目標在不同高度的威脅度Wh[i]分布如圖2、圖3所示。
圖2 飛機的高度威脅度
圖3 巡航導彈的高度威脅度
圖中:H[i]為敵機相對保衛(wèi)目標的高度,H[i]以百米為單位。根據現代空襲兵器的戰(zhàn)術技術性能,目標高度小于或等于0的可能性較小。模型中,當目標高度小于或等于0時,認為H[i]=0;a、b為系數。
由圖2和圖3可得高度威脅度Wh[i]為:
2)空中目標航路投影捷徑威脅度Wd[i]的分布如圖4、圖5所示。
圖中:dj[i]為來襲敵機相對保衛(wèi)目標的航路捷徑,以百米為單位;c、d為系數。
圖4 飛機的航路捷徑威脅度
由圖4和圖5可得航路捷徑威脅度Wd[i]為:
在這里根據空中目標不同建立其高度和航路捷徑的系數相關的知識庫(略),同時在知識庫中加入空中目標的飛行狀態(tài)和航路方向,其中飛行狀態(tài)分為水平飛行Fs1和俯沖Fs2,其中當水平飛行時Fs1取0.3和俯沖時Fs2取0.8;航路方向劃分為臨近Course1和離遠Course2,其中臨近時Course1取1和離遠時Course2?。?。
圖5 巡航導彈的航路捷徑威脅度
知識庫的自學習采用自適應神經模糊推理系統[5](ANFIS),該系統是一種用來在給定的輸入輸出數據中產生模糊規(guī)則的系統方法。這里以空中目標在不同天氣條件下威脅度知識庫為例,說明其工作過程,對其中輸入和輸出作了相應的簡化,其工作過程如圖6所示。
第一層是輸入層。其輸入為飛機類型、攜彈類型和天氣情況,輸出為轟炸機(S1)、戰(zhàn)斗機(S2),一般炸彈(As1)、精確制導炸彈(As2),能見度較好(Wh1)、能見度不好(Wh2)。
圖6 空中目標在不同天氣條件下威脅度知識庫學習算法
第二層為模糊化層。該層采用鐘形激活函數。
第三層為規(guī)則層。本例中共生成8個規(guī)則。
第四層為歸一化層。該層每個神經元接收來自規(guī)則層所有神經元的輸入,并計算給定規(guī)則的歸一化激活強度。
第五層是逆模糊層。
第六層表示總和神經元。
ANFIS處理問題時,沒有必要給出規(guī)則后項參數的任何先驗知識,ANFIS會學習這些參數并調節(jié)成員函數。ANFIS采用混合學習算法,其學習的過程融合了最小二乘估算法和梯度下降法,可表示為一個P線性方程。
利用ANFIS學習算法,經過學習可得到轟炸機攜帶精確制導炸彈在能見度較高的情況下威脅度最大,為0.788,其權重經過學習后為0.7822;而戰(zhàn)斗機攜帶一般炸彈在能見度較低情況下的威脅度較小,為0.213,其權重經過學習后為0.112。
評估空中目標威脅度的Agent學習算法,采用神經網絡方法。首先說明兩點:1)由于在現代反空襲作戰(zhàn)中,敵空襲兵器可以全方位發(fā)起攻擊,而且判定目標威脅度時,空中目標并不處于攻擊段,所以在此模型中暫不考慮空襲兵器主攻方向的因素;2)計算空中目標威脅度時,只考慮一批目標中只有一架飛機或一枚巡航導彈,若需考慮一批目標中有多個空襲兵器,可在一個空中目標的基礎上計算。
圖7 目標威脅度評估
第一層為歸一化層,共取3個節(jié)點,輸入為各種機型在天氣、被保衛(wèi)目標類型及空中目標相對位置的威脅度估計,其輸入由評估因素知識庫輸出值提供;
第二層為BP網絡輸入層,相應也取3個節(jié)點;
第三層為隱層,此處取8個節(jié)點,輸出特性函數取S型函數;
第四層為輸出層,取1個節(jié)點,輸出特性函數取S型函數,輸出值即為空中目標對被保衛(wèi)目標的威脅程度,此處采用(0,1)區(qū)間的連續(xù)數。
設網絡中輸入層權值為ω1mj(m =1,2,3;j=1,2,…,8),輸入層節(jié)點為o1m(m=1,2,3);中間層的權值為ω2j(j=1,2,…,8),中間層的節(jié)點值為o2j(j=1,2,…,8),中間層的閥門值為θ2j(j=1,2,…,8);輸出層的閥門值為θ3,輸出層的節(jié)點值也即威脅度值為w。則節(jié)點值的數學表達式為:
威脅度計算主要是用于防空作戰(zhàn)指揮信息系統中對空中目標的威脅度進行排序,從而為防空兵群火力分配提供基本依據。為了驗證該模型的有效性,本例采用10個訓練樣本(見表1),設定10個不同種類和不同飛行條件的目標,其期望威脅度值由專家確定。將表1中的樣本值輸入進行BP神經網絡模型的自學習訓練,得出訓練后的權值和閥門值(見表2)。
表1 樣本數據
表2 BP神經網絡模型訓練后的權值和閥門值
在此選定4個檢驗樣本(見表3)。將表2中的經過自學習得出的權值和閥門值代入BP神經網絡模型,對4個檢驗樣本進行威脅度計算,得出實際輸出威脅度值。該模型的輸出威脅度與期望威脅度排序一致且誤差均小于0.005,從而驗證了該模型的有效性。
表3 檢驗數據
Agent技術應用正處于起步階段,對于一些概念和關鍵技術的理解還沒有達到共識。由于考慮因素的多樣性、全面性,以及自學習算法的復雜性等,實際上利用Agent評估空中目標威脅度是非常復雜的過程,文中重在說明方法和過程,因此對一些情況進行了必要的簡化。
[1] 劉己斌.城市防空作戰(zhàn)指揮自動化系統火力分配研究[D].鄭州:防空兵指揮學院,2001.
[2] 范勇,陳有偉,李為民.彈炮結合防空武器系統火力分配模型[J].火力與指揮控制,2004,29(3):46-48.
[3] 劉剛.基于智能Agent的動態(tài)協作任務求解機制及應用研究[D].北京:鐵道科學研究院,2006.
[4] 石純一,張偉.基于Agent的計算[M].北京:清華大學出版社,2007.
[5] [澳大利亞]邁克·耐格納威斯基.人工智能智能系統指南[M].顧力栩,等譯.北京:機械工業(yè)出版社,2007.