張紅利,吉琳娜,楊風暴
(中北大學信息與通信工程學院,山西 太原 030051)
面對復雜海戰(zhàn)場環(huán)境,快速、準確地掌握敵方行為意圖能夠使指揮員及時做出下一步的戰(zhàn)術應對措施。通過觀察目標的行為和運動狀態(tài)信息,識別目標的行為意圖[1]。在行為意圖識別過程中,存在著許多不確定性因素。如何對不確定性信息快速準確識別行為意圖是一個研究重點。
目前對目標的行為意圖識別研究主要基于認知模板[2-3]、神經(jīng)網(wǎng)絡[4-6]、多屬性決策[7]、灰色關聯(lián)方法[8]等。文獻[9]對觀察的目標建立作戰(zhàn)態(tài)勢模板,從敵方目標中提取特征信息,通過與模板庫中的相似度對比確定目標行為意圖;而在模板匹配過程中,需要較長的時間,才能在上一時間段預先選擇的模板中進一步判斷行為意圖,進而識別出行為意圖。文獻[10]將目標屬性和戰(zhàn)術意圖分別作為輸入、輸出,利用神經(jīng)網(wǎng)絡對輸入和輸出特征數(shù)據(jù)進行網(wǎng)絡模型訓練,得到屬性和意圖之間的規(guī)則,能夠有效識別意圖。文獻[7]基于模糊推理規(guī)則和多屬性決策對目標特征進行攻擊意圖的判斷;但基于多屬性決策當輸入信息的數(shù)量較多時,其計算量較大,運算時間較長,無法滿足實時性。文獻[11]利用高維數(shù)據(jù)相似度計算目標狀態(tài)對意圖的支持度,結合D-S證據(jù)理論對目標意圖進行貫序識別,有實時性,但是行為意圖識別準確度不理想。
文獻[12]利用知識圖譜具有信息過濾、快速檢索的功能,結合相似度實現(xiàn)了艦船目標的識別。文獻[13]將知識圖譜用于構建知識庫,將??漳繕诵畔⑦M行關聯(lián),并實現(xiàn)??漳繕说臏蚀_識別。可能性網(wǎng)絡源于貝葉斯網(wǎng)絡思想,是可能性理論與圖形模式的結合,通過構建不確定信息關系間的模型,使得可能性網(wǎng)絡模型能夠合理地描述和處理不確定信息,利用可能性推理對行為意圖進行識別[14]。知識圖譜可將數(shù)據(jù)轉化為機器能夠理解和處理的知識,具有快速查詢,匹配搜索信息的優(yōu)勢,在行為意圖識別中能夠將獲取到的數(shù)據(jù)進行狀態(tài)特征信息提取,為行為意圖識別的推理提供有利支撐。雖然知識圖譜能夠將海面目標的特征信息進行相互關聯(lián),但無法解決不確定性推理問題。可能性推理是基于知識圖譜中匹配到的狀態(tài)信息和結合可能性網(wǎng)絡給出節(jié)點關系間的條件可能性分布,基于可能性推理規(guī)則實現(xiàn)目標的行為意圖。知識圖譜和可能性推理的結合,能夠獲取到目標特征信息并快速、準確地識別行為意圖。因此本文利用可能性理論的思想,通過構建可能性網(wǎng)絡模型對行為意圖進行識別,將目標相關數(shù)據(jù)輸入到知識圖譜中來判斷它所屬具體等級和類型,再利用可能性分布對目標進行行為意圖識別。
目標的特征信息是行為意圖識別的要素,知識圖譜能夠將目標特征信息進行關聯(lián)。知識圖譜(KG)是在傳統(tǒng)知識工程以及語義Web基礎上發(fā)展而來的知識表示技術,旨在描述客觀世界的概念、實體、事件及其相互間的關系,快速幫助用戶獲取信息[15]。知識圖譜主要是對實體及其之間的相互關系進行描述,利用實體間的聯(lián)系用語義信息進行實體間關系的連接。因此目標特征信息知識圖譜是利用語義信息體現(xiàn)目標特征信息間的聯(lián)系[16]。在行為意圖推理過程中,將獲取到的數(shù)據(jù)在知識圖譜中查詢推理得到目標的特征信息?;诤C婺繕颂卣髦R圖譜的構建及應用具體過程如圖1所示。
圖1 海面目標特征知識圖譜的構建及應用Fig.1 Construction and application of knowledge graph of surface target feature
推理模塊是行為意圖識別的核心,負責相關的推理任務,主要利用可能性網(wǎng)絡構成推理模型,與知識圖譜中存儲的信息之間進行交互,將知識圖譜中的信息轉化為可能性推理中使用的信息,具有處理不確定性信息的能力。如“今天有可能下雨,實現(xiàn)某種行為意圖的可能性”都是對未來發(fā)生結果的一種不確定性估計。
可能性網(wǎng)絡以可能性理論為基礎,用于處理不確定性信息的問題,通過圖形形象化地表述出來。選取輸入變量(目標特征信息)、輸出變量(行為意圖)作為可能性網(wǎng)絡的節(jié)點,用有向邊來表示變量之間的關系??赡苄跃W(wǎng)絡節(jié)點個數(shù)由輸入變量和輸出變量的個數(shù)來決定。
可能性網(wǎng)絡使用可能性來表示不確定性。設X=(X1,…,Xn)為論域U=U1×…×Un的n維可能性變量,πx是與x相關聯(lián)的可能性分布,且πx(x1,…,xn)為πx的可能性分布函數(shù),即[17]
?(x1,…,xn)∈X1×…×Xn
πx(x1,…,xn)=p(X=x1,…,X=xn),
(1)
則稱πx(x1,…xn)為與X=(X1,…,Xn)相關聯(lián)的多元可能性分布函數(shù)。
在可能性推理過程中將會用到多元可能分布公式進行計算,公式為
(2)
式(2)中,πX|Y(x|y)為Y=y下X的條件可能性分布函數(shù)。
當輸入變量為多個變量時,有
(3)
在各輸入變量相互獨立的假設下,式(3)可具體化為
(4)
依據(jù)不同因素在行為意圖下的可能度,采用信息熵的思想對每一個因素計算其熵值,公式為
i=1,2,…,n,
(5)
式(6)中,Ej表示因素j的信息熵,I表示因素的總體個數(shù)。
最后得到各行為意圖的可能性為
(7)
行為意圖識別的過程一般為:依據(jù)目標的實時信息分析目標行為意圖目標特征信息,采用推理機制對目標實時行為意圖進行推理,最終獲得目標行為意圖識別結果。本文具體識別方法如圖2所示。
圖2 目標行為意圖識別流程圖Fig.2 Flowchart of target behavior intent recognition
目標的特征信息能夠顯示出目標真實的行為意圖,本文選取的目標特征信息與行為意圖有直接或間接關聯(lián)和影響。通過目標類型、目標地理位置、目標航行方向、目標航行速度、目標雷達工作狀態(tài)、目標行為等目標的特征核心要素,構建要素及要素間關系的語義表示結構,完成知識圖譜的構建。
根據(jù)相關領域的專家知識,不同目標類型對行為意圖影響的程度不同。大型艦艇具有較強的打擊能力;中型艦艇相比大型艦艇,攻擊能力較弱;小型艦艇相比大中型艦艇攻擊能力弱,但中型艦艇和小型艦艇偵察能力較強。因此將軍艦按照大型、中型和小型三個等級進行歸類,如圖3(a)所示為大型艦艇類型。
目標在航行過程中會開啟雷達,對于雷達工作狀態(tài)而言,雷達不同工作頻率范圍內(nèi)工作狀態(tài)不同,依據(jù)載頻、重頻和脈沖寬度的不同工作頻率內(nèi)對應工作狀態(tài)為鎖定、搜索和掃描三類[18]。
目標航行方向指目標對于我方位置的朝向,如果目標航向角度較小,說明目標是朝著我方前進,其相應威脅程度較高。因此按照目標在不同航向角下對應的威脅程度不同,將其劃分為大、中、小三個等級。
在分析行為意圖相關要素時,在海戰(zhàn)場環(huán)境中軍艦航行一般為直航、駐留和拐彎三種類型。
目標航行速度是一種表示行為意圖的特征,以高速機動的方式令敵意料不到的速度實施攻擊。根據(jù)海上不同類型目標在不同行為意圖中都能夠達到的最高速度及行駛的最低速度將其劃分高速和低速兩種類型。
將影響海面目標行為意圖的要素進行特征信息知識圖譜的構建,其構建的圖譜如圖3所示。
圖3 基于目標特征知識圖譜的構建Fig.3 Construction of knowledge graph based on target feature
利用可能性網(wǎng)絡模型解決行為意圖識別實際上是利用可能性推理來實現(xiàn),構建3層的可能性網(wǎng)絡模型,需要經(jīng)過以下步驟:
1) 首先確定節(jié)點內(nèi)容,節(jié)點對應著不同事件,將目標屬性作為影響行為意圖的原因,行為意圖的判定為結果,即確定行為意圖為進攻、偵察、撤離,選取的行為意圖具有代表性,威脅程度各不相同。因此最上層為結果行為意圖,下層目標行為意圖的表現(xiàn)因素,包括目標間的相對距離、目標行為、目標間的相對角度、目標攜帶武器裝備狀態(tài)和目標類型,目標行為考慮速度和島礁對其的影響,武器裝備狀態(tài)依據(jù)雷達狀態(tài)進行調(diào)整,如圖4所示。
圖4 可能性網(wǎng)絡結構圖Fig.4 Possible network structure diagram
2) 按照構建的可能性網(wǎng)絡的節(jié)點關系,通過分層模型,根據(jù)專家經(jīng)驗和先驗知識確定事件間的條件可能性分布表,如表1—表5所示,然后根據(jù)獲取的信息進行推理。
表1 目標行為與行為意圖的條件可能性分布表Tab.1 Conditional probability distribution of target behavior and behavioral intention
表2 目標行為航行速度、島礁的條件可能性分布表Tab.2 Conditional probability distribution table of target behavior sailing speed and reef
表3 目標行為意圖與目標距離、武器裝備的條件可能性分布表Tab.3 Conditional probability distribution table of target behavior intention, target distance and weapon equipment
表4 目標行為意圖與目標類型、航向角的條件可能性分布表Tab.4 Conditional possibility distribution table of target behavior intention, target type and heading angle
表5 武器與雷達工作狀態(tài)的條件可能性分布表Tab.5 Conditional probability distribution table of weapon and radar operating state
為驗證本文算法的有效性,將實驗結果與基于多屬性決策的方法及D-S證據(jù)理論進行了比較。假設我方發(fā)現(xiàn)目標在1 200 km處正向我方軍事基地方向勻速航行,我方要對敵方的海面目標進行行為意圖識別。
觀測證據(jù)1:T1時刻,有一艘巡邏艦航向角為85°,距離我方810 km,速度為13 kn時,行駛的前方有島礁,接收到雷達的重頻為15 kHz,脈沖寬度為9 μs,載頻為2 700 MHz。
觀測證據(jù)2:T2時刻,有一艘巡邏艦航向角為25°,距離我方180 km,速度為17 kn,行駛的前方有島礁,接收到雷達的重頻為15 kHz,脈沖寬度為9 μs,載頻為2 750 MHz。
觀測證據(jù)3:T3時刻,有一艘巡邏艦航向角為10°,距離我方10 km,速度為26 kn,已經(jīng)繞過島礁,接收到雷達的重頻為42 kHz,脈沖寬度為18 μs,載頻為2 850 MHz。
觀測證據(jù)4:T4時刻,有一艘巡邏艦航向角為90°,距離我方90 km,速度為25 kn,在它的前方有島礁,接收到雷達的重頻為35 kHz,脈沖寬度為18 μs,載頻為2 850 MHz。
觀測證據(jù)5:T5時刻有一艘巡邏艦航向角為170°,距離我方100 km,速度為26 kn,在它的前方有島礁,接收到雷達的重頻為15 kHz,脈沖寬度為8 μs,載頻為2 550 MHz。
依據(jù)戰(zhàn)場環(huán)境和目標屬性要素,目標速度、距離、航向角及雷達型號的工作頻率,基于知識圖譜中先驗知識將其轉化為不同狀態(tài)值如表6所示。
表6 不同狀態(tài)轉換表Tab.6 Conversion table of different states
利用式(5),得到各行為意圖在不同屬性下的信息熵值為E1=0.788 1,E2=0.818 0,E3=0.682 7,E4=0.900 7,E5=0.901 5。
再依據(jù)式(6)得各目標屬性權重為w1=0.233 1,w2=0.200 2,w3=0.349 1,w4=0.109 2,w5=0.108 4。
設節(jié)點行為意圖的可能度分別為
p(Y1)=p(Y2)=p(Y3)=0.5。
依據(jù)可能性網(wǎng)絡中的層次劃分及條件可能性分布表,通過條件可能性分布公式得知在雷達不同狀態(tài)(L0、L1、L2分別表示鎖定、搜索、掃描)條件下武器裝備(W0和W1分別表示開和關)的可能性。根據(jù)式(2)當雷達的工作狀態(tài)為掃描時,武器裝備狀態(tài)計算如下:
所以在T1時刻,雷達工作狀態(tài)為掃描時,武器裝備狀態(tài)為關。
p(W=W0|L=L0)=0.409 1,
p(W=W1|L=L0)=0.590 9,
p(W=W0|L=L1)=0.828 9,
p(W=W1|L=L1)=0.171 1。
類似地,可以得到在T2和T3時刻雷達工作狀態(tài)為跟蹤時,武器裝備狀態(tài)為關,在T2時刻雷達工作狀態(tài)為鎖定時,武器裝備狀態(tài)為開。
當速度為低速時,有島礁時,由于當行為(B1、B2、B3分別表示直航、駐留、拐彎)已知時,目標屬性速度(S0和S1分別表示低和高)和島礁(D0和D1分別表示有和無)相互獨立,根據(jù)式(4)得
p(B=B1|S=S0,D=D0)=0,
p(B=B2|S=S0,D=D0)=0.385 4,
p(B=B3|S=S0,D=D0)=0.331 8。
所以在T1當速度為低速,無島礁時,目標所屬行為可能性為直航狀態(tài)。
p(B=B1|S=S0,D=D1)=0.246 3,
p(B=B2|S=S0,D=D1)=0.133 2,
p(B=B3|S=S0,D=D1)=0.093 8。
同理,在T3時刻速度為高速時,有島礁時,目標所屬行為為拐彎狀態(tài)。在T2時刻速度為高速時,無島礁時,目標所屬行為為直航狀態(tài)。
引入信息熵,對目標屬性客觀分配不同權重,計算不同時刻各屬性組合下目標行為意圖。為了驗證本文方法的準確性和實時性,采用相同數(shù)據(jù)通過多屬性決策和D-S證據(jù)理論驗證,結果如表7和表8所示。連續(xù)輸入5個觀測時刻,可得到5個時刻目標行為意圖的可能性變化如圖5所示。
表7 不同方法行為意圖識別可能性大小Tab.7 Possibility of behavior intention identification by different methods
表8 不同方法行為意圖識別耗費的時間Tab.8 Time consumption of behavior intention identification by different methods
通過仿真實驗,本文方法和基于多屬性決策方法在5個時刻得出的結果一致,目標行為意圖在5個時刻分別為偵察、偵察、進攻、進攻、撤離,證明本文方法較為準確。而D-S證據(jù)理論在T1時刻的行為意圖識別結果有偏差,在其他時刻行為意圖識別與本文方法和多屬性決策方法得出的結果一致,可能是由于T1時刻的距離和航向角特征在偵察和撤離時區(qū)分度不大,導致識別有誤差。本文方法與多屬性決策方法相比,雖多屬性決策方法能夠準確識別行為意圖,但耗費時間較長,而本文方法不僅能準確識別行為意圖且耗時短。而D-S證據(jù)理論耗費的時間最短,但行為意圖識別準確性較差,本文方法具有準確性。因此本文方法在行為意圖識別方面較為準確,且具有實時性。
圖5 行為意圖識別結果圖Fig.5 Result diagram of behavior intention recognition
針對復雜海戰(zhàn)場中行為意圖準確識別的關鍵問題,本文構建了行為意圖要素的知識圖譜,借助信息熵權為目標不同屬性客觀分配權重,結合可能性網(wǎng)絡在推理方面的優(yōu)勢進行行為意圖識別。根據(jù)海戰(zhàn)場提供的幾個時刻的證據(jù)信息進行推理分析,能夠快速準確識別出敵方目標的行為意圖,該方法在一定程度上能夠克服專家經(jīng)驗帶來的主觀性,使得結果準確客觀。