基于知識圖譜的仿真想定智能生成方法

2023-04-24 11:26:50司光亞

指揮與控制學(xué)報 2023年1期

安靖司光亞周杰韓旭

1. 國防大學(xué)研究生院北京 100091 2.國防大學(xué)聯(lián)合勤務(wù)學(xué)院北京 100858 3.國防大學(xué)聯(lián)合作戰(zhàn)學(xué)院北京 100091

隨著戰(zhàn)爭復(fù)雜性的不斷加劇,模擬仿真系統(tǒng)已被廣泛應(yīng)用于作戰(zhàn)理論創(chuàng)新、作戰(zhàn)方案設(shè)計優(yōu)化、作戰(zhàn)能力評估,以及各類演習(xí)演訓(xùn)和裝備采辦活動中[1-2]. 作為初始化并驅(qū)動模擬仿真系統(tǒng)運行的基礎(chǔ)支撐,仿真想定的質(zhì)量直接影響系統(tǒng)運行效率和仿真結(jié)果的真實可信[3]. 由于仿真系統(tǒng)存在仿真層級（平臺級、聚合級）、仿真模式（人在回路、人不在回路）、仿真模型等差異,對仿真想定的需求、可驅(qū)動運行的想定腳本的要求等并不完全一致. 因此,仿真想定的開發(fā),普遍存在專業(yè)性強、定制要求高、遷移性差的問題. 針對這一系列問題,提出了一種基于知識圖譜的仿真想定智能生成方法. 該方法通過多源仿真模型的實體鏈接,構(gòu)建支撐仿真想定生成的知識圖譜,提升仿真系統(tǒng)模型的重用性[4]；研究適用于仿真模型匹配的實體對齊算法,提高數(shù)據(jù)匹配度[5]. 方法中待解決的核心關(guān)鍵技術(shù)包括：1）仿真想定的形式化描述. 與軍事想定不同,仿真想定用以驅(qū)動仿真系統(tǒng)運行,應(yīng)表示為結(jié)構(gòu)化、形式化的想定數(shù)據(jù),并確保其能被仿真系統(tǒng)識別、理解和使用；2）知識圖譜的構(gòu)建. 為支撐仿真想定的映射匹配,知識圖譜構(gòu)建過程中,要按照仿真想定的要素需求,搭建知識圖譜框架,并有效鏈接主流仿真系統(tǒng)模型實體；3）實體對齊算法的選擇. 在不同的仿真推演系統(tǒng)中,相同實體可能對應(yīng)不同仿真模型,或擁有不同模型屬性,需要選擇有效的實體對齊算法,提高仿真想定與知識圖譜的匹配速度和精度.

1 仿真想定的定義和形式化描述

仿真想定是在軍事想定的基礎(chǔ)上,面向模擬仿真系統(tǒng),根據(jù)仿真實驗的目的、邊界條件、實驗?zāi)Ｊ?、仿真系統(tǒng)需求等,對初始戰(zhàn)場態(tài)勢,交戰(zhàn)各方作戰(zhàn)力量、武器裝備、作戰(zhàn)行動、交戰(zhàn)規(guī)則、仿真規(guī)則等進行的設(shè)定. 作為仿真實驗的基礎(chǔ),仿真想定為仿真系統(tǒng)的初始化、驅(qū)動和運行提供所需的各類數(shù)據(jù)集合和腳本,包括仿真實體、任務(wù)模型、規(guī)則模型等結(jié)構(gòu)化、形式化的仿真想定數(shù)據(jù),記為多維歐氏空間（實體、任務(wù)、規(guī)則）,形式化描述如下：

2 知識圖譜的構(gòu)建

知識圖譜作為一種符號化的知識特征表達方式,能夠精準(zhǔn)表示實體及特征之間的相關(guān)性[6]. 其構(gòu)建流程是：在確定領(lǐng)域核心概念集的基礎(chǔ)上,通過本體的概念建模、關(guān)系建模、屬性建模,建立核心概念層次結(jié)構(gòu)和關(guān)系,完成知識圖譜框架構(gòu)建；基于該框架,對現(xiàn)有的主流仿真系統(tǒng)等模型庫進行實體鏈接,提升仿真模型重用性,完成知識特征的組合表達[7].

2.1 領(lǐng)域知識本體建模

作戰(zhàn)領(lǐng)域的頂層概念較多,包括作戰(zhàn)力量、武器裝備、作戰(zhàn)行動、戰(zhàn)場環(huán)境等,需要根據(jù)知識圖譜的構(gòu)建目標(biāo)選擇領(lǐng)域核心概念集. 本文知識圖譜的構(gòu)建目標(biāo)是支撐仿真想定數(shù)據(jù)映射匹配,因此,選定的核心概念集為想定的實體（包括作戰(zhàn)力量和武器裝備）、任務(wù)、規(guī)則. 根據(jù)《軍語》《軍事百科》、作戰(zhàn)條令條例等,明確核心概念的準(zhǔn)確定義,進行層次關(guān)系結(jié)構(gòu)確定（部分層次結(jié)構(gòu)關(guān)系描述如表1所示）,并對本體的底層屬性進行定義,完成本體的概念建模、關(guān)系建模、屬性建模,構(gòu)建知識圖譜的基本框架.

1）作戰(zhàn)力量本體知識結(jié)構(gòu)

對于作戰(zhàn)力量,本體知識結(jié)構(gòu)如圖1 所示,包括作戰(zhàn)力量、軍種、部隊類型、屬性4 層,本體間相互關(guān)系主要包括isA、hasEquipment、hasTask,含義如表1 所示.

表1 本體層次關(guān)系表（部分）Table 1 Ontology relationship table（partial）

圖1 作戰(zhàn)力量本體關(guān)系結(jié)構(gòu)圖Fig.1 Ontology relationship structure of combat force

2）武器裝備本體知識結(jié)構(gòu)

對于武器裝備,本體知識結(jié)構(gòu)可以根據(jù)實際需要進行逐層分解. 例如,對于本文待驗證實例“立體投送”. 武器裝備本體知識結(jié)構(gòu)可以分為5 層,本體間相互關(guān)系主要包括isA、isSynonyms、hasEquipment. 第1 層為武器裝備本體；第2 層包括作戰(zhàn)平臺、投送平臺、輔助平臺3 個本體（isA）；第3 層有31 個本體,包括登陸艇、氣墊船、掃雷艦、半潛船、殲擊機、運輸機、直升機、雷達站等概念本體；第4 層具有2 030 個本體,包括具體型號的武器裝備平臺（is－Synonyms）；第5 層屬性,即為上層本體的各類實際參數(shù),取自飛行器、艦船等各類知識庫. 如,飛行器類包括最大飛行速度、最小飛行速度、飛行高度、最大載荷、武器掛載（hasEquipment）、載人數(shù)等多維性能指標(biāo).

3）作戰(zhàn)任務(wù)本體知識結(jié)構(gòu)

對于作戰(zhàn)任務(wù),本體知識結(jié)構(gòu)分為任務(wù)、行動、行動屬性3 層,本體間相互關(guān)系主要包括hasPart、is－PartOF、isOperatedBy、hasTask、sameOperator. 第1層為任務(wù),是具有明確作戰(zhàn)意圖的軍事行動,是由若干個行動組成（hasPart）的本體概念. 根據(jù)任務(wù)的粒度,可表示為組合模型（記為CM）或原子模型（記為MM）,組合模型由原子模型組成（MM,isPartOF,CM）.第2 層為行動,是任務(wù)實施過程中的步驟,不可再細(xì)分的本體概念,是原子模型. 第3 層為行動屬性,根據(jù)仿真想定的形式化描述,主要包括：行動執(zhí)行實體（MM,isOperatedBy,OPA）、行動發(fā)起條件、起始時刻、起始位置、行動起始狀態(tài)、結(jié)束時刻、結(jié)束位置、行動結(jié)束狀態(tài)、行動區(qū)域、行動路線、行動目標(biāo)、行動持續(xù)時間、預(yù)期效果等. 為了更加完善表現(xiàn)本體關(guān)系,可進一步基于推理對本體關(guān)系（如hasTask、sameOperator 等）進行補充完善,推理表如表2 所示.

表2 作戰(zhàn)任務(wù)本體知識關(guān)系推理表Table 2 Ontology knowledge relationship reasoning table of combat tasks

2.2 多源仿真模型實體鏈接

現(xiàn)有的實體鏈接方法主要分為3 類：局部特征鏈接方法,全局特征鏈接方法,混合特征鏈接方法. 本文采用全局特征鏈接方法,對主流仿真系統(tǒng)開放模型庫等多源仿真模型數(shù)據(jù)進行整合.

全局特征鏈接方法基于強化學(xué)習(xí)全局特征抽取網(wǎng)絡(luò)和用于相似性計算的神經(jīng)網(wǎng)絡(luò). 由于篇幅受限,此處不再描述兩個網(wǎng)絡(luò)的訓(xùn)練過程,重點對網(wǎng)絡(luò)的框架及應(yīng)用進行闡述. 實體鏈接的基本思路如下：

1）通過基于強化學(xué)習(xí)的全局特征抽取網(wǎng)絡(luò)框架,從待鏈接實體/指征項（entity/mention）的全局信息（記為S={x1,x2,…,xn}）中抽取特征,框架描述如下：

狀態(tài)空間wi：由當(dāng)前特征和已選擇的特征組成,對實體/指征項的第i 個特征xi進行選擇時,將狀態(tài)表示為一個連續(xù)的特征向量F（wi）={xi,wi-1,s}. 其中,xi表示當(dāng)前特征的向量；wi-1表示所選特征集合的向量；s 表示待鏈接實體/指稱項的向量.

動作決策yi：yi∈{0,1},0 表示當(dāng)前特征對實體鏈接的精度沒有提升,1 表示有提升. 通過策略函數(shù)πΘ（wi,yi）確定yi.

獎勵函數(shù)r：是當(dāng)前所選特征是否能夠提高實體鏈接精度的評價,定義為r（wi|S）=Δs. 其中,Δs 表示實體關(guān)系混合特征與實體特征在分類器內(nèi)特征權(quán)重的差值.

策略函數(shù)πΘ（wi,yi）：

其中,F（wi）是特征向量,σ（·）是含有超參數(shù)Θ={W,b}的sigmoid 激活函數(shù).

2）獲得待鏈接實體/指稱項特征之后,將它們與候選實體特征在隱藏層中進行級聯(lián),輸入到雙層神經(jīng)網(wǎng)絡(luò),利用sigmoid 激活函數(shù),獲取實體/指稱項m和候選實體特征e 之間的相似性得分sim（m,e）.

該神經(jīng)網(wǎng)絡(luò)的損失函數(shù)采用交叉熵誤差：

其中,s 是計算得到的相似度得分sim（m,e）,t 表示實體是否為真.

3）通過加權(quán)計算得到各實體對＜待鏈接實體/指稱項,候選實體＞的排序得分. 計算公式為

其中,sim（m,e）表示相似度得分,p（e|m）表示先驗概率,α 和β 分別表示相似度和先驗概率的權(quán)重系數(shù),α+β=1.

4）根據(jù)r（m,e）對每一個候選實體進行排序,完成實體/指稱項的鏈接.

3 基于知識圖譜實體對齊的仿真想定匹配映射

3.1 實體對齊

考慮到名特征[8-10]和結(jié)構(gòu)特征[11-12]能夠分別從語義和結(jié)構(gòu)兩方面對實體進行刻畫,本文基于上章構(gòu)建知識圖譜,采用兩種特征相結(jié)合的實體對齊方法[13],將仿真想定中的實體分別匹配為已鏈接在知識圖譜中的相似度最高的仿真模型.

兩實體e1G1和e2G2之間的距離記為D（e1,e2）,計算公式：

其中,Ds（e1,e2）表示實體名特征向量；Dn（e1,e2）表示實體結(jié)構(gòu)特征向量；α 是調(diào)整兩種特征權(quán)重的超參數(shù). 顯然,該距離決定了兩個實體之間的匹配程度,值越小,則實體匹配度越高.

兩種特征向量的計算方法分別如下：

1）實體名特征向量Ds（e1,e2）

采用平均詞向量（averaged word embedding）表示[14-15].

詞向量集合記為Vi={viw1,viw2,…,viwn}. 其中,viwk={xik1,xik2,…,xikk}詞向量,表示詞映射到空間向量的維度. 構(gòu)造向量矩陣式（5）計算向量均值.

將計算得到的知識圖譜實體e1G1的中心詞向量VVi和想定實體e2G2特征詞集合的每個詞向量vtj,代入下述公式計算余弦相似度：

2）實體結(jié)構(gòu)特征Dn（e1,e2）

由圖卷積神經(jīng)網(wǎng)絡(luò)（graph convolutional network,GCN）捕捉實體鄰接結(jié)構(gòu)信息的生成[16].

將實體結(jié)構(gòu)特征詞轉(zhuǎn)換為底層向量s={x1,x2,…,xn},隨后在編碼層使用Bi-LSTM 提取文本序列特征,輸入特征向量xt與上一時刻狀態(tài)ht-1共同生成狀態(tài)ht,形成GCN 的輸入h. 計算公式如下：

其中,i、f、o 分別為輸入門、輸出門和遺忘門；b 為偏置項；W 為參數(shù)矩陣.和分別為前向LSTM 和反向LSTM 輸出結(jié)果；⊕表示向量級聯(lián),de為單向LTSM網(wǎng)絡(luò)維度.

基于圖結(jié)構(gòu)GCN 編碼層利用Bi-LSTM 生成分詞特征向量,將每個節(jié)點的鄰域內(nèi)的相關(guān)信息編碼為一個新的特征表示向量. hil-1表示輸入向量,hil表示在l 層節(jié)點i 輸出向量,圖卷積計算公式如下：

直接使用上式會出現(xiàn)節(jié)點級差過大現(xiàn)象,因此,通過對鄰接矩陣進行歸一化解決問題,改進式子為：

最后,利用LTSM 結(jié)構(gòu)對編碼層基于圖結(jié)構(gòu)的編碼輸出進行解碼,采用單向LSTM 將圖結(jié)構(gòu)的特征表示轉(zhuǎn)換成序列結(jié)構(gòu)的特征向量. 解碼過程如下：

解碼層輸入：從編碼層獲得實體結(jié)構(gòu)特征分詞xi的上下文表示向量ht,前一神經(jīng)元特征向量生成表示為Tt-1,前一神經(jīng)元值c2t-1,解碼層前一隱層向量h2t-1,最終輸出向量Tt表示為：

其中,i、f、o 分別為輸入門、遺忘門、輸出門；b 是偏執(zhí)項；W 為參數(shù)矩陣. Tt形成T,即實體結(jié)構(gòu)特征向量Dn（e1,e2）.

3.2 腳本生成

采用XML DOM 技術(shù),生成仿真想定運行腳本.具體流程包括：

1）依據(jù)仿真推演平臺的想定標(biāo)準(zhǔn)模板構(gòu)建XML 仿真腳本的對象節(jié)點.

3）重復(fù)1）、2）直至所有節(jié)點插入數(shù)據(jù),生成能夠驅(qū)動推演的仿真想定運行腳本.

4 仿真想定生成實例驗證和分析

以某作戰(zhàn)樣式“立體投送”行動為背景,生成仿真想定,驗證能否驅(qū)動仿真系統(tǒng)按照預(yù)定行動時序運行（行動時序設(shè)計略）.

1）對想定數(shù)據(jù)進行形式化描述,如表3 所示.

表3 仿真想定形式化描述Table 3 Formalization description of simulation scenarios

2）基于已構(gòu)建的知識圖譜,采用名稱特征與結(jié)構(gòu)特征相結(jié)合的實體對齊算法,對仿真想定進行實例化,映射為仿真系統(tǒng)可執(zhí)行的仿真想定運行腳本.部分匹配結(jié)果如表4 所示.

表4 仿真想定實例化匹配結(jié)果Table 4 Matching results of examples of simulation scenarios

3）將生成的仿真想定腳本導(dǎo)入仿真系統(tǒng),驅(qū)動“人不在環(huán)”的仿真推演,推演過程如表5 所示.

表5 仿真推演過程示例Table 5 Examples of simulation deduction process

通過仿真系統(tǒng)運行結(jié)果可以看出,本文所生成的仿真想定能夠按照預(yù)定的行動時序,驅(qū)動仿真系統(tǒng)推演.

5 結(jié)論

本文設(shè)計并實現(xiàn)了一種基于知識圖譜的仿真想定智能化生成方法. 基于強化學(xué)習(xí)全局特征抽取網(wǎng)絡(luò)和用于相似性計算的神經(jīng)網(wǎng)絡(luò),實現(xiàn)了主流仿真系統(tǒng)現(xiàn)有模型的實體鏈接,構(gòu)建了知識圖譜. 采用名稱特征和結(jié)構(gòu)特征相結(jié)合的實體對齊算法,實現(xiàn)仿真想定實體的精確匹配,生成仿真想定. 采用該方法生成“立體投送”行動推演仿真想定,并驅(qū)動仿真系統(tǒng)運行. 實驗結(jié)果顯示,仿真推演過程與預(yù)定行動構(gòu)想實際相符,方法有效.