俞棋睿 歐陽偉俊 秦 龍 矯媛媛 胡 越
1.國防科技大學(xué)系統(tǒng)工程學(xué)院 湖南 長沙 410073
陸軍分隊?wèi)?zhàn)術(shù)級作戰(zhàn)仿真系統(tǒng)中CGF 的戰(zhàn)場行為與地理環(huán)境和實體活動緊密相關(guān). 實現(xiàn)高效且精確的態(tài)勢感知和實例價值排序[1],在增強(qiáng)CGF 行為擬人性、提高仿真系統(tǒng)運(yùn)行效率等維度上都有重要意義. 空間認(rèn)知技術(shù)在環(huán)境知識的獲取、表示、管理等任務(wù)中應(yīng)用愈發(fā)廣泛[2],而實現(xiàn)對虛擬戰(zhàn)場環(huán)境感知過程的建模,能夠有效實現(xiàn)針對戰(zhàn)場態(tài)勢中目標(biāo)對象的感知、管理與查詢功能. 這對于提高CGF 模型空間感知行為的可信度和感知行為模型計算效率,具有現(xiàn)實意義.
在對軍事人員態(tài)勢感知過程方面,本文采用了價值排序的思想,價值排序指在虛擬環(huán)境中,感知主體結(jié)合多感官感知注意力機(jī)制和感知主體實例偏好等,對感知對象進(jìn)行價值評價及排序的過程. 考慮到CGF 動作行為的可編程性,重點(diǎn)考慮視覺和聽覺兩種感知方式,并充分研究各實例類感知習(xí)慣、能力等現(xiàn)有資料,提出各影響因子線性加權(quán)后的價值評價算法,從而生成CGF 態(tài)勢感知下感知目標(biāo)的有序輸出. 感知對象價值排序結(jié)果的準(zhǔn)確與否,對CGF 后續(xù)分析決策的合理性、虛擬戰(zhàn)場仿真推演的逼真性都存在一定影響. 如何合理量化影響因子的作用權(quán)重,是衡量注意力感知方法可信度的關(guān)鍵所在[3].
本文對如何提升感知模型計算效率進(jìn)行了研究.目前,制約感知效率提升的一大性能瓶頸是感知主體查詢及動態(tài)管理感知對象的時間復(fù)雜度. 其中,傳統(tǒng)的簡單遍歷法準(zhǔn)確率高但查詢效率較為低下;KD樹管理CGF 實體的方法,雖大大提高了查詢效率,但KD 樹的頻繁重構(gòu)同樣造成大量的時間浪費(fèi).
針對上述問題,本文基于空間分塊的實踐實現(xiàn)了對戰(zhàn)場空間的高效感知及動態(tài)管理. 結(jié)合多感官感知注意力機(jī)制(視、聽)及感知主體實例偏好,應(yīng)用價值排序建立了基于感知注意力機(jī)制的價值模型,并與傳統(tǒng)感知方法橫向?qū)Ρ? 結(jié)合空間分塊和價值模型搭建了分隊?wèi)?zhàn)術(shù)級態(tài)勢感知仿真平臺. 基于空間分塊的CGF 注意力感知方法,在不損失感知精度的前提下能夠有效提高感知效率,具有其可行性和有效性,可為戰(zhàn)場態(tài)勢感知實踐提供參考.
視覺模型使用錐形感知模型[4],以視點(diǎn)為圓錐頂點(diǎn),視線所在直線為圓錐中線. 感知夾角構(gòu)建視錐,如圖1 所示,視錐盡頭最外圍為視圈,中心處為心點(diǎn).若CGF 實體落在錐體內(nèi),則認(rèn)為其處于可感知范圍之中,納入感知對象行列[5].
圖1 視覺模型錐形感知示意圖Fig.1 Schematic diagram of cone perception of visual model
在二維平面上,如圖2 所示,采用視覺模型扇面感知. 以觀察點(diǎn)為圓心,最大觀察距離為半徑,視野跨度為扇形的角弧度,從而確定視覺觀察范圍[6].
圖2 視覺模型扇面感知示意圖Fig.2 Schematic diagram of sector perception of visual model
聽覺模型[7]使用球形感知模型,如圖3 所示,以聽覺中心為球心,設(shè)定聽覺半徑及聽覺閾值,根據(jù)各聲源分貝數(shù)與聽覺閾值的比對,聲源地理坐標(biāo)與感知球形區(qū)域的匹配確定CGF 實體的可感知性.
圖3 聽覺模型球形感知示意圖Fig.3 Schematic diagram of spherical perception of auditory model
在二維平面上,如圖4 所示,采用聽覺模型圓形感知. 以觀察點(diǎn)為圓心,最大聽覺距離為半徑,繪制聽覺感知圓,從而確定聽覺感知范圍.
圖4 聽覺模型圓形感知示意圖Fig.4 Schematic diagram of circular perception of auditory model
空間分塊,即按照固定長寬分割特定地理空間為若干等大地塊,如圖5 所示,sTile 即為地圖sMap中的等大地塊.
圖5 作戰(zhàn)區(qū)域空間分塊思想可視化呈現(xiàn)Fig.5 Visualization presentation of spatial block concept in combat geographical area
此外,于各地塊內(nèi)部維護(hù)一系列存儲某一特定類型及陣營實體的鏈表,即以vector 容器存儲某一地塊內(nèi)各類型-陣營對包含的全部CGF 實體集合;同時構(gòu)建CGF 實體與所屬地塊間的二維映射哈希表,以STL 的關(guān)聯(lián)容器map 建立CGF 實體ID 與所屬地塊間的鍵值對應(yīng)關(guān)系. 其中,鏈表實現(xiàn)了對單個地塊內(nèi)部感知對象的定位索引,為軸對齊包圍盒(axisaligned bounding box,AABB)涉及地塊的感知提供支撐;而哈希表則存儲了整個仿真區(qū)域內(nèi)所有感知對象的信息,以便根據(jù)感知對象ID 查找其相關(guān)信息. 鏈表和映射哈希表的引入,實現(xiàn)了地塊與CGF 實體的雙向鏈接,從不同層面滿足了用戶的快速查詢需求.
映射哈希表建立了CGF 實體與所屬地塊的索引關(guān)系,有利于快速定位實例所屬空間分塊,大大降低了對象查詢和管理的時間復(fù)雜度.
1)時間復(fù)雜度優(yōu)化.鏈接CGF 實體與空間地塊,在快速定位的同時實現(xiàn)了戰(zhàn)場感知范圍的塊幅壓縮,即克服了遍歷較大地理空間范圍造成的高時間復(fù)雜度.
在具體實施時,先根據(jù)觀察者初始位置及其類型屬性,繪制其視覺觀察扇面和聽覺感知圓,并拓展為各自的AABB. AABB 即為包含該對象,且各邊平行于坐標(biāo)軸的最小矩體,在二維平面上體現(xiàn)為最小矩形. 通過包圍盒在地理空間所處位置和覆蓋面積,確定各自觀察范圍的相關(guān)所屬空間地塊. 并通過CGF實體和空間地塊的映射關(guān)系,遍歷相關(guān)地塊全部實體,分別與視覺觀察扇面或聽覺感知圓相匹配. 空間分塊思想的應(yīng)用,大大降低了戰(zhàn)場空間遍歷的時間復(fù)雜度,優(yōu)化了全域遍歷的低成效、高耗時等弊端.
如圖6 所示,觀察扇面的AABB 覆蓋了從A-I的全部地塊,需遍歷9 個地塊中全部對象;而聽覺感知圓的AABB 僅覆蓋了塊A、塊B、塊D、塊E、塊G、塊H,只需遍歷上述6 個地塊中的對象[5].
圖6 觀察扇面和聽覺感知圓的AABBFig.6 AABB of the observing sector and auditory perception circle
2)對象感知方法. 確定感知主體Agent 的位置及觀察方向,進(jìn)一步確定其視覺感知扇面及聽覺感知圓. 在此基礎(chǔ)上分別繪制觀察扇面及感知圓的AABB,依此確定完全或部分重疊的相關(guān)地塊,即觀察遍歷的范圍. 進(jìn)而利用地塊與CGF 實體間的鏈表實現(xiàn)對相關(guān)CGF 實體的快速定位及其與感知范圍的匹配,以最終確定感知對象列表.
相較于傳統(tǒng)鏈表的遍歷查詢和KD 樹的高頻重構(gòu),空間分塊思想在對象管理和查詢方面,有其顯著的比較優(yōu)勢.
一方面,相比于傳統(tǒng)鏈表的順序遍歷法,空間分塊的對象感知方法實現(xiàn)了實體的定位初篩,將感知范圍限制在與視覺扇面及聽覺感知圓的AABB 完全重疊或部分重疊的空間分塊內(nèi),大大壓縮了遍歷范圍,避免了對不在感知范圍內(nèi)目標(biāo)的比對檢查.
另一方面,KD 樹的對象管理方式包含KD 樹的構(gòu)建與查詢. 感知對象在戰(zhàn)場空間內(nèi)頻繁遷移的過程中,其相對位置不斷變化,故KD 樹的頻繁重構(gòu)無法避免. 相比于KD 樹通過犧牲重構(gòu)時間成本換取較高查詢效率的弊端,空間分塊的對象感知方法充分利用了一定時間跨度內(nèi)CGF 實體基本停留于所屬初始空間分塊內(nèi)的特點(diǎn),大大降低了信息頻繁存取造成的時間損耗,且極少數(shù)感知對象跨地塊遷移對應(yīng)于空間分塊算法僅涉及相關(guān)鏈表及映射哈希表的刪改,其時間成本同樣遠(yuǎn)低于KD 樹重構(gòu).
計算機(jī)生成兵力綜合了包括聽覺、視覺在內(nèi)的多種感官,從虛擬戰(zhàn)場環(huán)境中進(jìn)行態(tài)勢感知. 感知注意力機(jī)制既包括由感知能力、習(xí)慣等要素導(dǎo)致的信息捕捉差異,又包含CGF 實體基于個體類型、屬性的個性化偏好. 構(gòu)建感知注意力機(jī)制的價值模型,即對以上兩種注意力機(jī)制的作用機(jī)理實行量化建模.從選擇與反饋兩個角度入手,通過感知信息的初篩,并將信息傳回智能體形成反饋,依據(jù)價值排序生成基于價值得分的感知對象優(yōu)先度降序?qū)嵗斜?
真實戰(zhàn)場環(huán)境中,感知主體感知戰(zhàn)場態(tài)勢會結(jié)合客觀目標(biāo)威脅度及主體實例偏好,對感知目標(biāo)價值進(jìn)行綜合考量,通過建立價值指標(biāo)體系,確定價值指標(biāo)參數(shù)及影響權(quán)重,求出價值得分并進(jìn)行降序排序.
模型建立層面,分別建立視覺注意力模型[8-9]和聽覺注意力模型.
構(gòu)建視覺注意力模型時,主要考慮指標(biāo)為目標(biāo)與感知主體間距離[10]、角度偏移量[11]及感知目標(biāo)移動性[3]三要素為價值評價排序依據(jù). 對聽覺注意力模型[12],主要考慮指標(biāo)為聲音分貝數(shù),如圖7 所示. 鑒于Agent 主體根據(jù)其不同的屬性特點(diǎn)對感知對象存在的特定實例偏好,本文進(jìn)一步將主體實例偏好納入價值指標(biāo)體系.
圖7 注意力機(jī)制價值指標(biāo)構(gòu)成示意圖Fig.7 Schematic diagram of composition of value indicators of attention mechanism
感知注意力的價值評價算法: 輸入: CGF 主體可感知目標(biāo)對象全集R;輸出: 價值優(yōu)先度排序后的感知對象降序?qū)嵗斜?
對于任意目標(biāo)i∈R: 1)以目標(biāo)與感知主體之間的距離從大到小進(jìn)行排序,得到目標(biāo)距離序號Rdis;2)以目標(biāo)與視覺中軸線的角度偏移量從大到小進(jìn)行排序,得到目標(biāo)偏移量序號Rangle;3)以目標(biāo)當(dāng)前移動速度從小到大進(jìn)行排序,得到目標(biāo)移動性序號Rmobility;4)以目標(biāo)分貝數(shù)從小到大進(jìn)行排序,得到目標(biāo)分貝數(shù)序號RDecibel;5)基于目標(biāo)類型進(jìn)行從低價值到高價值的偏好排序,得到偏好排名序號Rpref;6)將以上5 個參數(shù)分別賦權(quán)進(jìn)行線性加合[13-14],并降序排序,得到根據(jù)價值得分降序排序后的有序目標(biāo)集R′. 因各要素在價值評價體系中的重要度衡量存在實際偏好,故本實驗平臺暫采取直接相加并求取算術(shù)平均的方式定義價值得分.
分隊?wèi)?zhàn)術(shù)級作戰(zhàn)仿真系統(tǒng)旨在通過仿真推演還原真實戰(zhàn)斗場景實況[15]. 考慮到多兵種一體化聯(lián)合作戰(zhàn)已然成為未來戰(zhàn)爭的基本作戰(zhàn)形式,為充分還原虛擬戰(zhàn)場環(huán)境,優(yōu)化CGF態(tài)勢感知,搭建仿真戰(zhàn)場環(huán)境應(yīng)設(shè)置不同陣營及多種類型的CGF 模型(含坦克、裝甲車、單兵、集群等),并使之按照想定規(guī)則隨機(jī)散落于地理空間各處. 鑒于CGF 實體生命周期的局限性和真實人類的注意力有偏性,在定義CGF 對象時也應(yīng)引入注意力機(jī)制并定義生命周期屬性,以初篩無效感知,凸顯主要信息,實現(xiàn)多兵種及多陣營下的CGF 感知注意力控制,如圖8 所示.
圖8 分隊?wèi)?zhàn)術(shù)級態(tài)勢感知仿真平臺框架Fig.8 Simulation platform framework of element tactical-leveled situational awareness
本文聚焦于虛擬戰(zhàn)場環(huán)境下感知主體對地圖內(nèi)各實例對象的感知效應(yīng). 在考慮到真實戰(zhàn)場環(huán)境影響的基礎(chǔ)上,綜合視覺和聽覺兩個感知維度,和感知主體實例偏好的主觀維度,提出了基于感知注意力機(jī)制的價值模型,依此對主體態(tài)勢感知的注意力機(jī)制進(jìn)行仿真模擬. 同時,結(jié)合實際軍事分析需求,實現(xiàn)了二維空間下仿真推演的簡單可視化并進(jìn)一步將其封裝為動態(tài)鏈接庫,完成針對基于感知注意力機(jī)制的價值模型的驗證. 同時,搭建的戰(zhàn)場態(tài)勢感知仿真實驗平臺,也能更加方便用戶及時通過仿真結(jié)果進(jìn)行分析,在短時間內(nèi)迅速作出調(diào)整決策.
態(tài)勢感知仿真平臺實現(xiàn)的具體功能如下: 1)該平臺使用戶能夠在地圖場景內(nèi)或隨機(jī)或于指定位置放置感知對象[16];2)即時改變視覺觀察扇面朝向,按用戶需求調(diào)整感知方向(觀察扇面中心線方向)[17];3)實現(xiàn)感知對象在地圖范圍內(nèi)的隨機(jī)游走;4)實現(xiàn)了Agent 主體對CGF 實體的實時探測、價值排序及可視化輸出;5)即時按用戶需求改變Agent 主體所處坐標(biāo)位置;6)實現(xiàn)AABB 的可視化呈現(xiàn).
如圖9 所示,本文模擬的區(qū)域規(guī)格為100*100,單個地塊規(guī)格為10*10,故將整個區(qū)域劃分為了10*10 的方格區(qū). 設(shè)地塊數(shù)量為M,CGF 實體數(shù)量為N,故區(qū)域內(nèi)總的變量個數(shù)為地塊數(shù)量與CGF 實體數(shù)量的累加,即M+N. 在遍歷查詢、KD 樹查詢和分塊查詢3 種查詢方式下,感知對象篩選過濾計算任務(wù)的時間復(fù)雜度分別如下:遍歷查詢因涉及模擬區(qū)域內(nèi)全部CGF 實體,故算法時間復(fù)雜度為O(N);KD樹查詢算法在計算篩選過濾環(huán)節(jié)的時間復(fù)雜度時,并不考慮KD 樹構(gòu)建算法的時間耗費(fèi),因此,當(dāng)CGF實體對象均勻分布于地圖中時,KD 樹的近鄰搜索時間復(fù)雜度趨近于O(log2N),只有在CGF 實體呈現(xiàn)集中部署的情況下搜索時間復(fù)雜度才退化為O(N). 然而在本文研究所涵蓋的應(yīng)用場景中,由于CGF 實體位置的動態(tài)變化,將頻繁引發(fā)KD 樹的全局重構(gòu),這將帶來額外的時間開銷;而對于本文所給出的空間分塊算法,考慮最壞情況為智能體的感知區(qū)域覆蓋了全部地塊,即感知區(qū)域的AABB 覆蓋了所有的地塊,此時算法時間復(fù)雜度為O(M)+O(N),但實際應(yīng)用中,感知主體的感知區(qū)域面積遠(yuǎn)遠(yuǎn)小于整個地圖的面積,且作為感知對象的CGF 實體一般呈均勻分布的態(tài)勢,因此,其實際的搜索地塊數(shù)量M′<<M,其時間復(fù)雜度將得到大幅壓縮,且個別CGF 實體由于運(yùn)動發(fā)生的位置改變只需要相鄰地塊之間的鏈表刪除和插入操作,因此,更適合用于維護(hù)動態(tài)場景中的目標(biāo)信息,故實際時間復(fù)雜度應(yīng)遠(yuǎn)小于O(M)+O(N).
圖9 戰(zhàn)場態(tài)勢感知仿真實驗平臺可視化Fig.9 Visualization of battlefield situation awareness simulation experiment platform
本仿真實驗平臺采用windows10 操作系統(tǒng),CPU信息為Intel(R)Core(TM)i7-9750H CPU@2.60 GHz 2.59 GHz. 該仿真平臺中,在戰(zhàn)場空間內(nèi)初始投入200 個CGF 實體,令其按照想定規(guī)則隨機(jī)分布于地圖各分塊內(nèi). 青藍(lán)色扇形和紫色圓形分別為視覺觀察扇面和聽覺感知圓的可視化呈現(xiàn),玫紅色矩形則為其AABB 標(biāo)示.
地圖內(nèi)各CGF 實體依據(jù)其特定類型和陣營,由不同半徑及顏色的空心圓標(biāo)出,并被賦予特定行進(jìn)速度. 地圖右側(cè)欄內(nèi)由上至下分別顯示當(dāng)前時刻仿真時鐘、仿真速度、探測距離、觀測數(shù)量、查詢方式及排序依據(jù),CGF 實體列表內(nèi)容則為感知對象的有序輸出[18]. 隨仿真時鐘不斷推進(jìn),地圖內(nèi)各實例對象以特定行進(jìn)速度沿隨機(jī)方向不斷游走[3],隨著感知對象不斷變化,右側(cè)欄輸出也隨時間推進(jìn)實時更新.
圖10 所示為3 種感知方式耗時對比(仿真平臺運(yùn)行100 次),橫向比較空間分塊的對象感知方法、簡單遍歷法以及基于KD 樹的對象管理方法,可以發(fā)現(xiàn),空間分塊的對象感知方法在態(tài)勢感知的時間效率上具有極大優(yōu)勢. 相比之下,簡單遍歷法因篩選范圍存在較大冗余耗時更多,而KD 樹因頻繁重構(gòu)造成大量時間損耗. 觀察感知結(jié)果(如圖11)可知,三者在感知對象的數(shù)量和內(nèi)容上完全一致,僅僅只是價值排序的結(jié)果有所不同. 即空間分塊法本身不會造成感知精度上的明顯損失.
圖10 3 種感知方式耗時對比Fig.10 Time consuming comparison of three kinds of perception modes
圖11 3 種感知方式下結(jié)果的對比呈現(xiàn)Fig.11 Comparative presentation of results under three kinds of perception modes
在具體的仿真實驗實施中,簡單遍歷法及基于KD 樹的對象管理方法以感知主體與CGF 實體間的坐標(biāo)距離為依據(jù)降序排序;而空間分塊的對象感知方法則應(yīng)用本文所提出的基于感知注意力機(jī)制的價值模型,依據(jù)價值得分降序排序. 觀察排序結(jié)果可知,依據(jù)坐標(biāo)距離的排序方法,存在較近單兵實體的價值優(yōu)先度略高于稍遠(yuǎn)的裝甲目標(biāo)的情形,不符合主觀認(rèn)知. 而價值模型的構(gòu)成則充分考慮感知習(xí)慣及主觀認(rèn)知,更符合戰(zhàn)場實際.
綜上所述,基于空間分塊的CGF 注意力感知方法在不損失感知精度的前提下,能夠有效提高感知效率,優(yōu)化價值優(yōu)先度排序[19-21],具有一定可行性,可為戰(zhàn)場態(tài)勢感知實踐提供參考.
本文實現(xiàn)了視聽兩種感官和感知主體實例偏好共同作用下的虛擬戰(zhàn)場態(tài)勢感知以及針對感知對象的價值排序,進(jìn)一步基于離散事件調(diào)度框架,對虛擬戰(zhàn)場態(tài)勢感知仿真實驗平臺設(shè)計了完整的可視化動態(tài)鏈接庫. 基于當(dāng)下研究成果對下步工作作出如下展望: 1)拓寬感知維度;2)實現(xiàn)工程化;3)權(quán)重偏好訓(xùn)練;4)優(yōu)化系統(tǒng)構(gòu)建. 在后續(xù)工作中,需要進(jìn)一步拓寬感知維度,以進(jìn)一步貼近實戰(zhàn),提高仿真實驗之于現(xiàn)代化戰(zhàn)爭的借鑒意義.
致謝
感謝本文的共同第一作者歐陽偉俊先生對態(tài)勢感知仿真實驗平臺可視化實現(xiàn)、感知注意力價值評價算法設(shè)計等工作作出的重要貢獻(xiàn).