郭宇強,郭俊文,盧志剛*,李志偉,翟曉燕
(1.北方自動控制技術(shù)研究所,太原 030006;2.智能信息控制技術(shù)山西省重點實驗室,太原 030006)
在新時代背景下,邊境地區(qū)不但存在傳統(tǒng)安全問題(如領(lǐng)土、軍事沖突等),也不斷出現(xiàn)非傳統(tǒng)安全問題(如恐怖主義、非法移民、偷渡等),應(yīng)對傳統(tǒng)或非傳統(tǒng)威脅的作戰(zhàn)仍然是邊防保衛(wèi)的主要任務(wù)。在邊境巡邏警戒的過程中,如何準(zhǔn)確、快速地獲取未知目標(biāo)的位置、數(shù)量、特征等信息,掌握對方的態(tài)勢,有利于指揮端及時作出決策,對邊境保衛(wèi)任務(wù)的完成有關(guān)鍵作用。
目前在無人車使用光電設(shè)備偵察目標(biāo)區(qū)域的時候,按照下發(fā)的任務(wù),在偵察點進行搜索偵察,通常使用周掃、扇掃以及人工搜索等模式,需要耗費大量時間,并且現(xiàn)階段對于光電設(shè)備的研究主要針對伺服穩(wěn)定控制、目標(biāo)跟蹤精度等方面,對于邊境、高原山地、森林等復(fù)雜環(huán)境條件下對未知目標(biāo)的搜索捕獲還沒有特別有效的策略。文獻[1]在電子偵察領(lǐng)域,使用雷達傳感器進行目標(biāo)監(jiān)測,使用貝葉斯理論的調(diào)度方法,提高了目標(biāo)的捕獲概率以及減少了搜索時間。文獻[2]通過光學(xué)設(shè)備的視場、成像能力以及目標(biāo)的速度、大小,實現(xiàn)了單信息條件引導(dǎo)下的目標(biāo)搜索跟蹤功能,以目標(biāo)速度和方位作為單信息條件,通過航跡預(yù)測進行目標(biāo)跟蹤。文獻[3]使用最大威脅度的方法進行搜索目標(biāo)區(qū)域,針對目標(biāo)威脅度的大小,制定探測傳感器的偵察策略,可以減少偵察時間。文獻[4]采用重點與隨機結(jié)合的搜索方式,對權(quán)重因子占比大的區(qū)域采用重點搜索的方式,對其他非重點區(qū)域采用隨機搜索的方式,來進行避障策略的研究。
上述搜索方法大多需要確定的條件才能實現(xiàn)對目標(biāo)的搜索捕獲,而在邊境偵察應(yīng)用中,要達到很高的目標(biāo)識別捕獲率、獲取到明確的目標(biāo)信息是很困難的。本文針對邊境區(qū)域作戰(zhàn)中目標(biāo)分布隨機、無人車光電設(shè)備搜索偵察時間長、目標(biāo)捕獲效率不高等問題,基于無人車一定裝備數(shù)量的條件,以無人機協(xié)同搜索結(jié)果作為先驗信息,以目標(biāo)搜索捕獲效能(包括時空覆蓋率和滿足目標(biāo)信息準(zhǔn)確率)作為反饋條件,采用基于效能反饋機制的改進貝葉斯理論方法實現(xiàn)目標(biāo)搜索捕獲策略的優(yōu)化。
本文采用無人機與無人車協(xié)同來進行搜索偵察任務(wù),即無人機與無人車共同對目標(biāo)區(qū)域展開搜索,基于無人機采集的先驗?zāi)繕?biāo)信息,無人車對目標(biāo)區(qū)域展開有效偵察搜索和目標(biāo)捕獲,結(jié)合效能反饋機制,更新無人車目標(biāo)捕獲方案,直到目標(biāo)捕獲結(jié)果滿足效能要求或策略更新次數(shù)達到兩次,為無人車長時間跟蹤目標(biāo)、采用多種非致命手段處置目標(biāo),以及協(xié)助地面人員捕獲目標(biāo)提供有利條件。如圖1 為基于效能反饋機制的無人車目標(biāo)捕獲流程圖。
圖1 基于效能反饋機制的無人車目標(biāo)捕獲流程圖
基于效能反饋機制的無人車目標(biāo)捕獲流程分為如下5 個步驟:
1)指揮端進行空地協(xié)同搜索捕獲任務(wù)的部署與分配,將任務(wù)分別下發(fā)給無人車與無人機。
2)無人機接收到任務(wù),對目標(biāo)區(qū)域率先展開搜索偵察,獲得目標(biāo)信息后,將信息回傳到指揮端。
3)基于無人機給出的先驗?zāi)繕?biāo)信息,指揮端對信息進行分析處理,得到不同目標(biāo)在不同位置的概率分布,這些已知的概率便作為搜索區(qū)域t=t時刻的目標(biāo)存在概率值。無人車采用改進貝葉斯理論的方法,對t時刻的概率值進行計算,制定合適的搜索捕獲策略,合理分配目標(biāo)區(qū)域的搜索時間。
4)根據(jù)已分配好的搜索時間,無人車執(zhí)行搜索捕獲任務(wù),獲取目標(biāo)信息。
5)以時空覆蓋率和滿足目標(biāo)信息準(zhǔn)確率作為效能反饋條件,如果不滿足效能要求,則更新搜索捕獲策略,并且將當(dāng)前已有信息作為先驗信息,重新分配搜索時間,無人車再次執(zhí)行搜索捕獲任務(wù);如果捕獲結(jié)果滿足效能要求或更新次數(shù)達到兩次,則輸出目標(biāo)搜索捕獲結(jié)果。
以邊境區(qū)域偵察搜索和目標(biāo)捕獲為例,采用基于效能反饋機制的改進貝葉斯理論搜索捕獲策略,基于無人機先驗信息,獲取到t時刻邊境目標(biāo)區(qū)域內(nèi)存在的目標(biāo)信息,經(jīng)過貝葉斯網(wǎng)絡(luò)模型,得到t時刻區(qū)域的目標(biāo)存在概率分布,合理分配無人車的搜索時間。以時空覆蓋率和滿足目標(biāo)信息準(zhǔn)確率作為指標(biāo),反饋調(diào)節(jié)搜索捕獲策略。
本文采用先驗概率分布,根據(jù)無人機采集的目標(biāo)信息求解該區(qū)域目標(biāo)的存在概率。考慮到邊境作戰(zhàn)中,以坦克Ω、車輛Ω、人員Ω以及工事Ω4種為邊境常見敵方目標(biāo),用集合N 表示,設(shè)N={Ω,Ω,Ω,Ω},因此,樸素貝葉斯先驗概率公式:(1)其中,事件A 表示該目標(biāo)區(qū)域存在目標(biāo),事件B 表示該目標(biāo)區(qū)域發(fā)現(xiàn)4 種可能的目標(biāo)結(jié)果。
考慮到探測設(shè)備對不同的目標(biāo)有不同的識別率和虛警率,假設(shè)在某一偵察區(qū)域中,分別捕獲到目標(biāo)1 和目標(biāo)2,探測設(shè)備對兩個目標(biāo)的識別概率均為g。由于該探測設(shè)備對目標(biāo)1 的識別率高、虛警率低,而對目標(biāo)2 的識別率低,虛警率高,因此,該偵察區(qū)域目標(biāo)1 的存在概率ω和目標(biāo)2 的存在概率ω并不相同,識別率與目標(biāo)存在概率之間的關(guān)系滿足g<ω<ω。綜上,用識別概率來表示目標(biāo)的存在概率是不合適的,因此,本文在綜合考慮探測設(shè)備的識別率和虛警率的基礎(chǔ)上,對貝葉斯網(wǎng)絡(luò)模型進行改進。
用g表示探測設(shè)備對目標(biāo)的識別概率,p表示探測設(shè)備虛警概率,H表示是否存在目標(biāo),z表示探測設(shè)備是否識別到目標(biāo),
對于無人機偵察過的區(qū)域,無人機光電裝置未探測出目標(biāo),同時也不存在目標(biāo)的區(qū)間,該偵察區(qū)域t時刻目標(biāo)的存在概率值為
對于無人機已偵察過的目標(biāo)區(qū)域,基于給出的目標(biāo)信息,無人車的光電轉(zhuǎn)臺調(diào)轉(zhuǎn)到目標(biāo)點所在位置,對目標(biāo)點附近進行搜索,因此,無人車的光電裝置搜索角度,以及搜索高低角是影響搜索時長的因素之一。以目標(biāo)點為中心,設(shè)?為無人車對目標(biāo)所在區(qū)域進行搜索捕獲的搜索角度,β 為無人車對目標(biāo)所在區(qū)域進行搜索捕獲的高低角。此外,目標(biāo)的威脅度等級W也是影響偵察時長的因素之一,目標(biāo)的威脅度越大,則分配的偵察時間越長,越有可能將該目標(biāo)進行搜索捕獲。
基于目標(biāo)的最終發(fā)現(xiàn)概率、搜索角度、威脅度等因素,求得每塊區(qū)域搜索捕獲的最佳時長為:
通過計算得出各個目標(biāo)區(qū)域的偵察搜索時間,以任務(wù)的形式發(fā)送給無人車,無人車按此搜索捕獲策略對目標(biāo)區(qū)域進行搜索捕獲。無人車完成目標(biāo)捕獲任務(wù)后,以時空覆蓋率和滿足目標(biāo)信息準(zhǔn)確率作為效能反饋指標(biāo),評價制定的搜索捕獲策略是否有效,以及是否需要無人車進一步更新搜索捕獲策略。
基于無人機采集的先驗?zāi)繕?biāo)信息,無人車根據(jù)貝葉斯理論的方法,合理分配邊境目標(biāo)區(qū)域的偵察時間。由于無人車光電設(shè)備存在誤識別率,僅搜索捕獲一次目標(biāo)存在虛警率和誤差,因此,無人車光電設(shè)備完成一次偵察搜索后,根據(jù)偵察信息的反饋效果,如時空覆蓋率、目標(biāo)信息準(zhǔn)備率等,更新無人車的搜索捕獲策略,使下一次搜索捕獲取得更優(yōu)的效能。雖然搜索捕獲多次可以降低虛警率和誤差,但是次數(shù)過多會降低搜索效率,造成時間的冗余和浪費,因此,參考多位學(xué)者的研究以及相關(guān)工程化應(yīng)用后,本文對目標(biāo)區(qū)域的搜索捕獲策略更新不多于兩次。
2.2.1 時空覆蓋率
如圖2 所示為本文的目標(biāo)區(qū)域劃分示意圖,根據(jù)目標(biāo)區(qū)域的面積以及探測裝備的探測范圍,將目標(biāo)區(qū)域分為8 個探測區(qū)域,區(qū)域C 存在兩個目標(biāo),而區(qū)域F 不存在目標(biāo)。
圖2 大致目標(biāo)區(qū)域劃分示意圖
時空覆蓋率為探測區(qū)域面積與探測區(qū)域偵察時間的乘積之和與目標(biāo)區(qū)域面積與總偵察時間乘積的比值。因此,時空覆蓋率的定義如下:
其中,S為目標(biāo)區(qū)域的總面積,T為分配給無人車搜索目標(biāo)區(qū)域所需要的總時間,S為探測區(qū)域的面積,t為該探測區(qū)域分配好的偵察時間。
以時空覆蓋率作為無人車策略更新的效能反饋條件,其評價標(biāo)準(zhǔn)是時空覆蓋率的大小位于最小面積覆蓋率和最大面積覆蓋率組成的區(qū)間內(nèi)時,即認為本次搜索是有效的,否則認為本次搜索是無效的。對于實際邊境區(qū)域中,存在一定數(shù)量無人車或無人機都難以搜索覆蓋的區(qū)域,因此,無人車最大搜索捕獲目標(biāo)區(qū)域的面積為n 個探測區(qū)域的面積,總面積為目標(biāo)區(qū)域的面積,即最大面積覆蓋率為:
其中,有m 個區(qū)域均為感興趣區(qū)域。因此,時空覆蓋率σ 滿足η<σ<η,即認為時空覆蓋率效能反饋符合要求。
2.2.2 目標(biāo)信息準(zhǔn)確率
通過信息融合得到目標(biāo)信息準(zhǔn)確率的評價,更新無人車的搜索捕獲策略,可以大幅度提高偵察和融合效率。無人機與無人車將采集到的目標(biāo)信息進行融合,得到更為準(zhǔn)確的結(jié)果,可以提高目標(biāo)特征信息識別的準(zhǔn)確性,降低虛警率。其中,空地協(xié)同信息融合準(zhǔn)確性評價指標(biāo)有:目標(biāo)屬性偏差、目標(biāo)位置偏差以及目標(biāo)數(shù)量偏差等。
1)目標(biāo)屬性偏差。針對無人機與無人車對不同目標(biāo)的識別率不同,無人機識別到的目標(biāo)類型Ω與無人車識別到的目標(biāo)類型Ω存在不一致的情況,即Ω≠Ω;也存在無人機識別到的目標(biāo)類型Ω與無人車識別到的目標(biāo)類型Ω一致的情況,即Ω=Ω。采用模糊積分的決策級融合方法對無人車與無人機獲取的目標(biāo)屬性信息進行融合,最終得到融合結(jié)果Ω,融合后存在以下情形:
Ω=Ω無人車識別目標(biāo)類型與融合結(jié)果一致
Ω≠Ω無人車識別目標(biāo)類型與融合結(jié)果不一致
(16)
當(dāng)兩個結(jié)果一致時,即認定無人車偵察有效,不會進行策略更新以及進行二次分配偵察時間,將融合結(jié)果進行上報即可;而兩個結(jié)果不一致時,判定無人車偵察無效,基于現(xiàn)有的概率信息,根據(jù)式(11),更新搜索捕獲策略,重新計算無人車偵察目標(biāo)區(qū)域的時間,對目標(biāo)重新進行搜索捕獲。
2)目標(biāo)位置偏差。針對無人機與無人車獲取的目標(biāo)存在位置偏差的問題,首先考慮無人機與無人車獲取的目標(biāo)類型是否一致,如果一致,則存在兩種可能,一是該區(qū)域內(nèi)存在多個目標(biāo)、二是該目標(biāo)為運動目標(biāo);如果兩者識別的目標(biāo)類型不一致,則存在目標(biāo)區(qū)域內(nèi)有多個目標(biāo)出現(xiàn)的情況,根據(jù)已獲得的目標(biāo)信息,制定新的搜索捕獲策略,再次分配該區(qū)域偵察時間。圖3 為目標(biāo)位置偏差反饋流程圖。
圖3 目標(biāo)位置偏差反饋流程圖
3)目標(biāo)數(shù)量偏差。針對無人機與無人車搜索捕獲到的目標(biāo)數(shù)量不一致的問題,可能存在兩種情況,一是無人機與無人車均捕獲到目標(biāo),二是只有無人車或無人機捕獲到目標(biāo)。對于第1 種情況,根據(jù)現(xiàn)有概率信息作為先驗信息,制定合適的搜索策略,搜索捕獲后如果不存在數(shù)量偏差,則將二者信息進行融合上報。對于第2 種情況,如果是無人機發(fā)現(xiàn)目標(biāo),則無人車再次制定搜索策略進行偵察;如果是無人車發(fā)現(xiàn)目標(biāo),則無人機重新返回目標(biāo)區(qū)域進行偵察,偵察過后,如果不存在數(shù)量偏差,則將二者信息進行融合上報。
如果無人車或無人機再次搜索偵察過后,現(xiàn)有結(jié)果不變,仍存在數(shù)量偏差,則說明部分目標(biāo)被障礙物遮擋,或由于地形地勢因素導(dǎo)致某一方探測設(shè)備無法偵察,因此,將無人車與無人機的共同搜索結(jié)果作為最終結(jié)果即可。如圖4 所示為目標(biāo)數(shù)量偏差反饋流程圖。
圖4 目標(biāo)數(shù)量偏差反饋流程圖
首先基于上述分析設(shè)計,構(gòu)建了無人車基于無人機先驗信息,進行搜索捕獲敵方目標(biāo)的仿真環(huán)境,并進行了仿真實驗。
表1 為無人機光電設(shè)備識別結(jié)果及區(qū)域偵察時間結(jié)果表。無人機將獲取的信息上報給指揮中心。
表1 無人機識別結(jié)果及偵察時間統(tǒng)計
然后,根據(jù)無人機獲得的先驗信息,進行無人車搜索捕獲策略的制定和區(qū)域偵察時間的分配。無人車對區(qū)域內(nèi)的敵方目標(biāo)進行搜索捕獲,期間根據(jù)效能反饋機制實時更新搜索策略,自動再次搜索捕獲。獲取的目標(biāo)結(jié)果如表2 所示。
表2 無人車識別結(jié)果
最后,通過無人機與無人車對目標(biāo)區(qū)域的搜索捕獲,將二者信息進行決策級融合,最終得到準(zhǔn)確的目標(biāo)信息。圖5 為搜索捕獲目標(biāo)的概率分布和時間分布圖。圖5(a)為無人機偵察到目標(biāo)信息的概率分布圖。通過獲得各個區(qū)域內(nèi)目標(biāo)存在的概率值,合理分配偵察時間,無人車按照分配好的區(qū)域偵察時間,對目標(biāo)區(qū)域進行搜索捕獲識別,因此,圖5(b)為目標(biāo)區(qū)域偵察時間分布圖,圖5(c)為無人車搜索捕獲到目標(biāo)信息概率分布圖,圖5(d)為融合后目標(biāo)精確分布概率圖。
圖5 搜索捕獲目標(biāo)的概率分布和時間分布圖
根據(jù)無人機與無人車采集的目標(biāo)信息,結(jié)合效能反饋機制,更新搜索捕獲策略,實現(xiàn)了更優(yōu)的目標(biāo)捕獲效能。
3.2.1 搜索策略的時空覆蓋率
根據(jù)上述仿真結(jié)果,按照式(12),計算得出時空覆蓋率為74%,并根據(jù)式(14)、式(15)計算最大面積覆蓋率η和最小面積覆蓋率η,得出η=78.54%,η=68.72%,時空覆蓋率滿足η<σ=74%<η指標(biāo),則本次偵察搜索有效。
3.2.2 目標(biāo)捕獲信息準(zhǔn)確率
對于無人機與無人車獲取的偵察信息,存在目標(biāo)屬性偏差、目標(biāo)數(shù)量偏差等情況。如目標(biāo)3 存在目標(biāo)屬性偏差,無人機識別為人員的概率為82%,無人車識別為車輛的概率為83%,采用基于模糊積分的方法進行決策級融合,得到目標(biāo)3 的類型為車輛,與無人車識別結(jié)果一致,因此,不再更新無人車搜索捕獲策略。如目標(biāo)4,無人機未在目標(biāo)區(qū)域檢測出目標(biāo),而無人車檢測到目標(biāo)區(qū)域存在人員,在這種情況下,無人車不存在未識別到目標(biāo)的情況,因此,不再對無人車下達偵察此目標(biāo)區(qū)域的任務(wù)。
3.2.3 搜索時間比較
在目前工程化應(yīng)用中,無人車光電設(shè)備采用較多的方法有周視搜索方法,有時候也采用最大威脅度搜索方法。其中,周視搜索方法是以固定角速度對搜索區(qū)域進行固定時長偵察,最大威脅度搜索方法是按照每個區(qū)域的威脅度排序從大到小分配時間進行搜索?,F(xiàn)將周視搜索、最大威脅度搜索方法與本文采用的方法進行綜合比較。如圖6 為以上3種方法的搜索時間對比圖。
圖6 3 種方法的搜索時間對比圖
由圖6 可以看出,對于無人機未發(fā)現(xiàn)目標(biāo),但無人車可以捕獲到目標(biāo)的區(qū)域,使用最大威脅度搜索方法分配給無人車的偵察時間為0,這塊區(qū)域不會被無人車進行搜索偵察,因此,對于最后融合結(jié)果的準(zhǔn)確性會降低。而對于周視搜索,對于所有目標(biāo)區(qū)域,偵察時間相同,會造成時間的浪費。最后通過計算,周視搜索目標(biāo)區(qū)域所耗費的時間為600 s,采用最大威脅度搜索方法所需要的時間為550 s,本文采用的方法耗時為512 s,因此,本文所使用的方法有效縮短了無人車偵察目標(biāo)區(qū)域的搜索時間,并且相比于最大威脅度方法,提高了上報信息的準(zhǔn)確率。
3.2.4 搜索策略更新次數(shù)
由于光電轉(zhuǎn)臺識別存在一定的虛警率和誤識別率,對目標(biāo)區(qū)域只進行一次搜索存在較大誤差,而多次搜索會增加搜索時長,因此,參考多位學(xué)者的研究以及相關(guān)工程化應(yīng)用,綜合考慮基于無人機的搜索信息時,無人車搜索策略更新不超過2 次。本文采用的方法,為避免效能反饋陷入局部最優(yōu),對無人車某一區(qū)域的搜索捕獲策略更新不多于2 次,對存在目標(biāo)的區(qū)域最多搜索3 次,而對于非目標(biāo)存在的區(qū)域,可以做到偵察一次即可,因此,采用本文的方法大大提高了無人車搜索捕獲目標(biāo)的效率。
本文提出了一種基于效能反饋機制的改進貝葉斯理論的邊境區(qū)域無人車目標(biāo)捕獲策略。根據(jù)改進貝葉斯方法進行區(qū)域概率計算,并且得出每個區(qū)域的搜索時長,無人車進行目標(biāo)區(qū)域的搜索,以時空覆蓋率和滿足目標(biāo)信息準(zhǔn)確率作為反饋指標(biāo),動態(tài)更新搜索捕獲策略。通過仿真實驗,與基于最大威脅度方法偵察目標(biāo)區(qū)域的總耗時和一般周視搜索下的耗時進行了分析對比,證明了本文方法的可行性和優(yōu)越性。