• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于區(qū)間箱粒子多伯努利濾波器的傳感器控制策略

      2021-07-25 17:50:18陳輝鄧東明韓崇昭
      自動化學(xué)報 2021年6期
      關(guān)鍵詞:伯努利高斯濾波器

      陳輝 鄧東明 韓崇昭

      多目標(biāo)跟蹤中傳感器控制的核心是根據(jù)一定的優(yōu)化準(zhǔn)則,選擇傳感器的工作狀態(tài)或運行參數(shù),進(jìn)而控制量測過程以達(dá)到優(yōu)化多目標(biāo)跟蹤性能的目的.本質(zhì)上,它是一個最優(yōu)非線性控制問題.這類問題的解決通常是在部分可觀測馬爾科夫決策過程(Partially observable Markov decision process,POMDP)的理論框架下[1?4]進(jìn)行.POMDP 一般包括表征狀態(tài)信息的多目標(biāo)概率密度函數(shù),一個可允許的傳感器控制集合和評價函數(shù).然而,多目標(biāo)傳感器控制問題一般處理高度復(fù)雜的多目標(biāo)隨機系統(tǒng),其目標(biāo)的數(shù)量不僅隨時間變化,而且其量測也會受到漏檢和虛警的影響.這些復(fù)雜的不確定性因素都使得多目標(biāo)傳感器控制策略的求解變得非常困難.

      近些年來,基于隨機有限集(Random finite set,RFS)的多目標(biāo)跟蹤方法備受關(guān)注.該方法將多目標(biāo)狀態(tài)和多目標(biāo)量測建模為有限集值.同時通過引入有限集統(tǒng)計(Finite set statistics,FISST)[5?6]理論,將雜波環(huán)境下的多目標(biāo)狀態(tài)估計問題描述為貝葉斯濾波問題,從而避免了傳統(tǒng)跟蹤算法中較難處理的數(shù)據(jù)關(guān)聯(lián)問題.基于RFS 的多目標(biāo)跟蹤方法可在貝葉斯濾波框架下根據(jù)每個時刻接收的集值量測遞推更新多目標(biāo)狀態(tài)的概率密度函數(shù).為簡化在多目標(biāo)狀態(tài)空間上直接求解多目標(biāo)貝葉斯濾波器的復(fù)雜度,Mahler 和Vo 提出了一系列最優(yōu)近似多目標(biāo)濾波器[7?14],包括矩遞推濾波器和形式多樣的(有標(biāo)簽和無標(biāo)簽)多伯努利濾波器.這些方法目前已應(yīng)用在多目標(biāo)傳感器控制問題[15?19]中.值得注意的是,這些傳統(tǒng)的量測模型通常用量測噪聲來表征量測模型的不確定性,稱為統(tǒng)計不確定性.然而,在許多實際應(yīng)用中,這種標(biāo)準(zhǔn)的量測建模方式是不夠準(zhǔn)確的.例如,復(fù)雜的監(jiān)控系統(tǒng)通常會遭遇未知的同步偏差和系統(tǒng)延遲.由此產(chǎn)生的量測通常會受到典型未知分布和偏差的邊界誤差的影響.此時,這種帶有邊界誤差的量測可以用一個“區(qū)間量測”而不是點值量測來描述.區(qū)間量測表示一種不確定性,稱為集論不確定性[20?21].文獻(xiàn)[22] 結(jié)合序貫蒙特卡羅方法和區(qū)間分析技術(shù),在目標(biāo)跟蹤背景下首次提出箱粒子的概念,其核心思想是利用狀態(tài)空間內(nèi)的多維區(qū)間或者體積非零的矩形區(qū)域代替?zhèn)鹘y(tǒng)的點粒子,同時用誤差界限模型代替?zhèn)鹘y(tǒng)的誤差統(tǒng)計模型.作為一種“廣義粒子濾波”算法,箱粒子濾波仍然在貝葉斯濾波框架下進(jìn)行[23],并通過一組帶有權(quán)值的箱粒子來表征多目標(biāo)后驗概率密度函數(shù).由于箱粒子可以被解釋為一種由大量點粒子組成的集總形式,因此,用箱粒子濾波器進(jìn)行狀態(tài)估計時相當(dāng)于箱粒子所覆蓋的空間中的所有點粒子都參與估計,這就在很大程度上減少了所需粒子的數(shù)量,降低了算法的復(fù)雜度,節(jié)省了計算資源,提高了算法的運行速度.鑒于箱粒子濾波器估計效果較好,運行速度更快的優(yōu)點,近幾年,已有一些學(xué)者相繼提出了箱粒子概率假設(shè)密度濾波器[24],箱粒子(多)伯努利濾波器[25?28]等.

      箱粒子濾波器運行速度快的優(yōu)點使得其與傳感器管理的結(jié)合更具優(yōu)勢.遺憾的是,截至目前基于箱粒子濾波器的傳感器管理并沒有引起太多學(xué)者的關(guān)注,而且在我們現(xiàn)有的知識背景中,也并未查閱到有相關(guān)研究成果的發(fā)表.實際上,基于箱粒子濾波器進(jìn)行傳感器控制策略的求解,最大的難題在于如何用表征多目標(biāo)概率密度的箱粒子直接求解以信息散度為代表的評價函數(shù).這與利用點粒子求解評價函數(shù)大不相同.由于德爾塔粒子的正交特性和易于求解積分的特點,點粒子求解評價函數(shù)是方便和容易的.但箱粒子作為體積非零的矩形區(qū)域,其并沒有正交消除冗余項的便利,因此直接利用箱粒子求解評價函數(shù)是極其困難的.

      鑒于此,本文基于區(qū)間不確定性推理,利用箱粒子多伯努利濾波器提出了一種基于信息測度的傳感器控制策略.首先,利用箱粒子實現(xiàn)多伯努利濾波器,并通過一組帶有權(quán)值的箱粒子來表征多目標(biāo)后驗概率密度函數(shù).其次,利用箱粒子的高斯分布假設(shè),將多伯努利密度近似為高斯混合.顯然,這不但避免了利用箱粒子直接求取評價函數(shù)的難題,而且將其轉(zhuǎn)化為利用高斯混合求解評價函數(shù)的問題.隨后,針對高斯混合分布間的信息增益大都不存在閉式解的問題,本文基于高斯混合多伯努利濾波器,研究并推導(dǎo)了兩個高斯混合之間的柯西施瓦茲(Cauchy-Schwarz,CS)散度求解公式,并以此為基礎(chǔ)提出相應(yīng)的傳感器控制策略.為了對比說明所提方案的合理性和有效性,基于蒙特卡羅方法,本文也給出了通過混合均勻采樣近似箱粒子,進(jìn)而利用點粒子求解CS 散度的遞推公式,并給出了相應(yīng)的傳感器控制策略.最后,仿真實驗驗證了所提算法的有效性.

      1 問題描述

      1.1 多目標(biāo)隨機有限集建模

      對于一個單目標(biāo)系統(tǒng),目標(biāo)狀態(tài)和量測一般由不同維數(shù)的隨機矢量構(gòu)成.這些矢量在隨時間演變的過程中,其維數(shù)是恒定的.而多目標(biāo)系統(tǒng)顯然并非如此,其狀態(tài)和量測一般由各自包含多個狀態(tài)和量測的集合構(gòu)成,且維數(shù)隨時間而變化.假定k ?1時刻在目標(biāo)狀態(tài)空間中存在Nx(k ?1)個目標(biāo),狀態(tài)分別為,目標(biāo)狀態(tài)維數(shù)為nx.隨著時間的演化,這些目標(biāo)可能會消亡,或以新的狀態(tài)繼續(xù)存活,而新的目標(biāo)也有可能出現(xiàn).此時,k時刻Nx(k)個目標(biāo)的狀態(tài)可記為,且狀態(tài)順序和目標(biāo)順序無關(guān).同時,k時刻傳感器接收到Mz(k)個量測在量測空間中取值分別為,量測維數(shù)為nz.這些量測既可能來自于目標(biāo),也可能來自于雜波,并且量測順序和目標(biāo)順序無關(guān).那么,k時刻多目標(biāo)狀態(tài)和多目標(biāo)量測都分別構(gòu)成一個無序的RFS.其中,F(X)表示X所有有限子集的并集,F(Z)表示Z所有有限子集的并集.在區(qū)間不確定性分析中,量測一般表示為區(qū)間量測,此時多目標(biāo)量測為∈F(IZ),其中IZ為區(qū)間量測空間,F(IZ)表示IZ所有有限子集的并集.對于k ?1 時刻給定的多目標(biāo)狀態(tài)Xk?1,假設(shè)目標(biāo)xk?1∈Xk?1以存活概率pS,k(xk?1)繼續(xù)存活在k時刻.若不考慮衍生目標(biāo),則多目標(biāo)狀態(tài)集Xk可建模為

      其中,Sk|k?1(xk?1)是從k ?1 時刻到k時刻存活目標(biāo)狀態(tài)的RFS.Γk為k時刻新生目標(biāo)狀態(tài)的RFS.

      假設(shè)目標(biāo)狀態(tài)轉(zhuǎn)移方程為

      其中,fk是系統(tǒng)的狀態(tài)轉(zhuǎn)移矩陣,wwwk~N(0,Qk)為過程噪聲.

      此外,假設(shè)k時刻傳感器以檢測概率pD,k(xk)檢測到目標(biāo)xk∈Xk,且被檢測目標(biāo)以式(3)產(chǎn)生量測zk∈Zk.

      其中,vvvk為量測噪聲.在本文的實際仿真場景中,pvvv描述為零均值高斯白噪聲.k時刻的傳感器位置xs,k(ν)=[xs,k(ν),ys,k(ν)]T由傳感器控制方案ν所決定.考慮傳感器檢測不確定性,此時傳感器對應(yīng)目標(biāo)量測是一個RFS,可表示為Θk(xk).若考慮雜波的影響,則k時刻傳感器接收到的多目標(biāo)量測集Zk可建模為

      1.2 多目標(biāo)跟蹤中基于信息論的傳感器控制方法

      多目標(biāo)跟蹤中基于信息論的傳感器控制通常是在POMDP 框架下進(jìn)行的.實際上,POMDP 是馬爾科夫決策過程的推廣形式,其通常包括三個要素:表征多目標(biāo)狀態(tài)信息的概率密度函數(shù),一個可允許的傳感器控制集合和評價函數(shù).具體來講,FISST理論框架下的多目標(biāo)狀態(tài)信息可用k時刻多目標(biāo)后驗概率密度pk|k(Xk|k|Z1:k)來描述.用Uk表示k時刻可允許的傳感器控制集合,每一個傳感器控制ν∈Uk決定下一時刻傳感器的位置.對于每一個傳感器控制ν給定一個對應(yīng)的評價函數(shù)R(ν).則最優(yōu)控制序列uk可按以下準(zhǔn)則確定

      其中,pk|k?1(X|Z1:k?1)表示k時刻多目標(biāo)先驗概率密度,R(ν,p,Z)是與傳感器控制ν相關(guān)的評價函數(shù),由未來量測集Zk(ν)所決定.通常未來量測集可由式(3)和(4)獲得.但這種方法通常會給傳感器的求解帶來極大的計算負(fù)擔(dān).比較常用且實際的做法是在不考慮雜波、噪聲且檢測概率pD,k=1 的情況下,對每一個控制ν產(chǎn)生一個預(yù)測理想量測集(Predicted ideal measurement set,PIMS)[29?30],進(jìn)而用PIMS 代替實際量測來進(jìn)行傳感器控制的求解.

      此外,評價函數(shù)依據(jù)控制決策評價體系的不同可分為兩大類:基于任務(wù)驅(qū)動和基于信息驅(qū)動.基于任務(wù)驅(qū)動的傳感器控制策略旨在某個單一準(zhǔn)則下基于某個特殊任務(wù)進(jìn)行優(yōu)化.而基于信息驅(qū)動的傳感器控制策略由于能夠兼顧多任務(wù)指標(biāo)的競爭優(yōu)化而備受關(guān)注,其評價函數(shù)通常反映了多目標(biāo)概率密度間的信息增益DI(·,·),即R(ν)選擇為信息測度

      1.3 區(qū)間分析

      區(qū)間分析又稱區(qū)間數(shù)學(xué),是一門用區(qū)間變量代替點變量進(jìn)行運算的數(shù)學(xué)分支.通常,由于測量誤差的存在,濾波會產(chǎn)生不精確結(jié)果,而區(qū)間分析技術(shù)卻能精確給出誤差界限.因此利用區(qū)間分析技術(shù)進(jìn)行運算,其運算結(jié)果相對于傳統(tǒng)數(shù)學(xué)方法具有更高的置信度.

      區(qū)間通常定義在實數(shù)域R 內(nèi),是一個連續(xù)且封閉的實數(shù)子集,表示為.其中,表示區(qū)間下界,表示區(qū)間上界.一般地,一個d維區(qū)間或者箱體[x]∈Rd是d個一維區(qū)間的笛卡爾乘積,表示為[x]=[x1]×···×[xd].箱體的體積定義為|[x]|.

      值得注意的是,對于一個非線性系統(tǒng),箱體[x]在經(jīng)過非線性轉(zhuǎn)移函數(shù)f傳遞后一般會得到不規(guī)則的非箱體形狀.為了保證轉(zhuǎn)移后得到規(guī)則形狀,以便于分析計算,區(qū)間分析技術(shù)引入了包含函數(shù)(Inclusion functions)的概念,其目的是通過包含函數(shù)快速的找到包圍這種不規(guī)則形狀的最小箱體.若有函數(shù)f,其包含函數(shù)可定義為:已知函數(shù)f:Rn→Rm,如果?[x]∈IR,[f]([x])?f([x]),那么區(qū)間函數(shù)[f]:IRn→IRm是包含函數(shù).收縮算法是區(qū)間分析技術(shù)中的另一個重要概念,實現(xiàn)箱粒子收縮首先要解決的問題就是“約束滿足問題(Constraint satisfaction problems,CSP)”.它的實質(zhì)是在約束集H:(f(x)=0,x∈[x])中尋找一個滿足約束函數(shù)f(x)=f(x1,x2,···,xn)=0 的最小約束集S,即找到一個包含[x] 中所有x且滿足約束函數(shù)f的最小體積[x].本文采用一種被廣泛應(yīng)用的約束傳播方法(Constraints propagation,CP)[25],又稱為前向后向法.

      2 Box-CBMeMBer 濾波器

      2.1 SMC-CBMeMBer 的本質(zhì)

      CBMeMBer 作為MeMBer 的改進(jìn)版本,在概念上完全不同于PHD 和CPHD.它并沒有“壓縮”狀態(tài)信息,進(jìn)而用統(tǒng)計特性去近似多目標(biāo)密度,而是通過傳遞一組相互獨立且數(shù)量固定的伯努利參數(shù)來直接近似多目標(biāo)密度.顯然,CBMeMBer 的這種優(yōu)勢為多目標(biāo)跟蹤問題的遞推求解和執(zhí)行效率提供了極大的方便和提高.SMC-CBMeMBer 作為多伯努利濾波器的具體實現(xiàn)形式之一,本質(zhì)上是隨時間傳遞和更新一組德爾塔粒子和對應(yīng)的權(quán)值,并最終由這組帶有權(quán)值的德爾塔粒子的加權(quán)和近似表征多伯努利密度.

      2.2 點粒子到箱粒子

      在SMC-CBMeMBer 中,假設(shè)多目標(biāo)多伯努利密度可以表示為,其中r(i)表示第i個伯努利過程的存在概率,p(i)(x)表示該伯努利過程的概率分布,M為伯努利過程個數(shù).p(i)(x)一般有如下形式

      其中,L(i)表示該概率分布的粒子個數(shù),w(i,j)是其對應(yīng)的粒子權(quán)值,δx(i,j)(x)為狄拉克德爾塔函數(shù).當(dāng)L(i)→∞時,式(7)收斂于p(i)(x).一般地,粒子個數(shù)通常會對濾波器的性能產(chǎn)生極大影響.粒子數(shù)越多,濾波器整體性能越優(yōu)異,這顯而易見.但與此同時,大量的粒子參與濾波過程會極大地提高算法的計算復(fù)雜度.文獻(xiàn)[22] 結(jié)合粒子濾波技術(shù)和區(qū)間分析技術(shù),提出了一種利用箱粒子代替點粒子,進(jìn)而減少粒子個數(shù)的處理方法.此外,文獻(xiàn)[22?26] 將每個“箱體”刻畫成一個以箱粒子為支撐集的概率密度函數(shù),每個均勻函數(shù)都充分反映了對應(yīng)箱粒子的特性.因此,若箱粒子[x]作為支撐集,令U[x]表示該箱粒子的均勻概率密度函數(shù),則式(7)可以表示為

      事實上,Box-CBMeMBer 濾波器在形式上可以看成是用箱粒子代替點粒子的SMC-CBMeMBer濾波器,以下將給出具體遞推公式.

      2.3 Box-CBMeMBer 遞推

      1)預(yù)測步

      假設(shè)k ?1 時刻后驗多目標(biāo)多伯努利密度表示為,且每一個概率密度具有以下形式

      則k時刻預(yù)測多伯努利密度可表示為

      nB為新生箱粒子個數(shù).

      2)更新步

      結(jié)合存活目標(biāo)多伯努利密度和新生多伯努利密度,可令k時刻預(yù)測多伯努利密度πk|k?1為

      其中

      則后驗多伯努利密度πk|k可表示為

      3)重采樣和狀態(tài)估計

      和傳統(tǒng)的點粒子濾波器一樣,箱粒子濾波器仍然需要進(jìn)行重采樣.但具體的采樣方法卻顯著不同,箱粒子濾波器通常采用隨機子劃分法進(jìn)行重采樣,即可以將權(quán)重大的箱粒子用一組區(qū)間更小的箱粒子去替代.此外,目標(biāo)狀態(tài)是所對應(yīng)箱粒子質(zhì)心狀態(tài)的加權(quán)和.

      3 Box-CBMeMBer 中基于箱粒子高斯分布近似的傳感器控制方法

      盡管Box-CBMeMBer 也類似地通過一組帶有權(quán)值的箱粒子來逼近多伯努利密度.但相比于SMCCBMeMBer,基于Box-CBMeMBer 進(jìn)行傳感器求解顯然要困難許多.利用點粒子求解信息散度是極具優(yōu)勢的,這主要是因為狄拉克德爾塔函數(shù)(Dirac delta function)的正交特性和便于求解積分的特性.而對于箱粒子,這一體積非零的矩形區(qū)域,顯然并沒有正交消除冗余項的便利.因此,利用箱粒子直接求解信息測度是相當(dāng)困難的.

      文獻(xiàn)[25] 利用服從高斯分布的量測噪聲來構(gòu)造服從均勻分布的區(qū)間量測噪聲,即給出了一種由統(tǒng)計不確定性轉(zhuǎn)化為區(qū)間不確定性的有效方法.該方法給本文以啟發(fā)式的思考.特別是該方法用嚴(yán)格的等式給出了計算過程.由于不存在等式成立的限定條件,因此該等式合理的給出了一個高斯分布和區(qū)間箱體相互轉(zhuǎn)化的方法.換而言之,利用區(qū)間噪聲近似代替服從高斯分布的噪聲,這顯然是一個可逆過程.假設(shè)任一箱粒子[x],其質(zhì)心狀態(tài)mx=mid([x])=[x,x′,y,y′]T,其區(qū)間中心到邊界的長度.則可通過構(gòu)造高斯分布來逼近服從混合均勻分布的箱粒子,即

      式(33)的重要意義就在于代替式(19)來近似多伯努利密度,如此不但避免了直接利用箱粒子求解評價函數(shù)的難題,而且進(jìn)一步將基于Box-CBMeMBer 的傳感器控制求解問題轉(zhuǎn)化為利用高斯混合求解評價函數(shù)的問題.

      利用高斯混合求解評價函數(shù)即便在以點目標(biāo)濾波器為基礎(chǔ)的傳感器控制策略中也不多見,究其原因主要在于高斯混合分布間的信息散度大都不存在閉式解.盡管如此,相比于點粒子求解評價函數(shù),高斯混合求解仍有其無法比擬的執(zhí)行效率上的優(yōu)勢,這對于傳感器的實時管理具有很重要的價值和意義.有鑒于此,本文基于GM-CBMeMBer 濾波器,研究了兩個高斯混合之間的CS 散度的求取,并以此為基礎(chǔ)提出相應(yīng)的傳感器控制策略.

      假設(shè)p0和p1分別表示兩個概率密度函數(shù),則它們之間的CS 散度可表示為

      根據(jù)式(6)和(34),評價函數(shù)可以表示為

      GM-CBMeMBer 濾波器通過傳遞一組帶有權(quán)值的高斯分量來逼近多目標(biāo)密度.顯而易見,每個伯努利過程對應(yīng)的高斯分量對于整體的多目標(biāo)密度的逼近程度是不同的.出于簡化計算的考慮,本文提取存在概率r較大的伯努利過程(r >rm),從而利用這些伯努利過程去聯(lián)合近似空間多目標(biāo)概率密度,進(jìn)而研究相應(yīng)評價函數(shù)的求解.

      其次,對于每種控制方案ν∈Uk確定傳感器的位置xs,k(ν).隨后對每一個控制ν僅產(chǎn)生一個相應(yīng)的PIMS,可表示為

      由于不考慮雜波和噪聲,且pD,k=1,因此不存在繼承航跡(漏檢)的伯努利RFS,而對于每個PIMS 更新的伯努利RFS,其存在概率恒為1.因此,我們只需要結(jié)合GM-CBMeMBer 濾波算法,利用PIMS 對式(36)中的每個高斯分量參數(shù)進(jìn)行更新,則更新后的多目標(biāo)概率密度也具有高斯混合的形式,即

      其中,每個高斯分量對應(yīng)權(quán)值為

      k時刻目標(biāo)狀態(tài)估計、估計誤差協(xié)方差分別為

      其中,Hk表示k時刻非線性量測函數(shù)的雅克比矩陣.更新后的多目標(biāo)概率密度可近似表示為

      值得注意的是,為了計算式(35),本文需要借助兩個高斯分布之間的乘積公式,即

      根據(jù)式(36)和(48),式(35)第一項可推導(dǎo)如下

      其中

      式(35)中的第二項和第三項類似于第一項的推導(dǎo)方法,不再贅述.則最后評價函數(shù)可寫成如下形式

      其中

      為了直觀地說明本節(jié)所提方案的求解步驟,以下給出算法1 實現(xiàn)偽碼.

      4 Box-CBMeMBer 中基于箱粒子混合均勻采樣的傳感器控制方法

      事實上,除了上文中給出的通過構(gòu)造高斯分布近似箱粒子的方法以外,一個自然的選擇是基于蒙塔卡羅方法,利用采樣粒子集去代替箱粒子.如前所述,箱體是一個均勻分布函數(shù),因此本文利用混合均勻采樣的思想,對每個箱粒子進(jìn)行均勻采樣,用得到的點粒子來近似代替箱粒子,從而將傳感器策略求解問題轉(zhuǎn)化為更一般的利用點粒子求解評價函數(shù)的問題.以下將給出利用點粒子求解CS 散度的遞推公式.

      一般地,CS 散度除了有式(34)的表示方法外.Hoang 等[31]也推導(dǎo)了兩個泊松點過程之間的CS 散度,表達(dá)如下

      其中,π1和π2表示泊松點過程,u1和u2分別是其強度函數(shù),K表示目標(biāo)狀態(tài)的量測測度.此外,值得注意的是,對任一多目標(biāo)概率分布最有效的泊松近似是多目標(biāo)分布的一階矩.基于這種思想,文獻(xiàn)[19]結(jié)合式(55)給出了兩個多伯努利分布間的CS 散度.本文進(jìn)一步給出了傳感器控制中CS 散度的粒子求解方法.

      假設(shè)k時刻預(yù)測多目標(biāo)多伯努利密度表示為,且每一個概率密度被一組帶有權(quán)值的粒子近似

      則預(yù)測多伯努利密度的強度函數(shù)為

      此外,由于不考慮雜波和噪聲,且pD,k=1,因此不存在繼承航跡(漏檢)的伯努利RFS.此時利用PIMS 更新后的后驗多伯努利密度可表示為

      類似地,后驗多伯努利密度的強度函數(shù)為

      將式(57)和(59)代入式(55)可得

      利用德爾塔函數(shù)積分特性,則基于CS 散度的傳感器評價函數(shù)為

      為了直觀地說明本方案的求解步驟,以下給出算法2 實現(xiàn)偽碼.

      5 算法程序的偽碼

      為了說明基于Box-CBMeMBer 傳感器控制策略的整體算法流程,列出算法偽碼如下:

      6 仿真分析

      6.1 場景參數(shù)

      本文考慮距離方位跟蹤 (Range-bearing tracking,RBT).設(shè)置監(jiān)控區(qū)域為 [?π,π]×.場景中目標(biāo)軌跡均為近常速運動模型(Nearly constant velocity model,NCVM)[32],共計出現(xiàn)4 個目標(biāo),其狀態(tài)轉(zhuǎn)移密度為

      其中[25],

      其中,T=1 s 為采樣周期,總共采樣50 次.Qk為過程噪聲協(xié)方差,I2為2 階單位矩陣,?為克羅內(nèi)克積,?=0.05 為過程噪聲強度.本文借鑒文獻(xiàn)[25](如式(32))將服從高斯分布的Qk轉(zhuǎn)化為服從均勻分布的區(qū)間過程噪聲.

      在本文仿真中,設(shè)置檢測概率pD,k=0.98.雜波強度κk(z)=λcV u(z),其中每周期雜波平均數(shù)λc=5,V為監(jiān)控區(qū)域體積,u(z)表示監(jiān)控區(qū)域內(nèi)的雜波均勻分布.目標(biāo)存活概率pS,k=0.99.目標(biāo)新生過程是一個多伯努利RFS,其密度為,其中,Pγ=diag{[10,5,10,5]T}.新生箱粒子可通過采樣得到.假設(shè)軌跡刪減閾值為rT=10?3,伯努利過程存在概率提取閾值為rm=0.5,對應(yīng)高斯混合分量權(quán)值提取閾值為wm=0.2,箱粒子個數(shù)Lbox=40,每個箱體(箱粒子)均勻采樣粒子數(shù)Lsam=30.

      在RBT 中,量測函數(shù)hk(x)有如下形式

      其中,xk和yk表示k時刻目標(biāo)的位置,xs,k和ys,k表示k時刻傳感器的位置.量測噪聲vvv是零均值高斯白噪聲,其協(xié)方差為,其中σθ=0.25°,σr=2.5 m.此外,傳感器返回的是區(qū)間量測,其區(qū)間長度為Δ=[Δθ,Δr]T,其中Δθ=4°,Δr=70 m 分別是區(qū)間量測的角度長度和距離長度.值得注意的是,傳感器通常有偏差(系統(tǒng)誤差),此時hk(x)+vvvk并不在區(qū)間量測的中心位置.因此,結(jié)合RBT 量測方程,傳感器區(qū)間量測可構(gòu)造如下

      6.2 多目標(biāo)跟蹤性能評價

      本文采用OSPA(Optimal subpattern assignment)距離[33]來評估多目標(biāo)跟蹤的性能.其定義如下:設(shè)真實的和估計的多目標(biāo)狀態(tài)集合分別為X={x1,···,xm}和,若m≤n,則OSPA 距離為

      6.3 傳感器控制集合

      若k時刻傳感器實際位置為xs,k=[xs,k,ys,k]T,則下一時刻傳感器所有可允許控制的位置集合Uk+1可表示為

      其中Nθ=8,NR=2,則Uk+1總共包括17 種控制方案(包含傳感器處于靜默狀態(tài)).vs,c是傳感器自身的容許控制速度,設(shè)為20 m/s.

      6.4 實驗仿真

      本文設(shè)計的RBT 仿真場景中,共計出現(xiàn)四個目標(biāo),其運動參數(shù)如表1 所示.

      表1 多目標(biāo)參數(shù)Table 1 Parameters of multi-target

      首先基于Box-CBMeMBer 濾波器對RBT 場景中的多目標(biāo)進(jìn)行單次跟蹤仿真,如圖1 所示.顯然,即便在雜波較多的環(huán)境下,Box-CBMeMBer 仍能克服目標(biāo)新生和消亡帶來的不確定性,排除雜波干擾,最終得到良好的跟蹤估計效果.

      為了對比說明所提控制方案的合理性和有效性.本文在如圖1 所示同樣的場景條件下,構(gòu)造了四種控制方案并進(jìn)行了200 次蒙特卡羅(Monte Carlo,MC)實驗.其中,方案一是“箱粒子高斯分布近似”,即本文所提控制方案.該方案通過構(gòu)造高斯分布來近似表示箱粒子,進(jìn)而利用高斯混合加權(quán)和來逼近多目標(biāo)狀態(tài)空間分布,最終在求解本文所給出的高斯混合CS 散度的基礎(chǔ)上得到傳感器最優(yōu)控制方案.方案二是“箱粒子混合均勻采樣”即通過混合均勻采樣得到點粒子進(jìn)而代替箱粒子,利用加權(quán)粒子集近似表達(dá)多目標(biāo)空間分布,并求其強度函數(shù).該方案借鑒了傳統(tǒng)粒子濾波的思想,利用德爾塔粒子的正交特性和易于求解積分的特點,計算CS 散度并最終得到傳感器最優(yōu)控制方案.方案三是“隨機控制”,代表每個時刻的傳感器控制方案在可允許的控制集合中隨機選取.這種隨機選取看似簡單,但該方案往往會獲得比較良好的控制效果,因此經(jīng)常作為典型的控制方案被加以比較.方案四是“ENT”作為一種經(jīng)典的控制方案[34],其仍然利用箱粒子混合均勻采樣得到的點粒子來求取相應(yīng)的評價函數(shù),其目的旨在一套可允許的傳感器控制集合中決策出相應(yīng)的控制方案,以使得傳感器檢測到目標(biāo)勢的后驗期望值(PENT)達(dá)到最大.

      圖1 實際的目標(biāo)軌跡Fig.1 Actual target trajectories

      圖2 給出了四種控制方案在200 次MC 實驗中對多目標(biāo)狀態(tài)估計的OSPA 距離統(tǒng)計對比結(jié)果.可以看出,四種控制方案都有較好的跟蹤估計效果,這說明了四種控制方案的有效性.具體地,OSPA 距離分別在5 s,10 s,15 s 呈現(xiàn)出明顯的波動,這是因為隨著目標(biāo)的新生,多目標(biāo)狀態(tài)空間分布發(fā)生了較大變化,但隨著傳感器有目的的機動,相對于其他傳感器控制方案,Box-CBMeMBer 濾波器顯然很快應(yīng)對了這種變化,因此OSPA 距離在短暫波動后又回到理想的平穩(wěn)狀態(tài).這種快速收斂性說明在目標(biāo)勢攝動的情況下,本文所提算法具有相對較好的魯棒性.另外,多目標(biāo)狀態(tài)OSPA 在30 s 左右也發(fā)生了較為明顯的波動,究其原因主要在于在25 s 到32 s 之間,目標(biāo)3 和目標(biāo)4 在空間中非常接近(如圖1 所示),兩個目標(biāo)運動過程中的“匯集”影響了彼此的狀態(tài)估計.此外,比較四種方案可以看出,方案一顯然比其余三種方案的跟蹤估計效果要好.尤其是相比于方案二,方案一通過構(gòu)造高斯分布顯然更能表征箱粒子,更能逼近多目標(biāo)狀態(tài)空間分布,從而通過CS散度指導(dǎo)傳感器得到最優(yōu)的控制方案.而最優(yōu)的控制方案能夠提供更加精確的量測,進(jìn)而得到更好的估計效果.方案四跟蹤估計效果較差,這是因為該控制方案是以目標(biāo)勢后驗期望值(PENT)最大化為評價準(zhǔn)則,并沒有以多目標(biāo)跟蹤精度達(dá)到最優(yōu)作為評價指標(biāo).

      圖2 四種控制方案的OSPA 距離比較Fig.2 OSPA distances for four control strategies

      圖3 給出了方案一,即本文所提控制方案在單次實驗中對傳感器的最優(yōu)控制軌跡.可以看出,在整個控制過程中,傳感器會始終依據(jù)當(dāng)前的濾波結(jié)果不斷地對自身的位置進(jìn)行自適應(yīng)調(diào)節(jié),即基于最優(yōu)評價準(zhǔn)則求解出當(dāng)前時刻傳感器相對于所有目標(biāo)的最佳觀測位置.特別是隨著目標(biāo)的出生和消亡,傳感器總是會產(chǎn)生明顯的機動來適應(yīng)這種變化,進(jìn)而適應(yīng)總體多目標(biāo)概率密度函數(shù)的變化,以保證自身能在最優(yōu)的位置最大化地接收多目標(biāo)信息.

      圖3 所提方案的傳感器控制軌跡Fig.3 Sensor trajectory for the proposed strategy

      目標(biāo)勢估計如圖4 所示.顯然,四種控制方案的勢估計均值都很接近真實目標(biāo)數(shù).但通過統(tǒng)計目標(biāo)勢估計標(biāo)準(zhǔn)差(如圖5,表2),仍能發(fā)現(xiàn)方案一有相對較好的估計效果.尤其是相比于方案二,方案一由于更能真實地反映多目標(biāo)狀態(tài)空間分布,從而能夠為CS 散度的求解乃至于最優(yōu)傳感器位置的決策提供更加精確的多目標(biāo)信息,這使得方案一在估計效果上要優(yōu)于方案二.方案四對目標(biāo)勢的估計效果最好,這毫不奇怪,因為該方案是以目標(biāo)勢的后驗期望值最大化為評價準(zhǔn)則,只是針對目標(biāo)勢優(yōu)化的單一任務(wù)進(jìn)行決策,雖然在這種情況下,并不能使多目標(biāo)整體定位的性能得到提升,但卻可以提升濾波器對于多目標(biāo)的檢測性能.

      表2 四種控制方案勢估計誤差均值的絕對值Table 2 Absolute value of cardinality error for four control strategies

      圖4 四種控制方案的勢估計比較Fig.4 Cardinality estimation for four control strategies

      圖5 多目標(biāo)勢估計標(biāo)準(zhǔn)差Fig.5 Standard deviation of multi-target cardinality estimation

      此外,圖6 給出了四種控制方案在200 次MC實驗中的平均包含值.可以看出,四種方案下的平均包含值都非常接近1,這說明多目標(biāo)的估計狀態(tài)幾乎都被包含在相應(yīng)箱粒子內(nèi),這同時也說明了基于四種控制方案的Box-CBMeMBer 濾波器都具有良好的跟蹤估計性能.

      圖6 多目標(biāo)平均包含值Fig.6 Mean inclusion values of multi-target

      四種方案在同樣的場景參數(shù)下均運行50 步,其單步平均運行時間如表3 所示.可以看出,方案一在執(zhí)行效率上要優(yōu)于方案二,這種差別主要來自于傳感器評價函數(shù)的求解所花的時間.而利用高斯混合求解評價函數(shù),在執(zhí)行效率上具有天然的優(yōu)勢.從這點來看,顯然方案一,即本文所提控制方案更適合作為Box-CBMeMBer 的傳感器控制策略,因為兩者的結(jié)合更能保留Box-CBMeMBer 濾波器執(zhí)行速度快的優(yōu)點.方案三運行速度最快,這是因為其在傳感器求解上的時間花費幾近于無,時間成本主要來源于濾波過程.方案四運行較慢,這是因為在求解評價函數(shù)的過程中需要對所有預(yù)測箱粒子混合均勻采樣后的所有點粒子進(jìn)行更新.

      表3 四種控制方案單步平均運行時間對比Table 3 The average execution time for four control strategies

      為了驗證過程噪聲變化對所提算法性能的影響,本文結(jié)合式(64),通過改變過程噪聲強度?的大小,在同樣的場景條件下運行MC 仿真并統(tǒng)計OSPA 均值加以比較.如圖7 所示,隨著過程噪聲強度?的不斷變大(?=0.05,0.5,1,5,10),多目標(biāo)估計精度在不斷下降.但就總體趨勢而言,多目標(biāo)估計精度僅是有限度小范圍的變化,整體變化趨勢比較平穩(wěn).這說明了在參數(shù)攝動(過程噪聲)的情況下,本文所提傳感器控制方法具備良好的魯棒性.

      圖7 所提方案中不同過程噪聲強度對估計性能的影響Fig.7 Tracking performance of different process noise intensities for the proposed strategy

      以下討論量測噪聲的變化對本文算法的影響.本文仍然在相同的仿真場景下通過改變量測噪聲協(xié)方差系數(shù)來控制量測噪聲協(xié)方差的大小,進(jìn)而對比說明其對濾波器性能的影響.如圖8 所示,隨著?的不斷增大,多目標(biāo)狀態(tài)的OSPA 在不斷增大,估計精度在不斷降低,這反應(yīng)了量測不確定性程度對濾波器精度的影響.此外,盡管噪聲協(xié)方差的增大如預(yù)期的那樣引起了多目標(biāo)跟蹤估計效果的變差,但總體而言,多目標(biāo)整體濾波效果呈現(xiàn)了一個相對平穩(wěn)的過程,在參數(shù)攝動的范圍內(nèi),多目標(biāo)狀態(tài)估計OSPA 均值的最大變化(最大值和最小值)小于15 m,這說明了所提算法在不同的量測噪聲水平下有著較好的魯棒性.

      圖8 所提方案中不同量測噪聲系數(shù)對估計性能的影響Fig.8 Tracking performance of different measure noise factors for the proposed strategy

      事實上,箱粒子濾波同樣適用于解決非線性非高斯跟蹤問題.本文選擇具有普遍意義的閃爍噪聲[35?36]模擬非高斯噪聲,閃爍噪聲與高斯噪聲的主要差別在于尾部較長.一般地,閃爍噪聲可以分解為高斯噪聲和具有“厚尾”特性的噪聲之加權(quán)和[35?36],即f(g)=(1?ξ)fN(g)+ξfI(g),其中,f(g)為閃爍噪聲,fN和fI分別為高斯和大方差高斯分布,其協(xié)方差分別為ΣN和ΣI,ξ為閃爍噪聲概率,0<ξ <1.本文基于以上非高斯模型,設(shè)定,σθ=0.25°,σr=2.5 m,閃爍噪聲概率ξ=0.2,ΣI=K ·ΣN,并在K分別取值為5,10,20,50,100 的條件下進(jìn)行MC 仿真,進(jìn)而對多目標(biāo)狀態(tài)估計的OSPA 均值進(jìn)行統(tǒng)計分析.如圖9 所示,隨著K的不斷增大,厚尾程度越嚴(yán)重,相應(yīng)的多目標(biāo)狀態(tài)的估計精度不斷下降.但從OSPA所呈現(xiàn)出的總體趨勢來看,面對不同厚尾程度的非高斯噪聲,所提算法仍能以較好的精度跟蹤多目標(biāo),這也證明了本文所提方法對典型的非高斯噪聲具有較好的適應(yīng)性.

      圖9 所提方案中不同K 值對估計性能的影響Fig.9 Tracking performance of different K values for the proposed strategy

      在本文所提算法中,傳感器速度也會在一定程度上影響多目標(biāo)狀態(tài)的估計精度.本文結(jié)合實際的場景設(shè)置,分別在設(shè)定不同的傳感器速度的基礎(chǔ)上進(jìn)行MC 仿真,并統(tǒng)計多目標(biāo)跟蹤估計的OSPA 均值.如圖10 所示,可以看出,傳感器速度的不同設(shè)定會對多目標(biāo)跟蹤精度產(chǎn)生影響,而速度為20 m/s時,多目標(biāo)估計精度較好.總體而言,隨著傳感器速度的增大,多目標(biāo)估計精度似乎在一定范圍內(nèi)進(jìn)行有限的優(yōu)化.可以理解的是,傳感器的速度越大將會使傳感器越快到達(dá)“最佳”觀測區(qū)域.但也不是傳感器速度越快就越好,因為在離散時間動態(tài)系統(tǒng)中,傳感器每周期內(nèi)的控制距離過大,也可能會使傳感器“錯過”最優(yōu)觀測位置.

      圖10 所提方案中不同的傳感器速度對估計性能的影響Fig.10 Tracking performance of different sensor speeds for the proposed strategy

      為了詳細(xì)說明由于分量刪減所產(chǎn)生的不同的高斯混合分量個數(shù)對多目標(biāo)狀態(tài)估計精度和計算復(fù)雜度的影響,本文分別在rm和wm不同取值的情況下進(jìn)行MC 仿真,并在表4 中對多目標(biāo)狀態(tài)估計的OSPA 和對應(yīng)運行時間進(jìn)行對比分析.可以看出,隨著rm和wm的不斷減小,越多的高斯分量參與近似多目標(biāo)密度.多目標(biāo)密度的近似程度越高,所提出的多目標(biāo)概率密度間的信息增益的計算也就越精確,傳感器控制的效果也就越好,這最終反映在多目標(biāo)狀態(tài)的OSPA 上.很顯然,隨著閾值的不斷減小,多目標(biāo)的跟蹤效果也在不斷優(yōu)化.但這種優(yōu)化是有限度的,閾值小到一定程度并繼續(xù)減小,跟蹤精度并沒有得到顯著的提高,算法的計算花銷卻在顯著提高,這嚴(yán)重影響了多目標(biāo)跟蹤中傳感器管理的計算效率.因此,當(dāng)進(jìn)行傳感器控制時,需要控制高斯分量個數(shù)來平衡多目估計精度和計算復(fù)雜度.本文中設(shè)定rm=0.5,wm=0.2,此時被提取的高斯混合分量在事實上幾乎涵蓋了所有的多目標(biāo)信息,在保證估計精度的同時,也有著不錯的運行速率.

      表4 不同高斯分量個數(shù)的性能比較Table 4 Tracking performance comparison of different Gaussian components

      圖11(a)給出了RBT 在200 次MC 仿真中,方案一所遍歷的所有傳感器控制位置及與目標(biāo)的相對位置.可以看出,隨著多目標(biāo)的不斷變化(新生、消亡及狀態(tài)的變化),傳感器總會及時調(diào)整自身的位置以適應(yīng)目標(biāo)的不確定性所帶來的多目標(biāo)狀態(tài)空間分布的變化.如圖11(b)(傳感器軌跡云放大效果圖),盡管跟蹤場景中存在諸多隨機因素,導(dǎo)致每次MC仿真中的傳感器運動軌跡都不大可能一致,但該軌跡云仍能夠充分展示傳感器軌跡控制的總體趨勢.

      圖11 所提方案的傳感器控制軌跡Fig.11 Sensor control trajectories for the proposed strategy

      7 結(jié)論與展望

      本文的主要工作是基于區(qū)間不確定性推理,利用Box-CBMeMBer 濾波器提出了基于信息測度的傳感器控制策略.文中首先利用箱粒子實現(xiàn)Box-CBMeMBer 濾波器,并通過一組帶有權(quán)值的箱粒子來表征多目標(biāo)后驗概率密度函數(shù).其次,利用箱粒子的高斯分布假設(shè),將多伯努利密度近似為高斯混合.隨后,選擇CS 散度作為評價函數(shù),并詳細(xì)推導(dǎo)了兩個高斯混合之間的CS 散度的求解公式,以此為基礎(chǔ)提出相應(yīng)的傳感器控制策略.該方法也是本文提出的最為核心的基于區(qū)間不確定性推理的傳感器控制方案.此外,作為一種對比方案,本文利用蒙特卡羅方法,即通過對箱粒子進(jìn)行混合均勻采樣,進(jìn)而利用點粒子求解CS 散度提出了相應(yīng)的控制策略.后一種方案符合粒子濾波解決傳感器控制問題的傳統(tǒng)思路,但它的計算效率還是要明顯低于所提出的箱粒子高斯近似的傳感器控制策略.最后,通過幾種經(jīng)典方案的對比,驗證了所提算法的有效性.所提方法的意義在于,通過對傳感器控制策略合理近似求解,成功將Box-CBMeMBer 濾波器與現(xiàn)代傳感器管理系統(tǒng)相結(jié)合.這對于廣泛存在著區(qū)間不確定性的現(xiàn)實多目標(biāo)跟蹤系統(tǒng)的管理與控制具有重要的理論價值.顯然,所提方法可以進(jìn)一步推廣到基于現(xiàn)代高分辨率傳感器的多擴展目標(biāo)跟蹤問題中,未來對利用區(qū)間不確定性推理解決多傳感器管理也具有重要的參考價值.

      猜你喜歡
      伯努利高斯濾波器
      基于無擾濾波器和AED-ADT的無擾切換控制
      小高斯的大發(fā)現(xiàn)
      天才數(shù)學(xué)家——高斯
      從濾波器理解卷積
      電子制作(2019年11期)2019-07-04 00:34:38
      開關(guān)電源EMI濾波器的應(yīng)用方法探討
      電子制作(2018年16期)2018-09-26 03:26:50
      一種伯努利原理研究的實驗裝置
      淺談關(guān)于n重伯努利試驗概率計算問題
      基于TMS320C6678的SAR方位向預(yù)濾波器的并行實現(xiàn)
      有限域上高斯正規(guī)基的一個注記
      三個高階伯努利多項式與等冪和多項式的對稱等式
      诸城市| 二连浩特市| 德格县| 娄底市| 石渠县| 水富县| 静安区| 和龙市| 稷山县| 桃园县| 新营市| 宜都市| 日土县| 中牟县| 芒康县| 克拉玛依市| 海门市| 乌审旗| 巴彦淖尔市| 莒南县| 马尔康县| 高要市| 木里| 怀远县| 和林格尔县| 梅州市| 台东县| 河津市| 右玉县| 河北区| 乐业县| 汶上县| 淮阳县| 栾城县| 新邵县| 涞源县| 富顺县| 田东县| 宁武县| 开化县| 屏东市|