孫承鋼,張奕群,2
(1.北京電子工程總體研究所,北京 100854; 2. 北京仿真中心 航天系統(tǒng)仿真重點(diǎn)實(shí)驗(yàn)室,北京 100854)
探測(cè)跟蹤技術(shù)
基于軌跡預(yù)測(cè)的二階DPA擴(kuò)散抑制方法*
孫承鋼1,張奕群1,2
(1.北京電子工程總體研究所,北京 100854; 2. 北京仿真中心 航天系統(tǒng)仿真重點(diǎn)實(shí)驗(yàn)室,北京 100854)
二階動(dòng)態(tài)規(guī)劃算法(DPA)是一種有效的點(diǎn)目標(biāo)檢測(cè)算法,能夠在低信噪比條件下檢測(cè)目標(biāo),但也存在著評(píng)價(jià)函數(shù)擴(kuò)散等缺點(diǎn)。針對(duì)二階DPA的這一不足,提出了抑制二階DPA評(píng)價(jià)函數(shù)擴(kuò)散的方法。與其他抑制方法相比,提出的方法既有效地降低了噪聲對(duì)檢測(cè)過(guò)程的影響、抑制了評(píng)價(jià)函數(shù)擴(kuò)散的現(xiàn)象、提高了對(duì)目標(biāo)的檢測(cè)能力,又更適合于硬件實(shí)現(xiàn)。
目標(biāo)檢測(cè);Markov過(guò)程;動(dòng)態(tài)規(guī)劃;軌跡預(yù)測(cè);卡爾曼濾波;評(píng)價(jià)函數(shù)擴(kuò)散
點(diǎn)目標(biāo)檢測(cè)與跟蹤,特別是低信噪比條件下的點(diǎn)目標(biāo)檢測(cè)與跟蹤,一直是一個(gè)困難的問(wèn)題,這是由于點(diǎn)目標(biāo)沒(méi)有形狀和紋理特征,而且信噪比比較低時(shí),目標(biāo)的灰度與噪聲相仿,所以很難將目標(biāo)與噪聲區(qū)分開(kāi)來(lái),以致對(duì)點(diǎn)目標(biāo)的檢測(cè)和跟蹤十分困難。
從20世紀(jì)六七十年代起,人們開(kāi)始系統(tǒng)地研究點(diǎn)目標(biāo)跟蹤問(wèn)題,并提出全局最近鄰(GNN)算法[1]、概率數(shù)據(jù)關(guān)聯(lián)(PDA)算法[2]、聯(lián)合概率數(shù)據(jù)關(guān)聯(lián)(JPDA)算法[3-4]、多假設(shè)跟蹤(MHT)算法[5-7]、動(dòng)態(tài)規(guī)劃算法(DPA)[8-9]等多種算法,其中DPA是一種重要的先跟蹤后檢測(cè)算法,也是目前最有效的低信噪比跟蹤算法,它通過(guò)逆向分步尋優(yōu)實(shí)現(xiàn)在跟蹤過(guò)程中檢測(cè)目標(biāo),取得了檢測(cè)效果和計(jì)算量上的平衡。然而DPA也存在著一些不足[10],例如檢測(cè)過(guò)程容易受到噪聲干擾、由于評(píng)價(jià)函數(shù)擴(kuò)散導(dǎo)致的目標(biāo)覆蓋等。
由于DPA存在上述不足,有人提出了基于二階Markov過(guò)程的DPA[10](簡(jiǎn)稱二階DPA),該算法改善了對(duì)低信噪比運(yùn)動(dòng)目標(biāo)的檢測(cè)能力,縮短了所需的檢測(cè)幀數(shù),但是對(duì)評(píng)價(jià)函數(shù)擴(kuò)散的抑制并不理想,所以文獻(xiàn)[10]中專門提出了一種抑制評(píng)價(jià)函數(shù)的方法,但該方法不適合于硬件實(shí)現(xiàn)。為了解決上述問(wèn)題,本文提出了一種方法,該方法既能有效抑制評(píng)價(jià)函數(shù)的擴(kuò)散,又比較適合于硬件實(shí)現(xiàn)。
二階DPA是文獻(xiàn)[10]首次提出的,其基本內(nèi)容介紹如下。在基于二階Markov過(guò)程的DPA中采用的評(píng)價(jià)函數(shù)[11]為
s(θ(k),θ(k-1),…,θ(1)) =
(1)
由于式(1)的計(jì)算量很大,為簡(jiǎn)化尋優(yōu)過(guò)程,將式(1)中的分式部分整理為遞推形式:
P(θ(k)|θ(k-1),θ(k-2),…,θ(1))·
(2)
假設(shè)目標(biāo)滿足二階Markov模型,則式(2)等號(hào)右側(cè)的狀態(tài)轉(zhuǎn)移概率P(θ(k)|θ(k-1),θ(k-2),…,θ(1))可簡(jiǎn)化為
P(θ(k)|θ(k-1),θ(k-2),…,θ(1))=
P(θ(k)|θ(k-1),θ(k-2)),
k≥3.(3)
定義:
Θk
并令
lnP(θ(k)|θ(k-1),θ(k-2)),k=3,
lnP(θ(2)|θ(1)),
結(jié)合式(1)及(2),(3),得到遞推形式的評(píng)價(jià)函數(shù):
s(θ(k),θ(k-1)…,θ(1))=a(k)+s(θ(k-1),
…,θ(1)),k≥3,
s(θ(2))=a(2)+s(θ(1)).
(4)
在DPA中,評(píng)價(jià)函數(shù)最大的軌跡認(rèn)為是目標(biāo)的真實(shí)軌跡,因此
(5)
s(θ(2),θ(1))=a(2)+s(θ(1)).
(6)
根據(jù)位置的估計(jì)誤差,就可以確定搜索范圍。由于搜索范圍減小,二階DPA中評(píng)價(jià)函數(shù)擴(kuò)散范圍與傳統(tǒng)DPA相比要小。為了進(jìn)一步抑制評(píng)價(jià)函數(shù)擴(kuò)散,文獻(xiàn)[10]提出了一種抑制評(píng)價(jià)函數(shù)擴(kuò)散的方法。該方法將整幅圖像分成了2部分,一部分是包含目標(biāo)的關(guān)聯(lián)區(qū)域;另一部分則是未檢測(cè)出目標(biāo)的區(qū)域。通過(guò)將目標(biāo)軌跡的關(guān)聯(lián)始終限制在關(guān)聯(lián)區(qū)域內(nèi),減小關(guān)聯(lián)到目標(biāo)軌跡上的噪聲數(shù)量,從而達(dá)到抑制評(píng)價(jià)函數(shù)擴(kuò)散的目的。該方法在軟件仿真時(shí)有著良好的抑制效果,但在實(shí)際應(yīng)用中會(huì)遇到以下問(wèn)題:第一,在對(duì)圖像進(jìn)行處理時(shí),該方法首先對(duì)搜索區(qū)域內(nèi)的軌跡進(jìn)行關(guān)聯(lián)。由于搜索區(qū)域可能在圖像的任意位置,所以在實(shí)際處理前必須獲取到整幅圖像的數(shù)據(jù)信息,這會(huì)浪費(fèi)大量的時(shí)鐘周期。第二,目標(biāo)搜索區(qū)域的個(gè)數(shù)和大小不固定,導(dǎo)致在硬件設(shè)計(jì)時(shí)必須預(yù)先留出足夠的資源,而這極易導(dǎo)致硬件資源的浪費(fèi)。
由于上述缺點(diǎn)的存在,導(dǎo)致該算法的實(shí)時(shí)性較差、硬件資源的消耗也比較大。鑒于以上原因,提出了一種基于軌跡預(yù)測(cè)的擴(kuò)散抑制方法,該方法既能夠很好的抑制評(píng)價(jià)函數(shù)擴(kuò)散,又更適合于硬件實(shí)現(xiàn)。
文獻(xiàn)[10]的擴(kuò)散抑制方法的關(guān)鍵就是劃定目標(biāo)關(guān)聯(lián)區(qū)域,將能夠與目標(biāo)軌跡關(guān)聯(lián)的像元限制在該區(qū)域內(nèi),從而實(shí)現(xiàn)對(duì)擴(kuò)散的抑制。但這樣做就會(huì)產(chǎn)生上一節(jié)中所述的2個(gè)缺點(diǎn)。所以提出利用軌跡預(yù)測(cè)來(lái)抑制評(píng)價(jià)函數(shù)擴(kuò)散的方法,因?yàn)樵诖朔椒ㄖ胁辉傩枰獎(jiǎng)澏繕?biāo)關(guān)聯(lián)區(qū)域,從而避免了劃定目標(biāo)關(guān)聯(lián)區(qū)域所帶來(lái)的問(wèn)題。
2.1 原理分析
對(duì)于一幅分辨率為M×M的圖像,其像素點(diǎn)的測(cè)量值z(mì)(k)通常有如下定義:
式中:1≤i,j≤M,zij(k)為像素點(diǎn)(i,j)的觀測(cè)值并滿足如下關(guān)系[12]:
式中:μ>0。從上式可以看出,目標(biāo)所在觀測(cè)數(shù)據(jù)的均值一定比噪聲的均值大。因此,所有通過(guò)DPA檢測(cè)到的軌跡中,目標(biāo)軌跡的評(píng)價(jià)函數(shù)是最大的。
根據(jù)DPA中的尋優(yōu)關(guān)系,所有像素點(diǎn)都是關(guān)聯(lián)到其附近的評(píng)價(jià)函數(shù)最大的軌跡上,這就使得會(huì)有多個(gè)像素點(diǎn)關(guān)聯(lián)到目標(biāo)軌跡上,如圖1所示,導(dǎo)致目標(biāo)周圍像素點(diǎn)的評(píng)價(jià)函數(shù)增大,出現(xiàn)評(píng)價(jià)函數(shù)擴(kuò)散現(xiàn)象。因此如果能夠減少與目標(biāo)軌跡關(guān)聯(lián)的像素?cái)?shù)量,就能夠有效降低評(píng)價(jià)函數(shù)的擴(kuò)散程度。
圖1 評(píng)價(jià)函數(shù)擴(kuò)散的原因Fig.1 Reason of merit function scattering
2.2 基于軌跡預(yù)測(cè)的擴(kuò)散抑制方法
根據(jù)上述分析,在式(6)中引入權(quán)重ω:
s(θ(2),θ(1))=a(2)+s(θ(1)),
(7)
擴(kuò)散抑制方法的具體實(shí)現(xiàn),如圖2所示。可分為以下幾個(gè)步驟:
(1) 根據(jù)二階DPA確定搜索范圍Rs;
(2) 根據(jù)式(6)計(jì)算評(píng)價(jià)函數(shù);
從實(shí)現(xiàn)步驟中可以看出,擴(kuò)散抑制方法不需要?jiǎng)澏P(guān)聯(lián)區(qū)域,可以對(duì)獲取到的像元信息進(jìn)行實(shí)時(shí)處理,從而節(jié)約大量的時(shí)鐘周期。同時(shí)擴(kuò)散抑制方法的算法結(jié)構(gòu)固定,其實(shí)現(xiàn)過(guò)程中其所需的硬件資源固定,不會(huì)出現(xiàn)硬件資源的浪費(fèi)。由此可以看出,此方法很好的克服了文獻(xiàn)[10]中方法所存在的2個(gè)缺點(diǎn)。
2.3 狀態(tài)估計(jì)
在估計(jì)目標(biāo)狀態(tài)前,先要建立目標(biāo)運(yùn)動(dòng)模型。設(shè)在第k幀時(shí),目標(biāo)的運(yùn)動(dòng)狀態(tài)為
假設(shè)目標(biāo)不機(jī)動(dòng),即目標(biāo)的運(yùn)動(dòng)軌跡基本上是一條直線,其運(yùn)動(dòng)狀態(tài)模型[13-14]為
θ(k+1)=Fkθ(k)+Gkv(k),
式中:
式中:Tk+1是第k+1幀圖像與第k幀圖像間的時(shí)間間隔;v(k)為0均值的白噪聲;狀態(tài)誤差滿足:
第k幀圖像的觀測(cè)模型為
Rk
為了方便,假設(shè)圖像中的噪聲為0均值的白噪聲。
圖2 擴(kuò)散抑制方法的實(shí)現(xiàn)過(guò)程Fig.2 Realization of method for restraining merit function scattering
下面通過(guò)仿真來(lái)說(shuō)明擴(kuò)散抑制方法對(duì)評(píng)價(jià)函數(shù)擴(kuò)散的抑制效果。實(shí)驗(yàn)的詳細(xì)參數(shù)如表1所示。
表1 實(shí)驗(yàn)參數(shù)Table 1 Parameter of test
其中,信噪比定義為目標(biāo)灰度和噪聲方差之比。
通過(guò)比較圖3和圖4可以看出,文中提出的擴(kuò)散抑制方法能夠有效地抑制評(píng)價(jià)函數(shù)擴(kuò)散,其抑制效果與文獻(xiàn)[10]中方法的抑制效果相差不多。在圖4中,目標(biāo)位于評(píng)價(jià)函數(shù)最大的2個(gè)像素點(diǎn)處,評(píng)價(jià)函數(shù)的擴(kuò)散已經(jīng)被抑制掉,只要給定合適的閾值,就可以直接將目標(biāo)確定出來(lái)。
圖3 二階DPA的評(píng)價(jià)函數(shù)Fig.3 Merit function of second-order DPA
圖4 擴(kuò)散抑制方法的評(píng)價(jià)函數(shù)Fig.4 Merit function of method for restraining merit function scattering
本文提出了一種抑制二階DPA評(píng)價(jià)函數(shù)擴(kuò)散的方法。通過(guò)引入目標(biāo)運(yùn)動(dòng)狀態(tài),減小搜索范圍大小,進(jìn)而抑制評(píng)價(jià)函數(shù)的擴(kuò)散。仿真結(jié)果表明,該方法能夠有效的抑制評(píng)價(jià)函數(shù)擴(kuò)散。從表面上看由于引入卡爾曼軌跡預(yù)測(cè)使得算法的計(jì)算變得極為復(fù)雜,實(shí)際上由于目標(biāo)運(yùn)動(dòng)模型中的矩陣都是稀疏矩陣,使得卡爾曼遞推計(jì)算過(guò)程變得非常簡(jiǎn)單,很容易硬件實(shí)現(xiàn)。但是因?yàn)槟繕?biāo)在搜索范圍R′內(nèi)的概率小于1,導(dǎo)致算法的檢測(cè)概率有一定程度的減小,如何克服這一缺點(diǎn)還有待于進(jìn)一步研究。
[1] BLACKMAN S, POPOLI R. Design and Analysis of Modern Tracking Systems[M].Country Norwood,United States: Artech House, 1999.
[2] BAR-SHALOM Y, KIRUBARAJAN T, LIN X. Probabilistic Data Association Techniques for Target Tracking with Application to Sonar, Radar and EO Sensors[J]. IEEE Aerospace and Electronic Systems Magazine, 2005, 20(8): 37-56.
[3] FORTMANN T E, THOMAS E, BAR-SHALOM Y, et al. Sonar Tracking of Multiple Targets Using Joint Probabilistic Data Association[J]. IEEE Journal of Oceanic Engineering, 1983, 8(3): 173-184.
[4] BAR-SHALOM Y, FORTMANN E T. Tracking and Data Association[M].New York:Academic Press, 1988
[5] REID D B. An Algorithm for Tracking Multiple Targets[J]. IEEE Trans. on Automatic Control,1979, 24(6):843-854.
[6] REID D B.A Multiple Hypothesis Filter for Tracking Multiple Targets in a Cluttered Environment[R]. Lockheed Missiles and Space Company Report, 1977.
[7] BLACKMAN S S. Multiple Hypothesis Tracking for Multiple Target Tracking[J]. IEEE Aerospace and Electronic Systems Magazine, 2004, 19(1): 5-18.
[8] BARNIV Y. Dynamic Programming Solution for Detecting Dim Moving Targets[J]. IEEE Trans. on Aerospace and Electronic Systems,1985, 21(1): 144-156.
[9] BARNIV Y,KELLA O. Dynamic Programming Solution for Detecting Dim Moving Targets Part II: Analysis[J]. IEEE Trans. on Aerospace and Electronic Systems, 1987,23(6):776-788.
[10] 王碩. 基于二階Markov過(guò)程的動(dòng)態(tài)規(guī)劃法及其在點(diǎn)目標(biāo)檢測(cè)中的應(yīng)用[D].北京:中國(guó)航天科工第二研究院,2015. WANG Shuo. Dynamic Programming Algorithm Based on Second-Order Markov Process and Its Application on Point Target[D].Beijing: The Second Research Academy of CASIC,2015.
[11] ARNOLD J, SHAW S, PASTERNACK H. Efficient Target Tracking Using Dynamic Programming[J]. IEEE Trans. on Aerospace and Electronic Systems,1993, 29(1): 44-56.
[12] TONISSEN S M, EVANS R J. Performance of Dynamic Programming Techniques for Track-Before-Detect[J]. IEEE Trans. on Aerospace and Electronic Systems,1996, 32(4): 1440-1451.
[13] PULFORD G W, LA SCALA B F, Over-the-Horizon Radar Tracking Using the Viterbi Algorithm-Second Report to High Frequency Radar Division[R]. University of Melbourne, Technical Report CSSIP 16/95, Aug. 1995.http://web.ukonline.co.uk/gpulford/Pdf doc/vda-rep2.pdf.
[14] PULFORD G W, LA SCALA B F. Over-the-Horizon Radar Tracking Using the Viterbi Algorithm-Third Report to High Frequency Radar Division[R]. University of Melbourne, Technical Report CSSIP 27/95, Dec. 1995. http://web.ukonline.co.uk/gpulford/Pdf doc/vda-rep3.pdf.
[15] PULFORD G W, LA SCALA B F. Multihypothesis Viterbi Data Association: Algorithm Development and Assessment[J]. IEEE Trans. on Aerospace and Electronic Systems, 2010, 46(2): 583-609.
Restraint Method for Merit Function Scattering of Second-Order DP Algorithm Based on Trace Prediction
SUN Cheng-gang1, ZHANG Yi-qun1,2
(1.Beijing Institute of Electronic System Engineering,Beijing 100854, China;2.Science and Technology on Special System Simulation Laboratory,Beijing 100854,China)
The second-order dynamic programming algorithm (DPA) is effective on target detection. The low SNR target can be detected with this algorithm. But the algorithm still has some shortages like merit function scattering. Aiming at the shortage of the second-order DPA, a method is put forward to restrain the merit function scattering. With the method, the impact of noise on the detection process can be reduced, and the merit function scattering can be restrained. The method hasbetter detection ability,and can be implemented on hardware much more easily.
target detection; Markov process; dynamic programming; trace prediction; Kalman filter; assessment function scattering
2016-03-08;
2016-05-15
有
孫承鋼(1990-),男,遼寧大連人。碩士生,主要研究方向?yàn)閷?dǎo)航、制導(dǎo)與控制。
10.3969/j.issn.1009-086x.2016.06.015
TN953;N945.13
A
1009-086X(2016)-06-0085-06
通信地址:100854 北京142信箱30分箱
E-mail:15311449734@189.cn