許志剛,周 立
(淮海工學(xué)院a.理學(xué)院;b.測繪工程學(xué)院,江蘇連云港 222005)
純方位目標跟蹤(bearings-only tracking,BOT)技術(shù)在紅外探測、無人機空中偵察、海洋中的目標搜救等一些實際工程中具有重要的應(yīng)用價值[1-2].
由于特殊的可觀測性問題[3],被動觀測平臺必須進行有效的機動,才能保證系統(tǒng)存在唯一解[4].在實際應(yīng)用中,量測的角度往往受噪音的干擾,即使在系統(tǒng)可觀測情況下,估計器的性能受觀測平臺機動軌跡的影響也非常大,具體體現(xiàn)在目標參數(shù)估計精度、估計器穩(wěn)定性、收斂時間等指標方面.
在研究觀測平臺機動策略時,選用不同的性能指標會產(chǎn)生不同的機動軌跡;從跟蹤估計目標運動參數(shù)角度,大多數(shù)文獻選用FIM信息陣和方位變化率來研究.如文獻[5]選用FIM下界為性能指標,研究固定目標定位問題中的平臺機動軌跡;文獻[6]直接基于最大化FIM的行列式,用微分包含技術(shù)試圖尋找目標定位問題的觀測平臺最優(yōu)軌跡;文獻[7]則選用方位變化率最大作為性能指標,推導(dǎo)出勻速直航目標跟蹤的本載體最優(yōu)軌跡;Passerieux等[8]以變形FIM為指標,通過解析和數(shù)值迭代方法給出最佳觀測平臺機動Euler方程.另外有文獻基于Cramer-Rao下界(CRLB)性能指標,利用矩陣跡最小探索觀測平臺的最優(yōu)軌跡[9].目前對運動目標跟蹤問題,文獻大多利用批處理方法給出末端點平臺航向控制,且控制表達式非常繁瑣,計算復(fù)雜,不利于應(yīng)用;或者利用方位差最大指標給出實時控制,但這種控制只考慮了方位信息,與觀測器和目標相對距離以及速度無關(guān),達不到充分利用現(xiàn)有信息的效果.
文獻[10]選用最大化當前FIM增量行列式指標給出了定位系統(tǒng)的一種基于當前量測的最優(yōu)控制策略.本文將上述結(jié)果推廣到遠距離目標被動跟蹤系統(tǒng),給出當前時刻一種新的觀測平臺航向控制策略,設(shè)計的航向機動控制序列幾何意義明確,在工程應(yīng)用中具有可操作的借鑒價值.
傳統(tǒng)上,CRLB主要被用來估計次優(yōu)線性/非線性濾波的誤差性能[11],由于CRLB在系統(tǒng)構(gòu)建前能預(yù)測可達到的最優(yōu)理論性能指標,因此也可以利用它來進行系統(tǒng)設(shè)計.雖然CRLB批處理計算需要求取高階矩陣的逆,使得計算復(fù)雜度隨采樣時間延長越來越高[12],但Tichavsky等[13]給出離散系統(tǒng)濾波CRLB(PCRLB)遞推式,使得計算復(fù)雜度大為減小.
記Jk為濾波Fisher信息矩陣(FIM)[11],離散型濾波信息陣Jk的一個遞推計算公式[13]為
這里
假定目標和觀測平臺都在同一平面上,觀測平臺以速率Vw,k運動.觀測平臺動力學(xué)方程為
初始條件
其中xw,k,yw,k分別為k時刻觀測平臺在x和y方向的坐標;Cw,k為k時刻觀測平臺運動航向,為控制參數(shù).
量測噪音ηk~N(0,R).
Fisher信息矩陣(FIM)為
其中
式(5)可化為
利用式(1)可得FIM遞歸式為
在BOT系統(tǒng)中,F(xiàn)IM是反映觀測平臺機動后對目標信息提取的度量陣.隨著量測數(shù)據(jù)的增加,F(xiàn)IM陣的全局計算量呈指數(shù)型增長,同時也不適合實時控制;在工程應(yīng)用中,k時刻觀測平臺機動模式控制策略的選擇更具有現(xiàn)實意義.
不失一般性,第一步先研究k到k+1時刻(k>1)的觀測平臺機動軌跡.如圖1所示,設(shè)觀測平臺在時刻k位于O點,目標位于A點,在k+1時刻觀測平臺運動到B點,假設(shè)觀測平臺速度在一個采樣周期內(nèi)保持不變,即從k時刻到k+1時刻速度Vw,k不變,采樣周期為T,則sk=|OB|=Vw,kT;記|OA|=rk,|BA|=rk+1,現(xiàn)要確定觀測平臺在k時刻的航向Cw,k,使得當前信息量最大.由于從k時刻到下一采樣時刻之前僅有前k時刻的量測方位,可假定一個采樣周期內(nèi)目標近似不動(仍位于A).
圖1 觀測平臺與目標的幾何態(tài)勢Fig.1 Geometric state of observer platform and target
依據(jù)貪婪法思想,盡可能使當前信息最大,這里取最大化信息陣行列式增量為性能指標,即可歸結(jié)為求解優(yōu)化問題:
經(jīng)推導(dǎo)得
下面給出k時刻觀測平臺航向的幾何描述.
觀測平臺在k時刻測得目標角度βk;作以O(shè)為圓心,sk=Vw,kT為半徑的圓(如圖2所示),作OD⊥OA交圓O于D點,連AD交圓于B點,則∠OAD=αk.作OE⊥BD,容易看出∠DOE=∠BOE=αk,且αk=βk-βk+1,所以因此觀測平臺最優(yōu)軌跡為從O點運動到B點.如果僅就當前量測信息,關(guān)于觀測器與目標瞄準線對稱方向還有另一個機動軌跡,由于這里的目標是運動的,對于左右兩個機動軌跡的選擇可通過所有量測方位信息給出判斷.
圖2 當前時刻k的觀測平臺次優(yōu)機動航向Fig.2 Optimal maneuver heading of observer platform at current time k
當觀測平臺到達B點后,此時目標運動到F點,目標在F點方位被測量.觀測平臺在進行下一個機動控制選擇時,當采樣時間很小時,可繼續(xù)將目標看作在F點不動.下面討論左右支機動策略的選擇.
考慮n時刻累計信息陣:
由目標與觀測平臺運動態(tài)勢,根據(jù)投影定理得
上式化簡可得
其中qm,k,qw,k分別為目標和觀測平臺的舷角,左負右正(見圖2).
當觀測平臺與目標互為右舷(sin qm,k,sin qw,k均為正值)時,此時0≤βk+1-βk≤π;反之,當觀測平臺與目標互為左舷(sin qm,k,sin qw,k均為負值)時,此時-π≤βk+1-βk≤0;由于這里主要考慮遠距離目標跟蹤,當觀測平臺與目標相對距離的變化率很小時,可忽略不計,因此,若觀測平臺與目標同舷時,sin2(βiβj)取得最大值,也即max{det[(~JToln)2×2]}存在.
以圖3為例,當目標軌跡為P→A1→A2→A3→A4→A5時,運用機動策略可得觀測平臺1條次優(yōu)機動序列:O→B1→B2→B3→B4→B5.這里目標與觀測平臺互為左舷(-π≤qm,k,qw,k≤0).同理可給出目標與觀測平臺互為右舷的機動序列.
圖3 觀測平臺機動軌跡(-π≤qm,k,qw,k≤0)Fig.3 Observer platform maneuver trajectoryl(-π≤qm,k,qw,k≤0)
特別地,若目標沿瞄準線(LOS)走接近或遠離觀測平臺的直線運動,可以找到觀測平臺2條次優(yōu)機動軌跡.圖4給出當目標沿LOS航向走接近觀測平臺情形下觀測平臺2支次優(yōu)機動航向.目標軌跡為P→A1→A2→A3→A4→A5.左支:O→B1→B2→B3→B4→B5→B6.右支:O→D1→D2→D3→D4→D5→D6.
圖4 目標走LOS航向時觀測平臺的2支機動軌跡Fig.4 Two observer maneuver trajectories in LOS course
給出最大化FIM行列式增量指標下不同目標初距、觀測平臺速度和采樣時間情形下最優(yōu)軌跡的形態(tài)變化.圖5為觀測平臺與目標互為右舷情形下的運動平臺機動軌跡.其中:目標初始坐標(單位:m)(0,2 000),速度8m/s,航向5π/6;觀測平臺初始位置(0,0),速度15m/s;采樣周期T=5s.圖6為觀測平臺與目標互為左舷情形下的運動平臺機動軌跡.其中:目標初始坐標(單位:m)(0,10 000),速度15m/s,航向7π/6;觀測平臺初始位置(0,0),速度20m/s;采樣周期T=10s.
在方位率最大指標下機動軌跡與平臺速度無關(guān),航向與瞄準線垂直,信息提取以方位信息為唯一目的,這里信息包含距離信息和方位信息.從圖6可看出機動軌跡隨觀測平臺速度的提高,向目標靠近的速度相對也加快,反映了觀測平臺速度提高、機動策略加強對目標距離信息的提??;反之則更側(cè)重目標角度信息的提取,使信噪比逐漸提高,增加信息量的獲取.
圖5 觀測平臺與目標互為右舷Fig.5 Observer moves along starboard side of the target
圖6 觀測平臺與目標互為左舷Fig.6 Observer moves along portside of the target
純方位目標跟蹤系統(tǒng)觀測平臺的貪婪法機動策略,利用當前時刻的角度量測數(shù)據(jù),選用當前FIM行列式增量作為指標,使得每一步選擇中都采取在當前狀態(tài)下最好或最有利的機動選擇.由于貪婪法的計算簡單以及所求得的結(jié)果比較接近最優(yōu)結(jié)果,所以得到的機動控制策略更具有可操作性和實用性.傳統(tǒng)最大角度變化率絕對值指標法,與相對距離和觀測平臺速度沒有關(guān)系,所以它更單一地以提高角度信息為主,當量測容量達到一定飽和度時,濾波效果隨時間增加將趨于平緩.貪婪法機動軌跡隨觀測平臺速度、目標初始距離的變化而變化,在距離信息和角度信息側(cè)重性上保持一種平衡.速度越大,相對距離越小,則機動策略越加強距離信息的提取,反之則更側(cè)重加強角度信息的提取.在短距離目標跟蹤中,目標和平臺幾何態(tài)勢以及距離因素對左右支策略選擇的影響是進一步研究的問題.
[1] BARSHALOM Y,LI Xiaolong,KIRUBARAJAN T. Estimation with Applications to Tracking and Navigation[M].New York:Wiley,2001.
[2] DENG Xinpu,WANG Qiang,ZHONG Danxing.Observability of airborne passive location system with phase difference measurements[J].Chinese Journal of Aeronautics,2008,21(2):149-154.
[3] NARDONE S C,AIDALA V J.Observability criteria for bearings-only target motion analysis[J].IEEE Transactions on Aerospace and Electronic Systems,1981,17(2):161-166.
[4] 許志剛,董志榮.純方位系統(tǒng)定位與跟蹤解的唯一性問題[J].火力與指揮控制,2002,27(4):38-42.
[5] LIU P T.An optimum approach in target tracking with bearings measurements[J].Journal of Optimization Theory and Applications,1987,56(2):205-214.
[6] OSHMAN Y,DAVIDSON P.Optimization of observer trajectories for bearings-only target localization[J]. IEEE Transactions on Aerospace and Electronic Systems,1999,35(3):892-902.
[7] 董志榮.純方位系統(tǒng)定位與跟蹤的本載體最優(yōu)軌線方程及其最優(yōu)軌線[J].指揮控制與仿真,2007,29(1):7-15.
[8] PASSERIEUX J M,VAN CAPPEL D.Optimal observer maneuver for bearings-only tracking[J].IEEE Transactions on Aerospace and Electronic Systems,1998,34(3):777-788.
[9] HELFERTY J P,MUDGETT D R.Optimal observe trajectories for bearing-only tracking by minimizing the trace of the Cramer-Rao lower bound[C]//Proceedings of the 32nd Conference on Decision and Control.San Antonlo,Texas,December,1993:936-939.
[10] 許志剛,盛安冬,陳黎,等.被動目標定位系統(tǒng)觀測平臺的最優(yōu)機動軌跡[J].控制理論與應(yīng)用,2009,26(12):1337-1344.
[11] KERR T H.Status of CR-like lower bounds for nonlinear filtering[J].IEEE Transactions on Aerospace and Electronic Systems,1989,25(9):590-601.
[12] TAYLOR J H.The Cramer-Rao estimation error lower bound computation for deterministic nonlinear systems[J].IEEE Transactions on Automatic Control,1979,24(2):343-344.
[13] TICHAVSKY P,MURAVCHIK C H,NEHORAI A.Posterior Cramer-Rao bounds for discrete-time nonlinear filtering[J].IEEE Transactions on Signal Processing,1998,46(5):1386-1396.