苑瑞林,朱志甫,孫 華
(1.鶴壁職業(yè)技術(shù)學(xué)院 電子信息工程學(xué)院,河南 鶴壁 458030; 2.東華理工大學(xué) 江西省新能源技術(shù)研究中心,江西 南昌 330013)
無人機已經(jīng)被廣泛應(yīng)用于軍事、航空、醫(yī)學(xué)救援、遠程測量等多個領(lǐng)域,目前,雷達/紅外跟蹤系統(tǒng)由于具有靈活性、冗余性、簡單性和可靠性而被廣泛使用[1-2].雷達是一種有源傳感器,它利用無線電波確定目標(biāo)的距離和方位角.然而,電磁信號很容易受干擾,這些不想要的信號可能來自內(nèi)部和外部源,包括被動的和主動的[3].紅外傳感器是一種無源傳感器,對電磁干擾無影響,對大氣環(huán)境敏感[4],利用雷達和紅外傳感器可以大大提高目標(biāo)跟蹤精度.然而,雷達和紅外傳感器的測量都是非線性的,因此,雷達/紅外無人機跟蹤系統(tǒng)需要研究無人機跟蹤濾波器.
模型不確定性、測量噪聲和目標(biāo)未知的轉(zhuǎn)向指令是無人機跟蹤系統(tǒng)中具有挑戰(zhàn)性的問題[5-6].在文獻[7]中,用一種蟻群估計器追蹤機動目標(biāo).在文獻[8]中,目標(biāo)跟蹤問題被公式化為零和博弈,并且開發(fā)了一個極大極小值算法估計目標(biāo)在傳感器網(wǎng)絡(luò)中的位置.在文獻[9]中,將目標(biāo)跟蹤問題描述為隨機對策,對線性連續(xù)時間系統(tǒng)的h∞最優(yōu)狀態(tài)估計濾波器問題進行了求解.在文獻[10]中,為解決無人機跟蹤過程采用粒子濾波算法存在粒子貧化現(xiàn)象,提出了基于蝙蝠回聲頻率和響度變換定位機制的群智能啟發(fā)算法.為了擴展線性離散動態(tài)系統(tǒng)約束狀態(tài)變量的極大濾波器,在文獻[11]中,提出了一種約束狀態(tài)估計濾波器.所有的算法都假設(shè)測量矩陣是常數(shù),它們不能用于雷達/紅外目標(biāo)跟蹤系統(tǒng)中.為了解決這一缺陷,本文采用離散時間博弈理論.
首先將目標(biāo)跟蹤問題轉(zhuǎn)化為離散時間零和對策;然后提出了一種基于博弈的狀態(tài)估計算法,用于雷達/紅外目標(biāo)跟蹤系統(tǒng)的同步更新算法.利用代數(shù)方法建立了該問題的求解方法,并在三維笛卡爾坐標(biāo)系中開發(fā)了一種精確估計無人機位置和速度的迭代算法.該算法是一種魯棒的極大極小值迭代濾波器,通過最差的轉(zhuǎn)向命令、最小化估計誤差而獲得.
為了實現(xiàn)對無人機位置的精確估計,首先建立無人機的運動學(xué)模型,建立離散時間無人機動態(tài)模型如下:
(1)
式中:k為時間指數(shù);xk∈Rn為三維笛卡爾坐標(biāo)中系統(tǒng)在第k步的位置、速度和加速度狀態(tài)向量,R為維度;C為將系統(tǒng)狀態(tài)和無人機目標(biāo)轉(zhuǎn)向指令相關(guān)聯(lián)的系數(shù)矩陣;zk∈Rr為測量向量;vk∈Rm和ωk∈Rr分別為過程噪聲和零均值高斯序列的測量噪聲,相應(yīng)的協(xié)方差矩陣分別為Qk和Rk;A為狀態(tài)轉(zhuǎn)移矩陣;B為系統(tǒng)噪聲系數(shù)矩陣;μk為未知轉(zhuǎn)向指令向量;f(·)為非線性函數(shù)的測量模型,并在稍后定義.
式(1)中,f(·)取決于傳感器的類型.本文采用雷達/紅外傳感器組合形式對無人機運動進行跟蹤,其量測包括目標(biāo)距離、方位角及俯仰角信息.用于量測機器人位置的雷達/紅外傳感器設(shè)置于同一平臺上,假定兩個傳感器位于同一位置.建立三維笛卡爾坐標(biāo)下無人機與傳感器平臺的幾何關(guān)系,如圖1所示.
圖1 無人機與傳感器平臺的幾何關(guān)系Fig.1 Geometric relationship between unmanned aerial vehicle and sensor platform
(6)
(7)
考慮到以上所述,f(xk)可寫為
(8)
狀態(tài)估計指對無人機過去的運動狀態(tài)加以平滑,并對現(xiàn)在的運動狀態(tài)進行濾波以預(yù)測未來的運動狀態(tài).由于在目標(biāo)跟蹤系統(tǒng)中,偏狀態(tài)估計濾波器比有偏狀態(tài)估計更適合.采用無偏濾波器對運動狀態(tài)進行估計,其濾波器結(jié)構(gòu)具有零值平均初始條件,即
(9)
(10)
為了采用博弈論進行狀態(tài)估計,將式(10)給出的估計誤差分解如下:
(11)
(12)
式中:Ke為設(shè)計常數(shù).
在獲得無人機位置信息后,引入博弈論的方法對估計位置進行平滑,以提高位置估計精度,并實現(xiàn)目標(biāo)跟蹤.
在零和博弈中,采用離散時間動態(tài)博弈.定義成本函數(shù)為
(13)
式中:Wk為正定矩陣;N為時間范圍.
(14)
式中:M為協(xié)方差權(quán)重矩陣;D為對角權(quán)重矩陣.
(17)
(18)
式中:Pk為協(xié)方差矩陣.
進一步,假定給出了f(xk)的雅可比矩陣Ck,則可以遞歸地利用以下關(guān)系得到狀態(tài)估計:
電動汽車市場是我國最重要的新興產(chǎn)業(yè)之一,是交通行業(yè)發(fā)展的必然結(jié)果。目前中國電動汽車市場處于萌芽階段,朝氣蓬勃,具有較大的潛力,同時具有較高的風(fēng)險。但是只要采用了符合市場、符合消費者偏好的商業(yè)模式,會大大降低電動汽車行業(yè)的風(fēng)險。
(19)
為獲得Ck,使用式(6)和式(7)的雅可比矩陣可獲得相應(yīng)測量矩陣為
(20)
綜合式(19)和式(20),獲得矩陣Ck表達式為
(21)
可以看出Ck=Jf是一個時變矩陣.
為驗證基于博弈論濾波的雷達/紅外定位方法對無人機位置的跟蹤效果,在Matlab/Simulink環(huán)境下,對無人機變高度飛行和恒定高度飛行進行了跟蹤誤差仿真.
雷達/紅外傳感器均位于笛卡爾坐標(biāo)的原點,采樣速率為t=1 s,雷達傳感器的測量噪聲向量是標(biāo)準偏差為30 m、方位角為0.86°的零均值高斯序列,紅外傳感器測量噪聲向量是方位角和仰角均為0.57°的標(biāo)準偏差,過程噪聲為0.08 m/s2的零均值高斯序列.通過100次蒙特卡洛進行仿真測量,采用均方根誤差(Root Mean Square Error,RMSE)和累積均方根誤差(Cumulative Root Mean Square Error,CRMSE)作為位置和速度估計的性能指標(biāo),其表達式如下:
(22)
(23)
式中:K為采樣點數(shù);T為采樣時間.
3.2.1標(biāo)稱噪聲干擾
假設(shè)無人機的初始位置為[3 600 3 600 0],其運動軌跡為1~10 s,以[-10 10 20]m/s的速度做勻速直線運動;在10~25 s之間以恒定速度[20 20 20]運動;在25~40 s之間的恒定加速度[2 -2 0]運動,其后在50~60 s之間的保持速度不變.
根據(jù)無人機運動軌跡,對比博弈論濾波、擴展卡爾曼濾波和容積卡爾曼濾波下,無人機位置和速度的均方根誤差,如圖2所示.
圖2 標(biāo)稱噪聲干擾下無人機變高度飛行跟蹤誤差Fig.2 Tracking error of unmanned acerial vehicle at variable height under nominal noise
由表1可以看出:雖然博弈論濾波能夠獲得無人機更準確的估計結(jié)果,但結(jié)果表明,所有濾波器均能以合理的精度估計三維笛卡爾坐標(biāo)系中無人機的位置和速度.3種濾波器下的位置均方根誤差分別為20.85,22.63和23.42 m,速度均方根誤差分別為8.6,11.6和11.7 m/s.
3種濾波器下無人機CRMSE和運行時間如表1所示.可以看出,對比累積位置誤差,博弈論濾波的比擴展卡爾曼濾波降低了6%,比容積卡爾曼濾波降低了3%.此外,博弈論濾波的累積速度誤差比另外2種濾波方法減小了9%.3種濾波方法中容積卡爾曼濾波運行時間最長.
表1 標(biāo)稱噪聲干擾下無人機變高度CRMSE及運行時間Tab.1 CRMSE and running time of unmanned acerial vehicle at variable height under nominal noise
3.2.2非標(biāo)稱噪聲干擾
為進一步研究噪聲干擾對跟蹤精度的影響,采用相同的飛行路徑,設(shè)置雷達傳感器的測量噪聲向量是標(biāo)準偏差為60 m、方位角為1.72°的零均值高斯序列.紅外傳感器測量噪聲向量是方位角和仰角均為1.15°的標(biāo)準偏差的零均值高斯序列.獲得無人機位置和速度的均方根誤差,如圖3所示.
圖3 非標(biāo)稱噪聲干擾下無人機變高度飛行跟蹤誤差Fig.3 Tracking error of unmanned acerial vehicle at variable height under non-nominal noise interference
從圖3可以看出:3種濾波方式下位置均方根誤差分別為25.63,40.71和43.65 m,速度均方根誤差分別為16.36,32.64和32.85 m/s,表明博弈論濾波在非標(biāo)稱噪聲擾動下的跟蹤性能同樣優(yōu)與另外兩種濾波方式.進一步對比分析3種濾波器的累積均方根誤差,如表2所示.
表2 非標(biāo)稱噪聲干擾下無人機變高度CRMSE及運行時間Tab.2 CRMSE and running time of unmanned acerial vehicle at variable height under non-nominal noise
由表2可以看出:與擴展卡爾曼濾波和容積卡爾曼濾波相比,本文提出的博弈論濾波的位置CRMSE減少了12%,速度CRMSE減少了36%.
基于上述分析可知,當(dāng)噪聲統(tǒng)計量是標(biāo)稱時,擴展卡爾曼濾波、容積卡爾曼濾波和博弈論濾波均能以合理的精度在三維笛卡爾坐標(biāo)系中估算無人機的位置、速度.但是,如果噪聲統(tǒng)計信息未知,則本文提出的博弈論濾波具有更好的跟蹤效果.
根據(jù)無人機的特征,很長一段時間內(nèi)在恒定高度飛行,因此,有必要研究恒定高度飛行下的跟蹤效果.設(shè)定無人機的飛行軌跡為
(24)
3.3.1標(biāo)稱噪聲干擾
無人機恒定高度飛行過程中,在標(biāo)稱噪聲干擾下,其位置和速度的均方根誤差如圖4所示.
顯然,與博弈論濾波相比,擴展卡爾曼濾波和容積卡爾曼濾波存在相當(dāng)大的估計誤差.博弈論濾波導(dǎo)致位置均方根誤差在8.35 m左右,而擴展卡爾曼濾波和容積卡爾曼濾波的平均位置誤差分別為18.25和18.63 m(幾乎是原來的2倍或更多).3種濾波方式下的平均速度誤差分別為12.63,32.62和32.15 m/s.表3列出了3種過濾器的CRMSE和運行時間.
由圖3(a)可以看出:博弈論濾波的位置CRMSE對于擴展卡爾曼濾波減少了32%,對于容積卡爾曼濾波減少了26%.如前所述,容積卡爾曼濾波的運行時間比博弈論濾波和擴展卡爾曼濾波長.
圖4 標(biāo)稱噪聲干擾下無人機恒定高度飛行跟蹤誤差Fig.4 Flight tracking error of unmanned acerial vehicle at constant heigth under nominal noise interference
表3 標(biāo)稱噪聲干擾下無人機恒定高度CRMSE及運行時間Tab.3 CRMSE and running time of unmanned acerial vehicle at constant height under nominal noise
3.3.2非標(biāo)稱噪聲干擾
設(shè)置雷達傳感器的測量噪聲向量為零均值高斯序列,標(biāo)準偏差為60 m,方位角為1.72°,紅外傳感器的測量噪聲向量為零均值高斯序列,方位角和仰角的標(biāo)準差為1.43°.模擬非標(biāo)稱噪聲干擾下的跟蹤效果,如圖5所示.
由圖5(a)可以看出:博弈論濾波產(chǎn)生的平均位置誤差在40 m左右,而擴展卡爾曼濾波和容積卡爾曼濾波的平均位置誤差分別為100.35和105.74 m.由圖5(b)可以看出:博弈論濾波平均速度誤差在45.62 m/s左右,而擴展卡爾曼濾波和容積卡爾曼濾波平均速度誤差分別為113.52 m/s和105.26 m/s.另外,3種濾波器的狀態(tài)估計和運行時間測試的CRMSE如表4所示.由表4可以看出:對于擴展卡爾曼濾波和容積卡爾曼濾波,博弈論濾波的CRMSE減少了46%.博弈論濾波的速度CRMSE對于擴展卡爾曼濾波和容積卡爾曼濾波均減少了53%.
圖5 非標(biāo)稱噪聲干擾下無人機恒定高度飛行跟蹤誤差Fig.5 Flight tracking error of unmanned acerial vehicle at constant height under nominal noise interference
表4 標(biāo)稱噪聲干擾下無人機恒定高度CRMSE及運行時間Tab.4 CRMSE and running time of unmanned acerial vehicle at constant height under nominal noise
本文將博弈論濾波算法應(yīng)用與雷達/紅外無人機目標(biāo)跟蹤,將其描述為零和博弈,導(dǎo)出了博弈均衡點,以獲得三維笛卡爾坐標(biāo)系中無人機位置和速度的最佳估計.所提出濾波器增益可通過假設(shè)目標(biāo)的最可能未知的轉(zhuǎn)向命令來計算,使得其對目標(biāo)的轉(zhuǎn)向命令具有一定的魯棒性.通過對變高度飛行和恒定高度飛行進行仿真,與擴展卡爾曼濾波和容積卡爾曼濾波相比,證明了博弈論濾波器的有效性和高精度性能.