葛鯤鵬 洪峰 鄒煥新 陳楠
摘要:為解決紅外圖像中對人體進行實時魯棒跟蹤的問題 ,本文針對紅外圖像的特點,提出一種新的基于模板差分的紅外人體跟蹤算法。該算法以視頻中前一幀目標模板與當前幀差分后得到的正負值區(qū)域為基礎,得到人體在當前幀的準確位移,并通過以模板灰度均值替代模板邊緣的方式提高跟蹤精度,算法跟蹤的準確度和運算速度相比常用的粒子濾波和Mean Shift跟蹤算法都有大幅度的提升,實驗結(jié)果表明,本文所提出的算法運算速度快,準確性高,能夠很好的實現(xiàn)紅外圖像序列中對人體目標的跟蹤。
關鍵詞:紅外圖像 行人跟蹤 均值替代 模板差分
中圖分類號:TP391.4 文獻標識碼:A 文章編號:1007-9416(2016)07-0122-02
目前,智能視頻監(jiān)控的很多成果已廣泛應用于交通管控、自動導航、安全檢查等生產(chǎn)和生活的各個領域,而對人體或其它運動的物體進行穩(wěn)健的跟蹤是目前很多智能視頻應用的基礎。事實上,對人體進行跟蹤比對其它運動物體進行跟蹤要復雜得多,除光照條件的變化等不利影響外,人體目標在運動過程中產(chǎn)生的形變、運動的無規(guī)律性、與其他人體目標之間的互動以及人與人之間的交匯和遮擋等,都使人體目標跟蹤的復雜度大大增加。為解決這些問題,到目前為止提出的算法有很多,比較經(jīng)典的有粒子濾波[1]和Mean Shift算法[2],但這些方法都有其自身的缺陷。粒子濾波會面臨粒子退化的問題,Mean Shift算法會陷入局部最優(yōu)的問題,而且這些算法大多都用于可見光圖像的跟蹤,當應用到紅外圖像時,由于目標丟失了顏色和紋理信息,跟蹤的效果并不理想。
紅外圖像是灰度圖像,且灰度值取決于物體的溫度和熱輻射,在紅外圖像中,人體丟失了皮膚和衣服的顏色信息,而且更為不利的是紅外視頻和可見光視頻相比,分辨率和信噪比都會低很多,而且人體在行進過程中的形變更增加了跟蹤的難度。為克服紅外視頻中人體目標特征信息缺失的特點,本文提出了一種新的人體跟蹤方法,算法以灰度均值替代邊緣的模板與當前幀差分為基礎,實現(xiàn)了紅外圖像序列中對人體的跟蹤。文章最后給出了在不同紅外圖像數(shù)據(jù)庫中的人體跟蹤結(jié)果。
1 幀間差分法
幀間差分法通過相鄰兩幀視頻圖像之間的差分得到運動目標的邊緣信息,因其算法實現(xiàn)簡單,程序設計復雜度低,對光線等場景變化不太敏感等特點,常運用于運動目標檢測,一般通過選取閾值來提取序列圖像中的運動區(qū)域。在序列圖像中,第幀圖像和第幀圖像之間的變化可用二值差分圖像表示:
(1)
式中為差分圖像二值化的閾值。
2 均值替代邊緣的模板差分法
2.1 模板差分
本文所提出的模板差分法在首次迭代時與幀間差分法類似,但公式與幀間差分法相比要作稍許改變:
(2)
為得到目標的準確位移,將在在第幀上按照所指的方向(即正負值質(zhì)心的連線方向)移動一個像素的距離,然后重復上述過程(即再用第幀的模板與之相減,得到),如此反復迭代直到的方向與上次迭代方向相反時停止,算法具體實施方法如下:
(3)
其中為的中心點坐標,為歸一化常數(shù),目的是使目標每次最多只位移一個像素。
2.2 均值替代模板邊緣
實驗過程中發(fā)現(xiàn),即使第4步可以解決一定程度的誤差累積,當跟蹤持續(xù)一段時間后,跟蹤框會還是會出現(xiàn)如圖1a和圖1b中所示的現(xiàn)象。
從圖1可以看到目標和背景各占據(jù)候選框的一邊,這種情況十分不利于本算法的跟蹤,當模板中的背景區(qū)域不能環(huán)繞目標,而是與目標分置于模板兩側(cè)時,模板與候選目標相減就不能產(chǎn)生有效的正負值區(qū)域,導致跟蹤出現(xiàn)嚴重誤差,為解決這個問題,本文采用以模板灰度均值替代模板邊緣的方式強制賦予模板周圍近似背景的區(qū)域,方法如下:
首先取幀中模板亮度平均值,而后將賦予幀模板的最外三層像素,用公式表式為:
(4)
(5)
其中和為別模板圖像的長度和寬度,為幀模板中每個像素的灰度值。為模板圖像灰度所組成的矩陣。
實際用于匹配的第幀的模板都如圖2所示,在強制賦予模板四周近似背景的區(qū)域之后,由于有了外層的保護區(qū)域,在視頻背景中沒有高亮物體干擾的情況下,每一幀都可以實現(xiàn)穩(wěn)定而準確的跟蹤。
3 實驗結(jié)果與分析
為了驗證本文所提算法的有效性,利用2個不同的視頻序列進行了實驗。其中,圖3和圖4來自OTCBV基準庫中的Terravic Motion IR Database.實驗在配置為Intel core 2.53GHz處理器、內(nèi)存為4G,軟件環(huán)境為MATLAB的PC上完成。
圖3所示的視頻中,行人行走過程中有兩次被樹木短暫的遮擋,可以看到本文所提出的算法對這種短暫遮擋有較強的適應性,自始至終保持魯棒的跟蹤。
圖4所示的視頻中,人體目標從第535幀開始,有19秒的時間是完全隱藏的,但本文提出的算法在目標出現(xiàn)后仍然能夠準確鎖定目標。
圖5為從OTCBVS Benchmark Dataset 05 5a測試結(jié)果中抽取前50幀,然后本用文所提出的算法和粒子濾波及Mean Shift算法每幀運算速度對比,粒子濾波算法采用的粒子數(shù)為200個。從圖中可以看到,Mean Shift算法每幀需時40多毫秒,粒子濾波算法也要8毫秒以上,本文所提出的算法平均每幀運算時間只需1毫秒左右,完全能夠滿足實時跟蹤的需求。
4 結(jié)語
本文提出的灰度均值替代邊緣的模板差分法,借鑒圖像處理技術(shù)中常用的幀間差分和模板匹配等方法,利用前一幀模板與當前幀差分產(chǎn)生的正負值區(qū)域獲得目標在當前幀的位移方向,并在此方向上以單個像素迭代得到目標的準確位置,且采用以灰度均值框替代模板邊緣的方式消除誤差累積,保證跟蹤的準確性。實驗表明本文所提出的紅外人體跟蹤算法簡單、快速、有效,能夠很好的應對人體運動過程中產(chǎn)生的形變,并在每一幀中都能準確的框定人體目標。算法的主要缺點是容易受到背景中高亮物體的干擾,且不能適應目標的大小變化,因此,在算法中加入對背景高亮部分的檢測,增強算法的抗干擾性能,以及加入可隨目標變化自適應擴大或縮小的跟蹤框是下步研究的重點。