基于積分直方圖分塊的MeanShift跟蹤算法

2015-05-30 10:48:04陳瑞卿

科技創(chuàng)新導(dǎo)報(bào) 2015年7期

關(guān)鍵詞：改進(jìn)

陳瑞卿

摘要：該文提出了一種新的基于積分直方圖分塊的MeanShift運(yùn)動(dòng)目標(biāo)跟蹤算法，采用積分圖分塊作為目標(biāo)描述算子，融合了顏色直方圖和空間信息，有效地解決了原始MeanShift跟蹤算法僅僅利用了顏色信息，而造成顏色相似運(yùn)動(dòng)目標(biāo)之間的誤匹配，大量的試驗(yàn)結(jié)果表明，該文提出的方法，即使在復(fù)雜的場(chǎng)景中，也能夠魯棒準(zhǔn)確地實(shí)現(xiàn)運(yùn)動(dòng)目標(biāo)的定位并跟蹤。

關(guān)鍵詞：MeanShit算法跟蹤算法改進(jìn)

中圖分類號(hào)：G420 文獻(xiàn)標(biāo)識(shí)碼：A 文章編號(hào)：1674-098X（2015）03（a）-0056-01

視頻圖像中運(yùn)動(dòng)目標(biāo)跟蹤是計(jì)算機(jī)視覺領(lǐng)域中一個(gè)關(guān)鍵問題，在視覺監(jiān)控、智能交通、感知用戶接口、虛擬現(xiàn)實(shí)、智能房間、遠(yuǎn)程醫(yī)療以及視頻編碼等領(lǐng)域都有著廣泛的研究價(jià)值和應(yīng)用前景。MeanShift算法作為一種高效的模式匹配算法，就是在每一幀圖像中尋找一個(gè)與目標(biāo)模板特征最相似的候選目標(biāo)區(qū)域，由于不需要進(jìn)行窮盡式的搜索，已經(jīng)成功地應(yīng)用在實(shí)時(shí)目標(biāo)跟蹤領(lǐng)域中。MeanShift算法僅僅考慮到跟蹤目標(biāo)的顏色信息，沒有考慮到空間信息，所以當(dāng)場(chǎng)景中出現(xiàn)和運(yùn)動(dòng)目標(biāo)顏色直方圖相似的目標(biāo)時(shí)，MeanShift算法會(huì)跟蹤失效。

該文所提出的運(yùn)動(dòng)目標(biāo)跟蹤算法，融合了目標(biāo)的顏色直方圖和空間信息，與單純地應(yīng)用基本的MeanShift相比，跟蹤的魯棒性和效果要提升很多。積分圖算法大大降低了鄰域匹配中不必要的計(jì)算，提高了算法的實(shí)時(shí)性。

該文第1節(jié)介紹基本的MeanShift跟蹤算法和基于積分直方圖的分塊跟蹤算法，第2節(jié)介紹本文提出的改進(jìn)算法，試驗(yàn)結(jié)果在第3節(jié)給出，最后是結(jié)論和展望。

1 MeanShift算法與基于積分直方圖的分塊跟蹤算法

MeanShift算法對(duì)運(yùn)動(dòng)目標(biāo)進(jìn)行描述，采用了RGB顏色空間中的三通道彩色直方圖。在給定的RGB特征空間中，以概率密度函數(shù)q來表達(dá)目標(biāo)模型，候選目標(biāo)模型記作為p（y）。q與p（y）的相似性度量就是考慮目標(biāo)模板圖像和候選目標(biāo)圖像各個(gè)樣本點(diǎn)對(duì)之間的距離關(guān)系。距離越大表明相似性越小，反之相似性越大。故目標(biāo)的定位就轉(zhuǎn)化為測(cè)量相鄰兩幀圖像之間目標(biāo)模型和候選目標(biāo)模型的相似性系數(shù)。

文獻(xiàn)中介紹了一種基于積分直方圖的分塊跟蹤算法，其較MeanShift算法對(duì)目標(biāo)的定位準(zhǔn)確，但計(jì)算量較大，因?yàn)樵诟欉^程中，要計(jì)算圖像序列中各幀的積分直方圖和跟蹤目標(biāo)區(qū)域的積分直方圖，用20個(gè)跟蹤塊來描述運(yùn)動(dòng)目標(biāo)，且每一塊都要計(jì)算其積分直方圖，每一塊的搜索都是在給定區(qū)域中窮盡式搜索，這些都大大增加了跟蹤的時(shí)間消耗，對(duì)于跟蹤實(shí)時(shí)性無疑是一個(gè)巨大的挑戰(zhàn)。但這種跟蹤方法考慮了運(yùn)動(dòng)目標(biāo)的空間信息，較基本的MeanShift算法對(duì)目標(biāo)的定位是準(zhǔn)確的。

2 對(duì)目標(biāo)模型描述的改進(jìn)

MeanShift算法中對(duì)運(yùn)動(dòng)目標(biāo)的描述中，沒有考慮到運(yùn)動(dòng)目標(biāo)各個(gè)部分的空間信息，也就是說，對(duì)于一個(gè)框定目標(biāo)的矩形框或橢圓框來說，目標(biāo)處于該框的任何位置，其直方圖都是一樣的，假設(shè)在一種很極端的情況下，即要跟蹤的目標(biāo)上半部分是白色，下半部分是黑色，而后在視頻幀的某一幀中，在該目標(biāo)的附近出現(xiàn)了一個(gè)上半部分是黑色，下半部分是白色的目標(biāo)，其直方圖的分布可以看到，只利用目標(biāo)的顏色信息，其直方圖的分布是相似的，這時(shí)，如果利用MeanShift算法跟蹤時(shí)，很有可能跟蹤錯(cuò)誤，但利用積分直方圖的分塊跟蹤方法時(shí)，由于其在描述目標(biāo)的時(shí)候，考慮到了跟蹤目標(biāo)各部分之間的空間信息，不會(huì)跟錯(cuò)目標(biāo)，但跟蹤的實(shí)時(shí)性得不到滿足。

2.1 對(duì)分塊跟蹤算法的改進(jìn)

首先將分塊跟蹤算法中對(duì)于目標(biāo)的分塊操作進(jìn)行修改，即在選定的特征空間里，并假設(shè)運(yùn)動(dòng)目標(biāo)是用矩形框框住的前提下，對(duì)運(yùn)動(dòng)目標(biāo)分為五部分來描述，即將運(yùn)動(dòng)目標(biāo)從目標(biāo)中心位置開始，水平方向分為上下兩部分，垂直方向分為左右兩部分，并且在與跟蹤窗口的中心位置重合處得到一個(gè)小的跟蹤窗口，用這五部分的描述來反應(yīng)給定的跟蹤目標(biāo)。在跟蹤的過程中，也是分開跟蹤這五部分，最終將這五部分的跟蹤結(jié)果進(jìn)行加權(quán)組合，從而得到目標(biāo)在當(dāng)前幀中的最終位置。

2.2 綜合分塊跟蹤算法和MeanShift算法

為了滿足實(shí)時(shí)性的要求，不是將運(yùn)動(dòng)目標(biāo)的各個(gè)跟蹤塊在給定的區(qū)域進(jìn)行窮盡式搜索，而是用顏色直方圖來描述運(yùn)動(dòng)目標(biāo)的五部分，這樣會(huì)考慮到運(yùn)動(dòng)目標(biāo)的空間信息，不會(huì)像基本的MeanShift算法那樣丟失了目標(biāo)的空間信息，然后在給定搜索區(qū)域內(nèi)對(duì)每一部分進(jìn)行MeanShift算法的跟蹤，從而每一塊都會(huì)得到當(dāng)前幀中的目標(biāo)的位置，從而根據(jù)該塊與目標(biāo)中心的關(guān)系，可得到5個(gè)目標(biāo)位置，最后，將這5個(gè)位置進(jìn)行加權(quán)組合，從而得到目標(biāo)在當(dāng)前幀中的最終位置。

3 試驗(yàn)結(jié)果

我們所做的跟蹤測(cè)試，都是在初始幀圖像中選定一個(gè)固定形狀的區(qū)域，譬如圓形、矩形或者是橢圓等等，并使得這個(gè)固定的區(qū)域能夠?qū)⑦\(yùn)動(dòng)目標(biāo)包圍，在隨后的各幀圖像中，只要搜索到的區(qū)域和這個(gè)固定區(qū)域包含的區(qū)域最相似即可。

4 結(jié)論和展望

該文算法只是考慮到了在對(duì)目標(biāo)模板進(jìn)行描述的過程中，加入了目標(biāo)模板的空間信息，與基本的MeanShift跟蹤算法相比，只是目標(biāo)的定位準(zhǔn)確了一些，但時(shí)間的消耗比基本的MeanShift算法大，且沒有考慮到所選擇的特征空間的更新和目標(biāo)模板的更新操作。

特征空間是從跟蹤一開始就給定了，在跟蹤的過程中，沒有對(duì)特征空間進(jìn)行更新，并且在整個(gè)跟蹤過程中，目標(biāo)模板始終保持不變，目標(biāo)在運(yùn)動(dòng)過程中，其外觀和背景都會(huì)發(fā)生相應(yīng)的變化，在跟蹤開始選定的特征空間或許就不能很好的區(qū)分跟蹤過程中的目標(biāo)和背景，肯定需要重新選擇合適的特征空間，也需對(duì)目標(biāo)模板進(jìn)行某種更新操作來達(dá)到跟蹤準(zhǔn)確的目的。

在下一步的工作中，我們將盡力解決這個(gè)問題。

參考文獻(xiàn)

[1] D.Comaniciu，V.Ramesh， and P.Meer.Kernel-based object tracking.IEEE Trans.Pattern Anal.Mach.Intell.2003，25（5）：564-577.

[2] D.Comaniciu，V.Ramesh，and P.Meer.Real-Time tracking of non-rigid objects using mean shift.In：Werner B，ed.IEEE Intl Proc.of the Computer Vision and Pattern Tecognition，Vol 2.Stoughton：Printing House，2000：142-149.