孫景偉,丁學(xué)用,雷 歌
(三亞學(xué)院 理工學(xué)院,海南 三亞 572022)
基于HOG的實時壓縮跟蹤研究
孫景偉,丁學(xué)用,雷 歌
(三亞學(xué)院 理工學(xué)院,海南 三亞 572022)
壓縮跟蹤利用壓縮感知理論將Harr類特征投影到低位空間中,實現(xiàn)了實時性跟蹤。但該方法提取是關(guān)于顏色信息的特征,易受光照影響,在光照劇烈變化的場合會跟蹤失敗?;诖?,提出一種基于梯度方向直方圖實時壓縮跟蹤算法。該算法采用HOG特征取代Harr類特征,增強對光照的不敏感性,提高了跟蹤魯棒性。通過不同視頻的測試結(jié)果表明,文章提出的方法在光照劇烈變化、形變等情況下能準(zhǔn)確地跟蹤目標(biāo),且平均幀率15 frame/s,基本滿足實時性要求。
壓縮感知;Harr類;梯度方向直方圖
運動目標(biāo)跟蹤是近年來計算機(jī)視覺領(lǐng)域的熱門研究方向之一,在視頻監(jiān)控、軍事領(lǐng)域、智能機(jī)器人、智能交通系統(tǒng)方面有著廣泛的應(yīng)用背景。2006年壓縮感知被Candes和Donoho提出來以后,就成為國內(nèi)外的研究熱點,壓縮感知被應(yīng)用到運動目標(biāo)跟蹤上來,并取得較好的效果。文獻(xiàn)[2]中通過采用稀疏投影矩陣的方法對Harr類特征進(jìn)行壓縮,快速的提取特征,提高跟蹤效率,然而,該方法提取的是關(guān)于顏色信息的特征,光照不敏感性差,當(dāng)光照變化劇烈時會跟蹤失敗。
本文針對文獻(xiàn)[2]中的跟蹤算法中的缺陷,提出了改進(jìn)算法。文章采用梯度方向直方圖特征(Histogram of Oriented Gradient, HOG)代替harr類特征,增強目標(biāo)特征表達(dá)能力,增強光照的不敏感性,提高了跟蹤的魯棒性。并通過實驗表明,本文提出的算法能在光照劇烈變化、形變等情況下能實時穩(wěn)定的跟蹤目標(biāo)。
1.1 觀測矩陣
依據(jù)壓縮感知理論,當(dāng)觀測矩陣滿足有限等距特性(RIP)[3]時,信號能投影到低位空間中:y=Rx (1)其中x∈Rn×1是原始信號;R∈Rm×n(m<<n)是觀測矩陣,y∈Rm是觀測值。R要滿足有限等距特性(RIP)[3]。
本文根據(jù)文獻(xiàn)[4],選取了非常稀疏的觀測矩陣,定義如下:
1.2 梯度方向直方圖
先用高斯濾波器對圖像進(jìn)行平滑,然后使用3×3的Sobel掩膜對圖像進(jìn)行水平、垂直方向濾波,獲得水平和垂直方向的梯度。根據(jù)感興趣的矩形區(qū)域內(nèi)各點在水平和垂直方向的梯度值GXi,GYi計算出各點梯度值的幅值Gi和方向θi:
為了計算梯度方向直方圖,將各點梯度方向歸并量化為有限個方向,本文設(shè)定為4個方向(bins),每45°為一個區(qū)域。完成梯度方向的歸并量化,統(tǒng)計各個方向的點的數(shù)目,并對其歸一化處理,映射到[0,1]區(qū)間,得到感興趣矩形區(qū)域的梯度方向直方圖,即得到四維的HOG特征x=(a1,a2,a3,a4),其中a1+a2+a3+a4=1。
本文借鑒文獻(xiàn)[2]的跟蹤框架,提出了改進(jìn)算法:基于HOG實時壓縮跟蹤。首先,根據(jù)第n幀的跟蹤結(jié)果來提取正樣本和負(fù)樣本,提取正負(fù)樣本的矩形HOG特征,然后利用稀疏的測量矩陣對其進(jìn)行壓縮,進(jìn)而更新分類器;然后,在感興趣區(qū)域內(nèi)提取第(n+1)幀的候選目標(biāo),用上面的方法獲取壓縮后的HOG特征,進(jìn)而根據(jù)分類器選取分類值最高的候選目標(biāo)作為跟蹤的結(jié)果。
2.1 快速的HOG特征提取
假設(shè)圖像的大小為w×h,那么矩形HOG特征數(shù)達(dá)到(w×h)2,特征數(shù)總數(shù)的等級達(dá)到105~1010,數(shù)量十分龐大,為了降低計算量,選取非常稀疏的測量矩陣進(jìn)行壓縮:
從R可知測量矩陣中每一行的非零元素的個數(shù)不超過4個,從而大大減少了計算量,圖1顯示了HOG特征提取的過程,記xi=(ai1,ai2,ai3,ai4)為第i個矩形對應(yīng)的HOG特征。
2.2 貝葉斯分類器
對樣本圖像Z,計算其相對應(yīng)的HOG特征Y=(y11,y12,y13, y14;…;ym1,ym2,ym3,ym4),假設(shè)Y中每一列所有的元素是相互獨立,且p(z=1)=p(z=0),則有
圖1 HOG特征提取流程
其中z=1代表正樣本,z=0代表負(fù)樣本,且
最后,選取H(Y)最大的候選目標(biāo)作為跟蹤的結(jié)果,并對下面的系數(shù)進(jìn)行更新:
式中λ表示前一幀對當(dāng)前幀影響的程度,使用最大似然估計求解u1
j和σ1j,即
2.3 算法流程
本文針對文獻(xiàn)[2]中的算法缺陷提出了基于HOG實時壓縮跟蹤算法,具體流程如下:
(1)手工提取第一幀的跟蹤目標(biāo)。
(3)根據(jù)式(5)選取最大的值作為跟蹤的結(jié)果。
(5)根據(jù)式(7)和(8)對分類器進(jìn)行更新。
(
6)跳到第二步驟進(jìn)行下一幀處理。
為了驗證本文的跟蹤效果,將其用于跟蹤下面的3種視頻序列:David indoor,Car4,Car11;并與下面的兩種跟蹤算法作了比較:Compressive Tracking(CT)[1],Online AdaBoost(OAB)[5]。圖2是上面的跟蹤方法對3種個視頻序列的部分跟蹤結(jié)果;圖3顯示的是相應(yīng)的跟蹤誤差;表1顯示的是平均誤差的比較。
表1 平均誤差的比較
(a)David indoor
(b)Car4
圖2(a)顯示的是有姿勢變化和光照變化的David indoor視頻序列跟蹤結(jié)果,本文的方法、CT都能成功的跟蹤目標(biāo),而OAB在人轉(zhuǎn)身和光照變化時會發(fā)生跟蹤偏移,且從表1可知本文的跟蹤方法平均跟蹤誤差最小,跟蹤效果最好。
圖2(b)顯示的是光照急劇變化的Car4視頻序列跟蹤結(jié)果,從188幀開始即當(dāng)車經(jīng)過橋底,光線從亮變暗時,CT和OAB開始跟蹤失敗,只有本文的方法能成功的跟蹤目標(biāo)。
圖2(c)顯示的是對夜晚中車輛行駛的Car11視頻序列的跟蹤結(jié)果,視頻中有劇烈的光照變化且目標(biāo)物體與背景顏色相似的情況。從第10幀開始,由于受到光照的影響,CT開始跟蹤失??;從第221幀開始,當(dāng)光照從白光變成紅光,且車輛轉(zhuǎn)彎時,OAB開始跟蹤失?。欢疚牡姆椒艹晒Φ母櫮繕?biāo)。
圖2 跟蹤結(jié)果
圖3 相應(yīng)的跟蹤誤差
綜上所述,由于CT和OAB提取的都是關(guān)于圖像的顏色信息,易受光照影響,跟蹤穩(wěn)定性差,而本文提出的方法提取的是圖像的梯度信息,光照不敏感性強,在光照劇烈變化的情況下,也能成功的跟蹤目標(biāo)。
本文分析了CT算法的缺陷,提出了一種基于HOG實時壓縮跟蹤算法。本文方法提取的HOG特征,即提取的是圖像的梯度信息,受光照影響小,克服了CT算法對光照的不敏感性,提高了跟蹤的魯棒性。本文的跟蹤算法,在CPU 2.0 GHZ、內(nèi)存2 GB筆記本電腦上運行,跟蹤速度達(dá)到15 frame/s,保證了跟蹤的實時性,并且通過對比實驗,驗證了本文算法的優(yōu)越性。
[1]LI H, SHEN C, SHI Q. Real-time visual tracking using compressive sensing[C].Computer Vision and Pattern Recognition(CVPR), 2011 IEEE Conference on, 2011:1305-1312.
[2]ZHANG K, ZHANG L, Yang M H.Real-time compressive tracking[M].Heidelberg: Computer Vision–ECCV 2012. Springer Berlin, 2012.
[3]CANDES E J, TAO T. Decoding by linear programming[J].Information Theory, IEEE Transactions on, 2005(12):4203-4215.
[4]ACHLIOPTAS D. Database-friendly random projections:Johnson-Lindenstrauss with binary coins[J].Computer and System Sciences, 2003(4):671-687.
[5]GRABNER H, GRABNER M, BISCHOF H. Real-time tracking via on-line boosting[C].Proceedings on British Machine Vision Conference,2006(1):47-56.
Research on real time compression tracking based on HOG
Sun Jingwei, Ding Xueyong, Lei Ge
(Institute of Technology of Sanya University, Sanya 572022, China)
Compression Tracking projects Harr features onto the lower space to achieve a real-time tracking by using the compressed sensing theory. However, the feature which is extracted by this method is about color character, which is sensitive to light. In the occasion of the light with dramatic changes, it easily leads to the failure tracking. Based on the above discussion, we propose a HOG-based real-time compression tracking. In this paper, we use HOG features to replace Harr features to enhance the insensitivity to light, improve the tracking robustness. Through different video test results ,they show that the proposed method could track the target accurately in the light of dramatic changes and deformation circumstances, and the average frame rate is 15 frame/s, which is basically meet the real-time requirements.
compression sensing; Harr features; histogram of oriented gradient
孫景偉 (1988— ),男,海南三亞,碩士研究生,助教;研究方向:圖像處理。