張芝華
(安徽三聯(lián)學(xué)院電子電氣工程學(xué)院,安徽 合肥 230601)
近年來,隨著多媒體技術(shù)的迅速發(fā)展,視頻監(jiān)控已取得廣泛應(yīng)用,視頻數(shù)據(jù)急劇增長[1]。但在如此大的視頻數(shù)據(jù)中快速查找出所需目標(biāo)將花費(fèi)大量的人力物力。因此快速而準(zhǔn)確的檢索出所需目標(biāo),才能更好的利用視頻信息,才能更好的為人們服務(wù)[2]。視頻檢索大部分是基于圖像的顏色、紋理以及形狀等特征[3-4],在這些特征中顏色特征是最直觀的特征也是最重要的特征[5],因此準(zhǔn)確識別視頻顏色信息非常有意義,值得我們深入研究[6]。現(xiàn)有的基于顏色信息的視頻檢索方法大部分是基于單個像素進(jìn)行處理,但是圖像顏色是一個漸變的過程,一種顏色通常含有多個像素,每次僅對一個像素進(jìn)行識別較繁瑣,且不符合人眼的觀察特性[7]。本文提出了一種基于超像素分割的視頻目標(biāo)檢索算法,該算法首先對視頻序列進(jìn)行超像素分割,然后對每個超像素區(qū)域進(jìn)行顏色識別,檢索出所需要的視頻幀序列。實(shí)驗(yàn)結(jié)果表明,基于超像素分割的視頻目標(biāo)檢索算法,可以準(zhǔn)確的檢索出所需目標(biāo),具有較高的應(yīng)用價值。
所謂超像素主要是把圖像中的相鄰像素利用顏色特征和位置信息劃分為不同的圖像塊[8]。本文采用的聚類算法-SLIC是一種簡單的線性迭代聚類算法[9],其具體過程如下:
(1)初始化聚類類別數(shù)K和迭代次數(shù)N,確定種子點(diǎn)Ci=[li,ai,bi,xi,yi]T。這里:變量i表示第i個超像素區(qū)域,(li,ai,bi)表示像素i的顏色值,(xi,yi)表示像素i的坐標(biāo),Ci與其周圍像素點(diǎn)的初始距離d(i)=∞;
(2)微調(diào)種子位置,避免聚類中心點(diǎn)是邊緣點(diǎn)和噪聲點(diǎn):在Ci的3×3鄰域內(nèi)計(jì)算像素的梯度大小,將Ci點(diǎn)移動到梯度最小的區(qū)域,梯度定義如下(1)所示:
(1)
圖1 超像素分割
(3)初始化數(shù)據(jù),記錄每個像素所屬的類別數(shù)及像素到聚類中心點(diǎn)Ci的距離;
(4)比較每個像素到聚類中心Ck的空間距離,然后更新聚類中心,計(jì)算如下所示:
(2)
(3)
其中:Ds為像素到Ck的空間距離;Ckn更新后的聚類中新;
圖2 超像素分割
圖3 檢測結(jié)果
圖4 視頻第1幀檢索
(5)比較距離大小,更新距離,并通過標(biāo)簽記錄此時的位置;
(6)重復(fù)執(zhí)行步驟(4)、(5),直至達(dá)到步驟(1)所設(shè)定的迭代條件才終止;
(7)比較相鄰聚類中心亮度差值,合并較小的聚類區(qū)域,亮度計(jì)算如下:
從插秧和鏟、擔(dān)秧的公式中,每插一畝秧可得28分,每鏟、擔(dān)一畝秧得12分,也就是說,這一系列工作做完有40分,一天插一畝田正常需要4個一級工,每人插0.25畝,而十隊(duì)當(dāng)天出工的社員大部分都是二、三級工,平均每人插了0.29畝。此外,十隊(duì)所插的田是分布在四個不同地方,這其中距離的遠(yuǎn)近也會對工作效率產(chǎn)生影響。即便如此,當(dāng)天的勞動效率還是高于正常勞動水平。
Dm=(μ-μm)2
(4)
式中,μ和μm分別表示最小聚類中心區(qū)域與其最近的鄰聚類中心區(qū)域的平均亮度值。
圖5 視頻第20幀檢索
圖6 超像素區(qū)域?yàn)?00視頻第1幀檢索
基于超像素分割的視頻目標(biāo)檢索算法改變傳統(tǒng)的基于單像素的顏色識別方法,利用SLIC對視頻幀進(jìn)行超像素分割,然后基于超像素區(qū)域進(jìn)行識別。其具體步驟如下:
(1)加載訓(xùn)練的顏色樣本集及需要檢測的顏色;
(2)對待檢測的視頻幀利用gamma矯正進(jìn)行預(yù)處理,gamma矯正公式如下:
(5)
gamma函數(shù)為:
(6)
該函數(shù)不是唯一的。
(3)將輸入的視頻幀序列由RGB彩色空間轉(zhuǎn)為Lab彩色空間,方便后續(xù)SLIC進(jìn)行分割;
(5)對每個超像素區(qū)域進(jìn)行均值化處理,方便后續(xù)基于塊的顏色識別,每個塊只需要識別一個像素;
(6)利用馬氏距離判斷每個區(qū)域顏色是否含有所要檢測的顏色信息并進(jìn)行標(biāo)記,馬氏距離其計(jì)算公式如下公式7,檢測結(jié)果如圖3:
(7)
這里L(fēng)abi表示第i類超像素顏色值,Labhj表示顏色樣本集中第j類的第h個值。
為了驗(yàn)證算法有效性,基于VS2010和OpenCV2.4.6軟件仿真實(shí)現(xiàn),利用監(jiān)控拍攝的戶外視頻,以檢測紅色目標(biāo)為例進(jìn)行視頻目標(biāo)檢索。檢索結(jié)果如下圖4和圖5所示,其中:圖4為視頻第1幀,圖5位視頻第20幀。SLIC迭代次數(shù)為10次,初始超像素區(qū)域?yàn)?000個。
從檢索結(jié)果可以看出,選擇合適的超像素區(qū)域數(shù)視頻序列中的所有紅色目標(biāo)都可以無誤的被檢測出來,誤差較小。但是若選擇的超像素區(qū)域數(shù)過小將直接影響檢索結(jié)果,如圖6所示出現(xiàn)漏檢。
視頻目標(biāo)檢測在視頻監(jiān)控中取得了廣泛的應(yīng)用,針對視頻監(jiān)控中基于單個像素的目標(biāo)檢索方法,本文提出了一種基于圖像塊的目標(biāo)檢索算法。該算法改變傳統(tǒng)的基于單個像素的顏色目標(biāo)檢索,提出了基于圖像塊的顏色檢索算法。實(shí)驗(yàn)結(jié)果表明,本文提出的算法可以很好的檢測出視頻目標(biāo),具有較高的實(shí)用性。
但是基于超像素分割的視頻檢索算法與設(shè)定的超像素區(qū)域的大小有關(guān),若設(shè)定的區(qū)域不合適將直接影響檢索效果,如何根據(jù)視頻幀自適應(yīng)的設(shè)定超像素區(qū)域?qū)⑹俏覀兿乱徊窖芯康闹攸c(diǎn)。