胡涵菲
關(guān)鍵詞:超像素分割;Mean Shift 分水嶺;最大相似性原理;目標(biāo)提取
中圖分類號:TP18 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號:1009-3044(2023)14-0025-04
1 總體方案設(shè)計(jì)
1.1 功能模塊的劃分
一般圖像中的顏色與形狀特征較為復(fù)雜,很難實(shí)現(xiàn)目標(biāo)物的全自動(dòng)提取。本文結(jié)合圖像分割的基本原理,采用與用戶交互式的半自動(dòng)分割方法,將系統(tǒng)分為對原始圖像的初步分割和對分割后的圖像進(jìn)行相似度合并兩部分,最后得到目標(biāo)提取結(jié)果圖像。
在像素分割模塊中,通過按鈕選擇原始圖像進(jìn)行分割程序,并將分割后的圖像結(jié)果單獨(dú)保存;在目標(biāo)提取模塊中,將原始圖像和分割圖像作為輸入,再通過畫筆粗略地標(biāo)記目標(biāo)對象和背景的位置,分割塊合并結(jié)束后,目標(biāo)對象的邊緣被標(biāo)記出,即完成提取。圖片在各功能模塊的輸入輸出流程如圖1所示。
1.2 主要實(shí)現(xiàn)功能的原理
1.2.1 基于Mean Shift 的圖像初始分割
Mean Shift算法是指一個(gè)迭代計(jì)算的步驟,即先算出當(dāng)前點(diǎn)的偏移均值,再移動(dòng)該點(diǎn)到其偏移均值,然后以此為新的起始點(diǎn)繼續(xù)移動(dòng),直到滿足一定的條件后結(jié)束迭代[1]。Comaniciu等人把Mean Shift算法成功地運(yùn)用到特征空間的分析,在圖像分割中取得了很好的效果。此外,基于Mean Shift算法的圖像分割結(jié)果中過度分割較少,可以很好地保持目標(biāo)邊界。
Mean Shift圖像分割算法的輸入可以是灰度圖像或彩色圖像,用戶唯一需要調(diào)整的參數(shù)是分析的分辨率[1]。基于該算法的圖像分割是間斷保持平滑算法的前向擴(kuò)展,每個(gè)像素都與位于其鄰域內(nèi)的聯(lián)合域密度的顯著模式相關(guān)聯(lián),在對相鄰模式進(jìn)行修剪后,生成圖像區(qū)域分割結(jié)果。
1.2.2 基于最大相似度的區(qū)域合并
在Mean Shift分割圖像的基礎(chǔ)上,基于最大相似度的區(qū)域合并(MSRM)機(jī)制進(jìn)行區(qū)域合并,從而實(shí)現(xiàn)目標(biāo)對象的輪廓提取。MSRM能夠自適應(yīng)圖像內(nèi)容,不需要一個(gè)預(yù)設(shè)的閾值[2],其原理為:如果在所有R的相鄰區(qū)域中,Q與其相似性最高,則將區(qū)域R與其相鄰區(qū)域Q合并[3]。
通過使用筆畫來粗略地標(biāo)記目標(biāo)對象和背景的位置后,該方法在標(biāo)記的幫助下將Mean Shift分割的超像素按照是否被標(biāo)記背景區(qū)域自動(dòng)合并,非標(biāo)記對象區(qū)域也將被識(shí)別,從而避免與背景合并。一旦所有的非標(biāo)記區(qū)域都被標(biāo)記出來,然后就可以很容易地從背景中提取出物體的輪廓。
2 各個(gè)功能模塊的實(shí)現(xiàn)原理
2.1 Mean Shift 圖像分割算法流程
通過Mean Shift 算法進(jìn)行圖像分割包括兩個(gè)步驟:模點(diǎn)搜索和合并相似區(qū)域。通過模點(diǎn)搜索找到每個(gè)數(shù)據(jù)點(diǎn)的類中心,并以中心的顏色代替自己的顏色,以此來實(shí)現(xiàn)圖像平滑。但通過搜索得到的模點(diǎn)太多,且模點(diǎn)間距離較近,如果將每個(gè)模點(diǎn)都作為一類會(huì)導(dǎo)致類別太多,容易產(chǎn)生過分割,因此模點(diǎn)搜索后需要進(jìn)行相似區(qū)域合并。
不斷重復(fù)步驟Step 1—Step 4,集合MB 覆蓋區(qū)域逐漸擴(kuò)大,非標(biāo)記區(qū)域N 的數(shù)量越來越少,當(dāng)整個(gè)標(biāo)記背景區(qū)域MB 找不到新的合并對象時(shí),迭代停止。第一階段的區(qū)域合并后,一些非標(biāo)記的背景區(qū)域與相應(yīng)的背景標(biāo)記合并;仍有一些非標(biāo)記的背景區(qū)域由于彼此之間的相似性得分高于與標(biāo)記的背景區(qū)域之間的相似性得分,因此未合并到背景集合中。圖3(b)顯示在第一階段合并后,許多屬于背景的區(qū)域的房子已合并,但仍有一些非標(biāo)記的背景區(qū)域剩余。
循環(huán)執(zhí)行這兩個(gè)合并階段,直到?jīng)]有新的合并發(fā)生。一般圖片的合并算法基本在2-3輪內(nèi)結(jié)束,當(dāng)所有區(qū)域被標(biāo)記為提取目標(biāo)或背景后,通過只提取目標(biāo)區(qū)域可以很容易地得到物體的輪廓,如圖3(d)所示。
3 測試和調(diào)試
對六個(gè)測試圖像的像素分割和目標(biāo)提取結(jié)果如圖4所示,第一列為原始圖像,第二列為Mean Shift初始分割結(jié)果,第三列顯示感興趣目標(biāo),并用白色線條勾勒出其輪廓。
由于圖像合并時(shí)根據(jù)區(qū)域間的RGB顏色直方圖計(jì)算區(qū)域間的相似度,因此目標(biāo)對象顏色與背景顏色差異越大,合并效果也就越好。例如示例1、4、6,只需通過一筆標(biāo)注就可以實(shí)現(xiàn)目標(biāo)區(qū)域的準(zhǔn)確提取。對于示例2、3,目標(biāo)區(qū)域有部分像素塊的顏色與背景差異較小,需要對這些差異較小的區(qū)域著重標(biāo)記,才能較好地實(shí)現(xiàn)分割。示例5的分割效果不好,由于左前車輪的顏色與影子顏色太過相近,在像素分割時(shí)直接被劃分到同一區(qū)域,因而在區(qū)域合并時(shí),最終提取的目標(biāo)輪廓也包含影子部分??梢酝ㄟ^其他的分割方法對示例5進(jìn)行更細(xì)致的分割,或者手動(dòng)進(jìn)行圖像分割,或許可以將影子與車輪分割開來。
4 總結(jié)與反思
初始分割是目標(biāo)提取的基礎(chǔ),若是分割得太過細(xì)碎會(huì)導(dǎo)致合并效率降低,也會(huì)導(dǎo)致提取效果不太好。通過對比常用分割方法的效果發(fā)現(xiàn),Mean Shift方法通過迭代產(chǎn)生規(guī)則形狀的超像素,但不能控制超像素的數(shù)量、大小;SLIC方法基于顏色和距離相似性進(jìn)行的超像素分割,可以產(chǎn)生大小均勻、形狀規(guī)則的超像素;N-cut方法利用輪廓特征和紋理特征來全局最小化代價(jià)函數(shù),可控制數(shù)量且形狀規(guī)整緊湊,但圖邊界效果不好[5]。考慮到MeanShift方法可以規(guī)則提取物體邊緣且分割塊較少,最終選擇該方法進(jìn)行圖像分割。在超像素合并階段,寧紀(jì)鋒教授提出的最大相似度區(qū)域合并方法較為經(jīng)典,在MSRM合并算法的基礎(chǔ)上進(jìn)行了復(fù)雜度的簡化,并對合并效果進(jìn)行了測試。對提取結(jié)果進(jìn)行分析后發(fā)現(xiàn)改進(jìn)效果較好,可以有效提取出感興趣目標(biāo)物。