李 鋼,李海芳,尚方信,郭 浩
(太原理工大學 計算機科學與技術(shù)學院,太原 030024)
圖像分割一直是圖像處理領(lǐng)域的熱點和難點,其主要目標是將圖像劃分為若干個不重疊的子區(qū)域,每一區(qū)域內(nèi)具有相同的特征。由于圖像內(nèi)容種類繁雜、特征不統(tǒng)一且易被噪聲污染,因此目前沒有一種通用的分割方法可取得較穩(wěn)定可靠的效果。文獻[1]提出活動輪廓模型,該模型與多種統(tǒng)計方法相結(jié)合,在解決各種類型圖像的分割問題中得到了較為廣泛且成功的應用,但其仍存在諸多問題。
針對上述問題,本文基于傳統(tǒng)的噪聲魯棒分割算法和圖像梯度信息,構(gòu)建一種可變形自適應鄰域的活動輪廓模型,目的是在兼顧算法效率的同時,提高疊加概率噪聲的非同質(zhì)或弱邊緣圖像分割精度。
活動輪廓模型按分割依據(jù)的不同可分為邊緣型活動輪廓模型[2]和區(qū)域型活動輪廓模型[3-5]。以測地線活動輪廓(Geodesic Active Contours,GAC)模型[2]為代表的邊緣型模型僅能處理具有明顯邊界的無噪聲簡單圖像,以C-V模型[6]為代表的區(qū)域型活動輪廓模型使用分片常數(shù)函數(shù)擬合圖像的背景和目標區(qū)域,提取目標邊緣并進行圖像分割,該模型對初始輪廓位置具有魯棒性,但其僅能分割同質(zhì)均勻圖像。針對C-V模型的不足,以局部二值擬合(Local Binary Fitting,LBF)模型[7]和局部圖像擬合(Local Image Fitting,LIF)模型[8]為代表的局部區(qū)域活動輪廓模型利用圖像局部信息進行分割,可較準確地分割灰度不均勻的圖像。但上述局部模型的能量函數(shù)是非凸的,在水平集演化過程中容易陷入局部極小值,且對輪廓初始位置敏感性較強。
很多學者在LBF、LIF的基礎(chǔ)上提出改進模型,文獻[9]將方差統(tǒng)計量引入LBF模型,通過分析每個像素鄰域的灰度分布和圖像局部高斯概率進行圖像分割,其進一步增強了局部區(qū)域活動輪廓模型對非均質(zhì)圖像的適應能力,但依然不能準確分割弱邊界性質(zhì)顯著的圖像和噪聲圖像。文獻[10]提出的LCK(Local Correntropy-based K-means)模型使用局部相關(guān)系數(shù)判別正常像素點與噪聲點,并適當降低噪聲點在運算過程中的權(quán)重以保證能量函數(shù)不被噪聲干擾,對極值噪聲(如椒鹽噪聲)具有較好的分辨能力,但該模型在強噪聲環(huán)境下會拋棄過多圖像信息,且不能準確分辨沒有顯著極值的概率噪聲(如高斯噪聲)。文獻[11]提出的模糊C聚類(Fuzzy C-Means,FCM)方法認為像素點應當對各分割子區(qū)域均具有從屬概率,不應絕對地屬于一個分割子區(qū)域。該方法可較準確地分割椒鹽噪聲圖像,但其像素點以概率形式從屬于多個子區(qū)域,在高斯噪聲和弱邊界圖像目標邊緣處易造成混淆從而導致分割失敗。文獻[12]提出一種鄰域自適應LCV模型,該模型認為圖像均勻程度應與鄰域半徑負相關(guān),其根據(jù)圖像局部灰度均值差異判斷圖像均勻程度,并自動選擇鄰域半徑。LCV模型較好地兼顧了算法性能和分割精度,可較準確地分割非均質(zhì)圖像和背景區(qū)域較復雜的圖像,但該模型只考慮了鄰域在分割曲線兩側(cè)的灰度均值差異,無法準確分割灰度均值變化不顯著的概率噪聲圖像。
上述模型都只考慮了像素灰度值與局部均值的差異,對圖像全局和局部空間內(nèi)灰度值的變化情況考慮不足,無法準確分割具有弱邊界的概率噪聲圖像,且都容易陷入局部極小值。針對該問題,本文構(gòu)建一種可變形的自適應鄰域分割模型,使用圖像梯度方向和長度引導鄰域變形,在圖像梯度值較大時,模型認為此處具有清晰的目標邊界,鄰域沿梯度方向變形,使目標邊界兩側(cè)有更多有效信息參與計算;在圖像梯度值較小時,模型認為此處是平滑區(qū)域或具有弱目標邊界,鄰域形態(tài)接近圓形,避免拋棄過多有價值的圖像信息。
LCK是一種噪聲魯棒的分割模型,其創(chuàng)新點在于引入一種基于K-means聚類方法的相關(guān)性系數(shù),用于衡量鄰域內(nèi)像素點與鄰域中心的相似程度。該相關(guān)性系數(shù)的值介于0和1之間,某一像素點處的相關(guān)性系數(shù)越接近0,說明該像素點與鄰域內(nèi)圖像內(nèi)容的相關(guān)性越低,被噪聲污染的可能性越大。
被椒鹽噪聲污染的像素點往往與其鄰域內(nèi)灰度均值相差較大,其具有較小的相關(guān)性系數(shù)。LCK模型的能量函數(shù)在計算中受噪聲點影響較小,因此,該模型對椒鹽噪聲圖像具有較好的魯棒性。LCK模型的能量函數(shù)表示為:
(1)
其中,懲罰項P(φ)使水平集函數(shù)在迭代過程中保持為符號距離函數(shù)[13],而無需重新初始化,L(φ)為曲線長度約束項,用來確保分割曲線在演化過程中保持平滑。P(φ)、L(φ)的形式如式(2)、式(3)所示。
(2)
(3)
定義在整個圖像域Ω上的水平集函數(shù)φ的梯度值φ恒為1時,懲罰項P(φ)的值最小。此時以零水平集為起點,在圖像域上任一方向每移動一個單位長度,函數(shù)值的變化量為1,即函數(shù)φ符合“符號距離函數(shù)”的定義。長度約束項L(φ)在曲線長度為0時取得最小值,對分割輪廓曲線起到類似氣球彈力的約束作用。圖像擬合項要求圖像灰度值與鄰域均值盡可能地接近。因此,在能量函數(shù)式(1)最小化的過程中,φ趨近于1,在圖像擬合項和長度約束項共同作用使分割輪廓盡可能接近目標邊界的同時,去除輪廓上多余的不平滑部分。
(4)
其中,I為圖像灰度值,μ1、μ2為圖像內(nèi)各點附近的局部灰度均值,表達式如下:
(5)
(6)
其中,wx,y為圖像域內(nèi)x、y2點間的相關(guān)性系數(shù),表達式為:
wx,y=Hε(φ)g(‖I(y)-μ1(x)‖2)+
(1-Hε(φ))g(‖I(y)-μ2(x)‖2)
(7)
(8)
該方法通過計算圖像中各像素點的灰度值與其鄰域灰度的相關(guān)性,減少水平集函數(shù)迭代過程中噪聲點對分割結(jié)果的影響,但由于該模型通過降低權(quán)重的方法處理噪聲點,在圖像包含較多噪聲時可能會拋棄過多圖像內(nèi)容,從而出現(xiàn)分割失敗的情況。
傳統(tǒng)的噪聲魯棒模型致力于減少噪聲點對能量函數(shù)的干擾,如利用圖像全局或局部的灰度統(tǒng)計特征判定噪聲點,該類模型使算法在噪聲環(huán)境下依然可以得到較為準確的分割結(jié)果,在處理灰度變化顯著的椒鹽噪聲時效果顯著,但對高斯噪聲適應能力較弱,原因是被高斯噪聲污染的像素點與原圖差別不大,傳統(tǒng)的噪聲魯棒模型無法準確分辨噪聲點。
以高斯噪聲為代表的概率分布噪聲具有良好的統(tǒng)計學性質(zhì),當噪聲服從的分布均值為0時,整幅圖像灰度均值與原圖十分接近。考慮到C-V模型是LBF模型在鄰域范圍與圖像尺寸相同時的特殊形式,可以知道分割模型的鄰域范圍越大,計算鄰域均值時考慮的像素點越多,高斯噪聲點對分割結(jié)果的影響越小,但過大的鄰域范圍將導致局部模型失去對非均質(zhì)圖像的適應能力。文獻[14]討論鄰域半徑的作用,指出鄰域半徑大小直接影響局部模型的分割精度和曲線演化速度。因此,本文在LCK模型的基礎(chǔ)上,考慮圖像梯度信息并設(shè)定更豐富的鄰域形態(tài),通過圖像內(nèi)各點的灰度梯度值和梯度方向引導鄰域變形,該方法不僅在計算鄰域均值時使盡可能多的圖像信息參與運算,提高概率噪聲的魯棒性,而且避免鄰域范圍過大對模型處理弱邊界圖像時起到的負面作用,從而提高分割精度。進一步地,引入局部相關(guān)性系數(shù),考慮鄰域內(nèi)一點與其他像素點的相關(guān)程度,避免鄰域變形過程中由拋棄過多圖像信息導致的噪聲信息干擾分割結(jié)果的問題。
如圖1所示,高斯噪聲圖像的梯度值變化較小,保留了大部分梯度信息。疊加少量椒鹽噪聲的圖像雖然不影響肉眼觀察,但噪聲點附近具有顯著的灰度變化。傳統(tǒng)的噪聲魯棒模型通過像素點與其附近灰度均值的差異程度分辨椒鹽噪聲點,但無法分辨高斯噪聲點。本文方法使用圖像梯度方向和長度信息引導鄰域變形,不依賴鄰域在分割曲線兩側(cè)的灰度均值,彌補了自適應LCV模型的不足。當圖像出現(xiàn)顯著灰度變化、梯度值較大時,本文模型認為此處是目標邊界的可能性較大,鄰域形狀變?yōu)闄E圓;當圖像局部近似均勻、梯度值較小時,橢圓偏心率變小,鄰域近似為圓形。
圖1 噪聲圖像的梯度值對比
如圖2所示,在一幅目標為白色(灰度值較大)、背景為灰色(灰度值較小)的二值圖像中取4個具有代表性的局部區(qū)域,點x位于背景或目標區(qū)域內(nèi)部時,圖像梯度值較小,鄰域形狀接近圓形;點x位于目標與背景區(qū)域交界處時,圖像梯度值較大且具有顯著的方向,此時鄰域形狀變?yōu)殚L軸方向與梯度方向一致的橢圓,橢圓偏心率與圖像梯度值正相關(guān)。
圖2 本文模型鄰域變形示意圖
本文模型核函數(shù)定義如下:
(9)
(10)
模型能量函數(shù)構(gòu)造如下:
(11)
(12)
其中,等號右側(cè)前后2項分別是鄰域內(nèi)外2側(cè)的圖像擬合項,λ1、λ2是相應的權(quán)重系數(shù),c1(x)、c2(x)表示以點x為中心的鄰域灰度均值。根據(jù)變分法和Euler-Lagrange方程,本文模型的水平集演化方程如下:
(13)
(14)
其中:
(15)
(16)
R(x)為點x間的相關(guān)性系數(shù),表達式為:
(1-Hε(φ))g(‖I(y)-c2(x)‖2)dy
(17)
運用本文模型對圖像進行分割的主要步驟如下:
1)計算圖像梯度向量的方向和大小;
2)初始化水平集函數(shù)φ;
3)初始化相關(guān)性系數(shù)Ri(x)為一個與圖像大小相同的零矩陣;
4)根據(jù)式(15)、式(16)計算c1(x)、c2(x);
5)根據(jù)式(13)、式(14)演化水平集函數(shù);
6)根據(jù)式(17)計算Ri+1(x),Ri(x):=Ri+1(x),判斷其是否滿足迭代停止條件,如果滿足,停止曲線演化;否則,重復步驟4)~步驟6)。
為驗證本文模型對弱邊界圖像及噪聲圖像的處理能力,將本文模型、LBF模型、鄰域自適應LCV模型、LCK模型、RLSF模型和FCM模型的分割結(jié)果進行對比。實驗均在Lenovo臺式機上使用MATLAB R2017a完成。如無特殊說明,本文實驗參數(shù)設(shè)置為:λ1=1,λ2=1,μ=0.003×255×255,ν=1,Δt=0.1,ε=1,m=1,n=1。
本節(jié)實驗選取5幅具有代表性的人工合成圖像,分別對其疊加等強度的高斯噪聲,然后將本文模型與其他5種活動輪廓模型的分割結(jié)果進行對比分析。為便于統(tǒng)計分析,數(shù)據(jù)集圖片分辨率均被調(diào)整為256像素×256像素,應用骰子相似系數(shù)法(DSC)[15]和分割錯誤比(RSE)與手工標注分割結(jié)果進行定量比較。DSC與RSE定義如下:
(18)
(19)
其中,Area(S)表示S區(qū)域的面積,也即包含的像素個數(shù),S1,S2分別表示模型分割結(jié)果與基準分割結(jié)果中的前景目標區(qū)域。實驗結(jié)果中,DSC值越接近1,RSE值越接近0,則模型分割結(jié)果越接近基準分割結(jié)果,模型分割精度越高。
圖3所示為6種模型對部分弱邊界圖像和高斯噪聲圖像的分割結(jié)果。其中,弱邊界圖像與分割結(jié)果展示于奇數(shù)行(A1、B1、C1、D1、E1),對應的噪聲圖像與分割結(jié)果展示于偶數(shù)行(A2、B2、C2、D2、E2)。為確保對比實驗的有效性和公平性,初始輪廓均位于圖像中心,且設(shè)定相同的分割參數(shù)。
圖3 6種模型對合成圖像的分割結(jié)果
通過觀察圖3可以發(fā)現(xiàn),所有模型均可以有效處理具有清晰邊界的人工圖像A1;LBF模型、LCK模型和RLSF模型在分割具有模糊邊界的人工圖像B1、C1時失效,這是由于該3個模型的卷積核尺寸是固定值,不能根據(jù)圖像內(nèi)容自動調(diào)整,在分割輪廓外側(cè)是面積較大的均勻區(qū)域的圖像時,模型會使能量泛函陷入局部極小值,從而導致分割失敗,但自適應LCV模型和本文模型彌補了這一缺陷。同時,對于圖像中包含多種弱邊界目標且相距較近的D1,尺寸固定的鄰域使LBF模型和LCK模型能對其進行準確分割;自適應LCV模型和本文模型在局部灰度值變化明顯時,可以自動縮小鄰域范圍,因此,分割下側(cè)白色目標時不受上側(cè)黑色目標的影響。在同時具有光照不均勻、灰度不均勻和弱邊界性質(zhì)的圖像E1上,自適應LCV模型無法進行準確分割,原因是圖像中目標邊界處灰度變化不顯著,模型在局部使用的鄰域面積過大,考慮的圖像信息過多,導致分割失敗;FCM模型對高斯噪聲的適應能力優(yōu)于自適應LCV模型,但FCM模型模糊聚類的特性使得在圖像噪聲密度較大時像素點被正確分類的概率不大,從而出現(xiàn)誤分割現(xiàn)象。值得注意的是,FCM模型在處理噪聲弱邊界圖像時,其模糊聚類機制更容易被干擾從而出現(xiàn)誤分割現(xiàn)象。本文模型考慮了圖像梯度信息,因此,其可以拋棄部分不重要的圖像信息,最終進行準確分割。
疊加高斯噪聲實驗圖片的分割結(jié)果驗證了本文模型具有較好的抗噪聲能力,LBF模型、LCK模型、RLSF模型、自適應LCV模型和FCM模型均表現(xiàn)不佳,原因是高斯噪聲點附近不具有類似椒鹽噪聲的顯著灰度變化,LCK模型的相關(guān)性系數(shù)方法無法準確分辨正常像素點和噪聲點,未使用高斯核函數(shù)的自適應LCV模型也由于灰度變化不顯著而無法準確選擇鄰域尺寸,導致分割失敗,而被高斯噪聲污染的圖片梯度值與原圖接近,因此,本文模型可以得到與無噪聲圖片相接近的分割結(jié)果。
本節(jié)實驗各模型分割結(jié)果的DSC值、RSE值如表1、圖4和圖5所示。由實驗結(jié)果可以看出,與其他模型相比,本文模型可在弱邊界圖像、高斯噪聲圖像上進行準確且穩(wěn)定的分割。
表1 6種分割模型在合成圖像上的DSC值和RSE值
圖4 合成圖像分割結(jié)果DSC值折線圖
圖5 合成圖像分割結(jié)果RSE值折線圖
在弱邊界噪聲合成圖像上進行的對比實驗證明了本文模型對該類型圖像分割的有效性,為證明本文模型在分割圖像時具有廣泛的適應性,本節(jié)實驗引入Cornell大學iCoseg自然圖像數(shù)據(jù)集[16],并對其中每幅圖片都進行散焦模糊并疊加方差為 0.2的高斯噪聲,使用與上節(jié)實驗相同的量化方法評估各模型的分割性能。圖6所示為LBF模型、LCK模型、RLSF模型、自適應LCV模型、FCM模型和本文模型在散焦的噪聲自然圖像數(shù)據(jù)集上的分割結(jié)果。
圖6 6種模型對自然圖像的分割結(jié)果
由圖6的實驗結(jié)果可以看出,采用固定尺寸卷積核的LBF模型、LCK模型受到弱邊界性質(zhì)和高斯噪聲的影響,無法根據(jù)圖像性質(zhì)和灰度分布規(guī)律自動地調(diào)整鄰域大小,LCK模型的相關(guān)性系數(shù)方法無法準確辨別高斯噪聲點,因此,這2個模型極易陷入局部極小值從而出現(xiàn)過分割或誤分割的情況。RLSF模型未使用高斯核函數(shù),較小的迭代步長使模型對弱邊界和非均值圖像具有較好的適應能力,但致使模型容易被高斯噪聲干擾,從而陷入局部極小值,最終在全圖像域上出現(xiàn)誤分割。自適應LCV模型依據(jù)鄰域兩側(cè)局部灰度均值的差異調(diào)整鄰域大小,無法在弱邊界和高斯噪聲條件下適應內(nèi)容和紋理較復雜的自然圖像,同時由于沒有使用高斯核函數(shù),因此易出現(xiàn)全局性質(zhì)的誤分割。FCM模型的模糊聚類方法無法在天空、水面等具有相對均勻但具有紋理的噪聲區(qū)域分辨噪聲點,易出現(xiàn)誤分割現(xiàn)象。本文模型根據(jù)圖像梯度引導鄰域變形,對高斯噪聲和自然圖像的背景或目標區(qū)域內(nèi)的干擾信息不敏感,從而獲得理想且穩(wěn)定的分割結(jié)果。上述分割結(jié)果的DSC值、RSE值量化對比結(jié)果如表2、圖7和圖8所示。
表2 6種分割模型在自然圖像上的DSC值和RSE值
圖7 自然圖像分割結(jié)果DSC值折線圖
圖8 自然圖像分割結(jié)果RSE值折線圖
為驗證本文模型對初始輪廓位置的弱敏感性,本節(jié)實驗在多幅人工合成噪聲圖像上設(shè)置5種初始輪廓位置,分別位于圖像的四角和中部,本文模型對其的分割結(jié)果如圖9所示。
圖9 本文模型在不同初始輪廓下的分割結(jié)果
由圖9可以看出,初始輪廓與待分割目標輪廓的拓撲關(guān)系對最終分割結(jié)果的影響不顯著,即無論初始輪廓是否與目標輪廓存在交叉重疊關(guān)系,模型在噪聲環(huán)境下均可進行準確分割,且分割結(jié)果具有穩(wěn)定性和一致性。本文模型使用圖像梯度信息引導鄰域變形,允許真正包含目標邊界信息的像素點參與計算,且拋棄掉少量無關(guān)的像素信息,因此,其對初始輪廓具有較好的魯棒性。
本文構(gòu)建一種基于圖像梯度信息的鄰域自適應分割模型,由于基于圖像梯度建立鄰域變形機制,目標邊界較清晰,因此與自適應LCV模型、LCK模型和FCM模型相比,該模型可以準確分割高斯噪聲圖像,且在圖像具有弱邊界和非均質(zhì)性質(zhì)時依然可以保持良好的有效性和分割精度。本文模型引入了新的模型參數(shù),實現(xiàn)參數(shù)設(shè)置自動化將是下一步著力解決的問題。
[1] KASS M,WITKIN A P,TERZOPOULOS D,et al.Snakes:active contour models[J].International Journal of Computer Vision,1988,1(4):321-331.
[2] CASELLES V,KIMMEL R,SAPIRO G.Geodesic active contours[J].International Journal of Computer Vision,1997,22(1):61-79.
[3] 陳 雷.基于活動輪廓模型的圖像分割算法研究[D].濟南:山東大學,2013.
[4] 李 磊.圖像分割研究現(xiàn)狀概述[J].信息技術(shù)與信息化,2015(3):85-87.
[5] MUMFORD D,SHAH J.Optimal approximations by piecewise smooth functions and associated variational problems[J].Communications on Pure and Applied Mathematics,1989,42(5):577-685.
[6] CHAN T F,VESE L A.Active contour without edges[J].IEEE Transactions on Image Processing,2001,10(2):266-277.
[7] LI C,KAO C Y,GORE J C,et al.Implicit active contours driven by local binary fitting energy[C]//Proceedings of 2007 IEEE Conference on Computer Vision and Pattern Recognition.Washington D.C.,USA:IEEE Press,2007:1-7.
[8] ZHANG K,SONG H,ZHANG L.Active contours driven by local image fitting energy[J].Pattern Recognition,2010,43(4):1199-1206.
[9] WANG L,HE L,MISHRA A,et al.Active contours driven by local Gaussian distribution fitting energy[J].Signal Processing,2009,89(12):2435-2447.
[10] WANG L,PAN C.Robust level set image segmentation via a local correntropy-based K-means clustering[J].Pattern Recognition,2014,47(5):1917-1925.
[11] JIANG X L,WANG Q,HE B,et al.Robust level set image segmentation algorithm using local correntropy-based fuzzyc-means clustering with spatial constraints[J].Neurocomputing,2016,207(C):22-35.
[12] 廖祥云,袁志勇,鄭 奇,等.引入局部全局信息的區(qū)域自適應局域化快速活動輪廓模型[J].計算機學報,2016,39(7):1464-1476.
[13] LI C,XU C,GUI C,et al.Level set evolution without re-initialization:a new variational formulation[C]//Proceedings of IEEE Computer Society Conference on Computer Vision and Pattern Recognition.Washington D.C.,USA:IEEE Press,2005:430-436.
[14] LIAO X,YUAN Z,ZHENG Q,et al.Multi-scale and shape constrained localized region-based active contour segmentation of uterine fibroid ultrasound images in HIFU therapy[J].PLOS One,2014,9(7).
[15] DIETENBECK T,ALESSANDRINI M,FRIBOULET D,et al.Creaseg:a free software for the evaluation of image segmentation algorithms based on level-set[C]//Proceedings of IEEE International Conference on Image Processing.Washington D.C.,USA:IEEE Press,2010:665-668.
[16] BRATRA D,KOWDLE A,PARIKH D,et al.iCoseg:interactive cosegmentation by touch[EB/OL].[2017-09-25].http://chenlab.ece.cornell.edu/projects/touch-coseg /index.html.