(中國(guó)民用航空飛行學(xué)院空中交通管理學(xué)院,四川 廣漢 618307)
圖像分割是將圖像劃分為若干個(gè)具有獨(dú)特性質(zhì)區(qū)域的過(guò)程,在計(jì)算機(jī)視覺(jué)領(lǐng)域諸多分支中獲取了廣泛的應(yīng)用[1]。在對(duì)遙感圖像的分析過(guò)程中,分割方法應(yīng)該考慮數(shù)據(jù)采集方面的信息,諸如光譜和空間分辨能力等[2]。作為一種無(wú)監(jiān)督學(xué)習(xí)算法,模糊C均值(fuzzy c-means,FCM)在圖像分割領(lǐng)域獲取了廣泛的成功,其通常比硬聚類(lèi)算法更加靈活。盡管傳統(tǒng)的FCM因其完美的數(shù)學(xué)理論在諸多方面尤其是圖像分割領(lǐng)域得到了廣泛的應(yīng)用[3-15],然而在圖像分割過(guò)程中該方法亦存在對(duì)初始聚類(lèi)中心敏感以及對(duì)噪聲魯棒性不強(qiáng)等問(wèn)題。
為了克服傳統(tǒng)FCM算法在圖像分割中噪聲魯棒性差的問(wèn)題,許多學(xué)者利用圖像空間信息對(duì)FCM進(jìn)行了改進(jìn),使得圖像分割性能大大提高[3-8]??紤]到傳統(tǒng)的FCM沒(méi)有結(jié)合分析圖像的形狀等先驗(yàn)知識(shí),Ahmed等通過(guò)引入鄰域信息提出了基于空間信息的FCM算法(Fuzzy clustering with spatial constraints, FCMS),克服了傳統(tǒng)方法對(duì)異常點(diǎn)敏感的局限性[3]。FCMS方法計(jì)算復(fù)雜度較高,尤其是處理尺寸較大時(shí)相當(dāng)費(fèi)時(shí)。鑒于FCMS方法運(yùn)算復(fù)雜度高的問(wèn)題,Chen和Zhang等[4]利用均值濾波和中值濾波對(duì)FCMS進(jìn)行了優(yōu)化,提出了FCM_S1和FCM_S2算法降低了計(jì)算復(fù)雜度。文獻(xiàn)[6]基于核函數(shù),通過(guò)對(duì)FCM的各個(gè)模塊進(jìn)行獨(dú)立賦值,提出了基于領(lǐng)域信息的核廣義模糊均值聚類(lèi)算法(Kernel generalized fuzzy c-means clustering with spatial information, KGFCMS),提升了圖像分割性能。Yang等[10]通過(guò)引入單一數(shù)據(jù)點(diǎn)至隸屬度函數(shù)提出了一種新的目標(biāo)函數(shù),提高了圖像分割過(guò)程中抗噪聲能力。文獻(xiàn)[12]利用領(lǐng)域灰度異質(zhì)結(jié)構(gòu)和上下文信息提出了自適應(yīng)約束的核模糊C均值(adaptively regularized kernel-based fuzzy-means clustering, ARKFCM)方法。未解決FCM方法魯棒性問(wèn)題,Tao等[14]基于形態(tài)學(xué)重構(gòu)和隸屬度函數(shù)濾波提出了快速魯棒模糊C均值方法(fast and robust fuzzy c-means clustering, FRFCM)方法,大大提高了圖像分割性能,F(xiàn)RFCM被證明為當(dāng)前最優(yōu)的圖像分割算法。
盡管基于FCM的系列優(yōu)化算法在圖像分割領(lǐng)域中已經(jīng)表現(xiàn)出了良好的性能,但是邊緣保持和去噪仍是待解決的問(wèn)題。利用FCM對(duì)圖像分割的主要困難在于這類(lèi)方法對(duì)噪聲非常敏感并且難以保持清晰的圖像邊緣[4,7-9]。濾波技術(shù)已廣泛用于計(jì)算機(jī)圖形、圖像和視覺(jué)等諸多領(lǐng)域。其中,導(dǎo)向?yàn)V波器[16]是用于邊緣保持平滑的一種優(yōu)秀方法,該濾波器的優(yōu)點(diǎn)在于邊緣保持平滑的計(jì)算復(fù)雜度不依賴(lài)于濾波器尺寸。導(dǎo)向?yàn)V波器可以有效地平滑區(qū)域噪聲,并產(chǎn)生視覺(jué)上令人滿(mǎn)意的邊緣輪廓。相對(duì)于雙邊濾波器,導(dǎo)向?yàn)V波器在邊緣附近能得到更好的輸出。因此,導(dǎo)向?yàn)V波器現(xiàn)已成為圖像處理、特征提取和目標(biāo)識(shí)別等計(jì)算機(jī)視覺(jué)應(yīng)用領(lǐng)域的重要技術(shù)。考慮到分割任務(wù)之一是抑制噪聲并強(qiáng)化重要結(jié)構(gòu)特征,在圖像分割處理中本文通過(guò)結(jié)合空間信息將導(dǎo)向?yàn)V波引入到FCM的目標(biāo)函數(shù)中來(lái)進(jìn)行模糊聚類(lèi)。如果導(dǎo)向?yàn)V波器可以有效地抑制梯度翻轉(zhuǎn)導(dǎo)致的偽像并產(chǎn)生良好的視覺(jué)邊緣輪廓,本文認(rèn)為利用該濾波技術(shù)FCM在分割圖像時(shí)可以獲得更準(zhǔn)確的圖像分割。同時(shí),考慮到圖像分割的性能在一定程度上依賴(lài)于初始的聚類(lèi)數(shù)目和聚類(lèi)中心,本文利用均值漂移算法[17]選取合適的聚類(lèi)數(shù)目作為參考。與當(dāng)前主流方法KGFCMS、RFCM、ARKFCM和FRFCM對(duì)比,實(shí)驗(yàn)結(jié)果證明了本文所提算法的有效性。
本文的其余部分安排如下。文中的第二部分描述了一些相關(guān)工作基礎(chǔ)。第三部分詳細(xì)介紹了本文所提的圖像分割算法。第四部分給出了該算法的實(shí)驗(yàn)結(jié)果。最后一部分對(duì)本文進(jìn)行了總結(jié)。
(1)
(2)
最小化目標(biāo)函數(shù):
(3)
可以獲得J的局部最小值。在上式中,m是大于1的實(shí)數(shù),‖·‖代表歐幾里德范數(shù)。
FCM是一種自動(dòng)對(duì)圖像數(shù)據(jù)進(jìn)行聚類(lèi)的方法,其本質(zhì)上利用歐幾里德范數(shù)計(jì)算像素點(diǎn)與聚類(lèi)中心的隸屬度,進(jìn)而判別每個(gè)像素點(diǎn)屬于各個(gè)模式的程度。與引入模糊劃分相適應(yīng),F(xiàn)CM引入的模糊隸屬度介于0和1之間,所以其比硬聚類(lèi)分析更加靈活地分析圖像的不確定性和復(fù)雜性。
FCM算法進(jìn)行聚類(lèi)時(shí)僅考慮了像素的特征向量而忽略了相鄰像元間具有空間關(guān)系,有鑒于此Ahmed等人[3]利用圖像空域信息約束作為懲罰函數(shù)FCM 算法進(jìn)行了優(yōu)化和改進(jìn),提出FCM_S方法以提高圖像分割性能。但FCM_S方法在每一次迭代過(guò)程中需要計(jì)算一次鄰域項(xiàng),算法的時(shí)間復(fù)雜度較高。為解決FCM_S 算法復(fù)雜度高和精確性不足問(wèn)題,Chen等人[4]在此基礎(chǔ)上通過(guò)引入鄰域均值和鄰域中值濾波代替鄰域項(xiàng),提出了FCM_S1和FCM_S2算法,得到了廣泛的應(yīng)用。本文采用基于鄰域均值的FCM_S1算法,其目標(biāo)函數(shù)如下:
(4)
其中,α是控制圖像非局部均值濾波項(xiàng)的參數(shù)。以類(lèi)似于傳統(tǒng)的FCM算法, 利用拉格朗日乘子法對(duì)公式(4)的目標(biāo)函數(shù)J求極小值,可求得聚類(lèi)中心和隸屬度更新公式:
(5)
(6)
盡管FCM_S1/2方法較好地融合了領(lǐng)域信息,相對(duì)于FCM以及FCM_S實(shí)現(xiàn)了在分割性能以及運(yùn)算速度方面的提升,但該方法亦存在缺乏對(duì)圖像邊界的平滑約束、對(duì)抗圖像區(qū)域強(qiáng)背景噪聲以及對(duì)初始聚類(lèi)中心敏感等問(wèn)題。
導(dǎo)向?yàn)V波器[16]定義為局部線(xiàn)性濾波過(guò)程, 包括引導(dǎo)圖像I、輸入圖像p和輸出圖像q。導(dǎo)向?yàn)V波器的關(guān)鍵假設(shè)是q和I為局部線(xiàn)性關(guān)系:
qi=akIi+bk, ?i∈wk,
(7)
式中,i是像素的索引,wk為以像素k為中心半徑為r的窗口。為了確定線(xiàn)性系數(shù)(ak,bk),建立目標(biāo)函數(shù)E(ak,bk)在窗口wk中最小化q和濾波器輸入p的差值:
(8)
其中:ε是控制平滑度的正則化參數(shù)。公式(8)的結(jié)果可以通過(guò)下面的線(xiàn)性回歸得到:
(9)
(10)
這里,μk和σk分別為窗口k中I的均值和方差?;谏鲜?,導(dǎo)向?yàn)V波器的輸出結(jié)果為:
(11)
圖1為導(dǎo)向?yàn)V波的過(guò)程,對(duì)輸入圖像p和輸出圖像q建立圖中模型可提取圖像中諸如噪聲等非感興趣信息n。
圖1 導(dǎo)向?yàn)V波的過(guò)程[16]。
均值漂移算法[17]的關(guān)鍵思想是其自適應(yīng)地尋找概率密度極大值的估計(jì)方法,不需要任何先驗(yàn)知識(shí)。具體利用感興趣區(qū)內(nèi)數(shù)據(jù)密度變化計(jì)算和搜尋中心點(diǎn)的漂移向量,通過(guò)迭代移動(dòng)中心點(diǎn)直到到達(dá)密度最大處,進(jìn)而得到感興趣區(qū)域內(nèi)的數(shù)據(jù)的次數(shù)。對(duì)于給定d維空間Rd中的n個(gè)樣本點(diǎn)X={x1,x2,…,xn},基于高斯核的均值漂移向量形式為:
(12)
新漂移中心為:
(13)
均值漂移算法本質(zhì)上即為在每次迭代的時(shí)候求解一個(gè)向量,使得圓心向數(shù)據(jù)集密度最大的方向移動(dòng)進(jìn)而與局部極值點(diǎn)重合,圖2對(duì)這一過(guò)程進(jìn)行了描述。
圖2 均值漂移過(guò)程描述(圖片來(lái)源:http://www.cse.psu.edu/~rtc12/CSE598G/introMeanShift.pdf)。
以均值漂移算法選定的初始聚類(lèi)中心作為參考,本文通過(guò)結(jié)合空間信息和導(dǎo)向?yàn)V波提出了基于均值漂移和空間信息的導(dǎo)向模糊C均值聚類(lèi)方法(Guided fuzzy c-means clustering with spatial information, GFCM_MS),旨在消除噪聲和保持邊緣細(xì)節(jié)?;贔CM_S1方法,通過(guò)迭代更新聚類(lèi)中心V=[vj]和隸屬函數(shù)U={uik}:
(14)
(15)
最小化GFCM_MS目標(biāo)函數(shù):
(16)
相對(duì)于其他FCM系列圖像分割算法,本文所提出的GFCM_MS具有如下優(yōu)勢(shì):
1)GFCM_MS的優(yōu)良邊緣保持特性,通過(guò)實(shí)現(xiàn)圖像邊界的平滑約束得到了光滑的分割邊界,使得不連續(xù)的原本屬于同一類(lèi)像素點(diǎn)聚連一起形成具有實(shí)際意義的子圖;
2)GFCM_MS對(duì)噪聲的魯棒性,劃分空間推廣到可能性劃分空間可實(shí)現(xiàn)強(qiáng)噪聲背景下圖像的理想分割效果(詳見(jiàn)實(shí)驗(yàn)結(jié)果);
3)GFCM_MS利用均值漂移初始化了聚類(lèi)中心,迭代次數(shù)少、計(jì)算復(fù)雜度小、收斂速度快,進(jìn)而較好地降低了算法陷入局部最優(yōu)的可能性。
本章提出的GFCM_MS算法的步驟如表1所示。
表1 GFCM_MS算法的步驟
為了對(duì)GFCM_MS算法的性能進(jìn)行評(píng)估,本文考慮了RFCM[10]、KGFCMS[6]、ARKFCM[12]和FRFCM[14]方法,并建立了對(duì)比實(shí)驗(yàn),數(shù)據(jù)集包括1個(gè)合成圖像和3個(gè)真實(shí)圖像。本文使用分割精度(segmentation accuracy, SA)[8]作為評(píng)估指標(biāo),分割精度SA定義為所有分類(lèi)正確像素點(diǎn)數(shù)目與所有像素點(diǎn)數(shù)目比值:
(17)
其中:c為聚類(lèi)數(shù)目,Ai表示屬于第i類(lèi)的像素的數(shù)目,Ci表示表示實(shí)際中屬于第i類(lèi)的像素的數(shù)目。
在本節(jié)中,本文利用合成圖像對(duì)算法的圖像分割性能進(jìn)行評(píng)估,該合成圖像包含4個(gè)模式。使用合成圖像來(lái)驗(yàn)證分割方法性能的優(yōu)點(diǎn)在于合成數(shù)據(jù)包括了圖像實(shí)際模式以及噪聲參數(shù)控制等的先驗(yàn)信息。
圖3 加噪合成圖像(方差為0.01高斯噪聲)的分割結(jié)果比較
圖4 加噪合成圖像(方差為0.02高斯噪聲)的分割結(jié)果比較
圖5 加噪合成圖像(方差為0.05高斯噪聲)的分割結(jié)果比較
圖3~5分別顯示了各方法對(duì)加噪合成圖像(分別加入方差為0.01、0.02和0.05高斯噪聲)的分割結(jié)果。從圖中可以看到,RFCM、KGFCMS、ARKFCM和FRFCM對(duì)噪聲較為敏感,不同區(qū)域邊界模糊,錯(cuò)分點(diǎn)較多。在GFCM_MS所實(shí)現(xiàn)的結(jié)果中,錯(cuò)分點(diǎn)很少,區(qū)域邊界比較清晰,因此該算法對(duì)高斯噪聲具有魯棒性,得到了滿(mǎn)意的分割結(jié)果。表2給出了不同方法對(duì)加噪合成圖像分割所得到的分割精度SA。由表中的SA可以看出,F(xiàn)RFCM方法表現(xiàn)出較高的精度,但該方法隨著噪聲強(qiáng)度的增加其分割精度逐步下降。GFCM_MS對(duì)不同強(qiáng)度噪聲表現(xiàn)出很好的魯棒性,較大程度上抑制圖像中噪聲,分割精度始終保持>0.94。綜合圖3~5和表2,GFCM_MS分割性能明顯優(yōu)于其他方法。
表2 不同方法對(duì)加噪合成圖像分割所得到的分割精度SA
圖6顯示了不同方法對(duì)遙感圖像(航空港)分割結(jié)果。由圖6可以看出,RFCM、ARKFCM和FRFCM對(duì)不同區(qū)域進(jìn)行了一定的保持,但由于受噪聲影響這三個(gè)方法在聚類(lèi)區(qū)域內(nèi)部都或多或少地出現(xiàn)了孤立的噪聲點(diǎn)。而GFCM_MS方法對(duì)兩個(gè)區(qū)域進(jìn)行了較好的保持,分割的區(qū)域均勻性良好而且區(qū)域之間的邊界清晰,沒(méi)有孤立的像素點(diǎn)。
圖6 遙感圖像(機(jī)場(chǎng))的分割結(jié)果
不同方法對(duì)遙感圖像(橋梁)的分割結(jié)果如圖7所示。圖中的目標(biāo)區(qū)域橋梁,屬于“細(xì)長(zhǎng)”模式。從視覺(jué)角度,RFCM、KGFCMS、ARKFCM和FRFCM沒(méi)有很好地實(shí)現(xiàn)對(duì)圖像的分類(lèi),橋梁與水域部分產(chǎn)生了較大的混疊,錯(cuò)分比較嚴(yán)重,對(duì)橋梁這種“細(xì)長(zhǎng)”模式無(wú)法實(shí)現(xiàn)正確的聚類(lèi)連接。由于GFCM_MS引入了導(dǎo)向?yàn)V波信息和空間信息,使得分割結(jié)果在保持大量圖像細(xì)節(jié)的同時(shí)獲得比較干凈的同質(zhì)分割區(qū)域,橋梁和水域之間不存在其他方法所得到的錯(cuò)分問(wèn)題,獲得了令人滿(mǎn)意的分割結(jié)果。
圖7 遙感圖像(橋梁)的分割結(jié)果
圖8展現(xiàn)了不同方法對(duì)遙感圖像(河流)的分割結(jié)果。在該測(cè)試圖像中,RFCM、KGFCMS和ARKFCM方法對(duì)河流、陸地和冰川3個(gè)區(qū)域的分割中,存在大量的錯(cuò)分。相對(duì)于RFCM、KGFCMS和ARKFCM,F(xiàn)RFCM方法給予了較好的劃分,不同區(qū)域邊界相對(duì)清晰。而本文所提出的GFCM_MS則保持了清晰的圖像邊緣以及更多的細(xì)節(jié),圖像分割更加準(zhǔn)確,盡管有若干孤立的像素,但其區(qū)域均勻性和邊界定位都令人滿(mǎn)意。
圖8 遙感圖像(河流)上的分割結(jié)果
圖9比較了不同方法對(duì)遙感圖像(航空器)的分割結(jié)果。RFCM、FRFCM和GFCM_MS在對(duì)該測(cè)試圖像的分割中獲取了較為清晰的邊界。相對(duì)于RFCM和FRFCM,GFCM_MS機(jī)翼和垂直翼之間的機(jī)身邊界定位更加準(zhǔn)確。
圖9 遙感圖像(航空器)上的分割結(jié)果
圖像分割是計(jì)算機(jī)視覺(jué)領(lǐng)域的一個(gè)重要問(wèn)題,模糊聚類(lèi)因其特有的描述形式比其他傳統(tǒng)的分割算法更具優(yōu)勢(shì),因此得到了廣泛的應(yīng)用。本文提出了一種有效的遙感圖像分割方法,該方法較好地結(jié)合了聚類(lèi)分析和導(dǎo)向?yàn)V波技術(shù)對(duì)圖像分割的優(yōu)勢(shì):一方面,該方法較好地對(duì)聚類(lèi)的圖像邊界進(jìn)行了平滑約束,獲得了平滑和封閉的分割邊界;另一方面,該方法因其對(duì)噪聲的魯棒性,提高了強(qiáng)噪聲背景下圖像分割的準(zhǔn)確度;最后,通過(guò)結(jié)合均值漂移所導(dǎo)出的初始聚類(lèi)中心,降低了算法陷入局部最優(yōu)的概率?;趯?dǎo)向?yàn)V波技術(shù),本文所提出的方法通過(guò)結(jié)合均值漂移和空間信息,使得像素在組合的特征空間中得到更加準(zhǔn)確的表達(dá)。實(shí)驗(yàn)結(jié)果表明,本文所提出的方法提升了圖像結(jié)構(gòu)被噪聲損壞的分割準(zhǔn)確度,該算法所得到的測(cè)試結(jié)果在可接受范圍之內(nèi)。本文的后續(xù)工作將圍繞復(fù)雜場(chǎng)景分類(lèi)問(wèn)題開(kāi)展研究。