李 力,陳息坤
(1. 廣東科學技術職業(yè)學院 物聯(lián)網(wǎng)工程學院,廣東 廣州 510640;2. 上海大學 機電工程與自動化學院,上海 200444)
圖像分割是根據(jù)像素之間的相似度(包括亮度、顏色和紋理等)將數(shù)字圖像分為若干個像素組,從而簡化后續(xù)分析的過程[1-3]。近年來,針對不同的應用場合,出現(xiàn)了多種圖像分割算法,如閾值法、區(qū)域劃分法、邊緣檢測法和深度學習方法等[4-6]。在真實環(huán)境中,由于采集和轉換過程中的噪聲干擾、圖像的質(zhì)量下降,用上述方法難以產(chǎn)生有效的分割結果。比如面對噪聲時,閾值法出現(xiàn)目標和背景混疊的現(xiàn)象,區(qū)域劃分法產(chǎn)生過分割和欠分割,邊緣檢測法分割的結果邊緣貼合度差,難以滿足實際需求,基于深度學習的方法需要大量的噪聲圖像的學習樣本訓練模型,復雜度和成本較高。模糊C-均值(Fuzzy C-means,FCM)聚類算法[7]是一種無監(jiān)督訓練算法,因其不需要提前訓練樣本、算法結構簡單和聚類效果好等優(yōu)點被廣泛應用于圖像分割領域。
由于傳統(tǒng)FCM聚類算法未考慮圖像的空間信息,因此對噪聲較為敏感,為提高傳統(tǒng)FCM算法的魯棒性和有效性,已經(jīng)提出許多FCM變體算法以實現(xiàn)更好的性能。目前對于FCM算法的改進大致可分為以下4種:① 基于局部空間信息的FCM算法,該方法考慮了中心像素以外的其他鄰域像素,提高了算法的魯棒性,如模糊局部信息C-均值算法(FLICM)[8]、基于空間約束和偏差校正的模糊C-均值算法(BCEFCM_S)[9]和基于空間約束和隸屬度鏈接的模糊C-均值算法(FCM_SICM)[10];② 基于直方圖的方法,該方法將聚類過程由原始圖像轉換為在直方圖上進行聚類,提高了算法的時間效率,如增強型模糊C-均值算法(EnFCM)[11]、快速廣義模糊C-均值算法(FGFCM)[12]和快速超像素模糊C-均值算法(SFFCM)[13];③ 基于區(qū)域級信息的FCM算法,該方法通過考慮更多的圖像冗余信息以提高算法的魯棒性,如基于區(qū)域信息和均值隸屬度鏈接的模糊子空間聚類算法(FSC_LNML)[14]、區(qū)域級信息模糊C-均值算法(RLFCM)[15]和自適應區(qū)域級模糊C-均值算法(FALRCM)[16];④ 基于特征加權的FCM算法,該方法主要通過考慮圖像的多個特征以加強對彩色圖像的分割性能,如特征和聚類加權模糊C-均值算法(FWCW_FCM)[17]、聚類加權和組特征加權的模糊C-均值算法(CGFFCM)[18]。
雖然上述算法提高了對噪聲的魯棒性,但其局部空間信息或區(qū)域級信息與聚類中心的距離采用歐式距離進行計算。盡管此度量方法在計算上很簡單,但是,在分割已被噪聲、離群值或其他圖像偽影損壞的圖像時,使用歐氏距離可能會產(chǎn)生不穩(wěn)健的結果,因此需要有一種新的度量方法代替歐氏距離,提高算法的魯棒性。核度量方法由此引入,基于核函數(shù)的模糊C-均值算法(KWFLICM)[19]在FLCM的基礎上用核度量方法代替歐氏距離,分割性能顯著提高。該算法雖然能對噪聲圖像進行有效分割,但其對局部空間的約束參數(shù)無法進行自適應選擇,且聚類結果出現(xiàn)過分割現(xiàn)象,影響分割精度。
本文提出一種基于空間信息的模糊C-均值噪聲圖像分割算法。首先,將區(qū)域級信息加入FCM目標函數(shù)中,并用核度量方法代替?zhèn)鹘y(tǒng)歐氏距離,計算區(qū)域級空間信息與聚類中心的距離,提高算法對噪聲的魯棒性;其次,用原始圖像與區(qū)域級空間信息絕對差的倒數(shù)和它本身來約束原始圖像和區(qū)域信息項,實現(xiàn)約束項參數(shù)自適應選擇;最后,利用連通分量濾波,消除聚類結果中出現(xiàn)的過分割現(xiàn)象,提高分割精度。
傳統(tǒng)FCM聚類算法通過反復迭代,使目標函數(shù)達到最小,將圖像I中的N個像素指定為K類:
(1)
式中:ci為第i個聚類簇的中心,uij為第j個像素屬于第i個聚類簇的隸屬度,m為隸屬度權重指數(shù),通常設置為2。通過拉格朗日數(shù)乘法,式(1)通過式(2)和式(3)最小化:
(2)
(3)
傳統(tǒng)FCM沒有考慮局部空間信息,對噪聲比較敏感,為了增強算法對噪聲的魯棒性,將局部空間信息引入FCM目標函數(shù)中。但在高噪聲圖像或混合噪聲圖像中,中心像素的相鄰像素可能大都是噪聲像素,因此,考慮其他局部像素塊比以中心像素為中心的像素塊更合理,區(qū)域級信息由此引入目標函數(shù)中,區(qū)域級信息ξj表示為:
(4)
(5)
式中:xj為原始圖像I的第j個像素,xq為落在區(qū)域Rj(S×S)的第q個像素,M(xq)和M(xj)分別為以像素xq和像素xj為中心的局部像素塊,大小為l×l(l
圖1 圖像I中的局部像素塊與區(qū)域級信息的關系Fig.1 The relationship between local pixel blocks and region-level information of image I
傳統(tǒng)FCM算法對噪聲圖像較為敏感,難以得到理想的分割結果。本文考慮了圖像的區(qū)域級信息,并用核度量方法代替?zhèn)鹘y(tǒng)歐氏距離,計算區(qū)域級空間信息與聚類中心的距離,然后用原始圖像與區(qū)域級空間信息絕對差的倒數(shù)和它本身來約束原始圖像和區(qū)域信息項,最后用連通分量濾波,消除聚類過程中出現(xiàn)的過分割現(xiàn)象。
為了提高FCM的抗噪聲性能,許多FCM變體算法被提出,其目標函數(shù)可以概括為:
(6)
式中:Gij為模糊度因子,β為約束項,不同的算法具有不同的模糊度因子Gij。在基于區(qū)域級信息的模糊C-均值算法(FCM_NLS)[20]中,模糊度因子Gij為:
(7)
觀察區(qū)域級信息約束項Gij,ci所在‖·‖中前面部分為原始圖像的區(qū)域級信息,則Gij可表示為Gij=‖ξj-ci‖2,其中ξj為圖像的區(qū)域級信息,因此Gij可以看作區(qū)域級信息與聚類中心的歐氏距離計算的結果。盡管此度量方法在計算上很簡單,但是使用歐氏距離可能會導致對因噪聲、離群值和其他成像偽影而損壞的圖像進行分割時出現(xiàn)非穩(wěn)健的結果。為提高魯棒性,可將核度量方法引入目標函數(shù)代替歐氏距離。
特征空間中的核可以表示為以下函數(shù)K:
K=〈Φ(x),Φ(y)〉,
(8)
式中:Φ(·)表示隱式非線性映射,〈Φ(x),Φ(y)〉為內(nèi)積運算。高斯徑向基函數(shù)核(GRBF)是一種常用的核算法,其表達式為:
(9)
式中:D為向量的維數(shù),σ為內(nèi)核帶寬,一般設置為4,a≥0,1≤b≤2,顯然K(x,x)=1。Φ(xj)和Φ(ci)在特征空間的內(nèi)積為Φ(xj)TΦ(ci)=K(xj,ci),通過核替換有:
‖Φ(xj)-Φ(ci)‖2=K(xj,xj)+K(ci,ci)-2K(xj,ci)。
(10)
通過這種方法,得到了原始數(shù)據(jù)空間中一類新的非歐幾里德距離測度,由于K(x,x)=1,因此模糊因子Gij=‖ξj-ci‖2可以用下式表示:
(11)
綜上所述,基于核度量的區(qū)域級信息提取步驟如下:首先,選取圖像I的一個像素為中心像素,記為xj,其周圍l×l的鄰域范圍為局部區(qū)域,記為M(xj);其次,在以xj為中心的S×S區(qū)域內(nèi)搜尋一個與xj灰度值相同(或相差不大)的像素,記為xq,其局部區(qū)域為M(xq),則由上述2個局部區(qū)域M(xj)和M(xq)構成的區(qū)域即為以像素xj為中心的區(qū)域級信息;最后,利用式(4)和式(5)計算區(qū)域級信息,并將其引入FCM目標函數(shù)中,遍歷整幅圖像,直至所有像素完成聚類。
FCM聚類算法將每個像素視為獨立的樣本,因此在聚類過程中,容易產(chǎn)生過分割現(xiàn)象,即分割結果中包含大量孤立的小區(qū)域,如圖2所示。
圖2 使用連通分量濾波前后的對比Fig.2 The comparison of results before and after using connected component filtering
由圖2(c)可以看出,聚類結果包含很多無用的小區(qū)域,從而影響分割精度,利用連通分量濾波可以有效地去除這些小區(qū)域。
連通分量濾波技術,首先計算所有連通區(qū)域的面積,然后由大到小對這些連通分量進行排序,生成面積決策圖,接著求出各個連通區(qū)域的區(qū)間長度,最大區(qū)間對應一個區(qū)域,該區(qū)域的面積被認為是閾值M,最后用得到的M消除孤立區(qū)域。文獻[21]提出可利用面積密度平衡算法與連通分量濾波相結合來快速尋找閾值M。用χp表示第p個數(shù)據(jù)點的歸一化面積,其中1≤p≤N+1,0≤χp≤1,αq表示第q個區(qū)域的面積,ζp表示在半徑ε下χp附近的αq的個數(shù),可用公式表示為:
(12)
(13)
式中:Q為由聚類算法得到的連通區(qū)域的個數(shù)。kq為αq的映射:
(14)
將kq歸一化的值作為閾值M進行連通分量濾波消除聚類結果中出現(xiàn)的過分割現(xiàn)象。如圖2(d)所示,經(jīng)過連通分量濾波后,圖2(c)中孤立的小區(qū)域被濾除,進而提高了分割精度。
為了提高傳統(tǒng)FCM算法對噪聲的魯棒性,提出一種自適應區(qū)域級信息約束方法,目標函數(shù)為:
(15)
(16)
(17)
本文算法步驟如算法1所示。
算法1:基于區(qū)域信息和連通分量濾波的FCM算法輸入:圖像I,聚類數(shù)目K,誤差參數(shù)ε,最大迭代次數(shù)T,局部像素塊尺寸l,搜索半徑S輸出:隸屬度矩陣u'ij,聚類中心c'i1.計算原始圖像的區(qū)域級信息ξj2.初始化隸屬度矩陣u'ij、聚類中心c'i3.利用式(11)計算區(qū)域級信息與聚類中心的距離4.a←25.重復執(zhí)行 ⅰ 用式(17)更新聚類中心c'i ⅱ 用式(16)更新隸屬度矩陣u'ij ⅲ 用式(15)更新目標函數(shù)J(a)m ⅳ a←a+16.直到‖J(a)m-J(a-1)m‖<ε或a>T7.返回 隸屬度矩陣u'ij,聚類中心c'i
為了驗證本文算法的有效性,采用合成圖像和彩色圖像進行測試,并將實驗結果與FCM、CGFFCM、FSC_LNML和RLFCM算法進行對比。為了說明算法對不同類型的噪聲都具有較強的魯棒性,實驗選用等量的高斯白噪聲、椒鹽噪聲和均勻分布乘性噪聲的混合噪聲污染圖像。
指標采用模糊分割系數(shù)VPC、模糊分割熵VPE、分割精準度SA、平均交并比mIoU和歸一化互信息NMI:
(18)
(19)
(20)
(21)
式中:Ai為分割結果中第i個聚類簇的像素集合,Ci為參考圖像中第i個聚類簇的像素集合。SA、VPC和mIoU越大,分割結果越好,VPE越小分割性能越好。對于圖像I1和I2:
(22)
式中:MI(I1,I2)表示I1和I2的互信息,H(I1)和H(I2)分別表示I1和I2的熵,NMI越大,分割結果越好。
對幾種算法的參數(shù)設置如下:對于所有算法,設置隸屬度指數(shù)m=2,最小誤差ε=10-6,最大迭代次數(shù)T=200;對于CGFFCM算法,pint、pmax和pstep分別設置為0、0.8和0.05;對于FSC_LNML和RLFCM算法,設置局部窗口l=9,搜索窗口S=15,平滑度參數(shù)h=9;對于本文算法的參數(shù)敏感性將在3.3節(jié)討論。
原始圖像大小為256 pixel×256 pixel,在實驗過程中分別加入5%、10%、15%和20%的混合噪聲,聚類數(shù)目K=3。圖3為5種算法對含15%混合噪聲合成圖像的分割結果,5種算法對含混合噪聲合成圖像的定量指標結果如表1所示。
表1 5種算法對含不同混合噪聲的合成圖像的性能指標Tab.1 The performance indexes of five algorithms for synthetic images with different mixed noises
圖3 5種算法對含15%混合噪聲合成圖像的分割結果Fig.3 The segmentation results of five algorithms for synthetic images with 15% mixed noise
首先,討論分割的視覺效果。視覺效果最差的為FCM和CGFFCM算法,因為FCM算法沒考慮圖像的任何空間信息,對噪聲較為敏感,而CGFFCM算法是基于特征的聚類算法,即在算法的輸入端輸入圖像的特征而非圖像本身,而在面對噪聲時,原始圖像的特征被噪聲破壞,難以表征圖像信息,因此CGFFCM的結果視覺效果較差。FSC_LNML和RLFCM算法雖然考慮了圖像的空間信息,但度量像素與聚類中心的距離仍然采用原始的歐氏距離,因此結果中含有一部分噪聲斑點,且存在誤分割現(xiàn)象,視覺效果較差。本文算法的視覺效果最好,這主要歸因于區(qū)域級信息和核度量方法。
其次,分析各個算法的性能指標。由表1可以看出,總體上,隨著噪聲密度的增加,所有算法的性能均有所下降。其中,FCM和CGFFCM算法的性能指標最低,如在噪聲密度為20%時,FCM和CGFFCM算法的NMI指標分別為13.33%和11.51%,表明在面對高密度噪聲時,這2種算法無法正確執(zhí)行。RLFCM算法的性能指標較好,接近本文算法,個別指標甚至超過本文算法,如在噪聲密度為5%時,RLFCM算法的VPC為98.51%,超過本文算法。本文算法在大多數(shù)指標上性能均優(yōu)于其他幾種比較算法,穩(wěn)定性較好。
3.1節(jié)的合成圖像實驗說明本文算法是一種魯棒性較強的圖像分割算法,本小節(jié)采用真實的彩色圖像驗證算法的有效性。為了實驗的嚴謹性,本文測試了來自伯努利數(shù)據(jù)庫(BSDS500)[22]的所有圖像,并給出了所有算法的平均性能指標,如表2所示。同時為了展示視覺效果,本文選取幾幅具有代表性的圖像,將所有算法的分割結果展示在圖4中。
表2 5種算法對含不同混合噪聲彩色圖像的性能指標Tab.2 The performance indexes of five algorithms for color images with different mixed noises
由圖4可以看出,FCM算法的分割結果中充滿噪聲,視覺效果較差。CGFFCM算法存在嚴重的誤分割現(xiàn)象,幾乎無法辨別圖像中的目標和背景,這表明,CGFFCM算法雖然考慮了圖像的多個特征,但面對噪聲時,其穩(wěn)健性逐漸降低。FSC_LNML算法對#24063、#67079的分割結果較好,但在分割#3063時存在誤分割,將飛機和天空誤分為一類,#86016和#42049的結果中存在少許噪聲斑點。RLFCM算法是最近提出的一種基于非局部空間信息的FCM變體算法,其性能較好,因此可以分割大多的彩色圖像,但也有例外,如#24063的分割結果中目標比較模糊,#3063的分割結果含有少量噪聲。相比前幾種算法,本文算法不僅能有效地分割目標,同時可以較好地抑制噪聲,視覺效果最好。
在性能指標方面,本文給出了所有算法在BSDS500數(shù)據(jù)庫中的平均性能指標。與合成圖像類似,隨著噪聲的增加,各個指標逐漸降低,但相較于其他算法,本文算法下降得較為緩慢,即本文算法具有更好的穩(wěn)定性。這主要歸因于本文算法考慮了圖像的區(qū)域信息,同時又以核函數(shù)為距離度量,在面對噪聲時穩(wěn)定性更好。
討論參數(shù)對算法性能的影響,即局部窗口尺寸l和搜索窗口尺寸S的選擇。首先,確定l的值,l為局部窗口尺寸,決定鄰域范圍的大小。如果l太小,則無法有效濾除噪聲,而過大的l導致空間運算(即區(qū)域信息的提取過程)過分平滑圖像,使得圖像的細節(jié)和邊緣信息丟失,進而影響分割精度,因此需要選擇合適的l值。如圖5所示,隨著l增大,算法的性能也相應提升,當l增加到9時,其性能逐漸趨于穩(wěn)定,因此本文設置l=9。其次,確定S的值,S為搜索窗口的尺寸,當S較小時,算法執(zhí)行速度較快,但魯棒性較差,當S較大時,可以有效濾除噪聲,但算法的時間效率也相對降低,因此選擇合適的S值是至關重要的。如圖6所示,隨著S的增加,算法的性能也在逐漸提升,但當S增加到15之后,其各個性能增加緩慢,綜合時間效率和分割性能考慮,本文設置S=15。
圖6 不同S對算法性能的影響Fig.6 The effect of different S values on the performance of the algorithm
時間復雜度是評價算法性能的重要指標,表3列出了5種算法的時間復雜度,其中N為像素總個數(shù),L為特征數(shù),T為迭代步長。由表3可知,FCM算法的復雜度最低,因為原始FCM算法并未考慮任何空間信息,因此最為簡單。復雜度較低的為CGFFCM算法,該算法只考慮圖像的特征而沒有進行空間運算,因此復雜度較低,本文算法和其他幾種算法都是基于區(qū)域級信息的FCM算法,因此復雜度較高,為o(n5),但同時魯棒性也較好。
表3 5種算法的復雜度比較Tab.3 The complexity comparison of five algorithms
本文提出了一種基于空間信息的模糊C-均值噪聲圖像分割算法。針對傳統(tǒng)FCM聚類算法對噪聲缺乏魯棒性的問題,將原始圖像的區(qū)域級信息加入FCM的目標函數(shù)之中,并用核度量方法代替歐氏距離,計算區(qū)域級信息與聚類中心之間的距離,提高了算法對噪聲的魯棒性,而且將原始圖像與區(qū)域級空間信息絕對差的倒數(shù)和它本身作為約束項,來自適應約束原始圖像和與區(qū)域級信息,最后再利用連通分量濾波對聚類結果中出現(xiàn)的孤立小區(qū)域進行去除,提高分割精度。通過合成圖像和彩色圖像分割實驗對比,表明本文算法在模糊分割系數(shù)、模糊分割熵、分割精確度、平均交互比和歸一化互信息等方面均優(yōu)于CGFFCM、FSC_LNML和RLFCM算法。但本文算法輸入?yún)?shù)較多,如何減少輸入?yún)?shù)將是下一步的研究目標。