龍建武,陳鴻發(fā),鄢澤然,朱江洲
(重慶理工大學(xué) 計(jì)算機(jī)科學(xué)與工程學(xué)院, 重慶 400054)
圖像是有效傳遞信息的主要方式之一,良好的分割算法能為圖像理解帶來巨大的幫助。Ren等[1]首次提出了超像素的概念,超像素分割是將圖像劃分成具有一定視覺感知意義的原子區(qū)域,每個(gè)區(qū)域內(nèi)的像素具有高度的相似性,從而提供一種簡(jiǎn)明的圖像表示形式。超像素顯著地降低了圖像后續(xù)處理的復(fù)雜度,提高了處理效率。超像素分割正逐步成為越來越受歡迎的圖像預(yù)處理技術(shù),被廣泛用于圖像分割[2-3]、目標(biāo)識(shí)別[4]、目標(biāo)追蹤[5]、3D重建[6-7]等眾多計(jì)算機(jī)視覺任務(wù)中。直至目前,為生成良好的超像素以滿足各種視覺任務(wù)的需要,已有多種超像素分割算法相繼被提出,根據(jù)原理的不同主要分為兩類。第一類是基于圖論的能量?jī)?yōu)化方法,比如規(guī)則化圖割算法[8](normalized cuts,NCuts)、熵率算法[9](entropy rate superpixel,ERS)、懶惰隨機(jī)游走算法[10](lazy random walk,LRW)。最初Shi等[8]提出的NCuts方法能生成具有良好邊界粘合和規(guī)則形狀的超像素,然而歸一化割是計(jì)算密集型的,每一次迭代只能產(chǎn)生一個(gè)超像素,因此NCuts的計(jì)算復(fù)雜性非常高。Liu等[9]提出的基于熵率的超像素分割算法(ERS)將超像素分割問題表述為一個(gè)目標(biāo)函數(shù),該函數(shù)由一個(gè)圖和一個(gè)平衡項(xiàng)組成,即計(jì)算從圖上的削減成本到生成超像素的熵率。熵率可以幫助將緊湊和均勻的區(qū)域組合在一起,這也有利于超像素覆蓋一個(gè)關(guān)于感知邊界的單一對(duì)象,但是ERS超像素的形狀不夠規(guī)則。Shen等[10]提出的懶惰隨機(jī)游走算法(LRW)是從輸入圖像中獲取每個(gè)像素的概率,并使用概率和切換時(shí)間獲取初始超像素。LRW引入了新的能量函數(shù),迭代優(yōu)化初始超像素,但是該方法的分割效率不佳。第二類是基于聚類的特征優(yōu)化方法,包括簡(jiǎn)單線性迭代聚類算法[11](simple linear iterative clustering,SLIC),線性譜聚類算法[12-13](linear spectral clustering,LSC),實(shí)時(shí)DBSCAN聚類算法[14](real-time DBSCAN clustering,DBSCAN)。Achanta等[11]于2012年提出的簡(jiǎn)單線性迭代聚類(SLIC)采用K均值聚類方法生成相對(duì)較低計(jì)算成本的超像素,但面對(duì)復(fù)雜圖像時(shí)不能很好地貼合目標(biāo)對(duì)象邊界。Shen等[14]提出了基于密度的帶噪聲應(yīng)用空間聚類DBSCAN算法用于超像素分割,DBSCAN算法分為2個(gè)階段:在第一個(gè)階段,使用DBSCAN將像素聚類成超像素;在第二階段,將小的超像素合并到大的超像素中。該算法具有O(N)的計(jì)算復(fù)雜度,表現(xiàn)出了非常好的實(shí)時(shí)性。Li等[12-13]采用的線性譜聚類提取超像素結(jié)合了歸一化切割和K均值的優(yōu)點(diǎn),能獲得良好質(zhì)量的超像素。然而,由于計(jì)算特征比較復(fù)雜,LSC的計(jì)算復(fù)雜度高。近兩年,一些新的超像素分割算法相繼被提出,包括高斯混合模型超像素算法[15]( gaussian mixture model superpixel.GMMS)和動(dòng)態(tài)隨機(jī)游走算法[16](dynamic random walk,DRW),它們擁有著良好的算法性能,但同時(shí)也存在著不足之處。
雖然上述方法各具優(yōu)勢(shì),但一直以來提出一種實(shí)時(shí)的、邊界貼合與規(guī)則性相適應(yīng)的、超像素?cái)?shù)目與迭代次數(shù)可控的、算法復(fù)雜度較低的超像素分割算法都是一個(gè)非常具有挑戰(zhàn)性的研究問題。通過上述分析,以往的超像素分割算法大部分都是通過設(shè)計(jì)不同的能量?jī)?yōu)化函數(shù)進(jìn)行硬劃分,對(duì)于簡(jiǎn)單圖像能夠得到很好的效果,但在處理復(fù)雜圖像時(shí)分割效果不盡如人意,或者是采用的能量?jī)?yōu)化函數(shù)包含的特征較多導(dǎo)致算法復(fù)雜度較高,因此如何保證算法復(fù)雜度與分割效果兩者之間的平衡是值得深入研究的問題。為滿足這些要求,本文提出一種基于局部模糊聚類的超像素分割算法,這是FCM算法首次應(yīng)用于超像素分割。超像素用于代替像素進(jìn)行更緊湊的視覺表示,并作為大量圖像處理應(yīng)用的一個(gè)重要的預(yù)處理步驟,它的計(jì)算成本是最受關(guān)注的問題之一。在這些超像素算法中,SLIC算法、DBSCAN算法等已成為較為流行的算法,因?yàn)樗梢栽诓缓馁M(fèi)太多成本的情況下快速生成超像素,但其仍有許多空間可提高。一種理想的超像素方法不僅需要滿足良好邊界粘附的要求,而且還需要高效。由于在視覺應(yīng)用中使用了超像素分割作為預(yù)處理步驟,所以優(yōu)先選擇具有較少計(jì)算的高質(zhì)量超像素分割算法。本文提出的局部FCM超像素分割算法繼承了現(xiàn)有算法比如SLIC、DBSCAN等的優(yōu)點(diǎn),并進(jìn)一步提高了分割效果。本文中將FCM算法用于生成超像素,由于FCM算法是以隸屬度的形式對(duì)圖像進(jìn)行軟化分,它能有效減小復(fù)雜圖像中的復(fù)雜紋理對(duì)分割帶來的影響,以及對(duì)圖像中不規(guī)則對(duì)象的細(xì)分也能達(dá)到更好的效果。為了更好地利用FCM算法生成性能優(yōu)良的超像素,對(duì)算法的搜索區(qū)域進(jìn)行了幾何限制,同時(shí)結(jié)合超像素的特點(diǎn),縮小了隸屬度的計(jì)算區(qū)域,改進(jìn)了FCM算法的初始化方法與聚類中心的更新方式。生成超像素的過程主要分為兩步,首先通過FCM聚類算法獲得初始超像素,在該步驟中,聚類中心的更新改為每個(gè)超像素的所有像素點(diǎn)向量平均值,這滿足了超像素的規(guī)則度的要求。隸屬度矩陣由像素的所屬3×3鄰域超像素的隸屬度組成,而隸屬度計(jì)算中包含了像素點(diǎn)與各個(gè)聚類中心的向量距離加權(quán)。然后,通過顏色和空間信息的測(cè)量,將初始的小超像素與其附近的超像素融合在一起。
(1)
(2)
D=dlab+(m/S)dxy
(3)
最后可能出現(xiàn)一些“孤立”超像素,這就需要將“孤立”超像素合并到與鄰近超像素距離度量最小的超像素中,以保證超像素塊的一致性。整個(gè)過程如算法1所示。
算法1 SLIC算法
輸入:包含N個(gè)像素點(diǎn)的圖像I
輸出:SLIC超像素分割結(jié)果
初始化:超像素個(gè)數(shù)K以及K個(gè)像素點(diǎn)作為聚類中心,并將中心移動(dòng)到鄰域內(nèi)梯度值最小的像素點(diǎn)處。設(shè)定迭代停止閾值E,初始化聚類中心ci,設(shè)置迭代計(jì)數(shù)器t=0。
算法開始:
1:對(duì)N個(gè)像素計(jì)算在搜索范圍內(nèi)的到聚類中心點(diǎn)的距離,并將該像素點(diǎn)歸入距離最近的聚類。
2:對(duì)K個(gè)聚類中心點(diǎn)進(jìn)行更新。
3:如果‖ct-ct+1‖ 4:將“孤立”超像素進(jìn)行合并。 算法結(jié)束 模糊C均值(FCM)算法是一種基于軟化分的聚類算法。FCM算法的目標(biāo)價(jià)值函數(shù)為: (4) 式中:uij∈[0,1];m是控制聚類效果的參數(shù);ci是模糊簇的聚類中心;dij表示第j個(gè)數(shù)據(jù)點(diǎn)與第i個(gè)聚類中心的歐式距離。然后構(gòu)造帶有約束因子的拉格朗日函數(shù): (5) 式中:λj是n個(gè)約束式的拉格朗日乘子。對(duì)式子中uij求導(dǎo),得到使目標(biāo)價(jià)值函數(shù)最小的必要條件: (6) (7) 通過迭代更新隸屬度與聚類中心,當(dāng)目標(biāo)價(jià)值函數(shù)幾乎達(dá)到最小時(shí),獲得聚類結(jié)果。整個(gè)過程如算法2所示。 算法2FCM算法 輸入:數(shù)據(jù)樣本 輸出:數(shù)據(jù)聚類結(jié)果 初始化:給定聚類類別數(shù)c,0 算法開始: 1:根據(jù)式(6)計(jì)算或更新隸屬度矩陣uij。 2:根據(jù)式(7)更新聚類中心ci。 3:如果‖ct-ct+1‖ 算法結(jié)束 傳統(tǒng)FCM算法通過計(jì)算隸屬度的形式來確定每一個(gè)數(shù)據(jù)點(diǎn)屬于某個(gè)聚類的程度,它的優(yōu)點(diǎn)是,對(duì)于滿足正態(tài)分布的數(shù)據(jù)聚類效果會(huì)很好。算法是收斂的,因此得到的模糊隸屬度矩陣具有一致性;它的缺點(diǎn)是,當(dāng)數(shù)據(jù)中包含噪聲的時(shí)候,聚類效果不好。算法的性能很依賴于初始聚類中心,同時(shí)算法是基于全局?jǐn)?shù)據(jù),當(dāng)數(shù)據(jù)量特別大時(shí),整個(gè)算法就非常耗時(shí),效率低。 針對(duì)以上問題,一些典型的改進(jìn)模糊聚類方法被提出,比如,PCM算法[17]作為一種窮舉型搜索算法,通過改變隸屬度的約束條件來改善聚類效果,它能很好地處理噪音,從而彌補(bǔ)了FCM容易受噪聲影響的不足。但PCM 算法需要一個(gè)比較好的初始劃分,以確保準(zhǔn)確的聚類,這是一個(gè)難解決的問題;AFCM算法[18]通過對(duì)度量方式進(jìn)行非線性變化,從某種程度上改善了聚類結(jié)果,但算法變得更加復(fù)雜,這種改變度量方式得到的聚類算法在數(shù)據(jù)尺度發(fā)生改變的時(shí)候,會(huì)比較敏感,可能會(huì)導(dǎo)致很糟糕的聚類結(jié)果,所以其適用性并不廣泛;Wang等[19]提出了一種使聚類中心的搜索范圍限制在直方圖峰值附近的新的FCM算法,該算法加快了收斂速度,但是它僅僅適用于有明顯峰值的聚類樣本;反之,則不適用。從以上分析可以看出,這些改進(jìn)的模糊聚類算法各具優(yōu)點(diǎn),但同時(shí)也存在著許多不足之處,因此,對(duì)模糊聚類算法提出更好的改進(jìn)是非常有必要的。 根據(jù)在分割過程中,優(yōu)化圍繞種子點(diǎn)像素搜索相鄰像素的搜索策略,利用FCM對(duì)復(fù)雜圖像的像素以隸屬度的形式進(jìn)行聚類,提出了一種基于局部模糊聚類的超像素分割算法。傳統(tǒng)意義上的FCM算法的搜索方式是基于全局的,其搜索區(qū)域如圖1所示,并且聚類中心的更新也是基于全局的,對(duì)于圖像這種包含大量像素點(diǎn)的數(shù)據(jù)來說,相應(yīng)的計(jì)算復(fù)雜度非常高,效率也非常低。所以為了與對(duì)圖像進(jìn)行超像素分割相適應(yīng),需要對(duì)傳統(tǒng)的模糊聚類算法進(jìn)行改進(jìn)。Lab顏色模型由3個(gè)要素組成,L表示亮度,a表示的顏色通道的范圍是從綠到紅,b表示的顏色通道的范圍是從藍(lán)到黃。Lab顏色模型優(yōu)點(diǎn)在于色域?qū)掗?,包含了RGB顏色模型的所有色域,同時(shí)彌補(bǔ)了RGB色彩分布不均的不足。由于在超像素分割過程中需要充分利用像素的顏色信息,所以需要盡量保留寬闊的色域來獲得更完整的顏色信息。而Lab顏色模型能夠很好地符合上述要求,這對(duì)在超像素分割過程中提升分割效果有顯著的作用,因此本文算法選擇CIELAB顏色模型。聚類過程從在步長(zhǎng)為S的常規(guī)網(wǎng)格空間上采樣K個(gè)聚類中心Ci=[li,ai,bi,xi,yi]T的初始化步驟開始,生成大小相等的超像素,聚類中心處于與該區(qū)域像素向量的平均值相對(duì)應(yīng)的位置。這樣做可以有效避免將超像素種子點(diǎn)設(shè)定在邊緣并且減少噪聲像素成為超像素種子點(diǎn)的機(jī)會(huì)。在圖像中,當(dāng)每個(gè)像素周圍的鄰域像素離該像素越近時(shí),他們之間的相似性就越高,這種分布特點(diǎn)與正態(tài)分布的特點(diǎn)比較相似,根據(jù)前文中提及的模糊聚類算法對(duì)滿足正態(tài)分布的像素點(diǎn)的聚類效果會(huì)很好的優(yōu)點(diǎn),并且考慮到每個(gè)像素周圍的鄰域超像素包含了相應(yīng)數(shù)量的像素點(diǎn),而3×3鄰域大小能夠較好地覆蓋一定鄰域內(nèi)的像素,在保證覆蓋鄰域內(nèi)像素的同時(shí)避免了像素間差異性過大。因?yàn)猷徲蜻^小比如4鄰域就不能完全覆蓋鄰域內(nèi)像素,鄰域過大比如5×5鄰域會(huì)產(chǎn)生鄰域內(nèi)像素間差異性過大的影響,兩者都會(huì)使分割不夠準(zhǔn)確,不利于算法的性能。為了最終獲得更好的超像素分割結(jié)果,本文算法分配每個(gè)像素與被劃分的3×3鄰域的超像素相關(guān)聯(lián),改進(jìn)后的搜索區(qū)域如圖2所示。這是加快算法速度的關(guān)鍵,因?yàn)橄拗扑阉鲄^(qū)域的大小會(huì)大大減少計(jì)算的次數(shù),降低計(jì)算復(fù)雜度。限制搜索區(qū)域大小的先驗(yàn)信息為超像素個(gè)數(shù)K值。當(dāng)K值過大時(shí),每個(gè)超像素區(qū)域就非常小,對(duì)應(yīng)搜索區(qū)域就很小,不能很好的保證信息的完整性;當(dāng)K值過小時(shí),每個(gè)超像素區(qū)域就很大,對(duì)應(yīng)搜索區(qū)域就很大,此時(shí)像素信息過于冗余,會(huì)導(dǎo)致劃分結(jié)果不夠準(zhǔn)確,降低分割效果。所以整個(gè)過程需要合理地初始化K值來限制搜索區(qū)域的大小。 圖1 FCM算法的搜索區(qū)域示意圖 圖2 本文算法的搜索區(qū)域示意圖 此處引入FCM算法中隸屬度函數(shù)的概念來計(jì)算像素對(duì)周圍3×3鄰域的超像素的隸屬度u,然后構(gòu)造與超像素分割相適應(yīng)的帶有約束因子的拉格朗日函數(shù): (8) 式中:n代表搜索區(qū)域內(nèi)的像素個(gè)數(shù),同時(shí): dij=dc+ds (9) 其中: (10) (11) 對(duì)u和c分別進(jìn)行求導(dǎo)得到使目標(biāo)函數(shù)J達(dá)到最小的必要條件: (12) (13) 在實(shí)現(xiàn)算法的過程中,首先利用初始化的超像素求像素平均值計(jì)算聚類中心,然后確定d,接下來利用式(12)(13)進(jìn)行迭代更新,直到聚類中心幾乎不再改變,可利用式(14)來控制: |Jt+1-Jt| (14) 式中:t是算法迭代次數(shù);E是迭代停止閾值。t與E是給定值以滿足算法達(dá)到分割效果的要求。像其他超像素算法一樣,F(xiàn)CM超像素沒有顯式強(qiáng)制連接,在聚類過程結(jié)束時(shí),一些不屬于與其聚類中心的“孤立”超像素可能仍然存在。為了解決這一點(diǎn),這些超像素被指定為最近的聚類中心的標(biāo)簽。在合并過程中,利用距離函數(shù)D計(jì)算“孤立”超像素與鄰近超像素之間的距離,距離函數(shù)D中包含了顏色距離和空間距離。一個(gè)好的超像素不僅要通過將超像素的邊界貼合在物體邊緣的性能來衡量,而且也能保持超像素的均勻大小,本算法利用色差來確定2個(gè)初始超像素是否應(yīng)該合并為一個(gè),空間距離保證了最終超像素的規(guī)則性,那么合并距離D被定義為: D(Ii,p)=α1dc(Ii,p)+(1-α1)ds(Ii,p) (15) 其中: (16) (17) 算法3基于局部模糊聚類的超像素分割算法 輸入:圖像I 輸出:超像素分割結(jié)果 初始化:指定超像素個(gè)數(shù)K,初始化聚類中心c,設(shè)定迭代停止閾值E,搜索步長(zhǎng)S,設(shè)置迭代計(jì)數(shù)器t=0。 算法開始: 1:在搜索區(qū)域內(nèi)根據(jù)式(12)計(jì)算或更新隸屬度矩陣uij。 2:根據(jù)式(13)更新聚類中心ci。 3:如果‖Jt-J(t+1)‖ 4:根據(jù)式(15)對(duì)“孤立”超像素合并到鄰近超像素區(qū)域內(nèi)得到最終的劃分結(jié)果。 算法結(jié)束 由于在進(jìn)行超像素合并時(shí)需要同時(shí)考慮到顏色信息和空間信息,相比于典型的距離度量方式如傳統(tǒng)歐式距離、馬氏距離以及曼哈頓距離等,本文算法在超像素合并步驟采用的距離度量方式的特點(diǎn)在于,綜合考慮了顏色信息和空間信息,以每個(gè)超像素的聚類中心的顏色信息和空間信息代表對(duì)應(yīng)的超像素,將顏色距離和空間距離相結(jié)合,并各自賦予相應(yīng)的權(quán)重,顏色距離權(quán)重用來控制顏色信息的相似性,空間距離權(quán)重用來控制空間信息的影響。而此時(shí)對(duì)顏色信息的依賴性比對(duì)空間信息的依賴性要大,因此賦予較大的顏色距離權(quán)重和較小的空間距離權(quán)重,這樣可以保證兩者之間的平衡,從而在比較準(zhǔn)確地衡量“孤立”超像素和鄰近超像素相似性的同時(shí)還能夠保證合并后的最終超像素的規(guī)則性。綜上,該距離度量方式優(yōu)點(diǎn)在于,能夠很好地衡量“孤立”超像素和鄰近超像素的相似性,確保是否應(yīng)該合并成一個(gè),同時(shí)保證了最終超像素的規(guī)則性,這符合生成良好超像素的目標(biāo)。 為驗(yàn)證本文算法的有效性,與現(xiàn)有典型超像素分割算法如ERS算法、SLIC 算法、LRW算法、LSC算法和DBSCAN算法以及近兩年一些新提出的超像素分割算法如GMMS算法和aptDRW算法從視覺、分割精度[20]和實(shí)時(shí)性等方面進(jìn)行量化對(duì)比。 為了定量評(píng)價(jià)本文超像素分割算法的性能,實(shí)驗(yàn)中選擇 BSDS500和MSRC-V1 2個(gè)數(shù)據(jù)集。BSDSS500是用于邊界檢測(cè)和圖像分割的數(shù)據(jù)集,內(nèi)容包括從戶外場(chǎng)景、景觀、建筑、動(dòng)物到人類。它由500張圖片組成,包括200張訓(xùn)練圖片、100張驗(yàn)證圖片和200張測(cè)試圖片,該數(shù)據(jù)集中每張圖片的大小為321×481或481×321。MSRC-V1是用于目標(biāo)識(shí)別和圖像分割的數(shù)據(jù)集,內(nèi)容包括建筑、景觀和動(dòng)物等9個(gè)類別,總共240張圖片。 在對(duì)圖像進(jìn)行超像素分割中,高分割精度是最關(guān)鍵和最基本的要求。本文采用常用的準(zhǔn)確性定量比較指標(biāo),包括邊界召回率(BR,boundary recall)和欠分割誤差(UE,under-segmentation error)。 邊界召回率BR是衡量超像素算法中邊界粘附性能的重要指標(biāo)。邊緣召回率BR定義為與超像素邊緣的距離小于2像素的真實(shí)邊緣在所有真實(shí)邊緣中所占的比例,邊緣召回率越高,意味著很少有真正的邊界被忽略。邊界召回率BR的計(jì)算公式如下: (18) 式中:B(si)和B(gj)分別表示超像素邊界和GroundTruth(GT)邊界的像素集;1()是一個(gè)指示函數(shù),用來檢查B(si)和B(gj)之間最近像素是否在像素的ε-距離內(nèi),并設(shè)置ε為2。 欠分割誤差UE是邊界粘附的另一個(gè)評(píng)估指標(biāo)。它是基于每個(gè)超像素只屬于一個(gè)對(duì)象的要求。UE測(cè)量從GT泄露的超像素內(nèi)部像素的百分比,如果超像素與多個(gè)GroundTruth段有效重疊,UE將相應(yīng)增加。欠分割誤差UE的計(jì)算公式如下: (19) 式中:指標(biāo)函數(shù)1( )等于有效重疊的一個(gè)值,κ=0.05是閾值。 對(duì)比試驗(yàn)所采用的實(shí)驗(yàn)平臺(tái)為1臺(tái)具有Intel i7-7700HQ 2.80 GHz處理器和8 GB RAM內(nèi)存的計(jì)算機(jī)。為了對(duì)比公平,實(shí)驗(yàn)使用各個(gè)超像素分割算法論文給出的源代碼,并盡量在不改變算法默認(rèn)參數(shù)的條件下進(jìn)行。本文算法采用 C++編寫。源代碼以C++實(shí)現(xiàn)的算法還有NC、SLIC、LRW算法,而LSC、ERS、DBSCAN、GMMS、aptDRW算法是以C++與Matlab相結(jié)合進(jìn)行實(shí)現(xiàn)的。 各個(gè)超像素分割算法在K=300左右時(shí)的一些分割結(jié)果視覺上的對(duì)比如圖3所示。取部分結(jié)果的一些細(xì)節(jié)作對(duì)比,如圖4所示。由圖3和圖4可知當(dāng)超像素個(gè)數(shù)K=300左右時(shí),本文算法得到的超像素形狀規(guī)則且大小比較均勻,而且邊緣附著性能與規(guī)則度相對(duì)平衡。SLIC算法、LRW算法與本文算法的相似之處在于得到的超像素形狀也較為規(guī)則。而ERS算法、LSC算法、DBSCAN算法得到的超像素形狀總體上沒有本文算法規(guī)則。比如ERS算法得到的超像素形狀不夠規(guī)則且大小不均勻;LSC算法在圖像簡(jiǎn)單區(qū)域得到的超像素比較規(guī)則,但是在比較復(fù)雜區(qū)域得到的超像素形狀的規(guī)則性不足,DBSCAN算法在圖像簡(jiǎn)單區(qū)域得到的超像素的形狀呈菱形,但在圖像復(fù)雜區(qū)域得到的超像素規(guī)則性欠佳。GMMS算法得到的超像素規(guī)則度不夠高,而aptDRW算法生成的超像素的大小差異性比較明顯。 圖3 各超像素分割結(jié)果(從上到下各行依次是ERS、SLIC、LRW、LSC、DBSCAN、GMMS、aptDRW、Ours) 圖4 超像素局部放大區(qū)域的實(shí)驗(yàn)結(jié)果 由于2個(gè)數(shù)據(jù)集中的圖片分辨率相對(duì)較小,參考文獻(xiàn)[14],實(shí)驗(yàn)對(duì)比時(shí)超像素個(gè)數(shù)K的值給定范圍為100~600。本文算法與各個(gè)超像素分割算法的在2個(gè)不同數(shù)據(jù)集表現(xiàn)的性能如下: 各個(gè)超像素分割算法在BSD500上的性能曲線如圖5、6所示。 圖5 邊界召回率曲線 圖6 欠分割誤差曲線 當(dāng)K=400左右時(shí),各個(gè)算法的BR與UE都比較接近。為了能更清楚明了的進(jìn)行分析對(duì)比,本文給出下列相應(yīng)的實(shí)驗(yàn)數(shù)據(jù),如表1所示。 表1 BSD500分割結(jié)果的BR與UE實(shí)驗(yàn)數(shù)據(jù) 對(duì)于各個(gè)超像素分割算法在MSRC-V1數(shù)據(jù)集上的分割性能,本文取超像素個(gè)數(shù)K=200、400和600時(shí)的實(shí)驗(yàn)數(shù)據(jù)進(jìn)行對(duì)比,如表2和表3所示。 表2 MSRC-V1分割結(jié)果的BR實(shí)驗(yàn)數(shù)據(jù) 表3 MSRC-V1分割結(jié)果的UE實(shí)驗(yàn)數(shù)據(jù) 由于SLIC、LSC、DBSCAN、GMMS和本文算法的算法復(fù)雜度均為O(N),根據(jù)文獻(xiàn)[13-15],超像素個(gè)數(shù)K=100到600范圍內(nèi)的取值對(duì)實(shí)時(shí)性數(shù)據(jù)影響不大,而ERS、LRW、aptDRW算法復(fù)雜度均高于O(N)。因此取超像素個(gè)數(shù)K=400時(shí)各個(gè)算法在BSDS500和MSRC-V12個(gè)數(shù)據(jù)集上的實(shí)時(shí)性數(shù)據(jù)進(jìn)行對(duì)比,如表4所示。 表4 K=400時(shí)各個(gè)算法的平均時(shí)間 s 由圖5、6和表1~3分析對(duì)比可以得出,在2個(gè)數(shù)據(jù)集上,無論是在邊界召回率BR還是欠分割誤差UE上,本文算法相對(duì)SLIC和LRW算法都有明顯的優(yōu)勢(shì)。這是由于局部模糊聚類采用在3×3鄰域超像素搜索區(qū)域內(nèi)計(jì)算像素隸屬度并比較隸屬度大小進(jìn)行軟化分,比較準(zhǔn)確地將像素劃分到鄰域超像素。相比于除SLIC,LRW外的其他超像素分割算法如ERS、LSC、DBSCAN、GMMS以及aptDRW等算法,當(dāng)超像素的個(gè)數(shù)設(shè)置較少時(shí),本文算法的BR和UE表現(xiàn)欠佳。當(dāng)超像素個(gè)數(shù)較多,特別是K=400左右或者K>400時(shí),對(duì)于BSDS500數(shù)據(jù)集,在BR上本文算法比其他算法都略高。在UE上,本文算法比ERS、LSC、DBSCAN和aptDRW算法略低,但略高于GMMS算法;對(duì)于MSRC-V1數(shù)據(jù)集,在BR上,本文算法比其他算法都略高。在UE上,本文算法與ERS、LSC、DBSCAN和aptDRW算法都比較接近,略高于GMMS算法,但在K=600左右時(shí)本文算法最低;因此可以得出,本文算法能夠較好地處理不同數(shù)據(jù)集圖片。從局部模糊聚類來看,這是因?yàn)楫?dāng)超像素個(gè)數(shù)較多時(shí),超像素區(qū)域的像素?cái)?shù)量適中,區(qū)域像素求平均得到的聚類中心能夠很好地代表該超像素,因此能比較準(zhǔn)確地在3×3鄰域超像素搜索區(qū)域內(nèi)計(jì)算像素隸屬度并進(jìn)行劃分。同時(shí),在本文算法的合并步驟中,采用距離度量方式能夠保證生成的最終超像素的精度。在實(shí)時(shí)性方面,本文超像素分割算法由于限制了搜索區(qū)域的大小,在3×3鄰域超像素搜索區(qū)域內(nèi)計(jì)算像素隸屬度,這表示,在搜索區(qū)域內(nèi),只需要計(jì)算每個(gè)像素對(duì)于3×3鄰域超像素的隸屬度,然后通過比較隸屬度的大小來進(jìn)行像素的劃分,相比于基于全局的方式,這極大地降低了運(yùn)算復(fù)雜度。與其他超像素分割算法的實(shí)時(shí)性數(shù)據(jù)相比較,由表4分析對(duì)比可以得出,本文算法慢于實(shí)時(shí)性最優(yōu)的DBSCAN及SLIC算法,但相差不大,與GMMS算法也比較接近。而本文算法的實(shí)時(shí)性相比于ERS、LRW、LSC、aptDRW算法有明顯的優(yōu)勢(shì)。因此本文算法以良好的實(shí)時(shí)性獲得了較好的分割效果,保證了算法復(fù)雜度和分割效果之間的平衡。 本文局部模糊聚類算法對(duì)于超像素個(gè)數(shù)K值的選取比較敏感,因?yàn)樗鼪Q定了聚類中心的初始化,以及之后像素隸屬度的計(jì)算并進(jìn)行劃分的的準(zhǔn)確性。相對(duì)于傳統(tǒng)FCM基于全局的搜索方式,本文算法大大縮小了搜索區(qū)域,有效地降低了運(yùn)算復(fù)雜度,同時(shí)不容易受噪聲影響,穩(wěn)定性較高,彌補(bǔ)了傳統(tǒng)FCM對(duì)噪聲比較敏感的不足。 提出了一種基于局部模糊聚類的超像素分割算法。FCM超像素分割算法能夠生成形狀規(guī)則性與邊界貼合性保持平衡的超像素。首先通過縮小搜索區(qū)域,設(shè)計(jì)像素對(duì)于超像素隸屬度的鄰域大小,適當(dāng)改變隸屬度的計(jì)算方式,得到一種新的基于局部模糊聚類算法,然后利用該算法迭代生成初始的超像素,在后處理步驟中將一些未被劃分的像素與鄰近超像素進(jìn)行合并,得到最后的超像素分割結(jié)果。采用2種標(biāo)準(zhǔn)的超像素分割精度的評(píng)價(jià)指標(biāo)與其他幾種經(jīng)典算法進(jìn)行比較。本文算法的優(yōu)勢(shì)在于對(duì)包括復(fù)雜對(duì)象或復(fù)雜紋理區(qū)域的圖像生成的超像素也能保持良好的形狀規(guī)則性與邊界貼合性,不足在于超像素的分割效果比較依賴于超像素的個(gè)數(shù),當(dāng)超像素個(gè)數(shù)較少時(shí),本文算法的分割精度不高,這也是本文算法需要解決的問題,需要進(jìn)一步研究。1.2 傳統(tǒng)模糊聚類算法
2 本文算法
3 實(shí)驗(yàn)結(jié)果與分析
3.1 數(shù)據(jù)集
3.2 評(píng)價(jià)標(biāo)準(zhǔn)
3.3 實(shí)驗(yàn)環(huán)境
3.4 超像素分割結(jié)果比較
4 結(jié)論