許超
(商洛學院 陜西省商洛市 726000)
圖像分割是識別圖像中的對象并在所識別的對象之間形成上下文關系的基礎。模糊C 均值聚類算法是圖像分割中的經(jīng)典聚類算法之一,用于獲得源圖像的顏色量化版本,以進一步分割圖像。在圖像分割領域中應用模糊C 均值聚類算法會產生許多固有的復雜性,首要問題之一是預先指定簇的數(shù)量,其他問題包括由于隨機選擇初始中心,F(xiàn)CM 會陷入局部最優(yōu)。為了解決這個隨機初始化問題,目前已經(jīng)提出了許多基于進化算法的研究。J.Kennedy 和Russell 提出了一種基于群體智能的優(yōu)化算法[1]。此后,Omran 等人將此粒子群優(yōu)化算法(PSO)應用于圖像分類[2]。 近年來,PSO 的混合版本(包括速度和位置計算的優(yōu)化)與原始PSO 相比具有更好的性能。高尚等人使用PSO 的輸出來初始化K 均值聚類算法,并獲得了更好的結果[3]。他還證明,與K 均值聚類算法+ PSO 組合相比,PSO + K均值聚類算法組合是更好的選擇。李海陽等人在PSO 的連續(xù)迭代中更新慣性權重時使用了相同的方法[4]。本次研究以模糊C-均值代替K 均值來進一步改善圖像分割效果。通過與自適應粒子群優(yōu)化算法相結合,模糊C 均值算法將改善圖像分割效果,因為它用隸屬度值來分類數(shù)據(jù)點,而不是像K 均值那樣嚴格的0 或1 對數(shù)據(jù)點進行分類。
Bezdek 等人引入的模糊C 均值算法根據(jù)目標函數(shù)將數(shù)據(jù)點xi,i=1,2,3,...分組為C 群集。
其中,cj代表jth簇的原型值,uij是cj在簇j 中的隸屬度,m 是任何大于1 的實數(shù)。為了最小化目標函數(shù),將高隸屬度值分配給這些像素,這些像素的強度位于其簇的原型值附近。其中uij用(2)式計算,cj用(3)式計算。
當Jm的值在后續(xù)迭代中停止變化時,該算法收斂。J.Kennedy和Russell 引入粒子群優(yōu)化算法,將問題的最優(yōu)解抽象為在N 維空間中飛行的無質量、體積的粒子。一組粒子稱為粒子群或簡稱為“群”。每個粒子都有自己的飛行速度,空間位置和適合度值。假設粒子i 在d 維空間中的位置為Xi=(xi1,xi2,...,xid),速度為Vi=(vi1,vi2,...vid)。在迭代過程中,當前的個體最優(yōu)解p-best是Pi=(pi1,pi2,...,pid),當前的全局最優(yōu)解g-best 是Pg=(pg1,pg2,...,pgd)??梢苑謩e使用(4)式和(5)式計算粒子的速度和位置。
其中w 是慣性權重,它代表繼承到下一飛行速度的當前飛行速度的數(shù)量。c1代表粒子的自我學習能力,c2代表粒子的社會學習能力。在PSO 算法中,c1和c2是常數(shù),其值在0 到4 之間。通常,c1=c2=2.0。r1和r2都是在0 和1 之間均勻分布的隨機數(shù)。李海陽等人在PSO 中使用了動態(tài)慣性權重的概念[4]。在本次研究中,我們擴展了這種想法以實現(xiàn)更好的分割效果。通過動態(tài)改變慣性權重可以提高粒子群優(yōu)化算法的性能。保持慣性權重不變可能導致算法收斂于局部最優(yōu)解,線性減小的慣性權重甚至可能超出最優(yōu)點。為了克服這些缺點,可以使用(6)式動態(tài)計算慣性權重。
圖1:三種算法的圖像分割結果
其中wmax是最大慣性權重,wmin是最小慣性權重。f 是粒子i的當前適應值,favg是群的當前平均適應度,fmin是群中所有粒子的最小適應值。該方法具有以下優(yōu)點:
(1)適應值小于平均適應值的粒子被賦予較低的慣性權重,從而降低飛行速度以保持其位置。
(2)適應值大于平均適應值的粒子被賦予更高的慣性權重,從而提高飛行速度,以快速靠近其最適合的鄰居。
粒子群算法的兩個學習因子通常是常數(shù)。分配給這些因子不適當?shù)闹悼赡軙е虏黄谕妮敵觥榱说玫礁玫慕Y果,我們分別使用(7)式和(8)式計算了學習因子c1和c2。
為了初始化群體,在圖像X 的N 個總像素中隨機選取M 個像素成為初始聚類中心,作為優(yōu)化問題的解集。確定聚類中心后,圖像X 中的剩余像素應根據(jù)以下聚類準則分配給這些M類。設xi為數(shù)據(jù)點集X 中的ith數(shù)據(jù)點,且cj為jth簇中心。如果則將xi分配給jth簇。粒子的適應度使用以下公式進行評估:
式中,fi表示粒子i 的適配度,N 為像素總數(shù),M 為解集中粒子的數(shù)目,xi代表ith像素,cj為jth簇中心。群的平均適應度favg計算如下:
群的收斂程度可以通過計算群適應度方差δ2來測量,如下所示:
在優(yōu)化過程中,粒子適應度將逐漸趨于相同。當發(fā)生這種情況時,該算法被認為是收斂的,并且群體適應度方差δ2將減小到某個范圍,這意味著該算法已經(jīng)接近全局最優(yōu)解。該最優(yōu)解作為FCM 算法的初始聚類中心。
使用Berkeley 分割數(shù)據(jù)集和基準測試的圖像對APSOF 算法進行了測試,這是一個應用于圖像分割的標準數(shù)據(jù)集。此數(shù)據(jù)集中的大多數(shù)圖像都是真實的圖像,并已調整大小以減小文件大小。在本文中,從所有測試圖像中選擇了四個圖像進行深入分析。為了比較結果,采用了兩種經(jīng)典的聚類算法,即K 均值聚類算法和模糊C均值聚類算法。簇的初始數(shù)目根據(jù)圖像的不同而不同,通常最多在5 到10 個簇之間。在模糊C 均值算法和APSOF 中,m 的值為2。分割結果如圖1所示。APSOF 的性能可以從兩個方面進行分析:定性分析和定量分析。具體情況將在以下各節(jié)中介紹。
定性分析基本上是基于識別圖像中感興趣的區(qū)域或對象的能力,通過肉眼觀察來評估圖像質量。從圖1 中,我們可以容易地推斷出,APSOF 的分割結果比K 均值和模糊 C 均值有優(yōu)勢(表1)。
我們將逐幅圖像進行分析,得到分割圖像的視覺差異。
從圖1 的第一行(即人臉),我們可以看到,與其他圖片相比,APSOF 中眼睛和嘴巴附近的部分與面部其余部分有很好的區(qū)別。另外,在APSOF 中,背景偽影,特別是人臉左側的背景偽影被清晰地分割出來,而在其他算法的分割結果中卻并不清楚。
表1:模糊C 均值和APSOF 的標準化Jm 值
圖1 的第二行(即花朵),可以觀察到,與趨向于較暗色調的模糊C 均值相比,APSOF 的輸出中的顏色是明亮和充滿活力的。在這種情況下,K 均值完全失去了背景色。
對于如圖1 第三行所示的金字塔圖像,APSOF 算法在金字塔頂部和云層左端的區(qū)域具有最好的分割效果。模糊C-均值將金字塔頂部誤歸類為云的一部分。盡管K 均值具有與APSOF 相似的結果,但它在金字塔和云的角部分的像素分類方面表現(xiàn)不佳。
對于圖1 第四行所示的老鷹圖像,除了圖像中下半部分附近的斑點可以忽略之外,所有的算法都產生了相似的分割結果,因為它們對于整個圖像沒有太大的意義。
綜上所述,通過定性分析可知,APSOF 算法的性能明顯優(yōu)于K 均值和模糊C 均值算法。
利用兩種算法的最終Jm值,可以比較APSOF 和模糊C 均值的性能。為了便于比較,通過將每個單獨的Jm值除以每個輸出的兩個Jm值的平均值來對這些值進行歸一化。根據(jù)表1 中提供的信息,在大多數(shù)情況下,通過使用APSOF,Jm可以最小化。對于老鷹的圖像,由于APSOF 和模糊C 均值的分割輸出基本相似,所以在Jm值上只有很小的差別。
模糊C 均值算法是一種標準的圖像分割算法,但對初始化比較敏感。像APSOF 這樣的混合算法可以改進標準的模糊C 均值算法以獲得更好的圖像分割。性能比較表明,該算法優(yōu)于K 均值和模糊C 均值,但是計算成本較高。為了滿足實時應用的需要,需要提高APSOF 的效率。在以后的工作中,可以將空間信息結合起來,進一步提高分割效率,增強算法對圖像數(shù)據(jù)中噪聲的敏感性。