林愛英, 谷小青, 李富強(qiáng), 賈樹恒, 袁超
(河南農(nóng)業(yè)大學(xué)理學(xué)院,河南 鄭州450002)
閾值分割作為圖像分割中的重要方法,因其具有簡(jiǎn)單、有效、易于實(shí)現(xiàn)等優(yōu)點(diǎn)被廣泛應(yīng)用。閾值分割的關(guān)鍵是如何選取合適的閾值,國(guó)內(nèi)外有許多學(xué)者對(duì)此已進(jìn)行了大量的研究[1-6]。在眾多的閾值分割方法中,基于信息熵的閾值選取方法因其良好的信息論背景備受關(guān)注。PUN[3]首先將信息熵的概念應(yīng)用于圖像分割。KAPUR等[7]通過研究指出了PUN[3]研究中存在的問題,提出一維最大熵閾值法。結(jié)合圖像空間信息,ABUTALEB[8]將一維最大熵方法推廣到二維直方圖上,提出二維熵閾值分割方法。其后,人們基于廣義信息論相繼提出了Renyi熵[9]、Tsallis熵[10]等多種熵閾值分割算法,并推導(dǎo)出相應(yīng)的二維算法[11-12]。但上述基于信息熵的閾值分割方法存在一個(gè)關(guān)鍵問題,最大熵在某些灰度值處存在無定義情況?;谶@一原因,吳一全等[13]從信息量需滿足的原則出發(fā),定義了倒數(shù)熵,給出了一維最大倒數(shù)熵閾值選取算法公式,并推廣到二維直方圖區(qū)域。范九倫等[14]把倒數(shù)熵概念應(yīng)用于粗糙集理論中,提出一種倒數(shù)粗糙熵閾值分割法,進(jìn)一步豐富了倒數(shù)熵的閾值化方法。
最大倒數(shù)熵閾值法解決了熵閾值法中存在的無定義值問題[15],但其準(zhǔn)則函數(shù)是對(duì)圖像中目標(biāo)和背景的倒數(shù)熵取算術(shù)平均,這和傳統(tǒng)最大熵閾值法的基本思路是一樣的,都是基于目標(biāo)和背景類對(duì)分割的影響是對(duì)等的假設(shè)。對(duì)于實(shí)際的圖像分割,目標(biāo)和背景對(duì)分割所起的作用顯然是不同的。鑒于此,作者提出一種對(duì)目標(biāo)和背景倒數(shù)熵進(jìn)行加權(quán)平均的新閾值分割方法。為了確定合適的加權(quán)值,結(jié)合圖像質(zhì)量評(píng)價(jià)準(zhǔn)則——均勻性測(cè)度和量子粒子群優(yōu)化算法對(duì)權(quán)值進(jìn)行自適應(yīng)選取。
與之相對(duì)應(yīng)的目標(biāo)熵(Ho(t))和背景熵(HB(t))分別定義為:
(1)
(2)
最大Shannon熵[7]閾值分割法將目標(biāo)和背景的信息熵之和作為準(zhǔn)則函數(shù),即
H(t)=HO(t)+HB(t)
(3)
(4)
(5)
(6)
倒數(shù)熵最優(yōu)閾值t*選取為:
(7)
在上述的基于信息熵的閾值分割方法中,采用的目標(biāo)函數(shù)η1(t)是由KAPUR等[7]提出的目標(biāo)和背景的信息熵之和,即
η1(t)=HO(t)+HB(t)
(8)
最佳閾值t*通過選取最大化該目標(biāo)函數(shù)來實(shí)現(xiàn),即
(9)
BRINK[16]通過分析二維灰度直方圖提出一種對(duì)目標(biāo)熵和背景熵取小的準(zhǔn)則函數(shù),該方法通過對(duì)背景和目標(biāo)類中的最小熵進(jìn)行最大化來尋求最佳分割閾值?;诖?,得到另外一種基于信息熵的閾值分割方法,其準(zhǔn)則函數(shù)η2(t)為:
η2(t)=min(HO(t),HB(t))
最佳閾值t*選取為:
(10)
在實(shí)際的圖像分割中,KAPUR提出的最大熵閾值法因其對(duì)灰度分布的假設(shè)最弱,其適應(yīng)性較強(qiáng)。但在實(shí)際情況下其分割效果會(huì)比BRINK提出的熵取小法效果差一些[16]。基于此,本研究提出一種能綜合最大熵閾值法和熵取小法這2種方法分割性能的新型倒數(shù)熵閾值分割法。
通過上面對(duì)現(xiàn)有的基于信息熵閾值分割方法的分析和比較,本研究提出一種基于倒數(shù)熵的加權(quán)平均閾值化方法。具體的推導(dǎo)過程如下:
對(duì)于任意的2個(gè)實(shí)函數(shù)f1(t)和f2(t),顯然以下的關(guān)系成立:
min(f1(t),f2(t))≤mf1(t)+(1-m)f2(t)≤
max(f1(t),f2(t))
(11)
式中:m為權(quán)重參數(shù),且0≤m≤1,mf1(t)+(1-m)f2(t)可以看作f1(t)和f2(t)的加權(quán)平均。
對(duì)于2個(gè)非負(fù)的函數(shù)f′1(t)和f′2(t),由式(11)可以得出下面的關(guān)系式成立:
min(f′1(t),f′2(t))≤mf′1(t)+(1-m)f′2(t)≤f′1(t)+f′2(t)
(11′)
式中:0≤m≤1為權(quán)重參數(shù),mf′1(t)+(1-m)
f′2(t)可以看作f′1(t)和f′2(t)的加權(quán)平均。
(12)
(13)
由式(12)和以上的分析可以看出,當(dāng)m=0.5時(shí),加權(quán)平均倒數(shù)熵閾值法就成為最大倒數(shù)熵閾值法,當(dāng)m=0或m=1時(shí),加權(quán)平均倒數(shù)熵閾值法就成為倒數(shù)熵取小法。進(jìn)一步分析表明,本文提出的加權(quán)平均倒數(shù)熵閾值分割法的思路同樣適用于Shannon熵、Renyi熵、Tsallis熵閾值分割法,所以本文提出的分割方法可看作是對(duì)信息熵閾值分割法的一個(gè)補(bǔ)充,熵取小法和最大熵閾值法可看作本研究提出的熵閾值法的特例。
(1984年1月6日講座,全文略有刪節(jié)。吳培華教授提供講座錄音,史悠整理,劉祥安教授審閱,在此特申謝忱?。?/p>
如何選取合適的權(quán)重參數(shù)m是使用加權(quán)平均倒數(shù)熵閾值法對(duì)圖像進(jìn)行分割的關(guān)鍵。這里采用量子粒子群優(yōu)化(Quantum-behaved Particle Swann Optimization,QPSO)算法,以均勻性測(cè)度[15]作為圖像分割質(zhì)量評(píng)價(jià)指標(biāo),對(duì)權(quán)重參數(shù)m在(0,1)區(qū)間進(jìn)行自適應(yīng)選取。均勻性測(cè)度主要用來衡量區(qū)域內(nèi)的一致性,區(qū)域內(nèi)的均勻性與該區(qū)域內(nèi)的方差成反比,區(qū)域內(nèi)的方差越小,則均勻性測(cè)度越大,圖像分割效果越好。
假設(shè)閾值t將圖像分為目標(biāo)和背景2個(gè)不同的區(qū)域,分別記為Ri,i= 1, 2,則均勻性測(cè)度UM(t)定義為:
(14)
最佳權(quán)重參數(shù)m*可選為:
(15)
由于m可取(0,1)內(nèi)的任意實(shí)數(shù),窮舉搜索算法無法實(shí)現(xiàn),因此采用QPSO優(yōu)化算法來尋找其最優(yōu)解。
粒子群優(yōu)化(Particle Swann Optimization,PSO)算法最早源于對(duì)鳥類群體覓食行為的研究,通過模擬鳥群的捕食行為來實(shí)現(xiàn)優(yōu)化問題的求解,它最先由文獻(xiàn)[17]提出。PSO算法將每個(gè)粒子看作是在多維搜索空間中的一個(gè)沒有質(zhì)量和體積的微粒,并在搜索空間中以一定的速度飛行,通過不斷迭代趨近于最優(yōu)解。PSO算法的迭代方程如下:
Vi=ωVi+c1r1(Pi-Xi)+c2r2(Gbest-Xi)
(16)
Xi=Xi+Vi
(17)
式中:慣性因子ω為非負(fù)數(shù);2個(gè)學(xué)習(xí)因子c1和c1為非負(fù)常數(shù);r1和r2為相互獨(dú)立的介于(0, 1)之間的隨機(jī)數(shù);Xi和Vi分別為種群中粒子i的位置和速度;Pi為第i個(gè)粒子的最優(yōu)位置;Gbest為群體中所有粒子的最佳位置。
迭代終止條件通常是根據(jù)實(shí)際問題設(shè)置的最大迭代次數(shù),或粒子群進(jìn)行搜索時(shí)尋找到的滿足預(yù)先設(shè)定的最小適應(yīng)閾值的最優(yōu)位置。
在基本PSO算法中,粒子是在經(jīng)典力學(xué)的狀態(tài)下沿著確定的軌跡飛行,因此粒子搜索的空間是一個(gè)有限的區(qū)域,因而不能保證一定找到全局最優(yōu)解。文獻(xiàn)[18]將量子理論引入經(jīng)典PSO算法,提出了一種全局收斂的量子粒子群優(yōu)化(QPSO)算法。該方法對(duì)整個(gè)PSO算法的搜索策略進(jìn)行了改變,其迭代方程中不再需要速度向量,僅需要粒子的位置向量,使得迭代方程的形式更簡(jiǎn)單,參數(shù)更少,因而更容易控制。通過蒙特卡羅隨機(jī)模擬的方式可得到粒子的位置方程,具體的QPSO算法迭代方程如下:
p=aPi+(1-a)Gbest
(18)
(19)
(20)
(21)
式中:a和u為(0,1)區(qū)間的隨機(jī)數(shù);N為粒子的數(shù)目;D為粒子的維數(shù);Pi為第i個(gè)粒子的最佳位置;Gbest為群體中所有粒子的最佳位置;p為每個(gè)粒子的勢(shì)中心點(diǎn);mbest為Pi的均值;β為收縮擴(kuò)張系數(shù),它是QPSO算法中的一個(gè)非常重要的參數(shù)。
β隨迭代次數(shù)從1線性減小到0.5,第t次迭代時(shí)的β一般可取為[18]:
(22)
式中:Maxiter為算法的最大迭代次數(shù)。
QPSO算法可由以下幾個(gè)步驟實(shí)現(xiàn):
Step 1:粒子群初始化。對(duì)于QPSO 算法,需要初始化的參數(shù)有2類:(1)粒子群的規(guī)模N、粒子的維數(shù)D和最大迭代次數(shù)Maxiter;(2)每個(gè)粒子的初始位置x。由于參數(shù)m是一維的,故粒子群的維數(shù)D=1,粒子的個(gè)數(shù)隨機(jī)選取,這里選取N=10個(gè)粒子,最大迭代次數(shù)Maxiter選取為50。每個(gè)粒子代表一組參數(shù),第i個(gè)粒子的初始位置為xi,其中xi=rand(0,1)。
Step 2:計(jì)算10個(gè)粒子的適應(yīng)度值。對(duì)于第i個(gè)粒子,利用式(13)計(jì)算加權(quán)平均倒數(shù)熵(m=xi),選取圖像最佳閾值;然后再利用式(15)計(jì)算對(duì)應(yīng)第i個(gè)粒子的適應(yīng)度值。重復(fù)上述過程計(jì)算所有粒子的適應(yīng)度值。
Step 3:將每個(gè)粒子的當(dāng)前適應(yīng)度值與其所經(jīng)歷過的歷史最好位置的適應(yīng)值進(jìn)行比較。如果更好,則用當(dāng)前位置更新個(gè)體歷史最好位置,反之,保持原來個(gè)體歷史最好位置不變。
Step 4:將每個(gè)粒子的當(dāng)前適應(yīng)度值和群體所經(jīng)歷的歷史最好位置的適應(yīng)度值進(jìn)行比較。若更好,更新群體歷史最好位置,反之,保持不變。
Step 5:根據(jù)式(20)或式(21)進(jìn)行粒子位置的更新。
Step 6:根據(jù)最大迭代次數(shù)或足夠好的粒子位置,判斷算法是否終止,如果終止條件滿足的話,則結(jié)束,否則,轉(zhuǎn)Step 2。
通過對(duì)大量不同類型的圖像分別進(jìn)行實(shí)驗(yàn),來說明本文方法的有效性?,F(xiàn)選取其中的4幅圖像對(duì)實(shí)驗(yàn)結(jié)果加以說明。這4副不同類型的圖像分別是普通Lena、光照不均勻Number、局部細(xì)節(jié)特征較多Cameraman和醫(yī)學(xué)CT圖像,如圖1所示。圖2給出了最大Shannon熵、Kapur最大倒數(shù)熵法、Brink倒數(shù)熵取小法及本文提出的加權(quán)平均倒數(shù)熵算法(Weighed Average Reciprocal Entropy, WARE)的分割結(jié)果。表1列出了這4種方法的分割閾值及加權(quán)平均倒數(shù)熵算法中權(quán)重參數(shù)m的取值。
圖1 原圖Fig.1 Original images
(a) 最大Shannon熵分割結(jié)果
(b) Kapur最大倒數(shù)熵法分割結(jié)果
(c) Brink倒數(shù)熵取小法分割結(jié)果
(d) 加權(quán)平均倒數(shù)熵法分割結(jié)果
由圖2(a) 的分割結(jié)果可以看出,除了普通Lena圖像,對(duì)于光照不均勻的車牌圖像、背景局部細(xì)節(jié)特征較多的Cameraman圖像和醫(yī)學(xué)CT圖像,傳統(tǒng)的最大Shannon熵方法已經(jīng)失效,不能對(duì)圖像實(shí)現(xiàn)有效的分割。
由圖2(b)和圖2(c)可以看出,Kapur最大倒數(shù)熵法、Brink倒數(shù)熵取小法和傳統(tǒng)Shannon法一樣,除了對(duì)普通Lena圖像能夠取得比較好的分割效果外,對(duì)其他3種不同特征的圖像均已失效。而加權(quán)調(diào)和平均倒數(shù)熵閾值法(圖2(d)所示)由于充分考慮了目標(biāo)和背景倒數(shù)熵的不同權(quán)重,對(duì)這幾種不同特征的圖像都能獲得較好的分割效果。
對(duì)比普通Lena圖像的分割結(jié)果,結(jié)合表1可以看出,本文提出的加權(quán)平均法在權(quán)重參數(shù)m=0.408 1時(shí),取得最佳閾值t=117,其結(jié)果與Kapur法、Brink法和Shannon法的分割效果基本相同。而從光照不均勻的Number圖像、局部細(xì)節(jié)特征較多的Cameraman圖像和醫(yī)學(xué)CT圖像的分割結(jié)果來看,Kapur倒數(shù)熵法、Brink倒數(shù)熵取小法和最大Shannon熵法已全部失效,不能有效地把目標(biāo)從圖像中提取出來。相反地,因充分考慮到目標(biāo)和背景類的先驗(yàn)熵對(duì)分割作用的不同影響,用加權(quán)平均代替算術(shù)平均的方法可取得令人滿意的分割結(jié)果。這也表明,本文提出的加權(quán)平均倒數(shù)熵法對(duì)實(shí)際圖像的分割具有更好的適應(yīng)性,可以推廣到其他熵閾值的分割方法中。
表1 4種方法的分割閾值Table 1 Comparison of segmentation thresholds by 4 methods
本文通過分析傳統(tǒng)最大熵閾值分割算法定義域的局限性及目標(biāo)和背景類對(duì)圖像分割所起的不同作用,提出了一種基于倒數(shù)熵進(jìn)行加權(quán)平均的新型閾值分割算法。該閾值分割法的準(zhǔn)則函數(shù)是目標(biāo)和背景信息倒數(shù)熵的加權(quán)平均。同時(shí),為了尋求最優(yōu)的權(quán)重參數(shù)m,采用圖像分割均勻性評(píng)價(jià)準(zhǔn)則并結(jié)合量子粒子群優(yōu)化算法進(jìn)行全局尋優(yōu)來尋找權(quán)重值。大量的實(shí)驗(yàn)結(jié)果表明,本文提出的加權(quán)平均倒數(shù)熵方法,能根據(jù)實(shí)際的圖像對(duì)權(quán)重參數(shù)進(jìn)行自適應(yīng)選取,比傳統(tǒng)熵閾值法能獲得更好的分割結(jié)果,更具有普遍實(shí)用性。