林倩倩, 歐聰杰
(華僑大學(xué) 信息科學(xué)與工程學(xué)院,福建 廈門 361021)
圖像閾值分割因其算法簡(jiǎn)單、計(jì)算量小、性能穩(wěn)定而成為應(yīng)用最廣泛的分割技術(shù)之一。該方法是假設(shè)圖像中的目標(biāo)和背景之間有較為明顯的視覺差異,則該圖像的灰度直方圖將呈現(xiàn)雙峰分布的結(jié)構(gòu),在雙峰之間的低谷處選擇閾值從而實(shí)現(xiàn)目標(biāo)和背景的分離。然而,由于圖像的任意性和復(fù)雜性,多數(shù)時(shí)候它們的直方圖分布并不呈現(xiàn)明顯的雙峰特征,針對(duì)這些情況,至今已提出了多種自動(dòng)選取閾值的分割方法,如最大類間方差法[1]、最大Shannon熵法[2]等,均得到有效應(yīng)用。其中基于最大Shannon熵法是通過最大化圖像灰度直方圖的Shannon熵,從而獲得最優(yōu)閾值來進(jìn)行圖像分割。為進(jìn)一步提高該方法的抗噪聲能力,該方法中的灰度直方圖也從一維分布被拓展到二維分布,在低信噪比的情況下,該方法也能取得較好的分割效果[3,4]。近年來,受到非廣延統(tǒng)計(jì)物理的啟發(fā),Shannon熵已被推廣到一種新的形式:Tsallis熵,以便更好地描述系統(tǒng)內(nèi)部的復(fù)雜相互作用[5,6],現(xiàn)已有越來越多的研究者將其引入到圖像閾值處理中[7~9]。值得一提的是,Tsallis熵在統(tǒng)計(jì)物理學(xué)中的引入是基于物理系統(tǒng)內(nèi)部存在的長(zhǎng)程相互作用這一實(shí)驗(yàn)背景的[10,11]。對(duì)應(yīng)于圖像處理,這種長(zhǎng)程作用可理解為圖像內(nèi)部各個(gè)像素點(diǎn)的灰度值之間存在的關(guān)聯(lián)[7~9],這種關(guān)聯(lián)有別于上文提到的領(lǐng)域像素點(diǎn)之間的關(guān)聯(lián),它是全局性的。然而,由于圖像類別的多樣性,并非所有圖像內(nèi)部的像素灰度關(guān)聯(lián)都是全局性的,例如:基于熱輻射原理的紅外成像,對(duì)于目標(biāo)整體而言,其表面各點(diǎn)的溫度分布存在一定聯(lián)系,導(dǎo)致目標(biāo)內(nèi)各像素的亮度值之間存在關(guān)聯(lián),但目標(biāo)和背景之間的溫度分布則未必相關(guān)?;诖耍疚奶岢隽艘环N新的閾值判斷標(biāo)準(zhǔn),結(jié)合二維直方圖的優(yōu)勢(shì),用于處理紅外成像、無損檢測(cè)等目標(biāo)和背景之間無明顯關(guān)聯(lián)的圖片。
Tsallis熵是Boltzmann-Gibbs-Shannon熵的推廣,其定義如下
(1)
式中n為灰度階,pi為圖像內(nèi)灰度值為i的像素點(diǎn)所占的百分比,實(shí)數(shù)q為一個(gè)描述像素點(diǎn)間長(zhǎng)程關(guān)聯(lián)強(qiáng)度的量,q的取值趨于1時(shí),長(zhǎng)程關(guān)聯(lián)消失,式(1)退化成Shannon的形式。Tsallis熵在數(shù)學(xué)上具有如下佯可加性
Hq(A+B)=Hq(A)+Hq(B)+(1-q)Hq(A)Hq(B).
(2)
在圖像的二值化處理中,A和B分別代表了目標(biāo)和背景,那么,上式右邊第三項(xiàng)就對(duì)應(yīng)于像素點(diǎn)的長(zhǎng)程關(guān)聯(lián)。需要指出的是,這種長(zhǎng)程關(guān)聯(lián)來自于Tsallis熵的內(nèi)在屬性,它不僅存在于目標(biāo)和背景之間,更存在于目標(biāo)(或背景)內(nèi)部的互不相鄰的像素點(diǎn)之間,調(diào)節(jié)q值使得閾值分割更為靈活、準(zhǔn)確。Sahoo P K等人[7]提出的基于二維最大Tsallis熵原理的閾值分割方法,進(jìn)一步提高了這類閾值分割法的抗噪能力。
設(shè)圖像的尺寸為M×N,灰度取值范圍為G={0,1,…L-1},f(x,y)表示圖像在坐標(biāo)為(x,y)處的像素灰度值,g(x,y)表示圖像在該像素k×k鄰域內(nèi)的灰度平均值,則{f(x,y),g(x,y)}∈G,1≤x≤M,1≤y≤N。若取k=3為例,則
(3)
式中 ?r」表示r的整數(shù)部分,則灰度值f=i且鄰域平均灰度值g=j的像素點(diǎn)出現(xiàn)的概率為
(4)
圖1 二維直方圖
(5)
(6)
將式(5)、式(6)代入式(1)可求得二維Tsallis目標(biāo)熵和背景熵分別為
(7)
(8)
Sahoo定義的準(zhǔn)則函數(shù)如下[7]
(9)
根據(jù)熵極值原理,使準(zhǔn)則函數(shù)Hq(s,t)獲得最大值的(s*,t*)則為最佳閾值,即
(10)
上述的Sahoo法在許多種類的圖片分割中都獲得了成功,但如前所述,圖像內(nèi)部各個(gè)像素點(diǎn)之間的關(guān)聯(lián)并非所有情況都是全局性的。例如:對(duì)于圖2中的PCB這張無損檢測(cè)圖片,背景的灰度相對(duì)比較均勻,而目標(biāo)部分的灰度差別較大。通過一維灰度直方圖分布也可以看出背景部分的像素點(diǎn)分布非常集中,形成尖峰,而目標(biāo)像素點(diǎn)的灰度分布則比較廣泛。由此可以判定該圖中背景像素的灰度值之間存在長(zhǎng)程關(guān)聯(lián),而目標(biāo)區(qū)域內(nèi)像素的灰度值關(guān)聯(lián)相對(duì)較弱,甚至可能并不存在?;诖?本文對(duì)Sahoo法進(jìn)行改進(jìn),提出一種新的閾值判斷準(zhǔn)則如下
(11)
利用上述提出的新的閾值判別準(zhǔn)則,本文對(duì)一些紅外線圖片和無損檢測(cè)圖片進(jìn)行了閾值分割實(shí)驗(yàn),發(fā)現(xiàn)該方法的結(jié)果準(zhǔn)確且抵抗噪聲穩(wěn)健。限于篇幅,現(xiàn)取其中的四幅圖像作為示例,見圖2~圖5(a),其中圖5(a)疊加有噪聲。從圖中可以看出:這些圖片具有如下共同特點(diǎn):1)一部分像素點(diǎn)的分布相對(duì)集中,而另一部分像素的分布范圍較廣;2)目標(biāo)和背景之間沒有明顯的全局性長(zhǎng)程關(guān)聯(lián)。一般情況下,q的合理取值范圍為0.5≤q≤1.0[6]。表1列出了Sahoo法和本文提出的方法對(duì)上述幾幅圖像進(jìn)行分割時(shí)得到的結(jié)果比較??梢钥闯?本文提出的方法得到的閾值對(duì)q值的變化響應(yīng)更加靈敏,這也驗(yàn)證了上述“局部長(zhǎng)程關(guān)聯(lián)”假設(shè)的有效性。將不同q值所對(duì)應(yīng)的分割結(jié)果與基準(zhǔn)圖進(jìn)行比對(duì),可以確定最佳的q值,如Pcb(q=0.9),Cell(q=0.8)等。表1的結(jié)論說明對(duì)于不同的圖像,它們內(nèi)部的關(guān)聯(lián)強(qiáng)度不會(huì)相同,符合自然界圖像的復(fù)雜性特征。而對(duì)于Sahoo法,在合理的q值范圍內(nèi),所得到的結(jié)果幾乎不變,因而,無法確定最佳q值。圖2~圖5列出了上述2種方法對(duì)這四幅測(cè)試圖像進(jìn)行閾值化時(shí)獲得的最佳分割結(jié)果,進(jìn)一步展示本文方法的有效性。
表1 測(cè)試圖片在不同q值下的閾值結(jié)果
圖2 PCB圖像及其最佳分割結(jié)果
圖3 Cell圖像及其最佳分割結(jié)果
圖4 Person圖像及其最佳分割結(jié)果
圖5 People圖像及其最佳分割結(jié)果
Tsallis熵是統(tǒng)計(jì)物理中用于描述內(nèi)部存在長(zhǎng)程相互作用系統(tǒng)的有效工具。若把圖像的灰度直方圖看成一種幾率分布,則可以利用這種熵的特性有效鑒別圖像內(nèi)部像素灰度間存在的關(guān)聯(lián)性。但由于自然界圖像的復(fù)雜性,并非所有的圖像內(nèi)部都存在均勻的全局性關(guān)聯(lián)?;诖?,本文對(duì)圖像灰度直方圖所包含的信息進(jìn)行分析并判斷其內(nèi)部的關(guān)聯(lián)特征,對(duì)于目標(biāo)和背景間不存在明顯關(guān)聯(lián)的圖片提出一種新的閾值判據(jù),這種方法建立在二維熵的基礎(chǔ)上,具有良好的抗噪性,并且兼顧了目標(biāo)和背景做為獨(dú)立分布時(shí)所包含信息的完整性,進(jìn)行閾值分離所得到的結(jié)果證明了這種方法的有效性。
參考文獻(xiàn):
[1] Otsu N.A threshold selection method from gray-level histogram-s[J].Automatica,1975,11(285-296):23-27.
[2] Kapur J N,Sahoo P K,Wong A K C.A new method for gray-level picture thresholding using the entropy of the histogram[J].Computer vision,graphics,and image processing,1985,29(3):273-285.
[3] Abutaleb A S.Automatic thresholding of gray-level pictures using two-dimensional entropy[J].Computer Vision,Graphics and Image Processing,1989,47 (1):22-32.
[4] Brink A D.Thresholding of digital images using two-dimensional entropies[J].Pattern Recognition,1992,25(8):803-808.
[5] Pathria R K.Statistical mechanics[M].Oxford:Perganon Press,1972.
[6] Tsallis C.Possible generalization of Boltzmann-Gibbs statistic-s[J].Journal of Statistical Physics,1988,52(1-2):479-487.
[7] Sahoo P K,Arora G.Image thresholding using two-dimensional Tsallis-Havrda-Charvát entropy[J].Pattern Recognition Letters,2006,27(6):520-528.
[8] 程淑紅,胡春海.利用最小Tsallis交叉熵的視頻對(duì)象分割算法[J].紅外與激光工程,2011,40(3):559-563.
[9] 吳一全,潘 喆,吳文怡.二維直方圖斜分Tsallis-Havrda-Charvát熵圖像閾值分割[J].光電工程,2008,35(7):53-58.
[10] La Porta A,Voth G A,Crawford A M,et al.Fluid particle accele-rations in fully developed turbulence[J].Nature,2001,409(6823):1017-1019.
[11] Liu B,Goree J.Superdiffusion and non-Gaussian statistics in a driven-dissipative 2D dusty plasma[J].Physical Review Letters,2008,100(5):055003.