倫向敏,侯一民,2
(1.東北電力大學 自動化工程學院,吉林 吉林132012;2.佐治亞大學 計算機系,喬治亞州 雅典城30605)
目前常用的圖像自動閾值分割方法較多,例如基于區(qū)域的圖像分割[1-3]、基于邊緣的圖像分割[1,4]、大津分割[5]、不變矩分割[6],此外,最大熵分割也廣泛應用。
熵是衡量系統(tǒng)混亂程度的量,一個系統(tǒng)自然發(fā)展的過程,是一個熵增加的過程,也就是說,系統(tǒng)的發(fā)展是趨于無序的,是能量的均衡的過程[7,8]。當系統(tǒng)達到平衡,則熵達到最大。
香農(nóng)將熵的概念引入到信息論中,將熵定義為如下形式
式中:H——整個系統(tǒng)或者過程的熵值,i——系統(tǒng)或者過程中的隨機事件,因此,p(i)是指某隨機過程在整個系統(tǒng)或者過程中出現(xiàn)的概率,log是取對數(shù)函數(shù)[9,10]。
在信息論中,熵值代表了整個系統(tǒng)或過程的無序性,也代表了信息分部的均勻程度,信息分部越均勻,則系統(tǒng)的熵值就越大。在進行圖像分割的時候,往往將整個圖像看作系統(tǒng),圖像中的像素值視為系統(tǒng)中的各個隨機過程。在一般的圖像中,往往都包含兩個部分,即目標和背景,圖像分割就是將圖像的目標和背景區(qū)分開來的過程,而目標和背景都在圖像中占有一定的比例,包含了大量的信息。在圖像分割的過程中,如果信息分部的越均勻,說明分割結果越趨于合理。最大熵分割符合了以上的假設,即,在分割過程中,盡量使整個圖像分割結果的熵值達到最大。最大熵分割等自動閾值選取的優(yōu)點是無需操作者自行選擇分割閾值。但很多時候自動選擇的閾值并不能滿足分割結果的需求,其主要的問題是一些圖像的細節(jié)部分不能充分分割出來。
本文提出了一種基于最大熵分割的迭代分割方法,其主要目的是針對圖像中的細節(jié)部分進行分割,在最大熵分割的基礎上,自動選擇更加準確的閾值,提高圖像細節(jié)部分的分割效果。本方法將最大熵分割在圖像數(shù)據(jù)中運行,并將分割結果中的待定部分作為下一次迭代的數(shù)據(jù)源,通過多次運行最大熵分割方法最終求取分割閾值。實驗中通過多幅常用圖像,體現(xiàn)了本文的分割方法的對圖像細節(jié)部分的分割效果。
二維灰度圖像的最大熵二值分割過程中,將圖像像素看作整個系統(tǒng)中的一個隨機過程,那么根據(jù)信息論中熵的定義,給定圖像之后,圖像的熵就已經(jīng)可以根據(jù)式 (2)計算得到
式中:his(i)——圖像直方圖中像素值出現(xiàn)的概率。
而最大熵分割并不是指整個原始圖像的熵,而是分割之后的熵。其標準是圖像分割完成之后,目標部分的熵加上背景部分的熵,其和值達到最大。可以用式 (3)表示熵值之和
則最佳的分割閾值Th滿足如下條件
以上的分割過程中,根據(jù)最大熵原理分割之后,如果準確的將目標和背景分割開,則目標類和背景類中,像素值的分布都達到最均勻,因此兩部分的熵之和達到最大;反之,如果分割不準確,則目標類中存在背景數(shù)據(jù),或者背景類中存在目標數(shù)據(jù),則混合類中的像素分布就不能達到最均勻,其熵值也不能達到最大。
在灰度圖像的二值分割中,分割閾值Th分布在目標和背景兩類中間,可以將大部分的目標和背景像素分割開來。但圖像中經(jīng)常有細節(jié)部分,其像素值處于分割閾值Th 附近,此時分割閾值的準確性就決定了圖像中這些細節(jié)部分的分割效果。如圖1所示,圖中左邊為原始的圖像,為斑馬魚 (Zebrafish)圖像;中間為圖像直方圖,根據(jù)最大熵分割方法,選擇最佳閾值為128,如圖中黑線所示;右邊為最大熵分割結果。由圖中可以看出,原始圖像中,較為重要的細節(jié)部分,即魚的尾部的邊界 (如圖中圓環(huán)中部分),魚的脊髓 (如圖中橢圓部分),分割結果并不理想。
圖1 原始最大熵分割實例
根據(jù)以上敘述,原始的最大熵分割方法并不能滿足圖像中細節(jié)部分的要求,可能會丟失很多重要的細節(jié)信息。因此,本文提出了迭代最大熵分割方法解決此問題。
根據(jù)最大熵分割的描述,可以自動選擇圖像分割閾值,但是在選定的閾值附近的像素,可能會體現(xiàn)一些圖像細節(jié),如果閾值選擇不準確,則會影響圖像細節(jié)部分的分割結果。本文提出了一種迭代的最大熵分割方法。方法中,在整個圖像領域內迭代使用最大熵分割,最終選定分割閾值。具體的流程可以描述為:①針對整個圖像進行最大熵分割,選定閾值Th(1),計算目標與背景兩類的均值U1(1),U2(1);②選定圖像像素值域中小于U1(1)的像素為一類,大于U2(1)的像素為另一類,將剩余部分,即大于等于U1(1)且小于等于U2(1)的像素視為下一次迭代的數(shù)據(jù)源;③利用該數(shù)據(jù)源作為下一次迭代的分割目標,重復步驟①和步驟②,直到滿足迭代結束條件。
如何定義迭代完成的條件是本算法中的關鍵問題。本文中提出了如下的迭代結束條件:由于給定了圖像之后,就可以計算圖像的統(tǒng)計信息,經(jīng)過每一次迭代,都會有一些圖像中的像素被確定分類。兩類的均值之間的距離不斷減少,最佳分割閾值的變化也不斷減小。因此,本文以最佳閾值的變化作為迭代結束條件,在以下的實驗中,采用了8位灰度圖像,其像素值域為0至255,當?shù)趎+1次迭代最佳分割閾值相對第n次迭代的最佳分割閾值變化少于3的時候,則結束迭代。以上迭代步驟可以描述為如圖2所示的流程。
圖2 迭代最大熵分割方法流程
根據(jù)以上的迭代分割方法,針對圖1中的原始圖像進行分割,結果如圖3所示。
由圖3可以看出,原始的最大熵分割確定了最佳的閾值為128,分割結果中并未將原始圖像中細節(jié)部分體現(xiàn)出來,如圖1中第一次分割結果所示。隨著迭代次數(shù)的增加,分割閾值發(fā)生了一定的變化。第二次迭代的分割閾值變?yōu)?35,第三次分割閾值變?yōu)?57,第四次閾值結果為162,最后一次迭代結果為176。經(jīng)過5次迭代,待定區(qū)域的像素比例不斷減少,如圖3的最后一個分割結果所示,第一次迭代后,待定區(qū)域的比例為53%,第二次迭代待定區(qū)域比例為27.3%,第三次迭代待定區(qū)域比例為11.2%,第四次迭代待定區(qū)域比例為5.39%,最后一次迭代待定區(qū)域比例為2.92%。最后一次迭代結束,分割結果已經(jīng)能夠體現(xiàn)Zebrafish的一些細節(jié)信息了,例如外形及脊髓,如圖3中最后的分割結果所示。
本文采用了3幅圖像作為實驗數(shù)據(jù),其中包括了一幅人工合成圖像,兩幅自然圖像。
在圖4所示的實驗中,采用了人工合成的圖像作為實驗對象。其中第一幅為原始圖像,圖像所有像素被分為幾類并加入了高斯噪聲,最終得到的原始圖像的直方圖如最后一幅圖所示。共有5類,其中4類加入了高斯噪聲,另一類是值為255的像素。5類中的4類像素比例與另一類相差較大。經(jīng)過原始的最大熵分割,之后進行迭代,經(jīng)過6次迭代得到最終分割結果。從結果可以看出,經(jīng)過多次迭代之后,最終的分割結果最接近手動分割結果。
圖3 迭代最大熵分割方法實例
第二組實驗采用的是細胞圖像ipexcell。圖5第一幅為原始細胞圖像,經(jīng)過第一次最大熵分割之后得到了如第二幅小圖所示的結果。圖中細胞體并未完整的體現(xiàn)在分割結果中,因此,采用了迭代最大熵分割方法,經(jīng)過5 次迭代之后,得到了如第6幅小圖所示的結果。其中的閾值變化如直方圖中所示。
圖4 合成圖像迭代最大熵分割方法結果
圖5 細胞圖像迭代最大熵分割方法結果
本文提出了一種迭代的最大熵分割方法。主要思想是針對灰度圖像,多次運用最大熵分割方法優(yōu)化分割閾值,最終得到分割結果。其主要目的是更加準確的體現(xiàn)一些像素值處于分割閾值附近的圖像細節(jié)。運用本文的方法共進行了4組實驗,包括了斑馬魚圖像,細菌圖像,細胞圖像和人工合成圖像的分割,結果體現(xiàn)了迭代的最大熵分割方法較之原始的最大熵分割,在優(yōu)化分割閾值上有很大的優(yōu)勢,能夠經(jīng)過多次分割體現(xiàn)圖像中一些不易分割的細節(jié)部分。
[1]KONG Dingke,WANG Guozhao.Region-similarity based active contour model for SAR image segmentation [J].Journal of Computer-Aided Design &Computer Graphics,2010,22 (9):1554-1562 (in Chinese).[孔丁科,汪國昭.基于區(qū)域相似性的活動輪廓SAR 圖像分割 [J].計算機輔助設計與圖形學學報,2010,22 (9):1554-1562.]
[2]WU Shilin,GENG Jiajia,ZHU Feng,et al.Region-based multi-class object recognition and segmentation [J].Journal of Image and Graphics,2011,16 (9):1607-1616 (in Chinese).[吳士林,耿佳佳,朱楓,等.基于區(qū)域的多類目標識別與分割算法研究 [J].中國圖象圖形學報,2011,16 (9):1607-1616.]
[3]Wang Lingfeng,Pan Chunhong.Robust level set image segmentation via a local correntropy-based K-means clustering [J].Pattern Recognition,2014,47 (5):1917-1925.
[4]Qi Donga,Liu Yanli,Zhao Qijun,et al.Detecting soft shadows in a single outdoor image:From local edge-based models to global constraints[J].Computers & Graphics,2014,38:310-319.
[5]ZHAO Xiangwen,JIN Guowang,XU Jingxuan,et al.Pseudo-color quantization of SAR data based on multi-threshold Otsu method of histogram segmentation [J].Journal of Zhengzhou Institute of Surveying and Mapping,2012,29 (6):445-450(in Chinese).[趙向文,靳國旺,許競軒,等.基于多閾值大津法直方圖分割的SAR 數(shù)據(jù)偽彩色量化方法 [J].測繪科學技術學報,2012,29 (6):445-450.]
[6]Marin D,Aquino A,Gegundez-Arias ME,et al.Supervised method for blood vessel segmentation in retinal images by using gray-level and moment invariants-based features [J].IEEE Transactions on Medical Imaging,2011,30 (1):146-158.
[7]Jose S Canovas,María Munoz Guillermo.Computing topological entropy for periodic sequences of unimodal maps[J].Commun Nonlinear Sci Numer Simulat,2014,19 (9):3119-3127.
[8]Umberto Lucia.Entropy generation approach to cell systems[J].Physica A:Statistical Mechanics and its Applications,2014,406 (15):1-11.
[9]Sun Lin,Xu Jiucheng.Information entropy and mutual information-based uncertainty measures in rough set theory [J].Applied Mathematics &Information Sciences,2014,8 (4):1973-1985.
[10]Dai Jianhua,Tian Haowei.Entropy measures and granularity measures for set-valued information systems[J].Information Sciences,2013,240 (10):72-82.