聶方彥,屠添翼,潘梅森,周慧燦
湖南文理學(xué)院 圖形圖像處理技術(shù)研究所,湖南 常德415000
圖像分割作為圖像處理后期階段任務(wù)的基礎(chǔ),是計(jì)算機(jī)視覺研究的重要內(nèi)容之一,在圖像分析、理解和目標(biāo)檢測、識(shí)別與跟蹤中具有重要的意義[1]。把人體目標(biāo)作為研究對象已成為計(jì)算機(jī)視覺領(lǐng)域中的一個(gè)熱點(diǎn)問題。人體目標(biāo)分割是智能監(jiān)控、高級人機(jī)接口、人體運(yùn)動(dòng)分析、人體行為理解等領(lǐng)域的一個(gè)先決條件,當(dāng)前研究主要集中于可見光視覺領(lǐng)域,經(jīng)過十幾年已取得了很大的發(fā)展[2]。
與可見光相比,紅外波長遠(yuǎn)超可見光譜,因此具有獨(dú)待的成像能力。最近十幾年隨著熱傳感技術(shù)的發(fā)展,設(shè)備成本急劇降低,紅外(熱)傳感器已廣泛用于各領(lǐng)域,如軍事、交通、安保、醫(yī)學(xué)等。由于紅外傳感器本身固有的特點(diǎn),紅外圖像與可見光圖像相比,普遍存在目標(biāo)與背景對比度低,目標(biāo)的邊緣模糊與噪聲較大,分辨細(xì)節(jié)能力較差等特點(diǎn),而且圖像的先驗(yàn)知識(shí)較少,因此紅外圖像的精確分割是比較困難的任務(wù)[3]。
目前,專門針對紅外人體圖像分割的文獻(xiàn)還比較少見,把已有的圖像分割算法用于紅外人體圖像分割,由于紅外成像的獨(dú)特特點(diǎn),并不能取得很好的結(jié)果。基于此,本文提出了一種新的有效的紅外人體圖像分割方法。在廣義熵——Renyi 熵[4]的基礎(chǔ)上定義一種新的模糊熵,也即模糊Renyi 熵,使用窮舉搜索法把這種新的模糊熵用于紅外人體圖像分割,實(shí)驗(yàn)取得了較好的結(jié)果。為了加快最優(yōu)分割閾值的獲取,設(shè)計(jì)了一種基于混沌理論[5]的模擬退火算法[6],即混沌模擬退火(Chaos Simulated Annealing,CSA)算法用于最優(yōu)分割閾值的選取。實(shí)驗(yàn)表明,本文方法不僅取得了令人滿意的分割結(jié)果,而且也大大降低了紅外人體圖像分割的時(shí)間。
一幅大小為m×n,具有L 級灰度的數(shù)字圖像可以表示為I={f(x,y)},這里x=1,2,…,m;y=1,2,…,n;f(x,y)∈{0,1,…,L-1} 。它的歸一化灰度直方圖H={h(l)|l=0,1,…,L-1}可通過下式計(jì)算:
其中,nl表示圖像中具有l(wèi) 級灰度的像素?cái)?shù)。應(yīng)用模糊集理論進(jìn)行圖像閾值分割時(shí),把數(shù)字圖像看做一個(gè)模糊集,這就意味著圖像中目標(biāo)O 與背景B 的灰度級各具有一個(gè)受限于下式的模糊隸屬度函數(shù):
其中,μO、μB分別表示目標(biāo)、背景的隸屬度函數(shù)。在閾值化時(shí)哪類隸屬度函數(shù)值大,就把該灰度級歸類到相應(yīng)類中。
把一幅圖像映射到一個(gè)模糊域,根據(jù)模糊集理論有多種函數(shù)可供選擇,如三角函數(shù)、S-函數(shù)、Z-函數(shù)以及π -函數(shù)等。在本文研究中,選擇S-函數(shù)、Z-函數(shù)作為模糊隸屬度函數(shù),即
這里l 是圖像灰度級,變量a、b、c 是決定模糊區(qū)間形狀的參數(shù),滿足條件0 ≤a ≤b ≤c ≤L-1。當(dāng)找到一個(gè)最佳的模糊區(qū)間(a,b,c)時(shí),最佳分割閾值可用下式計(jì)算得到:
應(yīng)用模糊隸屬度函數(shù)把一幅圖像映射到一個(gè)模糊域,即P=(μ(0)h(0),μ(1)h(1),…,μ(L-1)h(L-1)) ,從中分別可得到圖像目標(biāo)O 與背景B 的分布:
根據(jù)Renyi 熵定義[4],把圖像目標(biāo)O 與背景B 關(guān)于熵指數(shù)α 的模糊Renyi熵定義為:
應(yīng)用定義的模糊熵進(jìn)行圖像閾值分割時(shí),根據(jù)Renyi熵的可加性原則,使用最大熵原理[7]求取最佳閾值,即
從第2 章可以看出,用模糊隸屬度函數(shù)把一幅圖像映射到一個(gè)模糊域,需要用到三個(gè)參數(shù),如果用窮盡方法搜索這三個(gè)最佳參數(shù),算法時(shí)間復(fù)雜度是O(L3),將耗費(fèi)很長時(shí)間。模擬退火算法作為一種優(yōu)秀的數(shù)值優(yōu)化算法,自1983 年提出以來[6],在很多工程領(lǐng)域取得了成功的應(yīng)用[8-9],為了加快圖像分割算法的收斂速度,研究中采用了模擬退火算法進(jìn)行最優(yōu)分割閾值的選取。原始模擬退火算法在某些數(shù)值優(yōu)化問題中表現(xiàn)出收斂較慢,且不穩(wěn)定等問題,為了克服這些問題,設(shè)計(jì)了一種基于混沌理論[5]的模擬退火算法。
混沌(Chaos)是自然界中一種常見的非線性現(xiàn)象。混沌變量看似雜亂的變化過程其實(shí)含有內(nèi)在的規(guī)律性,利用混沌變量的隨機(jī)性、遍歷性及規(guī)律性可以進(jìn)行優(yōu)化搜索。引入混沌序列的搜索算法可在原始模擬退火算法迭代中產(chǎn)生局部最優(yōu)解的許多鄰域點(diǎn),以此幫助惰性解逃離局部極值點(diǎn),并快速搜尋到最優(yōu)解。混沌理論(Chaos Theory)[5]自1963 年被Edward Lorenz 提出以來,混沌學(xué)說在工程科學(xué)等領(lǐng)域得到了廣泛的研究[10],近年來有學(xué)者把混沌學(xué)說引入數(shù)值優(yōu)化問題并取得了很好的結(jié)果[11]。
為了構(gòu)造混沌模擬退火算法,首先引入著名的一維logistic映射[12]混沌系統(tǒng):
其中,xt表示混沌變量x 在第t 次迭代的值,λ 是分歧參數(shù),一般取λ=4。logistic 映射具有依賴于混沌初始條件的遍歷性、隨機(jī)性及敏感性等特性。
混沌模擬退火算法如下所示:
步驟1混沌初始化。初始化混沌變量及最優(yōu)解初值x0。
步驟2初始化模擬退火初始退火溫度Tmax、最小退火溫度Tmin、退火速率β、最大迭代次數(shù)Imax;設(shè)置當(dāng)前退火溫度T=Tmax,迭代計(jì)數(shù)器IC=0;設(shè)置當(dāng)前最優(yōu)解x*=x0,當(dāng)前最優(yōu)評價(jià)函數(shù)值f*=f(x*)。
步驟3
while(T >Tmin)do
i.While(IC ≤Imax)do
(1)用混沌擾動(dòng)方法產(chǎn)生一個(gè)滿足條件的新解xnew;
(2)計(jì)算各解的評價(jià)函數(shù)之間的差值:ΔF*=f(xnew)-f(x*),ΔF=f(xnew)-f(xIC);
(3)如果ΔF*≤0, 更新當(dāng)前最優(yōu)解及函數(shù)最優(yōu)值:x*=xnew,f*=f(xnew);
(4)如果ΔF ≤0, 更新當(dāng)前解及函數(shù)值:xIC=xnew,fIC=f(xnew);
(5)如果ΔF >0,以概率exp(-ΔF/T)更新當(dāng)前解及當(dāng)前函數(shù)值;
(6)IC=IC+1;
ii.降低退火溫度:T=β×T
步驟4輸出最優(yōu)解。
運(yùn)用所提出的模糊Renyi 熵結(jié)合設(shè)計(jì)的混沌模擬退火算法對紅外人體圖像進(jìn)行分割,首先設(shè)置一個(gè)混沌變量初值v0,再從v0出發(fā)根據(jù)logistic 映射初始化三個(gè)用于對問題解進(jìn)行擾動(dòng)的混沌變量(v01,v02,v03)。在此設(shè)計(jì)中v0i=λ×v0×(1-v0)×rand(),i=1,2,3,rand()是一個(gè)介于(0,1)之間的隨機(jī)數(shù);求出需處理圖像的最大灰度級gmax及最小灰度級gmin, 生成一個(gè)初始解(a0,b0,c0),a0=gmin+(gmax-gmin)×v01,b0和c0也用類似方法產(chǎn)生。用以上方法產(chǎn)生的實(shí)驗(yàn)解并不能保證條件a ≤b ≤c 成立,所以需對產(chǎn)生的混沌解進(jìn)一步處理,在本文研究中直接對產(chǎn)生的混沌解進(jìn)行升序排序,然后用排序后的解作為滿足條件的實(shí)驗(yàn)解;評價(jià)函數(shù)設(shè)置為。具體算法描述如下:
步驟1輸入待處理紅外人體圖像。
步驟2初始模擬退火算法參數(shù),初始混沌變量,生成一個(gè)混沌初始解。
步驟3運(yùn)行混沌模擬退火算法。
步驟4輸出最優(yōu)解。
步驟5根據(jù)式(5)計(jì)算最優(yōu)閾值T*。
步驟6用T*對輸入圖像進(jìn)行閾值分割。
步驟3 中的混沌擾動(dòng)變量v(t+1)i=λ×vti×(1-vti),i=1,2,3,t 為迭代次數(shù),產(chǎn)生的新解為xnew=(anew,bnew,cnew),
其中anew=gmin+(gmax-gmin)×v(t+1)1,bnew和cnew用類似方法產(chǎn)生,新解生成后再進(jìn)行升序排序,作為符合條件的解參與迭代運(yùn)算。
實(shí)驗(yàn)所用計(jì)算機(jī)配置為Intel?CoreTM2 Duo CPU T8100 2.10 GHz,2 GB 內(nèi)存,編程語言為Matlab(R2007b)。實(shí)驗(yàn)中的紅外圖像取自IEEE OTCBVS WS Series Bench標(biāo)準(zhǔn)紅外人體圖像庫[13]與自拍的紅外人體圖像集。這些圖像集包含有不同季節(jié)、不同環(huán)境條件下拍攝的圖像,如雨、陰、晴、白天及夜視等不同條件。為了比較算法的魯棒性,將提出的方法其他方法與進(jìn)行了比較。這些方法包括:Kapur 等人提出的最大熵方法[7];Otsu 提出的著名的最大類間方差方法[14];Cheng 等人提出的模糊劃分熵方法[15];Luo等人提出的最大模糊熵方法[16];Sahoo 等人提出的Renyi 熵方法[17]。實(shí)驗(yàn)中混沌模擬退火方法的相關(guān)參數(shù)設(shè)置如下:Tmax=10,Tmin=0.000 01,β=0.9,v0=0.1;模糊Renyi 熵指數(shù)α經(jīng)過大量實(shí)驗(yàn)驗(yàn)證,當(dāng)紅外人體圖像有效灰度級數(shù)小于100時(shí)α取(0.1,0.3)之間的值,在其他情況下α?。?.7,0.9)范圍內(nèi)的值能取得較好的分割結(jié)果,在實(shí)驗(yàn)中根據(jù)圖像灰度分布情況分別取α=0.2 或α=0.8;Sahoo 等人提出的Renyi 熵方法中的熵指數(shù)參照文獻(xiàn)[18]取α=0.7。圖1 列出了兩幅典型的實(shí)驗(yàn)圖像,其中圖像(a)的有效灰度級數(shù)是52,圖像(b)的有效灰度級數(shù)是225。
圖1 原始紅外人體圖像
如圖2 為各方法對圖1 中圖像進(jìn)行閾值分割時(shí)獲得的最佳閾值及閾值結(jié)果圖像。
從圖2 可以看出:Otsu 方法對兩幅圖像都不能取得比較好的分割結(jié)果;Kapur及Sahoo 兩種熵方法對圖1(a)的分割結(jié)果比較好,但對圖1(b)較差;Cheng 提出的模糊劃分熵方法對兩幅圖像的分割結(jié)果都不好;Luo 提出的方法對圖1(b)較好,對圖1(a)卻較差;本文的方法對這兩幅圖像的分割都能得到較滿意的結(jié)果。在大量的圖像上進(jìn)行實(shí)驗(yàn),結(jié)果表明本文方法得到的分割圖像邊緣較光滑,人體目標(biāo)能比較好地與背景分離。
圖2 各方法對實(shí)驗(yàn)紅外人體圖像進(jìn)行分割時(shí)獲得的最佳閾值及分割圖像
為了說明所設(shè)計(jì)的混沌模擬退火算法的搜索性能,用窮盡搜索方法與CSA 方法結(jié)合提出的模糊熵對圖1 中圖像的分割效果進(jìn)行了比較,如表1 所示。
表1 窮盡法與CSA 方法的性能比較
從表1 可以看出,用混沌模擬退火算法結(jié)合提出的模糊熵對圖像進(jìn)行分割,得到最佳模糊區(qū)域參數(shù)值與閾值和用窮盡搜索方法得到的最佳模糊區(qū)域參數(shù)值與閾值非常接近,這說明本文提出的混沌模擬退火算法是效的。從圖像分割所需的時(shí)間上來說,對圖1(a)而言,窮盡法耗時(shí)是CSA 方法的70 倍,對圖1(b)而言,窮盡法耗時(shí)是CSA 方法的644 倍。兩圖像的有效灰度級分別為52 與225,因而窮盡法的耗時(shí)不同。但對于CSA 方法來說,在256 級圖像灰度級范圍內(nèi)不管圖像的有效灰度級是多少,它的搜索耗時(shí)間保持在0.8 s 左右,從這點(diǎn)來說,提出的方法是適合實(shí)時(shí)處理要求的。
根據(jù)紅外人體圖像特點(diǎn),提出用模糊Renyi 熵結(jié)合基于混沌理論的模擬退火算法對紅外人體圖像進(jìn)行閾值分割。將本文方法與幾種著名的圖像閾值分割方法在紅外人體圖像集上進(jìn)行實(shí)驗(yàn)。實(shí)驗(yàn)結(jié)果證明:提出的方法在對紅外人體圖像進(jìn)行分割時(shí)能得到較理想的結(jié)果,魯棒性優(yōu)于其他幾種方法;此外針對256 級紅外人體灰度圖像,本文方法在CPU 處理時(shí)間上僅需0.8 s 左右,從而也滿足了通常情況下的紅外圖像處理實(shí)時(shí)性要求。
[1] Sezgin M,Sankur B.Survey over image thresholding techniques and quantitative performance evaluation[J].J Electron Imaging,2004,13(1):146-165.
[2] Zhao T,Nevatia R.Bayesian human segmentation in crowded situations[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition,Madison,WI,2003,2:459-466.
[3] Fang Y,Yamada K,Ninomiya Y,et al.A shape-independent method for pedestrian detection with far-infrared images[J].IEEE Transactions on Vehicular Technology,2004,53(6):1679-1697.
[4] Renyi A.On measures of entropy and information[C]//Proceedings of the 4th Berkeley Symp on Mathematical Statistics and Probability.California:University of California Press,1961:547-561.
[5] Lorenz E N.Deterministic nonperiodic flow[J].Journal of the Atmospheric Sciences,1963,20:130-141.
[6] Kirkpatrick S,Gelatt C D.Optimization by simulated annealing[J].Sciences,1983,220:671-680.
[7] Kapur J N,Sahoo P K,Wong A K C.A new method for gray-level picture thresholding using the entropy of the histogram[J].Comput Vision Graphics Image Process,1985,29:273-285.
[8] 金杉,麥豐,任波.基于模擬退火算法的資源負(fù)載均衡方案[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(22):160-163.
[9] 楊衛(wèi)波,王萬良.求解24 數(shù)碼問題的改進(jìn)遺傳退火算法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(15):9-11.
[10] 張玉金,蔣品群,王文延.基于混沌的雙重變換域數(shù)字圖像擴(kuò)頻水印算法[J].計(jì)算機(jī)工程與應(yīng)用,2011,47(6):188-191.
[11] Ji M,Tang H.Application of chaos in simulated annealing[J].Chaos,Solitons and Fractals,2004,21:933-941.
[12] May R M.Simple mathematical models with very complicated dynamics[J].Nature,1976,261:459-474.
[13] IEEE OTCBVS WS Series Bench[DB/OL].[2011-08-01].http://www.cse.ohio-state.edu/otcbvs-bench/bench.html.
[14] Otsu N.A threshold selection method from gray-level histograms[J].IEEE Trans on Systems Man Cybernet,1979,9(1):62-66.
[15] Cheng H D,Chen J R,Li J.Threshold selection based on fuzzyC-partition entropy approach[J].Pattern Recognition,1998,31(7):857-870.
[16] Luo X,Tian J.ICM method for multi-level thresholding using maximum entropy criterion[C]//Proceedings of Internat Conf on Image Analysis and Processing,1999:108-113.
[17] Sahoo P,Wilkins C,Yeager J.Threshold selection using Renyi’s entropy[J].Pattern Recognition,1997,30(1):71-84.
[18] Sahoo P K,Arora G.A thresholding method based on two-dimensional Renyi’s entropy[J].Pattern Recognition,2004,37:1149-1161.