姜 彬,施志剛
摘要:圖像分割是圖像處理中的一項關(guān)鍵技術(shù),也是一經(jīng)典難題,文章對近幾年來出現(xiàn)的圖像分割方法作了較為全面的分析,并對圖像分割技術(shù)的研究方向作了探討,對從事圖像處理學(xué)習(xí)與研究的人員具有一定的啟發(fā)作用。
關(guān)鍵詞:圖像分割;計算機(jī)視覺;圖像解析
中圖分類號:TP391文獻(xiàn)標(biāo)識碼:A文章編號:1009-3044(2009)35-10066-03
Image segmentation Technology Analysis and Prospect
JIANG Bin, SHI Zhi-gang
(Management & Information Department, Nantong Vocational & Technical Shipping College, Nantong 226010, China)
Abstract: Image segmentation is a key image processing techniques, is also a classic problem. This article of image segmentation method appeared in recent years gave a more comprehensive analysis, and discussed image segmentation research directions ,and also have some instructive effects on image processing, learning and research staff.
Key words: image segmentation; computer vision; image parsing
所謂圖像分割是指根據(jù)灰度、彩色、空間紋理、幾何形狀等特征把圖像劃分成若干個互不相交的區(qū)域,使得這些特征在同一區(qū)域內(nèi),表現(xiàn)出一致性或相似性,而在不同區(qū)域間表現(xiàn)出明顯的不同。簡單的講,就是在一幅圖像中,把目標(biāo)從背景中分離出來,以便于進(jìn)一步處理。
在圖象分割領(lǐng)域還沒有出現(xiàn)對任意圖象都適合的分割算法,如何根據(jù)不同行業(yè)圖像的特點,找出適應(yīng)行業(yè)具體需求的圖像分割算法,是我們追求的目標(biāo)。本文旨在對近幾年出現(xiàn)的圖像分割算法的分析總結(jié)的基礎(chǔ)上,對圖像分割技術(shù)研究的方向作出一些展望。
1 圖像分割常用的五種方法
1.1 對圖像特征、空間做分類的方法
常用的圖像特征有顏色特征、紋理特征、形狀特征、空間關(guān)系特征
1.1.1 顏色特征
顏色特征是一種全局特征,描述了圖像或圖像區(qū)域所對應(yīng)的景物的表面性質(zhì)。一般顏色特征是基于像素點的特征,此時所有屬于圖像或圖像區(qū)域的像素都有各自的貢獻(xiàn)。由于顏色對圖像或圖像區(qū)域的方向、大小等變化不敏感,所以顏色特征不能很好地捕捉圖像中對象的局部特征。另外,僅使用顏色特征查詢時,如果數(shù)據(jù)庫很大,常會將許多不需要的圖像也檢索出來。顏色直方圖是最常用的表達(dá)顏色特征的方法,其優(yōu)點是不受圖像旋轉(zhuǎn)和平移變化的影響,進(jìn)一步借助歸一化還可不受圖像尺度變化的影響,基缺點是沒有表達(dá)出顏色空間分布的信息。
1.1.2 紋理特征
紋理特征也是一種全局特征,它也描述了圖像或圖像區(qū)域所對應(yīng)景物的表面性質(zhì)。但由于紋理只是一種物體表面的特性,并不能完全反映出物體的本質(zhì)屬性,所以僅僅利用紋理特征是無法獲得高層次圖像內(nèi)容的。與顏色特征不同,紋理特征不是基于像素點的特征,它需要在包含多個像素點的區(qū)域中進(jìn)行統(tǒng)計計算。在模式匹配中,這種區(qū)域性的特征具有較大的優(yōu)越性,不會由于局部的偏差而無法匹配成功。作為一種統(tǒng)計特征,紋理特征常具有旋轉(zhuǎn)不變性,并且對于噪聲有較強(qiáng)的抵抗能力。但是,紋理特征也有其缺點,一個很明顯的缺點是當(dāng)圖像的分辨率變化的時候,所計算出來的紋理可能會有較大偏差。另外,由于有可能受到光照、反射情況的影響,從2-D圖像中反映出來的紋理不一定是3-D物體表面真實的紋理。
1.1.3 形狀特征
各種基于形狀特征的檢索方法都可以比較有效地利用圖像中感興趣的目標(biāo)來進(jìn)行檢索,但它們也有一些共同的問題,包括:①目前基于形狀的檢索方法還缺乏比較完善的數(shù)學(xué)模型;②如果目標(biāo)有變形時檢索結(jié)果往往不太可靠;③許多形狀特征僅描述了目標(biāo)局部的性質(zhì),要全面描述目標(biāo)常對計算時間和存儲量有較高的要求;④許多形狀特征所反映的目標(biāo)形狀信息與人的直觀感覺不完全一致,或者說,特征空間的相似性與人視覺系統(tǒng)感受到的相似性有差別。另外,從 2-D 圖像中表現(xiàn)的 3-D 物體實際上只是物體在空間某一平面的投影,從 2-D 圖像中反映出來的形狀常不是 3-D 物體真實的形狀,由于視點的變化,可能會產(chǎn)生各種失真。
1.1.4 空間關(guān)系特征
所謂空間關(guān)系,是指圖像中分割出來的多個目標(biāo)之間的相互的空間位置或相對方向關(guān)系,這些關(guān)系也可分為連接/鄰接關(guān)系、交疊/重疊關(guān)系和包含/包容關(guān)系等。
空間關(guān)系特征的使用可加強(qiáng)對圖像內(nèi)容的描述區(qū)分能力,但空間關(guān)系特征常對圖像或目標(biāo)的旋轉(zhuǎn)、反轉(zhuǎn)、尺度變化等比較敏感。另外,實際應(yīng)用中,僅僅利用空間信息往往是不夠的,不能有效準(zhǔn)確地表達(dá)場景信息。為了檢索,除使用空間關(guān)系特征外,還需要其它特征來配合。
1.2 基于區(qū)域的方法(如區(qū)域生長分割法、分裂合并法、分水嶺分割法等)
1.2.1 區(qū)域生長分割法
所謂區(qū)域生長(region growing)是指將成組的像素或區(qū)域發(fā)展成更大區(qū)域的過程。從種子點的集合開始,從這些點的區(qū)域增長是通過將與每個種子點有相似屬性像強(qiáng)度、灰度級、紋理顏色等的相鄰像素合并到此區(qū)域。它是一個迭代的過程,這里每個種子像素點都迭代生長,直到處理過每個像素,因此形成了不同的區(qū)域,這些區(qū)域它們的邊界通過閉合的多邊形定義。
區(qū)域生長分割算法的關(guān)鍵是初始種子點的選取和生長規(guī)則的確定。算法的優(yōu)點在于計算簡單,對于均勻的連通目標(biāo)有很好的分割效果,缺點是需要人為設(shè)定種子點,對噪聲敏感,可能導(dǎo)致區(qū)域出現(xiàn)空洞。
1.2.2 分裂合并法
分裂合并法的基本思想是從整幅圖像開始通過不斷分裂合并來得到各個區(qū)域。分裂合并算法的關(guān)鍵是分裂合并準(zhǔn)則的設(shè)計,這種算法對復(fù)雜圖像的分割效果較好,但算法復(fù)雜,計算量大,分裂可能破壞區(qū)域的邊界。
1.2.3 分水嶺分割法
分水嶺分割法,是一種基于拓?fù)淅碚摰臄?shù)學(xué)形態(tài)學(xué)的分割方法,其基本思想是把圖像看作是測地學(xué)上的拓?fù)涞孛?圖像中每一點像素的灰度值表示該點的海拔高度,每一個局部極小值及其影響區(qū)域稱為集水盆,而集水盆的邊界則形成分水嶺。
分水嶺分割法對微弱邊緣具有良好的響應(yīng),具有很強(qiáng)的邊緣檢測能力,正是由于其對微弱邊緣的良好響應(yīng),此算法可以得到比較好的封閉連續(xù)邊緣。但是同時對于圖像中的噪聲、物體表面細(xì)微的灰度變化,該算法也會產(chǎn)生“過度分割”的現(xiàn)象。
1.3 基于邊緣的方法(邊緣檢測等)
圖像的邊緣是指圖像局部區(qū)域亮度變化顯著的部分。該區(qū)域的灰度剖面一般可以看做一個階躍,即從一個灰度值在很小的緩沖區(qū)域內(nèi)急劇變化到另一個灰度相差較大的灰度值。圖像的邊緣部分集中了圖像的大部分信息,圖像邊緣的確定與提取對于整個圖像場景的識別與理解是非常重要的,同時也是圖像分割所依賴的重要特征。
邊緣檢測主要是圖像的灰度變化的度量、檢測和定位,邊緣檢測的基本思想是先利用邊緣增強(qiáng)算子,突出圖像中的局部邊緣,然后定義像素的“邊緣強(qiáng)度”,通過設(shè)置閾值的方法提取邊緣點集。但是由于噪聲和圖像模糊,檢測到的邊界可能會有間斷的情況發(fā)生。
1.4 基于函數(shù)優(yōu)化的方法(貝葉斯算法-Bayesian等)
貝葉斯(1702-1763) Thomas Bayes,英國數(shù)學(xué)家,在數(shù)學(xué)方面主要研究概率論。他首先將歸納推理法用于概率論基礎(chǔ)理論,并創(chuàng)立了貝葉斯統(tǒng)計理論,對于統(tǒng)計決策函數(shù)、統(tǒng)計推斷、統(tǒng)計的估算等做出了貢獻(xiàn)。
貝葉斯決策理論方法是統(tǒng)計模式識別中的一個基本方法。貝葉斯決策判據(jù)既考慮了各類參考總體出現(xiàn)的概率大小,又考慮了因誤判造成的損失大小,判別能力強(qiáng)。
1.5 綜合考慮邊緣和區(qū)域信息的混合分割方法
這類方法既可以很好的提取出圖像中目標(biāo)的邊緣又可以使得算法的計算相對簡單,對于均勻的連通目標(biāo)有較好的分割效果。
2 圖像分割的研究方向
2.1 圖像匹配
在圖像識別的過程中,常需要把不同時間、不同成像條件下對同一景物獲取的兩幅或者多幅圖像在空間上對準(zhǔn),或根據(jù)已知模式到另一幅圖中尋找相應(yīng)的模式,這就稱為圖像匹配。
圖像匹配主要可分為以灰度為基礎(chǔ)的匹配和以特征為基礎(chǔ)的匹配。
1)灰度匹配:灰度匹配的基本思想:以統(tǒng)計的觀點將圖像看成是二維信號,采用統(tǒng)計相關(guān)的方法尋找信號間的相關(guān)匹配。利用兩個信號的相關(guān)函數(shù),評價它們的相似性以確定同名點?;叶绕ヅ渫ㄟ^利用某種相似性度量,如相關(guān)函數(shù)、協(xié)方差函數(shù)、差平方和、差絕對值和等測度極值,判定兩幅圖像中的對應(yīng)關(guān)系。
2)特征匹配:特征匹配是指通過分別提取兩個或多個圖像的特征(點、線、面等特征),對特征進(jìn)行參數(shù)描述,然后運(yùn)用所描述的參數(shù)來進(jìn)行匹配的一種算法,基于特征的匹配所處理的圖像一般包含的特征有顏色特征、紋理特征、形狀特征、空間位置特征等。特征匹配首先對圖像進(jìn)行預(yù)處理來提取其高層次的特征,然后建立兩幅圖像之間特征的匹配對應(yīng)關(guān)系,通常使用的特征基元有點特征、邊緣特征和區(qū)域特征。 特征匹配需要用到許多諸如矩陣的運(yùn)算、梯度的求解、還有傅立葉變換和泰勒展開等數(shù)學(xué)運(yùn)算。基于圖象特征的匹配方法可以克服利用圖象灰度信息進(jìn)行匹配的缺點,由于圖象的特征點比較像素點要少很多,大大減少了匹配過程的計算量;同時,特征點的匹配度量值對位置的變化比較敏感,可以大大提高匹配的精確程度;而且,特征點的提取過程可以減少噪聲的影響,對灰度變化,圖象形變以及遮擋等都有較好的適應(yīng)能力。所以基于圖象特征的匹配在實際中的應(yīng)用越來越廣泛。所使用的特征基元有點特征(明顯點,角點,邊緣點等),邊緣線段等。
3)兩者的比較:特征匹配與灰度匹配的區(qū)別:灰度匹配是基于像素的,特征匹配則是基于區(qū)域的,特征匹配在考慮像素灰度的同時還應(yīng)考慮諸如空間整體特征、空間關(guān)系等因素。
特征是圖象內(nèi)容最抽象的描述,與基于灰度的匹配方法相比,特征相對于幾何圖象和輻射度影響來說更不易變化,但特征提取方法的計算代價通常較大,并且需要一些自由參數(shù)和事先按照經(jīng)驗選取的閥值,因而不便于實時應(yīng)用。同時,在紋理較少的圖象區(qū)域提取的特征的密度通常比較稀少,使局部特征的提取比較困難。另外,基于特征的匹配方法的相似性度量也比較復(fù)雜,往往要以特征屬性、啟發(fā)式方法及閥方法的結(jié)合來確定度量方法。
2.2 紋理分割和紋理合成
紋理分割是將紋理圖像依據(jù)同一紋理的一致性特征或不同紋理之間的特征差別,分割成若干有意義的區(qū)域的一種圖像分割技術(shù),如何提取有效的紋理特征是其關(guān)鍵點和難點。
紋理合成是為了解決紋理映射中存在的接縫走樣等問題而提出的,目前紋理合成方法可分為兩類:一類為過程紋理合成(PTS),另一類為基于樣圖的紋理合成(TSFS)。
過程紋理合成通過對物理生成過程的仿真直接在曲面上生成紋理,如毛發(fā)、云霧、木紋等,從而避免了紋理映射帶來的失真。這種方法可以獲得非常逼真的紋理,但對每一種新的紋理,卻需要調(diào)整參數(shù)反復(fù)測試,非常不便,有的甚至無法得到有效的參數(shù)。自然界中存在大量的紋理,這些紋理往往具有自相似性,即一小塊紋理就能反映整體紋理的特點。這就促使人們著手研究基于樣圖的紋理合成方法以取得更有效的成果:給定一小塊紋理,生成大塊相似的紋理。
基于樣圖的紋理合成(texture synthesis from samples,TSFS))技術(shù)是近幾年迅速發(fā)展起來的一種新的紋理拼接技術(shù),它基于給定的小區(qū)域紋理樣本,按照表面的幾何形狀,拼合生成整個曲面的紋理,它在視覺上是相似而連續(xù)的。TSFS技術(shù)可以克服傳統(tǒng)紋理映射方法的缺點,又避免了過程紋理合成調(diào)整參數(shù)的繁瑣,因而受到越來越多研究人員的關(guān)注,成為計算機(jī)圖形學(xué)、計算機(jī)視覺和圖像處理領(lǐng)域的研究熱點之一。利用TSFS技術(shù)還可以進(jìn)行紋理填充(如修補(bǔ)破損的圖片,重現(xiàn)原有圖片效果),紋理傳輸,擴(kuò)展到時域則可以用一短段視頻圖像,生成任意長度的非重復(fù)的視頻動畫等。所以紋理合成技術(shù)在圖像編輯、數(shù)據(jù)壓縮、網(wǎng)絡(luò)數(shù)據(jù)的快速傳輸、大規(guī)模場景的生成以及真實感和非真實感繪制等方面具有廣泛的應(yīng)用前景。
2.3 圖像解析(Image Parsing)
自然圖像本質(zhì)上是由大量隨機(jī)生成的視覺模式構(gòu)成,圖像理解的目的是將輸入圖像解析成構(gòu)成它的不同的視覺模式。
根據(jù)我們所感興趣的不同類型的模式,圖像解析問題分別被稱為:圖像分割(對均勻灰色、彩色和紋理區(qū)域的處理)、知覺組織(對點、線和一般圖形的處理)、目標(biāo)識別(對文本和對象的處理)。
3 總結(jié)
圖像分割是圖像理解與計算機(jī)視覺領(lǐng)域國際學(xué)術(shù)界公認(rèn)的將會長期存在的最困難的問題之一,到目前為止既不存在一種通用的圖像分割方法,也不存在一種判斷是否分割成功的客觀標(biāo)準(zhǔn)。圖像分割之所以困難的一個重要原因是其并不完全屬于圖像特征提取問題,它還涉及到各種圖像特征的知覺組織。從一般意義上來說,只有對圖像內(nèi)容的徹底理解,才能產(chǎn)生完美的分割。
參考文獻(xiàn):
[1] Gonzalez R C. Digital Image Processing Using MATLAB[M].阮秋琦,譯.北京:電子工業(yè)出版社,2005.
[2] 孫即祥.圖像分析[M].北京:科學(xué)出版社,2005.
[3] 章毓晉.圖像工程[M].北京:清華大學(xué)出版社,2007.