趙詩宇
摘 要: 圖像分割是AI領(lǐng)域中一個重要的分支,是機(jī)器視覺技術(shù)中關(guān)于圖像理解的重要一環(huán)。近年的自動駕駛技術(shù)中,也需要用到這種技術(shù)。車載攝像頭探查到圖像,后臺計算機(jī)可以自動將圖像分割歸類,以避讓行人和車輛等障礙。近年來傳統(tǒng)分割算法不斷被科研工作者優(yōu)化和組合,相信會有更多的分割新算法井噴而出。
關(guān)鍵詞: 圖像分割;AI;機(jī)器視覺
1 圖像分割的數(shù)學(xué)定義
在一幅數(shù)字圖像中,每個像素點的坐標(biāo)設(shè)為 x,y ,每個像素點的值與坐標(biāo)的關(guān)系表示成一個二元函數(shù)f x,y 。函數(shù)值可以表示灰度圖像中的灰度值;也可以表示顏色。[1]圖像分割其實可以看成把圖像分成若干個無重疊的子區(qū)域的過程,即有如下定義:設(shè)R是整個要分割的圖像區(qū)域,將此區(qū)域分成n各自區(qū)域R1,R2,R3,…,Rn的過程就是圖像分割,其中子區(qū)域Ri,滿足一下五個條件:
(1)∪ni=1Ri=R;
(2)Ri∩Rj=,對所有Ri和Rj,i≠j;
(3)Ri是一個連通的區(qū)域,對于i=1,2,…,n;
(4)P Ri =TRUE,對于i=1,2,…,n;
(5)P Ri∩Rj =FALSE,對于任意相鄰區(qū)域Ri和Rj。
由以上定義可知,(1)表示圖像中任意一部分都要分割到某各自區(qū)域中。(2)表示任意兩個子區(qū)域不會重疊。(3)表示子區(qū)域中的任意兩個像素點能連通。(4)要求所有子區(qū)域中的像素點都符合一種特點。(5)要求任意相鄰子區(qū)域中沒有相同之處。
2 常見的圖像分割算法
目前圖像分割方法數(shù)量已經(jīng)達(dá)到上千種。隨著對圖像分割的更深層次研究和其他科學(xué)領(lǐng)域的發(fā)展,陸續(xù)出現(xiàn)了許多使用新理論的圖像分割算法。各種圖像分割算法都有其不同理論基礎(chǔ),下面介紹幾種常見的分割方法。
2.1 基于閾值的圖像分割算法
閾值分割法具有易于操作、功能穩(wěn)定、計算簡單高效等優(yōu)點。閾值分割法的基本原理是:根據(jù)圖像的整體或部分信息選擇閾值,把圖像依據(jù)灰度級別劃分。[2]如何選取合適的閾值是閾值算法最重要的問題。由于該算法直接利用灰度值,因此計算方面十分簡單高效。當(dāng)圖像中目標(biāo)與背景灰度差異大時,應(yīng)使用全局閾值分割法;當(dāng)圖像灰度差異不大或多個目標(biāo)的灰度相近時,局部閾值或動態(tài)閾值分割法會更適合。基于閾值的分割方法雖然簡單高效,但也有其局限性,一方面,當(dāng)圖像中的灰度值差異不明顯或灰度范圍重疊時,可能出現(xiàn)過分割或欠分割的情況;另一方面,閾值方法不關(guān)心圖像的空間特征和紋理特征,只考慮圖像的灰度信息,抗噪性能差,導(dǎo)致在邊界處的效果不符合預(yù)期,得到的分割效果比較差。
2.2 基于邊緣檢測的圖像分割算法
邊緣檢測分割法,是通過檢測邊界來把圖像分割成不同的部分。[3]在一幅圖像中,不同區(qū)域的邊緣通常是灰度值劇烈變化的地方,邊緣檢測分割法就是根據(jù)灰度突變來進(jìn)行圖像分割的?;谶吘墮z測分割方法按照執(zhí)行順序的差異可分為兩種,即串行邊緣分割技術(shù)以及并行邊緣分割技術(shù)。基于邊緣檢測分割方法重點是如何權(quán)衡進(jìn)行檢測時的抗噪性能和精度。若提高該方法檢測精度,噪聲引起的偽邊緣會影響圖像得到過多的分割結(jié)果;然而,若提高該方法抗噪性,會使得輪廓處的結(jié)果精度不高。因此研究人員在實際應(yīng)用的時候,需要綜合考慮檢測精度與抗噪性能的相互作用進(jìn)行取舍,這是邊緣檢測法的關(guān)鍵部分。邊緣檢測法優(yōu)點是運算快,邊緣定位準(zhǔn)確;其缺點是抗噪性能差,因而在劃分復(fù)雜圖像時非常容易導(dǎo)致邊緣不連續(xù)、邊緣丟失或邊緣模糊等問題,邊緣的封閉性和連續(xù)性難以保證。
2.3 基于區(qū)域的圖像分割算法
基于區(qū)域的圖像分割原理是連通含有相似特點的像素點,最終組合成分割結(jié)果?;趨^(qū)域的圖像分割主要利用圖像局部空間信息,能夠很好地避免其他算法圖像分割空間小的缺陷。域分割算法包括區(qū)域生長法以及區(qū)域分離與合并法。[4]區(qū)域生長法的總體思想是,依據(jù)某種相似性標(biāo)準(zhǔn),不停地把符合此標(biāo)準(zhǔn)的相鄰像素點加入到同一區(qū)域,最終得到目標(biāo)區(qū)域。在分割過程中種子點位置選取非常重要,直接影響分割結(jié)果優(yōu)劣。
2.4 基于神經(jīng)網(wǎng)絡(luò)技術(shù)的圖像分割算法
利用神經(jīng)網(wǎng)絡(luò)進(jìn)行圖像分割的基本原理是這樣的:將樣本圖像數(shù)據(jù)用來訓(xùn)練多層感知機(jī),最終得到?jīng)Q策函數(shù),進(jìn)而用獲得的決策函數(shù)對圖像像素進(jìn)行分類得到分割的結(jié)果。根據(jù)具體方法所處理的數(shù)據(jù)類別的不同,可以分為基于圖像像素數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)分割算法和基于圖像特征數(shù)據(jù)的神經(jīng)網(wǎng)絡(luò)分割算法。因為前者使用高維度的原始圖像作為訓(xùn)練數(shù)據(jù),而后者利用圖像特征信息,所以前者擁有更多能夠使用的圖像信息。前者對每個像素進(jìn)行單獨處理,由于數(shù)據(jù)量大并且數(shù)據(jù)維度高,所以使計算速度難以提高,如果用于處理實時數(shù)據(jù)則效果并不理想。[5]總而言之,神經(jīng)網(wǎng)絡(luò)是由許多模擬生物神經(jīng)的處理單元相互連接而成的結(jié)構(gòu),因它 有巨大的互連結(jié)構(gòu)和分布式的處理單元,所以系統(tǒng)擁有很好的并行性和健壯性,同時系統(tǒng)較為復(fù)雜,運算速度較慢。
3 結(jié)語
本文針對目前主要的一些圖像分割方法進(jìn)行了綜述,包括多閾值分割方法、邊緣檢測分割方法、基于區(qū)域分割方法、神經(jīng)網(wǎng)絡(luò)分割方等。由于應(yīng)用場合 不同,所需分割的圖像要求也有所不同,所以分割算法多種多樣,但至今不存在一個通用的算法。下一步的研究方向是找出一種能夠通用且魯棒性較好的分割方法。
參考文獻(xiàn):
[1]楊紅亞,趙景秀,徐冠華,etal.彩色圖像分割方法綜述[J].軟件導(dǎo)刊,2018(4).
[2]趙祥宇,陳沫涵.基于聚類的圖像分割方法綜述[J].信息技術(shù),2018(6).
[3]劉漢強(qiáng),趙靜.基于半監(jiān)督的超像素譜聚類彩色圖像分割算法[J].計算機(jī)工程與應(yīng)用,2018(14).
[4]潘曉航.醫(yī)學(xué)圖像分割方法[J].電子技術(shù)與軟件工程,2018(11).
[5]劉立波,程曉龍,賴軍臣.基于改進(jìn)全卷積網(wǎng)絡(luò)的棉田冠層圖像分割方法[J].農(nóng)業(yè)工程學(xué)報,2018,34(12):193-201.