張 椰,朱衛(wèi)綱,邢 強
(中國人民解放軍裝備學院 a.研究生管理大隊; b.光電裝備系, 北京 101416)
?
【信息科學與控制工程】
SAR圖像分割方法綜述
張 椰a,朱衛(wèi)綱b,邢 強a
(中國人民解放軍裝備學院 a.研究生管理大隊; b.光電裝備系, 北京 101416)
綜合論述了SAR圖像分割的幾種方法,并對每類方法的特點進行了簡要總結;結合深度學習在光學圖像分割中的應用,分析了深度學習在SAR圖像分割中的難點和借鑒意義;明確了SAR圖像分割急需解決的問題。
SAR;圖像分割;深度學習
合成孔徑雷達(Synthetic Aperture Radar,SAR)的概念是由美國Goodyear宇航公司的Carl Wiley在1951年首次提出,是一種具有距離高分辨和方位高分辨能力的成像雷達,自誕生以來在軍事領域和民用領域都得到了廣泛的應用。隨著SAR成像技術的不斷成熟,對SAR圖像的解譯與應用的研究變得愈加迫切,面臨的挑戰(zhàn)也愈加復雜。SAR圖像分割作為圖像解譯的一個重要環(huán)節(jié),能為后續(xù)解譯提供整體結構信息,凸顯感興趣區(qū)域,揭示圖像本質。在軍事領域,通過SAR圖像分割可以快速準確地對戰(zhàn)場環(huán)境進行更新、標記并提取戰(zhàn)場中感興趣的目標區(qū)域,對要實施打擊的目標(機場、橋梁、大壩、坦克、飛機、艦船)進行檢測識別,從而為部隊的部署、作戰(zhàn)計劃制定和武器的精確制導提供依據。在民用領域中,SAR圖像分割能夠準確地對環(huán)境信息進行提取,從而推動SAR在災害監(jiān)測、地球變化研究、地圖繪制等民用領域中的應用。
在SAR圖像分割的研究中,隨著理論的進步提出一系列分割新方法[1,14,25],這些方法往往都是對傳統分割方法的一些改進,而且一般都是針對具體需求人工參與進行分割,限制了分割方法的通用性。隨著深度學習在圖像分類中的應用,其良好的特征學習能力得到了學者的青睞,通過設計多層網絡結構自動學習中高級特征,能更有效地描述圖像的本質,更有效地表達高語義的特征,為實現圖像的自動分割提供新的途徑。
本文在總結前人提出的傳統的SAR圖像分割方法的基礎上,梳理了深度學習在圖像分割領域的應用,分析了SAR圖像分割的難點與下一步研究的趨勢。
SAR圖像分割方法經過幾十年的發(fā)展,產生了大量的方法,各類方法之間沒有明確的分界線,隨著SAR圖像分割的復雜化以及對分割精度要求的提高,很多方法都是各類方法之間的結合,本文對一些常用的SAR圖像分割方法歸納如下。
1.1 基于最優(yōu)閾值分割方法
基本思想是利用圖像中目標與背景在灰度特性上的差異,通過選取合適的灰度閾值來分割圖像,由于其處理直觀、實現簡單且計算速度快,在圖像分割中處于核心地位[2],最常用的方法是Qtsu法[3]??紤]到SAR圖像受相干斑噪聲影響嚴重,文獻[4]中提出了一種基于多Gamma分布的SAR圖像直方圖閾值分割算法,在有效抑制SAR相干斑噪聲的同時使邊緣特征得到極大保留。文獻[5]在對海陸SAR圖像進行自動分割時利用改進的Otsu法計算粗閾值,從而分割獲得大致的海域范圍,然后根據海域統計特性近似高斯分布的特點,確定了精確的分割閾值,該方法獲得了較好的分割速度和分割精度。文獻[6]提出基于矩特征分析的多閾值算法,通過計算矩特征,可以顯著增大MSTAR圖像中目標、陰影和背景區(qū)域之間的差異性,對此,對目標和陰影分別采用不同的閾值化策略,實現二者與背景之間的分離,在不需要進行噪聲抑制時,具有較高的分割精度。閾值分割方法實現簡單,分割速度較快,但對于多閾值分割時受相干斑噪聲影響嚴重。
1.2 基于邊緣檢測的分割方法
基本思想是利用不同區(qū)域之間特征的不一致性和不連續(xù)性,通過檢測出SAR圖像中的邊緣點,然后按一定的策略連接成閉合的曲線,得出SAR圖像的邊緣,進而構成分割區(qū)域。比較經典的基于邊緣的分割算法有平均比值法(Ratio OfAverage,ROA)[7]。邊緣檢測的準確性直接決定了分割的效果,為了避免噪聲對邊緣檢測的影響,基于多尺度多分辨率的邊緣檢測算法隨著小波技術的發(fā)展逐漸流行起來,文獻[8]提出一種基于局部混合濾波的邊緣檢測算法,對噪聲平滑的同時利用多尺度信息進行邊緣提取,有效地保留了邊緣的完整性和準確性,大大減少了偽邊緣和誤判邊緣。文獻[9]在稀疏表示理論基礎上結合形態(tài)學提出了一種去噪的邊緣檢測算法,克服了噪聲不穩(wěn)定性對邊緣檢測帶來的不利影響。文獻[10]從眾多海洋溢油分割方法中選取邊緣檢測算子和種子填充算法對SAR圖像進行分割,針對算法的一些缺陷,進一步加入紋理分析使圖像中的油膜與類油膜以及海水與海浪等更好地區(qū)分開。邊緣檢測方法主要還是針對邊緣特征明顯的圖片進行分割,如海岸線等,其邊緣特征保持與噪聲抑制存在固有矛盾。
1.3 基于模糊聚類的分割方法
基本思想是通過聚類算法將同一類的像素樣本的特征盡可能相似,而屬于不同類別的像素的差異盡可能大,從而實現圖像的分割,是一種無監(jiān)督的分割方法。模糊聚類方法中最經典的是模糊c-均值(Fuzzy C-Means,FCM)聚類算法[11],而傳統的FCM算法沒有考慮SAR圖像的空間信息,因此其對相干斑噪聲非常敏感,為了解決這一問題加入圖像結構信息。文獻[12]提出了偏差修正模糊C均值算法,該算法加入了鄰域約束懲罰項,這樣在FCM算法迭代求取某個像素的隸屬度時考慮了其周圍像素的影響,一定程度上抑制了噪聲。文獻[13]利用雙密度雙樹復小波變換優(yōu)秀的圖像去噪能力,對SAR圖像進行降噪處理,減少相干噪聲對分割結果的影響;然后通過改進的K均值聚類方法進行艦船分割,實驗結果表明能對SAR艦船目標進行有效區(qū)分。文獻[14]利用自適應遺傳算法的較強處理局部極值的能力,克服了FCM算法對初始化的敏感并動態(tài)地確定了空間信息影響因子,不僅考慮像素強度信息,而且考慮了空間相對位置信息,對初始分割不敏感,具有較強的抗噪性能,但同時也增加了算法的時間復雜度。文獻[15]提出自適應非局部均值算法獲取非局部空間信息,聚類的對象是圖像的灰度級不是像素值,聚類速度更快,提高了分割速度。聚類方法作為一種無監(jiān)督算法分割速度快,但只考慮了像素的灰度值,沒有利用像素之間的空間信息,不利于對相干斑噪聲的抑制。
1.4 基于馬爾科夫隨機場的分割方法
基本思想是在貝葉斯理論框架下根據最大后驗概率得到圖像分割結果,其中圖像的灰度服從一定概率分布,像素標號服從馬爾科夫隨機場(Markov Random Field,MRF),建立的MRF利用像素間局部相關性有效抑制了相干斑噪聲的影響。1998年Robert將MRF模型用于對MSTAR(Moving and Stationary Target Acquisition and Recognition)目標切片圖像進行分割[16],得到了較好的分割結果,但是,由于基于MRF模型的SAR圖像分割算法的最大化后驗概率的過程是一個迭代優(yōu)化過程,并且需要考慮每個像素的空間鄰域結構,要處理的數據量大,算法收斂速度慢。為了加速迭代過程,文獻[17]通過對SAR目標切片圖像中目標區(qū)、陰影區(qū)和背景區(qū)所占比率進行統計分析,得到了一種有效的迭代初值選擇方法,減少了迭代次數,提高了分割速度。為了降低計算的復雜度,文獻[18]通過初分割和邊緣特征建立鄰接圖上的馬爾可夫場,減少了運算復雜度,但過多依賴邊緣等其他高層特征,沒有充分利用圖像分布等統計特性。針對MRF的特點,許多文獻結合其他方法對MRF模型進行改進,提出有效的新方法。文獻[19]針對非平穩(wěn)SAR數據進行統計建模,提出了一種小波變換域的多尺度多方向三重馬爾可夫場模型,該模型能夠從圖像的空間結構和圖像特征上整合圖像的全局和局部信息,并利用粗尺度上的全局結構信息指導細尺度上的分割以實現多尺度決策融合,從而提高分割算法的抗噪性能,有效地解決誤分割問題,并且還能夠有效地捕捉圖像的奇異信息,從而提高了邊界定位的準確度。MRF算法利用了像素之間的空間信息,有效抑制了噪聲,但其計算量較大不能做到實時快速分割。
1.5 基于神經網絡的分割方法
傳統的人工神經網絡是一種應用類似于大腦神經突觸聯接的結構進行信息處理的數學模型,基于人工神經網絡模型的分割方法是非線性的。同傳統方法相比較,它可以處理復雜的數據集,識別精細的模式,還能夠利用多源數據,將潛在的信息提取出來[20]。但是該模型容易陷入局部最優(yōu)值。隨著研究的深入,研究者根據貓、猴等哺乳動物視覺皮層中同步脈沖發(fā)放現象,提出了一種被稱為第三代人工神經網絡的新型模型——脈沖耦合神經網絡模型(Pulse Coupled Neural Networks,PCNN),這幾年對該模型及其應用研究達到了一個嶄新的階段[21]。文獻[22]分析了PCNN用于圖像分割的潛在優(yōu)勢。在SAR圖像分割中,文獻[23]提出了一種優(yōu)化集成閾值的方法,避免了花費大量的時間選擇PCNN參數和迭代次數。文獻[24]針對傳統的單元連接PCNN只能將圖像分成兩類,通過將PCNN迭代設為兩級,使得所有神經元都能點火,可實現圖像的多類分割。文獻[25]針對高分辨SAR圖像在傳統PCNN模型的基礎上,對神經元的輸入信號,尤其是鏈接系數和閾值的非線性衰減子因子進行了改進和簡化,同時對鏈接強度系數進行理論上的近似推導,減少人工設置的參數。改進后的算法運行效率提高,自適應性增強,區(qū)域一致性和區(qū)域對比度都得到了提高,為高分辨率SAR圖像分割提供了新的途徑。雖然PCNN模型得到了廣泛的應用,但是其存在的問題還亟待解決,如網絡參數眾多,模型復雜度高,對信息自動及自適應處理能力相對較差等。
1.6 基于深度學習的分割方法
近幾年來,深度學習是圖像處理方面的一個比較熱的研究方向,基于很多隱層的神經網絡具有優(yōu)異的特征學習能力,它將原始的圖像作為輸入來學習特征,這種從不同的抽象層次自動學習特征的方法能夠使得一個識別系統更好地學習一些復雜的特征,不需要進行特征的定義,也不涉及顯式的特征提取,而且深度神經網絡具有優(yōu)異的特征學習能力,能夠深刻地刻畫數據內部豐富的信息,這種學習得到的特征對數據有更本質的刻畫,可以提升分類或者是預測的準確性。在光學圖像分割中,Long等[26]在2015年提出了全卷積網絡(FCN,Fully Convolutional Networks),為圖像分割開創(chuàng)了一個新途徑,該方法通過訓練一個端到端的網絡,實現了對像素的分類,在數據集PASCALVOC上實驗所得的結果較2012年提升了約20%,達到62.2%的準確率。但是該方法由于使用線性插值的方法,容易造成分割時細節(jié)結構的丟失或邊界模糊。在FCN的基礎上,Chen等[27]加入了隨機場算法(CRF,Conditional Random Fields)進行優(yōu)化,能更好的修復分割的邊界。Noh 等[28]提出用一個與FCN網絡完全對稱的多層反卷積網絡代替簡單的雙線性插值,將提取到的縮小特征重新映射回原圖像的大小,實現圖像的語義分割,這個方法最早在特征可視化中提出。由于在(pooling)的時候額外地記錄像素位置信息,用來在反池化(unpooling)的時候還原到圖像像素的原來位置,使得不需要做多層疊加進行強化就能得到清晰的分割輪廓圖。通過解卷積層(Deconvolution)和反池化層(Unpooling)的結合,在輸出的像素分類圖中更好地反映物體細節(jié),得到高品質分割效果。
卷積神經網絡在光學圖像上的應用為SAR圖像分割提供了新思路,但是SAR圖像分割與光學圖像分割相比存在更大的困難,如:相干斑噪聲、模糊的目標邊緣、低對比度、非目標強散射點的干擾以及大場景SAR圖像的稀疏性。其次,深度學習需要大量的訓練樣本進行訓練,而SAR圖像標簽數據使用人工標注的難度極大,工作量太大。針對SAR圖像的特點,文獻[29]利用CAD(Computer Aided Design)對圖的目標、背景和陰影進行標注,有效解決了標簽數據的困難,從而能使用卷積神經網絡進行有監(jiān)督的訓練,訓練獲得的模型能快速對MSTAR圖像進行分割,雖然模型設計比較簡單,但是相比于傳統的分割方法,該方法的分割精確,具有良好的魯棒性。在國內,文獻[30]使用卷積神經網絡模型,對卷積神經網絡算法的結構進行粒子群優(yōu)化(Particle Swarm Optimization,PSO)改進,修正網絡反饋,用正交試驗設計提高PSO算法精度,在完善網絡的同時,用超像素的方式提取圖像塊,作為神經網絡的第一層,該方法能夠快速進行網絡學習,對SAR圖像達到很好的分割效果。不過此神經網絡的第一層數據量非常大,對于將來更高分辨率的SAR圖像分割而言,需要更大的存儲空間且分割速度較慢。文獻[31]根據SAR圖像素描圖模型提取的素描圖將SAR 圖像分為聚集區(qū)域、勻質區(qū)域及結構區(qū)域3部分,對聚集區(qū)域、勻質區(qū)域使用深度自編碼器提取特征,利用詞袋模型進行聚類分割;對結構區(qū)域,使用分水嶺算法將SAR圖像分割成許多超像素,實現最終的分割。該方法可以獲得更加細致準確的地物類別劃分,區(qū)域一致性及邊緣一致性更好。但是其沒有完全使用SAR圖像素描模型中素描線本身的語義信息,對邊界和線目標的處理尚不完善。
隨著SAR技術的快速發(fā)展以及SAR圖像的廣泛應用,SAR圖像解譯的地位越來越高,SAR圖像分割作為SAR地物目標提取、分類和識別的關鍵步驟之一,對其的研究也在不斷地進步,其面臨的挑戰(zhàn)也越來越大,對于下一步的研究主要有如下幾個方面:
1)傳統的SAR圖像分割方法依舊是目前分割方法的基礎,隨著對理論研究的深入和現實需求的更新,SAR圖像分割方法發(fā)生日新月異的變化,新算法的出現主要還是改進經典算法和構造新算法。隨著技術的進步,多種信息的綜合利用將為SAR圖像的解釋提供更多的知識,將有助于構建多種精確的分割模型,隨著計算技術的快速發(fā)展,各種算法將不是孤立的,多種方法的融合將為SAR圖像的解譯提供更多的渠道。多種算法的組合將是SAR圖像分割算法發(fā)展的必然趨勢。
2)深度學習在SAR圖像分割中還處在摸索階段,深度學習在光學圖像上的成功應用為SAR圖像分割提供了理論基礎,但是其訓練樣本數量無法與光學圖像相比,導致其訓練的模型容易出現過擬合;而且SAR圖像場景大小一般是光學圖像的數倍,其標簽樣本的獲得存在一定的難度。為了克服對訓練樣本的要求,將全監(jiān)督的訓練模式轉變?yōu)槿醣O(jiān)督的方式,甚至是無監(jiān)督的方式,這樣就為實現快速、自動的分割提供了重要途徑。
3)由于戰(zhàn)場環(huán)境的快速變化和不可預測性,對SAR圖像分割的速度要求會越來越高;隨著SAR分辨率的提高,其數據量相應增加,圖像的處理速度將面臨更大的挑戰(zhàn),提高分割的速度是研究者們一直追求的目標。
SAR圖像分割在SAR圖像解譯領域具有重大意義和實際應用價值。本研究在對SAR圖像分割方法綜述的基礎上,結合了深度學習在光學圖像分割中的應用,為下一步研究指明了方向。深度學習的發(fā)展為SAR圖像分割提供了新的方法途徑,但對其研究任重而道遠。在人工智能發(fā)展的新時代,SAR圖像分割方法也將進一步發(fā)展。
[1] 余航,焦李成,劉芳.基于上下文分析的無監(jiān)督分層迭代算法用于SAR圖像分割[J].自動化學報,2014,40(1):100-116.
[2] 阮秋琦.數字圖像處理[M].北京:電子工業(yè)出版社,2007.
[3] OTSU N.A threshold selection method from gray level histograms[J].Automatica,1975,11(285-296):23-27.
[4] 文政穎,于海鵬.基于多Gamma分布模型的SAR圖像直方圖分割算法[J].計算機工程與設計,2014,35(6):2104-2108.
[5] 陳祥,孫俊,尹奎英,等.基于Otsu與海域統計特性的SAR圖像海陸分割算法[J].數據采集與處理,2014, 29(4):603-608.
[6] 倪維平,嚴衛(wèi)東,吳俊政,等.MSTAR圖像的矩特征分析與多閾值分割[J].中國圖像圖形學報,2013,18(10):1364-1373.
[7] BOVIK A C.On detecting edges in speckle imagery[J].IEEE Transactions on Acoustics,Speech,and Signal Processing,1988,36(10):1618-1627.
[8] 劉帥奇,胡紹海,肖揚,等.基于局部混合濾波的SAR圖像邊緣檢測[J].電子與信息學報,2013,35(5):1120-1127.
[9] MA X,LIU S,HU S,et al.SAR image edge detection via sparse representation[J].Soft Computing,2017:1-9.
[10]李淑清,李瑞華,王瀟.基于SAR圖像的海洋溢油分割方法研究[J].測繪工程,2017(26):37-40.[11]BEZDEK J C.Pattern recognition with fuzzy objective function algorithms[M].Springer Science & Business Media,2013.
[12]SHI Z,LIHUANG S,LI L,et al.A modified fuzzy C-means for bias field estimation and segmentation of brain MR image[C]//Control and Decision Conference (CCDC),2013 25th Chinese.IEEE,2013:2080-2085.
[13]楊曉波.結合小波變換和K均值聚類的SAR艦船目標分割[J].艦船科學技術,2016 (9X):169-171.
[14]田小林,焦李成,緱水平.加權空間函數優(yōu)化FCM的SAR圖像分割[J].西安電子科技大學學報,2008,35(5):846-852.
[15]汪柯陸.基于模糊c均值聚類的SAR圖像分割算法研究[D].西安:西安電子科技大學,2014.
[16]WEISENSEEL R A,KARL W C,CASTANON D A,et al.Markov random field segmentation methods for SAR target chips[C]//AeroSense’99.International Society for Optics and Photonics.[S.l.]:[s.n.],1999:462-473.
[17]高貴,計科峰,匡綱要.基于馬爾可夫隨機場SAR目標切片圖像分割方法[J].現代雷達,2004,26(5):42-44.
[18]SARKAR A,BISWAS M K,SHARMA K M S.A simple unsuper-vised MRF model based image segmen-tation approach[J].IEEE Transactions on Image Processing,2000,9(5):801-812.
[19]張鵬.基于統計模型的SAR圖像降斑和分割方法研究[D].西安:西安電子科技大學,2012.
[20]權金娟,溫顯斌,王春東,等.基于兩種神經網絡的SAR圖像多尺度分割與分析[J].光電子激光,2008,19(4):542-545.
[21]劉勍.基于脈沖耦合神經網絡的圖像處理若干問題研究[D].西安:西安電子科技大學,2011.
[22]KUNTIMAD G,RANGANATH H S.Perfect image segmentation using pulse coupled neural networks[J].IEEE Transactions on Neural Networks,1999,10(3):591-598.
[23]LI H,BAI Z.A new PCNN-based method for segmentation of SAR images[C]//Control,Automation,Robotics and Vision,2008.ICARCV 2008.10th International Conference on.IEEE,2008:1635-1639.
[24]WANG R,SONG J,ZHANG X.Multiclass segmentation of SAR image using modified unit-linking pulse coupled neural network[C]//2009 4th IEEE Conference on Industrial Electronics and Applications.IEEE,2009:3775-3778.
[25]汪華章,宰文姣.改進型脈沖耦合神經網絡高分辨率SAR圖像分割[J].北京大學學報:自然科學版,2013,49(2):176-182.
[26]LONG J,SHELHAMER E,DARRELL T.Fully convolu-tional networks for semantic segmentation[C]//Proceedings of the IEEE Conference on Computer Vision and Pattern Recognition.2015:3431-3440.
[27]CHEN L C,PAPANDREOU G,KOKKINOS I,et al.Semantic Image Segmentation with Deep Convolutional Nets and Fully Connected CRFs[J].Computer Science,2016(4):357-361.
[28]NOH H,HONG S,HAN B.Learning deconvolution network for semantic segmentation[C]//Proceed-ings of the IEEE International Conference on Computer Vision.[S.l.]:[s.n.],2015:1520-1528.
[29]MALMGREN-HANSEN D,NOBEL J M.Convolutional neural networks for SAR image segmenta-tion[C]//2015 IEEE International Symposium on Signal Processing and Information Technology (ISSPIT).IEEE,2015:231-236.
[30]于文倩.基于自適應頻域信息和深度學習的SAR圖像分割[D].西安:西安電子科技大學,2014.
[31]石西建.基于深度學習和區(qū)域圖的SAR圖像分割[D].西安:西安電子科技大學,2014.
[32]田微晴,程慧華,劉瓊俐,等.基于多重分形的遙感圖像融合檢測方法[J].四川兵工學報,2015(3):135-137.
(責任編輯 楊繼森)
Overview of SAR Image Segmentation
ZHANG Yea, ZHU Wei-gangb, XING Qianga
(a.Department of Graduate Management; b.Department of Optical and Electronic Equipment, Academy of Equipment of PLA, Beijing 101416, China)
This paper briefly summarizes each methods’ characteristics. Then, it analyzes the application of depth learning in optical image segmentation, which has some significance for SAR segmentation. Finally, some existing problems in the SAR image segmentation based on deep learning are briefly summarized and discussed and some possible new directions for future development are prospected.
SAR; image segmentation; deep learning
2017-02-15;
2017-03-10
張椰(1992—),男,碩士研究生,主要從事軍事信息處理研究。
10.11809/scbgxb2017.06.022
format:ZHANG Ye,ZHU Wei-gang,XING Qiang.Overview of SAR Image Segmentation[J].Journal of Ordnance Equipment Engineering,2017(6):99-103.
TN97;TJ765
A
2096-2304(2017)06-0099-05
本文引用格式:張椰,朱衛(wèi)綱,邢強.SAR圖像分割方法綜述[J].兵器裝備工程學報,2017(6):99-103.