譚博彥
摘要:隨著科學(xué)技術(shù)的不斷發(fā)展,特別是遙感技術(shù)的飛速發(fā)展,遙感圖像的分辨率越來越高,其包含的信息也越來越復(fù)雜,因此,迫切需要發(fā)展感興趣目標自動識別技術(shù)。精確識別對象對民用導(dǎo)航、環(huán)境保護、軍事等各個方面意義重大,提高對象的自動識別精度也是不可缺少的。本文通過查閱分析遙感圖像識別的文獻資料,對目標識別使用的一些基本理論和方法進行了綜合歸納。
關(guān)鍵詞:遙感圖像;目標識別; 綜述
中圖分類號:TP311 文獻標識碼:A 文章編號:1009-3044(2016)35-0206-03
A Literature Review on Remote Sensing Image Target Recognition
TAN Bo-yan
(Class 1422 The 1st Middle School of Loudi, Loudi 417000 China)
Abstract:With the continuous development of science and technology, Especially the rapid development of remote sensing technology, The resolution of the remote sensing images is higher and higher, it contains information is becoming more and more complex, therefore, an urgent need to develop interest in automatic target recognition technology. Accurately identify the object is of great significance to civil navigation, environment protection, military and other various aspects, to improve the automatic identification precision of the object is also indispensable. This article through the analysis of remote sensing image recognition of the literature, the target recognition using some of the basic theory and method are summarized.
Key words:remote sensing image; target recognition; literature review
目標識別是計算機視覺、圖像處理和機器學(xué)習(xí)中的重要研究課題之一。目前,目標識別的技術(shù)已經(jīng)廣泛應(yīng)用在各個領(lǐng)域中,近些年來其在遙感圖像中的應(yīng)用也越來越普遍。對遙感圖像進行精確地目標識別,一直是計算機圖像識別中的一個難題,且隨著遙感技術(shù)的迅速發(fā)展,其也成了該領(lǐng)域一個重要研究方向。精確定位遙感圖像中的感興趣目標,同時提取其狀態(tài)參數(shù)和屬性值,是遙感圖像目標識別的基本任務(wù)。該任務(wù)需要經(jīng)過地學(xué)、生物學(xué)、物候?qū)W等綜合性的專家知識指導(dǎo),運用信息科學(xué)和數(shù)學(xué)等一系列方法來實現(xiàn)簡單地電磁輻射特性的記錄,到地物時空分布變化的反演,這是一個非常典型的交叉學(xué)科問題[1]。
現(xiàn)在,遙感圖像目標識別共有兩種方法[2],一種是數(shù)據(jù)驅(qū)動型,表現(xiàn)為由下而上,一種知識驅(qū)動型,表現(xiàn)為由上而下。第一種是先對圖像進行普通的分割、標記、特征提取等,之后對每個已標記區(qū)域的特征向量和目標模型進行匹配。第二種則是根據(jù)描述模型,對圖像的可能特征提出合理假設(shè),然后根據(jù)假設(shè)進行分割、標記等。這兩種方法,前者通常是結(jié)合分類技術(shù)來進行,后者則是結(jié)合推理技術(shù)和先驗知識來進行。
1 基于分類技術(shù)的識別方法
基于分類技術(shù)的遙感圖像識別,最常被用于識別點、提取區(qū)域以及識別結(jié)構(gòu)目標中的結(jié)構(gòu)基元。此類方法多采用紋理、光譜、形狀等特征,通過提取出多種特征的臨近窗口,用來獲取在不同的尺度上的圖像信息[3]。
根據(jù)分類器是否需要采用訓(xùn)練樣本我們還可以將遙感圖像識別方法分為監(jiān)督分類和非監(jiān)督分類方法。其中,監(jiān)督分類的精度是由所選取的訓(xùn)練樣本決定的,而非監(jiān)督分類則常被當做預(yù)處理部分,其更多的是用于獲取整個圖像的上下文信息,同時還可用于新目標的探索和發(fā)現(xiàn)。
1.1監(jiān)督分類的方法
1.1.1 基于神經(jīng)網(wǎng)絡(luò)的分類方法
正相對于其他分類方法來說,基于神經(jīng)網(wǎng)絡(luò)的分類方法的研究時間較早,代表性成果也較多。其應(yīng)用范圍涉及農(nóng)作物、森林、土地利用分類以及特定目標的識別,網(wǎng)絡(luò)模型包括了反向傳播(BP)、分層、模糊和混合神經(jīng)網(wǎng)絡(luò)等。
梁路宏[4]等把模板匹配和神經(jīng)網(wǎng)絡(luò)方法相結(jié)合進行人臉識別。嚴柏軍[5]等人為計算火車的車皮數(shù),將圖像的直方圖特征、投影特征和矩陣特征相結(jié)合作為神經(jīng)網(wǎng)絡(luò)的輸入向量,進行貨車車鎖識別。李文娟[6]為達到優(yōu)化網(wǎng)絡(luò)目的,對現(xiàn)有的黃金分割算法進行了改進,其基于LM算法改進BP網(wǎng)絡(luò)建立LM-BP水質(zhì)評價模型,又將遺傳算法與BP網(wǎng)絡(luò)結(jié)合,為其尋找最優(yōu)權(quán)值和閾值,從而建立GA-BP模型。結(jié)果表明,GA-BP評價模型在網(wǎng)絡(luò)性能上要優(yōu)于LM-BP模型。劉丹[7]基于改進了的BP神經(jīng)網(wǎng)絡(luò)模型對飛機進行目標識別,結(jié)果表明此種方法識別的結(jié)果更加準確,識別的過程也更穩(wěn)定、可靠。
在遙感圖像分類形式的目標監(jiān)測中,基于神經(jīng)網(wǎng)絡(luò)監(jiān)督分類方法有效可行,它具備眾多優(yōu)點,如分類結(jié)果穩(wěn)定、自適應(yīng)能力強、所需先驗知識少等。且實驗證明,目前我們所用的諸多使用算法和技術(shù),都是結(jié)合了神經(jīng)網(wǎng)絡(luò)方法的算法來實現(xiàn)的。
1.1.2基于支持向量機分類方法
支持向量機分類方法,是指經(jīng)過了非線性變換的核函數(shù)通過由低維到高維空間的變換過程中,構(gòu)造出最小泛化誤差線性判別函數(shù)來實現(xiàn)低維空間的分類。好的核函數(shù)可以賦予向量機好的分類性能,且其可在經(jīng)驗風(fēng)險和模型的復(fù)雜度之間做適當?shù)钠胶?,目前得到廣泛推廣。
高恒振等[8]在將K-means聚類算法加入到最小二乘支撐向量機(LS-SVW),對沒有標簽的樣本集進行多次聚類,與分到同一類樣本點的次數(shù)相結(jié)合構(gòu)造出包袋核函數(shù),并將包袋核函數(shù)與RBF核函數(shù)運算后組合構(gòu)造出組合和函數(shù),將兩者對比發(fā)現(xiàn),改進后的最小二乘向量機比之前的性能更佳。郭春燕等[9]通過研究多類支持向量機分類方法的局限性,在一對一SVW中引入模糊的隸屬度函數(shù),對比實驗后發(fā)現(xiàn),一對一的模糊支持向量機要比一對多模糊支持向量機和其他三種方法的效果更好,但其對陣元和子帶的選擇要求較高。譚琨等[10]研究出了一種小波核函數(shù)的支持向量機,它是基于再生核Hilbert空間的,對比實驗后發(fā)現(xiàn)此種方法的分類精度較高,參數(shù)的選擇也較容易。樊繼偉等[11]提出一種主動支持向量機算法,其基于改進的概率選擇方法,該算法在實驗中是根據(jù)置信因子來挑選最佳的樣本組并計算其概率,該算法的優(yōu)點是彌補了其他算法的一些不足之處,也提高了遙感圖像的分類精度,但是算法的終止條件有待進一步研究完善。
雖然支持向量機分類方法在遙感圖像分類中應(yīng)用廣泛,許多基于此改進的算法也提高了分類的精度,但是圖像地物的復(fù)雜性,“同譜異物”、“同物異譜”等復(fù)雜現(xiàn)象導(dǎo)致錯分和漏分現(xiàn)象普遍存在,目前亟待更好的解決方法。
1.1.3基于隨機場模型分類方法
條件隨機場CRF以及馬爾可夫隨機場MRF被廣泛地用于遙感圖像的標注問題,這是因為其能夠融合和利用多種特征和圖像信息。因為遙感圖像的分類過程中的目標檢測其實也是對遙感圖像的標注,因此,目前涌現(xiàn)出了一批基于隨機場模型的解決方法。
鄭瑋[12]建立了模糊馬爾可夫隨機場模型(Fuzzy MRF, FMRF),用以解決遙感圖像分類中某些像素分類的不確定問題,此模型更合理地獲取圖像先驗知識,更好地符合了遙感圖像的特點,從而在圖像分割中使用更為準確的先驗知識。張曉峰[13]提出了一種自然場景文字提取方法,該方法基于全局特征CRF,利用邊緣濾波和開關(guān)映射相結(jié)合的方法提取出候選的文字區(qū)域。他使用當前和鄰域內(nèi)的節(jié)點的相似性作為全局特征,通過CRF將這些全局特征聯(lián)系起來,有效地提取出了文字區(qū)域。
因為遙感圖像的上下文信息之間關(guān)系復(fù)雜,很難用單一的隨機場模型來獲得準確的結(jié)果。因此,將隨機場模型和各種概率模型相結(jié)合的方法就顯現(xiàn)出了巨大的發(fā)展?jié)撃?,這種方法或許可以將復(fù)雜遙感圖像的目標檢測變得簡單精確。
1.2非監(jiān)督分類方法
因為不需要選定提前標注好的訓(xùn)練樣本,非監(jiān)督分類方法操作簡單快速,在遙感圖像分類中具有明顯的優(yōu)勢,但其分類的精度卻沒有監(jiān)督分類高。在實際的研究中,對遙感圖像分類常采用非監(jiān)督分類的方法作為發(fā)現(xiàn)知識、確定參數(shù)和特征預(yù)分析等步驟。
K-means聚類 ,K- means方法等非監(jiān)督分類方法中最常見的各種聚類算法,誤差平方和最小是它們聚類評判準則,它們可以通過最小得空間距離來達到平衡狀態(tài),但是它們無法自己確定聚類數(shù)目。陳華和陳書海[14]等在進行遙感分類的時候便采用了K- means算法, 取得了良好的效果。非監(jiān)督分類的實現(xiàn)方式多種多樣,如神經(jīng)網(wǎng)絡(luò)、隨機場模型等。于瑛英[15]基于聚類分類結(jié)合二叉樹思想,提出了一種新的聚類算法。此方法為避免以往聚類方法中同一類點在聚類中變成不同類的問題,充分利用二叉樹中分兩類的特征將多類聚類簡化為點聚類,將原有問題簡化處理。
2 基于知識的識別方法
在遙感圖像目標識別中對某些同類地物,如水體中的河流、水庫、湖泊和坑塘等,僅基于局部光譜、紋理等信息,很難對其做深度區(qū)分,對一些如公路、細小的河流等信息的提取,因此此類地物“混合像元”的現(xiàn)象比較嚴重,很難對他們做出精確地識別。要實現(xiàn)上述識別,要綜合利用到地物學(xué)、生物學(xué)、GIS 信息等知識。
根據(jù)遙感信息在識別過程中的應(yīng)用形式,又可以將其分為基于知識表示、推理和參數(shù)模型的方法。學(xué)者們常將目標與目標之間以及和環(huán)境之間的關(guān)系表示成知識的形式來推理,用這種方式來實現(xiàn)遙感目標的間接識別。同時目標中的特殊結(jié)構(gòu)常用基于參數(shù)模型的方法進行提取,這種方法經(jīng)常被用作目標的直接識別。
2.1基于參數(shù)模型的方法
目標中有一些特殊的結(jié)構(gòu),如公路的平行線、細長結(jié)構(gòu),機場中的平行跑道等,它們不能直接輸入分類器中,這是因為要采用特征向量的形式對他們進行分析描述幾乎是不可能的。在我們識別目標時,常用比如能量函數(shù)形式的參數(shù)化模型來進行目標的識別。有時為了完整提取目標,人們可通過設(shè)置能量函數(shù)的閾值來實現(xiàn)此類結(jié)構(gòu)的識別。
王永剛等[16]提取出了機場跑道對應(yīng)的平行線對,并且對機場遙感圖像進行了邊緣檢測結(jié)果的運算,采取的就是改進的Hough變換方法。何勇[17]等提取了機場的跑道邊界直線,其依據(jù)是,他發(fā)現(xiàn)在機載SAR的圖像中,跑道直線的灰度特征相當明顯。徐剛峰、王平等[18]經(jīng)過處理原始遙感圖像,得到原始圖像骨架圖,隨后對骨架的分支基元進行顯著性計算建立其相互之間的臨近相接關(guān)系,最后借助先驗知識來檢測條狀區(qū)域脊柱基元,獲得機場跑道區(qū)域的結(jié)構(gòu)骨架多尺表示,最終獲得更加完備的特征。
2.2基于知識表示和推理的方法
在對復(fù)雜的遙感圖像進行目標識別時,所需要的先驗知識總是來自不同的知識領(lǐng)域,為使信息的傳遞和分析推理能夠進行順利,我們必須采取合理地方法去表示它們,而且方法的核心和基礎(chǔ)是知識表示。知識表示是決定知識獲取、更新和推理的形式和策略的關(guān)鍵。目前我們所有的來代表知識表示的方法主要包含了神經(jīng)網(wǎng)絡(luò)、框架、語義網(wǎng)等等。其中對神經(jīng)網(wǎng)絡(luò)的知識獲取是采用的是監(jiān)督分類方法常用的設(shè)置樣本訓(xùn)練區(qū)方法,而其他的方法的知識獲取更新方式則是通過該領(lǐng)域的專家來完成。
陳韶斌等[19]研究得出建立一個機場目標的知識庫,確定機場各組成部分時要充分運用知識推理方法,并且采用合理方法來驗證各部分組成機場的各種可能性,最終實現(xiàn)對機場目標的識別。最終結(jié)果顯示:該方法在識別機場的同時確定了機場各組成部分的地理位置,獲得了更加準確可靠的機場識別結(jié)果。同時,該方法還可以更新知識庫來獲取更多的圖像特征,也適用于其他類型目標的識別,具有很強靈活性。
孔繁健[20]在1m高分辨率衛(wèi)星圖像中對電廠的冷凝塔、蓄水池、煙囪、煤棧橋和廠房等分別識別,是基于識別目標的顯著特征來建立起知識庫,并采用自上而下的知識驅(qū)動策略將各個目標逐個提取出來。
合適的知識表示和推理方法,在遙感圖像的專題應(yīng)用中尤為重要。采用合理地方法表示該領(lǐng)域的豐富知識,并及時獲取、更新、推理知識,便能夠使復(fù)雜遙感圖像的解譯水平得到更大的提升,獲取更多的有用信息更好地為服務(wù)人類。
3 結(jié)論
現(xiàn)如今,對遙感圖像目標識別的方法較片面,大多只是針對某一個場景或者是某一個問題來進行研究,并提出解決方法,這樣就極大地限制了多種方法的綜合使用,減少了解決問題的方法的實用價值。同時,此種做法還極大地增加了分析數(shù)據(jù)人員的工作量,不利于遙感圖像自主分析處理問題的解決。因此,隨著科學(xué)技術(shù)的發(fā)展,亟待出現(xiàn)能夠?qū)崿F(xiàn)遙感圖像自主識別復(fù)雜場景和目標的方法,這也是目前非常值得學(xué)者們研究的問題,它的實現(xiàn)與否將大大影響我們?nèi)祟惿畹母鱾€領(lǐng)域。
參考文獻:
[1] 張國敏.復(fù)雜場景遙感圖像目標檢測方法研究[D].長沙:國防科學(xué)技術(shù)大學(xué),2010.
[2] 舒海燕.圖像目標識別技術(shù)的研究與應(yīng)用[D].西安:西北工業(yè)大學(xué),2002.
[3] J.A.Richards. Analysis of Remotely Sensed Data:The Formative Decades and the Future[J].IEEE Transactions on Geoscience and Remote Sensing,2005,43(3):422-432.
[4] 梁路宏,艾海舟,徐光佑, 等.基于模板匹配與人工神經(jīng)網(wǎng)確認的人臉檢測[J].電子學(xué)報,2001,29(6):744-747.
[5] 嚴柏軍,宋承天,王克勇,等.BP 神經(jīng)網(wǎng)絡(luò)和遺傳算法在貨車車鎖檢測中的應(yīng)用[J].計算機輔助設(shè)計與圖形學(xué)報,2002,14(12):1179-1183.
[6] 李文娟.改進BP神經(jīng)網(wǎng)絡(luò)在水質(zhì)評價中的應(yīng)用研究[D].重慶:重慶理工大學(xué),2011.
[7] 劉丹.基于一種改進的BP神經(jīng)網(wǎng)絡(luò)的飛機目標識別[J].中國高新技術(shù)企業(yè),2011,16(2):12-13.
[8]高恒振,萬建偉,許可,等.基于聚類核函數(shù)的最小二乘支持向量機圖像半監(jiān)督分類[J].信號處理,2011(2).
[9] 郭春燕,趙春暉.基于模糊支持向量機的超光譜遙感圖像分類[J].應(yīng)用科技,2007(3).
[10] 譚琨,杜培軍.基于再生核Hilbert空間小波核函數(shù)支持向量機的高光譜遙感影像分類[J].測繪學(xué)報,2011(2).
[11] 樊繼偉,李朝鋒,吳小俊.改進的概率選擇主動支持向量機算法[J].計算機工程與應(yīng)用,2010(35).
[12] 鄭瑋.基于模糊Markov隨機場的無監(jiān)督遙感圖像分割算法[J].遙感學(xué)報,2008,12(2):246-251.
[13] 張曉峰.基于條件隨機場的目標提取[D].上海:華東師范大學(xué),2012.
[14] 陳華, 陳書海,張平,等.K - m ean s算法在遙感分類中的應(yīng)用[J].紅外與激光工程. 2000.29(2): 26-30.
[15] 于瑛英/支持向量機多分類問題中聚類分類方法研究[J].理論新探,2009,3(3):32-34.
[16] 王永剛.姜挺.龔輝.一種基于跑道檢測的機場識別方法[J].測繪工程,2009,18(5):69-72.
[17] 何勇,徐新,孫洪,等.機載SAR 圖像中機場跑道的檢測[J]. 武漢大學(xué)學(xué)報:理學(xué)版,2004,50(3):393-396.
[18] 徐剛峰,王平,沈振康.基于骨架特征的機場識別[J].紅外與激光工程,2006,35(6):717-721.
[19] 陳韶斌,蔡超,丁明躍,等.基于知識推理的機場目標識別[J].紅外與激光工程,2011(03):448-552.
[20] 孔繁健.基于高分辨率衛(wèi)星圖像的電廠目標的識別[D].南京:南京理工大學(xué),2006.