張金盈,姚光虎,林 琳,郭懷軒
(1. 山東省國土測(cè)繪院遙感技術(shù)部,山東 濟(jì)南 250013; 2. 神舟航天軟件(濟(jì)南)有限公司衛(wèi)星應(yīng)用中心,山東 濟(jì)南 250013; 3. 山東省水利科學(xué)研究院水資源與水環(huán)境省重點(diǎn)實(shí)驗(yàn)室, 山東 濟(jì)南 250013)
我國遙感技術(shù)的發(fā)展,使得遙感影像空間分辨率越來越高,這極大地便利了城區(qū)土地利用覆蓋制圖的研究,為城鎮(zhèn)發(fā)展規(guī)劃、應(yīng)急響應(yīng)和災(zāi)害評(píng)估等領(lǐng)域的應(yīng)用提供了重要的參考數(shù)據(jù)支持。高空間分辨率的遙感影像伴隨著豐富的光譜和紋理信息,同類地物內(nèi)的光譜差異增大,類間的光譜差異減少,同物異譜及同譜異物的現(xiàn)象也變得更加嚴(yán)重,導(dǎo)致目前的分類方法正確率不高[1],因此,基于高分辨率影像的分類具有一定的研究價(jià)值。
大量細(xì)節(jié)信息和復(fù)雜的光譜特征導(dǎo)致基于光譜統(tǒng)計(jì)特征進(jìn)行分類的方法正確率下降[2]。近年來,一些學(xué)者在分類過程中加入影像的紋理、空間結(jié)構(gòu)等特征[3],然后利用神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)等分類高分辨率影像。文獻(xiàn)[4]利用自適應(yīng)級(jí)聯(lián)分類器分類高分二號(hào)遙感影像。文獻(xiàn)[5]則利用高分二號(hào)影像進(jìn)行大麻地塊提取方法研究。文獻(xiàn)[6]從高分二號(hào)遙感影像中自動(dòng)提取云南松林區(qū)域。文獻(xiàn)[7]從多尺度的分割對(duì)象中提取紋理、顏色和形狀特征實(shí)現(xiàn)高分辨率影像的分類。文獻(xiàn)[8]將CART決策樹和面向?qū)ο蟮姆诸惙椒ㄏ嘟Y(jié)合分類高分辨率遙感影像,進(jìn)行土地利用監(jiān)測(cè)。文獻(xiàn)[9]則提出融合像素和分割對(duì)象特征分類高分辨率遙感影像。這些淺層視覺特征往往存在于低層高維特征空間,帶有很多冗余信息和雜點(diǎn)。而且,這些監(jiān)督方法往往是人工選擇訓(xùn)練樣本,分類器的性能很大程度上取決于樣本的選取質(zhì)量。
針對(duì)目前高分辨率影像分類中存在的問題,本文提出一種結(jié)合主動(dòng)學(xué)習(xí)和詞袋模型的高分二號(hào)遙感影像分類方法。圖1為本文方法的流程。文中首先以多尺度分割算法得到多尺度的影像分割對(duì)象作為基元;其次,考慮同一影像分割對(duì)象中視覺特征的相似性,基于詞袋模型來組織影像對(duì)象中的局部特征,以生成具有一定表達(dá)能力的視覺單詞,建立影像分割對(duì)象的高層次語義表達(dá),以提高影像分割對(duì)象視覺特征的表達(dá)能力;最后,充分考慮位于分類邊界的不確定性樣本分布,迭代選擇最優(yōu)和最優(yōu)價(jià)值的樣本用于訓(xùn)練支持向量機(jī)[10],用于分類遙感影像。
現(xiàn)實(shí)世界地物目標(biāo)復(fù)雜多變,不同地物類型需要適當(dāng)?shù)木嚯x和比例尺才能有效完整地呈現(xiàn),因此應(yīng)用單一的分割尺度很難實(shí)現(xiàn),要充分描述和表達(dá)不同的地物類型需要在不同的分割尺度下才能進(jìn)行。多尺度分割算法通過分割參數(shù)的設(shè)定,不同的參數(shù)設(shè)定決定了分割結(jié)果的尺度和質(zhì)量,進(jìn)一步會(huì)直接影響對(duì)象分類的精度。本文采用基于分型網(wǎng)絡(luò)演化算法[11]生成影像分割對(duì)象。這種分割算法具有良好的穩(wěn)健性,有效地改善了影像信息萃取的信噪比。文中首先對(duì)研究區(qū)域遙感數(shù)據(jù)進(jìn)行多尺度分割,基于多尺度分割結(jié)果選擇最佳的分割尺度。
在利用機(jī)器學(xué)習(xí)分類之前,需要對(duì)影像分割對(duì)象建立具有良好表達(dá)能力且穩(wěn)健的視覺特征表達(dá)。由于高分二號(hào)遙感影像空間分辨率的提高,導(dǎo)致同物異譜和同譜異物現(xiàn)象變得更加嚴(yán)重,這些存在于底層高維空間的視覺特征通常帶有大量的信息冗余和噪聲問題[12],使得基于這些底層視覺特征進(jìn)行分類的方法正確率不高。為了實(shí)現(xiàn)遙感影像信息解譯中影像分割對(duì)象的表達(dá)和分類,文中通過詞袋模型來提取影像分割對(duì)象中局部視覺特征的統(tǒng)計(jì)信息,實(shí)現(xiàn)影像分割對(duì)象的詞袋表示。圖2為影像分割對(duì)象的詞袋表達(dá)構(gòu)建示意圖,影像分割對(duì)象的詞袋表示構(gòu)建的具體過程如下:
(1) 基于像素提取每個(gè)像素的光譜和紋理信息[13],構(gòu)建像素的視覺特征向量并歸一化。
(2) 視覺詞典的構(gòu)建。利用K-means聚類算法計(jì)算n個(gè)聚類中心,每個(gè)聚類中心被看作一個(gè)“視覺單詞”,則n個(gè)“視覺單詞”組成了視覺詞典。
(3) “視覺單詞”的表示。將影像分割對(duì)象內(nèi)所有像素的視覺特征向量用離它最近的“視覺單詞”代替,統(tǒng)計(jì)當(dāng)前影像分割對(duì)象內(nèi)每個(gè)“視覺單詞”出現(xiàn)的頻率,構(gòu)建影像分割對(duì)象的詞袋表示。這個(gè)基于影像分割對(duì)象的詞袋表示將作為SVM分類器的輸入,對(duì)其對(duì)應(yīng)的影像分割對(duì)象進(jìn)行分類。
影像分割對(duì)象的詞袋表達(dá)構(gòu)建之后,文中采用SVM模型實(shí)現(xiàn)影像分類。由于SVM模型對(duì)于分類非線性高維數(shù)據(jù)通常表現(xiàn)出良好的性能。SVM模型[14]是一個(gè)二分類器(如圖3所示)。假設(shè)數(shù)據(jù)集D={(x1,y1),(x2,y2),…,(xn,yn)},其中,xi(1≤i≤n)表示影像分割對(duì)象的詞袋表示,yi(1≤i≤n)表示對(duì)應(yīng)影像對(duì)象的標(biāo)簽,分類超平面函數(shù)為f(x)=ωTx+b。對(duì)于分類超平面的求解通常被轉(zhuǎn)換為優(yōu)化問題
(1)
式(1)等價(jià)于
(2)
通過給每一個(gè)約束條件加上一個(gè)拉格朗日乘子α,將約束條件融合到目標(biāo)函數(shù)中,即
(3)
令
(4)
然而,傳統(tǒng)的SVM模型是針對(duì)二分類問題的。對(duì)于遙感影像的分類,往往涉及多種地物類型,因此,需要將遙感影像的分類方法轉(zhuǎn)化為多類問題。目前最簡(jiǎn)單的方法是將多類問題直接分解為若干個(gè)兩類問題。在SVM分類問題中,可采用一對(duì)一法和一對(duì)余[15]進(jìn)行多類分類,其中一對(duì)余的擴(kuò)展方法目前已經(jīng)在廣泛應(yīng)用于遙感影像分類中,因此本文采用此方法。
對(duì)于監(jiān)督方法而言,訓(xùn)練樣本的數(shù)量和質(zhì)量對(duì)分類器的性能起決定性作用。對(duì)于SVM分類器而言,離分類超平面越遠(yuǎn)的樣本,其分類置信度越高。主動(dòng)學(xué)習(xí)可以在SVM模型訓(xùn)練過程中根據(jù)學(xué)習(xí)進(jìn)程,根據(jù)一定的規(guī)則(如邊緣采樣[16])主動(dòng)選擇最有利于分類器性能的樣本進(jìn)行學(xué)習(xí),提高訓(xùn)練模型的泛化能力。因此,本文采用主動(dòng)學(xué)習(xí)的策略[17]訓(xùn)練最優(yōu)的SVM分類器。主動(dòng)學(xué)習(xí)從形式上說是一個(gè)循環(huán)迭代的過程,具體過程如下:
(1) 將已知樣本集分成3個(gè)集合,分別為初始訓(xùn)練樣本集U0、候選樣本集UC和測(cè)試樣本集UT。
(2) 進(jìn)行第i(i≥1)次循環(huán),利用訓(xùn)練樣本集Ui-1訓(xùn)練得到分類超平面fi-1。利用當(dāng)前分類超平面fi-1識(shí)別測(cè)試樣本集UT,記錄當(dāng)前分類超平面fi-1的正確率。然后利用當(dāng)前超平面fi-1識(shí)別候選樣本集UC,選擇新樣本,記作UN。樣本選擇準(zhǔn)則是:①添加錯(cuò)誤檢測(cè)的樣本。②對(duì)一個(gè)數(shù)據(jù)點(diǎn)進(jìn)行分類,當(dāng)數(shù)據(jù)點(diǎn)離超平面的距離越大,分類結(jié)果的確信度也越大。因此如果沒有錯(cuò)誤檢測(cè)的樣本則按樣本點(diǎn)到超平面的距離遠(yuǎn)近添加樣本。執(zhí)行Ui=Ui-1∪UN,UC=UC-UN。
(3) 重復(fù)步驟(2),直到UC為空或正確率不再變化為止(在所允許的誤差范圍內(nèi))。
為了驗(yàn)證本文方法的有效性,采用山東省某市的高分二號(hào)遙感影像作為驗(yàn)證數(shù)據(jù)集,同時(shí)將試驗(yàn)結(jié)果與傳統(tǒng)的基于像素的方法得到的分類結(jié)果進(jìn)行對(duì)比分析。場(chǎng)景Ⅰ和場(chǎng)景Ⅱ的大小均為1110×1105像素,空間分辨率為1 m。試驗(yàn)中主要將場(chǎng)景分類為地面、建筑物、植被和水體4大類,以驗(yàn)證本文方法的有效性。文中采用精確率(P)、召回率(R)、F1-score和總正確率評(píng)價(jià)分類結(jié)果的優(yōu)劣。
對(duì)于傳統(tǒng)的被動(dòng)學(xué)習(xí)而言,訓(xùn)練樣本的選擇是人為確定的訓(xùn)練樣本。而本文利用邊緣采樣的主動(dòng)學(xué)習(xí)方式優(yōu)化SVM模型的訓(xùn)練過程。為了驗(yàn)證該方法的有效性,文中將最大邊界采樣的策略和隨機(jī)采樣策略進(jìn)行對(duì)比分析。試驗(yàn)中訓(xùn)練樣本庫分別采用兩種采樣方式進(jìn)行更新。從圖4可以看出,隨著訓(xùn)練樣本庫的不斷更新,采用本文策略的樣本庫更新方式可以得到更優(yōu)的訓(xùn)練模型。
為了處理低維空間不可分的數(shù)據(jù),SVM通常利用核函數(shù)的方法將低維向量升維至高維空間。為了驗(yàn)證不同核函數(shù)對(duì)分類精度的影響,試驗(yàn)結(jié)果如圖5所示。與其他核函數(shù)相比,使用徑向基核函數(shù)的分類結(jié)果在總正確率上要高出2%以上。
視覺詞典中視覺單詞的個(gè)數(shù)決定了詞典的表達(dá)能力。為了驗(yàn)證視覺單詞個(gè)數(shù)對(duì)分類結(jié)果的影響,文中分別設(shè)置視覺單詞個(gè)數(shù)為100、200、300、400和500進(jìn)行對(duì)比試驗(yàn)。圖6中柱狀圖表示的不同地物類型的分類精度受視覺單詞個(gè)數(shù)的影響,而折線圖則反映的是分類總正確率受視覺單詞個(gè)數(shù)的影響。試驗(yàn)結(jié)果表明,視覺單詞個(gè)數(shù)對(duì)分類精度有較大影響,正確率的波動(dòng)大于4%。
為了進(jìn)一步驗(yàn)證本文方法的優(yōu)勢(shì),將本文方法與傳統(tǒng)的基于像素的方法進(jìn)行對(duì)比分析。表1給出了兩種方法分類場(chǎng)景Ⅰ和場(chǎng)景Ⅱ的精度對(duì)比??梢缘贸?,本文方法在分類正確率上要高出基于像素的方法6%以上。圖7中灰色表示建筑物區(qū),白色表示地面區(qū),黑色表示水體區(qū),淺灰色表示植被區(qū)。從圖中可以看出,本文方法可以有效抑制分類結(jié)果中的椒鹽現(xiàn)象。
表1 不同方法分類結(jié)果的對(duì)比 (%)
本文提出了一種結(jié)合主動(dòng)學(xué)習(xí)和詞袋模型的高分二號(hào)遙感影像分類方法。首先基于多尺度分割算法獲取最優(yōu)的影像分割對(duì)象集合;其次在提取影像的光譜和紋理信息基礎(chǔ)上,利用詞袋模型建立影像分割對(duì)象的語義表達(dá),以解決低層視覺特征與語義特征之間的語義鴻溝問題;最后基于邊緣采樣的方法獲取最有價(jià)值的訓(xùn)練樣本,以訓(xùn)練最優(yōu)的SVM模型。對(duì)高分二號(hào)衛(wèi)星的分類結(jié)果驗(yàn)證了本文方法的有效性。下一步將融合多源數(shù)據(jù),如多光譜的數(shù)據(jù)進(jìn)行融合處理和分類,以提高分類結(jié)果的正確性。