王 鑫,陳 琴
(三和數(shù)碼測繪地理信息技術(shù)有限公司 甘肅 天水 741000)
隨著人口的增長和經(jīng)濟(jì)的發(fā)展,土地利用的合理規(guī)劃和管理變得越來越重要。衛(wèi)星遙感影像在土地利用分類中的應(yīng)用越來越廣泛,成為了一種重要的土地資源監(jiān)測和管理手段。土地利用分類的目的是將土地利用類型劃分為不同的類別,以便于制定相應(yīng)的管理和規(guī)劃措施。尺度是土地利用分類中一個(gè)重要的因素。尺度越大,土地利用類型的信息越模糊,分類精度越低。因此,在土地利用分類中,如何選擇適當(dāng)?shù)某叨葘τ讷@得高精度的分類結(jié)果至關(guān)重要。
高光譜遙感影像土地利用分類的研究面臨著復(fù)雜的非線性數(shù)據(jù)結(jié)構(gòu)、有限訓(xùn)練樣本下的維數(shù)災(zāi)難以及光譜混合等挑戰(zhàn)[1-2]。此外,高光譜遙感影像給影像的精確分類帶來了新的挑戰(zhàn)。第一個(gè)挑戰(zhàn)是嚴(yán)重的光譜變異性和空間異質(zhì)性,一些基于光譜信息的分類方法會(huì)在分類結(jié)果中造成嚴(yán)重的椒鹽噪聲[3]。另一個(gè)挑戰(zhàn)是地物空間尺度的巨大差異。因此,在面向?qū)ο蟮姆诸愔校x擇合適的分割尺度具有挑戰(zhàn)性。因此,需要光譜-空間融合分類器,它可以同時(shí)考慮精細(xì)的光譜屬性信息和空間幾何信息。
傳統(tǒng)的高光譜空間分類方法可以通過引入空間信息來減少分類圖的椒鹽噪聲。這些方法基于兩個(gè)主要策略。第一種策略是級聯(lián)每個(gè)像素的空間特征和光譜信息作為分類器的輸入,其中空間特征包括紋理、形狀和對象特征。第二種策略是引入空間上下文信息來提高像素分類精度,這可以被認(rèn)為是一種基于后處理的分類方法。使用該策略的典型方法是基于馬爾可夫隨機(jī)場的方法、基于條件隨機(jī)場(conditional random field, CRF)的方法和擴(kuò)展形態(tài)學(xué)。盡管前面提到的高光譜遙感影像分類方法的有效性已被證明,但它們非常依賴基于領(lǐng)域知識和專家經(jīng)驗(yàn)的手工特征[4]。此外,使用手工特征作為輸入的傳統(tǒng)分類器,例如支持向量機(jī)(support vector machine, SVM)、多元線性回歸(multiple linear regression, MLR)和隨機(jī)森林(random forest, RF),可以被視為淺層網(wǎng)絡(luò),這限制了挖掘的潛力、高級語義特征和復(fù)雜場景分類方法。
深層卷積神經(jīng)網(wǎng)絡(luò)具有強(qiáng)大的特征學(xué)習(xí)能力,可以自動(dòng)挖掘深層次的空間特征,以廣泛應(yīng)用于遙感影像地物分類中??臻g取塊機(jī)制只能利用局部空間信息,造成分類結(jié)果中存在嚴(yán)重錯(cuò)分的孤立區(qū)域。為克服上述問題,本文提出聯(lián)合條件隨機(jī)場模型和卷積神經(jīng)網(wǎng)絡(luò)的遙感影像分類方法,通過條件隨機(jī)場模型整合全局上下文信息緩解高光譜影像的空譜異質(zhì)性。
本文采用的卷積神經(jīng)網(wǎng)絡(luò)示意圖如圖1 所示。為防止輸入特征的空間尺度下降過快,在構(gòu)建卷積神經(jīng)網(wǎng)絡(luò)時(shí)未采用池化操作。卷積層和池化層逐層提取深層次的空間特征,全連接層進(jìn)一步整合全局特征,最后全連接層輸出的高層語義信息通過分類器進(jìn)行分類。
圖1 基準(zhǔn)卷積神經(jīng)網(wǎng)絡(luò)高光譜分類示意圖
條件隨機(jī)場模型是Lafferty 提出的經(jīng)典概率判別模型,其最初是用來標(biāo)記序列化文本數(shù)據(jù)的統(tǒng)計(jì)模型。如圖2 所示。
圖2 條件隨機(jī)場模型示意圖
在二維圖像的處理中,CRF 通過概率圖模型中相鄰像素之間的邊連接關(guān)系來考慮像素之間的空間交互作用,進(jìn)而整合空間的上下文信息。在給定的定量觀測變量條件下,其直接對最大后驗(yàn)概率建模,具有更靈活的上下文信息建模能力。因此,CRF 模型廣泛應(yīng)用于遙感圖像分類等任務(wù)中。
本文提出聯(lián)合條件隨機(jī)場和卷積神經(jīng)網(wǎng)絡(luò)(conditional random field convolutional neural networks,CRFCNN)的全局融合分類框架。如圖3 所示?;谶x取的三維空間塊,本文首先構(gòu)建了一個(gè)深層卷積神經(jīng)網(wǎng)絡(luò)提取局部的深層次的空間特征,然后利用馬氏距離約束的CRF 模型進(jìn)一步整合空間上下文信息減少分類圖中的鼓勵(lì)區(qū)域。同時(shí)引入CRF 模型減弱空間塊尺寸對分類精度的影響。最后為緩解深層卷積神經(jīng)網(wǎng)絡(luò)海量參數(shù)和高光譜影像分類中訓(xùn)練樣本受限之間的矛盾,采用4 種虛擬樣本增強(qiáng)策略。
圖3 聯(lián)合條件隨機(jī)場和卷積神經(jīng)網(wǎng)絡(luò)地物分類框架
本文采用開源數(shù)據(jù)集WHU-Hi-LongKou。數(shù)據(jù)采集地點(diǎn)為湖北省龍口鎮(zhèn)典型的簡單農(nóng)業(yè)場景,采集時(shí)間為2018 年7 月17 日,數(shù)據(jù)采集期間天氣晴朗無風(fēng),氣溫約為36 ℃,空氣相對濕度約為65%。采集平臺(tái)為大疆M600pro無人機(jī)搭載的Nano-Hyperspec-VNIR 成像光譜儀,飛行高度約為500 m,空間分辨率為0.463 m,影像尺寸為550×400 像素,在400~1 000 nm 范圍內(nèi)有170 個(gè)波段。
2.2.1 訓(xùn)練樣本設(shè)置
標(biāo)注的每個(gè)類別,隨機(jī)選擇100 個(gè)標(biāo)記像素作為訓(xùn)練集用于模型訓(xùn)練,其余像素作為測試集,用于精度測試,詳細(xì)的訓(xùn)練樣本如表1 所示。WHU-Hi-LongKou 數(shù)據(jù)中訓(xùn)練樣本占標(biāo)記像素的0.44%。
表1 訓(xùn)練樣本和測試樣本劃分
2.2.2 模型參數(shù)設(shè)置
CRFCNN 分類框架中輸入模型的空間尺寸塊為9×9,數(shù)據(jù)增強(qiáng)策略20 次,參數(shù)值根據(jù)計(jì)算資源和分類準(zhǔn)確性的經(jīng)驗(yàn)值確定。卷積神經(jīng)網(wǎng)絡(luò)分為4 個(gè)卷積核尺寸為3×3,步長為1 的卷積層和兩個(gè)卷積核數(shù)量分別為128 和64 的全連接層構(gòu)成,模型訓(xùn)練中,初始學(xué)習(xí)率為0.01,衰減率為2e-4,采用Adam 進(jìn)行優(yōu)化,batch 數(shù)量設(shè)置為50,訓(xùn)練epoch為150。
視覺表現(xiàn)是評價(jià)分類方法非常重要的一個(gè)方面,圖4展示了CRFCNN 和對比方法(SVM、FNEA-OO、SVRFMC和基準(zhǔn)CNN)在WHU-Hi-LongKou 數(shù)據(jù)中的分類結(jié)果。
圖4 WHU-Hi-LongKou 數(shù)據(jù)分類結(jié)果
從分類圖中可以看出,由于不同作物之間光譜信息較為相似,僅使用光譜信息的SVM 分類結(jié)果中出現(xiàn)明顯的錯(cuò)分椒鹽噪聲現(xiàn)象。此外由于地塊邊緣農(nóng)作物較為稀疏,部分區(qū)域被誤分為雜草和道路。相比于SVM 分類結(jié)果,估計(jì)空間鄰域信息的方法(FNEA-OO、SVRFMC 和基準(zhǔn)CNN)顯示出優(yōu)異的視覺效果。FNEA-OO 分類結(jié)果相比于SVM 更為平滑,但由于道路、房屋和雜草的最佳分割尺度低于作物和水體的分割尺度,導(dǎo)致這3 類地物存在明顯的錯(cuò)分現(xiàn)象。SVRFMC 方法充分利用空間上下文信息,分類圖中的椒鹽噪聲得到極大緩解。然而由于SVM 分類器提供的一元?jiǎng)菽軠?zhǔn)確性較低,導(dǎo)致闊葉大豆、窄葉大豆和棉花之間存在一些錯(cuò)分?;鶞?zhǔn)CNN 方法只能利用局部空間信息,在訓(xùn)練過程中很容易陷入局部最優(yōu),導(dǎo)致分類圖中存在大量錯(cuò)分的孤立區(qū)域。CRFCNN 方法在CNN 基礎(chǔ)上融合空間上下文信息取得了最優(yōu)的目視效果,分類結(jié)果中錯(cuò)分的孤立區(qū)域顯著降低。
定量評價(jià)可以準(zhǔn)確評估分類算法的性能,其中測試樣本是通過野外實(shí)地勘察獲取的,通常不包括不確定類別像素。表2 中列出了CRFCNN 和對比方法的分類精度。分類精度和視覺表現(xiàn)類似,F(xiàn)NEA-OO、SVRFMC、CNN 和CRFCNN 分類方法的OA 比SVM 分別提升了4.53%,4.31%,3.24%和4.58%,其中CRFCNN 方法取得了最高的分類精度。除闊葉大豆外,CRFCNN 分類結(jié)果中其他作物的分類準(zhǔn)確率均在99%以上。因此實(shí)驗(yàn)結(jié)果證明CRFCNN 方法在WHU-Hi-LongKou 數(shù)據(jù)地物分類中具有優(yōu)異的性能。
表2 WHU-Hi-LongKou 數(shù)據(jù)分類精度
本文提出了聯(lián)合條件隨機(jī)場和卷積神經(jīng)網(wǎng)絡(luò)的分類框架CRFCNN,針對高分辨率影像的特點(diǎn),引入條件隨機(jī)場模型整合上下文信息,極大改善分類結(jié)果中錯(cuò)分的鼓勵(lì)區(qū)域,在高光譜影像的實(shí)驗(yàn)中表現(xiàn)出優(yōu)良的性能。但是本文的研究也存在著一些不足。例如,樣本的數(shù)量較少,無法衡量長時(shí)序高光譜影像地物分類的精度。對于土地利用的劃分存在著地域性,限制了其在廣域范圍內(nèi)發(fā)揮作用。