余 銘,魏立飛※,尹 峰,李丹丹,黃慶彬
(1.湖北大學(xué)資源環(huán)境學(xué)院,武漢 430062;2.湖北省國土資源研究院,武漢 430062;3.中國農(nóng)業(yè)科學(xué)院農(nóng)業(yè)資源與農(nóng)業(yè)區(qū)劃研究所/農(nóng)業(yè)部農(nóng)業(yè)遙感重點(diǎn)實(shí)驗(yàn)室,北京 100081;4.深圳市地籍測繪大隊(duì),深圳 518000)
農(nóng)作物類型識別是農(nóng)業(yè)災(zāi)情監(jiān)測、農(nóng)作物估產(chǎn)、長勢分析、確定農(nóng)作物類別、面積以及空間分布的重要基礎(chǔ)。同時也是農(nóng)業(yè)生產(chǎn)過程中合理分配資源、精準(zhǔn)施肥的重要依據(jù)[1-3]。隨著空間技術(shù)的發(fā)展,通過遙感影像解譯法進(jìn)行農(nóng)作物類型識別逐漸成為一種主流方式[4-5]。王立輝等[6]基于環(huán)境減災(zāi)衛(wèi)星數(shù)據(jù),應(yīng)用支持向量機(jī)(Support Vector Machine,SVM)方法對農(nóng)作物進(jìn)行分類,精度優(yōu)于傳統(tǒng)的最大似然法分類精度;劉磊等[7]利用決策樹方法基于多光譜數(shù)據(jù)提取了大麥、小麥、油菜和人工林草地的種植信息,總體分類精度達(dá)到86.90%;Zhang等[8]、平躍鵬[9]利用MODIS數(shù)據(jù)進(jìn)行分類,整體準(zhǔn)確度均大于90%;B.E.Bhojaraja等[10]基于Hyperion圖像,利用光譜角分類(Spectral Angle Mapper,SAM)算法提取了印度南部卡納塔克邦檳榔種植面積,達(dá)到了73.68%的準(zhǔn)確度;Peijun Du等[11]提出了一種高級二叉樹支持向量機(jī)方法基于AVIRIS數(shù)據(jù)對印度松進(jìn)行分類,精度高于90%;?tefan Con?iu等[12]利用農(nóng)業(yè)專家知識和機(jī)器學(xué)習(xí)算法基于Landsat數(shù)據(jù)實(shí)現(xiàn)了玉米、大豆、棉花、水稻的分類;郭交等[13]將Sentinel-1雷達(dá)影像與Sentinel-2光學(xué)影像融合對農(nóng)作物進(jìn)行分類;鄭利娟[14]基于高分一號和六號衛(wèi)星的影像特征,通過挖掘適用于農(nóng)作物分類的特征,研究其對農(nóng)作物分類的精度影響;歐陽玲、毛德華等[15]以Landsat8和多時相GF-1為遙感數(shù)據(jù)源,基于物候信息和光譜特征確定的農(nóng)作物識別關(guān)鍵時期和特征參數(shù),構(gòu)建面向?qū)ο蟮臎Q策樹分類模型。上述研究均圍繞傳統(tǒng)的多光譜遙感影像展開,但是多光譜遙感影像由于其波段數(shù)少、光譜分辨率較低等原因難以實(shí)現(xiàn)農(nóng)作物精細(xì)分類。高光譜數(shù)據(jù)除了具有較高的空間分辨率,還有連續(xù)且豐富的光譜波段,波段數(shù)多達(dá)幾十甚至上百個,能夠檢測到作物細(xì)微差別并鑒別出不同類別的作物,有利于提高農(nóng)作物分類的精度[16]。但是目前運(yùn)用高光譜數(shù)據(jù)對農(nóng)作物進(jìn)行精細(xì)分類的研究較少。而且常見的農(nóng)作物分布破碎不均勻,現(xiàn)有的高光譜數(shù)據(jù)農(nóng)作物分類方法沒有考慮到相鄰像素之間的相關(guān)性。由于條件隨機(jī)場(Conditional Random Field,CRF)能夠結(jié)合空間背景信息而被廣泛地運(yùn)用于圖像分割、立體視覺和活動分析等領(lǐng)域[17-18]。
本文以由AVIRIS傳感器收集的美國加利福尼亞州南部薩利納斯山谷(Salinas場景)的農(nóng)作物區(qū)域的高光譜數(shù)據(jù)為研究對象,提出了一種基于條件隨機(jī)場的高光譜遙感農(nóng)作物精細(xì)分類方法,對該數(shù)據(jù)集進(jìn)行精細(xì)分類研究,實(shí)驗(yàn)結(jié)果表明該方法有效地提高了農(nóng)作物精細(xì)分類精度,對精準(zhǔn)農(nóng)業(yè)的發(fā)展有著重要意義。
本文實(shí)驗(yàn)數(shù)據(jù)是由AVIRIS傳感器獲取的美國加利福尼亞州南部薩利納斯山谷的高光譜數(shù)據(jù)集,該數(shù)據(jù)集大小為512×217,空間分辨率為3.7 m,電磁波范圍為0.4~2.5 μm,共224個波段,去除108~112、154~167、224等20個受水吸收影響的波段后,用于研究的204個波段共包含蔬菜、裸地、葡萄園等16種地物類型。Salinas場景的編號、類別及各類的樣本數(shù)如表1所示。
表1 Salinas場景的驗(yàn)證樣本及各類地物樣本數(shù)Fig.1 Validation samples of the Salinas scene and the number of samples in each category
真實(shí)地物分布與驗(yàn)證數(shù)據(jù)集如圖1所示,其中圖1(a)為研究區(qū)地物真實(shí)分布圖,圖1(b)為驗(yàn)證數(shù)據(jù)集。
圖1 Salinas數(shù)據(jù)集:(a)真實(shí)地物分布圖(b)驗(yàn)證數(shù)據(jù)集Fig.1 The real object distribution and verification data set of Salinas data
條件隨機(jī)場是一種概率模型,由于能夠結(jié)合空間背景信息而被廣泛地運(yùn)用于圖像分割、立體視覺和活動分析等領(lǐng)域,但傳統(tǒng)的條件隨機(jī)場方法具有超平滑的現(xiàn)象[19]。因此本文提出了一種基于條件隨機(jī)場的高光譜遙感農(nóng)作物精細(xì)分類方法,該方法將利用SVM分類器獲得的各類別概率定義為條件隨機(jī)場的一元勢函數(shù),將空間平滑項(xiàng)與局部類別標(biāo)簽項(xiàng)的線性組合定義為二元勢函數(shù),從而達(dá)到在結(jié)合空間上下文信息的同時保留細(xì)節(jié)信息的分類效果。
CRF用統(tǒng)一的概率框架模擬隨機(jī)變量之間的局部鄰域相互作用,它直接模擬標(biāo)簽的后驗(yàn)概率,給出觀察圖像數(shù)據(jù)為吉布斯(Gibbs)分布:
其中y為輸入圖像的觀察數(shù)據(jù),x是整個圖像的相應(yīng)類別標(biāo)簽,Z是分區(qū)函數(shù),ψc(xc,y)是勢函數(shù),它根據(jù)圖像中的鄰域系統(tǒng)和派系對隨機(jī)變量的空間交互進(jìn)行局部建模。
作為判別分類框架,如公式(1)所示,CRF直接模擬標(biāo)簽x的后驗(yàn)分布,給定觀察值y,相應(yīng)的吉布斯能為:
分類影像通過貝葉斯最大后驗(yàn)規(guī)則(MAP)找到使后驗(yàn)概率P(x|y)最大化的標(biāo)簽圖像y。所以隨機(jī)場的MAP標(biāo)記xMAP由下式給出:
因此,當(dāng)后驗(yàn)概率P(x|y)最大時,能量函數(shù)E(x|y)最小。遙感分類問題可以通過設(shè)計合適的勢函數(shù)來描述:
其中ψi(xi,y)和ψij(xi,xj,y)分別定義在點(diǎn)i局部領(lǐng)域Ni上的一元勢函數(shù)和二元勢函數(shù)。
一元勢函數(shù)ψi(xi,y)對標(biāo)簽和觀察圖像數(shù)據(jù)之間的關(guān)系進(jìn)行建模,通過光譜特征向量來計算采用特定類別標(biāo)簽的單個像素成本。因此,可以用能夠給出標(biāo)簽xi的概率估計的判別式分類器單獨(dú)計算每個像元,給出特征向量。它在分類過程中其主導(dǎo)作用,一般為某監(jiān)督分類器的后驗(yàn)概率。通常被定義為:
其中f是一個特征映射函數(shù),它將圖像中任意一個像元映射到一個特征向量,fi(y)表示位置i處的特征向量,即光譜特征向量。P[xi=lk|fi(y)]是基于特征向量的像素i取的標(biāo)簽lk的概率。由于SVM分類器在遙感圖像分類的小訓(xùn)練集中表現(xiàn)良好,本文選取SVM分類器作為一元勢能。
二元勢函數(shù)通過考慮標(biāo)記場和觀測場來模擬每個像素與其鄰域之間的空間上下文信息。雖然由于光譜變化和噪聲的影響,均勻影像上的相鄰像素的光譜值可能看起來不相同,但是由于空間相關(guān)性的影響,它們很有可能是相同的類別。二元勢函數(shù)模擬了這種光滑性并且考慮了標(biāo)簽約束,這有利于分布均勻的區(qū)域中具有相同地物像元的分類以及保留兩個相鄰區(qū)域的邊緣。在本文中二元勢函數(shù)定義如下:
其中g(shù)ij(y)表示與數(shù)據(jù)y有關(guān)的平滑項(xiàng),ΘL(xi,xj|y)是大小為|L|×|L|的局部類標(biāo)簽成本項(xiàng),它表示鄰域內(nèi)的標(biāo)簽xi和xj之間的成本。參數(shù)θ是控制二元勢函數(shù)中標(biāo)簽成本項(xiàng)的程度的相互作用系數(shù)。函數(shù)gij(y)模擬相鄰像素i和j之間相互作用,用于衡量相鄰像素之間的差異,定義如下:
其中(i,j)是相鄰像素的空間位置,函數(shù)dist(i,j)是它們的歐幾里德距離。yi和yj是表示像素i和j出現(xiàn)的光譜向量,可以使鄰域內(nèi)相互作用的強(qiáng)度與圖像數(shù)據(jù)相關(guān)并且在相似區(qū)域促進(jìn)一致性。參數(shù)β為圖像中所有相鄰像素的光譜向量之間的均方差(即,β=(2<||yi-yj||2>)-1,其中<||yi-yj||2>是圖像上的平均值)。
局部類標(biāo)簽成本項(xiàng)ΘL(xi,xj|y)通過觀察到的圖像數(shù)據(jù)來模擬不同鄰域類別標(biāo)簽xi和xj之間的空間關(guān)系,并且被定義為:
其中P[xj|fi(y)]是特征向量fi(y)的標(biāo)簽概率。局部類別標(biāo)簽成本項(xiàng)考慮了相鄰像素的當(dāng)前類別標(biāo)簽xi以衡量相鄰元素i和j處標(biāo)簽之間的相互關(guān)系,當(dāng)特征空間中的類存在較強(qiáng)的重疊時,它會通過鄰域空間標(biāo)簽信息來改變像元的標(biāo)簽。因此,與當(dāng)前專題標(biāo)簽相關(guān)的局部類別標(biāo)簽成本項(xiàng)通過專題類標(biāo)簽的概率分布的估計形式來考慮光譜信息,以在考慮空間上下文信息的同時進(jìn)行適當(dāng)?shù)钠交?/p>
本文分別選取5%、10%的訓(xùn)練樣本進(jìn)行CRF分類模型訓(xùn)練,如圖2所示。
圖2 訓(xùn)練樣本的選取Fig.2 Selection of training samples
分別利用最小距離法、SVM、CRF方法對研究區(qū)主要農(nóng)作物,即蔬菜、裸地、葡萄園等16類地物進(jìn)行分類,并對比分析分類結(jié)果。分類結(jié)果與精度評價分別如圖3、表2所示。
圖3 Salinas數(shù)據(jù)分類效果對比圖:(a)(b)(c)當(dāng)訓(xùn)練樣本為5%時,最小距離法、SVM、CRF分類效果圖;(d)(e)(f)當(dāng)訓(xùn)練樣本為10%時,最小距離法、SVM、CRF分類效果圖Fig.3 Salinas data classification effect comparison:Minimun distance(a),SVM(b),CRF(c) classification effect map when the training sample is 5%;Minimun distance(d),SVM(e),CRF(f) classification effect map when the training sample is 10%
表2 Salinas數(shù)據(jù)不同算法精度對比Table 2 Accuracy comparison of different algorithms of Salinas data
圖3為Salinas數(shù)據(jù)在訓(xùn)練樣本分別為5%、10%時的分類效果對比圖。從圖中可以看出最小距離法分類結(jié)果“椒鹽”噪聲明顯,分類混淆現(xiàn)象嚴(yán)重,尤其是圖(a)、(d)右下角的背景全部被錯分為C2、C3、C5和C9類。圖(b)、(e)為SVM算法分類結(jié)果,圖中分類混淆現(xiàn)象有所改善,但“椒鹽”噪聲依然嚴(yán)重:如左上角的C2類與C15類等。圖(c)、(f)為CRF算法的分類效果圖,在綜合考慮了空間背景信息和光譜信息后,噪聲與分類混淆現(xiàn)象得到了優(yōu)化,對農(nóng)作物精細(xì)分類的效果較前兩種方法有較大的改善。
從表2可知,在訓(xùn)練樣本為5%、10%時,最小距離法分類結(jié)果的總體精度分別達(dá)到74.95%、75.70%,Kappa系數(shù)分別為0.7223、0.7308,但是個別地物精度較低,如在訓(xùn)練樣本為5%時,C8、C10、C15、C16的分類精度分別為60.87%、15.24%、44.32%、52.30%。訓(xùn)練樣本為10%時,C8、C10、C15、C16的分類精度分別為60.05%、28.31%、46.20%、52.95%;SVM算法分類結(jié)果的總體精度分別為88.86%、90.18%,Kappa系數(shù)分別為0.8874、0.8894,其中C15類地物精度僅為49.69%與51.97%;CRF方法分類結(jié)果的總體精度分別達(dá)到了90.74%、91.49%,Kappa系數(shù)分別為0.8954、0.9041,與前兩種方法相比分別提高了16%和2%,在前兩種方法中分類效果較差的C15在該方法中精度分別達(dá)到了72.32%與74.11%,除此之外所有類別的精度均在94%以上,分類效果較好。
針對傳統(tǒng)分類方法存在的局限,本文提出一種基于條件隨機(jī)場的高光譜遙感影像農(nóng)作物精細(xì)分類方法,對美國加利福尼亞州南部薩利納斯山谷的蔬菜、裸地、葡萄園等16種地物進(jìn)行分類,通過對條件隨機(jī)場模型中的一元勢函數(shù)使用SVM分類器對局部領(lǐng)域和有限的訓(xùn)練樣本獲得概率估計,在二元勢函數(shù)中使用空間平滑項(xiàng)和局部類別標(biāo)簽成本項(xiàng)來平滑局部鄰域空間以及考慮空間上下文信息,從而達(dá)到較好的農(nóng)作物精細(xì)分類效果。實(shí)驗(yàn)表明,與傳統(tǒng)的最小距離法和SVM方法相比,該方法的精度分別提高16%和2%,除C15類精度為74.11%外,各類地物的精度達(dá)到94%以上,在農(nóng)作物精細(xì)分類應(yīng)用中具有較大優(yōu)勢,能滿足實(shí)際生產(chǎn)需要。
隨著空間技術(shù)的不斷發(fā)展,新型的高光譜遙感影像的空間分辨率也越來越高,這使得高光譜遙感影像包含了更多的細(xì)節(jié)信息,由此也會造成同一地物內(nèi)部的光譜變化與異質(zhì)性。因此在未來的研究工作中,將重點(diǎn)展開空間特征與光譜特征信息互補(bǔ)研究,進(jìn)一步提升分類精度。