孫文瑞,姜慧芳,左曉慶,李瀟雨,劉懷鵬*
(1.洛陽(yáng)師范學(xué)院 國(guó)土與旅游學(xué)院,河南 洛陽(yáng) 471934)
利用遙感技術(shù)進(jìn)行土地利用分類(lèi)時(shí),根據(jù)影像數(shù)據(jù)特點(diǎn)選擇適用的分類(lèi)方法非常重要。監(jiān)督分類(lèi)由于其具有研究區(qū)的先驗(yàn)知識(shí),被廣泛應(yīng)用于遙感影像分類(lèi)中。利用監(jiān)督分類(lèi)方法進(jìn)行土地利用分類(lèi)的研究較多,如李帥[1]等以Landsat遙感影像為例,從分類(lèi)精度、錯(cuò)分漏分誤差等方面分析了平行六面體、最小距離、馬氏距離、最大似然對(duì)土地利用分類(lèi)精度的影響;史敏偉[2]等基于GF-2號(hào)影像,對(duì)比分析了隨機(jī)森林、最大似然監(jiān)督分類(lèi)法在高分辨率影像土地利用分類(lèi)中的優(yōu)勢(shì);王棟[3]等基于Landsat5 TM影像,對(duì)比分析了最大似然、支持向量機(jī)(SVM)、隨機(jī)森林3種監(jiān)督分類(lèi)器對(duì)大姚縣各地類(lèi)的分類(lèi)效果;黃鵬程[4]等基于Landsat8 OLI影像,對(duì)比分析了最大似然、決策樹(shù)分類(lèi)法對(duì)于西安市土地利用分類(lèi)的效果;程國(guó)旗[5]等以黃島區(qū)為例,基于Landsat8 OLI_TIRS影像,對(duì)比分析了最大似然、SVM、神經(jīng)網(wǎng)絡(luò)等6種監(jiān)督分類(lèi)器的土地利用分類(lèi)效果;蘇志強(qiáng)[6]基于GF-2號(hào)遙感影像,對(duì)比了博湖縣監(jiān)督分類(lèi)方法,結(jié)果表明隨機(jī)森林能更好地發(fā)揮GF-2號(hào)影像數(shù)據(jù)在土地利用分類(lèi)中的應(yīng)用潛力。綜合上述研究可知,在高維特征影像分類(lèi)中,隨機(jī)森林、SVM表現(xiàn)優(yōu)異,分類(lèi)精度較高,而最大似然因產(chǎn)生休斯現(xiàn)象,分類(lèi)精度極低。土地利用分類(lèi)采用影像的光譜波段即可取得較高的分類(lèi)精度,針對(duì)應(yīng)用較廣泛、具有豐富光譜信息的Landsat8數(shù)據(jù),利用哪種分類(lèi)器更為合適,是一個(gè)值得探索的問(wèn)題。因此,本文以洛陽(yáng)市為研究區(qū),選取Landsat8遙感影像的9個(gè)光譜波段,分別采用SVM、隨機(jī)森林和最大似然3種監(jiān)督分類(lèi)器確定研究區(qū)影像的類(lèi)別,并采集不同像素容量的訓(xùn)練樣本對(duì)影像進(jìn)行分類(lèi);再對(duì)3種分類(lèi)方法在不同訓(xùn)練樣本中的分類(lèi)精度進(jìn)行對(duì)比,從而確定以Landsat8影像光譜波段為信息源的影像分類(lèi)適用的分類(lèi)器,為基于遙感影像的土地利用分類(lèi)提供技術(shù)支撐。
洛陽(yáng)是隋唐大運(yùn)河的中心,先后有10多個(gè)王朝在此建都,具有千年帝都之稱(chēng);橫跨黃河中下游南北兩岸,東鄰鄭州市,西接三門(mén)峽市,北跨黃河與焦作市接壤,南與平頂山市、南陽(yáng)市相連;截至2018年末,總?cè)丝跒?13.67萬(wàn)人,常住人口為688.85萬(wàn)人,總面積為15 230 km2。由于洛陽(yáng)市吉利區(qū)在空間位置上與老城區(qū)、西工區(qū)、廛河回族區(qū)、澗西區(qū)和洛龍區(qū)不相鄰,本文不將吉利區(qū)劃入研究區(qū)。研究區(qū)位置如圖1所示。
圖1 研究區(qū)位置圖
本文選用Landsat8衛(wèi)星搭載的OLI陸地成像儀獲取的遙感影像數(shù)據(jù),成像時(shí)間為2017-08-09,共11個(gè)波段,包括8個(gè)空間分辨率為30 m的多光譜波段,1個(gè)空間分辨率為15 m的全色波段和兩個(gè)空間分辨率為100 m的熱紅外波段。本文主要利用海岸藍(lán)色、藍(lán)色、綠色、紅色、近紅外、短波紅外1、短波紅外2、熱紅外1、熱紅外2等9個(gè)波段對(duì)影像進(jìn)行分類(lèi),因此在影像分類(lèi)前,需對(duì)影像進(jìn)行波段合成、裁剪、融合等預(yù)處理,獲得具有15 m空間分辨率的9個(gè)波段影像再進(jìn)行分類(lèi)研究。
本文利用ENVI5.3軟件打開(kāi)研究區(qū)遙感影像,為便于各類(lèi)別訓(xùn)練樣本以及精度驗(yàn)證樣本的選擇,選用標(biāo)準(zhǔn)假彩色的波段組合顯示遙感影像。本文通過(guò)對(duì)影像的目視分析,采用自定義的形式確定影像的分類(lèi)類(lèi)別為水體、草類(lèi)、作物、裸地、樹(shù)木、不透水面和陰影,再根據(jù)遙感圖像解譯的相關(guān)內(nèi)容[7],建立每種地類(lèi)的解譯標(biāo)志,如表1所示。
表1 影像類(lèi)別的解譯標(biāo)志
在確定類(lèi)別的研究區(qū)影像中,根據(jù)各種地類(lèi)建立的解譯標(biāo)志,為影像選擇3套訓(xùn)練樣本、一套精度驗(yàn)證樣本。訓(xùn)練樣本、精度驗(yàn)證樣本中各地類(lèi)數(shù)量如表2所示。
表2 訓(xùn)練樣本與驗(yàn)證樣本數(shù)量/個(gè)
本文利用ENVI5.3中的ROI可分離性工具來(lái)計(jì)算任意類(lèi)別間的統(tǒng)計(jì)距離。根據(jù)相關(guān)文獻(xiàn),類(lèi)別之間樣本的可分離性應(yīng)處于0~2 之間,數(shù)值大于1.9,說(shuō)明樣本之間的可分離性好;數(shù)值小于1.8,則需重新選擇樣本;數(shù)值小于1,需將兩個(gè)類(lèi)別的樣本合并。本文計(jì)算得到的樣本可分離性數(shù)值如表3所示,可以看出,各類(lèi)別之間的可分離性數(shù)值均大于1.8,說(shuō)明選取的訓(xùn)練樣本符合要求,可用于影像分類(lèi)。
表3 土地利用類(lèi)型樣本可分離性數(shù)值
基于隨機(jī)森林、SVM、最大似然3種監(jiān)督分類(lèi)器,分別利用3套訓(xùn)練樣本對(duì)洛陽(yáng)市9個(gè)波段組合的影像進(jìn)行分類(lèi),再利用精度驗(yàn)證樣本檢驗(yàn)各種樣本下的總體精度,進(jìn)而分析不同分類(lèi)器在不同訓(xùn)練樣本情況下,總體精度的變化情況。為了分析波段組合、研究區(qū)變化情況下,Landsat8影像分類(lèi)結(jié)果與洛陽(yáng)市9個(gè)波段組合所得結(jié)果的異同,本文在不同波段組合下利用最佳分類(lèi)樣本對(duì)洛陽(yáng)市Landsat8影像進(jìn)行分類(lèi)檢驗(yàn),同時(shí)增加不同時(shí)相臨沂市蘭山區(qū)的Landsat8影像進(jìn)行研究區(qū)變化檢驗(yàn)。
本文分別采用訓(xùn)練樣本1、訓(xùn)練樣本2和訓(xùn)練樣本3對(duì)影像進(jìn)行分類(lèi),并利用精度驗(yàn)證樣本進(jìn)行驗(yàn)證。隨機(jī)森林、SVM和最大似然3種分類(lèi)器的總體精度變化結(jié)果如圖2所示,可以看出,隨著訓(xùn)練樣本數(shù)量的增加,隨機(jī)森林、最大似然的總體分類(lèi)精度均有一定程度的提高;對(duì)于SVM而言,當(dāng)訓(xùn)練樣本數(shù)由40個(gè)增加到60個(gè)時(shí),總體分類(lèi)精度有所下降,但整體上其總體分類(lèi)精度仍呈上升趨勢(shì)。在以9個(gè)波段為信息源的Landsat8影像分類(lèi)中,最大似然的分類(lèi)精度最高,隨機(jī)森林次之,SVM最低。
圖2 訓(xùn)練樣本數(shù)量對(duì)分類(lèi)精度的影響
在3個(gè)分類(lèi)器中,訓(xùn)練樣本3的總體精度都是最高的。3個(gè)分類(lèi)器利用訓(xùn)練樣本3的分類(lèi)結(jié)果混淆矩陣如表4~6所示,可以看出,SVM、隨機(jī)森林和最大似然的總體精度分別為87.464 3%、91.000 0%和91.750 0%;SVM、隨機(jī)森林和最大似然的Kappa系數(shù)分別為0.853 8、0.895 0和0.903 8,最大似然優(yōu)于隨機(jī)森林,更優(yōu)于SVM;最大似然和隨機(jī)森林的制圖精度和用戶(hù)精度明顯高于SVM。
表4 SVM監(jiān)督分類(lèi)混淆矩陣
就單個(gè)地物的分類(lèi)精度而言,3種分類(lèi)器對(duì)水體、裸地和陰影均可達(dá)到較高的識(shí)別精度;而草類(lèi)、作物和樹(shù)木的分類(lèi)精度則較低;不透水面采用隨機(jī)森林進(jìn)行分類(lèi)可得到相對(duì)較高的分類(lèi)精度。
表5 隨機(jī)森林監(jiān)督分類(lèi)混淆矩陣
表6 最大似然監(jiān)督分類(lèi)混淆矩陣
在9個(gè)波段組合分類(lèi)的基礎(chǔ)上,本文利用最佳訓(xùn)練樣本(訓(xùn)練樣本3),在一些典型的波段組合上驗(yàn)證實(shí)驗(yàn)結(jié)果在不同分類(lèi)器中的異同。不同波段組合下,3種分類(lèi)器分類(lèi)的總體精度如圖3所示,可以看出,在12次波段組合變化中,最大似然分類(lèi)10次取得了最好的分類(lèi)結(jié)果,隨機(jī)森林兩次取得了最好的分類(lèi)結(jié)果,SVM未取得最好的分類(lèi)結(jié)果,說(shuō)明在波段組合變化的情況下,最大似然分類(lèi)效果仍然最好,隨機(jī)森林次之,SVM分類(lèi)精度最低。
圖3 不同波段組合分類(lèi)精度對(duì)比
以洛陽(yáng)市老城區(qū)、西工區(qū)、廛河回族區(qū)、澗西區(qū)和洛龍區(qū)為例,本文分別利用SVM、隨機(jī)森林和最大似然3種分類(lèi)器進(jìn)行分類(lèi),結(jié)果如圖4所示,可以看出,整體上3種分類(lèi)器對(duì)影像分類(lèi)的效果均較好,水體、裸地、不透水面的分類(lèi)精度較高,結(jié)果與實(shí)地情況較接近,但草類(lèi)、作物和樹(shù)木互相之間易出現(xiàn)錯(cuò)分,分類(lèi)精度略低。
圖4 3種分類(lèi)器的分類(lèi)結(jié)果比較
本文采用與洛陽(yáng)市影像相同的處理方法,對(duì)2017-05-25成像的臨沂市蘭山區(qū)9個(gè)波段Landsat8遙感影像進(jìn)行不同分類(lèi)器分類(lèi)結(jié)果的檢驗(yàn),將影像分為水體、植被、建筑物、裸地和陰影5個(gè)類(lèi)別,每種類(lèi)別分別選取80個(gè)像素作為訓(xùn)練樣本,400個(gè)像素作為精度驗(yàn)證樣本。實(shí)驗(yàn)結(jié)果表明,最大似然分類(lèi)的總體精度為94.950 0%,Kappa系數(shù)為0.936 9;SVM分類(lèi)的總體精度為93.850 0%,Kappa系數(shù)為0.923 1;隨機(jī)森林分類(lèi)的總體精度為92.650 0%,Kappa系數(shù)為0.908 4,表明最大似然的分類(lèi)效果優(yōu)于隨機(jī)森林和SVM。
本文分別利用隨機(jī)森林、SVM、最大似然3種分類(lèi)器對(duì)Landsat8影像進(jìn)行分類(lèi),從而判斷較少特征采用的情況下所適用的分類(lèi)方法。結(jié)果表明,對(duì)于本文選用的Landsat8遙感影像,最大似然的分類(lèi)精度最高、分類(lèi)效果最好,表明在利用較少特征的Landsat8影像進(jìn)行分類(lèi)時(shí),選用速度較快的最大似然分類(lèi)法即可,在高維特征中具有優(yōu)異性能的隨機(jī)森林和SVM,未顯現(xiàn)其優(yōu)勢(shì)。
本文所得結(jié)論是否適用于更多季節(jié)、地區(qū)還需進(jìn)一步研究。另外,隨機(jī)森林、SVM、最大似然3種分類(lèi)器對(duì)Landsat8影像進(jìn)行分類(lèi)時(shí),訓(xùn)練樣本數(shù)將對(duì)分類(lèi)器總體精度產(chǎn)生影響,隨著訓(xùn)練樣本數(shù)的增加,3種分類(lèi)器的總體精度均呈上升趨勢(shì),而它們的總體精度是否繼續(xù)隨訓(xùn)練樣本數(shù)的增加而上升,還有待于進(jìn)一步研究。