俞浩藝
(江蘇省地質(zhì)測(cè)繪院 江蘇南京 211100)
社會(huì)經(jīng)濟(jì)發(fā)展對(duì)土地利用方式產(chǎn)生了較為顯著的影響,將無人機(jī)高分辨率遙感技術(shù)應(yīng)用到土地利用的分類中,可以有效提升土地規(guī)劃管理效率,對(duì)于宏觀土地政策的制定具有一定的借鑒意義[1-2]。
相較于普通載人航空和衛(wèi)星遙感,無人機(jī)遙感技術(shù)具有環(huán)境適應(yīng)性強(qiáng)、機(jī)動(dòng)靈活、成本低廉、分辨率高等特點(diǎn)[3],近年來逐漸應(yīng)用于林業(yè)、農(nóng)業(yè)、水土保持、土地利用分類等領(lǐng)域[4-6]。最早的土地利用分類主要是目視解譯。隨著高分辨率遙感影像的出現(xiàn),使得目視解譯更加容易,但是分辨率越高,光譜信息就越少,使得傳統(tǒng)的基于像元層次的分類方法可能就不再適用于高分率遙感影像的特征提取和分類。因此,基于面向?qū)ο蟮挠跋穹诸惙椒ň碗S之產(chǎn)生。目前關(guān)于面向?qū)ο蟮耐恋乩梅诸惙椒ㄈ蕴幱诔醪綉?yīng)用階段,技術(shù)理論相對(duì)傳統(tǒng)方法還未成熟,其分類效果與其他方法相比具有什么樣的優(yōu)勢(shì)也沒有明確的定論。故本文擬對(duì)基于面向?qū)ο蟮膬呻A段分類法、決策樹分類法、支持向量機(jī)分類法以及隨機(jī)深林分類法的土地利用分類情況進(jìn)行對(duì)比分析,以期能為高分辨率無人機(jī)遙感影像分類提供借鑒。
研究區(qū)地貌以丘陵臺(tái)地、沖積平原為主,地勢(shì)總體上比較平坦開闊,局部地區(qū)略有起伏,屬亞熱帶季風(fēng)氣候,日照充足,雨量充沛,溫差振幅小,年平均降雨量為1820 mm,年平均溫度22.7 ℃,年平均日照數(shù)1874 h。研究區(qū)耕地呈小斑塊狀分布,多以小規(guī)模經(jīng)營方式進(jìn)行耕作,主要農(nóng)作物為水稻、香蕉、荔枝、柑橘等,居民用地比較分散。研究區(qū)內(nèi)有一條小河流穿過,并分布有零星的坑塘和溝渠,林地面積較小。研究區(qū)高分辨率無人機(jī)影像見圖1。
圖1 研究區(qū)高分辨率無人機(jī)影像
本次無人機(jī)遙感影像主要借助于DB-2 標(biāo)準(zhǔn)型航測(cè)無人機(jī),全長2.1 m,翼展2.59 m,最大起飛重量17 kg,巡航速度為100~110 km/h,續(xù)航時(shí)間3 h,最小起降距離為50 m。航攝儀選用Nikon D800,其最大分辨率為7360×4912。飛行航攝選在天氣晴朗、能見度高且無風(fēng)時(shí)進(jìn)行,航線飛行方向?yàn)槟媳毕颍w行高度約1400m。
(一)決策樹分類法
決策樹分類法[7]屬于數(shù)字挖掘方式中常用的一種方法,主要用于無次序、無組序的樣本數(shù)據(jù)的分類。在決策樹建立過程中,一般需要確定最小樣本量和交叉驗(yàn)證的數(shù)量。本文中最小樣本數(shù)量設(shè)置為2,各地物類型的樣本數(shù)量分別為耕地68、林地35、居住用地48、交通運(yùn)輸用地15、水體9 以及其他用地21;為避免分支過多,導(dǎo)致計(jì)算量增大,精度降低,本文交叉驗(yàn)證的數(shù)量設(shè)置為3。
(二)支持向量機(jī)分類法
支持向量機(jī)分類法[8]屬于統(tǒng)計(jì)學(xué)理論中的一種機(jī)器學(xué)習(xí)算法,其基于最小風(fēng)險(xiǎn)化的原理,在高緯度的特征空間中尋找最優(yōu)分類超平面從而得到復(fù)雜數(shù)據(jù)序列中的分類結(jié)果,具有適應(yīng)性強(qiáng)、學(xué)習(xí)速度快等優(yōu)點(diǎn),目前已被廣泛應(yīng)用于遙感數(shù)據(jù)的智能處理過程中。在支持向量機(jī)分類過程中,最重要的就是誤差懲罰因子C 的設(shè)定和核函數(shù)的選型,常用的核函數(shù)包括線性核函數(shù)、Polynomial 核函數(shù)、RBF 核函數(shù)以及Sigmoid 核函數(shù)。本文根據(jù)前人研究經(jīng)驗(yàn),將懲罰因子設(shè)置為600,在四種核函數(shù)中,RBF 核函數(shù)表現(xiàn)最為穩(wěn)定,分類精度最高,故本文選擇RBF 核函數(shù)作為分類核函數(shù),其gamma 系數(shù)設(shè)置為0.0001。
(三)隨機(jī)森林分類法
隨機(jī)森林分類法[9]是在決策樹基礎(chǔ)上發(fā)展而來的集成分類方法,首先需要從原始樣本中隨機(jī)抽取出多個(gè)訓(xùn)練樣本子集,然后分別建立與各個(gè)樣本子集相對(duì)應(yīng)的決策樹,得到一個(gè)隨機(jī)森林,最后進(jìn)行投票表決和分類。該方法具有較強(qiáng)的魯棒性和學(xué)習(xí)速度,在分類過程中需要設(shè)置兩個(gè)重要參數(shù):決策樹最大個(gè)數(shù)和生成決策樹最大個(gè)數(shù),本文中分別設(shè)置為60 和5。
(四)基于面向?qū)ο蟮膬呻A段分類法
基于面向?qū)ο蟮膬呻A段分類方法[10]主要分為兩個(gè)分類過程,第一階段的分類主要是提取影像圖中的明顯光譜、紋理和幾何特征,通過建立四個(gè)影像對(duì)象層,并逐一建立起繼承關(guān)系,從而提取得到地物的有效特征;第二階段的分類主要是對(duì)第一階段中未被有效提取的信息進(jìn)行再提取,再提取過程采用最鄰近分類法,其主要分類過程為:
1)影像分割(本文采用的最優(yōu)分割尺度為210,形狀和緊致度參數(shù)取值為0.5);
2)樣本選擇(本文選擇林地、有作物耕地、無作物耕地樣本個(gè)數(shù)分別為10 個(gè)、7 個(gè)和5 個(gè));
3)構(gòu)建最優(yōu)特征空間(空間特征維數(shù)為10);
4)分類。
首先利用Agisoft Photo Scan 軟件中的SfM 技術(shù)將飛行獲取的無人機(jī)影像進(jìn)行制作成DOM 數(shù)字產(chǎn)品,然后利用ENVI 軟件裁剪出目標(biāo)研究區(qū)域,接著對(duì)裁剪得到的研究區(qū)影像進(jìn)行特征選?。ㄍ瓿杉y理特征和植被指數(shù)的選取),再接著將實(shí)驗(yàn)區(qū)影像進(jìn)行多特征融合,得到一個(gè)既包含紋理特征,又包含5 個(gè)波段光譜信息的實(shí)驗(yàn)影像數(shù)據(jù),然后再進(jìn)行多尺度的影像分割,并完成地物特征的提取,再分別利用基于面向?qū)ο蟮膬呻A段分類法、決策樹分類法、支持向量機(jī)分類法以及隨機(jī)深林分類方法對(duì)研究區(qū)土地利用分類情況進(jìn)行分析,最終得到研究區(qū)土地利用分類結(jié)果,并對(duì)不同分類方法的分類效果進(jìn)行比較。技術(shù)流程見圖2。
圖2 技術(shù)流程圖
不同分類方法得到的分類結(jié)果見圖3。從圖中可以看到:決策樹分類法能夠較好地對(duì)林地、耕地進(jìn)行分類,但對(duì)其他用地和居民地的劃分較差,特別是中間區(qū)域的居民地,有不少被誤劃分為其他用地。同時(shí)該方法劃分得到的交通用地和水體也比較差,劃分得到的河流出現(xiàn)了幾處不連續(xù)的地方。相反,支持向量機(jī)分類法得到的分類結(jié)果較決策樹分類法更準(zhǔn)確,特別是居民用地和其他用地的分類結(jié)果得到有效提升;隨機(jī)森林分類結(jié)果與支持向量機(jī)分類法分類結(jié)果基本相似,但中間居民區(qū)區(qū)域會(huì)出現(xiàn)其他用地的誤判。此外,該方法對(duì)交通運(yùn)輸用地的劃分不是很準(zhǔn)確,左上角停車場(chǎng)未能得到有效識(shí)別和分類;值得注意的是,兩階段分類法得到的分類圖與實(shí)際情況基本一致,對(duì)各類地物的分類均較佳,河流也未出現(xiàn)斷斷續(xù)續(xù)的情況,左上角交通運(yùn)輸用地的劃分也比較清楚。
圖3 不同方法分類結(jié)果圖
不同地物類別在不同分類方法下的分類用戶精度和制圖精度結(jié)果見圖4。從用戶精度來講:支持向量機(jī)分類法對(duì)于耕地和水體的分類用戶精度最高,分類精度分別為95.01%和100%,隨機(jī)森林法對(duì)交通運(yùn)輸用地的分類用戶精度最高,分類精度分別為100%,兩階段分類法對(duì)于林地、居住用地和其他用地的用戶分類精度最高,分類精度分別為82.46%、92.16%和81.25%;從制圖精度來講:兩階段分類法對(duì)于耕地、林地和交通運(yùn)輸用地的分類制圖精度最高,分類精度分別達(dá)到95.24%、85.45%和84.21%,支持向量機(jī)法對(duì)于居住用地和水體的分類制圖精度最高,分類精度分別達(dá)到90.57%和100%,決策樹和隨機(jī)森林分類法對(duì)于其他用地的制圖精度最高,分類精度為93.75%。
圖4 用戶和制圖精度對(duì)比
不同分類方法得到的總體分類精度情況見圖5。從圖中可以看到,決策樹分類法、支持向量機(jī)分類法、隨機(jī)森林分類法以及兩階段分類法的總體分類精度分別為85.27%、89.5%、86.99%和92.16%,Kappa 系數(shù)分別為73.24%、80.82%、76.06%以及85.1%,從總體精度和Kappa 系數(shù)的表現(xiàn)來看,基于面向?qū)ο蟮膬呻A段分類法均表現(xiàn)最優(yōu),其分類總體精度分別較決策樹分類法、支持向量機(jī)分類法以及隨機(jī)森林分類法提高約6.89%、2.66%和5.17%,Kappa 系數(shù)分別提高約11.86%、4.28%和9.04%,這是因?yàn)榛诿嫦驅(qū)ο髢呻A段分類法避免了多層次最優(yōu)分割尺度下的規(guī)則分類中出現(xiàn)的大量未被有效提取信息的現(xiàn)象,在利用最鄰近分類法進(jìn)行二次提取后,可以提高無人機(jī)高分辨率影像的地物分類精度。
圖5 總體分類精度對(duì)比
對(duì)基于面向?qū)ο蟮膬呻A段分類法、決策樹分類法、支持向量機(jī)分類法以及隨機(jī)深林分類法四種分類方法在高分辨率無人機(jī)影像中的土地利用分類情況進(jìn)行了對(duì)比分析,結(jié)果表明:基于面向?qū)ο蟮膬呻A段分類法可以避免在多層次最優(yōu)分割尺度下的規(guī)則分類中出現(xiàn)大量的未被提取的有效信息現(xiàn)象,在進(jìn)行二次提取后,可以更好地提取得到地物特征,從而提升分類精度和分類效果,因而該方法的分類效果在四種土地分類法中表現(xiàn)最佳,可在高分辨率無人機(jī)遙感影像分類工作中予以優(yōu)先應(yīng)用。