王國(guó)重,李中原,張繼宇,程煥玲,李佳紅
(1.黃河水文水資源科學(xué)研究院,鄭州 450004;2.河南省水文水資源局,鄭州 450003;3.河南黃河河務(wù)局,鄭州 450003;4.河南省水土保持監(jiān)測(cè)總站,鄭州 450008;5.河南省焦作水文水資源勘測(cè)局,河南 焦作 454002)
區(qū)域土地利用/覆蓋變化與其環(huán)境生態(tài)和經(jīng)濟(jì)社會(huì)可持續(xù)發(fā)展息息相關(guān),自然過程與人類活動(dòng)是導(dǎo)致土地利用改變的主要因素。近年來(lái),隨著科技和經(jīng)濟(jì)的快速發(fā)展,尤其是第三產(chǎn)業(yè)的異軍突起,土地利用類型也在發(fā)生顯著變化,表現(xiàn)為建筑用地、工礦用地增加迅速,耕地、林地、草地等面積被擠占,使得土地資源開發(fā)利用問題突出,嚴(yán)重制約著糧食安全、人與自然的和諧相處[1-3]。
利用遙感技術(shù)獲取土地利用/覆蓋信息首先需要對(duì)地物進(jìn)行分類,隨著計(jì)算機(jī)技術(shù)的不斷革新、眾多學(xué)者的潛心鉆研,各種影像分類方法不斷涌現(xiàn),如隨機(jī)森林(RF)、K近鄰(KNN)、支持向量機(jī)(SVM)、最大似然法(ML)、決策樹(DT)、稀疏表達(dá)分類器(SRC)、人工神經(jīng)網(wǎng)絡(luò)(ANN)等,國(guó)內(nèi)外學(xué)者基于不同遙感數(shù)據(jù)嘗試相應(yīng)的分類方法取得了許多有價(jià)值的成果[4-8],但對(duì)這些分類方法的時(shí)效性與精度比較研究的報(bào)道還不多。上述分類方法中,SVM和最大似然法是最為常用的2種分類方法。SVM通過學(xué)習(xí)算法,能夠自動(dòng)搜尋對(duì)分類有較好辨識(shí)能力的支持向量,因準(zhǔn)確率較高,在模式識(shí)別、故障檢測(cè)、分類和回歸分析等方面應(yīng)用廣泛[9-11];最大似然法是將多波段遙感數(shù)據(jù)視作多維正態(tài)分布來(lái)構(gòu)造分類函數(shù),再據(jù)此函數(shù)與最大值原則判斷類別的歸屬,因參數(shù)解釋能力較強(qiáng)、易于與先驗(yàn)知識(shí)融合、算法簡(jiǎn)單易于實(shí)施,得到許多研究者的青睞[12-15]。
采用支持向量機(jī)和最大似然法,并借助Landsat8影像對(duì)偃師市耕地、林地、草地、水域、建設(shè)用地5種用地類型進(jìn)行分類和精度評(píng)估,為后續(xù)進(jìn)一步研究、開發(fā)新的評(píng)估方法提供依據(jù)。
偃師市位于河南省中西部地區(qū),屬洛陽(yáng)市管轄,地處東經(jīng)112°26′15″—113°00′00″、北緯34°27′30″—34°50′00″。南屏嵩岳、北臨黃河,地勢(shì)自西向東傾斜,南北高,中間低,地貌景觀略呈槽形,地表形態(tài)復(fù)雜多樣,大體可分為山地、丘陵、坡地、平原4種類型[16]。屬暖溫帶大陸性季風(fēng)氣候,年均氣溫14.2℃,無(wú)霜期211 d,年均降水量500~600 mm,全年日照時(shí)數(shù)2 248.3 h。
遙感影像采用的是Landsat8衛(wèi)星數(shù)據(jù),該衛(wèi)星2013年2月11日由美國(guó)航空航天局(NASA)成功發(fā)射,共11個(gè)波段,波段1~7、9~11的空間分辨率為30 m,波段8為15 m分辨率的全色波段,衛(wèi)星每16 d可以實(shí)現(xiàn)一次全球覆蓋。由于所研究的區(qū)域?qū)儆陉懙兀蔬x取Landsat8影像的前7個(gè)波段進(jìn)行研究。
以偃師市2016年9月云量為2.36%的影像數(shù)據(jù)為主,采用90 m分辨率的SRTM數(shù)字高程數(shù)據(jù),用以裁剪遙感影像。通過ENVI軟件對(duì)Landsat8影像進(jìn)行輻射定標(biāo)、大氣校正,再根據(jù)研究區(qū)矢量數(shù)據(jù)裁剪經(jīng)此處理后的遙感影像,以便后續(xù)的處理與分析。
1.3.1 支持向量機(jī) 支持向量機(jī)(Support vector machine,SVM)是基于統(tǒng)計(jì)學(xué)習(xí)理論發(fā)展起來(lái)的新的機(jī)器學(xué)習(xí)方法,與傳統(tǒng)學(xué)習(xí)方法相比,該方法以結(jié)構(gòu)風(fēng)險(xiǎn)最小化為準(zhǔn)則,實(shí)現(xiàn)樣本誤差最小化、縮小模型泛化誤差,具有較高的精度、泛化能力強(qiáng)、運(yùn)算速度較快的優(yōu)點(diǎn)。SVM的關(guān)鍵在于核函數(shù),采用不同的核函數(shù)將導(dǎo)致不同的SVM算法[17]。其常見的核函數(shù)主要有線性核函數(shù)、多項(xiàng)式核函數(shù)、徑向基核函數(shù)、Sigmoid核函數(shù)、字符串核函數(shù)、傅立葉核函數(shù)、樣條核函數(shù)等。作為一種局部性較強(qiáng)的核函數(shù),徑向基函數(shù)(又稱高斯核函數(shù))能夠?qū)⒁粋€(gè)樣本映射到一個(gè)更高維度的空間內(nèi),不論樣本多少均有較好的性能,且參數(shù)較多項(xiàng)式核函數(shù)少,因此大多數(shù)情況下優(yōu)先使用高斯核函數(shù)[18]。
1.3.2 最大似然法 最大似然法是一種應(yīng)用最為廣泛的監(jiān)督分類方法,它以統(tǒng)計(jì)學(xué)理論和貝葉斯準(zhǔn)則為基礎(chǔ),假定訓(xùn)練區(qū)地物的光譜特征近似服從正態(tài)分布,可求出各類別的均值、方差以及協(xié)方差等特征參數(shù),從而求出總體的條件概率密度函數(shù),再根據(jù)貝葉斯函數(shù)和最大值規(guī)則確定類別的歸屬。具體做法如下[19]:
1)根據(jù)訓(xùn)練區(qū)得到各類別的均值、方差等特征參數(shù),假設(shè)各類別服從多維正態(tài)分布,其條件概率密度為:
式中,n為波段數(shù);μi表示wi類的均值向量;Σi是wi類的協(xié)方差矩陣。
式中,p(wi)為wi類的先驗(yàn)概率;p(x)表示與類別無(wú)關(guān)的公共項(xiàng)。
3)由判別規(guī)則確定類別的歸屬。
實(shí)際過程中,主要通過改變概率閾值來(lái)生成分類影像。
對(duì)經(jīng)過預(yù)處理的Landsat8影像分別采用SVM方法、最大似然法進(jìn)行分類。選取相同的訓(xùn)練樣本以便分類結(jié)果的精度比較。樣本間的可分離度是評(píng)價(jià)樣本質(zhì)量的最直接標(biāo)準(zhǔn),所選各類訓(xùn)練樣本間的可分離度詳見表1。由表1可知,各類樣本之間的可分離度均大于1.90,表明所選訓(xùn)練樣本質(zhì)量很好,屬于合格樣本。
表1 各樣本間的分離度
根據(jù)2種方法對(duì)偃師市遙感影像進(jìn)行分類,結(jié)果如圖1所示。通過Google earth軟件選取100個(gè)樣點(diǎn)對(duì)2種分類結(jié)果進(jìn)行精度評(píng)價(jià),結(jié)果如表2所示。由表2可知,ML法的平均分類精度比SVM法高1.15個(gè)百分點(diǎn),總精度高0.24個(gè)百分點(diǎn)、Kappa系數(shù)也略高0.003 8。
表2 2種方法的分類精度比較
圖1 偃師市2016年土地利用分類
王明偉等[20]認(rèn)為,SVM和最大似然法對(duì)Landsat5的分類精度相當(dāng);對(duì)于Landsat7,則SVM的分類精度高于最大似然法。楊艷青等[21]認(rèn)為SVM的分類精度優(yōu)于最大似然法。高鑫等[12]指出,最大似然法對(duì)居民地、水田、天然草地有較高的劃分精度。奉國(guó)和[22]、劉大寧等[23]的研究表明,SVM的分類精度受核函數(shù)及參數(shù)的影響較大。趙慧等[24]認(rèn)為,訓(xùn)練樣本量、輔助數(shù)據(jù)和分類法是影響土地利用/覆蓋分類精度的3個(gè)主要因素。可能是由于所選取的樣本區(qū)域與數(shù)量、核函數(shù)及其參數(shù)的影響導(dǎo)致SVM法的分類精度和Kappa系數(shù)略低于最大似然法,需要進(jìn)一步深入研究。
本研究以Landsat8影像為信息源,采用SVM與ML法,以系統(tǒng)默認(rèn)的參數(shù)對(duì)偃師市進(jìn)行土地利用分類,結(jié)果顯示,2種方法都具有很高的分類精度,但ML法的精度略高于SVM法,這可能與所選參數(shù)、核函數(shù)及訓(xùn)練樣本的影響有關(guān)。