王小燕,李靜瀾,白艷萍,郝姍姍,屈 創(chuàng)
(1.黃河水利委會(huì)員 黃河上中游管理局,陜西 西安 710021;2.黃河水土保持天水治理監(jiān)督局,甘肅 天水 741000;3.黃河水土保持綏德治理監(jiān)督局,陜西 榆林 719000)
水土流失是全球性的生態(tài)環(huán)境問題,其強(qiáng)度與土地利用、地形地貌、植被狀況、人類活動(dòng)等密切相關(guān)[1]。2018年水利部辦公廳印發(fā)了《水利部辦公廳關(guān)于做好年度水土流失動(dòng)態(tài)監(jiān)測工作的通知》(辦水?!?018〕77號(hào)),自此,水利部、流域管理機(jī)構(gòu)和省級(jí)水行政主管部門按照“統(tǒng)一標(biāo)準(zhǔn)、分級(jí)負(fù)責(zé)、協(xié)同開展”的原則[2],采用遙感解譯、野外核查、模型計(jì)算、統(tǒng)計(jì)分析等技術(shù)手段每年度開展全國水土流失動(dòng)態(tài)監(jiān)測,為水土流失防治和生態(tài)文明建設(shè)提供重要數(shù)據(jù)支撐。其中,高分辨率遙感衛(wèi)星影像解譯工作是全國水土流失動(dòng)態(tài)監(jiān)測的“基石”,通過遙感解譯可獲得大尺度土地利用、水土保持措施、植被覆蓋等信息,通過土壤侵蝕模數(shù)計(jì)算可及時(shí)掌握水土流失情況及治理成效,科學(xué)判別水土流失發(fā)展趨勢(shì)和變化規(guī)律,對(duì)貫徹落實(shí)國家生態(tài)文明建設(shè)決策與部署、推動(dòng)水土保持高質(zhì)量發(fā)展具有重要意義[3]。此外,為深入貫徹落實(shí)黨中央、國務(wù)院決策部署,進(jìn)一步深化“放管服”改革,水利部高度重視生產(chǎn)建設(shè)項(xiàng)目水土保持監(jiān)管和水土保持信息化工作,大力推進(jìn)生產(chǎn)建設(shè)項(xiàng)目水土保持監(jiān)管新思路、新方法、新技術(shù)的探索、示范和推廣?;诟叻直媛蔬b感、無人機(jī)等技術(shù),采取遙感監(jiān)管、無人機(jī)航測、地面調(diào)查、數(shù)據(jù)處理與入庫等技術(shù)手段,摸清生產(chǎn)建設(shè)項(xiàng)目建設(shè)狀況和施工情況,為生產(chǎn)建設(shè)項(xiàng)目水土保持專項(xiàng)整治提供了有力的技術(shù)支撐和數(shù)據(jù)基礎(chǔ)[4]。其中,遙感影像解譯工作是遙感監(jiān)管的重要內(nèi)容,是生產(chǎn)建設(shè)項(xiàng)目合規(guī)性判別的重要依據(jù)。
當(dāng)前,遙感影像具有高光譜、高時(shí)間分辨率、高空間分辨率的特征,已成為水土保持工作的重要基礎(chǔ)數(shù)據(jù)[5-6]。而影像分類是遙感影像應(yīng)用的基礎(chǔ),它是一個(gè)復(fù)雜的數(shù)據(jù)處理過程,傳統(tǒng)的目視解譯雖然簡單易操作,但是不僅需要解譯人員具備豐富的內(nèi)外業(yè)工作經(jīng)驗(yàn)和專業(yè)知識(shí),而且耗時(shí)耗力,解譯精度無法保證,已經(jīng)不適應(yīng)當(dāng)前的影像解譯需求。基于影像光譜、形狀和紋理信息的面向?qū)ο蟮倪b感影像分類方法雖取得了很好的效果,但自動(dòng)化程度較低。近年來,基于深度學(xué)習(xí)的遙感影像分類方法受到廣大學(xué)者的關(guān)注。本研究通過概述目前應(yīng)用較為廣泛的深度學(xué)習(xí)模型機(jī)理,總結(jié)基于深度學(xué)習(xí)的遙感影像分類研究進(jìn)展,分析不同深度學(xué)習(xí)模型在遙感影像分類應(yīng)用中的優(yōu)勢(shì)、局限性及在水土保持中的應(yīng)用,以期推動(dòng)遙感影像解譯工作發(fā)展,為水土保持工作提供更加準(zhǔn)確和豐富的數(shù)據(jù)支撐。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)領(lǐng)域中一個(gè)新的研究方向,它被引入機(jī)器學(xué)習(xí),使其更接近于人工智能(Artificial Intelligence,AI)。深度學(xué)習(xí)最早由多倫多大學(xué)教授Hinton等提出[7],是指一種模擬人類大腦研究學(xué)習(xí)的人工神經(jīng)網(wǎng)絡(luò)算法。對(duì)比傳統(tǒng)機(jī)器學(xué)習(xí),深度學(xué)習(xí)不需要預(yù)先確定訓(xùn)練特征,其特征學(xué)習(xí)能力強(qiáng),擬合、模型預(yù)測精度高[8]。以深度學(xué)習(xí)為代表的人工智能技術(shù)得到了快速發(fā)展,已在圖像分類、目標(biāo)檢測、語義分割、人臉識(shí)別、語音識(shí)別和視頻分類中得到了廣泛應(yīng)用。
和傳統(tǒng)的人工神經(jīng)網(wǎng)絡(luò)相比,深度學(xué)習(xí)模型結(jié)構(gòu)具有深層次模型結(jié)構(gòu)和多尺度特征表達(dá)的特點(diǎn)[9]。①深層次模型結(jié)構(gòu):深度學(xué)習(xí)模型往往具有更多的隱含層,隨著層數(shù)的增加,參數(shù)也會(huì)增加,其表現(xiàn)力更加強(qiáng)大。②多尺度特征表達(dá):深度學(xué)習(xí)本質(zhì)上是數(shù)據(jù)特征結(jié)構(gòu)抽象逐層表達(dá)的過程,模型中每一層都將上一層的輸出作為輸入進(jìn)行數(shù)據(jù)結(jié)構(gòu)與特征更高層次的表示,從而構(gòu)建復(fù)雜的數(shù)據(jù)結(jié)構(gòu),完成對(duì)原始數(shù)據(jù)的抽象表達(dá)。
目前,應(yīng)用較為廣泛的深度學(xué)習(xí)模型主要有深度置信網(wǎng)絡(luò)(Deep Belief Networks,DBN)[7]、堆棧自動(dòng)編碼器網(wǎng)絡(luò)(Stacked Auto-encoder Network,SAE)[10]和卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)[11]。
1)DBN算法是由多個(gè)受限玻爾茲曼(Restricted Boltzmann Machine,RBM)堆疊形成的概率生成模型,由輸入層、隱藏層和輸出層3個(gè)部分構(gòu)成,既可用于非監(jiān)督學(xué)習(xí),也可用于監(jiān)督學(xué)習(xí),通過訓(xùn)練神經(jīng)元間的權(quán)重,讓整個(gè)神經(jīng)網(wǎng)絡(luò)按照最大概率來生成訓(xùn)練數(shù)據(jù)。DBN是由多個(gè)RBM堆疊而成的概率生成模型,具有3個(gè)隱藏層的典型DBN模型結(jié)構(gòu)見圖1。DBN算法是一種非常實(shí)用的學(xué)習(xí)算法,不僅可以用來識(shí)別特征、分類數(shù)據(jù),還可以用來生成數(shù)據(jù)。應(yīng)用范圍較廣,擴(kuò)展性強(qiáng),可應(yīng)用于機(jī)器學(xué)習(xí)語音識(shí)別和圖像處理等領(lǐng)域[12]。
圖1 具有3個(gè)隱藏層的典型DBN模型結(jié)構(gòu)
2)傳統(tǒng)自編碼器的基本模型包含輸入層、隱藏層和輸出層,是一個(gè)由多層稀松自編碼器組成的神經(jīng)網(wǎng)絡(luò),其前一層自編碼器的輸出作為后一層自編碼器的輸入。輸入層數(shù)據(jù)首先通過編碼網(wǎng)絡(luò)進(jìn)行壓縮編碼,再經(jīng)過激活函數(shù)解碼恢復(fù)原始數(shù)據(jù),自編碼網(wǎng)絡(luò)依靠對(duì)編碼和解碼兩個(gè)網(wǎng)絡(luò)的訓(xùn)練得到最佳權(quán)值,其最理想的結(jié)果是輸入與輸出相同[13]。SAE是由若干稀疏自編碼器結(jié)構(gòu)單元組成的深度神經(jīng)網(wǎng)絡(luò),其結(jié)構(gòu)見圖2,是典型的深層神經(jīng)網(wǎng)絡(luò),被廣泛用于特征學(xué)習(xí)和表示,通過貪婪學(xué)習(xí)逐層確定參數(shù),再從頂層反向傳播來調(diào)整整個(gè)網(wǎng)絡(luò)的參數(shù)[14]。
圖2 SAE結(jié)構(gòu)
3)CNN是一類包含卷積計(jì)算且具有深度結(jié)構(gòu)的前饋神經(jīng)網(wǎng)絡(luò),是深度學(xué)習(xí)的代表算法之一,由卷積層、池化層構(gòu)成的低隱層和全連接層作為分類器的高層組成,其結(jié)構(gòu)見圖3。CNN模型基于卷積層特殊的網(wǎng)層結(jié)構(gòu)設(shè)計(jì),將輸入層經(jīng)過層層降維后經(jīng)全連接層輸出網(wǎng)絡(luò),使得其更適合處理高維遙感影像,在飛機(jī)檢測、船舶檢測等高光譜影像分類與識(shí)別中已經(jīng)得到了廣泛應(yīng)用。
圖3 CNN結(jié)構(gòu)
2014年,呂啟等[15]利用DBN模型對(duì)合成孔徑雷達(dá)(Synthetic Apeture Radra,SAR)影像分類精度進(jìn)行分類,并利用雷達(dá)衛(wèi)星26D極化合成SAR影像進(jìn)行了驗(yàn)證,發(fā)現(xiàn)利用DBN模型取得了更好的遙感影像分類效果。2015年,李帥等[16]提出了一種利用深度神經(jīng)網(wǎng)絡(luò)的SAR圖像部分遮擋目標(biāo)的特征提取和目標(biāo)識(shí)別方法,該方法可以綜合利用遮擋目標(biāo)的局部或整體結(jié)構(gòu)信息,以提高目標(biāo)的識(shí)別率。2016年,劉大偉等[17]利用深度信念網(wǎng)絡(luò)對(duì)高分辨率遙感影像進(jìn)行了基于光譜-紋理特征的分類研究,結(jié)果表明,DBN模型能夠更加準(zhǔn)確地挖掘高分辨率遙感影像的空間分布規(guī)律,提高分類精度,但關(guān)于DBN網(wǎng)絡(luò)結(jié)構(gòu)選擇沒有作進(jìn)一步研究。2018年,劉亞靜等[18]利用深度置信網(wǎng)絡(luò)對(duì)機(jī)載高光譜影像進(jìn)行了分類研究,結(jié)果表明,與支持向量機(jī)和傳統(tǒng)神經(jīng)網(wǎng)絡(luò)相比,DBN算法有更好的影像分類效果。
2015年,王知音等[19]利用堆棧自動(dòng)編碼構(gòu)建了深度學(xué)習(xí)模型,有效提高了遙感影像水體提取精度和自動(dòng)化程度。2016年,楊柳[20]利用堆棧自動(dòng)編碼在高分辨率遙感影像中提取了水體信息,研究表明相比支持向量機(jī)模型和人工神經(jīng)網(wǎng)絡(luò)模型,棧式自動(dòng)編碼器模型具有更高的準(zhǔn)確率。2017年,馬曉瑞[21]采用SAE逐層提取光譜特征,并加入正則項(xiàng)的能量函數(shù),實(shí)現(xiàn)遙感影像信息光譜特征深度提取,結(jié)果表明此方法具有更好的信息提取精度。2017年,譚鋼等[22]通過SAE進(jìn)行高光譜影像分類,利用Softmax分類器和AVIRIS及ROSIS數(shù)據(jù)集進(jìn)行驗(yàn)證,與稀松多項(xiàng)式邏輯回歸相比,具有空間特征的SAE深度學(xué)習(xí)影像分類具有更高的分類精度。2019年,張國東等[23]提出SAE可充分利用影像中的光譜信息,提高高光譜地物的分類精度。
2017年,黨宇等[24]利用高分辨率遙感影像采樣地表模型覆蓋度圖斑數(shù)據(jù),訓(xùn)練了一種經(jīng)典的CNN模型AlexNET,并驗(yàn)證了此類模型在地表覆蓋分類中的準(zhǔn)確性。2017年,張偉等[25]選取不同深度卷積信念模型對(duì)土地利用分類研究,結(jié)果顯示CNN經(jīng)典模型AlexNET精度最高,其次是VGG-6模型,分類精度較差的是GoogleNET模型。2019年,王鑫等[26]利用深度卷積神經(jīng)網(wǎng)絡(luò)與多核學(xué)習(xí)相結(jié)合的高分辨率遙感圖像分類方法,解決了提取遙感圖像特征泛化能力和特征表達(dá)弱的問題,有效提高了圖像分類精度。2021年,吳海平等[27]利用深度卷積網(wǎng)絡(luò)實(shí)現(xiàn)遙感影像地物自動(dòng)分類,并在此基礎(chǔ)上開展了后續(xù)研究,提取變化區(qū)域范圍,該方法為自動(dòng)化實(shí)現(xiàn)地物變化檢測提供了有效的解決方案。
通過總結(jié)DBN、SAE、CNN三種基于深度學(xué)習(xí)的遙感影像分類方法應(yīng)用實(shí)踐,分析三種基于深度學(xué)習(xí)的遙感影像分類方法的優(yōu)點(diǎn)、局限性及在水土保持中的應(yīng)用,見表1。①DBN有效汲取了無監(jiān)督學(xué)習(xí)和有監(jiān)督學(xué)習(xí)各自優(yōu)勢(shì),能夠更好地識(shí)別和發(fā)現(xiàn)遙感影像數(shù)據(jù)在時(shí)空上的變化規(guī)律,有效提高地物分類精度;但是DBN不能直接提取高維數(shù)據(jù)影像的特征,其模型網(wǎng)絡(luò)結(jié)構(gòu)和參數(shù)的確定需要基于人工先驗(yàn)知識(shí)干預(yù),受人為影響較大,運(yùn)算時(shí)間較長,下一步需要研究如何優(yōu)化和完善模型參數(shù)的選擇機(jī)制,減少人為因素影響;主要應(yīng)用于水土流失動(dòng)態(tài)監(jiān)測中土壤類型、土壤理化性質(zhì)、土壤水分分析等方面。②SAE與DBN相同,可以很好地發(fā)揮無監(jiān)督分類的優(yōu)勢(shì),可以對(duì)高維影像進(jìn)行降維,有效提取遙感影像目標(biāo)地物,結(jié)合極限學(xué)習(xí)機(jī)的方法解決數(shù)據(jù)復(fù)雜和樣本數(shù)量有限的問題,提高分類精度;但是SAE對(duì)分類數(shù)據(jù)集有較強(qiáng)的依賴性,需要結(jié)合其他分類器才能進(jìn)行高精度地識(shí)別和分類,且在計(jì)算過程中會(huì)隨著隱藏層和神經(jīng)元數(shù)量的增加,陷入局部最優(yōu),下一步需要研究如何搭建多算法結(jié)合的深度學(xué)習(xí)模型結(jié)構(gòu)以提高模型精度;主要應(yīng)用于水土流失動(dòng)態(tài)監(jiān)測和生產(chǎn)建設(shè)項(xiàng)目水土保持監(jiān)管中遙感影像目標(biāo)地物的分類和變化分析。③CNN可以很好地處理高維影像數(shù)據(jù),獲取影像紋理信息,捕捉像素之間的空間特征,在提取地物方面具有較大優(yōu)勢(shì);但是CNN算法精度受遙感影像訓(xùn)練樣本數(shù)量影響較大,需要大量已知類別的訓(xùn)練樣本來提高模型的泛化能力,計(jì)算量較大,下一步需要研究如何制作滿足模型參數(shù)的樣本庫以提高模型精度;主要應(yīng)用于水土流失動(dòng)態(tài)監(jiān)測中土地利用的分類和變化檢測。
表1 三種基于深度學(xué)習(xí)的遙感影像分類方法的優(yōu)點(diǎn)、局限性及在水土保持中的應(yīng)用
如何提高遙感影像分類精度,一直是學(xué)者們持續(xù)研究的問題。深度學(xué)習(xí)被引入遙感影像變化監(jiān)測、地物識(shí)別和分類中,大量研究表明,基于深度學(xué)習(xí)的遙感影像分類方法可以很好地提高影像分類精度,也證明了深度學(xué)習(xí)在遙感影像分類應(yīng)用方面的可行性。DBN、SAE、CNN三種基于深度學(xué)習(xí)模型被廣泛應(yīng)用在遙感影像分類中,可以很好地挖掘遙感影像空間特征,提高地物分類精度,然而受模型機(jī)理和參數(shù)限制,仍存在局限性。在下一步的研究中,需要優(yōu)化和完善DBN模型的參數(shù)選擇機(jī)制,減少人為因素干擾,同時(shí)改進(jìn)SAE和CNN模型的計(jì)算精度。