劉涵薇, 陳富龍, 廖亞奧
(1.中國科學(xué)院空天信息創(chuàng)新研究院數(shù)字地球重點實驗室,北京 100094; 2.可持續(xù)發(fā)展大數(shù)據(jù)國際研究中心,北京 100094; 3.中國科學(xué)院大學(xué),北京 100049; 4.中國地質(zhì)大學(xué)(北京),北京 100083)
長城作為我國首個列入世界文化遺產(chǎn)名錄的遺產(chǎn)項目,承載著中華民族“創(chuàng)造、奮斗、團結(jié)與夢想” 的偉大精神?!侗本┏鞘锌傮w規(guī)劃(2016—2035年)》提出,北京長城文化帶總面積4 929.29 km2,為歷史文化名城保護體系中的重要組成部分,亦是全國文化中心建設(shè)的重要內(nèi)容。注重保護其自然生態(tài)系統(tǒng)的原真性及完整性,對北部生態(tài)涵養(yǎng)功能區(qū)建設(shè)、北京歷史文化脈絡(luò)探索、京津冀一體化戰(zhàn)略協(xié)同發(fā)展都極為重要[1]。開展線性遺產(chǎn)文化帶環(huán)境要素動態(tài)變化及其驅(qū)動因子研究,能夠科學(xué)掌握其保護現(xiàn)狀和發(fā)展態(tài)勢,在監(jiān)測評估中更好地落實自然生態(tài)系統(tǒng)的整體保護,為文化帶經(jīng)濟、生態(tài)協(xié)調(diào)發(fā)展與遺產(chǎn)文化景觀可持續(xù)保護利用提供科學(xué)數(shù)據(jù)和技術(shù)手段。
明長城(北京段)景觀廊道范圍廣,傳統(tǒng)踏勘方法耗時耗力。衛(wèi)星遙感技術(shù)具備宏觀、客觀、快速和精準(zhǔn)等觀測優(yōu)勢,在大型線性文化遺產(chǎn)景觀廊道環(huán)境要素一體化監(jiān)測中具備應(yīng)用潛力。遙感動態(tài)監(jiān)測方法歷經(jīng)了數(shù)理統(tǒng)計[2]、面向?qū)ο骩3-4]、融合遙感大數(shù)據(jù)和機器學(xué)習(xí)[5-6]的技術(shù)革新過程。當(dāng)前,深度學(xué)習(xí)方法為遙感科學(xué)與技術(shù)的縱深發(fā)展帶來了新的生命力。該方法能規(guī)避人工主觀性,依據(jù)損失函數(shù)自行抽取與任務(wù)最相關(guān)的特征; 且學(xué)習(xí)模型具備一定遷移性和多場景應(yīng)用能力[7]。近年來,眾學(xué)者對深度學(xué)習(xí)方法在遙感數(shù)據(jù)分析中的作用機制、面臨挑戰(zhàn)、具備優(yōu)勢和應(yīng)用價值等進行了深入探索[8-9],提出了改進模型與算法[10-11],并成功應(yīng)用于城市綠地分類、大型遙感建筑物變化檢測[12-14]以及文化遺產(chǎn)環(huán)境要素監(jiān)測分析[15-17]等多種領(lǐng)域。然而,該方法在大型線性文化遺產(chǎn)景觀廊道整體性監(jiān)測與方法適應(yīng)性評估等方面的工作仍較為匱乏。綜合考慮明長城(北京段)文化帶監(jiān)測評估工作相對不足和環(huán)境要素變遷機制相對不明的現(xiàn)狀,本文選取該文化帶為實驗對象,使用提出的集成面向?qū)ο笞兓蛄糠治龊蚒-net深度學(xué)習(xí)遙感動態(tài)監(jiān)測方法開展應(yīng)用研究,旨在厘清2015—2020年度明長城(北京段)文化帶土地覆蓋類型變化趨勢及其與社會經(jīng)濟之間的內(nèi)在關(guān)聯(lián),進而為該文化帶生態(tài)環(huán)境協(xié)調(diào)發(fā)展和文化景觀可持續(xù)保護提供技術(shù)支持。
北京市(E 115.7°~117.4°,N 39.4°~41.6°),地處于華北平原的西北邊緣,地勢西北高、東南低,三面環(huán)山,東南部為一片緩緩向渤海傾斜的平原。海拔范圍8~2 303 m,東鄰天津,南與河北交界。北京是全球擁有世界文化遺產(chǎn)(7處)最多的城市,也是全球首個擁有世界地質(zhì)公園的首都城市。2020年全年接待旅游總?cè)藬?shù)達1.84億人次; 其中八達嶺長城、慕田峪長城是該城市文化遺產(chǎn)重要名片。
明長城(北京段)總長約527 km,整體走勢較連續(xù)。累計保存完整墻體比例約為12%,較完整約21%,存在損壞約67%,其保護工作仍有待加強。墻體周圍環(huán)境廊道作為該文化遺產(chǎn)的核心監(jiān)控范圍,對于明長城本體的保護具有影響和承接作用。土地覆蓋類型的變化可反映自然生態(tài)變遷及社會經(jīng)濟活動態(tài)勢,對于其整體的監(jiān)測評估和驅(qū)動機制挖掘極為重要。本文以明長城(北京段)位置及走向為基準(zhǔn)、向兩側(cè)各擴充2 km的文化帶為研究區(qū)域。該景觀廊道處于北京市北部,西臨軍都山,北靠燕山山脈,蜿蜒跨越延慶、懷柔等多個區(qū)域,空間展布范圍較大(圖1)。
圖1 明長城(北京段)文化帶研究范圍示意圖
覆蓋明長城(北京段)的2015年和2020年2期高分二號(GF-2)圖像,包含2 m分辨率全色和8 m分辨率多光譜(藍、綠、紅、近紅外)波段。經(jīng)過ISH融合增強處理,得到2 m分辨率多光譜(RGB)真彩色圖像。
為了對明長城(北京段)文化帶進行多維度的影響因子驅(qū)動分析,收集了相關(guān)年份各行業(yè)產(chǎn)值及比例等社會經(jīng)濟數(shù)據(jù)(北京統(tǒng)計年鑒: http: //nj.tjj.beijing.gov.cn/nj/main/2021-tjnj/zk/indexch.htm)。
研究從GF-2圖像及明長城展布范圍出發(fā),集成面向?qū)ο蟮淖兓蛄糠治?change vector analysis, CVA)掩模提取和U-net深度學(xué)習(xí)圖像分類技術(shù),對2015—2020年間明長城(北京段)文化帶的環(huán)境要素進行遙感動態(tài)監(jiān)測; 進而通過對重點靶區(qū)的精準(zhǔn)聚焦和土地覆蓋變化矩陣的過程追溯,實現(xiàn)影響驅(qū)動因子的信息挖掘與科學(xué)詮析(圖2)。
圖2 明長城文化帶遙感動態(tài)監(jiān)測與影響因子驅(qū)動分析技術(shù)流程圖
將配準(zhǔn)好的前后2個時相的圖像疊置,組合成兼顧二者信息的多時相組合圖像; 采用多尺度分割算法對其進行分割,得到矢量斑塊,作為后續(xù)變化區(qū)域掩模提取的尺度對象。分割中需要確定尺度因子、形狀因子、緊致度以及各個波段所占權(quán)重大小等。為了能夠?qū)⒕奂耐|(zhì)對象有效識別出來,在保證相鄰圖斑明顯差異性的基礎(chǔ)上,需要避免過度分割導(dǎo)致數(shù)據(jù)零碎[18]。
由于分割結(jié)果難以做到與實際地物類別分離情況完全吻合,分割后需進一步進行斑塊分離與合并??傮w而言,分割參數(shù)的選用需要根據(jù)實際情況、影像分辨率、地物分布特點等優(yōu)化選定。
采用面向?qū)ο蟮腃VA方法[19],將前后2期數(shù)據(jù)的斑塊特征值構(gòu)成特征矢量,設(shè)定基準(zhǔn)圖像(前時相)特征矢量為X,待檢測圖像(后時相)的特征矢量為Y,即
,
(1)
式中n為特征值數(shù)。
二者相減得到變化矢量ΔX,即
,
(2)
選取歐式距離值代表變化強度大小記為|ΔC|,即
,
(3)
式中|ΔC|包含了從前-后時相數(shù)據(jù)各個特征值變化的總和,代表著2期圖像的特征差異; 其值越大,表明2期圖像間的差別越大,即對應(yīng)斑塊土地覆蓋類型變更概率越大; 反之亦然。進而,可以根據(jù)計算的變化強度閾值,判定斑塊變化屬性。
深度學(xué)習(xí)模擬人腦多層嵌套的神經(jīng)系統(tǒng),逐層進行數(shù)據(jù)特征的提取并學(xué)習(xí)其內(nèi)在的規(guī)律特點,能夠從樣本中抽取更高層次的特征,為遙感圖像的處理提供了更為智能化的方式。
卷積神經(jīng)網(wǎng)絡(luò)是根據(jù)輸入/輸出建立對應(yīng)關(guān)系的網(wǎng)絡(luò)模型,主要由提取特征的卷積層、濃縮數(shù)據(jù)量并過濾提取信息的池化層、整合類別區(qū)分信息的全連接層以及輸入、輸出層構(gòu)成[20]。而針對圖像語義分割,該方法通過全卷積網(wǎng)絡(luò),確定遙感圖像像素類別并保留其位置信息。
本文采取一種U形對稱全卷積網(wǎng)絡(luò)—U-net,最初由Ronneberger等[21]提出。其體系結(jié)構(gòu)主要分為2部分: 編碼器和解碼器。編碼器通過多個卷積層連續(xù)采樣,得到不同的圖像特征級別,在每次下采樣之后,特征通道的數(shù)量也增加了一倍; 由于最大池化層的存在,特征映射的大小也將逐級減小。解碼器對頂層特征圖進行多層反卷積,并在下采樣過程中結(jié)合不同的特征層,將特征圖恢復(fù)到原始輸入圖像大小,完成圖像的端到端語義分割任務(wù)[22]。
假設(shè)前后2時相分別為t1和t2,分類結(jié)果共有m種,則以灰度值0 ~(m-1)代表各類別,將2時相結(jié)果進行差分: 若像素值為0,代表前后類別相同,未產(chǎn)生變化; 若前后類別不同,則重新賦值為1,代表發(fā)生變化。計算變化區(qū)域占總研究區(qū)的百分比即為變化率,即
δ=nv=1/(nv=0+nv=1)
,
(4)
式中:δ為變化率;v為灰度值;n為像素個數(shù)。 土地覆蓋變化率綜合反映自然過程及人為活動影響下地表覆蓋變化的強度。
變化矩陣由分類后各類別的轉(zhuǎn)換情況構(gòu)成,為m×m的矩陣,代表各類別轉(zhuǎn)換的數(shù)量及占比情況,能夠較為清晰地表達地表覆蓋的轉(zhuǎn)換過程。
為了方便2期數(shù)據(jù)對比處理以及綜合考慮程序內(nèi)存容量限制,將整體廊道通過棋盤分割方式,以5 000×5 000像素為基本單元,劃定為53個區(qū)塊(圖3),構(gòu)成2015年和2020年53對區(qū)塊影像。
圖3 明長城(北京段)文化帶廊道影像分塊示意圖
將每對區(qū)塊影像疊置,進行多尺度分割。根據(jù)研究區(qū)地物整體特征,設(shè)置尺度因子為30,形狀因子0.1,緊致度0.5,實現(xiàn)人工用地細節(jié)信息地精細分割。根據(jù)分割后的矢量文件,通過CVA算法提取差異較大的斑塊,作為變化區(qū)域掩模圖層輸入。
3.2.1 樣本制作及數(shù)量測試
依據(jù)已有土地利用分類體系標(biāo)準(zhǔn),結(jié)合GF-2融合影像特征,選取人工用地、水體、林地、草地、耕地、裸地進行樣本勾畫和制作,以凸顯和刻畫明長城文化帶環(huán)境要素地動態(tài)變化過程[23]。選取全連接網(wǎng)絡(luò)U-net模型,將大尺寸影像及標(biāo)簽圖像切割為若干256×256像素樣本集合,并通過旋轉(zhuǎn)、翻轉(zhuǎn)、改變對比度等方式對樣本集進行增廣,以提高模型學(xué)習(xí)的魯棒性。
通過控制樣本數(shù)量對模型進行分類精度測試,分類精度性能對比如表1與圖4。
表1 不同樣本量對U-net模型分類精度的影響
圖4 不同樣本量下U-net模型分類精度變化
從圖4可以看出,分類精度整體隨樣本量的增加而提高; 其次,當(dāng)樣本數(shù)量從前期的千級到萬級跨越時,模型學(xué)習(xí)性能提升幅度明顯; 后期則隨著樣本量增加,精度提升呈現(xiàn)收斂趨勢。將所制作的樣本以7∶3的比例進行訓(xùn)練樣本和測試樣本的分配,最終使用的學(xué)習(xí)樣本數(shù)量為: 2015年訓(xùn)練樣本53 020個,驗證樣本22 640個; 2020年訓(xùn)練樣本53 244個,驗證樣本22 788個。本研究樣本量在7萬~8萬之間,可實現(xiàn)優(yōu)于85%的分類準(zhǔn)確度。
3.2.2 模型訓(xùn)練及預(yù)測
經(jīng)過測試,設(shè)置batch_size=16,學(xué)習(xí)率為0.000 1時模型效果最佳,2期模型訓(xùn)練精度及損失曲線如圖5。訓(xùn)練均在5輪內(nèi)收斂且繼續(xù)穩(wěn)步提升。2015年模型訓(xùn)練精度最高達99.3%,驗證精度達97.1%,訓(xùn)練損失降至0.024,驗證損失降至0.123。2020年模型訓(xùn)練精度最高達96.5%,驗證精度達96.8%,訓(xùn)練損失降至0.223,驗證損失降至0.218。
(a) 2015年精度 (b) 2015年損失
針對整景或廣覆蓋遙感圖像的處理,本文采用待分類圖像分割批量預(yù)測和結(jié)果拼接的處理策略。CVA變化掩模圖層的輸入,可使U-net深度學(xué)習(xí)聚焦預(yù)變化重點區(qū)域,在提升數(shù)據(jù)處理效率的基礎(chǔ)上,進一步抑制基于像素處理的分類散斑噪聲。在整個研究區(qū)生成1 000個隨機驗證點位,人工判別確定真值類別,對分類結(jié)果通過混淆矩陣分析精度(表2、表3)。結(jié)果顯示: 2015年整體精度可達86.40%,Kappa系數(shù)為0.66; 2020年整體精度可達87.20%,Kappa系數(shù)為0.65; 揭示了模型預(yù)測結(jié)果的魯棒性以及研究區(qū)各類別面積占比變化的差異性。
表2 明長城(北京段)影像U-net分類結(jié)果混淆矩陣(2015年)
表3 明長城(北京段)影像U-net分類結(jié)果混淆矩陣(2020年)
研究區(qū)GF-2圖像的獲取時相對應(yīng)作物成熟/收割生長周期,光譜特征與同時期的草地、耕地、裸地相似(同譜異物)。考慮這些土地覆蓋類型與人為擾動相關(guān)度不大,故對其進行合并處理為“裸土耕地等”,與原“人工用地”、“水體”、“林地”生成4大土地覆蓋類型。將重分類后的2015年和2020年度圖像進行差分,得到文化帶景觀廊道土地覆蓋變化圖及其對應(yīng)類型變更信息(圖6); 子圖A—D為放大后的典型轉(zhuǎn)換類別。計算變化圖斑比例得到土地覆蓋總體變化率為:
δ=2 229 413/(2 229 413+2 280 197 447)= 0.098%
,
(5)
為了驗證所選模型的適用性與有效性,選取一處含多種地物類型的圖像為示例,分別使用決策樹(decision tree classifier,DTC)、支持向量機(support vector machine,SVM)、隨機森林(random forest,RF)分類器與U-net進行對比試驗; 并隨機選取100個點位對分類結(jié)果進行精度評價,結(jié)果見表4。由圖7、圖8分類對照結(jié)果可知,圖像中裸地與耕地光譜差異較小,山體陰影造成林區(qū)易與水體混淆,即DTC,SVM,RF分類器按光譜等特征進行土地覆蓋分類,因同物異譜、異物同譜現(xiàn)象錯分明顯; 而U-net模型能通過樣本遷移,學(xué)習(xí)發(fā)現(xiàn)地物之間整體規(guī)律和語義信息,改善山體陰影等錯分現(xiàn)象,類別完整性好,分類精度提升明顯。
(a) 測試圖像分類結(jié)果 (b) U-net分類結(jié)果
(a) RF分類結(jié)果 (b) DTC分類結(jié)果 (c) SVM分類結(jié)果
統(tǒng)計各地表要素變化類型像素的數(shù)量與比例,得到類別變化矩陣(表5)。
表5 明長城(北京段)文化帶2015—2020年土地覆蓋變化矩陣
由計算結(jié)果可知,總體變化率不到0.1%; 揭示明長城(北京段)所受影響較小。對變化矩陣作統(tǒng)計分析見圖9。由圖9可知,地表要素的變化主要體現(xiàn)在裸土耕地等與人工用地、林地的轉(zhuǎn)化,占比最大的為裸土耕地類別向林地轉(zhuǎn)化,是森林覆蓋面積增加的表征,貢獻文化帶生態(tài)正向變化(占比1/3)。其次是裸土耕地向人工用地轉(zhuǎn)化(占比約1/4),表現(xiàn)為自然空地、耕地等的人為占用,包括工業(yè)、商業(yè)以及居住用地的建設(shè)(圖10(a),(b)),揭示社會經(jīng)濟建設(shè)對生態(tài)環(huán)境的人為干預(yù)與破壞。同時占比約12%的人工用地拆除與環(huán)境整治情況,貢獻林地面積增加和生態(tài)正向變化。林地與人工用地互為轉(zhuǎn)化比例相當(dāng),占比約11%; 另存在約6%的人工用地拆除或土地復(fù)耕。
圖9 不同變化類別占比情況
(a) 細節(jié)一: 2015年圖像、2020年圖像和變化標(biāo)記 (b) 細節(jié)二: 2015年圖像、2020年圖像和變化標(biāo)記
同時研究也發(fā)現(xiàn)了少量偽變化標(biāo)記,見圖10,圖中每幅小圖從左到右分別為2015年圖像、2020年圖像和變化標(biāo)記,如季節(jié)氣候等變化引起的農(nóng)作物的不同生長周期表征(如圖10(c)為生長季與收割期差異); 冬季水體表面結(jié)冰導(dǎo)致的高反射與常態(tài)深色水體的差異(圖10(d))。
對比2015年及2020年的各類經(jīng)濟數(shù)據(jù)(圖11),發(fā)現(xiàn)以養(yǎng)殖、種植、培育生物材料相關(guān)的第一產(chǎn)業(yè)逐年下降,對自然地類的使用率有所降低。而生產(chǎn)總值仍隨經(jīng)濟發(fā)展而增長,含建筑土木、工業(yè)生產(chǎn)、房地產(chǎn)等的第二產(chǎn)業(yè)則呈現(xiàn)小比例提升,體現(xiàn)在土地覆蓋中人工用地的征用或退還,與經(jīng)濟穩(wěn)步發(fā)展整體協(xié)調(diào)。城市綠化覆蓋(由48.4%變更至49.0%)較為穩(wěn)定,森林覆蓋率從41.6%小幅增加至44.4%,與變化矩陣中林地比例的上升情況相符。近年來,北京旅游人數(shù)緩慢增加(去除2020疫情重大社會事件因素),2015—2020年旅游產(chǎn)業(yè)數(shù)據(jù)呈上升趨勢,揭示對文化遺產(chǎn)保護與開發(fā)的更高要求。
圖11 各產(chǎn)值分布及各年份比率增長趨勢
綜上所述,2015—2020年明長城(北京段)文化帶人工用地對裸土、林地等自然地類的侵占使用整體可控,生態(tài)環(huán)境保護與開發(fā)呈現(xiàn)正向發(fā)展態(tài)勢。
針對明長城大型線性文化遺產(chǎn)賦存環(huán)境一體化監(jiān)測和評估研究需求,本文提出了一種集成面向?qū)ο笞兓蛄糠治龊蚒-net深度學(xué)習(xí)的遙感動態(tài)監(jiān)測方法,開展2015—2020年時相文化帶景觀廊道土地覆蓋遙感變化監(jiān)測和社會經(jīng)濟影響驅(qū)動機制詮析,實驗結(jié)果表明:
1)明長城(北京段)文化帶2015—2020年期間,土地覆蓋變化率約千分之一,主要表現(xiàn)在裸土、耕地等向林地轉(zhuǎn)化,以及人工用地部分占用; 社會經(jīng)濟建設(shè)等擾動整體可控,文化帶生態(tài)環(huán)境正向發(fā)展態(tài)勢良好。
2)針對GF-2真彩色圖像中同物異譜、異物同譜等問題,深度學(xué)習(xí)圖像分類相較于傳統(tǒng)遙感分類方法具備優(yōu)勢,可以保留地物完整紋理和影像語義信息,獲得更為精確的遙感地物分類結(jié)果。
3)深度學(xué)習(xí)模型分類精度直接受制于樣本數(shù)量,總體呈正比關(guān)系; 但達到一定量級之后,精度改善緩慢并趨于飽和。使用U-net全連接網(wǎng)絡(luò)進行語義分割需要保證樣本與標(biāo)簽的全面對應(yīng),對典型性標(biāo)簽樣本制作提出了更高要求。
總體來說,使用面向?qū)ο驝VA變化掩模提取方法,輔助分類后變化檢測可高效、精準(zhǔn)獲取土地覆蓋變化靶區(qū),抑制基于像素分類的散斑效應(yīng),便于時相間地物類別變化檢測與變化矩陣定量分析。融合社會經(jīng)濟數(shù)據(jù)的遙感智能處理和信息解譯,可以深層次挖掘、佐證變化驅(qū)動力因素,為文化帶景觀廊道環(huán)境要素動態(tài)變遷研究提供全新方案。未來我們將進一步細化樣本類別,提升其廣度與精度; 針對遙感圖像特征改進U-net模型結(jié)構(gòu),進一步提高模型的適配性與分類精度,為方法模型的普適性推廣與復(fù)雜場景應(yīng)用奠定技術(shù)基礎(chǔ)。