謝 兵,楊 武 年,楊 鑫,王 芳
(1.四川司法警官職業(yè)學院,四川 德陽 618000; 2.成都理工大學 地球科學學院,四川 成都 610059; 3.內(nèi)江師范學院 地理與資源科學學院,四川 內(nèi)江 641000)
葉片含水量的多少是植被長勢好壞的重要參考因素,也是植被蒸騰和固碳的主要因素,在植被生長過程中起到重要作用,進而對生態(tài)環(huán)境也有著重要的影響。對植被葉片水含量的廣泛監(jiān)測,可以為植被生長狀況提供及時的科學評判,保證植被的良好生長。植被葉片含水量的多少對森林火災預防和減弱也有著重要的作用,植被葉片水含量越多植被燃燒的速度會越慢,植被著火點的溫度也會越高,有助于延緩森林火災和火勢蔓延,為及時撲滅火災贏得寶貴的時間[1]。
對于植被葉片含水量的測量或估算的傳統(tǒng)方法,往往都是將研究區(qū)劃分為眾多小區(qū)域,通過實地調(diào)查采樣和插值的方法得到整個研究區(qū)植被葉片含水量。衛(wèi)星遙感可以大范圍、快速和多譜段地進行遙測,獲取大量地面上有效信息[2-3],具有高效、無損、低成本、覆蓋范圍廣等特點。通過遙感技術獲取植被葉片含水量主要有以下2種方法。
一是采用相應的輻射傳輸模型通過輸入不同的葉片結構參數(shù)、生化組分含量信息、入射光線最大入射角等定量反演植被冠層含水量。阿布都瓦斯提·吾拉木等[4]根據(jù)葉片和冠層輻射傳輸模型Prospect模型、Lillesaeter模型、Sail H模型、大氣傳輸6S模型構建了一種新植被指數(shù)SPSI(短波紅外垂直失水指數(shù))來估算植被冠層含水量,并與野外實際測量的冠層含水量比較,研究發(fā)現(xiàn)兩者結果較為接近,新植被指數(shù)能很好地估算冠層含水量。程曉娟等[5]依據(jù)物理PROSAIL模型分析了對小麥冠層水分敏感的波段,利用這些敏感波段構建了一種新的植被水分指數(shù),發(fā)現(xiàn)這種新植被指數(shù)對冬小麥冠層水分含量估算精度很高。
二是基于統(tǒng)計分析方法監(jiān)測植被水分。Zhang等[6]利用了10個與水分相關的植被指數(shù)來估算冠層含水量(CWC)和冠層平均葉片等效水厚度(EWT),發(fā)現(xiàn)綠葉綠素指數(shù)、紅邊葉綠素指數(shù)、紅邊歸一化比值對CWC和EWT最為敏感。張海威等[7]通過分析8種植被指數(shù)與植被葉片含水量之間的相關關系,發(fā)現(xiàn)MSI和GVMI植被指數(shù)與植被葉片相對含水量的非線性三次擬合函數(shù)精度最高,GVMI指數(shù)反演的誤差最小。李玉霞等[8]基于光譜指數(shù)法建立植被含水量之間的關系模型,發(fā)現(xiàn)光譜指數(shù)法反演精度較高。
Sentinel-2衛(wèi)星搭載的多光譜成像儀有13個光譜波段,其特有的植被紅邊波段在植被參數(shù)反演中有著重要作用,且與其他波段相關系數(shù)較低,提高了影像的光譜信息量,為影像分類提供了更多的光譜特征。本文基于Sentinel-2,提取6種植被指數(shù),利用野外實測的60個樣本數(shù)據(jù)計算的葉片含水量數(shù)據(jù),建立植被葉片含水量與植被指數(shù)之間的關系模型,并進行驗證,得到川西高原研究區(qū)植被葉片含水量分布結果,該結果對于四川地區(qū)的生態(tài)環(huán)境評價有著重要意義。
松潘縣位于川西高原東北角,境內(nèi)有大片森林覆蓋,適合作為研究區(qū)分析研究植被水含量。研究區(qū)主要包含松潘縣燕云鄉(xiāng)、紅扎鄉(xiāng)、小姓鄉(xiāng)、大姓鄉(xiāng)、安宏鄉(xiāng)、青云鄉(xiāng)、牟尼鄉(xiāng)等鄉(xiāng)鎮(zhèn),總面積約1 000 km2,研究區(qū)內(nèi)有兩條大的河流——熱務曲河和岷江,兩條河流匯聚于鎮(zhèn)江關鄉(xiāng),年平均氣溫5.7 ℃,年均降水量720 mm,屬川西北高原氣候[9],研究區(qū)地理位置見圖1。
圖1 研究區(qū)位置
1.2.1葉片含水量測定
通過2018年8月進行的野外實地調(diào)查,在研究區(qū)內(nèi)大致均勻設置60個樣方(見圖2)。主要記錄每個樣方的經(jīng)緯度信息、高程、采集樹葉樣本。每個樣方內(nèi)按照植被頂、中、底3層各采集10片樹葉現(xiàn)場采用經(jīng)過校準的幸運JA303P型號電子分析天平稱其鮮重,采集的樹葉裝入紙袋中[10],采用葉面積測量儀測量樹葉面積。室內(nèi)葉片樣品在70 ℃烘干24 h以上,直至恒重后再采用華志HZY-A400型號電子分析天平稱重葉片干重,按照公式(1)計算葉片含水量(以葉片等效水厚度表示)。
注:底圖為2018年8月Sentinel-2衛(wèi)星影像,R:Band 8,G:Band 3,B:Band 2假彩色合成。
(1)
式中:EWTleaf表示葉片含水量,g/cm2;Wfresh表示新鮮葉片的重量;Wdry表示烘干后葉片的重量;A表示葉片的面積。
1.2.2遙感數(shù)據(jù)處理
Sentinel-2數(shù)據(jù)由于傳感器平臺在運行過程中的復雜情況,以及受到地球大氣情況、地表高程起伏狀態(tài)的影響,傳感器記錄的值往往與目標輻射亮度或地表反射率存在著偏差,需要通過數(shù)據(jù)預處理消除這些誤差[11]。經(jīng)遙感數(shù)據(jù)預處理得到Sentinel-2地表反射率數(shù)據(jù)產(chǎn)品(見圖3)。
植被指數(shù)常用來估算植被相關信息,常見的植被指數(shù)有NDVI、NDWI、TVI、FVC等,由于Sentinel-2數(shù)據(jù)是唯一一個在紅邊范圍含有3個波段的數(shù)據(jù)[12-14],增加了紅邊歸一化植被指數(shù)NDVI705,選取的植被指數(shù)見表1。
表1 Sentinel-2數(shù)據(jù)的植被指數(shù)計算公式
根據(jù)植被指數(shù)與葉片含水量的關系建立相應數(shù)學模型,方法包括:多元逐步回歸、隨機森林、BP神經(jīng)網(wǎng)絡[15]。
2.2.1多元逐步回歸
多元逐步線性回歸是從所有變量中考慮與植被葉片含水量決定系數(shù)最大、均方根誤差最小的變量,直至所選取的模型效果最好的變量即為最優(yōu)的變量。
多元回歸方程是假設有多個植被指數(shù)作為自變量x1,x2,x3…xn,它們與植被葉片含水量y之間存在如下關系:
y=a0+a1x1+a2x2+…+anxn
(2)
式中:a0為常數(shù)項,a1,a2,a3,…,an為待求回歸系數(shù)。
2.2.2隨機森林
隨機森林(Random Forest)是一種集成學習(Ensemble Learning)方法,通過集成多個決策樹來完成預測和分類任務。它結合了決策樹的特點和隨機性,具有較強的預測能力和穩(wěn)定性。
設定不同葉子數(shù)和樹數(shù),通過比較回歸得到的各種葉子大小和樹的數(shù)量的均方誤差來尋找最佳葉子大小和樹的數(shù)量(見圖4),從圖4中可以看出,葉子數(shù)為5、樹的數(shù)量為450時,誤差最小且穩(wěn)定,利用該參數(shù)進行植被指數(shù)的重要性分析,重要性由大到小依次為FVC、NDVI705、NDVI、NDWI1,NDWI2、TVI。
圖4 葉子數(shù)、樹數(shù)與誤差
2.2.3BP神經(jīng)網(wǎng)絡方法
BP神經(jīng)網(wǎng)絡能夠很好的處理輸入與輸出數(shù)據(jù),主要由輸入層、隱藏層、輸出層3部分組成,輸入層與隱藏層和隱藏層與輸出層通過權重、函數(shù)進行連接,輸出層在隱含層的基礎上確定輸入變量和激活函數(shù)輸出,當與目標存在誤差的情況下,經(jīng)輸出值與期望值比較,當誤差大于設定值時,則誤差反向傳播,通過逐層修改神經(jīng)元的權值,減少誤差,如此循環(huán)直到輸出的結果符合精度要求為止。
神經(jīng)網(wǎng)絡隱含層的第i個節(jié)點的輸入變量neti為
(3)
隱含層的第i個節(jié)點的輸出變量為
yi=f(neti)
(4)
式中:f為激活函數(shù),f(x)=1/(1+e-x),xj為隱含層第j個節(jié)點的輸入?yún)?shù),wij為隱含層的第i個節(jié)點到輸入層的第j個節(jié)點之間的神經(jīng)網(wǎng)絡權值函數(shù)。bi為閾值參數(shù)[16]。
隱含層神經(jīng)元個數(shù)采用如下經(jīng)驗公式確定:
(5)
式中:m為輸入層個數(shù),n為輸出層個數(shù)。計算出本模型的隱藏層神經(jīng)元個數(shù)為5。
采用十折交叉驗證法的均方根誤差RMSE、平均絕對誤差百分比MAPE檢驗模型的精度,公式為
(6)
(7)
采用的植被指數(shù)有6種,需要分析他們之間的自相關性,避免數(shù)據(jù)冗余,論文采用Pearson相關系數(shù)來確定植被指數(shù)之間的相關性[18](見表2)。統(tǒng)計學認為系數(shù)值的范圍在0~0.19之間為極低相關,0.20~0.39之間為低度相關,0.40~0.69為中度相關,0.70~0.89為高度相關,0.90~1.00為極高相關。
表2 植被參數(shù)之間相關系數(shù)
從表2可以看出,最大相關性為NDVI與NDVI705,Pearson相關系數(shù)為0.52;最小為TVI與NDWI1,Pearson相關系數(shù)為-0.04。只有NDVI與FVC、NDVI705與FVC、NDVI705與NDVI的Pearson相關系數(shù)處在中度相關,其他全部在極低度相關和低度相關,綜合分析,6種植被指數(shù)均可作為模型輸入數(shù)據(jù)。
論文基于多元逐步回歸、隨機森林、BP神經(jīng)網(wǎng)絡方法建立植被指數(shù)與植被葉片含水量遙感估算模型,并采用精度評價方法對3種模型加以驗證。根據(jù)十折交叉驗證方法,將60個樣本數(shù)據(jù)平均分成10份,其中9份用于訓練,1份用于測試。論文采用MATLAB軟件處理,運用crossvalind函數(shù)進行十折劃分,通過循環(huán)訓練計算10折交叉驗證的平均均方根誤差RMSE和平均絕對誤差百分比MAPE,結果見表3。
表3 十折交叉驗證法結果
從表3中可以看出,BP神經(jīng)網(wǎng)絡在均方根誤差和平均絕對誤差百分比上均小于隨機森林算法和逐步多元回歸算法,分別為0.000 59 g/cm2和2.34%,可以認為3種方法中BP神經(jīng)網(wǎng)絡模型反演植被葉片含水量效果最好。
由于BP神經(jīng)網(wǎng)絡模型在訓練數(shù)據(jù)和驗證數(shù)據(jù)集上精度最高,論文采用MATLAB軟件將Sentinel-2提取的FVC、NDVI、NDVI705、NDWI1、NDWI2、TVI植被指數(shù)作為輸入數(shù)據(jù),運用已訓練好的BP神經(jīng)網(wǎng)絡模型反演研究區(qū)植被葉片含水量,結果如圖5所示。
圖5 研究區(qū)植被葉片含水量分布
與圖1比較,可以看出河流段、城鎮(zhèn)村莊處呈現(xiàn)紅色,植被區(qū)域呈現(xiàn)綠色和黃色,河流、城鎮(zhèn)區(qū)域植被葉片含水量低,與實際情況一致。
本次研究從Sentinel-2影像和研究區(qū)實測葉片含水量為數(shù)據(jù)源,分析了Sentinel-2影像FVC、NDVI、NDVI705、NDWI1、NDWI2、TVI 6種植被指數(shù),并對6種植被指數(shù)的相關性進行分析,通過多元逐步回歸方法、隨機森林方法與BP神經(jīng)網(wǎng)絡模型,實現(xiàn)對川西高原植被葉片含水量的定量反演。結果表明:
(1) 基于因子相關分析,6種植被參數(shù)之間的自相關性低,均可以作為模型輸入?yún)?shù)。
(2) 采用隨機森林算法通過對葉片含水量與植被指數(shù)進行重要性分析,重要性由大到小依次為FVC、NDVI705、NDV1、NDWI1,NDWI2、TVI。
(3) 通過十折交叉驗證方法對3個模型進行評價可知,BP神經(jīng)網(wǎng)絡均方根誤差和平均絕對誤差百分比最小,分別為0.000 59 g/cm2和2.34%,表明BP神經(jīng)網(wǎng)絡模型優(yōu)于逐步多元回歸模型和隨機森林模型。