孫茜童, 付 蕓, 韓春曉, 范宇華, 王天樞
長(zhǎng)春理工大學(xué)光電工程學(xué)院, 吉林 長(zhǎng)春 130012
葉綠素a(Chlorophyll-a, Chl-a)占浮游植物去除自由水后干重的1%~2%[1]。 當(dāng)水體環(huán)境受到污染時(shí), 浮游植物的數(shù)量將增多, 其中葉綠素a的含量也會(huì)迅速增加。 對(duì)葉綠素a濃度進(jìn)行監(jiān)測(cè)能夠預(yù)防水質(zhì)惡化、 浮游植物過(guò)多, 是一種非常有效的水體環(huán)境保護(hù)手段。 地球上廣袤的海洋不僅蘊(yùn)含著豐富的資源, 而且海洋環(huán)境嚴(yán)重影響著全球的氣候。 葉綠素a濃度的傳統(tǒng)檢測(cè)方法是分光光度法, 該方法采樣點(diǎn)有限, 限制了建模精度。 近些年, 采用衛(wèi)星遙感影像進(jìn)行環(huán)境監(jiān)測(cè)已成為一種趨勢(shì), 它具有覆蓋范圍廣、 分析耗時(shí)短等優(yōu)勢(shì)。 同時(shí), 采集不同時(shí)間、 不同地點(diǎn)的數(shù)據(jù)建立數(shù)據(jù)庫(kù), 可以長(zhǎng)期監(jiān)測(cè)多種海洋環(huán)境參數(shù)。
隨著定量遙感技術(shù)的發(fā)展, 葉綠素a濃度反演建模技術(shù)也逐漸發(fā)展起來(lái)。 目前比較成熟的方法有基于物理光學(xué)模型的分析算法[2]、 基于波段組合的經(jīng)驗(yàn)算法[3-4]、 特征熒光峰算法[5], 以及支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)的方法[6-8]。 由于物理模型反演中一些輸入?yún)?shù)較難獲得, 且反演過(guò)程受許多不可控因素的影響, 導(dǎo)致該方法的反演精度受到限制[9]。 傳統(tǒng)的機(jī)器學(xué)習(xí)方法在捕捉空間光譜與Chl-a濃度之間的復(fù)雜關(guān)系時(shí)建模能力有限, 而且計(jì)算效率較低, 無(wú)法實(shí)現(xiàn)對(duì)大批量和大尺寸的遙感影像數(shù)據(jù)的實(shí)時(shí)處理與分析, 因此采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法反演Chl-a濃度也是比較困難的[10]。 隨著計(jì)算機(jī)硬件的研發(fā)和深度學(xué)習(xí)理論的發(fā)展[11], 卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)快速地發(fā)展起來(lái), 已經(jīng)廣泛地應(yīng)用于遙感影像處理領(lǐng)域。 遙感影像同時(shí)包含空間信息和光譜信息。 卷積神經(jīng)網(wǎng)絡(luò)在處理遙感影像時(shí)充分利用各種信息, 且在計(jì)算效率和分類準(zhǔn)確度等方面具有極大的優(yōu)勢(shì)[12]。 謝婷婷等[13]根據(jù)高分一號(hào)寬幅相機(jī)的影像數(shù)據(jù), 分別使用光譜響應(yīng)函數(shù)和影像像元反射率, 采用不同方法構(gòu)建Chl-a濃度反演模型。 得到的結(jié)果是隨機(jī)森林模型的精度較高, 前者R2為0.895, 后者為0.709。 于博文等[10]首次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于構(gòu)建全球海洋Chl-a濃度反演模型。 僅使用遙感圖像就可以獲得接近Chl-a濃度真值的圖像, 模型R2為0.901。 證明卷積神經(jīng)網(wǎng)絡(luò)在解決反演問(wèn)題方面具有可行性。 王浩云等[14]提出采用遷移學(xué)習(xí)的方法反演綠蘿葉片的葉綠素濃度。 研究表明, 結(jié)合了光譜信息和光學(xué)特性參數(shù)信息的模型預(yù)測(cè)效果更好,R2為0.931, 證明了光學(xué)參數(shù)反演葉綠素濃度方法的有效性。 本工作提出一種二維卷積神經(jīng)網(wǎng)絡(luò)建模方法, 應(yīng)用于不同時(shí)間、 地點(diǎn)的海洋區(qū)域葉綠素a濃度反演, 使用葉綠素a濃度真值對(duì)反演模型進(jìn)行了精度驗(yàn)證和影像對(duì)比。
中分辨率成像光譜儀(moderate resolution imaging spectroradiometer, MODIS)由美國(guó)宇航局(National Aeronautics and Space Administration, NASA)研制, 是搭載在Terra和Aqua衛(wèi)星上的重要儀器。 中分辨率成像光譜儀每48 h遍歷整個(gè)地球表面一次, 數(shù)據(jù)涉及36個(gè)波段。 這些數(shù)據(jù)幫助科研人員了解全球遙感的動(dòng)態(tài), 被廣泛地應(yīng)用于空氣質(zhì)量監(jiān)測(cè)、 土地沙漠化防護(hù)、 水質(zhì)監(jiān)測(cè)等方面。
選擇NASA海洋生物加工小組(Ocean Biology Processing Group, OBPG)生產(chǎn)的中分辨率成像光譜儀Level3標(biāo)準(zhǔn)映射遙感影像數(shù)據(jù), 包括遙感反射率影像(remote sensing reflectance, Rrs, 單位為sr-1)和葉綠素a濃度影像(單位為mg·m-3)來(lái)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。 卷積神經(jīng)網(wǎng)絡(luò)需要投入大量的數(shù)據(jù)進(jìn)行訓(xùn)練, 而現(xiàn)場(chǎng)采集的數(shù)據(jù)一般數(shù)量有限, 因此選用NASA海洋生物加工小組生產(chǎn)的海量葉綠素a濃度數(shù)據(jù)作為真值來(lái)訓(xùn)練模型。 該數(shù)據(jù)可信度高, 保證構(gòu)建的反演模型可以通過(guò)遷移學(xué)習(xí)應(yīng)用到同類型的數(shù)據(jù)上。 使用的全部數(shù)據(jù)的時(shí)間分辨率均為每月, 空間分辨率均為4 km(赤道位置), 覆蓋范圍一致。
卷積神經(jīng)網(wǎng)絡(luò)反演模型搭建流程如圖1所示。
圖1 卷積神經(jīng)網(wǎng)絡(luò)反演模型搭建流程Fig.1 Convolutional neural network inversion model building process
根據(jù)葉綠素a的光譜特征, 選取波段為412, 469, 488, 547和667 nm[15]的反射率數(shù)據(jù), 共5個(gè)波段。 分別對(duì)反射率數(shù)據(jù)、 葉綠素a濃度數(shù)據(jù)進(jìn)行100倍的放大處理, 再取log10對(duì)數(shù)轉(zhuǎn)換。 反射率數(shù)據(jù)若有小于0的異常值, 則將其設(shè)為0。 反射率數(shù)據(jù)和葉綠素a濃度數(shù)據(jù)若是無(wú)效值NaN, 根據(jù)其不等于任何具體數(shù)的特點(diǎn), 設(shè)置條件語(yǔ)句將其替換為0。 經(jīng)過(guò)上述方式的預(yù)處理后, 兩種數(shù)據(jù)均不含異常值、 無(wú)效值并都處在近似區(qū)間內(nèi), 有利于構(gòu)建反演模型。 六幅遙感影像數(shù)據(jù)預(yù)處理前后的統(tǒng)計(jì)情況如表1所示。
表1 六幅影像預(yù)處理前后統(tǒng)計(jì)情況Table 1 Details of six images before and after preprocessing
全年12個(gè)月反射率圖像總共60幅, 每個(gè)月有5幅圖像, 使用相同的圖像尺寸, 4 320 pixel×8 640 pixel。 考慮到平臺(tái)算力和訓(xùn)練效率, 裁剪大小為1 000 pixel×1 600 pixel的圖像構(gòu)建數(shù)據(jù)集, 并按照4∶1的比例劃分為訓(xùn)練集和驗(yàn)證集。 測(cè)試集1和測(cè)試集2大小均為400 pixel×500 pixel, 裁剪影像位置如圖2所示。 從可視化圖像中可以看出, 裁剪位置處的葉綠素a濃度涵蓋數(shù)據(jù)范圍較廣, 是整幅葉綠素a濃度數(shù)據(jù)中具有代表性的區(qū)域, 其中1為測(cè)試集1, 2為測(cè)試集2, 3為訓(xùn)練集和驗(yàn)證集。 在計(jì)算機(jī)算力允許的情況下, 應(yīng)盡可能地選取較大的訓(xùn)練集, 增加樣本數(shù)量能夠提升模型反演的效果。 搭建環(huán)境為Ubuntu20.04, 建模語(yǔ)言是Python, 數(shù)據(jù)分析軟件為ArcMap10.7和Origin 2019b。
圖2 裁剪遙感影像感興趣區(qū)域Fig.2 Cropping the area of interest of remote sensing images
卷積神經(jīng)網(wǎng)絡(luò)的建模能力較強(qiáng), 計(jì)算效率高, 適合解決具有復(fù)雜性和不確定性的反演問(wèn)題。 在處理計(jì)算機(jī)視覺(jué)任務(wù)中, 卷積神經(jīng)網(wǎng)絡(luò)的指標(biāo)優(yōu)于機(jī)器學(xué)習(xí), 根本原因是它能綜合利用遙感數(shù)據(jù)的空間信息和光譜信息。 如今航空衛(wèi)星圖像數(shù)據(jù)與日俱增[16], 衛(wèi)星遙感數(shù)據(jù)量大的特點(diǎn)要求葉綠素a濃度的反演算法能夠高效地處理大批量的遙感數(shù)據(jù), 因此設(shè)計(jì)一種提取特征能力強(qiáng)的深度學(xué)習(xí)算法來(lái)解決反演問(wèn)題是一個(gè)重要的研究課題。
增加特征圖數(shù)目和網(wǎng)絡(luò)深度都能夠提高網(wǎng)絡(luò)從訓(xùn)練集中提取有用信息的學(xué)習(xí)能力。 然而, 隨著結(jié)構(gòu)復(fù)雜度和計(jì)算量的提升, 網(wǎng)絡(luò)容易出現(xiàn)過(guò)擬合現(xiàn)象。 因此, 建模時(shí)要選取合適的網(wǎng)絡(luò)深度、 patch大小、 卷積核大小等參數(shù)。
填充(padding)操作可以防止丟掉圖像邊緣位置的信息。 如果不對(duì)圖像進(jìn)行填充, 會(huì)削弱圖像邊緣位置的數(shù)據(jù)提供信息的作用, 而僅突出圖像中間位置的數(shù)據(jù)對(duì)訓(xùn)練結(jié)果的影響。 此外, 隨著卷積層數(shù)增加, 圖像尺寸逐漸縮小, 不填充也會(huì)使最終的圖像過(guò)小。 選擇的填充方式為same卷積, 能夠起到填充邊緣、 擴(kuò)大邊緣的作用。 反演時(shí)patch尺寸會(huì)影響中心像素的周邊海域范圍, 根據(jù)實(shí)驗(yàn)效果最終使用13 pixel×13 pixel(52 km×52 km)的patch圖像塊掃描測(cè)試集, 即5個(gè)波段組合而成的反射率圖像, 生成卷積神經(jīng)網(wǎng)絡(luò)建模時(shí)使用的樣本塊。
反演模型結(jié)構(gòu)如圖3所示, 主體由四個(gè)卷積層、 兩個(gè)池化層、 兩個(gè)全連接層組成, 最后一層輸出Chl-a反演值。 在第一個(gè)pooling層、 第二個(gè)conv層之后都添加了dropout操作, 防止模型過(guò)擬合。 模型加深的同時(shí)也應(yīng)適當(dāng)?shù)刈儗挕?遙感圖像的空間分辨率有限, 選取3×3大小的卷積核既能充分利用鄰域的空間信息, 又能避免大尺寸的卷積核會(huì)包含太多與中心像素差距過(guò)大的反射率值。
圖3 卷積神經(jīng)網(wǎng)絡(luò)反演模型結(jié)構(gòu)Fig.3 Convolutional neural network inversion model structure
反演模型評(píng)價(jià)指標(biāo)為決定系數(shù)(R2)、 均方根誤差(root mean squared error, RMSE)以及平均絕對(duì)誤差(mean absolute error, MAE), 見(jiàn)式(1)—式(3)。R2反映模型的擬合程度, 取值范圍是[0, 1], 擬合程度越高, 取值越接近1。 誤差說(shuō)明模型的準(zhǔn)確性, 其中RMSE是對(duì)誤差的平方累加后再開(kāi)方, 放大了較大誤差之間的差距, 受異常值的影響更大, MAE反映的是反演結(jié)果的真實(shí)誤差。
(1)
(2)
(3)
截取2020年全年12個(gè)月份的影像, 得到測(cè)試集1與測(cè)試集2的反演評(píng)價(jià)指標(biāo)如表2所示。 其中1, 2, 3, 4, 5, 10, 11和12月份的R2均在0.9以上, 而年中附近月份的R2略低于0.9。 由于建模水域在冬季與夏季所處的溫度、 濕度、 光照等其他環(huán)境因素都不同, 所以靠近建模月份(即1月份)的數(shù)據(jù)反演效果會(huì)略優(yōu)于夏季。
表2 2020年全年葉綠素a濃度反演Table 2 Inversion results of chlorophyll-a concentrations for 2020
對(duì)兩個(gè)測(cè)試集在12個(gè)月份的各項(xiàng)平均值再取均值, 得到本卷積神經(jīng)網(wǎng)絡(luò)反演模型R2為0.930, RMSE為0.132, MAE為0.103。
圖4(a)和(b)分別是測(cè)試集1與測(cè)試集2的葉綠素濃度真值與反演預(yù)測(cè)值擬合情況, 大部分的散點(diǎn)都分布在擬合直線的兩側(cè)或線上; (c)是測(cè)試集1與測(cè)試集2的葉綠素濃度真值與反演預(yù)測(cè)值分布情況。 分布情況近似, 表明通過(guò)訓(xùn)練, 卷積神經(jīng)網(wǎng)絡(luò)從Rrs圖像和Chl-a圖像中提取到了二者之間的非線性關(guān)系。
圖4 2020年01月Chl-a濃度值(a): 測(cè)試集1擬合; (b): 測(cè)試集2擬合; (c): 分布情況Fig.4 Chl-a concentration values for January, 2020(a): Test set 1 fit; (b): Test set 2 fit; (c): Distribution
2020年1月的Chl-a濃度反演效果如圖5所示。 可以看出, CNN模型獲得的預(yù)測(cè)圖像與真值圖像具有很強(qiáng)的空間一致性。 對(duì)于Chl-a濃度較高的地方(即紅橙色區(qū)域), 反演顏色要比真值淺, 對(duì)于Chl-a濃度較低的地方(即藍(lán)紫色區(qū)域), 反演顏色也比真值淺。 真值與反演值的差值如圖5(c)和(f)所示, 能夠看出CNN反演出來(lái)的Chl-a濃度呈現(xiàn)出一種集中趨勢(shì), 海洋中部的反演效果要比陸地沿岸處效果好。
圖5 2020年01月Chl-a濃度反演效果(a): 測(cè)試集1真值; (b): 測(cè)試集1反演值; (c): 測(cè)試集1真值與反演值之間差值; (d): 測(cè)試集2真值; (e): 測(cè)試集2反演值; (f): 測(cè)試集2真值與反演值之間差值Fig.5 Chl-a concentration inversion effect for January, 2020(a): Test set 1 true values; (b): Test set 1 inversion values; (c): Difference between true and inversion values of test set 1; (d): Test set 2 true values; (e): Test set 2 inversion values; (f): Difference between true and inversion values of test set 2
在水色遙感領(lǐng)域, 根據(jù)光學(xué)性質(zhì)變化的主要影響因素將水體分為Ⅰ類和Ⅱ類[17]。 前者的主要影響因素是浮游植物, 后者的主要影響因素是有色可溶有機(jī)物。 通常情況下, 海洋水體受浮游植物影響較多, 沿岸水體由于自我凈化能力較弱, 受有色可溶有機(jī)物影響較多。 本研究通過(guò)patch掃描遙感影像生成訓(xùn)練樣本時(shí), 由于I類水體面積遠(yuǎn)遠(yuǎn)大于Ⅱ類水體面積, 二者訓(xùn)練樣本數(shù)量差異過(guò)大, 造成了高值Chl-a濃度與低值Chl-a濃度樣本不充足的問(wèn)題, 所以水域中部的反演效果稍好于水域邊緣。 如果未來(lái)有更多的沿岸水體數(shù)據(jù), 可以提升反演精度。 從整體水域來(lái)看, 本文提出的CNN模型能有效地反演出海洋Chl-a濃度。
由于采集水體樣本受天氣和周圍環(huán)境等實(shí)驗(yàn)條件限制, 目前針對(duì)內(nèi)陸湖泊、 河流葉綠素a濃度反演方法主要應(yīng)用在葉綠素a濃度較高、 面積較小的區(qū)域。 面對(duì)廣袤的海洋, 遙感影像數(shù)據(jù)量顯著增多, 建模工作量也大幅度提升, 因此經(jīng)典方法的適用性下降。 針對(duì)這個(gè)問(wèn)題, 采用CNN方法建立反演模型, 以海洋Chl-a濃度為研究對(duì)象, 通過(guò)對(duì)遙感影像進(jìn)行組合、 數(shù)學(xué)變換及剔除異常值等處理后, 輸入到CNN中。 結(jié)果表明, 葉綠素a濃度反演結(jié)果與真值數(shù)據(jù)具有較好的一致性(R2=0.930)和較低的誤差(RMSE=0.132, MAE=0.103)。 本文搭建的網(wǎng)絡(luò)采用1月份數(shù)據(jù)訓(xùn)練出的反演模型能夠有效地遷移到2月—12月上, 表明其存在更長(zhǎng)時(shí)間序列反演的能力, 而不需要引入新的觀測(cè)數(shù)據(jù)。 同時(shí)也能將其應(yīng)用在不同經(jīng)緯度的海洋區(qū)域上, 具有較好的泛化能力。