• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于卷積神經(jīng)網(wǎng)絡(luò)的全球海洋葉綠素a濃度反演方法

      2023-02-22 06:27:00孫茜童韓春曉范宇華王天樞
      光譜學(xué)與光譜分析 2023年2期
      關(guān)鍵詞:真值葉綠素反演

      孫茜童, 付 蕓, 韓春曉, 范宇華, 王天樞

      長(zhǎng)春理工大學(xué)光電工程學(xué)院, 吉林 長(zhǎng)春 130012

      引 言

      葉綠素a(Chlorophyll-a, Chl-a)占浮游植物去除自由水后干重的1%~2%[1]。 當(dāng)水體環(huán)境受到污染時(shí), 浮游植物的數(shù)量將增多, 其中葉綠素a的含量也會(huì)迅速增加。 對(duì)葉綠素a濃度進(jìn)行監(jiān)測(cè)能夠預(yù)防水質(zhì)惡化、 浮游植物過(guò)多, 是一種非常有效的水體環(huán)境保護(hù)手段。 地球上廣袤的海洋不僅蘊(yùn)含著豐富的資源, 而且海洋環(huán)境嚴(yán)重影響著全球的氣候。 葉綠素a濃度的傳統(tǒng)檢測(cè)方法是分光光度法, 該方法采樣點(diǎn)有限, 限制了建模精度。 近些年, 采用衛(wèi)星遙感影像進(jìn)行環(huán)境監(jiān)測(cè)已成為一種趨勢(shì), 它具有覆蓋范圍廣、 分析耗時(shí)短等優(yōu)勢(shì)。 同時(shí), 采集不同時(shí)間、 不同地點(diǎn)的數(shù)據(jù)建立數(shù)據(jù)庫(kù), 可以長(zhǎng)期監(jiān)測(cè)多種海洋環(huán)境參數(shù)。

      隨著定量遙感技術(shù)的發(fā)展, 葉綠素a濃度反演建模技術(shù)也逐漸發(fā)展起來(lái)。 目前比較成熟的方法有基于物理光學(xué)模型的分析算法[2]、 基于波段組合的經(jīng)驗(yàn)算法[3-4]、 特征熒光峰算法[5], 以及支持向量機(jī)與神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)的方法[6-8]。 由于物理模型反演中一些輸入?yún)?shù)較難獲得, 且反演過(guò)程受許多不可控因素的影響, 導(dǎo)致該方法的反演精度受到限制[9]。 傳統(tǒng)的機(jī)器學(xué)習(xí)方法在捕捉空間光譜與Chl-a濃度之間的復(fù)雜關(guān)系時(shí)建模能力有限, 而且計(jì)算效率較低, 無(wú)法實(shí)現(xiàn)對(duì)大批量和大尺寸的遙感影像數(shù)據(jù)的實(shí)時(shí)處理與分析, 因此采用傳統(tǒng)的機(jī)器學(xué)習(xí)方法反演Chl-a濃度也是比較困難的[10]。 隨著計(jì)算機(jī)硬件的研發(fā)和深度學(xué)習(xí)理論的發(fā)展[11], 卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks, CNN)快速地發(fā)展起來(lái), 已經(jīng)廣泛地應(yīng)用于遙感影像處理領(lǐng)域。 遙感影像同時(shí)包含空間信息和光譜信息。 卷積神經(jīng)網(wǎng)絡(luò)在處理遙感影像時(shí)充分利用各種信息, 且在計(jì)算效率和分類準(zhǔn)確度等方面具有極大的優(yōu)勢(shì)[12]。 謝婷婷等[13]根據(jù)高分一號(hào)寬幅相機(jī)的影像數(shù)據(jù), 分別使用光譜響應(yīng)函數(shù)和影像像元反射率, 采用不同方法構(gòu)建Chl-a濃度反演模型。 得到的結(jié)果是隨機(jī)森林模型的精度較高, 前者R2為0.895, 后者為0.709。 于博文等[10]首次將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用于構(gòu)建全球海洋Chl-a濃度反演模型。 僅使用遙感圖像就可以獲得接近Chl-a濃度真值的圖像, 模型R2為0.901。 證明卷積神經(jīng)網(wǎng)絡(luò)在解決反演問(wèn)題方面具有可行性。 王浩云等[14]提出采用遷移學(xué)習(xí)的方法反演綠蘿葉片的葉綠素濃度。 研究表明, 結(jié)合了光譜信息和光學(xué)特性參數(shù)信息的模型預(yù)測(cè)效果更好,R2為0.931, 證明了光學(xué)參數(shù)反演葉綠素濃度方法的有效性。 本工作提出一種二維卷積神經(jīng)網(wǎng)絡(luò)建模方法, 應(yīng)用于不同時(shí)間、 地點(diǎn)的海洋區(qū)域葉綠素a濃度反演, 使用葉綠素a濃度真值對(duì)反演模型進(jìn)行了精度驗(yàn)證和影像對(duì)比。

      1 實(shí)驗(yàn)部分

      1.1 數(shù)據(jù)源

      中分辨率成像光譜儀(moderate resolution imaging spectroradiometer, MODIS)由美國(guó)宇航局(National Aeronautics and Space Administration, NASA)研制, 是搭載在Terra和Aqua衛(wèi)星上的重要儀器。 中分辨率成像光譜儀每48 h遍歷整個(gè)地球表面一次, 數(shù)據(jù)涉及36個(gè)波段。 這些數(shù)據(jù)幫助科研人員了解全球遙感的動(dòng)態(tài), 被廣泛地應(yīng)用于空氣質(zhì)量監(jiān)測(cè)、 土地沙漠化防護(hù)、 水質(zhì)監(jiān)測(cè)等方面。

      選擇NASA海洋生物加工小組(Ocean Biology Processing Group, OBPG)生產(chǎn)的中分辨率成像光譜儀Level3標(biāo)準(zhǔn)映射遙感影像數(shù)據(jù), 包括遙感反射率影像(remote sensing reflectance, Rrs, 單位為sr-1)和葉綠素a濃度影像(單位為mg·m-3)來(lái)訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)。 卷積神經(jīng)網(wǎng)絡(luò)需要投入大量的數(shù)據(jù)進(jìn)行訓(xùn)練, 而現(xiàn)場(chǎng)采集的數(shù)據(jù)一般數(shù)量有限, 因此選用NASA海洋生物加工小組生產(chǎn)的海量葉綠素a濃度數(shù)據(jù)作為真值來(lái)訓(xùn)練模型。 該數(shù)據(jù)可信度高, 保證構(gòu)建的反演模型可以通過(guò)遷移學(xué)習(xí)應(yīng)用到同類型的數(shù)據(jù)上。 使用的全部數(shù)據(jù)的時(shí)間分辨率均為每月, 空間分辨率均為4 km(赤道位置), 覆蓋范圍一致。

      1.2 流程和數(shù)據(jù)預(yù)處理

      卷積神經(jīng)網(wǎng)絡(luò)反演模型搭建流程如圖1所示。

      圖1 卷積神經(jīng)網(wǎng)絡(luò)反演模型搭建流程Fig.1 Convolutional neural network inversion model building process

      根據(jù)葉綠素a的光譜特征, 選取波段為412, 469, 488, 547和667 nm[15]的反射率數(shù)據(jù), 共5個(gè)波段。 分別對(duì)反射率數(shù)據(jù)、 葉綠素a濃度數(shù)據(jù)進(jìn)行100倍的放大處理, 再取log10對(duì)數(shù)轉(zhuǎn)換。 反射率數(shù)據(jù)若有小于0的異常值, 則將其設(shè)為0。 反射率數(shù)據(jù)和葉綠素a濃度數(shù)據(jù)若是無(wú)效值NaN, 根據(jù)其不等于任何具體數(shù)的特點(diǎn), 設(shè)置條件語(yǔ)句將其替換為0。 經(jīng)過(guò)上述方式的預(yù)處理后, 兩種數(shù)據(jù)均不含異常值、 無(wú)效值并都處在近似區(qū)間內(nèi), 有利于構(gòu)建反演模型。 六幅遙感影像數(shù)據(jù)預(yù)處理前后的統(tǒng)計(jì)情況如表1所示。

      表1 六幅影像預(yù)處理前后統(tǒng)計(jì)情況Table 1 Details of six images before and after preprocessing

      全年12個(gè)月反射率圖像總共60幅, 每個(gè)月有5幅圖像, 使用相同的圖像尺寸, 4 320 pixel×8 640 pixel。 考慮到平臺(tái)算力和訓(xùn)練效率, 裁剪大小為1 000 pixel×1 600 pixel的圖像構(gòu)建數(shù)據(jù)集, 并按照4∶1的比例劃分為訓(xùn)練集和驗(yàn)證集。 測(cè)試集1和測(cè)試集2大小均為400 pixel×500 pixel, 裁剪影像位置如圖2所示。 從可視化圖像中可以看出, 裁剪位置處的葉綠素a濃度涵蓋數(shù)據(jù)范圍較廣, 是整幅葉綠素a濃度數(shù)據(jù)中具有代表性的區(qū)域, 其中1為測(cè)試集1, 2為測(cè)試集2, 3為訓(xùn)練集和驗(yàn)證集。 在計(jì)算機(jī)算力允許的情況下, 應(yīng)盡可能地選取較大的訓(xùn)練集, 增加樣本數(shù)量能夠提升模型反演的效果。 搭建環(huán)境為Ubuntu20.04, 建模語(yǔ)言是Python, 數(shù)據(jù)分析軟件為ArcMap10.7和Origin 2019b。

      圖2 裁剪遙感影像感興趣區(qū)域Fig.2 Cropping the area of interest of remote sensing images

      2 結(jié)果與討論

      2.1 卷積神經(jīng)網(wǎng)絡(luò)

      卷積神經(jīng)網(wǎng)絡(luò)的建模能力較強(qiáng), 計(jì)算效率高, 適合解決具有復(fù)雜性和不確定性的反演問(wèn)題。 在處理計(jì)算機(jī)視覺(jué)任務(wù)中, 卷積神經(jīng)網(wǎng)絡(luò)的指標(biāo)優(yōu)于機(jī)器學(xué)習(xí), 根本原因是它能綜合利用遙感數(shù)據(jù)的空間信息和光譜信息。 如今航空衛(wèi)星圖像數(shù)據(jù)與日俱增[16], 衛(wèi)星遙感數(shù)據(jù)量大的特點(diǎn)要求葉綠素a濃度的反演算法能夠高效地處理大批量的遙感數(shù)據(jù), 因此設(shè)計(jì)一種提取特征能力強(qiáng)的深度學(xué)習(xí)算法來(lái)解決反演問(wèn)題是一個(gè)重要的研究課題。

      2.2 卷積神經(jīng)網(wǎng)絡(luò)反演模型結(jié)構(gòu)

      增加特征圖數(shù)目和網(wǎng)絡(luò)深度都能夠提高網(wǎng)絡(luò)從訓(xùn)練集中提取有用信息的學(xué)習(xí)能力。 然而, 隨著結(jié)構(gòu)復(fù)雜度和計(jì)算量的提升, 網(wǎng)絡(luò)容易出現(xiàn)過(guò)擬合現(xiàn)象。 因此, 建模時(shí)要選取合適的網(wǎng)絡(luò)深度、 patch大小、 卷積核大小等參數(shù)。

      填充(padding)操作可以防止丟掉圖像邊緣位置的信息。 如果不對(duì)圖像進(jìn)行填充, 會(huì)削弱圖像邊緣位置的數(shù)據(jù)提供信息的作用, 而僅突出圖像中間位置的數(shù)據(jù)對(duì)訓(xùn)練結(jié)果的影響。 此外, 隨著卷積層數(shù)增加, 圖像尺寸逐漸縮小, 不填充也會(huì)使最終的圖像過(guò)小。 選擇的填充方式為same卷積, 能夠起到填充邊緣、 擴(kuò)大邊緣的作用。 反演時(shí)patch尺寸會(huì)影響中心像素的周邊海域范圍, 根據(jù)實(shí)驗(yàn)效果最終使用13 pixel×13 pixel(52 km×52 km)的patch圖像塊掃描測(cè)試集, 即5個(gè)波段組合而成的反射率圖像, 生成卷積神經(jīng)網(wǎng)絡(luò)建模時(shí)使用的樣本塊。

      反演模型結(jié)構(gòu)如圖3所示, 主體由四個(gè)卷積層、 兩個(gè)池化層、 兩個(gè)全連接層組成, 最后一層輸出Chl-a反演值。 在第一個(gè)pooling層、 第二個(gè)conv層之后都添加了dropout操作, 防止模型過(guò)擬合。 模型加深的同時(shí)也應(yīng)適當(dāng)?shù)刈儗挕?遙感圖像的空間分辨率有限, 選取3×3大小的卷積核既能充分利用鄰域的空間信息, 又能避免大尺寸的卷積核會(huì)包含太多與中心像素差距過(guò)大的反射率值。

      圖3 卷積神經(jīng)網(wǎng)絡(luò)反演模型結(jié)構(gòu)Fig.3 Convolutional neural network inversion model structure

      2.3 卷積神經(jīng)網(wǎng)絡(luò)模型反演結(jié)果

      反演模型評(píng)價(jià)指標(biāo)為決定系數(shù)(R2)、 均方根誤差(root mean squared error, RMSE)以及平均絕對(duì)誤差(mean absolute error, MAE), 見(jiàn)式(1)—式(3)。R2反映模型的擬合程度, 取值范圍是[0, 1], 擬合程度越高, 取值越接近1。 誤差說(shuō)明模型的準(zhǔn)確性, 其中RMSE是對(duì)誤差的平方累加后再開(kāi)方, 放大了較大誤差之間的差距, 受異常值的影響更大, MAE反映的是反演結(jié)果的真實(shí)誤差。

      (1)

      (2)

      (3)

      截取2020年全年12個(gè)月份的影像, 得到測(cè)試集1與測(cè)試集2的反演評(píng)價(jià)指標(biāo)如表2所示。 其中1, 2, 3, 4, 5, 10, 11和12月份的R2均在0.9以上, 而年中附近月份的R2略低于0.9。 由于建模水域在冬季與夏季所處的溫度、 濕度、 光照等其他環(huán)境因素都不同, 所以靠近建模月份(即1月份)的數(shù)據(jù)反演效果會(huì)略優(yōu)于夏季。

      表2 2020年全年葉綠素a濃度反演Table 2 Inversion results of chlorophyll-a concentrations for 2020

      對(duì)兩個(gè)測(cè)試集在12個(gè)月份的各項(xiàng)平均值再取均值, 得到本卷積神經(jīng)網(wǎng)絡(luò)反演模型R2為0.930, RMSE為0.132, MAE為0.103。

      圖4(a)和(b)分別是測(cè)試集1與測(cè)試集2的葉綠素濃度真值與反演預(yù)測(cè)值擬合情況, 大部分的散點(diǎn)都分布在擬合直線的兩側(cè)或線上; (c)是測(cè)試集1與測(cè)試集2的葉綠素濃度真值與反演預(yù)測(cè)值分布情況。 分布情況近似, 表明通過(guò)訓(xùn)練, 卷積神經(jīng)網(wǎng)絡(luò)從Rrs圖像和Chl-a圖像中提取到了二者之間的非線性關(guān)系。

      圖4 2020年01月Chl-a濃度值(a): 測(cè)試集1擬合; (b): 測(cè)試集2擬合; (c): 分布情況Fig.4 Chl-a concentration values for January, 2020(a): Test set 1 fit; (b): Test set 2 fit; (c): Distribution

      2020年1月的Chl-a濃度反演效果如圖5所示。 可以看出, CNN模型獲得的預(yù)測(cè)圖像與真值圖像具有很強(qiáng)的空間一致性。 對(duì)于Chl-a濃度較高的地方(即紅橙色區(qū)域), 反演顏色要比真值淺, 對(duì)于Chl-a濃度較低的地方(即藍(lán)紫色區(qū)域), 反演顏色也比真值淺。 真值與反演值的差值如圖5(c)和(f)所示, 能夠看出CNN反演出來(lái)的Chl-a濃度呈現(xiàn)出一種集中趨勢(shì), 海洋中部的反演效果要比陸地沿岸處效果好。

      圖5 2020年01月Chl-a濃度反演效果(a): 測(cè)試集1真值; (b): 測(cè)試集1反演值; (c): 測(cè)試集1真值與反演值之間差值; (d): 測(cè)試集2真值; (e): 測(cè)試集2反演值; (f): 測(cè)試集2真值與反演值之間差值Fig.5 Chl-a concentration inversion effect for January, 2020(a): Test set 1 true values; (b): Test set 1 inversion values; (c): Difference between true and inversion values of test set 1; (d): Test set 2 true values; (e): Test set 2 inversion values; (f): Difference between true and inversion values of test set 2

      在水色遙感領(lǐng)域, 根據(jù)光學(xué)性質(zhì)變化的主要影響因素將水體分為Ⅰ類和Ⅱ類[17]。 前者的主要影響因素是浮游植物, 后者的主要影響因素是有色可溶有機(jī)物。 通常情況下, 海洋水體受浮游植物影響較多, 沿岸水體由于自我凈化能力較弱, 受有色可溶有機(jī)物影響較多。 本研究通過(guò)patch掃描遙感影像生成訓(xùn)練樣本時(shí), 由于I類水體面積遠(yuǎn)遠(yuǎn)大于Ⅱ類水體面積, 二者訓(xùn)練樣本數(shù)量差異過(guò)大, 造成了高值Chl-a濃度與低值Chl-a濃度樣本不充足的問(wèn)題, 所以水域中部的反演效果稍好于水域邊緣。 如果未來(lái)有更多的沿岸水體數(shù)據(jù), 可以提升反演精度。 從整體水域來(lái)看, 本文提出的CNN模型能有效地反演出海洋Chl-a濃度。

      3 結(jié) 論

      由于采集水體樣本受天氣和周圍環(huán)境等實(shí)驗(yàn)條件限制, 目前針對(duì)內(nèi)陸湖泊、 河流葉綠素a濃度反演方法主要應(yīng)用在葉綠素a濃度較高、 面積較小的區(qū)域。 面對(duì)廣袤的海洋, 遙感影像數(shù)據(jù)量顯著增多, 建模工作量也大幅度提升, 因此經(jīng)典方法的適用性下降。 針對(duì)這個(gè)問(wèn)題, 采用CNN方法建立反演模型, 以海洋Chl-a濃度為研究對(duì)象, 通過(guò)對(duì)遙感影像進(jìn)行組合、 數(shù)學(xué)變換及剔除異常值等處理后, 輸入到CNN中。 結(jié)果表明, 葉綠素a濃度反演結(jié)果與真值數(shù)據(jù)具有較好的一致性(R2=0.930)和較低的誤差(RMSE=0.132, MAE=0.103)。 本文搭建的網(wǎng)絡(luò)采用1月份數(shù)據(jù)訓(xùn)練出的反演模型能夠有效地遷移到2月—12月上, 表明其存在更長(zhǎng)時(shí)間序列反演的能力, 而不需要引入新的觀測(cè)數(shù)據(jù)。 同時(shí)也能將其應(yīng)用在不同經(jīng)緯度的海洋區(qū)域上, 具有較好的泛化能力。

      猜你喜歡
      真值葉綠素反演
      反演對(duì)稱變換在解決平面幾何問(wèn)題中的應(yīng)用
      提取葉綠素
      桃樹(shù)葉綠素含量與SPAD值呈極顯著正相關(guān)
      基于低頻軟約束的疊前AVA稀疏層反演
      基于自適應(yīng)遺傳算法的CSAMT一維反演
      葉綠素家族概述
      10kV組合互感器誤差偏真值原因分析
      電子制作(2017年1期)2017-05-17 03:54:35
      真值限定的語(yǔ)言真值直覺(jué)模糊推理
      基于真值發(fā)現(xiàn)的沖突數(shù)據(jù)源質(zhì)量評(píng)價(jià)算法
      由松針制取三種葉綠素鈉鹽及其穩(wěn)定性的研究
      修武县| 玉环县| 延庆县| 远安县| 寻甸| 阜新| 罗定市| 屏东县| 彭州市| 长治市| 化州市| 旬阳县| 新沂市| 抚松县| 平利县| 加查县| 柘荣县| 大化| 建瓯市| 新宾| 旺苍县| 鞍山市| 巴中市| 深泽县| 辉县市| 无棣县| 新泰市| 尤溪县| 营山县| 密云县| 灵台县| 柏乡县| 轮台县| 昌黎县| 尼木县| 竹溪县| 元江| 景泰县| 白朗县| 衡东县| 庄河市|