摘要" 基于碳衛(wèi)星的遙感是一種正在發(fā)展的大范圍高精度CO2監(jiān)測(cè)方法,但當(dāng)監(jiān)測(cè)對(duì)象為我國(guó)長(zhǎng)三角區(qū)域這種大空間尺度時(shí),碳衛(wèi)星數(shù)據(jù)會(huì)存在時(shí)空稀疏性的問(wèn)題。本文提出了一種新的模型ST-SAN(space time soft attention network),旨在提高碳衛(wèi)星數(shù)據(jù)的高時(shí)空分辨率XCO2(大氣CO2)濃度估算精度。本文將2016—2020年的多源數(shù)據(jù)(包括人類活動(dòng)數(shù)據(jù)、氣象數(shù)據(jù)和植被數(shù)據(jù))與碳衛(wèi)星數(shù)據(jù)結(jié)合,生成空間分辨率為0.05°的無(wú)間隙XCO2日濃度數(shù)據(jù)集。通過(guò)ST-SAN模型對(duì)這些數(shù)據(jù)進(jìn)行訓(xùn)練和預(yù)測(cè)。實(shí)驗(yàn)結(jié)果表明,重建后的XCO2數(shù)據(jù)集與OCO-2衛(wèi)星數(shù)據(jù)和地面站點(diǎn)數(shù)據(jù)具有高度一致性,驗(yàn)證了本方法在高時(shí)空分辨率XCO2濃度估算中的有效性。
關(guān)鍵詞XCO2;重建;數(shù)據(jù)融合;時(shí)空變化
2024-06-20收稿,2024-08-24接受
國(guó)家自然科學(xué)基金項(xiàng)目(42075130;42275156)
引用格式:胡凱,劉滋然,邵鵬飛,等,2024.面向碳衛(wèi)星數(shù)據(jù)的高時(shí)空分辨率XCO2濃度估算的研究[J].大氣科學(xué)學(xué)報(bào),47(6):976-992.
Hu K,Liu Z R,Shao P F,et al.,2024.High-resolution spatiotemporal estimation of XCO2 concentration using carbon satellite data[J].Trans Atmos Sci,47(6):976-992.doi:10.13878/j.cnki.dqkxxb.20240620002.(in Chinese).
氣候變化對(duì)全球的生態(tài)、社會(huì)和經(jīng)濟(jì)產(chǎn)生巨大影響,是地球環(huán)境的主要挑戰(zhàn)之一(李瑩等,2023)。二氧化碳是影響人類生活最為顯著的溫室氣體之一,其不斷增加的濃度將加速氣溫上升,進(jìn)一步威脅糧食安全和人類生存。當(dāng)前,地球每年的碳排放量已經(jīng)超過(guò)了自然吸收能力,導(dǎo)致大氣中二氧化碳濃度不斷上升(Fujimori et al.,2022)。各國(guó)政府為了應(yīng)對(duì)氣候變化,制定了溫室氣體減排政策和目標(biāo),致力于將二氧化碳含量控制在特定水平(Xu,2020)。為了實(shí)現(xiàn)這一目標(biāo),人們首先需要了解大氣二氧化碳濃度的時(shí)空變化,制定相應(yīng)的減排政策(梁周彤等,2022)。因此,獲取高分辨率的長(zhǎng)時(shí)間序列二氧化碳數(shù)據(jù)具有重要意義。
目前,地面監(jiān)測(cè)和星載衛(wèi)星是監(jiān)測(cè)大氣二氧化碳濃度的兩個(gè)主要方法(Hu et al.,2024c)。全球范圍內(nèi)的地面監(jiān)測(cè)網(wǎng)絡(luò)由稀疏分布的站點(diǎn)組成,具有精確度高、時(shí)間分辨率高的優(yōu)點(diǎn),缺點(diǎn)是覆蓋范圍有限、空間分辨率較低、人力和物力成本較高,因此無(wú)法充分反映CO2的時(shí)空分布情況(Wunch et al.,2010)。相比之下,星載衛(wèi)星不受時(shí)空限制,具有覆蓋范圍廣、獲取周期短、更新速度快、限制條件少等優(yōu)點(diǎn),缺點(diǎn)是其數(shù)據(jù)需要反演,非直接獲得(Zhang et al.,2020)。
目前,人們已經(jīng)成功發(fā)射了碳衛(wèi)星,包括SCIAMACHY(Bovensmann et al.,1999)、AIRS(Aumann et al.,2003)、GOSAT(Hamazaki et al.,2004)、OCO-2(Crisp et al.,2017)、OCO-3(ODell and Pavlick,2019)以及TanSat(Liu et al.,2018)。這些碳衛(wèi)星能提供XCO2(大氣CO2)濃度數(shù)據(jù)。盡管衛(wèi)星遙感是一種有效手段,但在獲取我國(guó)長(zhǎng)三角這種大空間尺度的CO2數(shù)據(jù)方面仍面臨著時(shí)空間稀疏的挑戰(zhàn)。
近年來(lái),許多學(xué)者在面向提高碳衛(wèi)星數(shù)據(jù)的時(shí)空間覆蓋和數(shù)據(jù)精度的問(wèn)題上,進(jìn)行了大量研究。現(xiàn)有方法大致可分為兩大類:插值方法和數(shù)據(jù)融合方法。插值是一種用于估算函數(shù)在離散點(diǎn)上的函數(shù)值或?qū)?shù)信息的方法。它通過(guò)有限個(gè)已知點(diǎn)處的取值情況,估算出其他點(diǎn)處的近似值。為了準(zhǔn)確反映二氧化碳的時(shí)空分布,時(shí)間插值和空間插值均至關(guān)重要。但由于插值方法難以捕捉數(shù)據(jù)復(fù)雜性和變化性以及數(shù)據(jù)噪聲的影響,導(dǎo)致插值技術(shù)無(wú)法準(zhǔn)確地填補(bǔ)大面積空白。更重要的是,插值方法忽視了輔助參數(shù)的影響,比如氣象數(shù)據(jù)、植被數(shù)據(jù)以及人類活動(dòng)數(shù)據(jù)等。表1歸納了插值方法在碳衛(wèi)星數(shù)據(jù)應(yīng)用中的優(yōu)缺點(diǎn)。
數(shù)據(jù)融合方法主要分為基于統(tǒng)計(jì)的數(shù)據(jù)融合方法、基于模型模擬的數(shù)據(jù)融合方法、基于學(xué)習(xí)的數(shù)據(jù)融合方法。表2歸納了數(shù)據(jù)融合方法在碳衛(wèi)星數(shù)據(jù)應(yīng)用中的優(yōu)缺點(diǎn)。
近年來(lái),隨著深度學(xué)習(xí)的快速發(fā)展(Hu et al.,2024a),基于學(xué)習(xí)的數(shù)據(jù)融合方法越來(lái)越受到關(guān)注,其中一種主流的方法是利用機(jī)器學(xué)習(xí)構(gòu)建衛(wèi)星XCO2與輔助數(shù)據(jù)之間的關(guān)系,進(jìn)而估算全覆蓋XCO2數(shù)據(jù)(Hu et al.,2024b)。例如,Li et al.(2022)選擇影響大氣CO2濃度的環(huán)境因素,包括植被結(jié)構(gòu)、植被功能以及氣象條件,整合了OCO-2衛(wèi)星觀測(cè)的數(shù)據(jù),使用極端隨機(jī)樹(shù)模型進(jìn)行訓(xùn)練,以確定環(huán)境因素與XCO2濃度之間的關(guān)系,獲得了具有高時(shí)空分辨率的全球CO2數(shù)據(jù)集,并取得了0.83的相關(guān)系數(shù)和1.79×10-6的均方根誤差。He et al.(2022)基于輕梯度提升機(jī)器構(gòu)建了中國(guó)范圍內(nèi)的全覆蓋XCO2數(shù)據(jù);該研究使用了海拔高度、土地利用、氣象條件和CarbonTracker XCO2數(shù)據(jù),與以前研究中使用的時(shí)空克里格模型相比,LightGBM模型顯示出較好的預(yù)測(cè)性能。Zhang and Liu(2023)使用衛(wèi)星數(shù)據(jù)、植被和氣象等多種輔助數(shù)據(jù),運(yùn)用深度學(xué)習(xí)技術(shù)創(chuàng)建一個(gè)長(zhǎng)期的月度XCO2數(shù)據(jù)集,并對(duì)其時(shí)空變化進(jìn)行深入分析。綜上所述,基于學(xué)習(xí)算法的數(shù)據(jù)融合方法在衛(wèi)星二氧化碳數(shù)據(jù)重建領(lǐng)域中,能夠顯著提升數(shù)據(jù)的準(zhǔn)確性和處理效率。
在面向碳衛(wèi)星數(shù)據(jù)的高時(shí)空分辨率CO2濃度估算的研究領(lǐng)域中,盡管現(xiàn)有的研究已經(jīng)估計(jì)了CO2濃度,但仍有需要進(jìn)一步改進(jìn)的地方。
1) 以往生成的XCO2數(shù)據(jù)集的空間分辨率在0.1°至1°之間,取得的決定系數(shù)R2也在93%至97%之間(Zhang et al.,2022;Li T W et al.,2023)。雖然取得了較為不錯(cuò)的結(jié)果,但是,當(dāng)人們開(kāi)始著手火力發(fā)電站這種大型企業(yè)級(jí)別對(duì)象的具體監(jiān)測(cè)任務(wù)時(shí),現(xiàn)有數(shù)據(jù)集的估計(jì)精度和空間分辨率就需要進(jìn)一步提高。
2) 在以往利用機(jī)器學(xué)習(xí)構(gòu)建衛(wèi)星XCO2與輔助數(shù)據(jù)之間關(guān)系的研究中,氣象數(shù)據(jù)、植被數(shù)據(jù)經(jīng)常性地被當(dāng)作輔助數(shù)據(jù)進(jìn)行研究,但是很少把人類活動(dòng)數(shù)據(jù)考慮到模型中。這可能是人類活動(dòng)數(shù)據(jù)屬于社會(huì)科學(xué)范疇,而氣象數(shù)據(jù)和植被數(shù)據(jù)則歸屬于自然科學(xué)領(lǐng)域。由于這兩種學(xué)科的交叉研究較為罕見(jiàn),相關(guān)研究相對(duì)較少。因此,少有研究將氣象數(shù)據(jù)、植被數(shù)據(jù)以及人類活動(dòng)數(shù)據(jù)三者結(jié)合來(lái)預(yù)測(cè)XCO2數(shù)據(jù)。
從自然學(xué)科參數(shù)發(fā)展到基于衛(wèi)星遙感的“自上而下”溫室氣體排放清單反演和校驗(yàn)技術(shù)體系,實(shí)現(xiàn)對(duì)人為碳排放的精細(xì)化監(jiān)測(cè),是評(píng)估雙碳任務(wù)狀態(tài)的關(guān)鍵,是國(guó)內(nèi)外主流碳衛(wèi)星研發(fā)的初衷。在此基礎(chǔ)上,助力我國(guó)“政府牽頭,企業(yè)參與,多方推進(jìn)落實(shí)”的碳排放監(jiān)測(cè)模式,協(xié)助政府這一碳市場(chǎng)的管理者根據(jù)碳排放的觀測(cè)數(shù)據(jù)制定環(huán)境治理目標(biāo)和發(fā)布節(jié)能減排任務(wù),從而形成一個(gè)工作閉環(huán)。但是這種監(jiān)測(cè)是基于自然學(xué)科數(shù)據(jù)、多學(xué)科指標(biāo)的方案,在監(jiān)測(cè)時(shí)缺乏社會(huì)學(xué)科數(shù)據(jù)的參與,使得后期難以與社會(huì)學(xué)科的工作交接。
因此,本研究將人類活動(dòng)數(shù)據(jù)作為輔助變量,與衛(wèi)星數(shù)據(jù)、氣象數(shù)據(jù)、植被數(shù)據(jù)相結(jié)合,把軟注意力機(jī)制和卷積長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(convolutional long short-term memory,Conv-LSTM)進(jìn)行結(jié)合,提出了時(shí)空軟注意力網(wǎng)絡(luò)模型(space-time soft attention network,ST-SAN),利用深度學(xué)習(xí)框架生成了2016—2020年中國(guó)長(zhǎng)三角地區(qū)的空間分辨率為0.05°的無(wú)間隙XCO2日數(shù)據(jù)集,并在模型中加入支持向量機(jī)-遞歸特征消除(support vector machine-recursive feature elimination,SVM-RFE)的方法來(lái)解釋輸入特征重要性,通過(guò)交叉驗(yàn)證和地面驗(yàn)證評(píng)估了估算的CO2結(jié)果。
1" 數(shù)據(jù)和方法
1.1" 研究區(qū)域
中國(guó)長(zhǎng)三角地區(qū)是中國(guó)經(jīng)濟(jì)發(fā)展的引擎之一,在全球格局中具有重要的戰(zhàn)略地位(Lin et al.,2024)。該研究區(qū)域作為中國(guó)最為繁榮的地區(qū)之一,在經(jīng)濟(jì)發(fā)展、國(guó)際貿(mào)易、交通樞紐、人口密集和科技創(chuàng)新等方面發(fā)揮著關(guān)鍵作用。隨著經(jīng)濟(jì)騰飛,該地區(qū)產(chǎn)業(yè)結(jié)構(gòu)多樣,同時(shí)也面臨嚴(yán)重的環(huán)境問(wèn)題。雖然政府采取了調(diào)整能源結(jié)構(gòu)、推動(dòng)綠色制造、加強(qiáng)污染治理和生態(tài)保護(hù)等一系列措施,但解決長(zhǎng)三角地區(qū)的環(huán)境問(wèn)題仍是一個(gè)復(fù)雜的過(guò)程,需要全社會(huì)的參與和共同努力。因此,深入了解長(zhǎng)三角地區(qū)的CO2情況對(duì)于制定可持續(xù)發(fā)展戰(zhàn)略、推動(dòng)低碳經(jīng)濟(jì)轉(zhuǎn)型具有重要意義?;诖耍狙芯窟x擇(115°46′~123°25′E,29°20′~32°34′N)作為研究區(qū)域(Li W et al.,2023)。
1.2" 多源數(shù)據(jù)
如表3所示,本研究使用了多種數(shù)據(jù),主要分為4類:
1) XCO2數(shù)據(jù),包括OCO-2(Orbiting Carbon Observatory-2)衛(wèi)星數(shù)據(jù)、CAMS XCO2數(shù)據(jù)以及用于驗(yàn)證的總碳柱觀測(cè)網(wǎng)絡(luò)(TCCON)站點(diǎn)XCO2數(shù)據(jù)。
2) 植被指數(shù)數(shù)據(jù),代表歸一化植被指數(shù)(normalized difference vegetation index,NDVI)。
3) 氣象數(shù)據(jù),包括相對(duì)濕度(RH)、溫度(T2M)、緯向風(fēng)(UW)和經(jīng)向風(fēng)(VW)。
4) 人類活動(dòng)數(shù)據(jù),包括可以反映人類活動(dòng)對(duì)XCO2影響的人口數(shù)據(jù)(population data,POP)。
本研究使用的所有數(shù)據(jù)重采樣到空間分辨率為0.05°、時(shí)間分辨率為每日。
1.2.1" CO2濃度數(shù)據(jù)
1) OCO-2 XCO2數(shù)據(jù)
Orbiting Carbon Observatory-2 (OCO-2)是由美國(guó)宇航局(NASA)發(fā)起的衛(wèi)星任務(wù),旨在通過(guò)搭載高分辨率光譜儀監(jiān)測(cè)地球大氣中的CO2濃度(Wunch et al.,2017),并于2014年7月成功發(fā)射,主要提供平均干空氣CO2摩爾分?jǐn)?shù)(XCO2濃度)數(shù)據(jù)。OCO-2衛(wèi)星表現(xiàn)出局部同步觀測(cè)時(shí)間為13:30(北京時(shí),下同),空間分辨率為2.25 km×1.29 km,并具有約16 d的重訪周期。本研究使用OCO-2 L2 Lite FP版本的數(shù)據(jù)產(chǎn)品,Lite FP版本的優(yōu)勢(shì)在于數(shù)據(jù)具有更少的系統(tǒng)誤差和更高的準(zhǔn)確度,使用了從2018年1月1日到2020年12月31日期間的數(shù)據(jù)(https://earthdata.nasa.gov/)。
2) CAMS XCO2數(shù)據(jù)
CAMS XCO2數(shù)據(jù)是由歐洲環(huán)境局的Copernicus大氣監(jiān)測(cè)服務(wù)提供的大氣CO2濃度數(shù)據(jù),包括CO2和甲烷(CH4)(Inness et al.,2019)。目前CAMS XCO2數(shù)據(jù)覆蓋了2003—2020年的時(shí)段,其空間和時(shí)間分辨率分別為0.75°和3 h。這一數(shù)據(jù)集整合了來(lái)自地面站、衛(wèi)星以及氣象和大氣成分模型的信息,以高時(shí)空分辨率提供全球范圍內(nèi)CO2濃度的觀測(cè)(Agustí-Panareda et al.,2023)。此外,CAMS沒(méi)有同化OCO-2的數(shù)據(jù),這確保了多源數(shù)據(jù)在CO2估計(jì)中的有效融合(Tu et al.,2020),本研究利用CAMS XCO2作為重要的輔助輸入來(lái)估算CO2濃度(https://ads.atmosphere.copernicus.eu/)。
3) TCCON XCO2數(shù)據(jù)
如圖1所示,TCCON是一個(gè)全球性的CO2觀測(cè)網(wǎng)絡(luò),由地面測(cè)量站點(diǎn)構(gòu)成,目標(biāo)是通過(guò)高精度、高分辨率的測(cè)量,提供全球CO2濃度變化的詳盡信息(Yang et al.,2020)。該網(wǎng)絡(luò)匯集了來(lái)自全球各地的觀測(cè)站點(diǎn),遍布北美、南美、歐洲、亞洲、澳大利亞和南極洲等多個(gè)國(guó)家和地區(qū),每個(gè)站點(diǎn)均配備高精度的地面紅外光譜儀。TCCON檢測(cè)的CO2濃度精度為0.1×10-6,CH4濃度精度為2×10-9,是驗(yàn)證衛(wèi)星CO2數(shù)據(jù)的重要來(lái)源。因此,本研究選取了中國(guó)長(zhǎng)三角范圍內(nèi)的合肥站點(diǎn)的數(shù)據(jù)(時(shí)間范圍為2016年1月—2020年12月)來(lái)評(píng)估重建后的XCO2的精確性(https://tccondata.org/)。
1.2.2" 氣象數(shù)據(jù)
ERA5(第五代歐洲中期天氣預(yù)報(bào)中心再分析資料)是由歐洲中期天氣預(yù)報(bào)中心推出的全球大氣再分析產(chǎn)品,提供了高時(shí)空分辨率的氣象數(shù)據(jù),包括大氣組分、溫度、濕度、風(fēng)速、氣壓等多個(gè)要素(Hersbach et al.,2020)。ERA5數(shù)據(jù)的0.25°空間分辨率和小時(shí)級(jí)的數(shù)據(jù)提供了詳細(xì)的全球氣象信息(Hoffmann and Spang,2022)。本研究使用ERA5的氣象數(shù)據(jù),包括相對(duì)濕度(RH)、溫度(T2M)、緯向風(fēng)(UW)和經(jīng)向風(fēng)(VW)(https://cds.climate.copernicus.eu/)。
1.2.3" 植被指數(shù)數(shù)據(jù)
植被條件對(duì)調(diào)節(jié)大氣中的CO2水平具有重要作用,是碳匯的重要組成部分。植被通過(guò)光合作用吸收并儲(chǔ)存CO2,且植被促進(jìn)土壤有機(jī)質(zhì)的積累和固定,降低土壤中有機(jī)碳的氧化釋放,減少CO2的排放(Zhang et al.,2021)。
NDVI是通過(guò)測(cè)量地表在近紅外光和紅光波段的反射差異來(lái)估算植被狀況的遙感指數(shù)(Pettorelli et al.,2005)。其計(jì)算公式如下:
INDV=INIR-IRedINIR+IRed。" (1)
其中:INIR是近紅外波段的反射值;IRed是紅光波段的反射值。INDV的取值范圍通常為-1~1,表示植被的生長(zhǎng)狀況。高正值通常表示健康的植被,而較低或負(fù)值則可能指示裸露土地或其他非植被表面。NDVI作為碳匯的一部分,已被證明與CO2濃度密切相關(guān)。因此在重建過(guò)程中,NDVI被用作輔助預(yù)測(cè)因子之一(https://e4ftl01.cr.usgs.gov/MOLT/)。
1.2.4" 人類活動(dòng)數(shù)據(jù)
人口數(shù)據(jù)是指對(duì)一個(gè)特定地區(qū)、國(guó)家或全球范圍內(nèi)的人口數(shù)量和特征進(jìn)行統(tǒng)計(jì)的數(shù)據(jù),可以反映人類活動(dòng)對(duì)XCO2的影響(Lü et al.,2020)。LandScan是由美國(guó)橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室開(kāi)發(fā)的全球人口分布數(shù)據(jù)集,采用結(jié)合地理空間科學(xué)、遙感技術(shù)和機(jī)器學(xué)習(xí)算法的創(chuàng)新方法,是代表環(huán)境人口的最佳分辨率全球人口分布數(shù)據(jù)。該數(shù)據(jù)集結(jié)合了衛(wèi)星圖像、地理信息系統(tǒng)數(shù)據(jù)、國(guó)家統(tǒng)計(jì)數(shù)據(jù)以及地理特征如道路、河流和地形等信息。LandScan利用這些數(shù)據(jù)分析區(qū)域特征,結(jié)合“晚上燈光”數(shù)據(jù)等輔助信息,通過(guò)算法將人口數(shù)據(jù)分布到不同的柵格單元中,細(xì)化到高分辨率的人口密度地圖。因此,LandScan人口分布模型是根據(jù)每個(gè)國(guó)家和地區(qū)的數(shù)據(jù)條件和地理性質(zhì)而定制的。通過(guò)對(duì)環(huán)境人口進(jìn)行建模,LandScan可以捕獲人們?cè)诎滋旌秃谝沟娜繚撛诨顒?dòng)空間,而不僅僅是住宅區(qū)(https://landscan.ornl.gov/)。
1.3" 數(shù)據(jù)預(yù)處理
在這項(xiàng)研究中,本文旨在生成2016—2020年中國(guó)長(zhǎng)三角地區(qū)的XCO2數(shù)據(jù)集。因此,本研究采取了一系列數(shù)據(jù)處理步驟,在時(shí)間和空間維度上協(xié)調(diào)這些數(shù)據(jù)。
首先,由于大氣中氣溶膠的散射吸收、衛(wèi)星軌道的間隔、云的覆蓋以及反演算法本身的局限性,許多觀測(cè)數(shù)據(jù)被確定為不良數(shù)據(jù)。因此,本文對(duì)XCO2進(jìn)行了質(zhì)量控制,排除了潛在的問(wèn)題或不可靠數(shù)據(jù),有助于確保數(shù)據(jù)集的可靠性和準(zhǔn)確性。由于衛(wèi)星在13:30過(guò)境,本文以每小時(shí)為基礎(chǔ)獲取CAMS XCO2數(shù)據(jù),并從中選擇每天13:30的數(shù)據(jù)點(diǎn)作為日分布值。對(duì)于ERA5氣象數(shù)據(jù),本研究對(duì)不同氣壓層上的氣象數(shù)據(jù)進(jìn)行平均,以獲取整個(gè)大氣柱中的平均氣象情況。其次,所有數(shù)據(jù)均通過(guò)雙線性插值法重新采樣為空間分辨率為0.05°,時(shí)間分辨率為每日。最后,為了消除尺寸的影響,本研究通過(guò)預(yù)處理對(duì)所有數(shù)據(jù)進(jìn)行了歸一化處理。x*的歸一化計(jì)算如下:
x*=x-xminxmax-xmin。" (2)
其中:xmax和xmin分別表示樣本數(shù)據(jù)的最大值和最小值。這里需要指出的是,對(duì)于預(yù)處理后的數(shù)據(jù),雖然是時(shí)空間分辨率進(jìn)行了統(tǒng)一,但是仍然需要本研究的方法來(lái)進(jìn)行數(shù)據(jù)融合,以提高數(shù)據(jù)的準(zhǔn)確率。
1.4" 方法
本研究的主要目標(biāo)是利用OCO-2 XCO2、CAMS XCO2、植被數(shù)據(jù)、氣象變量以及人類活動(dòng)數(shù)據(jù)作為輸入,來(lái)估計(jì)每日的全覆蓋XCO2數(shù)據(jù)。通過(guò)構(gòu)建一個(gè)模型,建立這些變量之間的關(guān)系,從而實(shí)現(xiàn)對(duì)XCO2數(shù)據(jù)的估算。為了實(shí)現(xiàn)這一目標(biāo),本文提出了ST-SAN模型來(lái)構(gòu)建衛(wèi)星XCO2與其他輔助數(shù)據(jù)的關(guān)系,公式如下:
ρXCO2=fDXCO2,DCAMS,DRH,DT2M,DUW,DVW,DNDVI,DPOP。
其中:ρXCO2代表估計(jì)的二氧化碳碳通柱濃度;DXCO2、DCAMS是主要數(shù)據(jù);DRH、DT、DUW、DVW、DNDVI、DPOP是輔助數(shù)據(jù)。f()表示ST-SAN模型,它對(duì)輸出(即OCO-2 XCO2)和輸入數(shù)據(jù)之間的關(guān)系進(jìn)行建模。CO2重建流程如圖2所示。
ST-SAN模型將軟注意力機(jī)制和Conv-LSTM進(jìn)行結(jié)合,并在模型中加入了支持向量機(jī)-遞歸特征消除(SVM-RFE)方法來(lái)解釋特征的重要性。
首先,ST-SAN模型將多維度、多時(shí)空特征的數(shù)據(jù)集輸入模型中,通過(guò)SVM-RFE方法進(jìn)行特征選擇,提取對(duì)預(yù)測(cè)最有意義的特征。這一步驟確保模型能夠聚焦于對(duì)CO2濃度預(yù)測(cè)最關(guān)鍵的特征,從而簡(jiǎn)化數(shù)據(jù)維度并提高模型性能和模型的可解釋性。然后,將選出的特征輸入到Conv-LSTM層中,以捕捉數(shù)據(jù)中的時(shí)空相關(guān)性。Conv-LSTM結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)的優(yōu)點(diǎn),能夠同時(shí)處理數(shù)據(jù)的空間和時(shí)間特征,提高了模型對(duì)復(fù)雜數(shù)據(jù)模式的識(shí)別能力。
在Conv-LSTM層的基礎(chǔ)上,應(yīng)用軟注意力機(jī)制,通過(guò)分配不同的權(quán)重,突出重點(diǎn)特征。軟注意力機(jī)制能夠動(dòng)態(tài)調(diào)整各特征的重要性,使模型更加關(guān)注那些對(duì)預(yù)測(cè)結(jié)果有顯著影響的特征,從而提升預(yù)測(cè)的準(zhǔn)確性。最后,經(jīng)過(guò)注意力層處理后的特征輸入到全連接層,生成CO2濃度的預(yù)測(cè)結(jié)果。全連接層通過(guò)加權(quán)求和,將注意力層輸出的特征轉(zhuǎn)化為最終的預(yù)測(cè)值。
在ST-SAN模型的訓(xùn)練過(guò)程中,本研究進(jìn)行了100輪迭代訓(xùn)練,并對(duì)模型的性能進(jìn)行了持續(xù)監(jiān)控?;隍?yàn)證集的表現(xiàn),研究調(diào)整了早停策略,確保模型在訓(xùn)練過(guò)程中達(dá)到最佳性能。研究采用了具有良好收斂性能的Adam優(yōu)化器,其初始學(xué)習(xí)率設(shè)置為0.001,并根據(jù)驗(yàn)證集的表現(xiàn)進(jìn)行動(dòng)態(tài)調(diào)整。在損失函數(shù)的選擇上,模型采用了均方誤差(mean squared error,MSE),以有效衡量預(yù)測(cè)值與真實(shí)值之間的差距。訓(xùn)練過(guò)程中,批次大小設(shè)置為32,以保證模型的穩(wěn)定訓(xùn)練,使用反向傳播算法最小化損失函數(shù),通過(guò)訓(xùn)練數(shù)據(jù)不斷優(yōu)化模型參數(shù),以提高預(yù)測(cè)精度并準(zhǔn)確捕捉數(shù)據(jù)中的模式和規(guī)律。在驗(yàn)證階段,通過(guò)多種性能指標(biāo)評(píng)估模型,確保其在不同數(shù)據(jù)集上的穩(wěn)健性和高精度表現(xiàn)。此外,采用交叉驗(yàn)證方法進(jìn)一步驗(yàn)證模型的泛化能力,防止過(guò)擬合,確保模型在實(shí)際應(yīng)用中具有良好的預(yù)測(cè)性能。整個(gè)流程的設(shè)計(jì)旨在最大限度地利用時(shí)空數(shù)據(jù),提高CO2濃度預(yù)測(cè)的準(zhǔn)確性和可靠性。
此外,在消融實(shí)驗(yàn)中,CNN部分采用了3層卷積層,卷積核大小為3×3,激活函數(shù)為ReLU,卷積核數(shù)量分別為64、128和256,池化層采用2×2的最大池化操作。LSTM部分使用了一層隱藏態(tài)維度為256的雙向LSTM,輸入序列的維度為128。軟注意力機(jī)制采用單層注意力機(jī)制,輸入和輸出向量維度均為256,注意力權(quán)重的計(jì)算方法為點(diǎn)積。在每種組合方式中,研究均使用相同的數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,以確保結(jié)果的可比性。
圖3為ST-SAN模型網(wǎng)絡(luò)結(jié)構(gòu)圖。下面將分別介紹模型的3個(gè)主要部分來(lái)說(shuō)明ST-SAN模型的優(yōu)勢(shì)。
1) Conv-LSTM
Conv-LSTM (Liu et al.,2017)結(jié)合了卷積神經(jīng)網(wǎng)絡(luò)和長(zhǎng)短期記憶網(wǎng)絡(luò)的優(yōu)點(diǎn),用于處理時(shí)空數(shù)據(jù)。其原理是在輸入數(shù)據(jù)上進(jìn)行卷積操作以提取空間特征,然后應(yīng)用LSTM單元捕捉時(shí)間依賴關(guān)系,通過(guò)狀態(tài)傳遞保留空間結(jié)構(gòu)信息。這種結(jié)構(gòu)使得ConvLSTM能夠同時(shí)處理數(shù)據(jù)的空間和時(shí)間特征。
本研究將ConvLSTM應(yīng)用到ST-SAN模型中,使得模型能夠同時(shí)捕捉時(shí)空序列數(shù)據(jù)中的空間特征和時(shí)間依賴關(guān)系,有效地從數(shù)據(jù)中提取有關(guān)時(shí)空變化的信息,更準(zhǔn)確地理解時(shí)空序列數(shù)據(jù)的模式和趨勢(shì),并且可以防止梯度消失和爆炸問(wèn)題,提高預(yù)測(cè)精度。
2) 軟注意力機(jī)制
軟注意力機(jī)制允許模型在處理序列數(shù)據(jù)時(shí)動(dòng)態(tài)地關(guān)注輸入序列中的不同部分,從而提升模型的性能(皇甫曉瑛等,2023)。在軟注意力機(jī)制中,每個(gè)輸入部分都被賦予一個(gè)注意力權(quán)重,這個(gè)權(quán)重的大小為0~1,表示該部分在輸出中的重要性。所有注意力權(quán)重的總和等于1,可以通過(guò)對(duì)注意力權(quán)重進(jìn)行歸一化來(lái)實(shí)現(xiàn)。
本研究選擇軟注意力機(jī)制用于構(gòu)建ST-SAN模型,能夠使得模型動(dòng)態(tài)地關(guān)注輸入數(shù)據(jù)的不同部分,這在處理具有顯著時(shí)空特性的XCO2數(shù)據(jù)、植被數(shù)據(jù)和氣象變量時(shí)尤為重要。此外,雖然Conv-LSTM能夠有效處理時(shí)空序列數(shù)據(jù),但在捕捉長(zhǎng)時(shí)間依賴關(guān)系時(shí)可能存在局限性。軟注意力機(jī)制可以通過(guò)加權(quán)不同時(shí)間步的輸入,幫助Conv-LSTM更好地捕捉長(zhǎng)時(shí)間依賴關(guān)系,增強(qiáng)模型的記憶和選擇能力。同時(shí),相比一些復(fù)雜的注意力機(jī)制,軟注意力機(jī)制在計(jì)算復(fù)雜性上更為簡(jiǎn)單,適合處理大規(guī)模數(shù)據(jù)集。這可以減少計(jì)算資源的消耗,同時(shí)仍能保持良好的性能,更好地實(shí)現(xiàn)對(duì)每日全覆蓋XCO2數(shù)據(jù)的估算目標(biāo)。
3) SVM-RFE方法
SVM-RFE方法是一種特征選擇算法,結(jié)合了支持向量機(jī)(SVM)的分類性能和遞歸特征消除(RFE)的特征選擇能力(Duan et al.,2005)。支持向量機(jī)作為一種監(jiān)督學(xué)習(xí)算法,通過(guò)在特征空間中找到最優(yōu)超平面來(lái)分隔不同類別的樣本,并通過(guò)其學(xué)習(xí)到的權(quán)重向量反映特征的重要性。遞歸特征消除則通過(guò)不斷構(gòu)建模型并刪除最不重要的特征,迭代地選擇特征子集,直到達(dá)到預(yù)定的停止條件。
因此,SVM-RFE方法可用于選擇最具影響力的特征,從而提高模型的運(yùn)行效率和泛化能力,并且能夠自動(dòng)根據(jù)特征的權(quán)重進(jìn)行排序和消除,有效減少特征數(shù)量,降低過(guò)擬合風(fēng)險(xiǎn),并提升模型解釋性和計(jì)算效率。
基于SVM-RFE方法的優(yōu)點(diǎn),本研究在ST-SAN模型中加入了SVM-RFE方法,能夠有效地從原始多源數(shù)據(jù)中選擇出對(duì)模型影響最大的特征,為后續(xù)網(wǎng)絡(luò)訓(xùn)練打下堅(jiān)實(shí)基礎(chǔ)。
2" 結(jié)果與分析
2.1" 變量對(duì)模型的貢獻(xiàn)程度
本文研究了各變量之間的統(tǒng)計(jì)關(guān)系,用相關(guān)系數(shù)r來(lái)表示它們的相關(guān)性。公式如下:
r=∑ni=1(Xi-)(Yi-)∑ni=1(Xi-)2∑ni=1(Yi-)2。" (3)
其中:Xi和Yi分別表示兩個(gè)變量的第i個(gè)觀測(cè)值;和分別表示所有觀測(cè)值的平均值;n是觀測(cè)值的數(shù)量。由圖4可以看出,衛(wèi)星XCO2與CAMSXCO2的相關(guān)性最高,其次是溫度和濕度。雖然植被指數(shù)數(shù)據(jù)、緯向風(fēng)、經(jīng)向風(fēng)以及人類活動(dòng)數(shù)據(jù)與衛(wèi)星XCO2的相關(guān)性較弱,但是這些變量之間的互相關(guān)系是復(fù)雜的,比如溫度和濕度的相關(guān)系數(shù)為0.44,但濕度與植被指數(shù)數(shù)據(jù)的相關(guān)系數(shù)僅為0.16。盡管某些變量之間的相關(guān)性不是很明顯,但本文構(gòu)建的模型有能力從這些復(fù)雜關(guān)系中提取有用的信息。
為了進(jìn)一步探索所選變量與XCO2的潛在關(guān)系,本研究通過(guò)SVM-RFE方法進(jìn)行特征選擇并輸出排名柱狀圖,即可解釋變量在模型構(gòu)建過(guò)程中的貢獻(xiàn)程度。在ST-SAN模型中,最重要的預(yù)測(cè)因子是CAMS XCO2,其次是T2M、RH、POP、UW。為了驗(yàn)證SVM-RFE方法在模型中的正確性,本文選擇了隨機(jī)森林回歸模型來(lái)繼續(xù)做比較。結(jié)果(圖5)顯示,ST-SAN模型與隨機(jī)森林模型(李琳菲等,2024)的結(jié)果高度一致,表明ST-SAN模型中計(jì)算特征重要性的方法是令人信服的。
為了進(jìn)一步研究POP數(shù)據(jù)對(duì)模型的貢獻(xiàn),對(duì)有POP數(shù)據(jù)和無(wú)POP數(shù)據(jù)的模型進(jìn)行了比較。如圖6所示,在模型的直接擬合和地面站點(diǎn)驗(yàn)證中,沒(méi)有POP數(shù)據(jù)的模型的MAE(mean absolute error,平均絕對(duì)誤差)值比有POP數(shù)據(jù)的模型分別多了0.036 5和0.009 8,MSE的值也分別多了0.013 5和0.005 5,而沒(méi)有POP數(shù)據(jù)的模型的R2值比有POP數(shù)據(jù)的模型的R2值分別小了0.035 6和0.014 5。這表明POP數(shù)據(jù)對(duì)模型性能的改善有貢獻(xiàn)。
上述統(tǒng)計(jì)指標(biāo)計(jì)算如下:
R2=1-∑ni=1(yi-y^i)2∑ni=1(yi-y-i)2,(4)
EMA=1n∑ni=1yi-y^i, (5)
EMS=1n∑ni=1(yi-y^i)2。(6)
其中:n是樣本大小;yi和y^i分別是樣本i的觀測(cè)和預(yù)測(cè)的XCO2值;y-i是觀測(cè)的XCO2值的均值。
2.2" CO2重建結(jié)果的驗(yàn)證方法
本研究采用了交叉驗(yàn)證和地面驗(yàn)證兩種方法,以評(píng)估CO2重建結(jié)果的準(zhǔn)確性。首先,利用交叉驗(yàn)證算法對(duì)ST-SAN模型的性能進(jìn)行了評(píng)估。交叉驗(yàn)證方法具有無(wú)偏評(píng)估預(yù)測(cè)模型性能的優(yōu)勢(shì),而K折交叉驗(yàn)證則因其能夠利用整個(gè)數(shù)據(jù)集而得到廣泛應(yīng)用。在本研究中,選擇了K值為10,能夠最為準(zhǔn)確地反映模型的無(wú)偏概括性能。其次,在地面驗(yàn)證中,本研究用重建的XCO2數(shù)據(jù)和合肥站點(diǎn)數(shù)據(jù)進(jìn)行了比較,定量評(píng)估了模型預(yù)測(cè)性能。
2.3" CO2重建結(jié)果驗(yàn)證
首先,本研究用交叉驗(yàn)證的方法評(píng)估模型的泛化能力和穩(wěn)健性。本研究選擇了3種交叉驗(yàn)證的方法:基于樣本的交叉驗(yàn)證、基于時(shí)間的交叉驗(yàn)證和基于空間的交叉驗(yàn)證。
基于樣本的交叉驗(yàn)證是一種被廣泛采用的驗(yàn)證方法。該方法通過(guò)隨機(jī)選擇90%的樣本進(jìn)行模型建模,然后利用剩余的10%樣本進(jìn)行驗(yàn)證。這個(gè)過(guò)程會(huì)重復(fù)進(jìn)行10次,以確保所有樣本都得到了測(cè)試。
基于空間的交叉驗(yàn)證和基于時(shí)間的交叉驗(yàn)證也采用了類似的10折交叉驗(yàn)證過(guò)程。在基于空間的交叉驗(yàn)證中,本研究隨機(jī)丟棄10%的空間位置點(diǎn),而在基于時(shí)間的交叉驗(yàn)證中,也隨機(jī)丟棄10%的時(shí)間點(diǎn)。這些交叉驗(yàn)證方法從不同的角度評(píng)估了模型的準(zhǔn)確性。基于樣本的交叉驗(yàn)證反映了模型的整體預(yù)測(cè)能力,基于空間的交叉驗(yàn)證評(píng)估了模型的空間預(yù)測(cè)能力,而基于時(shí)間的交叉驗(yàn)證則展示了模型的時(shí)間預(yù)測(cè)能力。這些驗(yàn)證方法提供了對(duì)模型在不同維度上性能的全面評(píng)估,以確保模型在實(shí)際應(yīng)用中具有更強(qiáng)的魯棒性和穩(wěn)定性,結(jié)果如圖7所示。
直接擬合充分利用了所有可用數(shù)據(jù),無(wú)需考慮數(shù)據(jù)集的劃分,擬合的結(jié)果為R2=0.982 7,EMS=0.006 5,EMA=0.048 8?;跇颖镜慕徊骝?yàn)證擬合結(jié)果為R2=0.930 9,EMS=0.026 2,EMA=0.097 5,基于空間的交叉驗(yàn)證擬合結(jié)果為R2=0.902 6,EMS=0.036 9,EMA=0.115 8,可以發(fā)現(xiàn)模型在不同位置的估計(jì)能力也比較突出?;跁r(shí)間的交叉驗(yàn)證擬合結(jié)果為R2=0.912 5,EMS=0.033 1,EMA=0.109 7,表明基于日期的CV也取得了優(yōu)異的性能。因此,該模型無(wú)論是整體的預(yù)測(cè)能力,還是時(shí)間、空間的預(yù)測(cè)能力都取得了較為不錯(cuò)的結(jié)果。為了評(píng)估這些結(jié)果的統(tǒng)計(jì)顯著性,我們對(duì)訓(xùn)練后的結(jié)果進(jìn)行了顯著性檢驗(yàn)。所有結(jié)果的P值均小于0.01,表明這些結(jié)果在統(tǒng)計(jì)上顯著,具有較高的可信度。
其次,為了進(jìn)一步驗(yàn)證重建結(jié)果的準(zhǔn)確性,本研究將重建數(shù)據(jù)與TCCON站點(diǎn)測(cè)量的數(shù)據(jù)進(jìn)行了比較(圖8)。合肥站點(diǎn)的斜率為0.972,R2為0.941 5。根據(jù)顯著性水平,研究發(fā)現(xiàn)P值小于0.03,這表明該相關(guān)系數(shù)在統(tǒng)計(jì)上是顯著的。因此,盡管樣本量較小,R2仍然通過(guò)了顯著性檢驗(yàn)。這表明重建的值與合肥站點(diǎn)的值具有較高的一致性,可以生成高質(zhì)量的XCO2數(shù)據(jù)集。
2.4" 消融實(shí)驗(yàn)
消融實(shí)驗(yàn)是一種科學(xué)研究方法,旨在分析模型的各個(gè)組成部分對(duì)整體性能的貢獻(xiàn),并驗(yàn)證它們?cè)谀P椭械淖饔谩1狙芯康哪P椭饕?個(gè)部分:CNN(convolutional neural network)、LSTM(long short-term memory)和軟注意力機(jī)制。消融實(shí)驗(yàn)的目的是明確每個(gè)組件對(duì)模型性能的影響。
首先,基于ST-SAN模型,構(gòu)建完整模型并進(jìn)行訓(xùn)練和測(cè)試,以獲得基準(zhǔn)性能指標(biāo)。其次,對(duì)每個(gè)組件(CNN、LSTM和軟注意力機(jī)制)分別進(jìn)行單獨(dú)的消融實(shí)驗(yàn),通過(guò)移除每個(gè)組件并保留其他組件,構(gòu)建相應(yīng)的消融模型,使用相同的數(shù)據(jù)集進(jìn)行訓(xùn)練和測(cè)試,以獲得各自的性能指標(biāo)。最后,對(duì)兩個(gè)組件的不同組合進(jìn)行消融實(shí)驗(yàn),以進(jìn)一步了解它們之間的相互作用和影響。具體設(shè)計(jì)了6種組合方式:LSTM、CNN、LSTM-Attention、CNN-Attention、CNN-LSTM和ST-SAN。消融結(jié)果如圖9所示,表4列出了6種組合方式的評(píng)價(jià)指標(biāo)值。
2.5" 對(duì)比實(shí)驗(yàn)
為了進(jìn)一步研究ST-SAN模型的重建效果,本研究將ST-SAN模型的重建結(jié)果與4種廣泛使用的機(jī)器學(xué)習(xí)方法,即隨機(jī)森林(RF)、極限梯度提升(XGBoost)、支持向量回歸(SVR)、Transformer進(jìn)行了比較。由表5可見(jiàn),不同預(yù)測(cè)模型在性能評(píng)估指標(biāo)上呈現(xiàn)出多樣化。其中,ST-SAN模型在R2、EMS和EMA等方面表現(xiàn)最為優(yōu)秀,其擬合度高且預(yù)測(cè)誤差較小,是一個(gè)較為理想的模型選擇。相比之下,其他模型也表現(xiàn)良好,但在某些指標(biāo)上略遜于ST-SAN模型。綜合考慮模型性能,ST-SAN模型在CO2濃度重建方面取得了相當(dāng)大的優(yōu)勢(shì)。
2.6" 長(zhǎng)三角地區(qū)的CO2濃度趨勢(shì)
2.6.1" 長(zhǎng)三角地區(qū)CO2濃度總體趨勢(shì)
本文深入探討了中國(guó)長(zhǎng)三角地區(qū)過(guò)去5年CO2濃度的動(dòng)態(tài)變化。通過(guò)重建的中國(guó)長(zhǎng)三角地區(qū)CO2濃度數(shù)據(jù)集,本文能夠更準(zhǔn)確地描繪2016—2020年長(zhǎng)三角地區(qū)CO2濃度的分布與趨勢(shì)。
基于重建的數(shù)據(jù)集,研究發(fā)現(xiàn)2016—2020長(zhǎng)三角地區(qū)年均CO2濃度分別為404.185×10-6、407.243×10-6、408.997×10-6、411.399×10-6和414.014×10-6。2016—2017年CO2濃度年增加量為3.085×10-6,為5年最大,反映出該時(shí)期碳排放的劇增,這可能與區(qū)域內(nèi)工業(yè)活動(dòng)的加快、能源消費(fèi)的上升有關(guān)。而2017—2018年增量為1.754×10-6,為5年最小,可能是實(shí)施了更為嚴(yán)格的排放控制政策及提高能效措施的結(jié)果。2018—2019年和2019—2020年的濃度年增量分別為2.402×10-6和2.615×10-6,說(shuō)明盡管有波動(dòng),但整體趨勢(shì)仍是排放持續(xù)增加。
通過(guò)觀察長(zhǎng)三角地區(qū)年度濃度(圖10),研究發(fā)現(xiàn)長(zhǎng)三角地區(qū)整體碳排放總量增大但增速變緩,未來(lái)可能會(huì)出現(xiàn)負(fù)增長(zhǎng)的情況。并且,長(zhǎng)三角各省市間CO2濃度的區(qū)域差異有減小趨勢(shì),碳排放重心先向東南后向西北遷移。這種現(xiàn)象可能是由于上海及其周邊一些經(jīng)濟(jì)發(fā)展水平較高地區(qū)的高污染工業(yè)不斷向安徽等經(jīng)濟(jì)發(fā)展水平相對(duì)較低的地方遷移,導(dǎo)致安徽省的大部分區(qū)縣及浙江省部分區(qū)縣的碳排放增長(zhǎng)率較高。
通常情況下,NDVI和XCO2之間存在一定的關(guān)系,即一個(gè)地區(qū)的NDVI值較高,那么該地區(qū)的XCO2濃度可能會(huì)相對(duì)較低。反之,如果NDVI值較低,則XCO2濃度可能會(huì)較高。因此本研究對(duì)比了2020年長(zhǎng)三角地區(qū)的NDVI和XCO2濃度分布(圖11),可以進(jìn)一步發(fā)現(xiàn)長(zhǎng)三角地區(qū)西北部的山區(qū)和農(nóng)村地帶,NDVI值較高,呈現(xiàn)出綠色和淺綠色的良好植被覆蓋狀態(tài),而東南部的城市中心和工業(yè)區(qū)域NDVI值較低,呈現(xiàn)出偏黃色和紅色的較差植被覆蓋狀態(tài)。
綜上所述,長(zhǎng)三角地區(qū)的NDVI值呈現(xiàn)出由西北向東南逐漸降低的空間分布趨勢(shì)。相比之下,長(zhǎng)三角地區(qū)中部和東南部地區(qū)的XCO2濃度較高,呈現(xiàn)出紅色和橙色的高濃度區(qū)域,西北部山區(qū)和農(nóng)村地帶,XCO2濃度較低,呈現(xiàn)出綠色和藍(lán)色的低濃度區(qū)域。這種空間分布規(guī)律與NDVI分布的空間規(guī)律是相吻合的,即植被覆蓋較好的西北部地區(qū),碳排放相對(duì)較低,而植被覆蓋較差的東南部城市工業(yè)區(qū),碳排放則較高。
2.6.2" 長(zhǎng)三角地區(qū)CO2濃度季節(jié)性趨勢(shì)
本研究通過(guò)重建的數(shù)據(jù)集準(zhǔn)確地繪制了2016—2020年季節(jié)性CO2濃度分布(圖12),通過(guò)色彩深淺變化直觀展現(xiàn)了CO2濃度的季節(jié)性規(guī)律。
由圖12可見(jiàn),長(zhǎng)三角地區(qū)CO2濃度在不同季節(jié)之間存在一定的變化。春季和秋季時(shí)CO2濃度相對(duì)較低,這很可能是由于這兩個(gè)季節(jié)正是植物生長(zhǎng)和光合作用最旺盛的時(shí)期。在春季,隨著溫度漸暖,植被開(kāi)始恢復(fù)生長(zhǎng),大量的CO2被植物吸收用于光合作用,從而導(dǎo)致空氣中的CO2濃度下降。秋季,植物繼續(xù)生長(zhǎng)并積累營(yíng)養(yǎng),進(jìn)一步吸收大量的CO2,保持了較低的大氣CO2濃度。
而在夏季,由于氣候炎熱,植物的呼吸作用較為強(qiáng)烈(Graven et al.,2013)。同時(shí),夏季天氣炎熱可導(dǎo)致人類活動(dòng)增加,如大量使用空調(diào)導(dǎo)致能源需求激增,因而CO2排放量上升,故測(cè)得的CO2濃度相對(duì)較高。此外,夏季也可能伴隨著較少的降雨和植物生長(zhǎng),從而進(jìn)一步加劇CO2濃度的上升(Song et al.,2021)。至于冬季,植物生長(zhǎng)停滯,呼吸作用減弱,同時(shí)由于溫度較低可能減少了一些由人類活動(dòng)產(chǎn)生的CO2,因此CO2的整體濃度沒(méi)有太大的波動(dòng)。
長(zhǎng)三角地區(qū)的CO2季節(jié)性變化規(guī)律清晰地展現(xiàn)了人類活動(dòng)和自然生態(tài)過(guò)程對(duì)地區(qū)氣候的復(fù)雜影響。這些發(fā)現(xiàn)對(duì)理解和預(yù)測(cè)區(qū)域環(huán)境變化非常重要,也對(duì)制定更加有效的環(huán)境保護(hù)措施和減排政策有著至關(guān)重要的影響。
3" 結(jié)論
本文在ST-SAN模型框架下整合了衛(wèi)星數(shù)據(jù)和再分析數(shù)據(jù),并重建了中國(guó)長(zhǎng)三角地區(qū)2016—2020年高精度無(wú)縫隙的CO2濃度數(shù)據(jù)集,獲得了顯著的重建精度,由此對(duì)長(zhǎng)三角地區(qū)的XCO2進(jìn)行了時(shí)空特征分析,得到如下主要結(jié)論:
1) 將軟注意力機(jī)制和Conv-LSTM進(jìn)行結(jié)合,提出了ST-SAN模型,在模型中加入SVM-RFE方法用來(lái)解釋變量對(duì)模型的重要程度,并進(jìn)行高時(shí)空分辨率XCO2濃度估算;結(jié)果顯示:SVM-RFE方法與隨機(jī)森林模型的特征重要性結(jié)果高度一致,表明ST-SAN模型中計(jì)算特征重要性的方法是令人信服的。
2) 生成了2016—2020年中國(guó)長(zhǎng)三角地區(qū)空間分辨率為0.05°的無(wú)間隙XCO2日度數(shù)據(jù)集,且重建的數(shù)據(jù)集與TCCON站測(cè)量值相比具有高精度。
3) 長(zhǎng)三角地區(qū)的CO2濃度每年都在上升,2016—2017年間CO2濃度的增幅最大,2017—2018年間CO2濃度的增幅最小。長(zhǎng)三角地區(qū)CO2濃度在不同季節(jié)之間存在一定的變化,春季和秋季通常呈現(xiàn)較低的CO2濃度,而夏季則呈現(xiàn)較高的CO2濃度。
4" 總結(jié)與展望
本研究提出了一種基于衛(wèi)星觀測(cè)數(shù)據(jù)和輔助數(shù)據(jù),利用ST-SAN模型進(jìn)行長(zhǎng)三角地區(qū)CO2濃度重建的方法。盡管通過(guò)地面觀測(cè)驗(yàn)證了估計(jì)的大氣CO2濃度的高精度,但該研究仍然存在一些限制。
GOSAT、OCO-2/3以及TanSat等碳衛(wèi)星在觀測(cè)范圍上涵蓋了不同的地理區(qū)域,觀測(cè)時(shí)間上也存在差異。由于它們的觀測(cè)周期和重訪時(shí)間不同,所以可以提供不同時(shí)間尺度的數(shù)據(jù)。這意味著它們能夠捕捉到不同時(shí)間段內(nèi)的CO2濃度變化。此外,不同的衛(wèi)星還采用不同的反演算法來(lái)從觀測(cè)數(shù)據(jù)中推斷出CO2濃度。這些算法考慮了傳感器的特性、輻射傳輸模型和大氣背景,以提高數(shù)據(jù)的準(zhǔn)確性和可靠性。不同的反演算法可能在精度和適用性上有所差異,因此結(jié)合不同衛(wèi)星的數(shù)據(jù)可以獲得更全面、一致性更好的觀測(cè)結(jié)果。因此,將多個(gè)碳衛(wèi)星數(shù)據(jù)進(jìn)行融合,并結(jié)合氣象數(shù)據(jù)、植被數(shù)據(jù)、人類活動(dòng)數(shù)據(jù),有望提高重建的精度,這是未來(lái)研究的重點(diǎn)方向之一。
此外,對(duì)于碳衛(wèi)星數(shù)據(jù)重建領(lǐng)域,本研究還建議朝著以下幾個(gè)方向發(fā)展:
1) 高分辨率觀測(cè)。這將使得碳衛(wèi)星能夠更準(zhǔn)確地捕捉到地球表面上不同區(qū)域的碳循環(huán)過(guò)程和碳排放情況,提供更精細(xì)的數(shù)據(jù)重建結(jié)果。
2) 時(shí)間尺度擴(kuò)展。目前的碳衛(wèi)星數(shù)據(jù)重建主要關(guān)注短期的碳循環(huán)和碳排放變化,如季節(jié)尺度和年尺度。未來(lái)的發(fā)展方向可能會(huì)將時(shí)間尺度擴(kuò)展到更長(zhǎng)的時(shí)間范圍,例如對(duì)幾十年甚至幾個(gè)世紀(jì)的碳循環(huán)過(guò)程進(jìn)行建模和重建,以更好地理解和預(yù)測(cè)長(zhǎng)期的碳循環(huán)變化。
3) 區(qū)域性和全球性耦合。碳循環(huán)是一個(gè)具有區(qū)域性和全球性相互作用的系統(tǒng),不同地區(qū)的碳排放和碳吸收過(guò)程相互影響。未來(lái)的發(fā)展方向可能會(huì)更加關(guān)注區(qū)域尺度的碳循環(huán)研究,并將其與全球尺度的數(shù)據(jù)重建相耦合,以更全面地揭示碳循環(huán)的復(fù)雜性。
高分辨率的長(zhǎng)時(shí)間序列CO2數(shù)據(jù)提供了準(zhǔn)確理解碳循環(huán)和氣候變化的能力,支持政策制定和監(jiān)測(cè)政策效果,促進(jìn)國(guó)際合作和協(xié)調(diào),為決策者提供了科學(xué)依據(jù)和風(fēng)險(xiǎn)評(píng)估工具,以應(yīng)對(duì)氣候挑戰(zhàn)和實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo)。通過(guò)數(shù)據(jù)重建,人們能深入了解碳排放和吸收的地理分布、季節(jié)性變化和長(zhǎng)期趨勢(shì),為制定低碳戰(zhàn)略、規(guī)劃適應(yīng)措施和評(píng)估碳市場(chǎng)風(fēng)險(xiǎn)提供了支持。
參考文獻(xiàn)(References)
Agustí-Panareda A,Barré J,Massart S,et al.,2023.Technical note:the CAMS greenhouse gas reanalysis from 2003 to 2020[J].Atmos Chem Phys,23(6):3829-3859.doi:10.5194/acp-23-3829-2023.
Aumann H H,Chahine M T,Gautier C,et al.,2003.AIRS/AMSU/HSB on the aqua mission:design,science objectives,data products,and processing systems[J].IEEE Trans Geosci Remote Sens,41(2):253-264.doi:10.1109/TGRS.2002.808356.
Bhattacharjee S,Chen J,2020.Prediction of satellite-based column CO2 concentration by combining emission inventory and LULC information[J].IEEE Trans Geosci Remote Sens,58(12):8285-8300.doi:10.1109/TGRS.2020.2985047.
Bovensmann H,Burrows J P,Buchwitz M,et al.,1999.SCIAMACHY:mission objectives and measurement modes[J].J Atmos Sci,56(2):127-150.doi:10.1175/1520-0469(1999)056lt;0127:smoammgt;2.0.co;2.
Crisp D,Pollock H R,Rosenberg R,et al.,2017.The on-orbit performance of the Orbiting Carbon Observatory-2 (OCO-2) instrument and its radiometrically calibrated products[J].Atmos Meas Tech,10(1):59-81.doi:10.5194/amt-10-59-2017.
Duan K B,Rajapakse J C,Wang H Y,et al.,2005.Multiple SVM-RFE for gene selection in cancer classification with expression data[J].IEEE Trans NanoBioscience,4(3):228-234.doi:10.1109/TNB.2005.853657.
Fujimori S,Wu W C,Doelman J,et al.,2022.Land-based climate change mitigation measures can affect agricultural markets and food security[J].Nat Food,3(2):110-121.doi:10.1038/s43016-022-00464-4.
Graven H D,Keeling R F,Piper S C,et al.,2013.Enhanced seasonal exchange of CO2 by northern ecosystems since 1960[J].Science,341(6150):1085-1089.doi:10.1126/science.1239207.
Hamazaki T,Kuze A,Kondo K,2004.Sensor system for greenhouse gas observing satellite (GOSAT)[C]//Infrared Spaceborne Remote Sensing XII.Denver,CO.SPIE.doi:10.1117/12.560589.
He C P,Ji M R,Li T,et al.,2022.Deriving full-coverage and fine-scale XCO2 across China based on OCO-2 satellite retrievals and CarbonTracker output[J].Geophys Res Lett,49(12).doi:10.1029/2022gl098435.
Hersbach H,Bell B,Berrisford P,et al.,2020.The ERA5 global reanalysis[J].Quart J Roy Meteor Soc,146:1999-2049.
Hoffmann L,Spang R,2022.An assessment of tropopause characteristics of the ERA5 and ERA-Interim meteorological reanalyses[J].Atmos Chem Phys,22(6):4019-4046.doi:10.5194/acp-22-4019-2022.
Hu K,Shen C W,Wang T Y,et al.,2024a.Overview of temporal action detection based on deep learning[J].Artif Intell Rev,57(2):26.doi:10.1007/s10462-023-10650-w.
Hu K,Zhang Q,F(xiàn)eng X Y,et al.,2024b.An interpolation and prediction algorithm for XCO2 based on multi-source time series data[J].Remote Sens,16(11):1907.doi:10.3390/rs16111907.
Hu K,Zhang Q,Gong S,et al.,2024c.A review of anthropogenic ground-level carbon emissions based on satellite data[J].IEEE J Sel Top Appl Earth Obs Remote Sens,17:8339-8357.doi:10.1109/JSTARS.2024.3355549.
皇甫曉瑛,錢惠敏,黃敏,2023.結(jié)合注意力機(jī)制的深度神經(jīng)網(wǎng)絡(luò)綜述[J].計(jì)算機(jī)與現(xiàn)代化(2):40-49,57." Huangfu X Y,Qian H M,Huang M,2023.A review of deep neural networks combined with attention mechanism[J].Comput Mod(2):40-49,57.doi:10.3969/j.issn.2096-0182.2017.06.002.(in Chinese).
Inness A,Ades M,Agustí-Panareda A,et al.,2019.The CAMS reanalysis of atmospheric composition[J].Atmos Chem Phys,19(6):3515-3556.doi:10.5194/acp-19-3515-2019.
Li J,Jia K,Wei X Q,et al.,2022.High-spatiotemporal resolution mapping of spatiotemporally continuous atmospheric CO2 concentrations over the global continent[J].Int J Appl Earth Obs Geoinf,108:102743.doi:10.1016/j.jag.2022.102743.
李琳菲,楊穎,朱志偉,等,2024.梅雨降水季節(jié)預(yù)測(cè)的多方法比較[J].大氣科學(xué)學(xué)報(bào),47(2):313-329." Li L F,Yang Y,Zhu Z W,et al.,2024.A comparative study of multiple methods for seasonal prediction of Meiyu rainfall[J].Trans Atmos Sci,47(2):313-329.doi:10.13878/j.cnki.dqkxxb.20231225020.(in Chinese).
Li T W,Wu J G,Wang T X,2023.Generating daily high-resolution and full-coverage XCO2 across China from 2015 to 2020 based on OCO-2 and CAMS data[J].Sci Total Environ,893:164921.doi:10.1016/j.scitotenv.2023.164921.
Li W,Chen Z J,Li M C,et al.,2023.Carbon emission and economic development trade-offs for optimizing land-use allocation in the Yangtze River delta,China[J].Ecol Indic,147:109950.doi:10.1016/j.ecolind.2023.109950.
李瑩,葉殿秀,高歌,等,2023.2022年夏季中國(guó)氣候特征及主要天氣氣候事件[J].大氣科學(xué)學(xué)報(bào),46(1):110-118." Li Y,Ye D X,Gao G,et al.,2023.Climate characteristics and major meteorological events in China during the summer of 2022[J].Trans Atmos Sci,46(1):110-118.doi:10.13878/j.cnki.dqkxxb.20221110007.(in Chinese).
梁周彤,唐文瀚,曾寧,等,2022.基于WRF模式的京津冀地區(qū)地表大氣CO2濃度的模擬研究[J].大氣科學(xué)學(xué)報(bào),45(3):387-396." Liang Z T,Tang W H,Zeng N,et al.,2022.Simulation of surface atmospheric CO2 concentration in Beijing-Tianjin-Hebei region based on WRF model[J].Trans Atmos Sci,45(3):387-396.doi:10.13878/j.cnki.dqkxxb.20220228018.(in Chinese).
Lin J P,Yang S,Liu Y H,et al.,2024.The urban population agglomeration capacity and its impact on economic efficiency in the Yangtze River delta[J].Environ Dev Sustain,26(6):13739-13768.doi:10.1007/s10668-023-03242-9.
Liu Y,Wang J,Yao L,et al.,2018.The TanSat mission:preliminary global observations[J].Sci Bull,63(18):1200-1207.doi:10.1016/j.scib.2018.08.004.
Liu Y P,Zheng H F,F(xiàn)eng X X,et al.,2017.Short-term traffic flow prediction with Conv-LSTM[C]//2017 9th International Conference on Wireless Communications and Signal Processing (WCSP).Nanjing.doi:10.1109/WCSP.2017.8171119.
Lü Z H,Shi Y S,Zang S Y,et al.,2020.Spatial and temporal variations of atmospheric CO2 concentration in China and its influencing factors[J].Atmosphere,11(3):231.doi:10.3390/atmos11030231.
Mustafa F,Bu L B,Wang Q,et al.,2020.Multi-year comparison of CO2 concentration from NOAA carbon tracker reanalysis model with data from GOSAT and OCO-2 over Asia[J].Remote Sens,12(15):2498.doi:10.3390/rs12152498.
ODell C W,Pavlick R,2019.The OCO-3 mission:measurement objectives and expected performance based on 1 year of simulated data[J].Atmospheric Measurement Techniques,12:2341-2370.
Pettorelli N,Vik J O,Mysterud A,et al.,2005.Using the satellite-derived NDVI to assess ecological responses to environmental change[J].Trends Ecol Evol,20(9):503-510.doi:10.1016/j.tree.2005.05.011.
Sheng M Y,Lei L P,Zeng Z C,et al.,2023.Global land 1° mapping dataset of XCO2 from satellite observations of GOSAT and OCO-2 from 2009 to 2020[J].Big Earth Data,7(1):170-190.doi:10.1080/20964471.2022.2033149.
Siabi Z,F(xiàn)alahatkar S,Alavi S J,2019.Spatial distribution of XCO2 using OCO-2 data in growing seasons[J].J Environ Manag,244:110-118.doi:10.1016/j.jenvman.2019.05.049.
Song Z J,Yang H,Huang X J,et al.,2021.The spatiotemporal pattern and influencing factors of land surface temperature change in China from 2003 to 2019[J].Int J Appl Earth Obs Geoinf,104:102537.doi:10.1016/j.jag.2021.102537.
Toon G,Blavier J F,Washenfelder R,et al.,2009.Total column carbon observing network (TCCON)[C]//Advances in Imaging.Washington:OSA.doi:10.1364/fts.2009.jma3.
Tu Q S,Hase F,Blumenstock T,et al.,2020.Intercomparison of atmospheric CO2 and CH4 abundances on regional scales in boreal areas using Copernicus Atmosphere Monitoring Service (CAMS) analysis,COllaborative Carbon Column Observing Network (COCCON) spectrometers,and Sentinel-5 Precursor satellite observations[J].Atmos Meas Tech,13(9):4751-4771.doi:10.5194/amt-13-4751-2020.
Wunch D,Toon G C,Wennberg P O,et al.,2010.Calibration of the total carbon column observing network using aircraft profile data[J].Atmos Meas Tech,3(5):1351-1362.doi:10.5194/amt-3-1351-2010.
Wunch D,Wennberg P O,Osterman G,et al.,2017.Comparisons of the orbiting carbon observatory-2 (OCO-2) XCO2 measurements with TCCON[J].Atmos Meas Tech,10(6):2209-2238.doi:10.5194/amt-10-2209-2017.
Xu Y,2020.Environmental policy and air pollution in China[M].London:Routledge.doi:10.4324/9780429452154
Yang D,Boesch H,Liu Y,et al.,2020.Toward high precision XCO2 retrievals from TanSat observations:retrieval improvement and validation against TCCON measurements[J].J Geophys Res:Atmos,125(22):e2020JD032794.doi:10.1029/2020JD032794.
Zhang H,Peng J Y,Wang R,et al.,2021.Spatial planning factors that influence CO2 emissions:a systematic literature review[J].Urban Clim,36:100809.doi:10.1016/j.uclim.2021.100809.
Zhang L F,Li T W,Wu J G,2022.Deriving gapless CO2 concentrations using a geographically weighted neural network:China,2014—2020[J].Int J Appl Earth Obs Geoinf,114:103063.doi:10.1016/j.jag.2022.103063.
Zhang M Q,Liu G J,2023.Mapping contiguous XCO2 by machine learning and analyzing the spatio-temporal variation in China from 2003 to 2019[J].Sci Total Environ,858:159588.doi:10.1016/j.scitotenv.2022.159588.
Zhang X Y,Wang F,Wang W H,et al.,2020.The development and application of satellite remote sensing for atmospheric compositions in China[J].Atmos Res,245:105056.doi:10.1016/j.atmosres.2020.105056.
Zhao M W,Yue T X,Zhang X Y,et al.,2017.Fusion of multi-source near-surface CO2 concentration data based on high accuracy surface modeling[J].Atmos Pollut Res,8(6):1170-1178.doi:10.1016/j.apr.2017.05.003.
·ARTICLE·
High-resolution spatiotemporal estimation of XCO2 concentration using carbon satellite data
HU Kai1,2,LIU Ziran1,SHAO Pengfei1,F(xiàn)ENG Xinyan1,ZHANG Qi1,WENG Liguo1,2,WANG Yuanyuan3,DI Li3,XIA Min1,2
1School of Automation,Nanjing University of Information Science and Technology,Nanjing 210044,China;
2Jiangsu Collaborative Innovation Center for Atmospheric Environment and Equipment Technology,Nanjing University of Information Science and Technology,Nanjing 210044,China;
3State Grid Henan Electric Power Company,Zhengzhou 450000,China
Abstract" Carbon dioxide (CO2) is a primary greenhouse gas,and its rising atmospheric concentration is a critical driver of climate change,contributing to extreme weather,rising sea levels,and ecosystem alterations.Remote sensing via carbon satellites provides a powerful approach for large-scale,precise CO2 monitoring;however,challenges with spatial and temporal sparsity limit the accuracy and continuity of CO2 concentration (XCO2) estimates,particularly across large regions like Chinas Yangtze River delta.To address these limitations,this study introduces the Space-Time Soft Attention Network (ST-SAN),a novel model designed to enhance the spatiotemporal resolution of XCO2 estimates derived from carbon satellite data.The model leverages multi-source datasets (including human activity,meteorological,and vegetation) alongside carbon satellite observations,achieving a seamless XCO2 dataset with a 0.05° spatial resolution,thus providing a detailed view of regional CO2 dynamics.Training the ST-SAN model on data from 2016 to 2020,the methodology employs soft attention mechanisms to prioritize relevant features across spatial and temporal dimensions,enabling more accurate XCO2 predictions.The models effectiveness was rigorously evaluated by comparing reconstructed XCO2 data with observations from the Orbiting Carbon Observatory-2 and ground-based monitoring stations,demonstrating high consistency and reliability.By integrating diverse datasets,the ST-SAN model effectively addresses the sparsity issues in satellite observations,enhancing predictive performance and offering a comprehensive framework for high-resolution CO2 estimation.These findings underscore the potential of advanced machine learning techniques to improve atmospheric monitoring and provide critical insights for climate mitigation efforts.Future research could refine this model with additional data sources,extend its applicability to varied regions,and explore long-term CO2 trends to better understand the influences of human activity and natural processes on greenhouse gas emissions.The study not only demonstrates the feasibility of high-resolution XCO2 estimation but also establishes a foundation for more accurate climate assessments and informed environmental policy.
Keywords" XCO2;reconstruction;data fusion;spatiotemporal variation
doi:10.13878/j.cnki.dqkxxb.20240620002
(責(zé)任編輯:張福穎)