馬宗禾,駱哲文,孫 鐸,劉子炎,楊睿誠
(武漢理工大學,湖北 武漢 430070)
野火通常發(fā)生在農村地區(qū)或山區(qū),監(jiān)測站點數量有限且分布不均,因而難以實現整個火災區(qū)域PM2.5的擴散方式和傳輸特性等研究?;诜抡娴拇髿饪諝赓|量模式預報在空間上具有連續(xù)覆蓋性,但分辨率較低,結果誤差較大。另外,野火PM2.5有高濃度高度變化的特點,現有的統(tǒng)計模型對于PM2.5-AOD的關系在時間和空間上無法完全解釋變化。
為解決現有野火PM2.5測算野火熱輻射高、易受風影響的難點,引入哨兵二號影像、風向等新變量;另一方面,采用機器學習算法,使用高分辨率AOD數據,對野火PM2.5進行遙感反演,以期來填補高濃度PM2.5的估算領域的空白并嘗試提高最終PM2.5反演結果的精度。
2019年9月以來澳大利亞東海岸森林火災引起國際社會廣泛關注,其產生的大量野火煙霧已環(huán)繞地球半周。因此,亟需高分辨率野火PM2.5濃度數據為環(huán)境科學、生態(tài)經濟發(fā)展提供數據支撐,同時對公共衛(wèi)生和流行病學的研究也有重要意義。
圖1
2.2.1 數據處理
由于各類數據的來源、數據類型、空間分辨率不盡相同,要對各類數據進行預處理。模型的時間分辨率是24h,所搜集的數據大多為每日均值,對于非標準格式的數據按照數學與統(tǒng)計方法進行處理與驗證。
(1)填補AOD缺失:檢查AOD缺失,將Aqua和Terra AOD進行融合,再以AO據為基準建立一公里格網。
(2)對哨兵2號數據,計算改進歸一化燃燒指數(NBRT),分離燃燒區(qū)和非燃燒區(qū)。
式中,NIR波段范圍0.76-0.9μm;SWIR波段范圍2.08-2.35μm;Thermal波段10.4~12.5μm。
接著采用雙線性內插方法對其做降尺度處理,再用1*1km格網對其重采樣。
(3)對于MODIS NDVI數據,因其分辨率比較低,用Aggregation函數對其進行數據整合,保證計算過程是一公里格網的均值。
(4)對每個MODIS火點數據創(chuàng)建多級緩沖區(qū),計算每個網格單元MODIS的火點數,以15km緩沖區(qū)進行火點統(tǒng)計。
(5)使用最鄰近分類算法為每個氣象監(jiān)測站點分配氣象字段,從而獲取區(qū)域內氣象要素的連續(xù)表面,然后使用反距離加權方法插值到1*1km網格中。
(6)對于土地利用數據,以每個PM2.5監(jiān)測站點為中心,建立1*1km的緩沖區(qū),平均森林覆蓋率、高程值、道路長度到緩沖區(qū),并計算每個緩沖區(qū)的人口密度。
(7)對于PM2.5數據,將某一網格單元內所有PM2.5站點同一天的數據進行平均后賦值給該網格單元。
(8)對各因子與PM2.5濃度做多變量相關分析,并計算相關系數,移除會造成顯著共線性的變量,選取最優(yōu)預測變量。
2.2.2 模型構建
剔除了數據的缺失值及異常值后,將數據集按照7:3的比例隨機劃分為訓練集和測試集。訓練集用于建立模型,測試集用于精度評價。
我們使用隨機森林對訓練集進行構建模型。隨機森林具有以下優(yōu)點:運算量小,但預測精度高;可以高效的處理非線性過程;預測結果對非平衡數據和缺失數據較穩(wěn)健。我們將預處理后的相關因子作為模型的特征,監(jiān)測站點的PM2.5濃度作為監(jiān)督值,使用Python的Scikit-Learn模塊的算法訓練。同時幫助我們判斷本研究加入的哨兵2號數據、風向數據等是否真的提高了模型精度。
2.2.3 模型驗證
用先前劃分的測試集對建立的模型進行驗證,在此階段中,我們采用了模型預測值與地面觀測值之間的決定系0數(R2)、平均預測誤差(MPE)、均方根預測誤差(RMSE)、相對預測誤差(RPE)等統(tǒng)計指標來對模型擬合與交叉驗證結果進行比較,從而對模型表現和過度擬合現象進行評估。
2.2.4 模型應用
(1)澳大利亞野火煙霧PM2.5時空特征分析。因為地面監(jiān)測站點的稀疏性,所以僅靠地面監(jiān)測站的數據無法得知澳洲森林火災中煙霧PM2.5的整體變化。而我們建立的模型可以反演澳洲野火日均尺度PM2.5的濃度,研究澳洲野火PM2.5濃度的空間分布特征,并對其形成原因進行探討;同時會研究時間變化特征,并基于日時間序列和月均時間序列,分析澳洲野火期間PM2.5污染的時間變化趨勢。
(2)人口野火煙霧PM2.5暴露風險評估?;诮⒌哪P蛯馂钠陂g的居民健康風險進行評估。我們將研究期分為以下三個子階段:“火災前”時期,即研究區(qū)域的PM2.5水平正常;“火災中”時期,即研究區(qū)域內大多數AQ站中PM2.5的濃度急劇增加時;“火災后”時期,即PM2.5濃度恢復到正常水平。在不同的時期內,我們將分別用空氣質量濃度、人口暴露強度、人口加權濃度3種指標來對人口PM2.5暴露風險進行評估。
(3)野火顆粒物與相關疾病致死率關系研究。我們將澳大利亞全境范圍的AOD與PM2.5濃度時空分布情況與WHO提供的相關疾病的致死率健康數據結合,通過反距離權重(IDW)插值與提取等方法得到澳大利亞森林火災野火顆粒物與相關疾病致死率關系,從而對二者的關系進行分析與研究,為環(huán)境科學、生態(tài)經濟發(fā)展提供數據支撐,對公共衛(wèi)生和流行病學的研究與決策提供有價值的建議。
由于野火PM2.5相對于城市PM2.5更難估算,傳統(tǒng)的建模變量不夠,本文采用多源數據進行PM2.5濃度空間估算,除常用的AOD數據、氣象數據(相對濕度、風速和行星邊界層)、土地利用數據外,引入火點數據、哨兵二號數據和風向數據等輔助數據。既利用了AOD數據對于PM2.5良好相關關系,同時又考慮了野火煙霧所產生的高濃度高度變化的PM2.5難以被有效估算的問題。已有研究表明,風向對于PM2.5的分布有重要影響,但由于風向數據分析的復雜性,多數PM2.5濃度估算的研究沒有將其考慮在內,因此,為了提高結果數據的準確性,加入風向數據,結合其他多源數據對PM2.5濃度估算的結果進行對比驗證。
采用1km分辨率的AOD數據作為基礎,將其他因素數據進行重采樣配準到該數據上,保證高空間分辨率。MAIAC算法使用時間序列分析并同時處理固定的25*25 km2塊中的像素組,以得出表面雙向反射率分布函數和氣溶膠參數,顯示出增強的對比局部尺度氣溶膠變化的能力,并提高了云雪探測和氣溶膠檢索的質量。
我們對隨機森林算法進行優(yōu)化,解決PM2.5-AOD關系的時空異質性問題,以提高模型的估算精度。對PM2.5人口暴露風險,我們利用隨機森林優(yōu)化模型估算的高精度PM2.5濃度空間分布數據進行評估,且利用多指標評價方法從多個角度對澳大利亞的PM2.5人口暴露風險進行評估。該評估方式的可信度高。
2020年7月28日,世界自然基金會(WWF)發(fā)布一份報告,顯示2019年到2020年發(fā)生的澳大利亞叢林大火,造成了近30億只動物死亡或流離失所。面對自19世紀中葉以來最嚴重的火災,數據監(jiān)測方法與管理體系在不斷蔓延的火勢面前也顯得不盡人意。因此,針對本次火災的研究不僅具有深刻的現實意義,更是對于澳大利亞與整個國際社會的火災監(jiān)管體系有著深遠影響。我們的研究模型旨在為解決監(jiān)測與反演方法中現存部分缺陷并設法為相關監(jiān)管提出輔助決策與分析建議,而研究成果的應用則深化現實意義,在澳大利亞野火煙霧PM2.5時空特征分析、人口野火煙霧PM2.5暴露風險評估、野火顆粒物與相關疾病致死率關系研究等方面孵化研究成果。