• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于EOF 迭代的自動(dòng)氣象站氣溫觀測(cè)資料修復(fù)方法

      2022-04-15 09:33:46沈王彬李昕秦正坤張冰
      大氣科學(xué) 2022年2期
      關(guān)鍵詞:迭代法插值站點(diǎn)

      沈王彬 李昕 秦正坤 張冰

      1 南京信息工程大學(xué)大氣科學(xué)學(xué)院,南京 210044

      2 南京信息工程大學(xué)資料同化研究與應(yīng)用聯(lián)合中心,南京 210044

      3 南京氣象科技創(chuàng)新研究院/江蘇省氣象科學(xué)研究所,南京 210009

      1 引言

      大氣邊界層是下墊面與自由大氣進(jìn)行物質(zhì)與能量交換的重要場(chǎng)所,在大氣邊界層中時(shí)刻進(jìn)行著諸如湍流動(dòng)量和熱量交換等過程,一些常見的天氣現(xiàn)象如霧和降水以及一些爆發(fā)性氣象災(zāi)害如暴雨和沙塵暴與邊界層中的物理過程有密切聯(lián)系。地表熱力通量和水汽通量通過邊界層上傳自由大氣,影響天氣過程演變。因此,地面觀測(cè)資料在天氣預(yù)報(bào)預(yù)警中具有重要作用。

      隨著觀測(cè)技術(shù)的發(fā)展,目前我國已經(jīng)建立了巨大且密集的地面氣象觀測(cè)網(wǎng)絡(luò),全國已建成約七萬個(gè)自動(dòng)氣象觀測(cè)站,自動(dòng)氣象觀測(cè)站能夠定時(shí)、定點(diǎn)的觀測(cè)和記錄地面氣象信息,并且能夠在復(fù)雜的地形下進(jìn)行無人觀測(cè)(張慧, 2012)。但是自動(dòng)化氣象觀測(cè)事業(yè)的發(fā)展同時(shí)也帶來了些許問題,張穎超等(2017)、徐浩然(2019)指出隨著觀測(cè)自動(dòng)化的實(shí)現(xiàn),原有的業(yè)務(wù)模式發(fā)生改變,但是地面觀測(cè)技術(shù)的不穩(wěn)定導(dǎo)致地面觀測(cè)資料更容易出現(xiàn)質(zhì)量問題,一方面眾多臺(tái)站的觀測(cè)資料往往由于采集、傳輸或儀器自身的系統(tǒng)問題,不可能達(dá)到完全正確無誤,另一方面,區(qū)域自動(dòng)站資料的質(zhì)量控制和評(píng)估工作較為滯后,直接影響了資料在預(yù)報(bào)預(yù)測(cè)業(yè)務(wù)中的使用。

      為了提高區(qū)域自動(dòng)氣象站觀測(cè)的數(shù)據(jù)質(zhì)量,需要通過質(zhì)量控制來保證數(shù)據(jù)質(zhì)量(Lorenc and Hammon, 1988)。近十年來,我國氣象工作者在實(shí)時(shí)觀測(cè)資料自動(dòng)質(zhì)量控制方面做了大量的研究工作。國內(nèi)外有關(guān)地面氣象資料的常規(guī)質(zhì)量控制方法主要有氣候?qū)W界限值檢查、臺(tái)站或區(qū)域極值檢查、要素間內(nèi)部一致性檢查、時(shí)間一致性檢查以及空間一致性檢查等方法。王海軍等(2007)、陶士偉等(2009)、陳興旺(2011)、趙煜飛等(2011)都利用常規(guī)質(zhì)量控制方法對(duì)我國的地面觀測(cè)資料進(jìn)行了質(zhì)量控制試驗(yàn)。李良富等(2006)和葉小嶺等(2016)還嘗試了利用人工智能的黑板模型和基因表達(dá)式編程方法進(jìn)行了質(zhì)量控制。基于空間分析方法EOF(Empirical Orthogonal Function)分解方法,Qin et al.(2010)和邵宇行等(2021)針對(duì)全國高時(shí)間和空間分辨率的地面自動(dòng)站觀測(cè)資料,對(duì)前人提出的基于EOF 分析的質(zhì)量控制方法進(jìn)行適應(yīng)性的調(diào)整,并利用我國中東部的自動(dòng)站觀測(cè)資料進(jìn)行實(shí)際質(zhì)量控制試驗(yàn),發(fā)現(xiàn)該方法可以很好適用于高時(shí)空分辨率的地面自動(dòng)站觀測(cè)資料。

      錯(cuò)誤的自動(dòng)站觀測(cè)資料會(huì)對(duì)天氣預(yù)報(bào)和氣候變化研究帶來嚴(yán)重的影響,根據(jù)研究目的不同,氣象學(xué)家對(duì)錯(cuò)誤資料的處理方法也不盡相同。氣候研究往往是對(duì)資料的穩(wěn)定性提出較高的要求,如何把誤差的大小控制在氣象業(yè)務(wù)所允許的范圍內(nèi),提供一個(gè)在時(shí)間和空間上更加完整的觀測(cè)資料數(shù)據(jù)集,以確保歷史觀測(cè)資料的連續(xù)性是自動(dòng)站觀測(cè)資料應(yīng)用上面臨的問題(王曉春等,1994;江志紅等,2008;曹麗娟和嚴(yán)中偉, 2011)。而在資料同化應(yīng)用中,為了保證同化增量的合理性,往往傾向于直接剔除可疑的觀測(cè)資料(薛紀(jì)善, 2009),但錯(cuò)誤資料也并非完全不可利用,在進(jìn)行有效訂正的前提下,通過對(duì)訂正后資料進(jìn)行合理的、定量化的觀測(cè)誤差調(diào)整,將使得這些資料在模式中的應(yīng)用變?yōu)榭赡堋?/p>

      資料序列的訂正方法研究是國內(nèi)外學(xué)者所共同關(guān)注的問題之一,并已有不少研究。根據(jù)方法的原理不同,目前的錯(cuò)誤資料或者缺測(cè)資料的修復(fù)方法大致可以分為以下三類:一是利用觀測(cè)資料本身的規(guī)律或者不同氣象變量之間的物理關(guān)系來進(jìn)行資料修復(fù),多用于氣候資料(Annan and Hargreaves,2013; 李天祺等, 2015; 周芳成等, 2021),或者規(guī)律性 顯 著 的 資 料(G?ttsche and Olesen et al., 2001;Duan et al., 2012);二是利用隨機(jī)模型方法,利用擾動(dòng)的隨機(jī)樣本之間的相似性來修復(fù)數(shù)據(jù),比如神經(jīng)網(wǎng)絡(luò)方法(Wu et al., 2019)、自組織映射法和期 望 最 大 化 法 等(Sorjamaa and Lendasse, 2007;Zhao et al., 2020);三是根據(jù)變量的時(shí)空特征,利用最優(yōu)化和多維統(tǒng)計(jì)方法來修復(fù)資料,比如最優(yōu)插值方法(朱江等, 1995; Everson et al., 1997)、經(jīng)驗(yàn)正交函數(shù)(EOF)分解方法(Alvera-Azcárate et al.,2009; 盛崢等, 2009; Shen et al., 2019)。

      同時(shí),研究也發(fā)現(xiàn)沒有絕對(duì)最優(yōu)的空間內(nèi)插方法,必須對(duì)所研究的數(shù)據(jù)進(jìn)行空間探索分析,根據(jù)數(shù)據(jù)的特點(diǎn),選擇相應(yīng)方法,對(duì)某一種氣象要素合適的插值方法未必對(duì)另一種氣象要素合適(蔡彥楓等, 2015)。我國目前已經(jīng)建成了近七萬個(gè)地面自動(dòng)觀測(cè)站,高時(shí)空分辨率的地面自動(dòng)站資料最大的特征就是小尺度特征強(qiáng),時(shí)空變率大,容易出現(xiàn)極值情況,尤其是對(duì)于天氣變化尺度的研究,僅依賴于溫度的日變化等變量固有的規(guī)律性特征進(jìn)行修復(fù)容易出現(xiàn)較大的誤差,而較多的極值情況也導(dǎo)致了基于隨機(jī)性的修復(fù)方法存在一定的不足,所以依賴于周邊資料來修復(fù)地面站溫度資料是一種比較可行的方法。

      最優(yōu)化和多維分析方法都可以依據(jù)周邊資料來修復(fù)單個(gè)錯(cuò)誤資料,但是最優(yōu)化方法往往需要資料的誤差等先驗(yàn)信息,所以基于EOF 等多維分析方法的錯(cuò)誤資料修復(fù)方法就成為更為簡(jiǎn)單易行的方法。基于EOF 分析的時(shí)空分離的特征,Alvera-Azcárate et al.(2009)和Shen et al.(2019)都提出了基于EOF 空間分析方法的錯(cuò)誤資料修復(fù)方法。EOF 方法的優(yōu)點(diǎn)在于利用空間降維技術(shù)將原始變量場(chǎng)的時(shí)空結(jié)構(gòu)進(jìn)行正交分解,得到為數(shù)很少的不相關(guān)典型模態(tài)來代替原始變量場(chǎng)。EOF 方法提取的典型模態(tài)存在兩個(gè)重要特征,一是模態(tài)是在考慮了變量場(chǎng)時(shí)間和空間變化特征后確定的,不容易受到少數(shù)極值資料的影響,這種特征對(duì)于提取小尺度信號(hào)強(qiáng)的地表信息時(shí)尤為重要;二是EOF 方法提取的各個(gè)模態(tài)是相互正交的,各個(gè)模態(tài)及其對(duì)應(yīng)的系數(shù)在處理過程中不會(huì)相互影響,所以可以考慮通過迭代的方法逐步確定各個(gè)模態(tài)的系數(shù),不需要考慮不同模態(tài)系數(shù)之間的相互影響。利用EOF 分析方法的這兩個(gè)特征,我們就可以建立一個(gè)基于迭代的錯(cuò)誤資料修復(fù)方法。首先利用EOF 分析方法將研究區(qū)域的大氣溫度分離為不同尺度的空間模態(tài),然后分別針對(duì)代表不同時(shí)空尺度的EOF 模態(tài),通過迭代的方法消除錯(cuò)誤資料對(duì)EOF 分析模態(tài)的影響。由于個(gè)別錯(cuò)誤資料不會(huì)影響各個(gè)模態(tài)所對(duì)應(yīng)的時(shí)間系數(shù),結(jié)合迭代修正的EOF 分析模態(tài)和穩(wěn)定的時(shí)間系數(shù),我們就可以具有很好的時(shí)空連續(xù)性的修復(fù)結(jié)果。

      本文將針對(duì)全國自動(dòng)氣象站觀測(cè)資料高時(shí)空分辨率的特征,在有效識(shí)別自動(dòng)氣象站異常觀測(cè)資料的基礎(chǔ)上,利用EOF 分析方法,建立一個(gè)新的基于EOF 迭代方法的錯(cuò)誤資料修復(fù)方法,并對(duì)中國東部自動(dòng)站氣溫觀測(cè)資料進(jìn)行了錯(cuò)誤觀測(cè)資料的修復(fù)試驗(yàn),希望為自動(dòng)氣象站錯(cuò)誤觀測(cè)數(shù)據(jù)的修復(fù)提供科學(xué)依據(jù)。

      2 資料和方法

      2.1 數(shù)據(jù)說明

      本文選取的資料為江蘇省氣象局通過全國綜合氣象信息共享平臺(tái)CIMISS(China Integrated Meteorological Information Service System)數(shù)據(jù)庫實(shí)時(shí)接收的2019 年12 月1 日00:00 至7 日23:00(北京時(shí),下同)的逐小時(shí)地面自動(dòng)站觀測(cè)資料,共168 個(gè)時(shí)次的地面觀測(cè)站溫度觀測(cè)資料。選取的研究區(qū)域?yàn)椋?9°N~39°N,113°E~123°E)。高水平分辨率是自動(dòng)站觀測(cè)資料的主要特點(diǎn),圖1 給出了自動(dòng)站站點(diǎn)的空間分布特征,其中站點(diǎn)分布最密的主要是在江蘇、山東和安徽三個(gè)省份。

      圖1 地面自動(dòng)觀測(cè)站點(diǎn)(黑色點(diǎn))水平空間分布Fig.1 Spatial distribution of ground automatic observation stations(black points)

      由于觀測(cè)資料中存在大量缺測(cè)資料,為了保證研究結(jié)果的普遍性,我們需要對(duì)某些時(shí)刻缺測(cè)值進(jìn)行時(shí)間三次樣條插值,但是由于某些站缺測(cè)時(shí)刻過多導(dǎo)致時(shí)間插值后存在極端異常值。所以為了盡可能的消除時(shí)間插值對(duì)檢測(cè)結(jié)果的影響,我們首先對(duì)觀測(cè)資料進(jìn)行篩選;篩選的條件有:(1)前五個(gè)時(shí)次無缺測(cè),(2)后五個(gè)時(shí)刻無缺測(cè)以及(3)168 個(gè)時(shí)次至少有1/10 資料無缺測(cè);最終該區(qū)域包含4983 個(gè)觀測(cè)站。

      2.2 質(zhì)量控制方法

      對(duì)自動(dòng)氣象站氣溫觀測(cè)資料進(jìn)行質(zhì)量控制,準(zhǔn)確的識(shí)別出其中錯(cuò)誤的資料是修復(fù)錯(cuò)誤資料的前提。為此,邵宇行等人(2021)提出了基于EOF 的高時(shí)空分辨率自動(dòng)站溫度觀測(cè)資料質(zhì)量控制方法。按照該方法首先利用傳統(tǒng)質(zhì)量控制方法對(duì)資料進(jìn)行了預(yù)處理,去除了數(shù)據(jù)中明顯存在的誤差。在此基礎(chǔ)上,以ECWMF(European Center for Medium-Range Weather Forecasts)的ERA5 2 m 溫度再分析資料作為背景場(chǎng)信息,使用EOF 質(zhì)量控制方法對(duì)篩選出的4983 個(gè)站點(diǎn)進(jìn)行了質(zhì)量控制。

      圖2 給出了基于該質(zhì)量控制方法識(shí)別出的168個(gè)時(shí)次的錯(cuò)誤資料個(gè)數(shù)曲線。平均剔除資料為每日48 個(gè),剔除率約為0.96%,大部分時(shí)間錯(cuò)誤資料量都是穩(wěn)定在50 個(gè)左右,只是在第136 時(shí)次和第146 時(shí)次錯(cuò)誤資料個(gè)數(shù)異常偏多。

      圖2 2019 年12 月1~7 日質(zhì)量控制方法剔除資料量的時(shí)間變化曲線Fig.2 Hourly data count of abnormal data detected by the quality control method during December 1–7, 2019

      為了明確剔除資料的正確性,圖3 給出了2019 年12 月1 日11:00 四個(gè)離群觀測(cè)站點(diǎn)及其周圍站點(diǎn)的氣溫分布情況,黑色陰影表示地形高度。該時(shí)次一共識(shí)別出89 個(gè)離群站點(diǎn),主要分布在安徽省的中部及南部。根據(jù)四個(gè)錯(cuò)誤站點(diǎn)以及周圍站點(diǎn)的溫度分布可以看出,錯(cuò)誤站點(diǎn)在第36 個(gè)時(shí)次相較于周圍站點(diǎn)觀測(cè)溫度均為異常高值,因此可以認(rèn)定基于EOF 的質(zhì)量控制方法識(shí)別的錯(cuò)誤資料是合理的。雖然質(zhì)量控制方法能夠剔除絕大部分溫度異常的站點(diǎn),但是依然可能存在漏檢現(xiàn)象,圖3 中的區(qū)域中部(30.72°N,116.45°E)可以看到存在一個(gè)明顯低于周邊站點(diǎn)溫度的資料,這可能還需要更長(zhǎng)時(shí)間的資料來評(píng)估研究區(qū)域地面溫度的空間連續(xù)性特征,后續(xù)研究中我們將引入更長(zhǎng)時(shí)間資料來完善目前的質(zhì)量控制方法。

      圖3 2019 年12 月1 日11:00(第36 時(shí) 次)局部溫度數(shù) 值(單位:°C)。圖中陰影表示地形高度(單位:m),紅色為剔除站點(diǎn)Fig.3 Spatial distribution of the observed temperature (units: °C) at 1100 BJT (Beijing time) December 1, 2019 (36th hour). The shading indicates the terrain (units: m) and the red dots represent the abnormal stations

      從錯(cuò)誤站點(diǎn)的識(shí)別結(jié)果可以看出,自動(dòng)站觀測(cè)資料在每個(gè)時(shí)刻均存在50 個(gè)左右的錯(cuò)誤資料,在數(shù)值天氣預(yù)報(bào)需求日益精細(xì)化的背景下,錯(cuò)誤資料會(huì)對(duì)天氣預(yù)報(bào)帶來很多消極的影響。因此,在對(duì)錯(cuò)誤站點(diǎn)進(jìn)行準(zhǔn)確識(shí)別的基礎(chǔ)上,本研究的主要的目的是對(duì)錯(cuò)誤氣溫資料進(jìn)行準(zhǔn)確的修復(fù)。

      2.3 地面自動(dòng)站錯(cuò)誤資料修復(fù)方法

      在利用前期質(zhì)量控制方法有效識(shí)別錯(cuò)誤的氣溫觀測(cè)資料基礎(chǔ)上,我們將嘗試對(duì)錯(cuò)誤資料進(jìn)行修復(fù)研究。為了不失一般性,我們將嘗試修復(fù)其中任選的一個(gè)錯(cuò)誤觀測(cè)站s的氣溫觀測(cè)資料。

      高時(shí)空分辨率的地面自動(dòng)站溫度觀測(cè)資料也具有時(shí)空變率強(qiáng)的特點(diǎn),所以基于變量規(guī)律性特征或相似樣本的修復(fù)方法存在一定的不足,因此利用周邊觀測(cè)信息修復(fù)某個(gè)站點(diǎn)的錯(cuò)誤資料最為可行?;谧顑?yōu)插值方法和基于多維分析方法的修復(fù)方法是最常用的基于周邊觀測(cè)信息修復(fù)單個(gè)觀測(cè)資料的方法。這里我們分別選用了兩類修復(fù)方法,一是基于Cressman 空間插值方法的修復(fù)方法,二是利用Shen et al.(2019)建立的基于EOF 分析方法的迭代修復(fù)方法。

      2.3.1 基于Cressman 空間插值修復(fù)方法

      Cressman 插值方法是一種比較經(jīng)典的非規(guī)則格點(diǎn)空間插值方法(Cressman, 1959),該方法的基本原理是基于相鄰越近的站點(diǎn)在空間分布上具有越相近特征的假設(shè),由于地面自動(dòng)站高空間分辨率的特點(diǎn),因此利用錯(cuò)誤站點(diǎn)周圍正確的氣溫觀測(cè)資料,通過空間插值方法可以獲得該點(diǎn)的觀測(cè)信息。該方法的基本形式如下:

      其中,fi是第i個(gè)需要被修復(fù)的觀測(cè)站點(diǎn)的氣溫值,W(Di)是Cressman 權(quán)重系數(shù),其形式為

      式中,R為影響半徑,這里經(jīng)驗(yàn)的設(shè)定為0.75°,Di為錯(cuò)誤站點(diǎn)與周圍正確觀測(cè)站點(diǎn)的距離。由權(quán)重函數(shù)可以看出,距離被修復(fù)的點(diǎn)越近的點(diǎn)權(quán)重函數(shù)越大,符合Cressman 插值基本原理。

      2.3.2 基于EOF 迭代修復(fù)方法

      基于EOF 的迭代修復(fù)方法首先是建立用于EOF 分析的數(shù)據(jù)矩陣。假定地面站s點(diǎn)被檢測(cè)為錯(cuò)誤觀測(cè)站,再選取空間內(nèi)所有觀測(cè)站的觀測(cè)資料,剔除其中已經(jīng)檢測(cè)的所有錯(cuò)誤氣溫觀測(cè)資料,剩余觀測(cè)站數(shù)記為n??紤]到地面溫度的日變化,對(duì)于已選的n個(gè)觀測(cè)點(diǎn),選擇每個(gè)觀測(cè)點(diǎn)上當(dāng)日連續(xù)24 個(gè)時(shí)次的逐小時(shí)觀測(cè)數(shù)據(jù),假定修復(fù)某觀測(cè)站第12 時(shí)次的氣溫觀測(cè)資料,那么這里的24 個(gè)時(shí)次選為:當(dāng)日00:00~23:00 連續(xù)24 個(gè)時(shí)次的觀測(cè)氣溫,記為Ti, j,其中i=1,2,···,24 表示一共選取24個(gè)時(shí)次的觀測(cè)資料,j=n表示一共選取n個(gè)站點(diǎn)進(jìn)行重構(gòu)。

      最終用于修復(fù)的數(shù)據(jù)矩陣可以表示為Am×n:

      其中,m=24,代表所選的24 個(gè)時(shí)次,假設(shè)其中第x個(gè)時(shí)次,第s觀測(cè)點(diǎn)Tx,s為錯(cuò)誤資料,也是用于重構(gòu)的觀測(cè)點(diǎn)。為了增強(qiáng)錯(cuò)誤資料與其周邊資料點(diǎn)之間的小尺度異常特征,可以設(shè)Tx,s=0。對(duì)上述矩陣A進(jìn)行EOF 分解,我們可以得到:

      式中,Vk一般稱為模態(tài)向量,而Zk則是系數(shù)向量,k代表第k個(gè)模態(tài),因?yàn)樗x的觀測(cè)站數(shù)肯定是大于時(shí)次數(shù),所以EOF 分析獲得的模態(tài)數(shù)最多為m個(gè)。

      由于EOF 第一模態(tài)提取的是資料的平均特征,所以有理由認(rèn)為第一模態(tài)不會(huì)包含異常點(diǎn)0 值的信息,那么利用第一模態(tài)進(jìn)行重構(gòu)就可以得到:

      獲得準(zhǔn)確的第一模態(tài)信息是保證方法修復(fù)效果的前提條件。雖然0 值的異常信息不會(huì)被包含到第一模態(tài)中,但是0 值仍然可能使得應(yīng)有的第一模態(tài)信息被分散到其他模態(tài)中。因此需要通過迭代的方式逐步完善第一模態(tài)所代表的平均特征。

      在獲得Tx1,s后,我們將該值帶入到原來的數(shù)據(jù)矩陣,組成新的數(shù)據(jù)矩陣A1,即:

      對(duì)矩陣A1再次進(jìn)行EOF 分解可得:

      同樣獲得基于第一模態(tài)重構(gòu)獲得的s點(diǎn)氣溫,即:

      圖4 2019年12月4日00:00~23:00(a)用來重構(gòu)的氣溫分布(單位:°C)以及(b)隨迭代次數(shù)的變化曲線Fig.4 (a) Spatial distribution of temperature (units: °C) for reconstruction and (b) variation of with the number of iterations for station s from 0000 BJT to 2300 BJT on December 4,2019

      實(shí)現(xiàn)了第x個(gè)時(shí)次s點(diǎn)氣溫第一模態(tài)特征完全再現(xiàn)的基礎(chǔ)上,我們繼續(xù)提取第二模態(tài)的信息。經(jīng)過t1次迭代后,構(gòu)造的新的數(shù)據(jù)矩陣為At1為

      對(duì)矩陣At1進(jìn)行EOF 分解,并利用前兩個(gè)模態(tài)重構(gòu)s點(diǎn)地面溫度:

      從前面的分析可以知道,我們已經(jīng)獲得了Tx,s穩(wěn)定的第一模態(tài)信息,并構(gòu)造了新的數(shù)據(jù)矩陣,這等同于將除第1 模態(tài)外的其他模態(tài)分量設(shè)為0,簡(jiǎn)單的重復(fù)上述迭代過程,我們可以獲得具有前兩個(gè)模態(tài)準(zhǔn)確信息的T。同樣通過對(duì)更多模態(tài)進(jìn)行上述迭代過程,我們可以依據(jù)EOF 提供的周邊觀測(cè)點(diǎn)信息和其它未受干擾的通道觀測(cè)信息的約束條件下,獲取包含盡可能多正確觀測(cè)信息。

      理論上可以對(duì)所有模態(tài)進(jìn)行提取,所以圖5 也給出了不同模態(tài)迭代過程中誤差的變化曲線,圖中不同顏色分別代表不同的模態(tài)??梢钥吹?,前七個(gè)主要模態(tài)迭代結(jié)束后,重構(gòu)值趨于穩(wěn)定,此時(shí)誤差在0.5°C 左右。繼續(xù)對(duì)剩余的模態(tài)進(jìn)行提取,可以

      圖5 重構(gòu)過程中觀測(cè)值與重構(gòu)值的差隨迭代次數(shù)的變化曲線(單位:°C)。不同顏色分別代表不同的模態(tài)Fig.5 Temperature differences between the observed and the reconstructed temperature varying with the number of iterations (units: °C). Different colors represent different modes

      看到,由于剩余模態(tài)包含一些小尺度的氣溫場(chǎng)信息,因此重構(gòu)誤差曲線出現(xiàn)了一些波動(dòng),但是當(dāng)所有模態(tài)均被提取后,重構(gòu)誤差小于0.1°C。

      3 結(jié)果與分析

      3.1 重構(gòu)方法精度分析

      在新的修復(fù)方法適用之前,應(yīng)該對(duì)該方法的修復(fù)精度進(jìn)行評(píng)估。首先選取單個(gè)時(shí)刻的氣溫觀測(cè)資料中的正確資料作為驗(yàn)證數(shù)據(jù)。圖6 給出了2019年12 月4 日14:00(第87 個(gè)時(shí)次)用EOF 質(zhì)量控制方法識(shí)別出的錯(cuò)誤站點(diǎn)的分布??梢钥吹?,該時(shí)次一共出現(xiàn)19 個(gè)錯(cuò)誤站點(diǎn)。

      圖6 2019 年12 月4 日14:00(第87 個(gè)時(shí)次)EOF 質(zhì)量控制方法識(shí)別出的錯(cuò)誤站點(diǎn)(紅色圓點(diǎn))分布Fig.6 Spatial distribution of abnormal data (red points) at 1400 BJT December 4, 2019 (87th hour)

      對(duì)該時(shí)刻所有正確資料逐個(gè)進(jìn)行重構(gòu),將重構(gòu)結(jié)果與觀測(cè)進(jìn)行對(duì)比,并統(tǒng)計(jì)其均方根誤差可以有效的驗(yàn)證重構(gòu)方法的精度。均方根誤差的計(jì)算公式如下:

      其中,n表示選取的站點(diǎn)數(shù),T為站點(diǎn)的觀測(cè)氣?溫值,T為重構(gòu)得到的站點(diǎn)氣溫。若均方根誤差越小,則表明重構(gòu)結(jié)果精度更高。

      圖7 給出了2019 年12 月4 日14:00(第87 個(gè)時(shí)次)正確觀測(cè)氣溫、兩種方法重構(gòu)的氣溫分布以及觀測(cè)與重構(gòu)的誤差(觀測(cè)減去重構(gòu))。從自動(dòng)站正確觀測(cè)資料的分布可以看到,自動(dòng)站空間分辨率較高,因此能很好分辨更多小尺度的溫度變化特征??臻g分布形態(tài)也是評(píng)價(jià)插值方法的重要方面,對(duì)比基于EOF 迭代法和Cressman 插值法得到的氣溫分布,可以看到,EOF 迭代法重構(gòu)的氣溫與觀測(cè)非常接近,重構(gòu)場(chǎng)不僅能準(zhǔn)確的描述氣溫觀測(cè)的空間特征,對(duì)于觀測(cè)中存在的一些極值也能很好的還原,這是由于EOF 方法考慮了變量場(chǎng)時(shí)間和空間變化特征,不容易受到少數(shù)極值資料的干擾,也不易受觀測(cè)站點(diǎn)分布的疏密程度和不均勻性的影響。而Cressman 插值法得到的重構(gòu)場(chǎng)只能大致反映觀測(cè)氣溫的特征,但是在極值和極值附近區(qū)域重構(gòu)值與觀測(cè)存在較大差異,原因是Cressman 方法只考慮周圍站點(diǎn)的距離來確定其權(quán)重, 而不考慮它們之間的空間相關(guān)性,即是站點(diǎn)距離越近則變量值越大,分析值就越靠近,從而在極值及其附近區(qū)域出現(xiàn)偏向的特征。統(tǒng)計(jì)結(jié)果表明EOF 迭代法的重構(gòu)均方根誤差為0.41°C,而Cressman 插值的重構(gòu)均方根誤差為1.25°C,遠(yuǎn)大于EOF 迭代法,從重構(gòu)誤差的分布上可以看到,EOF 迭代法的重構(gòu)誤差基本在0.5°C 以內(nèi),并且誤差的分布比較隨機(jī),與氣溫本身高低無關(guān)。Cressman 插值重構(gòu)的誤差較高,尤其在地形變化強(qiáng)烈的區(qū)域附近,如安徽省的大別山以及黃山附近。由于地形影響,氣溫在大地形附近出現(xiàn)了較大溫度梯度,但是Cressman 插值僅考慮測(cè)站之間的距離,不能結(jié)合觀測(cè)站之間的空間相關(guān)性,因此插值結(jié)果誤差較大。

      圖7 2019 年12 月4 日14:00(第87 個(gè)時(shí)次)觀測(cè)氣溫、重構(gòu)氣溫以及誤差(觀測(cè)減去重構(gòu))的分布(單位:°C):(a)觀測(cè)氣溫;(b)EOF 迭代法重構(gòu)氣溫;(c)EOF 迭代法重構(gòu)氣溫的誤差;(d)Cressman 插值法重構(gòu)得到的氣溫;(e) Cressman 插值法重構(gòu)氣溫的誤差Fig.7 Spatial distributions (units: °C) of observed and restored temperature and their difference distribution at 1400 BJT December 4, 2019 (87th hour): (a) Observed temperature; (b) restored temperature of EOF method; (c) restoration error of EOF method; (d) reconstructed temperature of Cressman interpolation method; (e) reconstruction error of Cressman interpolation method

      為了增大樣本數(shù)來提高統(tǒng)計(jì)可信度,我們又選擇了2019 年12 月1~7 日 共168 個(gè)時(shí)次,共計(jì)808260 個(gè)正確的氣溫觀測(cè),分別使用EOF 迭代法和Cressman 插值法進(jìn)行重構(gòu)。經(jīng)統(tǒng)計(jì),EOF 迭代法和的重構(gòu)均方根誤差分別為0.48°C 和1.55°C,Cressman 插值的誤差遠(yuǎn)大于EOF 迭代法,這與圖7的結(jié)論一致。圖8 給出了所有正確觀測(cè)氣溫與重構(gòu)氣溫的散點(diǎn)圖,黑色點(diǎn)表示EOF 迭代法對(duì)應(yīng)的散點(diǎn),灰色點(diǎn)表示Cressman 插值法對(duì)應(yīng)的散點(diǎn)。可以明確看到,EOF 迭代法重構(gòu)的氣溫與觀測(cè)值較為接近,重構(gòu)誤差較小,而Cressman 插值法由于受多方面的干擾重構(gòu)效果較差,重構(gòu)后的氣溫表現(xiàn)出來的特征不明顯,其誤差明顯大于EOF 迭代法。

      圖8 觀測(cè)氣溫與EOF 迭代法(黑色點(diǎn))以及Cressman 插值法重構(gòu)氣溫(灰色點(diǎn))散點(diǎn)圖(單位:°C)Fig.8 Scatter plots between the observed and reconstructed temperature of the EOF iteration method (black spots) and the Cressman interpolation method (gray spots), units: °C

      進(jìn)一步分析重構(gòu)誤差的分布情況,圖9 給出的是觀測(cè)值與重構(gòu)值誤差的概率密度函數(shù)分布曲線??梢钥吹?,EOF 迭代法重構(gòu)誤差分布的峰度系數(shù)為210,誤差絕對(duì)值基本集中在0.5°C 以內(nèi),只有極少數(shù)誤差絕對(duì)值大于1°C,但是極值也在2°C 以內(nèi)。而Cressman 插值重構(gòu)誤差峰度系數(shù)為83.67,很大一部分站點(diǎn)的重構(gòu)誤差大于1°C。因此,相對(duì)于Cressman 插值而言,EOF 迭代法具有更高的穩(wěn)定性和更高的精度。

      圖9 EOF 迭代法(藍(lán)色實(shí)線)以及Cressman 插值(紅色虛線)的重構(gòu)誤差概率密度曲線(單位:°C)Fig.9 The probability density function of the reconstruction error for the EOF iteration method (blue solid line) and the Cressman interpolation method (red dotted line) during 1–7 December 2019(units: °C)

      3.2 實(shí)際重構(gòu)結(jié)果分析

      在根據(jù)正確數(shù)據(jù)對(duì)EOF 迭代法的修復(fù)精度進(jìn)行理想評(píng)估后,我們將修復(fù)方法應(yīng)用到實(shí)際錯(cuò)誤資料的修復(fù)中進(jìn)行檢驗(yàn)。分別使用EOF 迭代法和Cressman 插值法對(duì)基于EOF 的自動(dòng)站質(zhì)量控制方法識(shí)別出的錯(cuò)誤站點(diǎn)進(jìn)行修復(fù)。圖10a 給出了2019 年12 月4 日14:00(第87 個(gè)時(shí)次)局部溫度數(shù)值(紅色為錯(cuò)誤站點(diǎn)溫度數(shù)值),圖中的陰影表示地形高度。兩個(gè)站點(diǎn)在第87 時(shí)次被判定為離群點(diǎn),根據(jù)兩個(gè)站點(diǎn)第87 時(shí)次的溫度及其周圍站點(diǎn)溫度分布可以看出,兩個(gè)站點(diǎn)在第87 時(shí)次相對(duì)于周圍站點(diǎn)溫度為異常高值,并且該錯(cuò)誤站點(diǎn)的地面溫度觀測(cè)并未受地形的影響,因此可以認(rèn)定質(zhì)量控制方法判定的錯(cuò)誤資料是合理的。使用兩種方法對(duì)該錯(cuò)誤站點(diǎn)進(jìn)行重構(gòu),圖10b、c 分別給出了基于EOF 迭代法和Cressman 插值法修復(fù)的地面氣溫,可以看到,EOF 迭代法重構(gòu)的氣溫值明顯低于錯(cuò)誤的觀測(cè)氣溫,并且修復(fù)值與周圍觀測(cè)值更加接近,而Cressman 插值結(jié)果與周圍觀測(cè)相比則異常偏低,這是由于錯(cuò)誤站點(diǎn)南部出現(xiàn)了地形高度增加的情況,隨著地形高度的增加地面溫度也出現(xiàn)了明顯的降低,因此區(qū)域南部氣溫普遍低于區(qū)域北部,由于Cressman 插值只考慮測(cè)站空間距離因素,南部的低溫資料會(huì)使得最終插值結(jié)果偏低。EOF 迭代法則能綜合考慮氣溫的空間典型分布特征,使得重構(gòu)結(jié)果不受地形影響。因此,EOF 迭代法修復(fù)后的氣溫分布連續(xù)性更佳,其平滑性和規(guī)律性更好,修復(fù)效果也更好。

      重構(gòu)的氣溫分布已經(jīng)驗(yàn)證了修復(fù)氣溫在空間分布上的合理性。另一方面,自動(dòng)氣象站逐小時(shí)高分辨率的氣溫觀測(cè)資料為精細(xì)化研究氣溫的日變化差異、季節(jié)及氣候特征帶來了可能性,因此,修復(fù)后的氣溫隨時(shí)間變化是否合理也是評(píng)估修復(fù)氣溫質(zhì)量的一項(xiàng)重要指標(biāo)。圖11 給出了圖10 中兩個(gè)識(shí)別出的錯(cuò)誤站點(diǎn)的觀測(cè)以及修復(fù)后氣溫的日變化曲線,可以看到,與周圍站觀測(cè)氣溫相比,兩個(gè)存在錯(cuò)誤觀測(cè)資料的站點(diǎn)均在第15 時(shí)次出現(xiàn)了異常偏高的觀測(cè)氣溫(紅色線),在該時(shí)刻遠(yuǎn)高于周圍所有觀測(cè)站的氣溫(灰色線)。對(duì)北部站點(diǎn)而言,經(jīng)過EOF 迭代法修復(fù)后(藍(lán)色線),錯(cuò)誤站點(diǎn)氣溫的時(shí)間變化趨勢(shì)與周圍站點(diǎn)基本一致,符合氣溫日變化的規(guī)律,而Cressman 插值得到的氣溫(黑色線)在該時(shí)刻出現(xiàn)異常偏低的不合理變化趨勢(shì)。這是由于EOF 迭代法不僅能考慮到氣溫的典型空間分布特征,同時(shí)其在氣溫的時(shí)間變化趨勢(shì)約束下對(duì)錯(cuò)誤觀測(cè)進(jìn)行重構(gòu),最終得到的重構(gòu)結(jié)果能同時(shí)滿足氣溫的時(shí)空特征,而Cressman 插值結(jié)果則受到觀測(cè)站南部地形影響,插值結(jié)果異常偏低。

      圖10 2019 年12 月4 日14:00(第87 個(gè)時(shí)次)(a)局部觀測(cè)氣溫、(b)EOF 迭代法重構(gòu)氣溫以及(c)Cressman 插值氣溫分布,單位:°C。圖中黑色陰影表示地形高度(單位:m)Fig.10 Spatial distribution of (a) observed temperature, (b) restored temperature by the EOF iteration method and (c) restored temperature by the Cressman interpolation method at 1400 BJT on December 4, 2019 (87th hour), units: °C. The shading indicates the terrain (units: m)

      圖11 2019 年12 月4 日10:00~20:00 觀測(cè)氣溫(紅色)、重構(gòu)后氣溫(藍(lán)色)、Cressman 插值后(黑色)氣溫以及周圍站點(diǎn)的氣溫(灰色)序列(單位:°C)Fig.11 Time series of (a) observed temperature and (b) restored temperature by the EOF iteration method and (c) restored temperature by the Cressman interpolation method during 1000 BJT–2000 BJT on December 4, 2019 (units: °C)

      4 結(jié)論與討論

      錯(cuò)誤的自動(dòng)站觀測(cè)資料對(duì)天氣預(yù)報(bào)和氣候變化研究帶來很大的限制,地面氣候研究以及各個(gè)領(lǐng)域需要的專業(yè)氣象服務(wù)往往需要完整的自動(dòng)站觀測(cè)數(shù)據(jù),因此對(duì)異常觀測(cè)的資料序列進(jìn)行訂正,確保觀測(cè)資料的準(zhǔn)確性和連續(xù)性至關(guān)重要。

      本文利用江蘇省氣象局提供的2019 年12 月1日00:00 至7 日23:00,共168 個(gè)時(shí)次的地面自動(dòng)站溫度觀測(cè)資料,在EOF 的質(zhì)量控制方法有效識(shí)別異常觀測(cè)資料的基礎(chǔ)上,提出一種新的基于EOF 的迭代方法用于修復(fù)錯(cuò)誤的自動(dòng)氣象站地面氣溫觀測(cè)。

      結(jié)果表明,利用本文提出的EOF 迭代修復(fù)法可以較高精度的對(duì)地面氣溫觀測(cè)進(jìn)行重構(gòu),其重構(gòu)均方根誤差為0.48°C,遠(yuǎn)小于Crssman 插值法,并且EOF 迭代法修復(fù)后的氣溫在時(shí)空特征上都具有合理性。這是因?yàn)镋OF 迭代法不僅考慮了地面氣溫的典型空間分布,還利用了氣溫隨時(shí)間變化的特征對(duì)重構(gòu)進(jìn)行約束,從而從整體上考慮了插補(bǔ)資料的效果。而Cressman 一類的插值方法只選取了錯(cuò)誤點(diǎn)周邊的部分資料,通過資料的連續(xù)性進(jìn)行插值,但是其插值過程中不能考慮其他周邊資料的約束,所以容易受到個(gè)別極端資料的影響,這對(duì)于小尺度信息較強(qiáng)的地表變量來說,更容易出現(xiàn)不穩(wěn)定現(xiàn)象。

      由于資料長(zhǎng)度的限制,本文沒有對(duì)長(zhǎng)時(shí)間的氣溫觀測(cè)進(jìn)行修復(fù)試驗(yàn),在后續(xù)的研究中我們將針對(duì)更長(zhǎng)時(shí)間的觀測(cè)資料進(jìn)行重構(gòu)檢驗(yàn)。另一方面,目前的工作只針對(duì)地面氣溫展開,在以后研究工作中還應(yīng)考慮利用EOF 迭代法對(duì)其他一些地面觀測(cè)變量進(jìn)行修復(fù),例如相對(duì)濕度、降水等。

      猜你喜歡
      迭代法插值站點(diǎn)
      迭代法求解一類函數(shù)方程的再研究
      基于Web站點(diǎn)的SQL注入分析與防范
      電子制作(2019年14期)2019-08-20 05:43:42
      2017~2018年冬季西北地區(qū)某站點(diǎn)流感流行特征分析
      基于Sinc插值與相關(guān)譜的縱橫波速度比掃描方法
      首屆歐洲自行車共享站點(diǎn)協(xié)商會(huì)召開
      中國自行車(2017年1期)2017-04-16 02:53:52
      怕被人認(rèn)出
      一種改進(jìn)FFT多譜線插值諧波分析方法
      基于四項(xiàng)最低旁瓣Nuttall窗的插值FFT諧波分析
      迭代法求解約束矩陣方程AXB+CYD=E
      預(yù)條件SOR迭代法的收斂性及其應(yīng)用
      堆龙德庆县| 苍南县| 新安县| 慈溪市| 瑞昌市| 成安县| 同心县| 县级市| 锦屏县| 施秉县| 蓬莱市| 临高县| 阿拉善左旗| 青冈县| 如东县| 阿拉善左旗| 桃源县| 武义县| 绿春县| 灌南县| 若尔盖县| 临城县| 大同县| 保定市| 额尔古纳市| 吉林省| 磐石市| 通化县| 永年县| 屏南县| 鹤庆县| 新津县| 曲阳县| 兴义市| 竹北市| 卓资县| 三亚市| 同仁县| 张家港市| 吉木萨尔县| 望城县|