王昊運(yùn),王輝,張宇,萬莉穎
(1. 國家海洋環(huán)境預(yù)報(bào)中心,北京100081;2. 中國海洋大學(xué)海洋環(huán)境與生態(tài)教育部重點(diǎn)實(shí)驗(yàn)室,山東青島266100;3. 國家海洋局海洋災(zāi)害預(yù)報(bào)技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,北京100081)
在大氣和海洋模式中,初始狀態(tài)對于數(shù)值模擬的效果至關(guān)重要。作為一種順序同化方法,集合卡爾曼濾波(Ensemble Kalman Filter,EnKF)及其演變的集合同化方法,集諸多優(yōu)點(diǎn)于一身,是現(xiàn)有同化方法中最具應(yīng)用發(fā)展前景的一個(gè)[1-3]。EnKF 通過將多個(gè)擾動的初始樣本作為一個(gè)集合[4],利用這個(gè)集合估計(jì)背景誤差協(xié)方差,對卡爾曼濾波方法進(jìn)行了有效簡化。EnKF 的優(yōu)勢還在于:其計(jì)算代價(jià)比卡爾曼濾波和擴(kuò)展卡爾曼濾波小得多;不要求背景誤差協(xié)方差是線性演變的;不要求發(fā)展模式的線性和伴隨模式;可以給集合預(yù)報(bào)提供好的初始擾動[4-5]。
為了解決EnKF 在大氣和海洋數(shù)值模擬的應(yīng)用問題,最重要的兩個(gè)改進(jìn)就是背景誤差協(xié)方差的膨脹和局地化分析[6]。通常,模式的狀態(tài)向量維數(shù)很高(為107),遠(yuǎn)遠(yuǎn)大于集合樣本的維數(shù),這會導(dǎo)致背景誤差協(xié)方差矩陣中的虛假相關(guān)。同時(shí)因?yàn)榧蠘颖倦x散度的問題,也會導(dǎo)致同化分析對背景誤差協(xié)方差的低估[7-8]。EnKF及其演變而來的局地化分析在大氣和海洋數(shù)值模擬中得到了廣泛的應(yīng)用[9-12]。
集合同化的優(yōu)勢在于:集合同化方法不僅給出模式狀態(tài)的最優(yōu)估計(jì),而且不需要建立預(yù)報(bào)模式的切線性和伴隨,背景誤差協(xié)方差“流依賴”。在En-KF同化方法獲得成功的基礎(chǔ)上,為了不對觀測進(jìn)行擾動,發(fā)展了一系列演變、改進(jìn)的同化方法。例如:集合調(diào)整卡爾曼濾波(Ensemble Adjustment Kalman Filter,EAKF)、集合變換卡爾曼濾波(Ensemble Transform Kalman Filter,ETKF)、奇異演變插值卡爾曼濾波(Singular Evolutive Interpolated Kalman Filter,SEIK)、集合平方根濾波(Ensemble Square Root Filter,EnSRF)等。由于順序同化公式簡明、應(yīng)用相對容易,EnKF 及其演變版本得到了快速的發(fā)展和應(yīng)用[13-14]。觀測上不加擾動進(jìn)行同化,能夠解決EnKF 計(jì)算量大和集合成員少時(shí)收斂速度慢的問題,這一系列方法被統(tǒng)稱為集合均方根濾波[15-17]。例如比EnKF 更加高效的SEIK 方法,由于采用了二階取樣法,因此可以用更少的集合樣本數(shù)達(dá)到比EnKF 更好的效果,同時(shí)避免了EnKF 對觀測向量擾動帶來的人為誤差,所以更加節(jié)省計(jì)算資源并且更加有效。實(shí)際應(yīng)用中決定集合同化方法計(jì)算代價(jià)最關(guān)鍵的就是集合樣本數(shù),它直接決定了該同化方法需要在預(yù)報(bào)步時(shí)積分模式的次數(shù)。Nerger等[18]結(jié)合了ETKF在低維集合樣本展開的子空間對誤差協(xié)方差矩陣估計(jì)的優(yōu)勢和SEIK 采用二階取樣法可以帶來的小樣本數(shù)的優(yōu)勢,提出了誤差子空間變換卡爾曼濾波(Error Subspace Transform Kalman Filter,ESTKF)。ESTKF 被證明是一種更加高效的誤差子空間濾波,其局地化分析方案稱為局地誤差子空間變換卡爾曼濾波(Local Error Subspace Transform Kalman Filter,LESTKF)[19]。
LESTKF 在實(shí)際應(yīng)用中,同樣需要解決背景誤差協(xié)方差矩陣的低估和因?yàn)橛?jì)算能力不足導(dǎo)致集合樣本數(shù)過小引起的虛假相關(guān)。因此局地化方案中的重要參數(shù)“局地化半徑”和LESTKF分析方案中用來膨脹背景誤差協(xié)方差矩陣的“ 遺忘因子”(Forgetting Factor)這兩個(gè)重要參數(shù)對同化效果起著決定性的作用[19]。研究這兩個(gè)參數(shù)如何影響LESTKF 的同化性能和同化效果,以及如何選取這兩個(gè)參數(shù)才能最小化分析誤差,對于將該同化方法應(yīng)用于實(shí)際的大氣海洋模式是十分關(guān)鍵的[20]。本文利用Lorenz96 模型結(jié)合LESTKF 同化方法,通過“局地化半徑”和“遺忘因子”設(shè)置孿生實(shí)驗(yàn),研究這兩個(gè)重要參數(shù)對于同化效果的影響。
本文將首先探究“遺忘因子”對背景誤差協(xié)方差膨脹效果及同化結(jié)果的影響;其次將研究“局地化半徑”和“ 遺忘因子”的共同影響;最后結(jié)合Lorenz96 模型孿生實(shí)驗(yàn)的結(jié)果分析這兩個(gè)重要參數(shù)在集合同化分析中扮演的角色,并針對如何優(yōu)化選取參數(shù)提出建議和總結(jié)。
對于非線性海洋大氣系統(tǒng)而言,海洋大氣在tk時(shí)刻的n 維狀態(tài)向量為xk,和它對應(yīng)的誤差協(xié)方差矩陣為PK。m 個(gè)集合成員組成的狀態(tài)向量集合可表示為x(α)k,α = 1,…,m。用集合均值來表示對tk時(shí)刻的狀態(tài)估計(jì):
同化預(yù)報(bào)時(shí)首先將集合樣本分別通過模式積分至同化時(shí)刻。
在ESTKF分析步中,背景誤差協(xié)方差Pf在形式上用集合樣本Xf表示,即:
式(7)和(8)中:T?是一個(gè)m ×( m - 1)維的滿秩矩陣,并且每列元素的和為零,即
T?矩陣的作用是在計(jì)算矩陣L 時(shí)剔除集合樣本矩陣Xf的集合平均,即計(jì)算集合擾動。值得注意的是,矩陣L 是個(gè)n ×( m - 1)維矩陣,只存儲前m - 1個(gè)集合擾動。
分析場通過集合擾動矩陣L給出:
式(10)——(12)中:權(quán)重向量wˉ、變換矩陣A?分別為(m-1)維、(m-1)×(m-1)維。參數(shù)取值范圍為0<ρ?≤1,稱作“遺忘因子”,用來放大背景誤差協(xié)方差。ρ?作為該同化方法的重要參數(shù),其取值直接影響著ESTKF的同化效果,也是本文中的主要研究對象之一。
該方法在得到分析場后需要進(jìn)行再取樣。由于集合樣本矩陣經(jīng)過了變換用X?a表示,P?a同理。
根據(jù)之前的研究,在SEIK 中,矩陣C?-1由A?-1經(jīng)過Cholesky 分解得到,即( C?-1)TC?-1= A?-1。Ω 是一個(gè)m ×( m - 1) 維的矩陣,該矩陣所有列向量相互正交,并且與(1,…,1)T也正交。矩陣Ω 的作用是與( m - 1)×( m - 1) 維 的 集 合 變 換 矩 陣A?-1重 新 生成新的集合擾動矩陣。在ESTKF 中,Ω 矩陣記為Ω?,即:
式中:Ω?為Householder 矩陣[18]。Ω?的作用為將Xf(n×m 維)集合樣本空間中的向量投影在矩陣L(m-1個(gè)集合擾動)所在的誤差子空間。同樣矩陣Ω?是滿秩矩陣,并且列向量和為零。將式(8)——(13)中的T?矩陣替換為Ω?矩陣,最終算法就是ESTKF。
除了傳統(tǒng)的EnKF 等濾波的優(yōu)勢之外,ESTKF的本質(zhì)是在SEIK 的基礎(chǔ)上將集合變換矩陣的計(jì)算通過Ω?矩陣投影在誤差子空間來完成。該方法相對于SEIK 來說:計(jì)算矩陣L 時(shí),不必像之前一樣忽略最后一列的集合樣本,同時(shí)剔除了集合成員順序的影響;ESTKF 由于在誤差子空間計(jì)算,所以計(jì)算代價(jià)要小于SEIK。
為了消除集合樣本數(shù)不足導(dǎo)致的背景誤差協(xié)方差矩陣中的虛假相關(guān),假設(shè)只有距離模式格點(diǎn)在一定范圍(即局地化半徑)內(nèi)的觀測才會對模式格點(diǎn)產(chǎn)生影響。局地化不僅可以減小虛假相關(guān)對同化效果的影響,還可以減小計(jì)算量,尤其當(dāng)觀測數(shù)量遠(yuǎn)遠(yuǎn)大于模式集合樣本數(shù)時(shí)。而且局地化可以保證集合同化方法在高維模式應(yīng)用上的合理性,即對于每個(gè)模式格點(diǎn)而言,模式狀態(tài)的調(diào)整是在一個(gè)相對較大的集合空間內(nèi)實(shí)現(xiàn)的。需要注意的是,由于局地化半徑是為了消除虛假相關(guān),而不同模式可能有不同的虛假相關(guān),所以局地化半徑隨模式不同而不同。同時(shí),局地化可能會在局地區(qū)域的邊緣引起模式狀態(tài)的不連續(xù)。為了解決這一問題,通常引入平滑的、以局地化半徑為參數(shù)、以觀測和格點(diǎn)距離為自變量的局地化函數(shù),使得觀測的影響隨距離逐漸衰減。本研究中選用的局地化函數(shù)是五階Gaspari-Cohn 相關(guān)函數(shù)[17],即:
式中:d 表示觀測到模式格點(diǎn)的距離,rloc表示局地化半徑,計(jì)算結(jié)果表示觀測對分析點(diǎn)的權(quán)重。利用Gaspari-Cohn 相關(guān)函數(shù)按照權(quán)重結(jié)合局地化半徑中的觀測得到該格點(diǎn)處的分析值。
參數(shù)ρ?的選取對同化的影響主要發(fā)生在LESTKF 同化的分析步中,在協(xié)方差矩陣的計(jì)算中引入了一個(gè)膨脹因子來增加濾波穩(wěn)定性。因?yàn)槟J降膹?qiáng)非線性,導(dǎo)致在相空間中對初值十分敏感,在同化中太過相信模式預(yù)報(bào)的背景場將容易導(dǎo)致濾波發(fā)散,因此該參數(shù)的選取對于同化效果有著重要的影響。
局地化半徑通過把同化的區(qū)域分解成小的子區(qū)域,并行地同時(shí)更新每個(gè)格點(diǎn)的分析,更新時(shí)僅用到這個(gè)格點(diǎn)某一半徑內(nèi)的所有觀測。在分析局地化的基礎(chǔ)上,對該半徑內(nèi)的不同觀測引入權(quán)重的局地化方法被稱為觀測局地化(Observation Localization,OL)。研究表明,在局地化分析時(shí),針對不同的集合樣本數(shù)局地化半徑存在一個(gè)最優(yōu)的選擇[18]。
集合同化方法作為一種順序同化方法,在海洋和大氣領(lǐng)域得到廣泛應(yīng)用。EnKF、集合最優(yōu)插值(Ensemble Optimal Interpolation,EnOI)提出后,為了解決計(jì)算代價(jià)等問題,集合平方根濾波等分析方法演變出一系列的集合同化方法,如ETKF、EAKF、減秩卡爾曼濾波(Singular Evolutive Extended Kalman Filter,SEEK)、SEIK、ESTKF 等。這些集合同化方法都是先由預(yù)報(bào)步分別積分集合樣本;分析步僅需要模式提供的部分信息,通常只依賴于狀態(tài)向量,而不是單個(gè)物理量場。例如在海洋模式的狀態(tài)向量中,存儲著U、V、z、S、T等模式變量場,或是需要估計(jì)的模式參數(shù)。對于觀測算子H 的計(jì)算,只需要知道觀測位置在狀態(tài)向量中的存放位置即可。以上屬性使得建立一個(gè)用通用方式實(shí)現(xiàn)集合同化方法的核心算法,并通過調(diào)用通用接口來進(jìn)行同化的同化框架成為可能。這將極大地降低同化方案的實(shí)施。由于通用接口的設(shè)定,同化參數(shù)也便于系統(tǒng)化的管理和調(diào)整。
PDAF 同化框架就是一些集合同化方法的算法庫(網(wǎng)址:http://pdaf.awi.de)[21]。目前全球大部分同化系統(tǒng)都是離線進(jìn)行的,也就是模式集合積分與同化分析步分兩個(gè)程序進(jìn)行。這種同化方式雖穩(wěn)定但低效。因?yàn)槟J椒e分程序和同化程序之間需要用文件來傳遞信息,這種運(yùn)行方式稱為“離線模式”。另一種運(yùn)行方式為直接將同化程序?qū)戇M(jìn)模式代碼中整合成為一個(gè)程序,這種運(yùn)行方式更高效,但是需要調(diào)整很小一部分模式代碼,這種運(yùn)行方式稱為“在線模式”。前者是將模式積分和同化分析步分兩個(gè)單獨(dú)程序運(yùn)行,模式的輸出結(jié)果輸入到同化程序,同化的分析場又作為模式的啟動場;后者是將同化程序與模式耦合起來,需要對模式代碼做擴(kuò)展,調(diào)用PDAF 核心函數(shù),形成一個(gè)完整的運(yùn)行程序。 本研究中采用PDAF 同化 框 架結(jié)合Lorenz96 以“ 在線 模 式”運(yùn)行。實(shí)際情況中由于模式復(fù)雜,往往采用“離線模式”[21-23]。
Lorenz96 模型作為大氣和海洋的低階近似,具有非線性,存在混沌吸引子。Lorenz96 己經(jīng)被廣泛應(yīng)用于大氣海洋預(yù)測和資料同化的研究中[24]。其非線性強(qiáng),同時(shí)對初值非常敏感,其動力框架為:
式中:Xi為模型變量,F為定常強(qiáng)迫,F(xiàn)的大小決定著非線性的程度。本文的實(shí)驗(yàn)設(shè)計(jì)中,模型維數(shù)等于dim_state=40,即i = 1,2,…,40,強(qiáng)迫項(xiàng)F 選為8,數(shù)值積分采用四階龍格-庫塔格式。
對于孿生實(shí)驗(yàn)而言,將模式積分10 000 步得到的狀態(tài)向量的時(shí)間序列作為“真值”,并用第1 001步時(shí)的模式狀態(tài)作為初始場(前1 000 步為模式調(diào)整階段,即“spin up”階段),其狀態(tài)向量序列即為40×10 000維的矩陣。
觀測序列是在Lorenz96 模式“真值”序列的基礎(chǔ)上,加上不相關(guān)的隨機(jī)噪聲生成的。本節(jié)中,為了探索不同同化強(qiáng)度下遺忘因子和局地化半徑的影響,擾動了不同的觀測序列,兩個(gè)觀測序列的標(biāo)準(zhǔn)差分別取為1.0和0.1。為了去除模式調(diào)整階段的影響,本實(shí)驗(yàn)只同化1 000 步之后的觀測,采用積分一步同化一步觀測的方式。
用于集合同化的初始集合樣本由二階取樣法(Second-order Exact Sampling)在10 000 步模式“歷史真值”的基礎(chǔ)上生成初始樣本。本節(jié)為了探究遺忘因子和局地化半徑在不同樣本數(shù)下的同化效果,分別用10個(gè)、30個(gè)樣本做了對照試驗(yàn)。集合孿生同化實(shí)驗(yàn)流程見圖1。
圖1 集合孿生同化實(shí)驗(yàn)示意圖
由于本孿生實(shí)驗(yàn)的Lorenz96模型和同化方法均在PDAF同化框架中進(jìn)行,表1給出了主要同化參數(shù)的設(shè)置和選項(xiàng)。其中dim_ens 為集合樣本數(shù),forget和local_range分別對應(yīng)“遺忘因子”和“局地化半徑”。
表1 同化實(shí)驗(yàn)主要參數(shù)
為了探究不同遺忘因子對同化結(jié)果的影響,本實(shí)驗(yàn)采用local_range為5個(gè)模式格點(diǎn)、rms_obs=1.0、dim_ens=30;但將遺忘因子取不同值。將同化結(jié)果、模式預(yù)報(bào)結(jié)果與模式真值、估計(jì)值(30 個(gè)樣本的集合平均)做均方根誤差(Root Mean Square Error,RMSE)對比,綜合探究遺忘因子對同化結(jié)果的影響。為了方便表述,以下遺忘因子均記為f值。
圖2 給出了同化至1 000 步,即模式第2 000 步的真值、觀測值、估計(jì)值和分析場。圖2a 和2b 分別為第2 000 步的真值和觀測值;圖2c 和2d 分別為f =1.0 時(shí)模式估計(jì)場和同化分析場;圖2e和2f分別為f =0.9時(shí)的模式估計(jì)場和同化分析場。
通過對比發(fā)現(xiàn)模式第40 個(gè)格點(diǎn)上的觀測值相對真值出現(xiàn)了較大擾動(見圖2b、2d、2f 的紅框部分)。而只有f= 0.9的分析場有一個(gè)抬升,向觀測值做出了調(diào)整,這正是因?yàn)閒 對背景誤差協(xié)方差的膨脹作用導(dǎo)致的分析結(jié)果向觀測偏移。
為了研究f 對分析場和預(yù)報(bào)場的影響,本實(shí)驗(yàn)又將f 的取值擴(kuò)大為0.5~1.0,并計(jì)算其同化5 000步后與真值的RMSE。
圖3 分別為預(yù)報(bào)場和分析場的RMSE,橫坐標(biāo)為同化步(因?yàn)闀r(shí)間步過于密集,因此每隔50 步填值,橫坐標(biāo)100 即代表第5 000 步,以此類推)。f 從上到下由0.5(協(xié)方差膨脹最大)遞增至1.0(協(xié)方差不膨脹)。
圖3 預(yù)報(bào)場和分析場RMSE(橫坐標(biāo)為縮放50倍的時(shí)間步,縱坐標(biāo)為與真值的RMSE)
對于單個(gè)RMSE 序列來說,在同化開始時(shí)RMSE 最大。這是因?yàn)槌跏紭颖臼菑哪J街暗摹皻v史狀態(tài)”中提取的,與真值的誤差最大;但隨著同化預(yù)報(bào)步和分析步的交替,預(yù)報(bào)場和分析場均迅速向真值收斂。但是隨著同化實(shí)驗(yàn)的進(jìn)行會出現(xiàn)誤差的突然增長。該特征與Pham[8]的圖1一致。這一現(xiàn)象可能由于Lorenz 系統(tǒng)進(jìn)入了強(qiáng)的非線性區(qū)域所導(dǎo)致。
通過圖3a、b 的對比,發(fā)現(xiàn)LESTKF 對于所有實(shí)驗(yàn)而言均對預(yù)報(bào)場有所改善,但不同f 值的改善程度不同。通過縱向比較可以看出:f為0.95與f為1.0時(shí),f 的使用明顯避免了同化至3 000 步左右(圖中橫坐標(biāo)約60)的誤差爆發(fā);f 為0.5 時(shí)誤差最大;從上到下RMSE有一個(gè)先減小再增大的過程。
為了探究遺忘因子整體對同化結(jié)果的影響,分別對5 000 步同化實(shí)驗(yàn)的預(yù)報(bào)場和分析場的RMSE求時(shí)間平均(見圖4)。結(jié)果表明:f =0.95 時(shí)分析場和預(yù)報(bào)場的誤差最??;隨著f 的減小,誤差隨之增大。f =1.0 時(shí)分析誤差和背景誤差均存在著低估,隨著f 減小低估得到改善;但隨著f 繼續(xù)減小,則出現(xiàn)了分析誤差和背景誤差的高估,導(dǎo)致同化結(jié)果過于接近觀測從而偏離真值。藍(lán)線和黑線的交點(diǎn)則是最優(yōu)f 值。這說明遺忘因子通過控制對背景誤差協(xié)方差的估計(jì)會顯著影響同化效果,高估和低估均不是最優(yōu)f值。
圖4a、b 的對比表明對于固定的f 而言,分析場相對于真值的RMSE 明顯小于預(yù)報(bào)場相對于真值的RMSE。例如當(dāng)f =0.95 時(shí),預(yù)報(bào)場相對于真值的RMSE 約為0.25,而分析場相對于真值的RMSE 約為0.2。這說明f 通過對背景誤差協(xié)方差的放大的確可以改善LESTKF 的同化效果;但隨著f 越來越小,分析場對于預(yù)報(bào)場的提升依然存在,但提升效果開始變小。
本實(shí)驗(yàn)根據(jù)Nerger 等[18]的實(shí)驗(yàn)設(shè)置,將total_steps 設(shè)置為60 000 步,得到的結(jié)果作為真值;觀測依然在真值的基礎(chǔ)上增加隨機(jī)擾動,觀測誤差分別以1.0 和0.1 的標(biāo)準(zhǔn)差生成。前1 000 步仍然作為“spin up”階段。本實(shí)驗(yàn)將通過不同的觀測誤差控制同化實(shí)驗(yàn)的強(qiáng)度。集合樣本分別取10 個(gè)和30個(gè)。因?yàn)樵趯?shí)際的集合同化實(shí)驗(yàn)中,往往因?yàn)橛?jì)算資源的限制,不會選取過多的集合樣本,因此選取10個(gè)集合樣本更加接近實(shí)際情況。
local_range 的范圍為0~20 個(gè)格點(diǎn),這是因?yàn)椋篖orenz96 模式共有40 個(gè)格點(diǎn),并且是周期邊界條件;local_range 超過20 個(gè)格點(diǎn)后相當(dāng)于沒有局地化分析。將不同f 和local_range 組合進(jìn)行同化實(shí)驗(yàn),結(jié)果依然用RMSE 的時(shí)間平均來表示。當(dāng)時(shí)間平均RMSE 大于設(shè)定的觀測誤差時(shí),認(rèn)為發(fā)生了濾波發(fā)散。
圖5a 給出了30 個(gè)集合樣本、觀測誤差為1.0 的組合實(shí)驗(yàn)結(jié)果;5b為10個(gè)集合樣本、觀測誤差為1.0的組合實(shí)驗(yàn)結(jié)果;5c為10個(gè)集合樣本但觀測誤差降低至0.1 的組合實(shí)驗(yàn)結(jié)果。格點(diǎn)上的數(shù)字代表二者組合實(shí)驗(yàn)分析場的時(shí)間平均RMSE,白色格點(diǎn)說明該參數(shù)組合實(shí)驗(yàn)結(jié)果的誤差超過了設(shè)定的擾動的觀測誤差,發(fā)生了濾波發(fā)散,因此不填色。
圖5 可以看出當(dāng)集合樣本數(shù)為30 個(gè)時(shí),不論local_range 和f 如何選取,均沒有發(fā)生濾波發(fā)散,而且存在一個(gè)最優(yōu)的參數(shù)組合區(qū)域。這表明當(dāng)集合樣本數(shù)足夠大、同化方法對背景誤差協(xié)方差的估計(jì)很精確時(shí),引入遺忘因子和局地化分析依然對提高同化結(jié)果有幫助,能夠找到一個(gè)最優(yōu)的參數(shù)搭配區(qū)域。例如圖5a中l(wèi)ocal_range>6、f >0.93的區(qū)域。
當(dāng)集合樣本數(shù)為10個(gè)時(shí),這種情形更加接近實(shí)際同化,如圖5b、c 中出現(xiàn)了大面積的濾波發(fā)散區(qū)域。值得注意的是,最優(yōu)的參數(shù)選擇區(qū)域和濾波發(fā)散區(qū)域非常接近,兩者緊鄰。例如local_range = 7、f = 0.98 時(shí),RMSE 約為0.2;但是當(dāng)local_rangen = 8、f仍然為0.98時(shí),則出現(xiàn)了RMSE為3.5的濾波發(fā)散,這個(gè)結(jié)果與Nerger等[18]的結(jié)果仍然一致。Nerger解釋是由初始樣本隨機(jī)選取引起的同化實(shí)驗(yàn)前期的過渡階段導(dǎo)致的,差的隨機(jī)初始樣本會使該過渡階段變長,因此導(dǎo)致濾波發(fā)散。
圖4 時(shí)間平均RMSE(藍(lán)線代表與真值的誤差,黑線代表與估計(jì)真值的誤差)
圖5 組合實(shí)驗(yàn)結(jié)果(表中數(shù)字代表RMSE,白色區(qū)域?yàn)闉V波發(fā)散區(qū))
為了探討觀測誤差對于同化實(shí)驗(yàn)的影響,將觀測重新用0.1 的標(biāo)準(zhǔn)差隨機(jī)生成,并同樣用10 個(gè)集合樣本做了組合實(shí)驗(yàn),結(jié)果見圖5c。當(dāng)通過減小觀測誤差來增加同化強(qiáng)度時(shí),濾波發(fā)散的區(qū)域有所增大,但依然存在一個(gè)最優(yōu)的參數(shù)選擇區(qū)域。
本文通過Lorenz96 模型的孿生實(shí)驗(yàn),分別驗(yàn)證了局地化半徑和遺忘因子的不同選取對同化分析場的影響,并且詳細(xì)介紹了PDAF 同化中一些參數(shù)的設(shè)置。結(jié)論如下:
(1)局地化半徑對分析結(jié)果的空間分布影響明顯:局地化半徑過大,不能很好地濾去背景誤差協(xié)方差矩陣中的虛假相關(guān);局地化半徑過小則分析太細(xì)節(jié)化,使得物理量場不符合實(shí)際。
(2)遺忘因子作為單獨(dú)影響同化實(shí)驗(yàn)的因子時(shí),分析誤差隨著f 值的增大有一個(gè)先減小再增大的過程。這是因?yàn)閒 值控制著對分析誤差協(xié)方差和背景誤差協(xié)方差的估計(jì),對真值的低估和高估均會引起誤差。圖4中可以清楚的看到,估計(jì)的RMSE與實(shí)際的RMSE 的交點(diǎn)就是理論上最優(yōu)的遺忘因子。但在實(shí)際同化應(yīng)用中,由于對真值的估計(jì)不準(zhǔn)確,因此對于參數(shù)f的選取只能通過實(shí)驗(yàn)方法去尋找。
(3)f的選取對于同化效果影響顯著。Lorenz96理想實(shí)驗(yàn)結(jié)果表明:f 的作用是人為放大背景誤差協(xié)方差,防止濾波發(fā)散。f 取值并非越小越好,太小會使同化結(jié)果過于接近模式,從而減弱觀測信息對模式的調(diào)整。f 恰當(dāng)選取(取值為0~1),則可以明顯提高同化效果。因此在實(shí)際同化中選取該參數(shù)時(shí)應(yīng)格外注意。
(4)遺忘因子和局地化半徑作為共同因子影響同化時(shí),的確存在一個(gè)最優(yōu)的區(qū)域。但是最優(yōu)區(qū)域的選取需要慎重,因?yàn)樽顑?yōu)的參數(shù)組合的區(qū)域往往在濾波發(fā)散的臨界區(qū)域附近。一旦選取不當(dāng),則很容易出現(xiàn)濾波發(fā)散,這在實(shí)際同化中一定要注意。本文為今后進(jìn)一步利用LESTKF實(shí)際同化業(yè)務(wù)應(yīng)用中參數(shù)的最優(yōu)化選取做了鋪墊。
作為仍在不斷發(fā)展的同化方案,ESTKF 及PDAF 同化框架已經(jīng)得到越來越廣泛的應(yīng)用。由于PDAF 同化框架接口化、開源的特性,可以更方便地研究分析步中的其他參數(shù)并實(shí)現(xiàn)優(yōu)化。例如,如何選取自適應(yīng)的局地化半徑(隨緯度、同化的物理量而改變),以及如何進(jìn)一步選取自適應(yīng)的遺忘因子,以便協(xié)方差膨脹隨著同化問題不同而變化,是值得進(jìn)一步研究的問題。
資料同化是一個(gè)綜合問題,不僅需要同化方案的演進(jìn),同時(shí)還需要計(jì)算技術(shù)的進(jìn)步,二者缺一不可。怎樣在不提高計(jì)算代價(jià)的前提下提高同化效果,是資料同化理論研究中的一個(gè)重要方向。是否能夠提出一個(gè)更有效率的同化方案,并且能擁有集合濾波中隨時(shí)間演變的背景誤差協(xié)方差矩陣,仍是資料同化研究的一個(gè)重要問題。