趙進(jìn)平, 曹 勇, 石巖月
1. 中國(guó)海洋大學(xué)海洋與大氣學(xué)院, 山東 青島 266100; 2. 中國(guó)海洋大學(xué)數(shù)學(xué)科學(xué)學(xué)院, 山東 青島 266100)
絕大多數(shù)科研成果是由嚴(yán)謹(jǐn)?shù)目茖W(xué)研究得到的,但也有少量的成果是由意外得到的。合成滑動(dòng)相關(guān)系數(shù)的發(fā)現(xiàn)就是由一項(xiàng)意外引出的重要成果。
在研究?jī)蓚€(gè)時(shí)間序列相關(guān)性隨時(shí)間變化時(shí),需要使用滑動(dòng)相關(guān)系數(shù)(Running correlation coefficient, RCC)。RCC是選擇一個(gè)小于時(shí)間序列長(zhǎng)度的數(shù)據(jù)片段作為時(shí)間窗口,將計(jì)算一般相關(guān)系數(shù)的方法用于窗口中的數(shù)據(jù),然后移動(dòng)時(shí)間窗口,就可以獲得滑動(dòng)相關(guān)系數(shù)。我們將其稱為局域滑動(dòng)相關(guān)系數(shù)(Local running correlation coefficient, LRCC)。
作者用滑動(dòng)相關(guān)系數(shù)得到非常有趣的現(xiàn)象,取得了一系列成果。后來(lái)發(fā)現(xiàn)程序中用的不是標(biāo)準(zhǔn)的LRCC算法。一旦將算法換成LRCC算法,那些重要的現(xiàn)象就消失了。這就有兩種可能,一種是因用錯(cuò)了算法得到了錯(cuò)誤的結(jié)果;還有一種可能就是標(biāo)準(zhǔn)的LRCC算法存在問題。LRCC算法已經(jīng)用了90多年[1],得到非常廣泛的應(yīng)用,懷疑這種算法是大膽的、極具挑戰(zhàn)性的工作。
出于對(duì)自己結(jié)果的堅(jiān)信,我們開始尋找這兩種算法的差異和聯(lián)系。經(jīng)過縝密的推導(dǎo)得出,我們使用的算法實(shí)際上是一種與LRCC既有聯(lián)系又有差別的新算法,給出令人信服的應(yīng)用結(jié)果[2],并進(jìn)一步證明了SRCC是滑動(dòng)相關(guān)系數(shù)的正確表達(dá)方式[3]。我們將其命名為合成滑動(dòng)相關(guān)系數(shù)(Synthetic running correlation coefficient, SRCC)。本文將綜述SRCC方法,展現(xiàn)這種方法的科學(xué)價(jià)值,推廣SRCC方法的應(yīng)用。
為了更好地理解SRCC的作用和價(jià)值,我們將其與LRCC算法進(jìn)行比較,導(dǎo)出二者的關(guān)系,以獲得對(duì)SRCC的認(rèn)識(shí)。對(duì)于兩個(gè)長(zhǎng)度為N的等間距時(shí)間序列
X={xk:k=1,2,…,N},Y={yk:k=1,2,…,N},
我們常用的線性相關(guān)系數(shù)R被稱為皮爾遜積矩相關(guān)系數(shù)(Pearson product-moment correlation coefficient),即[4]:
(1)
其中,均值定義為
(2)
這個(gè)算法首先由Francis Galton[5-6]提出,后Karl Pearson進(jìn)行了推廣和應(yīng)用[7-8]。這里我們將(2)式用全部數(shù)據(jù)得到的均值稱為全局均值(Global mean),將(1)式表達(dá)的相關(guān)系數(shù)R稱為全局相關(guān)系數(shù)(Global correlation coefficient)。
由于相關(guān)系數(shù)R只是一個(gè)值,人們有時(shí)需要了解兩個(gè)時(shí)間序列相關(guān)性隨時(shí)間的變化,開始探索使用滑動(dòng)相關(guān)系數(shù)(RCC)[1],即在時(shí)間序列中選取一個(gè)窗口,將(1)式直接應(yīng)用到這個(gè)窗口之中,得到一個(gè)相關(guān)系數(shù)。然后移動(dòng)時(shí)間窗口,就會(huì)得到一個(gè)隨時(shí)間變化的相關(guān)系數(shù)。設(shè)移動(dòng)的時(shí)間窗口i的長(zhǎng)度為2n+1,即[i-n,i+n],得到:
(3)
去掉數(shù)據(jù)兩端的半窗口,滑動(dòng)相關(guān)系數(shù)的計(jì)算范圍為i∈[1+n,N-n],其中均值采用的是時(shí)間窗口內(nèi)數(shù)據(jù)計(jì)算的均值,
(4)
這里將(4)式定義的均值稱為局域均值(Local means),Rr即LRCC。
LRCC得到非常廣泛的應(yīng)用[9-15]。然而,LRCC算法隱含了一個(gè)假定,即可以將計(jì)算全局相關(guān)系數(shù)的方法直接用于計(jì)算LRCC,但是這樣做的合理性并未得到理論上的證明。該方法一直沿用至今,從來(lái)沒有人懷疑它的正確性。然而,用下面一個(gè)簡(jiǎn)單的例子就可以看出LRCC算法可能存在問題。隨機(jī)生成兩個(gè)長(zhǎng)度為500的白噪聲信號(hào),f1(t)和f2(t),如圖1(a)和(b)表示,二者的全局相關(guān)系數(shù)趨于零,LRCC(見圖1(c))表現(xiàn)為低于置信度的雜亂無(wú)章的值。
((a)和(b)為兩組白噪聲時(shí)間序列(紅線)及其局域均值(藍(lán)線),(c)為L(zhǎng)RCC,(d)為SRCC。(a) and (b) two series of the white noise (red lines) and the local means (blue lines); (c) LRCC; (d) SRCC.)
如果在兩個(gè)時(shí)間序列的150-350處分別加上常數(shù)a1和a2,
A1(t)=f1(t)+a1;A2(t)=f2(t)+a2。
(5)
常數(shù)取值為:
(6)
公式(5)式的時(shí)間序列示于圖2(a),(b)。我們期待,在加上常數(shù)的時(shí)間段有比較高的相關(guān)性。比如:若時(shí)間序列表達(dá)的是兩地的氣溫變化,常數(shù)都取為正值代表兩地在一段時(shí)間內(nèi)氣溫都出現(xiàn)升高,二者應(yīng)該體現(xiàn)為正相關(guān)。然而,LRCC(見圖2(c))并沒有體現(xiàn)這種期待,而是與沒有加上常數(shù)的結(jié)果(見圖1(c))幾乎相同。這個(gè)不合常理的結(jié)果難以解釋。
((a)和(b)為兩組加上常數(shù)偏差的白噪聲時(shí)間序列(紅線)及其局域均值(藍(lán)線),(c)為L(zhǎng)RCC,(d)為SRCC。(a) and (b) two series of the white noise defined by Eq. (5) (red lines) and the local means (blue lines); (c) LRCC; (d) SRCC.)
趙等[2]指出,LRCC的問題是:不僅數(shù)據(jù)本身隨時(shí)間變化,而且按照(4)式計(jì)算的兩組局域均值(圖1(a)、(b)和圖2(a)、(b)中的藍(lán)色線)也隨時(shí)間變化;LRCC反映了數(shù)據(jù)距平之間的相關(guān)性變化,卻沒能反映均值隨時(shí)間變化的相關(guān)性,因此漏掉了重要的信息。而SRCC算法如(7)式所示[2],即
(7)
雖然文獻(xiàn)[2]提出了SRCC算法,并且給出了一些應(yīng)用實(shí)例,但該算法并沒有在數(shù)學(xué)上得到證明。針對(duì)這個(gè)問題,文獻(xiàn)[3]對(duì)該算法進(jìn)行了深入研究,在數(shù)學(xué)上證實(shí)了該算法的正確性和唯一性。數(shù)學(xué)證明的依據(jù)是不同時(shí)間段之間滑動(dòng)相關(guān)系數(shù)取值應(yīng)該具有可比性。該文提出,滑動(dòng)相關(guān)系數(shù)在任意兩個(gè)時(shí)間段的取值都是應(yīng)該可以相互比較的,即相關(guān)系數(shù)相同意味著相關(guān)性相同,否則滑動(dòng)相關(guān)系數(shù)就失去了意義。
(圖中x軸和y軸為兩個(gè)時(shí)間序列數(shù)據(jù)的取值,不同顏色的陰影區(qū)代表不同窗口的數(shù)據(jù)散布點(diǎn)。(a) LRCC,帶有不同均值和帶有相同均值
文獻(xiàn)[2]得出了SRCC和LRCC,也就是Rs(i)和Rr(i)之間的關(guān)系,
Rs(i) =Rr(i)cosγxcosγy+ sinγxsinγy。
(8)
其中
(9)
(10)
從(8)式可以看出,SRCC實(shí)際上是LRCC與1加權(quán)的結(jié)果,LRCC的權(quán)重稱為余弦權(quán)重,而1的權(quán)重稱為正弦權(quán)重。以2 m氣溫和500 hPa氣溫(見圖4(a)、(b))為例,給出了LRCC(見圖4(c))和SRCC(見圖4(d))之間的權(quán)重關(guān)系。
(2 m和500 hPa氣溫?cái)?shù)據(jù)來(lái)自NCEP/NCAR Reanalysis 1。(a)2 m氣溫距平(紅線)及其局域均值(藍(lán)線);(b)500 hPa氣溫距平(紅線)及其局域均值(藍(lán)線);(c)LRCC;(d)SRCC; (e)余弦權(quán)重cosγx cosγy ;(f)正弦權(quán)重sinγx sinγy 。 2 m and 500 hPa air temperature are from NCEP/NCAR Reanalysis 1. (a) 2 m temperature anomalies (red line) and its local mean (blue line); (b) 500 hPa temperature anomalies (red line) and its local mean (blue line); (c)LRCC; (d)SRCC; (e) cosine right cosγx cosγy ; (f) sine right sinγx sinγy .)
結(jié)果表明,兩者之間的主導(dǎo)關(guān)系是正弦權(quán)重(見圖4(f)),因而SRCC在大部分時(shí)間的值接近1。而在2000年前后的一段時(shí)間,余弦權(quán)重占優(yōu)勢(shì)(見圖4(e)),SRCC與LRCC更為接近。類似更多的例子見文獻(xiàn)[2]。
這個(gè)結(jié)果的物理意義可以從(9)式看出。正弦權(quán)重大表明均值差的貢獻(xiàn)大,意味著局域均值與全局均值有比較大的差異,相關(guān)系數(shù)趨于1;而余弦權(quán)重大代表距平的貢獻(xiàn)比較大,得到的SRCC與LRCC接近。這個(gè)結(jié)果進(jìn)一步表明,如果距平變化強(qiáng)烈,均值差別不大,兩個(gè)相關(guān)系數(shù)非常接近;而如果距平變化微小而均值變化很大,則相關(guān)系數(shù)趨于1;在一般情況下,相關(guān)系數(shù)是這二者的組合。
雖然權(quán)重的大小決定了SRCC的取值,但是我們還是更關(guān)心其反映的物理意義。如果我們粗略地將信號(hào)中時(shí)間尺度小于時(shí)間窗口的認(rèn)為是高頻信號(hào),大于時(shí)間窗口的為低頻信號(hào),則正弦權(quán)重反映了信號(hào)中低頻信號(hào)所占的相對(duì)比重,而余弦權(quán)重為高頻信號(hào)的相對(duì)比重。從(8)式可以看出,LRCC主要體現(xiàn)了高頻信號(hào)之間的相關(guān)性,而SRCC既體現(xiàn)了高頻信號(hào)之間的相關(guān)性,也體現(xiàn)了低頻信號(hào)之間的相關(guān)性。也就是說,當(dāng)信號(hào)變化以高頻為主時(shí),兩個(gè)相關(guān)系數(shù)差別不大(見圖1(c)、(d)),而以低頻信號(hào)為主時(shí),二者有明顯的差別(見圖2(c)、(d))。如果兩個(gè)時(shí)間序列高頻信號(hào)微弱,而低頻信號(hào)差異很大,兩個(gè)相關(guān)系數(shù)給出的結(jié)果有明顯差別。
圖5給出北京氣壓(見圖5(a))與廣州氣壓(見圖5(b))之間的滑動(dòng)相關(guān)系數(shù)。在高頻成分中,二者體現(xiàn)了相似的變化規(guī)律,因而LRCC體現(xiàn)了正相關(guān)為主的態(tài)勢(shì)(見圖5(c))。而在低頻成分中,二者體現(xiàn)了不同的態(tài)勢(shì),北京氣壓在1995—2000年之間發(fā)生了階躍式的升高,而廣州的氣壓卻出現(xiàn)了兩次階躍式下降。我們核對(duì)了兩地的氣象站,其間并沒有搬遷和移位情況,氣壓的低頻變化應(yīng)與氣候系統(tǒng)的整體變化有關(guān)。SRCC體現(xiàn)了二者很高的負(fù)相關(guān),很好地展示了這種階躍式的變化,全局相關(guān)系數(shù)為-0.755,與SRCC的多年平均值非常一致;而LRCC則并未體現(xiàn)這種負(fù)相關(guān)的態(tài)勢(shì),其平均相關(guān)系數(shù)是正值,與全局相關(guān)系數(shù)相差甚遠(yuǎn)。
((a)北京及(b)廣州月均氣壓(紅線)及其局域均值(藍(lán)線),單位:hPa。(c)為L(zhǎng)RCC,(d)為SRCC。月均氣壓數(shù)據(jù)來(lái)自中國(guó)氣象局?jǐn)?shù)據(jù)中心。Monthly air pressure (red lines) and its local means (blue lines) in (a) Beijing and (b) Guangzhou with unit hPa; (c) LRCC; (d) SRCC. Monthly air pressure data are from China Meteorological Data Service Center.)
上節(jié)明確指出了SRCC與LRCC的關(guān)系,證實(shí)了SRCC是具有可比性要求的RCC,也是全面反映數(shù)據(jù)中各種頻率信號(hào)之間合成相關(guān)性的RCC。本節(jié)將介紹SRCC的主要應(yīng)用范疇。
前面2.5節(jié)提到,SRCC的一個(gè)重要特點(diǎn)就是包含了高頻和低頻信息。在很多情況下,人們會(huì)由于低頻信號(hào)的持久性而予以更多的關(guān)注。尤其是那些低頻信號(hào)很強(qiáng)的情形,SRCC有特殊的意義。
文獻(xiàn)[3]給出了一個(gè)例子。北京和紐約兩個(gè)城市的緯度非常接近,都在40°N 左右,分處于東西半球。北京(見圖6(a))與紐約(見圖6(b))的氣溫變化之間相關(guān)性由LRCC(見圖6(c))和SRCC(見圖6(d))確定。二者之間有一定的相似性,但在細(xì)節(jié)上,SRCC更加光滑,體現(xiàn)了低頻特性的貢獻(xiàn)。首先,2009年之前,SRCC以正相關(guān)為主,體現(xiàn)了地球上氣溫變化及全球變暖的整體一致性。而在2009年突然呈現(xiàn)負(fù)相關(guān),我們認(rèn)為與近些年北極變暖有關(guān)[18];產(chǎn)生這種現(xiàn)象的原因是北極變暖條件下大氣羅斯貝駐波振幅增大[19],導(dǎo)致冷空氣交替從美洲和亞洲流出,東西半球氣溫呈現(xiàn)蹺蹺板式的振蕩,因而發(fā)生負(fù)相關(guān)。例如,紐約在2009—2013年冬季都發(fā)生了極寒天氣,而北京在2014—2015年發(fā)生極寒天氣。第二,即使在2009年之前以正相關(guān)為主的期間,SRCC也體現(xiàn)了明顯的周期性變化,變化周期為3年左右。這種相關(guān)性體現(xiàn)了東西半球之間變化的整體一致性和蘊(yùn)含的微小差異,需要深入研究。
類似的例子還有很多,表明SRCC對(duì)于揭示低頻信號(hào)的變化有重要意義。但是,相關(guān)的研究還很少[20-22]。按照第1節(jié)的介紹,下面引用的兩篇文章實(shí)際上也是用SRCC完成的[23-24]。
前面介紹的都是物理量之間隨時(shí)間變化的相關(guān)性。SRCC在研究空間變化中有特殊的價(jià)值。在某一地區(qū)發(fā)生的變化有可能會(huì)影響其周邊一定范圍的地區(qū),也就是說,其周圍一些點(diǎn)的變化與該點(diǎn)的變化具有高度的一致性。按照時(shí)空一致性原則,越是低頻的現(xiàn)象,發(fā)生的時(shí)間越長(zhǎng),影響的范圍就越大。由于SRCC滿足了可比性的要求,可以將不同空間點(diǎn)之間的滑動(dòng)相關(guān)系數(shù)進(jìn)行比較,因此可以計(jì)算逐點(diǎn)的SRCC,然后將空間各點(diǎn)同一時(shí)間窗口的結(jié)果組合起來(lái),體現(xiàn)現(xiàn)象的空間特征,找出某種變化的影響范圍。該過程的影響范圍之內(nèi)的點(diǎn)發(fā)生的變化應(yīng)該與該過程有明顯的正相關(guān)。如果某點(diǎn)出現(xiàn)在中心過程之外,就會(huì)表現(xiàn)為沒有明顯的正相關(guān)。如果空間出現(xiàn)明顯的濤動(dòng)現(xiàn)象,就會(huì)表現(xiàn)出很強(qiáng)的負(fù)相關(guān)。
((a)北京和(b)紐約12點(diǎn)滑動(dòng)平均的表面氣溫(℃)(紅線)及其局域均值(藍(lán)線);(c) LRCC; (d) SRCC。表面氣溫?cái)?shù)據(jù)來(lái)自NCEP/NCAR Reanalysis 1。Surface air temperature (unit: °C) (red lines) and their local means (blue lines) in (a) Beijing and (b) New York with 12-points average; (c) LRCC; (d) SRCC. Surface air temperature data are from NCEP/NCAR Reanalysis 1.)
圖7 北極濤動(dòng)指數(shù)(紅線)和北極濤動(dòng)核心區(qū)平均氣壓的負(fù)值(藍(lán)線)(引自文獻(xiàn)[23])Fig. 7 Arctic oscillation index (red line) and average sea level air pressure of the Arctic oscillation core region (blue line)(from reference[23])
以北極濤動(dòng)(Arctic oscillation,AO)為例,AO是北半球的重要現(xiàn)象,是對(duì)20°N以北海面氣壓場(chǎng)(Sea level pressure,SLP)進(jìn)行經(jīng)驗(yàn)正交分解(Empirical orthogonal function, EOF)得到的第一模態(tài),其時(shí)間系數(shù)稱為北極濤動(dòng)指數(shù)(AOI),與氣壓變化的符號(hào)相反。AOI(見圖7紅線)體現(xiàn)了北半球大氣環(huán)流的整體變化特征,對(duì)北半球的很多現(xiàn)象都有影響。我們將北半球各點(diǎn)的SLP與AOI計(jì)算滑動(dòng)相關(guān),以找出AO的影響范圍。
圖8以AOI為參考變量,將北冰洋內(nèi)的各點(diǎn)SLP(來(lái)源:NCEP/NCAR再分析數(shù)據(jù))與AOI(來(lái)源:NOAA氣候預(yù)報(bào)中心)計(jì)算SRCC,其中,位于北歐海內(nèi)的A點(diǎn),體現(xiàn)非常完好的負(fù)相關(guān)。其他點(diǎn)也以負(fù)相關(guān)為主,體現(xiàn)了AO在北冰洋內(nèi)有很大的影響范圍。
圖8 用AOI與各點(diǎn)氣壓的SRCC表達(dá)的AO對(duì)北冰洋各個(gè)區(qū)域的影響(引自文獻(xiàn)[23])Fig. 8 Impact of Arctic oscillation on different regions in the Arctic Ocean by SRCC between AOI and SLP in these points(from reference[23])
基于我們對(duì)SRCC的理解,相關(guān)性好固然是體現(xiàn)相關(guān)性有意義的結(jié)果,相關(guān)性不好同樣體現(xiàn)了重要的信息。例如,在負(fù)相關(guān)為主導(dǎo)的區(qū)域在有些時(shí)間段發(fā)生了相關(guān)性很差,甚至是正相關(guān)的特征,我們將這種與主導(dǎo)相關(guān)性不一致的現(xiàn)象稱為“異常事件”。對(duì)整個(gè)北半球所有格點(diǎn)計(jì)算滑動(dòng)相關(guān)系數(shù),找出異常事件最靠北的位置,連接起來(lái),得到一個(gè)個(gè)影響北極的重要事件(見圖9);正是這些異常事件影響北冰洋,導(dǎo)致SLP與AOI的滑動(dòng)相關(guān)特性發(fā)生顯著變化。圖9表明,大多數(shù)異常事件都可以找到原因,1982/1983和1996/1997的異常事件是20世紀(jì)最強(qiáng)的兩次厄爾尼諾事件,其對(duì)遙遠(yuǎn)的北冰洋有明顯影響。其他的異常事件也可以從北太平洋的其他變化中得出[23]。
圖9還給出,在北歐海附近存在一個(gè)特殊的區(qū)域,該區(qū)域在過去的大半個(gè)世紀(jì)從來(lái)沒有發(fā)生過異常事件,其中各點(diǎn)的氣壓變化總是與AOI呈負(fù)相關(guān)。將該區(qū)域所有點(diǎn)的氣壓進(jìn)行平均,得到的結(jié)果(見圖7藍(lán)線)與AOI的相關(guān)系數(shù)達(dá)到-0.945,二者非常一致,幾乎可以相互替換,我們命名這個(gè)區(qū)域?yàn)楸睒O濤動(dòng)核心區(qū)(Arctic oscillation core region,AOCR)。該區(qū)域只占北半球面積的0.5%,但是其氣壓場(chǎng)竟然與AOI高度一致,不能不認(rèn)為該區(qū)域?qū)O的構(gòu)成有特別重要的意義。
SRCC能夠把時(shí)間變化的空間特征找出來(lái),是這個(gè)方法的重要用途。主要原因是SRCC充分滿足了可比性的要求,而LRCC不能體現(xiàn)與相鄰點(diǎn)的關(guān)系,因而不同點(diǎn)的LRCC值不具有可比性。因而,LRCC只能用于時(shí)間過程的相關(guān)性分析,而SRCC可以用于時(shí)空變化過程的分析(見下節(jié))。
(圖中的鋸齒線為發(fā)生異常事件的外緣。The dentate lines are the margins of the abnormal events.)
地球科學(xué)中常用到時(shí)空變化的數(shù)據(jù)(空間二維、時(shí)間一維),EOF方法是分析時(shí)空變化數(shù)據(jù)的有效方法[25],得到非常廣泛的應(yīng)用。EOF的結(jié)果會(huì)得到一個(gè)空間結(jié)構(gòu)和一個(gè)時(shí)間系數(shù)[26],空間結(jié)構(gòu)體現(xiàn)為整體的空間分布特征,而時(shí)間系數(shù)體現(xiàn)了該參數(shù)隨時(shí)間的變化。例如,AO是對(duì)北半球20°以北SLP進(jìn)行EOF分析的結(jié)果[27],得到空間結(jié)構(gòu)圖(見圖10(a))和時(shí)間系數(shù)(見圖7紅線)。EOF有一個(gè)最大的缺點(diǎn),就是不能體現(xiàn)空間分布隨時(shí)間的變化,而事實(shí)上,氣壓場(chǎng)的空間結(jié)構(gòu)是隨時(shí)間變化的。這個(gè)問題在EOF的框架下沒有辦法解決。
而滑動(dòng)相關(guān)系數(shù)SRCC與EOF聯(lián)合使用就可以解決這個(gè)問題,我們采用SRCC計(jì)算各點(diǎn)SLP與AOI的相關(guān)性,得到逐月的相關(guān)系數(shù)場(chǎng)。將這些場(chǎng)進(jìn)行平均,得到的平均相關(guān)系數(shù)的分布如圖10(b)所示,與AO的空間結(jié)構(gòu)(見圖10(a))非常接近。除此之外,SRCC在每一個(gè)時(shí)間層都提供了空間結(jié)構(gòu)。圖11是SRCC每年1月相關(guān)系數(shù)的空間分布,給出了AO的空間變化特征[24]。可見,SRCC給出的相關(guān)系數(shù)有非常好的低頻特性,相關(guān)系數(shù)的空間分布經(jīng)常在幾年的時(shí)間內(nèi)有很高的一致性,體現(xiàn)了一種持續(xù)多年的特征,如1954—1956, 1971—1978, 1989—1995年都體現(xiàn)了長(zhǎng)時(shí)間的一致性。與此同時(shí),又可以將這些一致的多年特征分成若干歷史時(shí)期,每個(gè)時(shí)期的相關(guān)系數(shù)的空間分布又有所不同。將SRCC與EOF相結(jié)合可以得到非常豐富的空間變化信息。
圖10 (a)北極濤動(dòng)的空間結(jié)構(gòu)(填色,引自文獻(xiàn)[28])和(b)SRCC多年平均場(chǎng)(引自文獻(xiàn)[23])Fig. 10 (a)Spatial pattern of Arctic oscillation(shaded, from reference[28]) and (b)multiyear average of SRCC(from reference[23])
圖11 用SRCC空間變化表達(dá)的北極濤動(dòng)空間變化圖(引自文獻(xiàn)[24])Fig. 11 Spatially varied patterns of Arctic oscillation by SRCC at different time(from reference[24])
本文作為綜述性文章介紹了合成滑動(dòng)相關(guān)系數(shù)的理論和應(yīng)用成果。由于對(duì)SRCC的認(rèn)識(shí)時(shí)間尚短,該方法的深刻內(nèi)涵尚不為人熟知,我們希望通過本文推廣這種方法,有助于數(shù)據(jù)的分析和科學(xué)的發(fā)展。
常用的滑動(dòng)相關(guān)系數(shù)被稱為局域滑動(dòng)相關(guān)系數(shù)(LRCC),這種方法將計(jì)算相關(guān)系數(shù)的方法直接應(yīng)用到一個(gè)時(shí)間窗口,得到相關(guān)系數(shù)隨時(shí)間的變化。LRCC從1928年沿用至今,并未有人懷疑它的正確性。然而,LRCC在一些情況下并沒有很好地體現(xiàn)實(shí)際的相關(guān)性。
LRCC只反映了兩個(gè)時(shí)間序列距平變化之間的相關(guān)性,沒有體現(xiàn)各個(gè)窗口均值變化之間的相關(guān)性,因而是一個(gè)不完整的滑動(dòng)相關(guān)系數(shù)。利用全部長(zhǎng)度的數(shù)據(jù)來(lái)計(jì)算均值(全局均值),可以得到一個(gè)新的滑動(dòng)相關(guān)系數(shù),命名為合成滑動(dòng)相關(guān)系數(shù)(SRCC)。SRCC算法背后有深刻的物理內(nèi)涵:在計(jì)算一個(gè)窗口的相關(guān)系數(shù)時(shí),不能認(rèn)為這個(gè)窗口內(nèi)的數(shù)據(jù)與其他窗口的數(shù)據(jù)毫無(wú)關(guān)聯(lián),而全局均值恰恰體現(xiàn)了各個(gè)窗口數(shù)據(jù)之間的聯(lián)系,各個(gè)窗口的數(shù)據(jù)都以其對(duì)全局均值的貢獻(xiàn)而進(jìn)行度量。
對(duì)SRCC算法進(jìn)行了深入的研究認(rèn)識(shí)到,SRCC與LRCC的根本區(qū)別在于是否考慮了均值的變化。SRCC實(shí)際上是由LRCC和1加權(quán)構(gòu)成的,當(dāng)距平變化占優(yōu)勢(shì)時(shí),SRCC趨于LRCC,而當(dāng)均值變化占優(yōu)勢(shì)時(shí),SRCC趨于1。如果籠統(tǒng)地將數(shù)據(jù)分為高頻變化和低頻變化,距平的變化體現(xiàn)了高頻變化,LRCC描述了高頻信號(hào)之間的相關(guān)性;而均值的變化體現(xiàn)為低頻變化,SRCC對(duì)高頻變化和低頻變化同時(shí)進(jìn)行了描述。結(jié)果表明,雖然SRCC全面體現(xiàn)了各種頻率現(xiàn)象之間的相關(guān)性,但LRCC并非需要淘汰;如果研究人員對(duì)于高頻變化有興趣仍可以使用LRCC進(jìn)行分析。
通過對(duì)SRCC算法進(jìn)行論證,該方法上升到理論的高度,成為一種可信的方法。該方法的數(shù)學(xué)證明是基于一個(gè)基本要求,即不同時(shí)間窗口獲得的相關(guān)系數(shù)取值一定要有可比性,即高相關(guān)性一定代表了兩個(gè)時(shí)間序列的一致性。從這個(gè)基礎(chǔ)出發(fā),證實(shí)了SRCC是符合可比性要求的滑動(dòng)相關(guān)系數(shù)算法。
正是由于可比性得到得了保障,在空間不同位置獲得的SRCC都可以相互比較,形成了每一個(gè)時(shí)間層相關(guān)系數(shù)的空間分布,成為分析時(shí)空三維數(shù)據(jù)的一種新方法。我們應(yīng)用這種方法可以通過較高的相關(guān)系數(shù)找出某物理過程的影響范圍,認(rèn)識(shí)該過程在整個(gè)空間的分布特征;也可以通過相關(guān)性不好的時(shí)間段來(lái)確定異常事件的發(fā)生,深入認(rèn)識(shí)異常事件的影響范圍和演化過程,成功地描述了某物理過程的時(shí)空變化。
進(jìn)一步的應(yīng)用表明,SRCC可以與經(jīng)驗(yàn)正交分解(EOF)方法聯(lián)合使用,消除了EOF結(jié)果只有一個(gè)空間結(jié)構(gòu)分布和一條時(shí)間變化曲線的不足,可以對(duì)每個(gè)時(shí)間層給出相關(guān)系數(shù)的空間分布,清楚地展現(xiàn)其影響范圍的演化過程,取得其他方法所無(wú)法取得時(shí)空變化的分析結(jié)果。
由此可見,SRCC的研究揭示了滑動(dòng)相關(guān)系數(shù)的實(shí)質(zhì),在數(shù)學(xué)上和物理上都與人們的認(rèn)知一致并得到充分證明,得到的結(jié)果全面體現(xiàn)了兩個(gè)過程的滑動(dòng)相關(guān)特性?;瑒?dòng)相關(guān)本來(lái)是一個(gè)時(shí)域的分析算法,而SRCC不僅可以用于時(shí)域分析,而且可以拓展到時(shí)空變化領(lǐng)域進(jìn)行應(yīng)用,揭示了數(shù)據(jù)中包含的全新過程。相信SRCC將在科學(xué)研究中發(fā)揮重要作用。