葉小嶺, 陳 昕, 熊 雄, 闞亞進(jìn), 王佐鵬
(1.南京信息工程大學(xué)自動(dòng)化學(xué)院, 南京 210044; 2.南京信息工程大學(xué)氣象災(zāi)害預(yù)報(bào)預(yù)警與評(píng)估協(xié)同創(chuàng)新中心, 南京 210044)
近年來(lái)全球變暖趨勢(shì)愈發(fā)明顯,氣溫變化給社會(huì)生產(chǎn)生活帶來(lái)了嚴(yán)重的影響[1-2],對(duì)于氣溫變化有效的研究可以為氣候預(yù)測(cè)、災(zāi)害預(yù)警等方面提供科學(xué)的幫助,為此中外學(xué)者進(jìn)行了許多有意義的研究[3-4]。就中國(guó)而言,對(duì)全國(guó)氣候變化、特殊地區(qū)(高原和盆地等)氣溫以及極端氣溫變化特征的研究取得了許多成果,如謝星旸等[5]與彭凱等[6]分別對(duì)中國(guó)的冬季與春季氣溫變化規(guī)律進(jìn)行了研究與分析;而在特殊地形如青藏高原、新疆塔里木盆地等不同地區(qū),朱伊等[7]與鄭奕等[8]分別對(duì)此進(jìn)行了溫度的時(shí)空變化研究;此外,對(duì)現(xiàn)代氣象災(zāi)害預(yù)警具有重大意義的極端氣溫變化方面,也有許多專家進(jìn)行研究,如高麗等[9]基于美國(guó)國(guó)家環(huán)境預(yù)報(bào)中心-全球集合預(yù)報(bào)系統(tǒng)(NCEP-GEFS)資料對(duì)中國(guó)極端氣溫變化特征進(jìn)行了分析;江曉菲等[10]則模擬分析了中國(guó)未來(lái)極端氣溫變化的概率估計(jì)及其不確定性。中國(guó)學(xué)者不僅對(duì)全國(guó)、特殊地區(qū)抑或是冬季、春季、極端氣溫等較大較特殊的方面研究較為充分,對(duì)小地區(qū)或者特例地區(qū)的細(xì)致研究方面也有涉及,如李葉妮[11]等對(duì)營(yíng)口地區(qū)的氣溫從多時(shí)間尺度的角度進(jìn)行了研究與分析。
同時(shí),在方法層面上,對(duì)于傳統(tǒng)的相關(guān)性分析、回歸分析、Mann-Kendall趨勢(shì)和突變檢驗(yàn)、經(jīng)驗(yàn)正交函數(shù)分解(empirical orthogonal function,EOF)等方法,宋偉等[12]對(duì)此做了很好的應(yīng)用,成功分析了中國(guó)東部冬季與北極近地面溫度變化的聯(lián)系;尹義星等[13]則對(duì)中國(guó)江蘇省的氣溫變化趨勢(shì)以及極端氣溫做了相應(yīng)的研究。與此同時(shí),國(guó)外的學(xué)者如Hannachi等[14]、Worku等[15]對(duì)EOF算法及Mann-Kendall檢驗(yàn)方法進(jìn)行了改進(jìn),且對(duì)研究對(duì)象的選取也進(jìn)行了新的嘗試,成功地將傳統(tǒng)方法改進(jìn)并應(yīng)用到全球范圍內(nèi)的氣溫分析當(dāng)中去。
經(jīng)探討存在以下兩個(gè)問(wèn)題:①分析方法多選取線性趨勢(shì)分析、相關(guān)系數(shù)分析、Mann-Kendall檢驗(yàn)及EOF等方法,在方法層面仍有改進(jìn)空間;②由于氣溫分析多在年時(shí)間尺度下進(jìn)行,分析面不夠細(xì)致,對(duì)季度、月度、日夜時(shí)間尺度下的氣溫變化,如區(qū)域性與季節(jié)性差異[16-17]等,可以進(jìn)行深層次的研究。因此現(xiàn)引入核密度估計(jì)算法并采用自適應(yīng)以及粒子群算法加以改進(jìn),研究該算法在不同時(shí)間尺度下的靈敏度,并將該算法應(yīng)用于區(qū)域的氣溫分析,期望得到更好更精細(xì)的效果,為分析氣溫時(shí)空變化以及影響特征作為參考。
所用的數(shù)據(jù)來(lái)源于國(guó)家氣象中心,包含江蘇省13個(gè)城市75個(gè)地區(qū)的地面觀測(cè)站1951—2009年地面定時(shí)(02:00、08:00、14:00、20:00)觀測(cè)資料(6 h氣溫),已經(jīng)過(guò)傳統(tǒng)質(zhì)量控制,明顯的粗大誤差已被剔除。經(jīng)篩選后選取1961—2008年江蘇省12個(gè)城市:徐州(站號(hào):58027)、宿遷(站號(hào):58131)、連云港(站號(hào):58044)、淮安(站號(hào):58141)、揚(yáng)州(站號(hào):58245)、南京(站號(hào):58238)、鎮(zhèn)江(站號(hào):58248)、常州(站號(hào):58343)、鹽城(站號(hào):58154)、無(wú)錫(站號(hào):58354)、蘇州(站號(hào):58349)、南通(站號(hào):58259)的氣溫6 h數(shù)據(jù)以及月平均數(shù)據(jù)作為基礎(chǔ)資料進(jìn)行數(shù)據(jù)預(yù)處理,取08:00與14:00氣溫的平均值作為日均溫,取20:00與02:00氣溫的平均值作為夜均溫,取12月—次年2月為冬季度均溫,3—5月為春季度均溫,6—8月為夏季度均溫,9—11月為秋季度均溫。
核密度估計(jì)(kernel density estimation,KDE)算法由Rosenblatt[18]和Parzen[19]提出。與參數(shù)估計(jì)方法相比,其優(yōu)點(diǎn)在于對(duì)觀測(cè)資料的分布不附加任何假定,也不需要了解分布的先驗(yàn)知識(shí),利用樣本數(shù)據(jù)直接得到函數(shù)的密度估計(jì),從而對(duì)數(shù)據(jù)進(jìn)行可視化的解釋。
假設(shè)(x1,x2,…,xn)為單站點(diǎn)下n個(gè)時(shí)間觀測(cè)樣本變量,則密度函數(shù)公式為
(1)
(2)
由于固定窗寬不能夠有效反映數(shù)據(jù)的稀疏程度帶來(lái)的影響,因此需要引用自適應(yīng)算法(adaptive algorithm)進(jìn)行改進(jìn),同時(shí)本文在自適應(yīng)算法改進(jìn)的基礎(chǔ)上進(jìn)一步提出粒子群(particle swarm optimization,PSO)優(yōu)化的方法,最終改進(jìn)后的自適應(yīng)核密度估計(jì)(adaptive kernel density estimation algorithm improved by particle swarm optimization, PA-KDE)算法公式為
(3)
(4)
結(jié)合窗寬系數(shù)λ代入式(4)即可得到式(3),下面圍繞改進(jìn)后得到的PA-KDE算法進(jìn)行相應(yīng)的靈敏度試驗(yàn)與分析以及算法在江蘇地區(qū)的應(yīng)用與分析,算法的流程如圖1所示。
圖1 算法改進(jìn)及應(yīng)用流程圖Fig.1 Flow chart of algorithm improvement and application
依據(jù)圖1所示,左邊由經(jīng)典的KDE算法按照所提出的改進(jìn)方法得到新的PA-KDE算法,在此基礎(chǔ)上利用固定窗寬、最優(yōu)窗寬以及改進(jìn)后的自適應(yīng)窗寬下的三種KDE算法分多站點(diǎn)以及多時(shí)間尺度地進(jìn)行靈敏度分析,最后結(jié)合新的PA-KDE算法與江蘇地區(qū)預(yù)處理后的地面氣溫觀測(cè)資料分區(qū)域與季節(jié)對(duì)結(jié)果進(jìn)行分析,并進(jìn)行相應(yīng)的結(jié)論總結(jié)與討論。
為測(cè)試PA-KDE算法在多站點(diǎn)下對(duì)不同時(shí)間尺度的氣溫?cái)?shù)據(jù)的靈敏度,由于窗寬對(duì)于靈敏度的影響最為關(guān)鍵,選取改進(jìn)前KDE算法中的固定窗寬(fixed h,F(xiàn)_H)、最優(yōu)窗寬(optimal h,O_H)與改進(jìn)后PA-KDE算法中的自適應(yīng)窗寬(adaptive h,A_H)進(jìn)行對(duì)比試驗(yàn),依次進(jìn)行季度均溫下不同站點(diǎn)(根據(jù)試驗(yàn)結(jié)果,選取徐州、連云港、南京、南通四站進(jìn)行展示,如圖2所示)的試驗(yàn)以及多時(shí)間尺度(季度、月度以及日夜)下單個(gè)站點(diǎn)(以徐州為例,如圖3所示)的均溫對(duì)比試驗(yàn),并利用平均絕對(duì)誤差(mean absolute error,MAE)、均方根誤差(root mean square error,RMSE)、納什系數(shù)(Nash-Sutcliffe model efficiency coefficient,NSC)和觀察者一致性(interobserver,IOA)指標(biāo)對(duì)靈敏度進(jìn)行評(píng)價(jià)。MAE與RMSE表示預(yù)測(cè)精度,值越小表示精度越高;NSC和IOA用來(lái)度量擬合優(yōu)度,值越大且越接近1表示擬合優(yōu)度越高。
分析圖2可得,在MAE與RMSE指標(biāo)下A_H算法得出的值最小,O_H算法得出的值最大,表明O_H算法在預(yù)測(cè)精度上不適用于江蘇省地面氣溫觀測(cè)資料季度均溫;在NSC與IOA指標(biāo)下可以看出A_H算法得出的值最大且接近1,O_H算法得出的值最小,表明在擬合優(yōu)度上,O_H算法也不適用;而A_H算法無(wú)論是預(yù)測(cè)精度還是擬合優(yōu)度都好于其他兩種算法,F(xiàn)_H算法效果介于兩者之間,且固定窗寬算法沒(méi)有普適性,因此三種算法的試驗(yàn)效果為A_H> F_H> O_H。
圖2 季度尺度下三種算法在四站點(diǎn)的指標(biāo)對(duì)比Fig.2 Numerical comparison with indicators of three algorithms in the four city stations at the quarterly time scale
進(jìn)一步進(jìn)行靈敏度分析,分析圖3可得,在MAE與RMSE指標(biāo)下,A_H算法得出的值最小,O_H算法得出的值最大,且隨著時(shí)間尺度變小越來(lái)越接近,表明在預(yù)測(cè)精度上A_H算法效果最優(yōu),F(xiàn)_H與O_H算法在月度及日夜時(shí)間尺度下也可行,在季度時(shí)間尺度下的效果不佳;在NSC與IOA指標(biāo)下A_H算法得出的值最大,O_H算法得出的值最小,且同樣隨時(shí)間尺度變小而越來(lái)越接近,表明在擬合優(yōu)度上也是A_H算法效果最優(yōu),而F_H與O_H算法僅在日夜時(shí)間尺度下可行,在季度及月度時(shí)間尺度下的效果均不佳;整體看來(lái)三種算法效果A_H> F_H> O_H,且A_H算法的可行性與普適性最好。
根據(jù)試驗(yàn)結(jié)果,江蘇省12個(gè)站點(diǎn)的指標(biāo)信息綜合出的結(jié)論一致,因此提出徐州站點(diǎn)下不同時(shí)間尺度、不同算法的四項(xiàng)指標(biāo)數(shù)值信息作為參考,如表1所示??梢钥闯龈倪M(jìn)后的PA-KDE算法(使用自適應(yīng)窗寬A_H)就預(yù)測(cè)精度與擬合優(yōu)度方面在多站點(diǎn)與多尺度下?lián)碛懈己玫男Ч?,?duì)不同時(shí)間尺度以及不同站點(diǎn)的氣溫?cái)?shù)據(jù)有著很好的靈敏度,對(duì)于深入分析地面氣溫觀測(cè)資料在多時(shí)間尺度下的時(shí)空變化特征有著很好的幫助。
圖3 不同時(shí)間尺度下三種算法在徐州站指標(biāo)對(duì)比Fig.3 Numerical comparison with indicators of three algorithms in Xuzhou station at different time scales
表1 不同時(shí)間尺度下三種算法在徐州站點(diǎn)的各指標(biāo)數(shù)值
根據(jù)上述試驗(yàn)結(jié)果,采用PA-KDE算法對(duì)江蘇省12市地面氣溫觀測(cè)資料進(jìn)行季度、日、夜尺度下的試驗(yàn),結(jié)合不同影響因子對(duì)圖4~圖6的時(shí)空變化特征進(jìn)行分析。相比于現(xiàn)有的氣溫分析方法,PA-KDE算法可以包含更多的信息,因此需要分區(qū)域與季節(jié)的分析地面氣溫觀測(cè)資料在多時(shí)間尺度下的時(shí)空變化特征(趨勢(shì)、概率特征等)以及不同影響因子(氣候、地理位置、海洋調(diào)節(jié)等)的影響,其中曲線縱軸的數(shù)值代表了對(duì)應(yīng)氣溫值的概率特征,曲線在橫軸上的寬度代表了極端氣溫的極值,而曲線的陡峭程度則可以顯示出氣溫變化的趨勢(shì)。圖4~圖6為試驗(yàn)結(jié)果曲線圖。
圖4 徐州、宿遷、連云港、淮安站點(diǎn)在PA-KDE 下的季度、日、夜均溫曲線Fig.4 Curve of quarterly mean temperature, daily mean temperature and nightly mean temperature under the PA-KDE in Xuzhou, Suqian, Lianyungang, Huaian
圖5 揚(yáng)州、南京、鎮(zhèn)江、常州站點(diǎn)在PA-KDE 下的季度、日、夜均溫曲線Fig.5 Curve of quarterly mean temperature, daily mean temperature and nightly mean temperature under the PA-KDE in Yangzhou, Nanjing, Zhenjiang, Changzhou
圖6 鹽城、無(wú)錫、蘇州、南通站點(diǎn)在PA-KDE 下的季度、日、夜均溫曲線Fig.6 Curve of quarterly mean temperature, daily mean temperature and nightly mean temperature under the PA-KDE in Yancheng, Wuxi, Suzhou, Nantong
3.2.1 季度時(shí)間尺度下的氣溫分析
根據(jù)季度均溫曲線的三個(gè)峰值,假設(shè)以25 ℃以上代表夏季,15 ℃左右代表春秋季,5 ℃以下代表冬季進(jìn)行分析,其中曲線整體越往右代表均溫越高,f(x)的值越大代表均溫持續(xù)時(shí)間越長(zhǎng)。
季度均溫曲線圖分區(qū)域分析如下:根據(jù)季度均溫曲線的變化,將江蘇地區(qū)分為三大區(qū)域,分別為圖4四市所構(gòu)成的江蘇北部區(qū)域、圖5四市所構(gòu)成的江蘇西南內(nèi)陸區(qū)域以及圖6四市所構(gòu)成的江蘇東部及東南沿海區(qū)域。根據(jù)第一區(qū)域可以看出春秋季的f(x)值接近0.06,且隨著位置偏南以及偏東會(huì)有所降低,冬季與夏季的f(x)值在0.03左右,對(duì)比發(fā)現(xiàn)徐州與宿遷的四季均溫時(shí)長(zhǎng)接近,淮安春秋季均溫時(shí)長(zhǎng)稍短,連云港春秋季的時(shí)長(zhǎng)更短,原因分析:雖然四市同屬季風(fēng)氣候,但是徐州與宿遷為溫帶氣候,而淮安與連云港為溫帶與亞熱帶過(guò)渡氣候,且由于連云港靠海,還受到海洋作用的影響。第二區(qū)域相對(duì)于第一區(qū)域而言,春秋季的f(x)值降低,冬季與夏季的f(x)值升高,且整體季度均溫曲線往右偏移,其中南京除了曲線整體往右偏移外,整體曲線的頻次數(shù)值反而與第一區(qū)域近似。原因分析:該區(qū)域相對(duì)于第一區(qū)域整體偏南,屬于江蘇的內(nèi)陸地區(qū),同時(shí)南京作為經(jīng)濟(jì)較為發(fā)達(dá)的省會(huì)城市,經(jīng)濟(jì)環(huán)境對(duì)其均溫的升高也造成了一定影響。第三區(qū)域相比于前兩個(gè)區(qū)域而言,春秋季的f(x)值進(jìn)一步降低,冬季與夏季的f(x)值進(jìn)一步升高,且整體均溫更加往右偏移,原因分析:該區(qū)域相較于前兩個(gè)區(qū)域偏東及東南沿海,且氣候以亞熱帶季風(fēng)氣候與海洋氣候?yàn)橹?,其中鹽城由于地理位置偏北與海洋作用的影響,使得其整體均溫又向左偏移了回去。
結(jié)合圖7站點(diǎn)分布綜合分析:氣候的影響大于位置帶來(lái)的影響,位置越偏東南,春秋季均溫時(shí)長(zhǎng)越短,冬夏季均溫時(shí)長(zhǎng)越長(zhǎng),且整體均溫越高,溫度變化越穩(wěn)定,海洋調(diào)節(jié)作用一定程度上彌補(bǔ)了位置偏東南帶來(lái)的影響。
圖7 江蘇省12市站點(diǎn)分布Fig.7 Distribution of 12 cities in Jiangsu Province
3.2.2 日、夜時(shí)間尺度下的氣溫分析
日、夜均溫曲線圖分析如下,日、夜均溫?cái)?shù)據(jù)量較大且f(x)曲線在橫軸上較長(zhǎng),假設(shè)以25 ℃以上代表夏季,15 ℃左右代表春秋季,5 ℃以下代表冬季,為了便于交叉驗(yàn)證,將曲線分季節(jié)進(jìn)行分析。
日、夜均溫夏季曲線部分有四種情形:①日間均溫曲線位于夜間均溫曲線偏右上方,圖4宿遷、連云港、淮安三市日間均溫的f(x)值比夜間均溫略高,圖6(a)鹽城則高出許多,原因分析:以上四市位于江蘇省北部,其中鹽城受海洋調(diào)節(jié)作用影響,該區(qū)域日均溫高于夜均溫且日間的高溫持續(xù)時(shí)間也比夜間長(zhǎng)。②日間均溫曲線位于夜間均溫曲線右下方,僅圖4(a)徐州市呈現(xiàn)這種情況,原因分析:徐州位于江蘇省最西北部,且屬于溫帶季風(fēng)氣候,該市日均溫略高于夜均溫但是日間高溫時(shí)長(zhǎng)低于夜間。③日間均溫曲線在夜間均溫曲線的右邊,f(x)值大小大致持平,圖5揚(yáng)州、南京、鎮(zhèn)江、常州四市均溫趨勢(shì)如此,原因分析:以上四市位于江蘇省西南及中部,相較于前兩種情形位置偏南,日均溫時(shí)長(zhǎng)有所降低。④日間均溫曲線高于夜間均溫曲線且夜間均溫曲線有波動(dòng),圖6中無(wú)錫、蘇州、南通三市均溫趨勢(shì)如此,原因分析:以上三市位于東南沿海區(qū)域,均屬于亞熱帶季風(fēng)氣候與海洋氣候,相較于第三種情況,以上三市夜間氣溫有所降低且波動(dòng),海洋調(diào)節(jié)對(duì)夜間氣溫影響較大,另外,隨著氣候從溫帶季風(fēng)向亞熱帶季風(fēng)以及海洋氣候變化的同時(shí),均溫曲線整體偏右移。
結(jié)合圖7站點(diǎn)分布綜合分析:氣候影響均溫的變化趨勢(shì),位置則影響均溫的持續(xù)時(shí)長(zhǎng),海洋調(diào)節(jié)則會(huì)同時(shí)提高日均溫與其時(shí)長(zhǎng),會(huì)降低夜均溫且不穩(wěn)定,在位置一致的情況下,海洋性氣候與季風(fēng)性氣候帶來(lái)的影響差別不大。
日、夜均溫春秋季曲線圖分兩種情形:①日均溫與夜均溫之間曲線距離相差較大,代表夜均溫持續(xù)時(shí)長(zhǎng)高于日均溫;②日均溫與夜均溫之間曲線距離相近,呈現(xiàn)日、夜均溫持續(xù)時(shí)長(zhǎng)趨于一致;結(jié)合圖4~圖6位置與氣候特征分析:海洋調(diào)節(jié)的影響會(huì)使得春秋季夜均溫持續(xù)時(shí)長(zhǎng)增加,位置上越偏南,日夜均溫曲線之間的差距越大,夜均溫持續(xù)時(shí)長(zhǎng)比日均溫越高,海洋調(diào)節(jié)為春秋季均溫劃分的重要因素,其次各個(gè)區(qū)域間南北位置不同帶來(lái)差異,越靠近東南沿海,曲線差距越大。
日、夜均溫冬季曲線圖變化與春秋季相近,也分為兩種情形:①夜均溫曲線遠(yuǎn)高于日均溫,這也符合冬季晝短夜長(zhǎng)的現(xiàn)狀;②夜間均溫曲線略高于日均溫且較為貼近;結(jié)合圖4~圖6站點(diǎn)分布綜合分析:位置為冬季均溫產(chǎn)生差異的主要原因,位置越偏西北,冬季夜均溫持續(xù)時(shí)間越長(zhǎng),反之,越偏東南,冬季夜均溫持續(xù)時(shí)間越短,但始終高于日均溫,海洋調(diào)節(jié)作用下會(huì)使得冬季均溫下降。
引入統(tǒng)計(jì)學(xué)概率預(yù)測(cè)中的非參數(shù)核密度估計(jì)方法并采用自適應(yīng)與粒子群算法加以改進(jìn),對(duì)江蘇省12個(gè)站點(diǎn)的地面氣溫觀測(cè)資料分別進(jìn)行了試驗(yàn)并加以分析,可以得到以下結(jié)論。
(1)改進(jìn)的PA_KDE算法在季度、月度、日夜時(shí)間尺度下均擁有良好的預(yù)測(cè)精度與擬合優(yōu)度,擁有很好的可行性與普適性,為傳統(tǒng)方法開拓了新的時(shí)間尺度分析路徑。
(2) PA_KDE方法在江蘇每一個(gè)站點(diǎn)的試驗(yàn)結(jié)果都包含大量可供分析的信息,可以更為有效地深入分析地面氣溫觀測(cè)資料。該方案為討論氣溫時(shí)空變化以及影響特征提供借鑒。
(3)分析所得不同影響因子間存在的聯(lián)系、協(xié)同關(guān)系,值得后續(xù)氣象研究的深入。僅選擇了江蘇地區(qū)氣溫資料的分析,該方法還可以借鑒衍生到其他地區(qū)以及非氣象資料的分析中去。