• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      深圳地區(qū)日極值氣溫的降尺度研究

      2014-07-18 11:14:37李晴嵐
      集成技術 2014年2期
      關鍵詞:訓練樣本氣溫尺度

      武 楊 李晴嵐

      (中國科學院深圳先進技術研究院 深圳 518055)

      深圳地區(qū)日極值氣溫的降尺度研究

      武 楊 李晴嵐

      (中國科學院深圳先進技術研究院 深圳 518055)

      氣象與人類日常生活的關系十分密切,氣象預報一直是人類社會高度關注的問題。隨著經濟的發(fā)展和社會的進步,人類對天氣預報的準確性提出了越來越高的要求,迫切希望實現(xiàn)氣象要素精細化預報。獲取詳細準確的區(qū)域氣象資料是實現(xiàn)氣象精細化預報的首要條件,全球大氣環(huán)流模式是目前預估大尺度未來全球氣候變化最重要的模式,能較好地模擬出大尺度的平均特征。但是模式預報輸出的空間分辨率較低,無法獲取精細的區(qū)域氣象資料,很難對區(qū)域天氣情景變化做出詳細的預測,而降尺度方法可用于彌補這方面的缺陷。文章的研究工作主要是利用統(tǒng)計降尺度的多元線性回歸方法和 BP 神經網(wǎng)絡方法對深圳地區(qū)近十年的日最低溫度和最高溫度進行降尺度分析研究。采用的數(shù)據(jù)是美國國家環(huán)境預報中心/美國國家大氣研究中心提供的 FNL 全球分析資料和深圳國家基本觀測站——竹子林站的實際觀測數(shù)據(jù),重點研究了基于 BP 神經網(wǎng)絡方法和多元線性回歸方法的統(tǒng)計降尺度模型的設計與實現(xiàn)過程,并對兩種方法的結果進行了比較,為區(qū)域站點的統(tǒng)計降尺度應用提供了設計方法和參考。

      統(tǒng)計降尺度; 日極值氣溫;多元線性回歸;BP 神經網(wǎng)絡;深圳

      1 引 言

      隨著經濟的發(fā)展和社會的進步,天氣對社會的發(fā)展和人們的生產生活影響越來越大。氣象信息在農業(yè)生產、交通運輸、資源開發(fā)、旅游商務和軍事安全等各個領域中的指導作用也越來越重要。因此,社會的發(fā)展不僅要求氣象預報部門能夠提供傳統(tǒng)常規(guī)的天氣預報服務,而且還需要獲取高分辨率的氣象預報信息。降尺度方法是目前實現(xiàn)精細化預報、獲取高分辨率氣象信息的重要技術手段,主要可以分為基于發(fā)展更高分辨率數(shù)值預報模式的動力降尺度方法和基于已有大尺度預報產品的統(tǒng)計降尺度方法[1]。這兩種方法各有優(yōu)缺點:動力降尺度方法物理意義較為明確,是未來氣象預報領域長期發(fā)展的方向,但其計算量很大,模擬和適用范圍受限制;統(tǒng)計降尺度方法是通過統(tǒng)計學手段建立大尺度和小尺度之間的尺度轉換,計算量較小,經濟實用,并且不受區(qū)域限制。所以,統(tǒng)計降尺度方法十分適合基層氣象站點的推廣使用,是實現(xiàn)精細化預報相對直接有效的手段[2]。

      Kidson 等[3]運用了逐步回歸的統(tǒng)計降尺度方法對新西蘭地區(qū)的日最高氣溫和日最低氣溫進行了預測分析,同時也對同樣的數(shù)據(jù)資料使用了耦合 RAMS 區(qū)域模式的動力降尺度方法,但兩種不同的降尺度方法的結果差別不大;Murphy[4]也使用同樣的方法對所在區(qū)域進行了對比研究,得出了基本相同的結論。這說明了動力降尺度雖然耗時很大,但是在目前發(fā)展狀況下并沒有取得較統(tǒng)計降尺度具有明顯優(yōu)勢的效果。Sailor[5]對美國氣象觀測站點的氣溫進行了多元線性回歸的統(tǒng)計降尺度研究;Murphy[6]也使用了相同的方法對歐洲若干站點的氣溫觀測值進行了模擬,其預測均取得了一定的效果;Hellstrm 等[7]對瑞士的降水情況進行了研究,其結果相比原始的模式預報精確了很多,但是在不同季節(jié)時間存在一定的誤差;范麗軍[8]使用了逐步回歸的方法對中國華北地區(qū) 49 個氣象觀測站的資料進行了分析,并對各個氣象觀測站的月平均溫度進行了預測,與實際觀測對比后反映預測值與實際值有比較一致的趨勢,但是仍然存在部分時間段和部分氣象觀測點差別較大的現(xiàn)象。Huth 等[9]對歐洲 8 個氣象觀測站秋冬季逐日溫度進行統(tǒng)計降尺度研究,使用了多元線性回歸方法并從多個角度進行評價,證明了線性方法在一般情況下也可以取得較好的降尺度效果,但是在跨月變化時會存在較大誤差,Paulin[10]使用了 SDSM(Statistical Downscaling Model)對加拿大東南部日極端氣溫進行降尺度分析也存在這樣的現(xiàn)象。

      大氣運動是非線性的[11],因此,多元線性回歸方法描述大氣運動在理論上存在不足。為了反映大氣的非線性特征,非線性的降尺度方法,如神經網(wǎng)絡方法,也被應用到氣溫的降尺度分析中。

      美國 Neural Ware 公司是較早開展利用神經網(wǎng)絡進行氣象預報研究的[12],1987 年,該公司研究并設計了一套該地區(qū)基于人工神經網(wǎng)絡的晴雨預測系統(tǒng),該系統(tǒng)的輸入是地面氣壓和風向資料,輸出為逐日的晴雨預報,結果經過檢驗準確率略高于當?shù)仡A報員的水平;Baik 等[13]應用神經網(wǎng)絡方法對熱帶氣旋強度進行了預報,并與多元線性回歸的結果進行了比較,結果表明神經網(wǎng)絡方法效果要好于多元回歸方法;美國的 David等[14]采用 BP 神經網(wǎng)絡模型對加利福尼亞地區(qū)的降水進行了研究,建立加利福尼亞 7 個不同區(qū)域的預報模型,經過分析后預報結果與實際分布基本保持一致。

      天氣對人類日常生活影響很大,尤其是氣溫。氣溫的高低直接影響人們的感官感受。氣溫預報的準確性對農業(yè)的生產影響極為重要,對社會的經濟發(fā)展建設、防災減災有著十分重要的意義。同時,氣溫作為最基本的氣象要素,它的預報準確性直接關系到其他氣象要素和天氣現(xiàn)象的預報準確性,特別是災害性天氣往往和氣溫的變化有著密切的聯(lián)系。然而,提高氣溫預報的精細化程度十分困難,目前中國的氣象要素預報只能達到縣地區(qū)級別的預報,不能滿足更小范圍甚至某個站點的更為精細化預報需求。

      基于以上背景,本文主要利用美國國家環(huán)境預報中心(NCEP)/國家大氣中心(NCAR)提供的 FNL 全球再分析資料(Final Operational Global Analysis)以及深圳市氣象局實際每日溫度觀測數(shù)據(jù),應用多元線性回歸以及神經網(wǎng)絡方法構建深圳地區(qū)日氣溫最高值及最低值的統(tǒng)計降尺度模型。旨在比較這兩種方法在降尺度研究中的表現(xiàn),并提高深圳地區(qū)大氣數(shù)值產品的釋用,生成較高分辨率的氣溫預報資料,從而改善實際預報中的預報精確度。

      2 資料和方法

      2.1 資 料

      本文構建統(tǒng)計降尺度模型使用的大尺度大氣環(huán)流資料為 2000~2012 年美國國家環(huán)境預報中心(NCEP)/國家大氣中心(NCAR)提供的 FNL全球再分析資料。NCEP 的 FNL 數(shù)據(jù)產品格式和 NCEP 使用的全球預報系統(tǒng)(Global Forecast System,GFS)數(shù)據(jù)格式是一致的,采用了表格驅動編碼的 GRIB1 版本編碼格式[15]。NCEP FNL數(shù)據(jù)的空間分辨率為 1°×1°,時間間隔為 6 h(即每天 4 次,國際時刻 00、06、12、18 時),數(shù)據(jù)中包含了地表以及 26 個標準等壓層(1000 mb~10 mb)、地表邊界層(部分為 sigma 層)和對流頂層等的要素信息。NCEP 再分析資料由于充分同化了盡可能全面的觀測資料,與其他資料相比較,是目前最為全面和可靠準確的全球大氣大尺度網(wǎng)格數(shù)據(jù)[16]。

      本文使用的小尺度變量是深圳國家基本氣象站——竹子林站(區(qū)站號為 59493)2000 年~2012年的實際氣溫觀測數(shù)據(jù)。竹子林站位于北緯22°32′、東經 114°00′、海拔 63 米,竹子林站具有 50 多年資料積累,觀測和資料審核嚴格執(zhí)行國家相關規(guī)范,單點資料代表深圳參加全國氣象資料交換,資料通過中國氣象局認定。

      2.2 方 法

      統(tǒng)計降尺度方法主要依賴于小尺度區(qū)域數(shù)年的實際氣象要素的觀測資料。通過統(tǒng)計學原理建立實際觀測的氣象要素與大尺度大氣環(huán)流因子之間的關系,然后把全球大氣環(huán)流模式模擬的大尺度預測環(huán)流因子信息作為這種關系的輸入,得到小尺度區(qū)域氣象要素變量,例如氣溫等的變化趨勢[17]。

      統(tǒng)計降尺度的關鍵在于利用統(tǒng)計學方法建立大尺度大氣環(huán)流預報因子和區(qū)域氣象要素預報變量之間的映射關系 Y=F(X),其中 X 表示大尺度大氣環(huán)流預報因子,Y 表示區(qū)域氣象要素預報變量。F 則表示了從多年區(qū)域的實際觀測資料中提取出來的表達區(qū)域地形、下墊面等區(qū)域獨特的地理環(huán)境特征,以及小尺度區(qū)域受到大尺度網(wǎng)格的大氣環(huán)流影響的特征等復雜信息。統(tǒng)計降尺度法的優(yōu)點主要是能夠糾正大氣環(huán)流模式(General Circulation Model,GCM)的系統(tǒng)誤差,根據(jù)區(qū)域氣候信息的特征將全球大氣環(huán)流模式中相關性較大,物理意義較明顯,預測較為準確的大氣環(huán)流因子篩選出來用于統(tǒng)計模型中,因而不必考慮邊界初值條件的影響[8]。本文將采用多元線性回歸的方法和 BP 神經網(wǎng)絡的方法來建立映射關系。

      2.2.1 多元線性回歸方法

      假設 y 是深圳地區(qū)日氣溫值,表示可觀測的隨機變量,它受到 p 個大尺度大氣環(huán)流因子 x1, x2,…, xp和隨機因素 ε 的影響,若 y 與 x1, x2,…, xp有如下線性關系:

      根據(jù)多年的實際氣溫觀測數(shù)據(jù)和對應的NCEP FNL 資料,得到 n 組樣本數(shù)據(jù)(xi1, xi2,…, xip; yi) ,i=1,2,…, n,他們滿足式(1),即有

      其中 ε1, ε2,…, εn相互獨立且都服從 N(0, σ2)。采用最小二乘法來估計多元線性回歸方程中的未知參數(shù) β0, β1,…, βp,即選擇 β=(β0, β1,…, βp)T使誤差平方和

      達到最小。從而可以得到多元線性回歸方程[18,19]。

      2.2.2 BP 神經網(wǎng)絡方法

      相對于多元線性回歸方法,BP 神經網(wǎng)絡模型屬于一種高度非線性映射,目前證明一個三層神經網(wǎng)絡可以實現(xiàn)任一連續(xù)函數(shù)或映射。BP 網(wǎng)絡模型結構見圖 1[20]。

      BP 算法的過程如下[21,22]:

      (1)通過網(wǎng)絡將輸入向前傳播:

      (4)考慮到最速下降法更新權值和偏置值的速度很慢且容易陷入最小局部點,本文采用牛頓法的速度和保證收斂的最速下降法的一個折中,Levenberg-Marquardt 算法,采用[23]

      來改進 BP 神經網(wǎng)絡[24,25]。

      3 統(tǒng)計降尺度模型的建立

      3.1 模型的建立流程

      統(tǒng)計降尺度模型的構建首先建立全球大氣大尺度網(wǎng)格點的環(huán)流因子和地面觀測站氣象要素變量之間的降尺度統(tǒng)計關系,然后利用模式輸出的格點預測數(shù)據(jù)和已經建立的統(tǒng)計關系,得到未來情景下地面測站的變量預測值。整個降尺度方法的過程為:

      圖 1 BP 網(wǎng)絡模型結構圖Fig.1. Structure of BP neural network model

      (1)選擇預報變量

      根據(jù)降尺度的目的,確定所要降尺度的地理區(qū)域和預報變量。收集該地理區(qū)域實際的觀測資料,并且分析預報變量資料的質量狀況,修補和訂正數(shù)據(jù)的缺漏和錯誤。本文選擇深圳市國家基本觀測站——竹子林站的實際觀測數(shù)據(jù),分析和預測的氣象變量是日氣溫的最高值和最低值。

      (2)選擇預測因子

      這是降尺度過程中最為重要的步驟之一,因為選擇的預測因子的好壞直接關系到模型的成功與否。因此,本文通過分析影響氣溫變化的物理原理和運用相關分析的方法去篩選大氣環(huán)流因子作為降尺度的預測因子。

      (3)降尺度的方法選擇

      統(tǒng)計降尺度的方法有很多,不同的方法所取得的效果也是不同的,尤其是針對不同的預報變量。本文將采用逐步多元回歸的方法和 BP 神經網(wǎng)絡的方法進行研究和比較。

      (4)模型的建立和檢驗

      通過訓練樣本的數(shù)據(jù)輸入到降尺度選擇的方法中,建立起降尺度模型。對模型的檢驗包括原有訓練樣本數(shù)據(jù)的輸入擬合狀況檢驗及驗證樣本數(shù)據(jù)的擬合狀況,其中最主要的是對驗證樣本數(shù)據(jù)的檢驗,這是考察建立的模型泛化能力是否良好的關鍵。如果模型的泛化能力不好就要考慮重新選擇降尺度的方法或者重新建立模型。

      (5)應用模型

      將 GCM 輸出的未來大氣環(huán)流因子應用到建立好的模型中,生成預報變量的預測結果,然后再進行結果的分析討論。

      3.2 預報變量的劃分

      模型的訓練樣本與檢測樣本屬于同分布數(shù)據(jù)是統(tǒng)計降尺度分析的前提條件。只有訓練樣本和檢測樣本屬于同分布的數(shù)據(jù),模型通過訓練樣本學習到的內在規(guī)律才值得推廣,才會具有較好的泛化能力和預測能力。假如訓練樣本與預測樣本不屬于同一分布,這兩個樣本的內在規(guī)律本身就不同,通過訓練樣本學習到的規(guī)律與預測樣本本身的規(guī)律也就不相同,應用不相同的規(guī)律去做預測其結果必然差別很大。

      因此,本文采用“分而治之”的思想對研究對象按照分布特征的規(guī)律不同劃分不同的集合分別進行研究。氣象學上普遍認為,某一區(qū)域多年同月份的氣候狀況是具有相似性的??紤]到日最高溫度和最低溫度也屬于不同的類別,本文將采用按月份建立日最高溫度和最低溫度統(tǒng)計降尺度模型的劃分方法。這樣的劃分可以減小研究對象內在規(guī)律的復雜程度,使得模型只學習屬于同月份分布的樣本,學習目的明確,不會受到其他不同月份分布樣本規(guī)律的影響。

      將 2000~2012 年共 13 年的數(shù)據(jù)按月份和日最高最低溫度的不同劃分為 24 個數(shù)據(jù)子集合,即深圳地區(qū) 2000~2012 年 1 月份日最高氣溫數(shù)據(jù)集,2000~2012 年 1 月份日最低氣溫數(shù)據(jù)集,2000~2012 年 2 月份日最高氣溫數(shù)據(jù)集,2000~2012 年 2 月份日最低氣溫數(shù)據(jù)集,依次類推至 2000~2012 年 12 月份日最高氣溫數(shù)據(jù)集,2000~2012 年 12 月份日最低氣溫數(shù)據(jù)集等共 24 個集合。從而達到了對原有大規(guī)模數(shù)據(jù)樣本“分而治之”的目的。劃分為較小的數(shù)據(jù)集合之后每個集合還需要劃分為訓練集合和測試集合。這 24 個數(shù)據(jù)集合中每個集合都包含了 13 年的氣溫數(shù)據(jù),考慮到模型的建立需要足夠多的訓練樣本才能夠較好地掌握其中的規(guī)律,因此采用2000~2009 年共 10 年的數(shù)據(jù)作為訓練樣本集去訓練網(wǎng)絡,2010~2012 年共 3 年的數(shù)據(jù)則作為測試樣本集合來驗證神經網(wǎng)絡的學習情況。

      3.3 預報因子的篩選

      適當?shù)念A報因子是統(tǒng)計預報好壞的關鍵因素。雖然影響預報對象的因素很多,但不同因素對預報對象的影響程度大小亦相差很大,因此我們必須分析出其中的主要因素,篩選出高質量的預報因子,來獲取足夠多的預報信息。

      某種氣象現(xiàn)象的產生、氣象要素的變化是由其物理機制所決定的,因此首先應當考慮從預報對象產生的物理機制及變化的物理過程中尋找預報因子[26]。

      局地溫度變化的物理過程可以用熱流量方程表示:

      通過以上的分析,我們根據(jù) F 達到 0.05 相關顯著水平的標準以及影響氣溫變化物理過程的因素,從 NCEP FNL 資料提供的 137 個大氣環(huán)流因子中選擇出 23 個與氣溫最相關的因子作為備選因子,具體如表 1 所示。

      這 23 個備選因子是與預報量有一定物理聯(lián)系且存在著相關的備選因子。這些因子對預報量都有一定的方差貢獻,但是,這并不意味著輸入模型的因子越多越好。而備選因子之間存在或多或少的交叉關系,因此它們對預報量的貢獻多少也存在著交叉現(xiàn)象。并且考慮到直接將 23 個變量輸入到降尺度模型中仍然存在太多變量,相關性不好,冗余信息過多等問題。需要按月份和最低最高溫度的不同,進一步將這 23 個變量進行篩選,尋求最優(yōu)合適的因子。

      表 1 NCEP 數(shù)據(jù)輸出變量列表Table. 1 List of NCEP data variables

      逐步回歸方法是最簡便和傳統(tǒng)的篩選方法。下面給出使用逐步回歸方法從 23 個備選因子中篩選出對應 12 個月的最高溫度和最低溫度模型的最顯著相關因子。逐步回歸通過引入所有 23個備選因子,之后測試每一個備選因子的顯著統(tǒng)計學大小,通過的大小來決定是刪除還是保留該變量[27]。

      我們得到的 12 個月的 Tmax和 Tmin最顯著相關的因子如下表 2 和表 3 所示。

      從表 2 和表 3 可以看出,12 個月的最高溫度和 12 個月的最低溫度的最顯著相關因子有很大區(qū)別,但是也存在一些共同的特點:

      (1)在 12 個月最高溫度和 12 個月最低溫度最顯著相關因子中,其中比濕、相對濕度 Surface是影響每個月份最高溫度和最低溫度最重要的相關因子;

      表 2 深圳各月最高氣溫變量選擇表Table 2. Significant predictors for daily Tmaxin 12 months

      表 3 深圳各月最低氣溫變量選擇表Table 3. Significant predictors for daily Tminin 12 months

      (2)除了(1)中的兩個因子外,影響 12 個月的最高溫度最顯著相關因子是相對濕度 850 hpa;影響 12 個月最低溫度最顯著相關因子是850 hpa 風強;

      (3)影響 7 月、8 月、9 月最低溫度和最高溫度最顯著相關因子還有位勢高度 500 hpa,相對濕度 500 hpa;

      (4)12 個月中,除了 7 月、8 月和 9 月外,其他月份最低溫度和最高溫度最顯著影響相關因子還有位勢高度 850 hpa,位勢高度 Surface。

      3.4 統(tǒng)計降尺度模型的建立

      本節(jié)建立的統(tǒng)計降尺度模型是基于 3.1 節(jié)的流程分析和 3.2 節(jié)、3.3 節(jié)對預報變量的劃分和預報因子的篩選結果。采用的降尺度方法主要是BP 神經網(wǎng)絡方法和逐步多元線性回歸方法。

      3.4.1 逐步多元回歸方法

      逐步多元回歸方法根據(jù)表 2 和表 3 的篩選因子結果,分別建立最高溫度和最低溫度對應的多元線性回歸方程,模型的參數(shù)由最小二乘方法解方程得到。此處列出 1 月和 7 月的最低溫度、最高溫度的回歸方程作為例子。

      3.4.2 BP 神經網(wǎng)絡方法

      同時,為了研究非線性方法在該領域的應用效果,采用逐步回歸篩選因子組合 BP 神經網(wǎng)絡的方法[28]建立新的統(tǒng)計降尺度模型。

      (1)歸一化處理

      該模型將逐步回歸篩選出來的預測因子作為神經網(wǎng)絡的輸入變量,考慮到每種大氣環(huán)流因子都具有不同的物理意義和不同的量綱,比如絕對渦度分量在 10—6~10—4范圍內變化,地表面壓力分量則在 104~106范圍內變化。如此大的數(shù)量級差別直接輸入網(wǎng)絡會使網(wǎng)絡在學習過程中權值的變化不均勻,容易出現(xiàn)網(wǎng)絡的不穩(wěn)定和提前進入訓練結束狀態(tài)。必須通過變換處理將網(wǎng)絡的輸入輸出數(shù)據(jù)限制在[—1,1]區(qū)間內,使每個輸入分量對網(wǎng)絡的影響處在相同重要的地位,從而避免權值變化不均勻的情況出現(xiàn)。

      因此采用如下區(qū)間變換式將輸入-輸出數(shù)據(jù)變換為[—1,1]:

      按上述的方法變換后,x 序列的最大值變?yōu)榱?1,最小值變?yōu)榱?—1。

      (2)隱含層節(jié)點的設計

      理論分析證明,三層 BP 神經網(wǎng)絡足以映射所有連續(xù)的函數(shù),只有當需要映射的函數(shù)很復雜或者不連續(xù)的時候才需要兩個及以上的隱含層,所以,為了避免網(wǎng)絡過于復雜,本文考慮設置一個隱含層。

      對于隱含層節(jié)點數(shù)的確定問題,至今仍無法用一個解析式精確求得,因此,1990 年,Eberhart 等[29]總結說“隱節(jié)點的選擇是一門藝術”是非常準確的。隱含層節(jié)點的作用是存儲從訓練樣本中不斷學習到的內在規(guī)律,隱含層節(jié)點的權值能夠增強網(wǎng)絡映射的能力。如果加入隱含層節(jié)點較少,那么網(wǎng)絡比較簡單,對于較為復雜的問題就很難從樣本的學習過程中掌握足夠的信息,學習到其中的規(guī)律;但若隱含層節(jié)點的數(shù)量過多,網(wǎng)絡將變得很復雜,泛化能力反倒會降低,網(wǎng)絡在學習過程中對于訓練樣本的全部內容包括非主要的規(guī)律甚至噪聲的干擾也記住,在對訓練樣本外的數(shù)據(jù)進行仿真時效果并不好。

      因此,設置多少個隱含層節(jié)點是比較復雜的問題,也是神經網(wǎng)絡設計的困難所在之處,主要影響的因素有映射的問題復雜程度、訓練樣本的劃分情況以及輸入輸出個數(shù)等。一般來說,需要描述的問題越復雜,規(guī)模越龐大,網(wǎng)絡需要的隱含層節(jié)點越多,甚至需要增加隱含層的數(shù)目來增強其映射能力。

      表 4 深圳各月最優(yōu)隱含層神經網(wǎng)絡節(jié)點數(shù)列表Table 4. Optimal number of the hidden layer of neural network for 12 months

      目前,確定最佳隱含節(jié)點數(shù)可以根據(jù)一些經驗公式作為參考,下面的公式是一些計算隱含層節(jié)點數(shù)的經驗公式:

      其中 k 為樣本數(shù),如果 i>n1,式中 m為隱含層節(jié)點,n 為輸入層節(jié)點數(shù),l 為輸出層節(jié)點數(shù),a 為 1~10 之間的常數(shù)。本節(jié)根據(jù)經驗公式算出隱含層節(jié)點個數(shù)大致范圍,主要采用試湊的辦法,通過設置較小的隱含層節(jié)點,然后逐步增加個數(shù),通過同一樣本集的反復訓練得出表現(xiàn)最優(yōu)的節(jié)點個數(shù)。表 4 所示為各個月份最低溫度和最高溫度模型的最優(yōu)節(jié)點個數(shù)。

      (3)網(wǎng)絡結構的設計

      通過以上的分析,以 1 月份最低氣溫模型對應的網(wǎng)絡設計為例,網(wǎng)絡采用輸入層為 8 個神經元,中間層經過黃金分割點算法的計算確定最優(yōu)節(jié)點數(shù)為 10 個神經元,輸出層為 1 個神經元。因此,網(wǎng)絡應該為 8×10×1 的結構,訓練的算法采用 Levenberg-Marquardt 算法,中間層神經元傳遞函數(shù)采用雙曲正切 S 型傳遞函數(shù) tansig,輸出層神經元傳遞函數(shù)采用線性傳遞函數(shù),前 10年的數(shù)據(jù)作為訓練樣本,后 3 年的數(shù)據(jù)作為檢驗樣本。本文采用 matlab 平臺來實現(xiàn)神經網(wǎng)絡的構建,設計好的網(wǎng)絡結構如下圖 2 所示。

      圖 2 BP 神經網(wǎng)絡結構圖Fig. 2. Structure of BP neural network

      4 統(tǒng)計降尺度模型的結果分析評價

      無論是神經網(wǎng)絡模型還是多元線性回歸模型,對模型的評價主要分為兩部分,第一部分:對訓練樣本集的模擬狀況,可以檢驗模型對訓練樣本的學習狀況,如果訓練樣本集擬合得較好說明模型對于訓練樣本作為先驗經驗,學習掌握了隱含在其中的主要規(guī)律和知識;第二部分:對測試樣本集的預測狀況,這是檢驗預測模型是否具有泛化能力的關鍵。因為測試樣本是未被模型學習過的數(shù)據(jù)集,這部分數(shù)據(jù)集與訓練樣本具有同分布狀態(tài),只有具有泛化能力的模型才能對這部分數(shù)據(jù)做出較好的預測。因此,檢驗降尺度模型的好壞關鍵是對測試樣本集預測狀況的評價分析。本節(jié)采用同一評價標準對多元線性回歸模型和神經網(wǎng)絡模型結果進行評價分析。

      采用的評判系數(shù)為:

      (1)相關系數(shù)平方:

      該參數(shù)是相關系數(shù) R2描述了預測值和實際值的擬合程度。R2被定義為回歸平方和(Regression Sum of Squares,SSR)與總平方和(Total Sum of Squares,SST)的比值。R2可以取值在[0,1]之間,越接近 1 越好,比如 R2=0.85表示預測數(shù)據(jù)的效果,平均解釋了原始數(shù)據(jù) 85%的方差狀況。

      (2)平均絕對誤差:

      (3)均方根誤差:

      記神經網(wǎng)絡模型為模 A,多元線性回歸模型為模 B,這兩種模型對訓練樣本的擬合情況通過參數(shù)比較如表 5 和表 6 所示。

      檢驗樣本集的檢驗參數(shù)比較如表 7 和表 8所示。

      表 5 深圳最低氣溫兩種模型訓練樣本參數(shù)比較Table 5. Performance comparison between two models for calibrated simulation of daily Tmin

      表 6 深圳最高氣溫兩種模型訓練樣本參數(shù)比較Table 6. Performance comparison between two models for calibrated simulation of daily Tmax

      表 7 深圳最低氣溫兩種模型檢驗樣本參數(shù)比較Table 7. Performance comparison between two models for validated simulation of daily Tmin

      表 8 深圳最高氣溫兩種模型檢驗樣本參數(shù)比較Table 8. Performance comparison between two models for validated simulation of daily Tmax

      2012 年的具體預測結果如圖 3、圖 4 所示。

      圖 3 2012 年日極值溫度多元回歸模擬與觀測比較圖Fig. 3. Comparison between the observed daily temperature extremums in 2012 and the simulated temperature by the multiple linear regression model

      圖 4 2012 年日極值溫度 BP 神經網(wǎng)絡模擬與觀測比較圖Fig. 4. Comparison between the observed daily temperature extremums in 2012 and the simulated temperature by BP neural network model

      通過以上數(shù)據(jù)表格和圖的分析,可以得出以下結論:

      (1)神經網(wǎng)絡模型的訓練樣本擬合情況要好于多元線性回歸,但是檢驗樣本的擬合情況卻相反。

      這說明了在統(tǒng)計降尺度領域,神經網(wǎng)絡并不具有比多元線性回歸更好的優(yōu)勢,盡管神經網(wǎng)絡在訓練樣本擬合的相當好,但是,神經網(wǎng)絡的過擬合問題卻比多元回歸突出很多,其非線性擬合能力并沒有很好的發(fā)揮出來。

      (2)兩種模型對最低溫度和擬合效果要好于對最高溫度的擬合效果,可以得出最高溫度受到的高空環(huán)流因子影響因素較最低溫度受到的影響更為復雜。

      (3)兩種模型普遍對于冬季的氣溫模擬的效果好于夏季的氣溫,主要是由于夏季深圳地區(qū)多受臺風的影響,天氣變化很劇烈,因此模型對于更為復雜的問題學習效果有待提高,需要對數(shù)據(jù)做進一步的處理或者引入臺風影響等其他相關因子。

      [1] Dibike YB, Coulibaly P. Validation of hydro-logic models for climate scenario simulation: the case of Saguenay watershed in Quebec [J]. Hydrological Processes, 2007, 21(23): 3123-3235.

      [2] Wilby RL, Charles SP, Zorita E, et al. Guidelines for use of climate scenarios developed from statistical downscaling methods [OL]. http://scholar. google.ca/scholar?cluster=8727505470784486273 &hl=zh-CN&as_sdt=0,5, 2004.

      [3] Kidson JW, Thompson CS. A comparison of statistical and model-based downscaling techniques for estimating local climate variations [J]. Journal of Climate, 1998, 11(4): 735-753.

      [4] Murphy J. An evaluation of statistical and dynamical techniques for downscaling local climate [J]. Journal of Climate, 1999, 12(8): 1156-2284.

      [5] Sailor DJ, Li XS. A semiempirical downscaling approach for predicting regional temperature impacts associated with climatic change [J]. Journal of Climate, 1999, 12(1): 103-114.

      [6] Murphy J. Prediction of climate change overEurope using statistical and dynamical downscaling techniques [J]. International Journal of Climatology, 2000, 20 (5): 489-501.

      [7] Hellstrōm C, Chen DL, Achberger C, et al. Comparison of climate change scenarios for Sweden based on statistical and dynamical downscaling of monthly precipitation [J]. Climate Research, 2001, 19(1): 45-55.

      [8] 范麗軍, 符淙斌, 陳德亮. 統(tǒng)計降尺度法對華北地區(qū)未來區(qū)域氣溫變化情景的預估 [J]. 大氣科學, 2007, 131(15): 887-897.

      [9] Huth R. Statistical downscaling in central Europe: evaluation of methods and potential predictor [J]. Climate Research, 1999, 13: 91-101.

      [10] Paulin C. Downscaling daily extreme temperatures with genetic programming [J]. Geophysical Research Letters, 2004, 31(16): L16203.

      [11] Hakami A, Odman MT, Russell AG. Nonlinearity in atmospheric response: a directsensitivity analysis approach [J]. Journal of Geiphysical Research: Atmospheres, 2004, 109(D15), doi: 10.1029/2003JD004502.

      [12] 金龍. 神經網(wǎng)絡氣象預報建模理論方法和應用 [M].北京: 氣象出版社, 2005.

      [13] Baik LJ, Hwang HS. Tropical cyclone intensity prediction using regression method and neural network [J]. Journal of the Meteorology Society of Japan, 1998, 76(5): 711-717.

      [14] Silverman D, Dracup JA. Artificial neural network and long range precipitation in California [J]. Journal of Applied Meteorology, 2000, 39(1): 57-66.

      [15] 孫修貴. 表格驅動碼編碼手冊—BUFR GRIB 和CREX編碼 [M]. 北京: 氣象出版社, 2010.

      [16] Kalney E, Kanamitsu M, Kistler R, et al. The NCEP/NCAR 40-year reanalysis project [J]. Bulletin of the America Meteorological Society, 1996: 437-471.

      [17] Benestad RE, Inger HB, Chen DL. Empirical-Statistical Downscaling [M]. World Scientific, 2008.

      [18] Kleinbaum DG, Kupper LL, Muller KE, et al. Applied Regression Analysis and Other Multivariable Methods (third edition) [M]. 北京: 機械工業(yè)出版社, 2003, 250-251.

      [19] Montgomery DC, Peck EA. Introduction to Linear Regression Analysis [M]. John Wiley&Sons, 1982.

      [20] Hagan MT, Demuth HB, Beale MH. Neural Network Design [M]. Stillwater: Martin Hagan, 1996.

      [21] Rumelhart DE, Hinton GE. Williams RJ. Learning representations by back-propagating errors [J]. Nature, 1986, 323: 533-536.

      [22] Rumelhart DE, McClelland JL. Parallel Disributed Processing: Explorations in the Microstructure of Cognition [M]. Cambridge: MIT Press, 1986.

      [23] Hagan MT, Menhaj MB. Training feedforward networks with the Marquardt algorithm [J]. IEEE Tansactions on Neural Networks, 1994, 5(6): 989-993.

      [24] Scales LE. Introduction to Non-linear Optimization [M]. New York: Springer-Verlag, 1985.

      [25] Miller WT, Sutton RS, Werbos PJ. Neural Networks for Control [M]. Cambridge: MIT Press, 1990: 171-178.

      [26] 朱乾根, 林錦瑞, 壽紹文, 等. 天氣學原理和方法(第四版)[M]. 北京: 氣象出版社, 2007.

      [27] Lomax RG, Hahs-Vaughn DL. Statistical Concepts: a Second Course(third edition) [M]. Routledge Academic Press, 2007.

      [28] Zhang DD. Neural Networks System Design Methodology [M]. Beijing: TsingHua University Press, 1996.

      [29] Eberhart EC. Neural Network PC Tools: a Practical Guide Russell [M]. New York: Academic Press, 1990.

      A Downscaling Study on the Daily Temperature Extremums in Shenzhen

      WU Yang LI Qinglan
      ( Shenzhen Institutes of Advanced Technology, Chinese Academy of Sciences, Shenzhen 518055, China )

      The weather has a profound influence on human’s daily life and the weather forecasting has always been a topic of great concern. With the economic development and social progress, people’s requirements for daily weather forecasting has become higher and higher. Information provided by the general circulation models (GCMs) can describe well some of the weather parameters at a large scale, but GCMs fail to provide detailed weather information at a regional or local scale for impact assessment studies. Outputs from GCMs are usually of low spatial resolutions. A common approach to bridge the scale mismatch is downscaling. In the present study, two methods, i.e., the statistical multiple linear regression and the BP neural network, were proposed to downscale large scale reanalysis data to daily temperature extremums at a local point, Shenzhen national meteorological station. The data used in this study are NCEP/NCAR (National Centers for Environmental Prediction/National Centre for Atmospheric Research) reanalysis dataset for the 2000~2012 period and daily observations of maximum temperature and minimum temperature at Shenzhen station for the same period. The two methods were compared in this study. Results show that both methods can simulate well the daily temperature extremums at Shenzhen station, but the performance of the statistical downscaling method is more stable than the BP neural network.

      statistical downscaling; daily temperature extreme; multiple linear regression; BP neural network; Shenzhen

      TG 156

      A

      2013-12-30

      深圳市科技研發(fā)資金項目(JCYJ20120617115926138)。

      武楊,碩士研究生,研究方向為計算機應用;李晴嵐(通訊作者),博士,副研究員,研究方向為氣候變化、天氣預報和臺風模擬與影響評估,E-mail:ql.li@siat.ac.cn。

      猜你喜歡
      訓練樣本氣溫尺度
      氣溫的神奇“魔法”
      基于FY-3D和FY-4A的氣溫時空融合
      財產的五大尺度和五重應對
      人工智能
      寬帶光譜成像系統(tǒng)最優(yōu)訓練樣本選擇方法研究
      融合原始樣本和虛擬樣本的人臉識別算法
      電視技術(2016年9期)2016-10-17 09:13:41
      基于稀疏重構的機載雷達訓練樣本挑選方法
      宇宙的尺度
      太空探索(2016年5期)2016-07-12 15:17:55
      與氣溫成反比的東西
      9
      霸州市| 长葛市| 塔城市| 甘肃省| 历史| 磐石市| 新丰县| 昌图县| 望城县| 榆林市| 禄丰县| 云林县| 洞头县| 依兰县| 湖北省| 泽州县| 汕头市| 横山县| 英吉沙县| 个旧市| 巴青县| 名山县| 抚顺市| 宣恩县| 定襄县| 兴化市| 青海省| 浑源县| 屯留县| 六枝特区| 南城县| 延吉市| 黑龙江省| 德州市| 聊城市| 涞源县| 轮台县| 凤凰县| 宁陕县| 沾益县| 连江县|