劉章君,郭生練,許新發(fā),許世超,成靜清
(1. 江西省水利科學(xué)研究院,江西南昌 330029;2. 武漢大學(xué)水資源與水電工程科學(xué)國家重點(diǎn)實(shí)驗(yàn)室,湖北武漢 430072)
相關(guān)性普遍存在于水文事件內(nèi)部屬性間,例如暴雨的歷時和強(qiáng)度、洪水的洪峰和洪量、干旱的歷時和烈度等。此外,還存在由于外部原因(如空間聯(lián)系、因果關(guān)系等)引起的相關(guān)性,如洪水的遭遇和地區(qū)組成、降雨和徑流的關(guān)系等[1]。深入了解和研究水文現(xiàn)象中的這些相關(guān)性規(guī)律,對于提高水文分析計(jì)算成果的精度和可靠性大有裨益。
早期的多變量水文分析計(jì)算研究主要采用邊緣分布相同的多變量分布模型(如多變量正態(tài)分布、多變量對數(shù)正態(tài)分布和多變量Gumbel等)和Meta-Gaussian分布模型[2]。這些傳統(tǒng)模型通常基于變量之間的線性相關(guān)關(guān)系而建立,對于非線性、非對稱的隨機(jī)變量難以很好地描述;另外部分模型假定變量服從相同邊緣分布,同時對相關(guān)性大小也存在一定的限制,影響了其適用性和成果準(zhǔn)確性。實(shí)際上,水文變量的相關(guān)性非常復(fù)雜,包括線性相關(guān)和非線性相關(guān);水文變量邊緣分布既可能服從正態(tài)分布,也可能服從偏態(tài)分布。因此,如何構(gòu)建非線性、非正態(tài)條件下的多變量聯(lián)合概率分布無疑具有很大的挑戰(zhàn)性。Copula函數(shù)是多變量聯(lián)合分布構(gòu)建理論與方法的重大突破,可以將邊緣分布和相關(guān)性結(jié)構(gòu)分開來研究,且對邊緣分布類型沒有任何限制,形式靈活多樣,可以描述變量間非線性、非對稱的相關(guān)關(guān)系[3]。1959年Sklar在統(tǒng)計(jì)學(xué)中提出Sklar定理,直到20世紀(jì)90年代末才開始廣泛應(yīng)用于金融、財(cái)經(jīng)、保險、精算和風(fēng)險分析等領(lǐng)域。2003年,意大利水文學(xué)者de Michele[4]將Copula函數(shù)引入水文水資源領(lǐng)域,首次建立了邊緣分布為廣義Pareto分布的降雨強(qiáng)度和降雨歷時的聯(lián)合概率分布。2004年,熊立華和郭生練[5]采用Gumbel-Hougaard Copula函數(shù)構(gòu)建了長江流域某站點(diǎn)洪峰和洪量的聯(lián)合分布。近十幾年來,Copula函數(shù)引起了國內(nèi)外水文水資源界的高度關(guān)注和興趣,研究的廣度和深度不斷推進(jìn)。大量的研究和應(yīng)用實(shí)踐表明,Copula函數(shù)作為構(gòu)造多變量聯(lián)合分布的一種有效工具,完整地保留了變量間相關(guān)性信息,具有很強(qiáng)的靈活性和良好的適用性[6]。
本文重點(diǎn)綜述近10年來Copula函數(shù)在水文事件多變量頻率分析、水文事件遭遇組合分析、水文隨機(jī)模擬、水文模型與預(yù)報以及其他問題中的最新研究進(jìn)展,對未來發(fā)展方向進(jìn)行展望,以期為繼續(xù)開展Copula函數(shù)在水文水資源中的應(yīng)用研究提供借鑒和參考。
Copula函數(shù)應(yīng)用基本流程包括:① 根據(jù)實(shí)際研究需要選定隨機(jī)變量;② 確定各隨機(jī)變量的邊緣分布;③ 計(jì)算相關(guān)系數(shù)及顯著性檢驗(yàn);④ 確定各備選Copula 函數(shù)的參數(shù);⑤ Copula 函數(shù)的擬合檢驗(yàn)與優(yōu)選;⑥ 推求聯(lián)合概率分布和條件概率分布;⑦ 結(jié)合實(shí)際問題開展相關(guān)后續(xù)研究。各步驟相關(guān)具體方法可以參見文獻(xiàn)[2-3]。表1列出了Copula函數(shù)在水文水資源應(yīng)用領(lǐng)域的主要研究問題及變量。
表1 Copula函數(shù)在水文水資源應(yīng)用領(lǐng)域的主要研究問題及相應(yīng)變量
降雨、洪水、干旱等很多水文事件往往具有多個特征屬性,考慮這些屬性的相關(guān)性并進(jìn)行多變量頻率分析可以更加科學(xué)合理、全面地評估水文事件的整體特征。水文事件多變量頻率分析研究的是發(fā)生在同一個站點(diǎn)/區(qū)域的同一個水文事件的多個特征屬性之間的相關(guān)性。
1.1.1 降雨事件
降雨事件通常包括降雨強(qiáng)度、降雨總量和降雨歷時等特征屬性,分析這些特征屬性變量的相關(guān)性,并建立聯(lián)合概率分布,有助于更加全面地認(rèn)識降雨事件的變化規(guī)律。Zhang和Singh[7]采用4種Archimedean Copula函數(shù)分別對降雨強(qiáng)度和降雨總量、降雨歷時和降雨總量及降雨強(qiáng)度和降雨歷時進(jìn)行兩變量聯(lián)合分析;許月萍等[8]比較分析了4種Copula函數(shù)在模擬不同歷時降雨量的聯(lián)合分布的差異及其對降雨頻率分析的影響;Vandenberghe等[9]基于比利時105 a的10 min降雨數(shù)據(jù),采用二維Copula函數(shù)擬合了暴雨特征量之間的相關(guān)性結(jié)構(gòu);Balistrocchi和Bacchi[10]采用Copula函數(shù)分析了暴雨總量和暴雨歷時之間的統(tǒng)計(jì)相關(guān)性;Jun等[11]通過Copula函數(shù)建立暴雨強(qiáng)度和暴雨歷時的兩變量聯(lián)合分布來計(jì)算場次暴雨事件的發(fā)生概率;Li等[12]分別采用時變GEV分布和Copula函數(shù)來模擬年最大降雨總量和降雨強(qiáng)度的邊緣分布和聯(lián)合分布,進(jìn)行非一致性條件下兩變量降雨頻率分析。
工程實(shí)踐中,中小流域或城市排水暴雨洪水計(jì)算時常遇到流量資料不足情況,采用Copula函數(shù)構(gòu)建暴雨強(qiáng)度、暴雨歷時的聯(lián)合分布,分析確定當(dāng)?shù)赜炅?頻率-歷時關(guān)系或暴雨強(qiáng)度公式,是提高用暴雨資料推求設(shè)計(jì)洪水精度的一條有效途徑。然而,目前降雨事件多變量頻率分析的系列抽樣方法多采用年最大取樣法,可能會遺漏一些數(shù)值較大的暴雨,造成小重現(xiàn)期部分明顯偏小,需要加強(qiáng)年多次取樣法在降雨事件多變量頻率分析的應(yīng)用研究,以擴(kuò)大暴雨信息量,增強(qiáng)樣本代表性。
1.1.2 洪水事件
洪水事件屬性包括洪峰、洪量和洪水歷時等,考慮這些屬性的相關(guān)性并進(jìn)行多變量頻率分析可以更好地掌握洪水事件特征,并應(yīng)用于設(shè)計(jì)洪水估算和和風(fēng)險分析。這方面的研究最初主要是分析計(jì)算洪峰、洪量和洪水歷時等特征屬性的聯(lián)合和條件概率分布、聯(lián)合和條件重現(xiàn)期。Zhang和Singh[13]基于Copula函數(shù)建立洪峰、洪量和歷時的二維聯(lián)合概率分布,并對條件重現(xiàn)期和聯(lián)合重現(xiàn)期進(jìn)行了探討。在此基礎(chǔ)上,如何在多變量框架下進(jìn)行洪水聯(lián)合設(shè)計(jì)值估算成為學(xué)者們關(guān)心的熱點(diǎn)問題,核心是多變量重現(xiàn)期的定義和聯(lián)合設(shè)計(jì)值的選取[14]。多變量重現(xiàn)期以“或”(“OR”)、“且”(“AND”)和Kendall重現(xiàn)期應(yīng)用最為廣泛[15-18],最近興起的結(jié)構(gòu)荷載重現(xiàn)期也逐步引起了學(xué)者們的注意,聯(lián)合設(shè)計(jì)值選取的常用方法是最可能組合法[19-20]。針對變化環(huán)境導(dǎo)致的洪水非平穩(wěn)性特征,也有學(xué)者開展了非一致性多變量洪水頻率分析,包含洪峰、洪量邊緣分布的非一致性,以及洪峰、洪量相關(guān)結(jié)構(gòu)的非一致性[21-24]。同時,多變量洪水分析計(jì)算的不確定性評估也是一個前沿方向,不僅涉及邊緣分布的不確定性,還要考慮相關(guān)性結(jié)構(gòu)(Copula函數(shù))的不確定性。兩者又均涉及到樣本抽樣、線型(類型)選取和參數(shù)估計(jì)不確定性,評估綜合不確定性非常復(fù)雜[25-27]。此外,為了在水庫控制運(yùn)用中充分考慮洪水的季節(jié)性變化規(guī)律,提高防洪興利綜合效益,基于Copula函數(shù)的分期設(shè)計(jì)洪水和水庫管運(yùn)洪水也是學(xué)者們關(guān)注的焦點(diǎn)[28-30]。
目前洪水事件的多變量頻率分析仍然面臨一些挑戰(zhàn)。首先,多變量重現(xiàn)期的概念比單變量情形復(fù)雜,尚無公認(rèn)和通用的定義方法,基本原則是要根據(jù)具體研究問題的物理背景而定。其次,對于同一防洪標(biāo)準(zhǔn)對應(yīng)無窮多種洪峰、洪量組合,如何科學(xué)合理地選擇設(shè)計(jì)值已成為另一個關(guān)鍵問題,當(dāng)前應(yīng)用最廣泛的是最可能組合法。如何在多變量框架下進(jìn)行洪水聯(lián)合設(shè)計(jì)值估算及風(fēng)險評估仍然是一個有爭議的問題,需要進(jìn)一步研究完善。最后,由于洪水通常關(guān)心的是上尾部稀遇頻率的設(shè)計(jì)值,多變量洪水分析模型比單變量模型具有更大的抽樣不確定性,導(dǎo)致模型成果不確定性很大。
1.1.3 干旱事件
描述干旱事件的特征屬性主要有干旱烈度、烈度峰值、干旱強(qiáng)度、干旱歷時和干旱間隔時間等,對多個干旱特征屬性進(jìn)行多變量頻率分析可以更加科學(xué)地評估干旱風(fēng)險。Copula函數(shù)早期主要被應(yīng)用在對干旱特征值的二元分析上,其中以干旱歷時和干旱烈度的聯(lián)合概率分布應(yīng)用最廣[31-33]。為了更全面地反映干旱事件的多維特征,多元Copula函數(shù)也被應(yīng)用于干旱問題的多特征分析中[34-36]。近年來,針對氣候變化和人類活動導(dǎo)致的干旱非一致性問題,有學(xué)者開展了變化環(huán)境下的多變量干旱頻率分析研究,通常采用時變Copula函數(shù)、滑動窗口或全球氣候模型(GCMs)氣候情景分析等方法[37-39]。
盡管目前采用的干旱指標(biāo)很多,但這些指標(biāo)大多數(shù)只是從某一方面(降水虧缺或地表徑流減少等)來評估旱情嚴(yán)重程度,未能全面地評估干旱風(fēng)險,難以反映旱情在地區(qū)間和季節(jié)上的差異。因此,通過融合多種旱情指標(biāo),構(gòu)建能反映干旱發(fā)生機(jī)理和過程的綜合指標(biāo)仍然是今后研究的重點(diǎn)之一。此外,受氣候變化和人類活動的影響,亟待開展基于非一致水文序列資料的水文干旱事件重現(xiàn)期和設(shè)計(jì)值估算及不確定性評估方法研究,以適應(yīng)變化環(huán)境帶來的影響。
水文事件遭遇組合分析主要針對具有物理聯(lián)系和相關(guān)性的不同時空水文事件變量之間,包括洪水遭遇中干支流不同站點(diǎn)的洪水遭遇、設(shè)計(jì)洪水地區(qū)組成中水庫斷面和區(qū)間洪水的遭遇組合、復(fù)合洪澇事件中多個致災(zāi)因子遭遇、不同站點(diǎn)或地區(qū)的豐枯遭遇等。
1.2.1 洪水遭遇
洪水遭遇是指干流與支流或支流與支流的洪峰在相差較短的時間內(nèi)到達(dá)同一河段的現(xiàn)象。閆寶偉等[40]和陳璐等[41]分別采用二維和四維Copula函數(shù)研究了最大洪水發(fā)生時間及發(fā)生量級遭遇的風(fēng)險特征;Huang等[42]提出了一種干支流洪水過程遭遇概率分析方法;Peng等[43]研究了考慮歷史洪水信息的洪水遭遇概率;Feng等[44]采用時變Copula函數(shù)探討了氣候變化影響下的非一致性洪水遭遇風(fēng)險。此外,河流交匯處的洪水遭遇組合和工程水文設(shè)計(jì)問題也受到學(xué)界關(guān)注[45-46]。
目前在洪水遭遇概率計(jì)算方面做了很多有益的探索,但大多數(shù)研究僅分析了年最大洪水遭遇情況,沒有考慮其他有可能危及保護(hù)目標(biāo)安全的較大洪水遭遇情況,導(dǎo)致計(jì)算的遭遇概率與實(shí)際情況不完全相符。另外,如何將洪水遭遇分析成果應(yīng)用于干支流水庫群防洪補(bǔ)償調(diào)度、錯峰調(diào)度,以發(fā)揮其實(shí)際價值,也是值得繼續(xù)探討的課題。
1.2.2 設(shè)計(jì)洪水地區(qū)組成
設(shè)計(jì)洪水地區(qū)組成主要研究當(dāng)防洪控制斷面發(fā)生設(shè)計(jì)洪水時,其上游水庫斷面、區(qū)間流域等各分區(qū)來水的分配及遭遇組合的形式。閆寶偉等[47]提出的基于Copula函數(shù)的最可能地區(qū)組成法統(tǒng)計(jì)意義明確、方案數(shù)唯一,應(yīng)用前景良好[48],也有學(xué)者提出了基于Copula函數(shù)的改進(jìn)離散求和法克服了傳統(tǒng)離散求和法需要進(jìn)行變量獨(dú)立性轉(zhuǎn)換的問題[49]。郭生練等[50]在此基礎(chǔ)上提出了水庫運(yùn)行期設(shè)計(jì)洪水計(jì)算理論和方法,并在金沙江下游梯級水庫、三峽水庫運(yùn)行期設(shè)計(jì)洪水及汛控水位推求中得到了應(yīng)用[51-53]。
洪水的空間分布情況對水庫群防洪系統(tǒng)設(shè)計(jì)與調(diào)度運(yùn)用具有重要影響,設(shè)計(jì)洪水地區(qū)組成分析是不可回避的關(guān)鍵問題。在水庫群防洪聯(lián)合調(diào)度中采用運(yùn)行期設(shè)計(jì)洪水及汛控水位作為依據(jù),并與實(shí)時洪水預(yù)報結(jié)合起來,是一個具有潛力和實(shí)用價值的方向。然而,目前實(shí)際中應(yīng)用最廣泛的方法是將設(shè)計(jì)斷面設(shè)計(jì)洪量分配給上游各分區(qū)以研究水庫調(diào)洪影響,這類方法假定水庫調(diào)蓄后設(shè)計(jì)斷面的洪水與天然情況同頻率,沒有充分考慮洪水地區(qū)組成的隨機(jī)特性和水庫調(diào)洪影響,此外還隱含假設(shè)了設(shè)計(jì)斷面洪水的洪峰、洪量同頻率,其合理性需要進(jìn)一步探究。
1.2.3 復(fù)合洪澇事件
洪澇災(zāi)害有時是由多個致災(zāi)因子遭遇組成的復(fù)合水文事件[54]。例如,中國的許多沿江平原地區(qū)和三角洲河網(wǎng)地區(qū)大多地勢低平,暴雨澇水能否順利排除不僅取決于設(shè)計(jì)暴雨標(biāo)準(zhǔn),還受到外江水位的極大制約,設(shè)計(jì)暴雨和外江水位的遭遇問題本質(zhì)上就是一個兩變量聯(lián)合分布問題。此外,沿海地區(qū)城市的外江通常為感潮河段,其洪水位既受上游河道洪水的作用,也受下游河口潮位的影響,任一時刻的洪水位都是上游河道洪水和下游河口潮位共同作用的結(jié)果。因此,可采用Copula函數(shù)構(gòu)造區(qū)間暴雨與外江水位、暴雨與潮位、上游洪水與河口潮位等多個致災(zāi)因子的聯(lián)合概率分布進(jìn)行組合風(fēng)險分析[55-58]。
多致災(zāi)因子影響下的復(fù)合洪澇事件分析最終目的是要研究多個荷載作用下的荷載效應(yīng)變量的概率分布問題,而當(dāng)前的大多數(shù)研究局限于多個荷載本身的聯(lián)合概率。例如,感潮河段洪水位是上游河道洪水和下游河口潮位共同作用的結(jié)果,堤防工程結(jié)構(gòu)破壞機(jī)制是河段洪水位超過了某一指定高程(如堤防設(shè)計(jì)洪水位)。因此,在今后復(fù)合洪澇事件研究中應(yīng)試圖建立荷載效應(yīng)變量與荷載變量的功能函數(shù),基于隨機(jī)變量函數(shù)的概率分布理論推算出荷載效應(yīng)變量的概率分布,并據(jù)此進(jìn)行工程設(shè)計(jì)和風(fēng)險評估。
1.2.4 豐枯遭遇
豐枯遭遇實(shí)質(zhì)是氣象水文變量的多區(qū)域組合問題,通常涉及到調(diào)水工程水源區(qū)和受水區(qū)的降水或徑流組合、多條河流的徑流組合或枯水流量組合等形式。分析水源區(qū)和受水區(qū)的豐枯遭遇對于跨流域水資源調(diào)配、多水源聯(lián)合調(diào)度等都具有重要意義,康玲和何小聰[59]、Du等[60]分別采用Copula函數(shù)研究了南水北調(diào)中線工程和山東省沭河至付疃河調(diào)水工程的豐枯遭遇問題。此外,很多學(xué)者在多條河流的徑流組合、不同站點(diǎn)的枯水流量組合等方面作了有益的探索[61-62],Ahmadi等[63]還進(jìn)行了基于時變Copula函數(shù)的兩變量非一致性枯水頻率聯(lián)合分析。
目前豐枯遭遇研究采用時間尺度一般為全年、汛期或非汛期,對于降雨徑流的變化描述不夠精細(xì),后續(xù)研究應(yīng)盡可能細(xì)化到月尺度以增強(qiáng)實(shí)用性。此外,當(dāng)前的豐枯遭遇研究通常采用天然徑流量資料,然而由于人類活動(水庫調(diào)蓄、土地利用等)影響了天然徑流的時空分布特征,原有的天然豐枯遭遇規(guī)律可能已經(jīng)發(fā)生變化,需要加強(qiáng)考慮人類活動影響的豐枯遭遇研究,更加真實(shí)地反映遭遇情況。
單站隨機(jī)模擬重點(diǎn)是描述水文事件多個特征屬性間的相關(guān)性結(jié)構(gòu)或水文時間序列的自相關(guān)特性,核心是如何構(gòu)造有效的聯(lián)合分布或條件分布。多站隨機(jī)模擬則要在此基礎(chǔ)上考慮站點(diǎn)間的空間相關(guān)性,同時模擬時間、空間2個相關(guān)結(jié)構(gòu)。Copula函數(shù)是刻畫變量相關(guān)性的有效工具,近年來也應(yīng)用于水文隨機(jī)模擬研究中。從隨機(jī)模擬的對象來看,主要可以分為降雨隨機(jī)模擬、洪水隨機(jī)模擬和徑流隨機(jī)模擬。
1.3.1 降雨隨機(jī)模擬
降雨事件隨機(jī)模擬首先基于Copula函數(shù)模擬降雨特征屬性,如降雨總量、降雨歷時、降雨強(qiáng)度、降雨間隔時間的相關(guān)性結(jié)構(gòu),然后模擬降雨的時程分配模式,最后對兩者進(jìn)行耦合。大多數(shù)研究主要針對單站點(diǎn)降雨事件隨機(jī)模擬,時間尺度上可以實(shí)現(xiàn)日、小時和分鐘[64-67。Bárdossy和Pegram[68]利用多維Copula函數(shù)同時模擬各站點(diǎn)間降雨量和降水發(fā)生的空間相關(guān)性,開發(fā)了多站點(diǎn)降雨隨機(jī)模擬模型。
近些年來,由于人類活動的強(qiáng)烈干擾,徑流形成的條件發(fā)生顯著的變化,破壞了水文資料系列的一致性,過去的實(shí)測資料無法反映未來的變化規(guī)律,在人類活動影響后新的徑流形成條件下通過暴雨資料推求設(shè)計(jì)洪水是一種可行途徑。因此,很有必要將建立的能考慮暴雨特征量間內(nèi)在相關(guān)性的隨機(jī)降水模型與流域水文模型進(jìn)行有機(jī)耦合,得到長系列的流量過程,從中統(tǒng)計(jì)得到洪水頻率曲線,推求變化環(huán)境下的設(shè)計(jì)洪水。目前這方面的研究剛剛起步,尚未進(jìn)入實(shí)用階段。
1.3.2 洪水隨機(jī)模擬
洪水事件隨機(jī)模擬一般分為2個模塊,即基于Copula函數(shù)的洪峰、洪量的聯(lián)合隨機(jī)模擬和洪水過程線形狀的模擬[69]。de Michele等[70]采用二維Copula函數(shù)隨機(jī)模擬水庫洪峰、洪量進(jìn)而生成大量入庫洪水過程線,Liu等[71]在此基礎(chǔ)上建立了大壩洪水漫頂風(fēng)險率計(jì)算模型。也有學(xué)者直接采用三維Copula函數(shù)構(gòu)建了洪量、洪峰和洪水歷時的聯(lián)合概率分布隨機(jī)模擬洪水過程線[72]。
目前基于Copula函數(shù)的洪水隨機(jī)模擬研究主要集中在單站洪水過程模擬,對于多站洪水同步模擬研究較少,而多站洪水隨機(jī)模擬是水庫群系統(tǒng)地區(qū)組成分析和運(yùn)行期設(shè)計(jì)洪水及汛控水位計(jì)算的有力工具,可以較好地克服水庫調(diào)蓄后設(shè)計(jì)斷面的洪水與天然情況同頻率假定的問題,建議加強(qiáng)這方面的研究。
1.3.3 徑流隨機(jī)模擬
徑流隨機(jī)模擬的核心是描述徑流時間序列的自相關(guān)結(jié)構(gòu),因此構(gòu)造徑流隨機(jī)模擬模型的重點(diǎn)就轉(zhuǎn)移到如何構(gòu)造有效的聯(lián)合分布或條件分布。閆寶偉等[73]建立了基于Copula函數(shù)的一階非平穩(wěn)時間序列季節(jié)性模型;Chen等[74]在此基礎(chǔ)上進(jìn)一步提出了可以考慮二階自相關(guān)的日流量隨機(jī)模擬方法;Chen等[75]將基于Copula函數(shù)的徑流隨機(jī)模擬推廣到多站點(diǎn)的月或日流量序列。
徑流隨機(jī)模擬技術(shù)的正確使用,將有助于得到比傳統(tǒng)方法更為可靠的結(jié)果,但是目前基于Copula函數(shù)的徑流隨機(jī)模擬研究大都局限于徑流樣本隨機(jī)生成理論方法的研究,應(yīng)積極推動隨機(jī)模擬生成徑流系列在水資源工程規(guī)劃設(shè)計(jì)和管理運(yùn)用實(shí)際中的應(yīng)用。另外,由于在徑流隨機(jī)模擬中所使用的模型缺乏物理機(jī)制,存在較大的模型不確定性,亟待加強(qiáng)模型與參數(shù)的不確定性研究工作。
水文模型與預(yù)報中大量存在變量相關(guān)性問題,例如評估水文預(yù)報結(jié)果的不確定性時需要模擬預(yù)報和實(shí)際流量之間的相關(guān)性,水文模型的輸入、參數(shù)和輸出之間也存在相關(guān)性[76]。應(yīng)用Copula函數(shù)解決水文模型預(yù)報相關(guān)問題主要包括水文預(yù)報不確定性評估和水文模型輸入、參數(shù)和輸出之間相關(guān)性模擬等。
1.4.1 水文預(yù)報不確定性評估
采用Copula函數(shù)構(gòu)建預(yù)報流量和實(shí)際流量的聯(lián)合概率分布,然后基于給定預(yù)報流量時實(shí)際流量的條件概率分布分析評估水文預(yù)報不確定性[76],或用條件概率分布推導(dǎo)描述貝葉斯先驗(yàn)分布和似然函數(shù),再基于得到的后驗(yàn)分布對水文預(yù)報不確定性進(jìn)行評價[77]。Madadgar和Moradkhani[78]提出了耦合Copula函數(shù)的貝葉斯模式平均(BMA)方法;劉章君等[77, 79]提出了基于Copula函數(shù)的單變量和多變量水文不確定性處理器(HUP)。
近幾年,基于Copula函數(shù)的水文預(yù)報不確定性評估方法取得了快速發(fā)展,應(yīng)用非常靈活,可以實(shí)現(xiàn)非線性和非正態(tài)條件下的概率水文預(yù)報。但仍存在有待進(jìn)一步深入研究的問題:一方面,基于Copula函數(shù)的概率水文預(yù)報應(yīng)逐步實(shí)現(xiàn)從單站點(diǎn)、單變量向多站點(diǎn)、多變量轉(zhuǎn)變,以期考慮水文變量間的時空相關(guān)性并降低預(yù)報不確定性;另一方面,要加強(qiáng)概率水文預(yù)報結(jié)果在洪水風(fēng)險預(yù)警、水庫調(diào)度風(fēng)險決策中的應(yīng)用,實(shí)現(xiàn)預(yù)報與風(fēng)險決策過程的有機(jī)結(jié)合,真正體現(xiàn)概率水文預(yù)報的價值和效益。
1.4.2 水文模型輸入、參數(shù)和輸出之間相關(guān)性模擬
通過利用Copula函數(shù)建立水文模型各輸入、各參數(shù)或輸入和參數(shù)之間的聯(lián)合分布,捕捉其相關(guān)性結(jié)構(gòu),得到的結(jié)果比假定它們相互獨(dú)立更加合理。Xiong等[80]基于Copula函數(shù)和概率分布推導(dǎo)法得到了年徑流的概率分布。Fan等[81]提出了基于Copula函數(shù)的粒子濾波方法用于水文資料同化。Wang和Fu[82]基于Copula函數(shù)建立了二元概率Budyko方法框架,并應(yīng)用于全球水資源可利用量的概率評估。此外,也有學(xué)者以洪水或徑流作為因變量,采用Copula函數(shù)直接建立因變量與自變量(影響因子)的聯(lián)合分布,基于條件概率分布進(jìn)行洪水或徑流模擬預(yù)測[83-84]。
不同水文模型各輸入、各參數(shù)或輸入和參數(shù)之間的相關(guān)性各具特點(diǎn),建模時采用能準(zhǔn)確捕捉相關(guān)性特征的Copula函數(shù)極為重要,如何有效地識別最優(yōu)Copula函數(shù)仍有待進(jìn)一步研究。采用Copula函數(shù)建立洪水(或徑流)及其影響因子的條件概率分布涉及的主要影響因子通常有多個,便于構(gòu)建高維Copula函數(shù)的藤Copula模型得到普遍應(yīng)用,然而目前藤Copula函數(shù)的結(jié)構(gòu)和參數(shù)不確定性分析考慮較少,有必要加強(qiáng)這方面的研究。
除了上述幾個方面外,國內(nèi)外學(xué)者還在降雨—徑流關(guān)系變異診斷[85]、水文氣象站網(wǎng)優(yōu)化設(shè)計(jì)[86]、水庫隨機(jī)優(yōu)化調(diào)度[87]等方面進(jìn)行了探索性研究,拓展了Copula函數(shù)在水文水資源領(lǐng)域的應(yīng)用范圍。
雖然Copula函數(shù)是描述變量間相關(guān)性結(jié)構(gòu)和多變量水文分析的一種有效數(shù)學(xué)工具,但要有一個客觀的認(rèn)識,既要認(rèn)識到其優(yōu)越性,也不能不加分析判斷盲目使用,在實(shí)際應(yīng)用中應(yīng)注意以下幾個方面的問題。
(1) Copula函數(shù)的應(yīng)用條件。Copula函數(shù)不是一種萬能工具,并不是所有關(guān)于相關(guān)性和多元分布的問題都可以套用。應(yīng)用Copula函數(shù)的前提條件是確保所分析的變量之間確實(shí)存有物理上的相關(guān)性,否則會得到錯誤的結(jié)論。
(2) Copula函數(shù)的參數(shù)估計(jì)。以水文領(lǐng)域中最常采用的阿基米德Copula函數(shù)族為例,目前二維情形可以采用Kendall秩相關(guān)系數(shù)法;對于三維及以上的Copula函數(shù),大多采用極大似然法。依據(jù)邊緣分布估計(jì)方法的不同,極大似然方法又可分為全參數(shù)、兩階段和半?yún)?shù)極大似然法,其中半?yún)?shù)法不受邊際分布的影響,穩(wěn)健性較好,推薦使用。也有學(xué)者提出貝葉斯方法和非參數(shù)方法進(jìn)行參數(shù)估計(jì),但目前實(shí)際中應(yīng)用較少。
(3) 對稱型和非對稱型Copula函數(shù)。對稱型Copula函數(shù)要求變量兩兩之間的相關(guān)性結(jié)構(gòu)相同或非常相似,要求變量之間的相關(guān)系數(shù)非常接近,但多變量水文分析實(shí)際中兩兩變量的相關(guān)性結(jié)構(gòu)往往并不相同。對于具有不對稱相關(guān)性的高維隨機(jī)變量,單參數(shù)難以真實(shí)反映其復(fù)雜的不對稱相關(guān)結(jié)構(gòu)。非對稱型Copula函數(shù)具有更加靈活的參數(shù)和結(jié)構(gòu)形式,更適用于擬合高維的水文隨機(jī)變量,在水文多變量分析計(jì)算實(shí)際應(yīng)用中更加合適。
(4) Copula函數(shù)的選擇。Copula函數(shù)本身不具有水文物理基礎(chǔ),不能從物理意義上確定各隨機(jī)變量的理論聯(lián)合分布模型。實(shí)際應(yīng)用中采用不同Copula函數(shù),計(jì)算結(jié)果有較大差異,因此選取合適的Copula函數(shù)尤其關(guān)鍵。實(shí)際工作中一般選取與已有實(shí)測資料配合最優(yōu)的Copula函數(shù),常用的擬合優(yōu)度準(zhǔn)則有均方根誤差準(zhǔn)則(RMSE值最小)、Akaike信息準(zhǔn)則(AIC值最小)以及Cramér-von Mises檢驗(yàn)法(P值大于0.05通過擬合檢驗(yàn),統(tǒng)計(jì)量Sn最小作為最優(yōu)Copula函數(shù))。
(5) Copula函數(shù)的尾部特性。不同水文事件表現(xiàn)出的尾部相關(guān)特性差異較大,不考慮尾部相關(guān)性可能會高估或低估風(fēng)險。例如,通常認(rèn)為Gumbel-Hougaard Copula函數(shù)能夠擬合洪水的上尾相關(guān)性,Clayton Copula函數(shù)可以擬合枯水的下尾相關(guān)性,若沒有考慮尾部相關(guān)性而誤用了其他的Copula函數(shù),對于洪水和枯水都會造成高估或低估災(zāi)害事件的風(fēng)險。因此,擬合優(yōu)度只是選擇Copula函數(shù)的必要條件,而不是充分條件,應(yīng)根據(jù)水文事件特點(diǎn)選擇可以準(zhǔn)確描述尾部相關(guān)特性的Copula函數(shù)。
(6) 多變量重現(xiàn)期的選取。單變量情況下,重現(xiàn)期和設(shè)計(jì)值存在唯一的對應(yīng)關(guān)系,計(jì)算方法清晰簡單。在多變量情況下,由于涉及到各變量的多種組合,目前對多變量重現(xiàn)期的定義也相應(yīng)有很多種,最常用的有“或”(“OR”)、“且”(“AND”)、Kendall和生存Kendall重現(xiàn)期以及最近興起的結(jié)構(gòu)荷載重現(xiàn)期。這些多變量重現(xiàn)期表征的物理意義和危險區(qū)域的劃分方式不同,實(shí)際應(yīng)用中尚沒有公認(rèn)、通用的選擇方法,基本原則是要根據(jù)具體研究問題的物理背景而定,選擇能夠正確表征水文失事機(jī)理的多變量重現(xiàn)期,作為水文事件聯(lián)合設(shè)計(jì)和風(fēng)險評估的依據(jù)。
(7) Copula函數(shù)模型成果的抽樣誤差。相同樣本容量下,基于Copula函數(shù)的多變量水文分析計(jì)算模型比單變量模型具有更大的抽樣不確定性,相同模型成果許可誤差下需要的樣本容量更大(如單變量模型需要幾十年資料,相應(yīng)多變量模型則可能需要幾百年)。因此,雖然Copula函數(shù)在理論上是構(gòu)建多變量水文分析計(jì)算模型的一種有效工具,但在應(yīng)用層面上,仍然難以擺脫工程實(shí)踐中樣本容量較小的制約,應(yīng)該重視模型成果不確定性分析。
自Copula函數(shù)理論與方法引入水文水資源領(lǐng)域以來,許多學(xué)者對其進(jìn)行研究和探討,在水文事件多變量頻率分析、水文事件遭遇組合分析、水文隨機(jī)模擬、水文模型與預(yù)報及其他問題中的應(yīng)用研究迅速發(fā)展。經(jīng)過十幾年在水文水資源領(lǐng)域中的應(yīng)用,已證實(shí)Copula函數(shù)是一種靈活構(gòu)造多變量聯(lián)合分布和處理多變量問題的有效工具,并顯示出良好的適用性和不可替代的優(yōu)越性。鑒于水文現(xiàn)象的高度復(fù)雜性,仍存在不少需要繼續(xù)深入探討的問題,建議進(jìn)一步開展以下幾個方面的研究工作。
(1) 繼續(xù)完善Copula函數(shù)的理論和方法。首先,高維Copula函數(shù)的構(gòu)建及其參數(shù)估計(jì)方法仍是Copula理論研究中的難點(diǎn)之一,藤Copula可以將高維Copula分解為若干二元Copula,在應(yīng)用中降低計(jì)算量,使得高維問題得到簡化,是今后研究的重點(diǎn)。其次,目前應(yīng)用最廣泛的阿基米德和橢圓類Copula函數(shù)都有其自身的局限性,后續(xù)研究可以拓展新的Copula函數(shù)簇,以適應(yīng)復(fù)雜多變的水文現(xiàn)象。最后,與其他水文分析計(jì)算方法相結(jié)合也是未來的一種發(fā)展趨勢,如Copula函數(shù)與熵理論、貝葉斯理論、馬爾可夫鏈等結(jié)合。
(2) 深入開展非一致性條件下的Copula函數(shù)建模方法研究。由于氣候變化及人類活動(水庫調(diào)蓄、土地利用和植被變化)的影響,應(yīng)用Copula函數(shù)建模時單個水文變量的邊緣分布和水文變量之間的相關(guān)結(jié)構(gòu)都可能發(fā)生變化。時變Copula函數(shù)模型的求解難度增大,仍需在實(shí)用化方面進(jìn)一步研究。因此,建議深入開展非一致性條件下的Copula函數(shù)建模方法研究,以期得到更加科學(xué)實(shí)用的結(jié)論。
(3) 建立Copula函數(shù)多變量模型的不確定性分析框架?;贑opula函數(shù)建立的多變量模型往往比單變量模型具有更大的不確定性,不僅涉及邊緣分布的不確定性,還要考慮相關(guān)性結(jié)構(gòu)(Copula函數(shù))的不確定性。兩者又均涉及到樣本抽樣、線型(類型)選取和參數(shù)估計(jì)不確定性,評估綜合不確定性非常復(fù)雜,目前相關(guān)研究仍處于起步階段,亟待建立一套多變量模型不確定性分析框架。
(4) 推進(jìn)Copula函數(shù)在水文水資源領(lǐng)域更深、更廣層次的應(yīng)用研究。深化Copula函數(shù)在水文事件多變量頻率分析、水文事件遭遇組合分析、水文隨機(jī)模擬、水文模型與預(yù)報等現(xiàn)有領(lǐng)域的應(yīng)用,改進(jìn)和完善當(dāng)前研究存在的問題和不足。此外,進(jìn)一步拓展Copula函數(shù)的應(yīng)用范圍,例如水文系列插補(bǔ)延長、山洪災(zāi)害動態(tài)臨界雨量計(jì)算、水位—流量關(guān)系、相應(yīng)水位(流量)預(yù)報等。