鄭炎輝,何艷虎,李深林,陳曉宏??
(1:中山大學(xué)水資源與環(huán)境研究中心,廣州510275)(2:華南地區(qū)水循環(huán)和水安全廣東普通高校重點(diǎn)實(shí)驗(yàn)室,廣州510275)
基于POT與P-IOSM的洪水風(fēng)險(xiǎn)信息挖掘?
鄭炎輝1,2,何艷虎1,2,李深林1,2,陳曉宏1,2??
(1:中山大學(xué)水資源與環(huán)境研究中心,廣州510275)
(2:華南地區(qū)水循環(huán)和水安全廣東普通高校重點(diǎn)實(shí)驗(yàn)室,廣州510275)
為了從有限的實(shí)測(cè)資料中挖掘更多洪水信息,以武江流域?yàn)檠芯繉?duì)象,在考證歷史洪水進(jìn)行特大值處理基礎(chǔ)上,基于犁市(二)水文站1956-2009年實(shí)測(cè)日流量數(shù)據(jù)提取了POT樣本,構(gòu)建基于P-Ⅲ模型確定控制點(diǎn)而改進(jìn)的非等步長(zhǎng)內(nèi)集-外集模型(P-IOSM)進(jìn)行洪水風(fēng)險(xiǎn)信息挖掘.結(jié)果表明:結(jié)合POT和P-IOSM模型的洪水風(fēng)險(xiǎn)評(píng)估能夠從有限的實(shí)測(cè)資料中獲取更多的洪水風(fēng)險(xiǎn)信息,得到更貼近事實(shí)的風(fēng)險(xiǎn)評(píng)估結(jié)果,能為決策者提供更多的依據(jù),從而使決策結(jié)果更加可靠實(shí)用.
洪水風(fēng)險(xiǎn);信息挖掘;POT;P-Ⅲ分布;信息分配;P-IOSM;武江流域
我國(guó)大多數(shù)水文監(jiān)測(cè)站點(diǎn)的洪水觀測(cè)數(shù)據(jù)時(shí)間序列較短,觀測(cè)系列通常只有幾十年[1],同時(shí)洪水災(zāi)害風(fēng)險(xiǎn)具有隨機(jī)、模糊、灰色等諸多的不確定性[2].在現(xiàn)有條件下洪水災(zāi)害的風(fēng)險(xiǎn)是估不準(zhǔn)的,傳統(tǒng)概率計(jì)算方法(如概率論、數(shù)理統(tǒng)計(jì)等理論與方法)建立在大量連續(xù)時(shí)間序列統(tǒng)計(jì)資料基礎(chǔ)上,而實(shí)際中會(huì)常遇到“小樣本”的不完備信息問(wèn)題,存在不精確和不確定的理論瓶頸[3-4].因此,為了提高洪水災(zāi)害的風(fēng)險(xiǎn)分析結(jié)果的可靠性和準(zhǔn)確性,從有限的實(shí)測(cè)資料中挖掘更多洪水信息的研究顯得尤為重要.
近年來(lái),許多研究者都通過(guò)POT抽樣法擴(kuò)大了洪水樣本,在此基礎(chǔ)上進(jìn)行洪水次數(shù)、量級(jí)、風(fēng)險(xiǎn)等研究,彌補(bǔ)改善了傳統(tǒng)AMS抽樣樣本較少的這一缺陷[5-9].與傳統(tǒng)年最大值(AnnualMaximum Series,AMS)抽樣相比,超定量(Peak-over-Threshold,POT)抽樣擴(kuò)大了樣本容量,不僅反映洪水量級(jí),還能反映洪水發(fā)生過(guò)程,相比較而言,更具物理相關(guān)性,能更有效利用實(shí)測(cè)資料描述洪水特征,能更充分利用洪水信息[10-12].
自從黃崇福等[13-16]系統(tǒng)提出信息擴(kuò)散、內(nèi)集-外集模型(IOSM)等多種模糊風(fēng)險(xiǎn)評(píng)價(jià)方法用于洪水災(zāi)害風(fēng)險(xiǎn)分析、地震災(zāi)害風(fēng)險(xiǎn)分析等領(lǐng)域后,鄒強(qiáng)[17]、Liu等[18]、Feng等[19]將IOSM模型應(yīng)用于洪水災(zāi)害、火災(zāi)、臺(tái)風(fēng)災(zāi)害等領(lǐng)域,在有限的觀測(cè)樣本中進(jìn)行了較為完備、可靠地災(zāi)害風(fēng)險(xiǎn)分析.使用基于信息分配原理建立的內(nèi)集-外集模型,可以針對(duì)信息不足而導(dǎo)致風(fēng)險(xiǎn)值估不準(zhǔn)的缺陷,將樣本進(jìn)行模糊處理來(lái)充分利用樣本的模糊過(guò)渡信息,使具有單值觀測(cè)值的樣本點(diǎn)轉(zhuǎn)化為具有模糊集值的樣本集,從而盡可能地填補(bǔ)小樣本信息存在的不完備空隙,通過(guò)有限的知識(shí)來(lái)試圖挖掘信息的內(nèi)在聯(lián)系和發(fā)生規(guī)律.通過(guò)這個(gè)途徑,將所有樣本的單值信息擴(kuò)散到設(shè)定好的控制域中所有點(diǎn)上,得到較為豐富的信息資料[20],可在保證期望值合理可靠的前提下體現(xiàn)風(fēng)險(xiǎn)估計(jì)的不精確性、不完備性,為快速而合理的風(fēng)險(xiǎn)判斷、及時(shí)而有效的風(fēng)險(xiǎn)規(guī)避提供科學(xué)依據(jù)[13-15].
在模糊處理技術(shù)領(lǐng)域的信息分配中,存在一個(gè)瓶頸問(wèn)題——控制點(diǎn)的選取.傳統(tǒng)內(nèi)集-外集模型控制點(diǎn)的選取通常采用Otness等[21]提出的控制點(diǎn)選擇公式,但是該公式的前提是正態(tài)總體和樣本量較大時(shí),因此在選取內(nèi)集-外集模型的控制點(diǎn)時(shí),直接引用會(huì)出現(xiàn)一些問(wèn)題,特別是信息較為集中且存在特大值的時(shí)候,部分控制區(qū)間會(huì)沒(méi)有樣本點(diǎn).因而本文將對(duì)其進(jìn)行改進(jìn),根據(jù)皮爾遜Ⅲ型曲線的頻率分析結(jié)果確定控制區(qū)間,將原來(lái)的等步長(zhǎng)IOSM模型改進(jìn)為根據(jù)皮爾遜Ⅲ型曲線的頻率分析結(jié)果確定控制區(qū)間的不等步長(zhǎng)P-IOSM模型.
綜上所述,本研究在POT抽樣基礎(chǔ)上,以南方濕潤(rùn)區(qū)武江流域?yàn)槔瑢⒒谛畔⒎峙湓砀倪M(jìn)的不等步長(zhǎng)P-IOSM模型應(yīng)用到洪災(zāi)風(fēng)險(xiǎn)分析中,從有限的實(shí)測(cè)資料中挖掘盡可能多的洪水信息,在現(xiàn)有信息不完備條件下得到了可能性概率風(fēng)險(xiǎn)值,可為決策者提供多層次、多值化的洪水風(fēng)險(xiǎn)信息.
研究區(qū)域?yàn)槲浣饔颍?4°50′~25°31′N,112°50′~113°35′E),面積7097 km2,干流全長(zhǎng)260 km,為珠江流域北江水系的一級(jí)支流,發(fā)源于湖南省臨武縣三峰嶺,于韶關(guān)市匯入北江.
洪水超定量序列和年最大值序列的提取采用武江下游重要控制站犁市(二)水文站1956-2009年的日流量資料(其中“2006·07”洪水作特大洪水處理)[6].
2.1 POT樣本提取
POT樣本提取有兩個(gè)關(guān)鍵,即洪峰樣本獨(dú)立性判別和超定量序列門限值的確定[12].
2.1.1 洪峰樣本獨(dú)立性判別標(biāo)準(zhǔn) 進(jìn)行洪水超定量頻率分析的前提是超定量洪峰樣本具有獨(dú)立性.本文結(jié)合美國(guó)水資源協(xié)會(huì)(USWRC)提出的判別標(biāo)準(zhǔn)與王善序等提出的超定量抽樣原則[6-7],進(jìn)行洪峰獨(dú)立性判別.
同時(shí)選取兩個(gè)連續(xù)洪峰的條件為[12]:
式中,θ為兩個(gè)峰間的間隔時(shí)間(d);A為流域面積(km2);Qi為第i場(chǎng)洪水的最大日流量.
不滿足上述條件的連續(xù)洪峰中,只取其中最大一次洪峰[1].
2.1.2 超定量序列門限值確定 超定量序列門限值S是確定超定量序列樣本的重要參數(shù).目前普遍認(rèn)為,門限值S的選擇并不唯一,關(guān)鍵在于使提取的超定量樣本服從某些標(biāo)準(zhǔn).門限值應(yīng)根據(jù)超定量系列發(fā)生次數(shù)分布、超定量洪水頻率分布以及獨(dú)立同分布假設(shè)共同確定[12].
(1)超定量樣本均值法:Davison等[22]認(rèn)為門限值應(yīng)在以下范圍內(nèi)選?。撼繕颖境^(guò)部分的均值(ˉXS-S)是門限值S的線性函數(shù),其中ˉXS是超定量樣本均值.該方法是通過(guò)門限值的確定使POT模型的廣義Pareto分布參數(shù)估計(jì)穩(wěn)定性最高[12].
(2)分散指數(shù)法:Ashkar等[23]認(rèn)為門限值的選擇應(yīng)使樣本分散指數(shù)在一個(gè)置信區(qū)間內(nèi),以確保超定量發(fā)生次數(shù)服從Poisson分布.
式中,m為年超定量發(fā)生次數(shù)序列,m(i)為第i年的超定量發(fā)生次數(shù);NY為實(shí)測(cè)資料的年數(shù);I為超定量序列發(fā)生次數(shù)的分散指數(shù);h服從自由度為(NY-1)的卡方分布.
泊松過(guò)程的分散指數(shù)為1,取置信區(qū)間為[5%,95%],則若χ2(5%)/(NY-1)<I<χ2(95%)/(NY-1),超定量次數(shù)服從泊松分布;其中χ2(5%)的自由度為(NY-1).
(3)年均超定量發(fā)生次數(shù)n法:n>1.65時(shí)采用指數(shù)分布做POT模型能取得較好的效果[24],n過(guò)大易影響樣本獨(dú)立性;國(guó)內(nèi)關(guān)于洪水超定量頻率分析多控制在2~3次[5].
本文在滿足條件(1)和(2)的門限值范圍內(nèi),選擇滿足n>2的較大門限值.
2.2 P-Ⅲ型頻率曲線
我國(guó)一般采用P-Ⅲ型頻率曲線來(lái)計(jì)算設(shè)計(jì)洪水[25],分布參數(shù)采用適線法估計(jì),具體計(jì)算公式參考相關(guān)文獻(xiàn)[26-27].
2.3 改進(jìn)的內(nèi)集-外集模型(P-IOSM)
2.3.1 內(nèi)集-外集模型(IOSM) 設(shè)洪水的觀測(cè)樣本為:
設(shè)U是樣本X的論域,u1、u2、…、um是給定步長(zhǎng)為Δ的離散點(diǎn),即Δ為控制點(diǎn)步長(zhǎng),Δ=uj-uj-1,j=2、3、…、m.
IOSM用來(lái)計(jì)算不利事件發(fā)生在區(qū)間Ij的模糊概率,這里:
顯然控制點(diǎn)uj是Ij的中間點(diǎn),且對(duì)于任意樣本點(diǎn)xi,均只落入一個(gè)區(qū)間.
根據(jù)樣本點(diǎn)分布的具體情況和IOSM的計(jì)算要求,區(qū)間總數(shù)m的確定方法為[21]:
當(dāng)樣本點(diǎn)xi受到隨機(jī)擾動(dòng)時(shí),樣本點(diǎn)會(huì)與Ij發(fā)生位置的變化,可能會(huì)離開(kāi)或進(jìn)入Ij.這里將離開(kāi)定義為游離,將進(jìn)入定義為漂入,對(duì)樣本點(diǎn)xi而言,游離或漂入?yún)^(qū)間Ij的可能性分別記為
為了方便地計(jì)算,首先給出樣本集合X關(guān)于區(qū)間Ij的內(nèi)集和外集定義:
(1)內(nèi)集Xin-j:Xin-j?X∩Ij,由所有在區(qū)間Ij內(nèi)元素構(gòu)成.
(2)外集Xout-j:Xout-j?X\Xin-j,由所有不在區(qū)間Ij內(nèi)元素構(gòu)成.在此基礎(chǔ)上,內(nèi)指標(biāo)集和外指標(biāo)集定義如下:
(1)內(nèi)指標(biāo)集Sj:如果?s∈Sj,有xs∈Xin-j,且{xs|s∈Sj}=Xin-j.
(2)外指標(biāo)集Tj:如果?t∈Tj,有xt∈Xout-j,且{xt|t∈Tj}=Xout-j.
如果Sj或Xin-j的容量為nj,記為.應(yīng)用信息分配公式:
樣本點(diǎn)xi游離或漂入?yún)^(qū)間Ij的可能性的計(jì)算公式分別如下:
顯然,對(duì)于Ij內(nèi)集中的樣本點(diǎn)xi,如果其qij值越小,則其離開(kāi)所在區(qū)間Ij并漂移到鄰近區(qū)間的可能性越大,反之亦然.同樣,對(duì)于Ij外集中的樣本點(diǎn)xi,如果其qij值越小,則其落入?yún)^(qū)間Ij的可能性越大,反之亦然.特別地,當(dāng)xi是Ij內(nèi)集中的點(diǎn)時(shí),稱xi已漂入Ij,其漂入的可能性定義為0;而當(dāng)xi是Ij外集中的點(diǎn)時(shí),稱xi已游離Ij,其游離的可能性定義為0.在區(qū)間論域和離散概率論域,根據(jù)式(10)的內(nèi)集-外集模型,可計(jì)算出一個(gè)關(guān)于隨機(jī)不利事件
發(fā)生在區(qū)間Ij中的可能性-概率分布(possibility-probability distribution,PPD):
式中,πIj(p)表示不利事件屬于區(qū)間Ij的概率為p的可能性,可以看作為區(qū)間Ij對(duì)概率p的隸屬度.
2.3.2 改進(jìn)的內(nèi)集-外集模型(P-IOSM) 當(dāng)采用式(7)確定控制區(qū)間,存在特大值的時(shí)候會(huì)出現(xiàn)部分區(qū)間可能性概率為0,導(dǎo)致流量較小區(qū)間可能性估計(jì)值小于流量較大區(qū)間的異常現(xiàn)象.因而對(duì)其進(jìn)行改進(jìn),基于皮爾遜Ⅲ型能較好擬合我國(guó)大多數(shù)河流的洪水系列,因而將原來(lái)的等步長(zhǎng)IOSM模型改進(jìn)為根據(jù)皮爾遜Ⅲ型曲線的頻率分析結(jié)果確定控制區(qū)間的不等步長(zhǎng)P-IOSM模型.
設(shè)Ij是控制區(qū)間,Δj是控制區(qū)間步長(zhǎng),由頻率分析得到各控制區(qū)間最大值IjPmax和最小值IjPmin,則可得到各控制區(qū)間范圍及控制區(qū)間步長(zhǎng):
同時(shí),式(8)改為:
2.4 基于IOSM模型的風(fēng)險(xiǎn)估計(jì)
由式(8)可知,在一個(gè)概率-可能性分布里,區(qū)間數(shù)量為m,可能性數(shù)量為n+1.可以這樣認(rèn)為,任意一個(gè)區(qū)間Ij,對(duì)應(yīng)有n+1個(gè)可能性,即πIj(pi)(i=0、1、…、n),相應(yīng)的可能性可以看作為區(qū)間Ij對(duì)概率pi的隸屬度.為了能夠盡可能多地為風(fēng)險(xiǎn)管理提供決策消息,這里用控制點(diǎn)uj來(lái)代表Ij,可以根據(jù)式(12)~(15)計(jì)算出區(qū)間Ij上可能性的權(quán)重ωi和期望值E[uj]:
式中,ωi(i=0、1、…、n)根據(jù)式(17)~(19)得到[28]:
式中,μr=πIj(pr),r=0、1、…、n.顯然,ωi≥0且
這樣,根據(jù)式(16)就得到了各個(gè)區(qū)間的期望值.在此基礎(chǔ)上,計(jì)算得到不利事件發(fā)生在區(qū)間Ij的概率:
那么風(fēng)險(xiǎn)估計(jì)值即為可能性估計(jì)值的累積:
3.1 超定量門限值提取
根據(jù)公式(1),符合獨(dú)立性判別標(biāo)準(zhǔn)的洪峰之間的時(shí)間間隔約為14天.對(duì)犁市(二)站54年日流量資料進(jìn)行洪峰獨(dú)立性判別,提取獨(dú)立洪峰超定量樣本.在提取過(guò)程中,部分洪峰雖然流量較大,但因洪峰之間時(shí)間間隔小于14天或者洪峰之間最小流量過(guò)大,不滿足獨(dú)立性判別標(biāo)準(zhǔn)而未入選.
根據(jù)所選獨(dú)立洪峰,綜合考慮超定量樣本均值法、分散指數(shù)法和年均超定量發(fā)生次數(shù),通過(guò)試算,確定最大門限值取S=1079m3/s,年均超定量發(fā)生次數(shù)為2.4,樣本數(shù)目為130個(gè).
具體確定過(guò)程如下:
a.對(duì)門限值進(jìn)行試算,由圖1超定量樣本超過(guò)部分均值(XS-S)與門限值S的關(guān)系曲線可知,當(dāng)門限值在區(qū)間[419,1079]m3/s時(shí),(-S)與S呈穩(wěn)定的線性關(guān)系.
圖1 超定量樣本超過(guò)部分均值與門限值的關(guān)系曲線Fig.1 The relation curve between the values that average of the peak over threshold minus the corresponding threshold and the corresponding thresholds
b.計(jì)算超定量序列發(fā)生次數(shù)的分散指數(shù),繪制分散指數(shù)圖,由且圖2可知S>324 m3/s時(shí)分散指數(shù)位于[5%,95%]的置信區(qū)間內(nèi),即年超定量個(gè)數(shù)服從泊松分布.
c.根據(jù)a和b可知在324~1079 m3/s范圍內(nèi)選擇滿足n>2的門限值,選擇最大門限值以加強(qiáng)樣本獨(dú)立性,取S=1079 m3/s,n=2.4.由此提取130個(gè)洪峰構(gòu)成POT樣本.
3.2 P-Ⅲ型頻率分析
根據(jù)POT取樣獲取130個(gè)獨(dú)立洪峰樣本,其中2006年7月洪水作特大洪水處理,對(duì)POT序列進(jìn)行P-Ⅲ型頻率分析,擬合效果優(yōu)良,相關(guān)系數(shù)達(dá)到0.98(圖3).
各設(shè)計(jì)頻率洪峰流量見(jiàn)表1.
表1 犁市(二)站不同設(shè)計(jì)頻率對(duì)應(yīng)洪峰流量Tab.1 Corresponding peak discharge of different design frequencies in Lishi(2)station
圖2 分散指數(shù)圖Fig.2 Figure of dispersion index
圖3 犁市(二)站POT洪水頻率曲線Fig.3 POT flood frequency curve of Lishi(2)station
3.3 基于P-IOSM的可能性-概率分布
如果采用式(7)確定控制區(qū)間,則區(qū)間數(shù)目為14,根據(jù)IOSM模型計(jì)算[7500,8000]區(qū)間最大可能性概率為0.008,而區(qū)間[7000,7500]、[6500,7000]、[6000,6500]、[5500,6000]可能性概率都為0,這與現(xiàn)實(shí)不符,原因是觀測(cè)樣本有限,觀測(cè)樣本并未能覆蓋所有區(qū)間,因而導(dǎo)致了部分區(qū)間可能性概率都為0的情況.因而皮爾遜Ⅲ型曲線的頻率分析結(jié)果確定控制區(qū)間,根據(jù)不同設(shè)計(jì)頻率洪峰流量劃分控制區(qū)間,得到控制區(qū)間與相應(yīng)控制中心值(表2).
表2 控制區(qū)間與相應(yīng)控制中心值(m3/s)Tab.2 The intervals and the corresponding discrete domains
根據(jù)一維線性信息分配函數(shù)即公式(8)計(jì)算擴(kuò)散信息矩陣qij,然后根據(jù)公式(9)和公式(10)分別計(jì)算得到游離信息矩陣qij和漂入信息矩陣q+ij;在此基礎(chǔ)上,根據(jù)公式(11)和公式(12)可得可能性-概率分布矩陣(PPD)(表3和圖4).
由表3和圖4可以看出災(zāi)害等級(jí)越高的洪水,其最大可能性(可能性為1)對(duì)應(yīng)的概率值越小,與災(zāi)害等級(jí)越高的洪水發(fā)生的概率越小這一現(xiàn)實(shí)相符.
表3 基于P-IOSM的可能性-概率分布Tab.3 Probability-possibility distribution based on P-IOSM
圖4 基于P-IOSM的可能性-概率分布Fig.4 Figure of probability-possibility distribution based on P-IOSM
根據(jù)公式(16)~(21)來(lái)計(jì)算得到不同等級(jí)災(zāi)害概率估計(jì)值p(uj)、風(fēng)險(xiǎn)估計(jì)值P(uj),從PPD可知,從不利事件樣本X出發(fā),不能確定不利事件發(fā)生的概率值,而是一個(gè)模糊集,即一個(gè)不利災(zāi)害事件對(duì)應(yīng)著幾個(gè)概率值,只是可能程度不同而已.它充分體現(xiàn)了在現(xiàn)有條件下自然災(zāi)害風(fēng)險(xiǎn)估不準(zhǔn)這一特性,與實(shí)際情況更加接近.
表4 基于P-ISOM的風(fēng)險(xiǎn)評(píng)估值結(jié)果Tab.4 Risk value estimation based on P-IOSM
例如對(duì)控制點(diǎn)u4而言,雖然洪峰流量落在以u(píng)4=3440為控制中心的區(qū)間3073<x<3807內(nèi)以p=0.023的可能性最大(為1),但是也不能忽視其他概率發(fā)生的可能性,即便是對(duì)于從不發(fā)生的p=0,仍然也有0.191的可能性.
不同級(jí)別災(zāi)害的可能性-概率分布具有相似的規(guī)律,只是其最大可能性對(duì)應(yīng)的概率不同.
如果用傳統(tǒng)直方圖計(jì)算頻率,用以代替概率,可計(jì)算出七級(jí)、六級(jí)、五級(jí)、四級(jí)、三級(jí)、二級(jí)、一級(jí)的概率依次為0.431、0.385、0.115、0.023、0.023、0.015和0.008,與基于P-IOSM計(jì)算的各等級(jí)災(zāi)害最大可能性一致,但若僅使用傳統(tǒng)直方圖計(jì)算災(zāi)害發(fā)生概率,則會(huì)出現(xiàn)三級(jí)災(zāi)害和四級(jí)災(zāi)害出現(xiàn)概率相等的結(jié)論,實(shí)際上三級(jí)災(zāi)害出現(xiàn)概率應(yīng)小于四級(jí)災(zāi)害,這在PPD中有所體現(xiàn),三級(jí)災(zāi)害發(fā)生概率為0.015有0.914可能性,四級(jí)災(zāi)害發(fā)生概率為0.015只有0.518可能性,說(shuō)明三級(jí)災(zāi)害比四級(jí)災(zāi)害更大可能性概率為0.015,即三級(jí)災(zāi)害比四級(jí)災(zāi)害發(fā)生概率小的可能性更大,同時(shí)從表4可知三級(jí)災(zāi)害出現(xiàn)概率為0.023,小于四級(jí)災(zāi)害的出現(xiàn)概率0.028,與現(xiàn)實(shí)相符.
可能性-概率分布本身保留了許多不確定信息,這些附加信息更貼近事實(shí),能為決策者提供更多的依據(jù),從而使決策結(jié)果更加可靠實(shí)用.
基于武江流域犁市(二)水文站1956-2009年實(shí)測(cè)日流量數(shù)據(jù)提取了POT樣本,在考證歷史洪水進(jìn)行特大值處理的基礎(chǔ)上,構(gòu)建基于P-Ⅲ模型確定控制點(diǎn)而改進(jìn)的非等步長(zhǎng)內(nèi)集-外集模型(P-IOSM)進(jìn)行洪水模糊風(fēng)險(xiǎn)分析.主要結(jié)論如下:
1)與年最大值模型相比,采用POT模型進(jìn)行洪水樣本選取,能充分利用實(shí)測(cè)洪水信息,增大樣本容量,降低抽樣誤差,從有限的觀測(cè)數(shù)據(jù)中獲取更多洪水樣本信息.
2)基于P-Ⅲ模型確定控制點(diǎn),能夠使洪水信息更為合理地在研究區(qū)域上分配,解決了洪水信息集中且存在較大值時(shí),無(wú)法合理分配區(qū)間的問(wèn)題.
3)結(jié)合POT與P-IOSM的洪水風(fēng)險(xiǎn)分析得到的可能性-概率分布,挖掘了更多的不確定信息,這些附加信息更貼近事實(shí),能為決策者提供更多的依據(jù),從而使決策結(jié)果更加可靠實(shí)用.
在將來(lái)的研究中,如果能獲取流域內(nèi)更多站點(diǎn)數(shù)據(jù)資料時(shí),將可以制定出整個(gè)流域的洪水風(fēng)險(xiǎn)圖,從而為決策者提供更直觀更強(qiáng)有力的支持,具有良好的工程應(yīng)用情景.
[1] Wang Shanxu.The flood frequency analysis based on POT flood series.Yangtze River,1999,30(8):23-25.[王善序.洪水超定量系列頻率分析.人民長(zhǎng)江,1999,30(8):23-25.]
[2] Huang Chongfu.Fuzzy risk assessment of urban natural hazards.Fuzzy Sets&Systems,1996,83(2):271-282.
[3] Zou Qiang.Study on the theory and method of comprehensive analysis and intelligent assessmentof flood disaster risk[Dissertation].Wuhan:Huazhong University of Science&Technology,2013.[鄒強(qiáng).洪災(zāi)風(fēng)險(xiǎn)綜合分析與智能評(píng)價(jià)的理論與方法[學(xué)位論文].武漢:華中科技大學(xué),2013.]
[4] Huang Qiang,Chen Zishen.Multivariate flood risk assessment based on the secondary return period.J Lake Sci,2015,27(2):352-360.DOI:10.18307/2015.0221.[黃強(qiáng),陳子燊.基于二次重現(xiàn)期的多變量洪水風(fēng)險(xiǎn)評(píng)估.湖泊科學(xué),2015,27(2):352-360.]
[5] Fang Bin,Guo Shenglian,Cai Xiaoling et al.Flood frequency analysis based on FPOTmethod.Water Power,2005,31(2):9-12.[方彬,郭生練,柴曉玲等.FPOT方法在洪水頻率分析中的應(yīng)用研究.水力發(fā)電,2005,31(2):9-12.]
[6] Zhang Lijuan,Chen Xiaohong,Ye Changqing et al.POT flood frequency analysiswith historical floods in Wujiang River. Journal ofHydraulic Engineering,2013,(3):268-275.[張麗娟,陳曉宏,葉長(zhǎng)青等.考慮歷史洪水的武江超定量洪水頻率分析.水利學(xué)報(bào),2013,(3):268-275.]
[7] Ye Changqing,Chen Xiaohong,Zhang Lijuan et al.Changing rule and influence of threshold for peak-over-threshold flood series under the changing environment in Wujiang,China.Advances in Water Science,2013,(3):392-401.[葉長(zhǎng)青,陳曉宏,張麗娟等.變化環(huán)境下武江超定量洪水門限值響應(yīng)規(guī)律及影響.水科學(xué)進(jìn)展,2013,(3):392-401.]
[8] Martins ES,Stedinger JR.Generalized Maximum likelihood pareto—Poisson estimators for partial duration series.Water Resources Research,2001,37(10):2551-2557.
[9] Parent E,Bernier J.Bayesian POTmodeling for historical data.Journal ofHydrology,2003,274(1/2/3/4):95-108.
[10] Dai Changjun,Liang Zhongmin,Luan Chengmei et al.Advance in flood frequency analysis for partial duration series.Advances in Water Science,2006,17(1):136-140.[戴昌軍,梁忠民,欒承梅等.洪水頻率分析中PDS模型研究進(jìn)展.水科學(xué)進(jìn)展,2006,17(1):136-140.]
[11] Beguería S.Uncertainties in partial duration seriesmodelling of extremes related to the choice of the threshold value.Journal ofHydrology,2005,303(1/2/3/4):215-230.
[12] Lang M,Ouarda TBMJ,Bobée B.Towards operational guidelines for over-threshold modeling.Journal of Hydrology,1999,225(3/4):103-117.
[13] Huang Chongfu ed.The natural disaster risk assessment:Theory and practice.Beijing:Science Press,2006.[黃崇福.自然災(zāi)害風(fēng)險(xiǎn)評(píng)價(jià):理論與實(shí)踐.北京:科學(xué)出版社,2006.]
[14] Huang Chongfu.An application of calculated fuzzy risk.Information Sciences—Informatics&Computer Science an International Journal,2002,142(142):37-56.
[15] Huang Chongfu,Moraga C,Yuan X eds.Calculation vs.Subjective Assessmentwith Respect to Fuzzy Probability//Computational Intelligence.Theory and Applications.Berlin Heidelberg:Springer,2001:392-411.
[16] Huang Chongfu ed.The natural disaster risk analysis andmanagement.Beijing:Science Press,2012.[黃崇福.自然災(zāi)害風(fēng)險(xiǎn)分析與管理.北京:科學(xué)出版社,2012.]
[17] Zou Qiang,Zhou Jianzhong,Zhou Chao etal.Flood disaster risk analysis based on variable fuzzy sets theory.Transactions of the Chinese Society ofAgricultural Engineering,2012,28(5):126-132.[鄒強(qiáng),周建中,周超等.基于可變模糊集理論的洪水災(zāi)害風(fēng)險(xiǎn)分析.農(nóng)業(yè)工程學(xué)報(bào),2012,28(5):126-132.]
[18] Liu X,Zhang J,CaiW etal.Information diffusion-based spatio-temporal risk analysis of grassland fire disaster in northern China.Knowledge-Based Systems,2010,23(1):53-60.
[19] Feng LH,Luo GY.Analysis on fuzzy risk of landfall typhoon in Zhejiang province of China.Mathematics&Computers in Simulation,2009,79(11):3258-3266.
[20] Zou Q,Zhou J,Zhou C etal.The practical research on flood risk analysis based on IIOSM and fuzzyα-cut technique.Applied Mathematical Modelling,2012,36(7):3271-3282.
[21] Otnes RK,Enochson L eds.Digital time series analysis.Taylor&Francis:Wiley,1972.
[22] Davison AC,Smith RL.Models for exceedancesover high thresholds.Journal Royalty Statistical Society B,1990,52(3):393-442.
[23] Ashkar F,Ouarda TBMJ.On some methods of fitting the generalized Pareto distribution.Journal of Hydrology,1996,177:117-141.
[24] Cunnane C.A note on the poisson assumption in partial duration series models.Water Resource Research,1979,15:489-494.
[25] Jin Sheng,Lei Xiaoyun,LiHui etal.Hydrological P-Ⅲfrequency curve calculation software development research.Southto-North Water Transfers and Water Science&Technology,2009,7(5):70-72.[靳晟,雷曉云,李慧.水文P-Ⅲ頻率曲線計(jì)算軟件開(kāi)發(fā)研究.南水北調(diào)與水利科技,2009,7(5):70-72.]
[26] Liu Guangwen.The parameter estimation of PearsonⅢdistribution.Journal ofChina Hydrology,1990,(4):1-15.[劉光文.皮爾遜Ⅲ型分布參數(shù)估計(jì).水文,1990,(4):1-15.]
[27] Song Dedun,Ding Jing.The application of probability weighted moments to estimating the parameters for Pearson type-Ⅲdistribution.Journal ofHydrology,1988,101(101):47-61.
[28] Shen Q,Zhao R.Risk assessment of serious crime with fuzzy random theory.Information Sciences,2010,180(22):4401-4411.
The flood risk data m ining based on POT and P-IOSM
ZHENG YanHui1,2,HE Yanhu1,2,LIShenlin1,2&CHEN Xiaohong1,2??
(1:Center forWater Resources and Environment,Sun Yat-sen University,Guangzhou 510275,P.R.China)
(2:Key Laboratory ofWater Cycle and Water Security in Southern China ofGuangdong Higher Education Institutes,Sun Yatsen University,Guangzhou 510275,P.R.China)
In order to getmore information about the flood risk,the Peak-over-threshold(POT)flood samples are extracted after extraordinary flood processing with historical information based on daily flow data of Lishi(2)station in the Wujiang River Basin form 1956-2009.Then the improved non-isochronous Interior-Outer-Set Model(IOSM)which uses P-Ⅲto determine the control point is applied to analyse the flood risk.The results show that:we can getmore flood risk information from limited data and flood risk assessment result that is closer to fact by combining POT and P-IOSM models.Itwill providemore evidence for policy-makers which makes the decision-makingmore reliable and practical.
Flood risk;datamining;POT;P-Ⅲdistribution;information diffusion;P-IOSM;Wujiang River Basin
DOI 10.18307/2017.0420
?2017 by Journal of Lake Sciences?國(guó)家自然科學(xué)基金項(xiàng)目(51210013,51479216,51509127)和國(guó)家科技支撐計(jì)劃項(xiàng)目(2012BAC21B0103)聯(lián)合資助.
2016-09-19收稿;2016-11-12收修改稿.鄭炎輝(1990~),男,博士研究生;E-mail:zhengyh9@m(xù)ail2.sysu.edu.cn.??通信作者;E-mail:eescxh@m(xù)ail.sysu.edu.cn.