馮 琨,張永麗,戴沂伽
(1.四川大學(xué)建筑與環(huán)境學(xué)院,成都 610065;2.西南財(cái)經(jīng)大學(xué)財(cái)政稅務(wù)學(xué)院,成都 610031)
水資源是人類(lèi)文明的源泉,與人類(lèi)的生存、發(fā)展和一切經(jīng)濟(jì)活動(dòng)密切相關(guān)。水資源形成與演化及開(kāi)發(fā)和可持續(xù)利用不僅僅指水資源在人類(lèi)的代際間公平分配,同時(shí)還指當(dāng)代人群之間、流域的上中下游之間和跨流域之間的合理分配[1]。一般而言,一個(gè)區(qū)域的水資源承載能力主要是由水資源的需求量和供給量構(gòu)成,而相比較之下,供給量在一定時(shí)期內(nèi)穩(wěn)定性較大,那么在區(qū)域水資源承載力的預(yù)測(cè)中,對(duì)需求量的預(yù)測(cè)具有重要意義[2]。
在成都市各區(qū)市縣《水資源綜合規(guī)劃》的編制過(guò)程中,河道外需水量預(yù)測(cè)一直是整個(gè)項(xiàng)目的核心內(nèi)容同時(shí)也是難點(diǎn),該預(yù)測(cè)對(duì)整個(gè)規(guī)劃起著基礎(chǔ)指導(dǎo)作用。規(guī)劃水平年內(nèi)河道外需水量的大小決定著水資源配置的方式,如果需水量預(yù)測(cè)值大于實(shí)際用水量則會(huì)出現(xiàn)水資源的浪費(fèi)現(xiàn)象,還會(huì)影響到政府相關(guān)部門(mén)在節(jié)水型社會(huì)建設(shè)上的工作進(jìn)度;如果需水量預(yù)測(cè)值小于實(shí)際的用水量則會(huì)出現(xiàn)用水缺口,導(dǎo)致該地區(qū)國(guó)民經(jīng)濟(jì)的發(fā)展和人民的生活受到影響。因此如何準(zhǔn)確有效地進(jìn)行河道外需水量的預(yù)測(cè),就顯得尤為重要了。
本文將利用主成分分析及BP人工神經(jīng)網(wǎng)絡(luò)模型這兩個(gè)工具來(lái)對(duì)成都市未來(lái)需水量進(jìn)行定量預(yù)測(cè),從而對(duì)水資源規(guī)劃的編制起到參考作用。
成都市地處成都平原,是四川省省會(huì)所在地。其西部為龍門(mén)山和邛崍山山區(qū),中部為成都平原,東部為龍泉山低山深丘區(qū)和金堂縣沱江以東丘陵區(qū),全市幅員面積 12390平 km2。全市地表水資源量 58.56億m3,折合年徑流深 472.65mm。全市地下水資源量 23.90億 m3,扣除重復(fù)計(jì)算部分后水資源總量為 61.06億 m3。平均產(chǎn)水模數(shù) 49.28萬(wàn)m3/km3,區(qū)域內(nèi)人均占有本地水資源量 553.38m3(未計(jì)過(guò)境水資源)。
影響一個(gè)城市 (包括區(qū)縣)需水量的因素有很多,一般可以從社會(huì)因素和自然因素兩方面來(lái)考慮。水資源需求量可以通過(guò)若干特征變量來(lái)反映,把這些特征變量定為評(píng)價(jià)指標(biāo),那么這些指標(biāo)就成為預(yù)測(cè)水資源需求量的指示器,為水資源的優(yōu)化配置奠定基礎(chǔ)[3]。
根據(jù)可靠性、充分性和可測(cè)性的原則,結(jié)合《成都市統(tǒng)計(jì)年鑒》(1990~2009),選定以下 9個(gè)指標(biāo)作為影響因子:X1為人口,萬(wàn)人;X2為第一產(chǎn)業(yè)增加值,萬(wàn)元;X3為第二產(chǎn)業(yè)增加值,萬(wàn)元;X4為第三產(chǎn)業(yè)增加值,萬(wàn)元;X5耕地面積,萬(wàn) hm2;X6為城市建成區(qū)面積,km2;X7為給水管道長(zhǎng)度,km;X8為工業(yè)廢水排放量,萬(wàn) t;X9為排水管道長(zhǎng)度,km。然后以年份(1990~2009年)作為時(shí)間序列,列出各個(gè)因子所含的數(shù)據(jù),現(xiàn)將部分年份的因子列于表 1。
表1 部分年份成都市需水量影響因子統(tǒng)計(jì)Tab.1 Affecting factors ofwater consumption for some years in Chengdu
為了消除所選擇因子的量綱對(duì)數(shù)據(jù)分析產(chǎn)生的影響,故需對(duì)它們進(jìn)行標(biāo)準(zhǔn)化處理。本文采用 SPSS軟件提供的 zscore函數(shù)對(duì)原始數(shù)據(jù)進(jìn)行處理。則有:
由于可供參考的影響因子多達(dá) 9個(gè),因此需要采取降維的方法來(lái)減少因子數(shù)量,提取出主成分。本文采用主成分分析的方式來(lái)抽取合理數(shù)量的主要影響因子,利用 SPSS軟件的因子分析功能對(duì)表 2的數(shù)據(jù)進(jìn)行運(yùn)算得出各因子間的相關(guān)系數(shù)矩陣,并列出各因子的初始特征值和對(duì)總方差的貢獻(xiàn)率,見(jiàn)表3。
表2 部分年份經(jīng)標(biāo)準(zhǔn)化處理后的因子數(shù)據(jù)Tab.2 Data bank of nor malized factors for some years
表3 方差分解主成分提取分析Tab.3 Principal components extraction of variance decomposition
根據(jù)表 3的結(jié)果可以看出:最初選取的 9個(gè)因子是合理且充分的 (貢獻(xiàn)率均≥85%),經(jīng)過(guò)抽取(主成分法抽取)的因子 1和因子 2可以解釋全部所有因子的 97.770%,他們的特征值分別為 7.708和 1.091均大于 1符合因子分析原理,因此提取這兩個(gè)主成分(即m=2),列出主成分因子載荷矩陣,見(jiàn)表4。
表4 主成分因子載荷矩陣Tab.4 Componentmatrix of principal factors
通過(guò)表 4可知主成分因子1在除了 ZX8外的其他因子上均有很高的載荷,可以根據(jù)它們的現(xiàn)實(shí)意義歸納總結(jié)為“經(jīng)濟(jì)社會(huì)發(fā)展因素 (F1)”。而主成分因子 2只在 ZX8和 ZX6上有較高載荷,根據(jù)其實(shí)際意義歸納為“環(huán)境因素 (F2)”。令主成分因子 1和因子 2分別為向量 B1、B2,為了得到主成分表達(dá)式,將表 4的載荷矩陣進(jìn)行運(yùn)算求出表達(dá)式中的各項(xiàng)系數(shù)。首先求主成分特征值 (抽取后)對(duì)應(yīng)的特征向量,令其分別為A1、A2,則有:
將向量A1、A2分別與標(biāo)準(zhǔn)化處理后的因子數(shù)據(jù)做內(nèi)積,即可得到主成分表達(dá)式。
根據(jù)統(tǒng)計(jì)界的最新理論,在主成分分析中一般不采用綜合主成分進(jìn)行后續(xù)分析,因?yàn)槠浣Y(jié)果不唯一。本文在之后的建模過(guò)程中將以貢獻(xiàn)率大于85%的因子做數(shù)據(jù)樣本。
人工神經(jīng)網(wǎng)絡(luò)(Back Propagation,BP)模型具有以任意精度逼近任意非線性函數(shù)的映射能力,在水利、電力、化工等領(lǐng)域得到了廣泛的應(yīng)用[4]。天津大學(xué)化工研究所的霍金仙[5]、哈爾濱市水利工程建設(shè)監(jiān)理站的崔仰彬[6]等先后研究了 BP神經(jīng)網(wǎng)絡(luò)在河道外需水量預(yù)測(cè)中的運(yùn)用,并驗(yàn)證了預(yù)測(cè)結(jié)果的合理性。
BP神經(jīng)網(wǎng)絡(luò)由三部分組成:輸入層、隱含層和輸出層。輸入層和輸出層都為單層,隱含層可以為單層,也可以為多層[7]。其學(xué)習(xí)過(guò)程分為信息的正向傳播過(guò)程和誤差的反向傳播過(guò)程兩個(gè)階段,外部輸入的信號(hào)經(jīng)輸入層 、隱含層的神經(jīng)元逐層處理 ,向前傳播到輸出層 ,給出結(jié)果 。如果在輸出層得不到期望輸出,則轉(zhuǎn)入逆向傳播過(guò)程,將實(shí)際值與網(wǎng)絡(luò)輸出之間的誤差沿原連接通路返回 ,通過(guò)修改各層神經(jīng)元的連接權(quán)值,減少誤差 ,然后再轉(zhuǎn)入正向傳播過(guò)程,反復(fù)迭代,直到誤差小于給定的值為止[8]。本文擬采用較通用的三層 BP神經(jīng)網(wǎng)絡(luò),其拓?fù)浣Y(jié)構(gòu)如圖 1所示。
用美國(guó) MathWorks公司開(kāi)發(fā)的 MATLAB R2010b作為模型的計(jì)算平臺(tái)。因?yàn)?BP神經(jīng)網(wǎng)絡(luò)采用“有教師”的方式訓(xùn)練學(xué)習(xí),樣本由輸入和輸出組成[9]。首先對(duì)所有樣本數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,令Y為儲(chǔ)存各年份需水量的變量 (單位:萬(wàn)噸),ZY為標(biāo)準(zhǔn)化處理之后的變量,見(jiàn)表 5。
表5 基于時(shí)間序列的部分年份需水量Tab.5 Water consumption for some years based on time sequence
(1)訓(xùn)練樣本確定:將1995年至 2006年的數(shù)據(jù)作為訓(xùn)練樣本,2007年和 2008年的數(shù)據(jù)作為測(cè)試樣本。根據(jù)前文的主成分分析,查看 ZY與 ZXi(1≤i≤9)的相關(guān)系數(shù)矩陣,并就各因子對(duì)于 ZY的作用大小進(jìn)行排序:ZX2>ZX7>ZX9>ZX4>ZX1>ZX3>ZX5>ZX6>ZX8,選取前5個(gè)因子:ZX2、ZX7、ZX9、ZX4、ZX1作為數(shù)據(jù)樣本,見(jiàn)表 6。
表6 樣本數(shù)據(jù)Tab.6 The data of samples
(2)模型參數(shù):訓(xùn)練函數(shù)為 TRA INLM;學(xué)習(xí)函數(shù)為L(zhǎng)EARNDM;性能函數(shù)為MSE;隱層傳遞函數(shù)為T(mén)ANSIG;輸出層傳遞函數(shù)為 PUREL IN。輸入層節(jié)點(diǎn)數(shù)為 5,輸出層節(jié)點(diǎn)數(shù)為 1,迭代次數(shù)為 1000,慣量因子 0.5,訓(xùn)練目標(biāo)誤差 0.001,學(xué)習(xí)系數(shù)為 0.05。
(3)隱含層神經(jīng)元數(shù)目的確定:該層神經(jīng)元數(shù)目采用試算法確定,即以 5為初值向上遞增,檢驗(yàn)?zāi)P偷挠?xùn)練誤差,直到找到誤差最小的值,經(jīng)驗(yàn)證隱含層神經(jīng)元數(shù)為 10時(shí),訓(xùn)練效果最佳,其結(jié)構(gòu)見(jiàn)圖 2。
圖2 構(gòu)建的BP網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.2 Created BP neural ne twork
(1)利用MATLAB的 newff函數(shù)創(chuàng)建一個(gè)前向型BP神經(jīng)網(wǎng)絡(luò),格式如下[10]:
net=newff(P,T,[S1 S2…S(N-i)],{TF1TF2…TFNi})
其中:P為輸入樣本向量,即 F1、F2;T為期望響應(yīng)即輸出;Si為神經(jīng)網(wǎng)絡(luò)各層的神經(jīng)元數(shù)目; N為神經(jīng)網(wǎng)絡(luò)的層數(shù);TFi表示對(duì)應(yīng)網(wǎng)絡(luò)層的傳遞函數(shù)類(lèi)型,本例將建立一個(gè) 3層的BP神經(jīng)網(wǎng)絡(luò)。
(2)訓(xùn)練過(guò)程經(jīng)過(guò) 17次迭代后,誤差達(dá)到容許范圍,見(jiàn)圖 3。
圖3 訓(xùn)練誤差曲線圖Fig.3 Training error curve
現(xiàn)將測(cè)試樣本向量輸入做預(yù)測(cè),并將結(jié)果作反歸一化處理,得到 2007年和 2008年的需水量分別為 52045萬(wàn)m3、59105萬(wàn)m3,與實(shí)測(cè)值 52127萬(wàn)m3、59462萬(wàn)m3的誤差分別為 -0.16%和 -0.60%,具有很高的精度,完全可以滿足實(shí)際工程的需要,現(xiàn)將各年份的模型擬合值及實(shí)測(cè)值列出,并繪出需水量年際變化曲線,見(jiàn)表 7、圖 4。
表7 部分年份期望輸出與實(shí)際輸出值Tab.7 Expected outputs and actual outputs for some fears
圖4 模型曲線圖Fig.4 Model curve
從圖 4可以看出,利用BP神經(jīng)網(wǎng)絡(luò)算法能夠很好地逼近希望得到的函數(shù),故而由此建立的水量預(yù)測(cè)模型是合理可用的。該模型很好的反應(yīng)了成都市需水量與主要影響因素的函數(shù)關(guān)系,在進(jìn)行未來(lái)需水量的預(yù)測(cè)時(shí),只需確定主成分分析中的 5個(gè)主要影響因素:人口、農(nóng)業(yè)增加值、第三產(chǎn)業(yè)增加值、給水管道長(zhǎng)度、排水管道長(zhǎng)度,即可計(jì)算出需水量。其中前 3個(gè)因素取值可以根據(jù)相關(guān)的社會(huì)發(fā)展和國(guó)民經(jīng)濟(jì)規(guī)劃來(lái)確定;后兩個(gè)因素則可以再次通過(guò)建立基于時(shí)間序列的BP神經(jīng)網(wǎng)絡(luò)模型,預(yù)測(cè)出規(guī)劃年份的值。本文通過(guò)此種方式預(yù)測(cè)出成都市2010年需水量約為 63727萬(wàn)m3。
BP神經(jīng)網(wǎng)絡(luò)具有很強(qiáng)的非線性映射能力,因此對(duì)于非線性關(guān)系的樣本數(shù)據(jù)它能夠很好的找出其內(nèi)在聯(lián)系,適于處理具有復(fù)雜變量的現(xiàn)實(shí)問(wèn)題。在建模前進(jìn)行的主成分分析則簡(jiǎn)化了輸入的樣本,減少了輸入的節(jié)點(diǎn)數(shù),極大地提高了程序的運(yùn)行效率。
值得關(guān)注的是,對(duì)樣本數(shù)據(jù)進(jìn)行預(yù)處理可以有效地提高網(wǎng)絡(luò)的學(xué)習(xí)能力和預(yù)測(cè)精度,在今后的水資源規(guī)劃中可以考慮推廣使用該方法對(duì)需水量進(jìn)行定量預(yù)測(cè),并結(jié)合定額法等傳統(tǒng)方法使得水資源的規(guī)劃工作更加科學(xué)、更加具有指導(dǎo)意義。
[1] 劉昌明,王紅瑞 .淺析水資源與人口、經(jīng)濟(jì)和社會(huì)環(huán)境的關(guān)系[J].自然資源學(xué)報(bào),2003,18(4):635-642.
[2] 劉丹丹,馮利華,王 寧,石 磊 .基于BP神經(jīng)網(wǎng)絡(luò)的義烏市水資源需求量預(yù)測(cè)[J].水資源與水工程學(xué)報(bào),2010,1 (3):114-117.
[3] 傅 湘,紀(jì)昌明 .區(qū)域水資源承載能力綜合評(píng)價(jià)—主成分分析法的應(yīng)用[J].長(zhǎng)江流域資源與環(huán)境,1999,8(2):168-173.
[4] 郭 默 .基于BP神經(jīng)網(wǎng)絡(luò)的施工揚(yáng)塵量化建模研究[D].蘭州大學(xué),2010.
[5] 霍金仙,郭 永,劉文先 .基于BP網(wǎng)絡(luò)的全國(guó)需水量預(yù)測(cè)研究[J].人民黃河,2009,31(9):54-56.
[6] 崔仰彬,董珊珊,楊 曦 .人工神經(jīng)網(wǎng)絡(luò)在城市需水量預(yù)測(cè)中的應(yīng)用[J].水利科技與經(jīng)濟(jì),2009,15(11):988-990.
[7] 魏海坤 .神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)設(shè)計(jì)的理論與方法[M].Beijing:NationalDefence Industry Pres,200525-36.
[8] 王 旭.人工神經(jīng)元網(wǎng)絡(luò)原理與應(yīng)用[M].沈陽(yáng):東北大學(xué)出版社,2002.
[9] 朱 凱,王正林.精通MATLAB神經(jīng)網(wǎng)絡(luò)[M].北京:電子工業(yè)出版社,2010.193-224.
[10] 陳小強(qiáng),胡向紅,袁鐵柱,張 建 .BP神經(jīng)網(wǎng)絡(luò)在灌區(qū)需水量預(yù)測(cè)中的應(yīng)用[J].地下水,2009,31(6):174-176.