李志新,賴志琴,龍云墨,徐桂弘
(貴州理工學(xué)院土木工程學(xué)院,貴陽 550003)
水資源合理配置是為了保障經(jīng)濟社會可持續(xù)發(fā)展以及水資源可持續(xù)利用,在一定范圍內(nèi),根據(jù)有效、公平和可持續(xù)的原則,按照市場經(jīng)濟規(guī)律進行資源配置,通過科學(xué)合理的調(diào)節(jié)需求與供給關(guān)系、維護和改善生態(tài)環(huán)境等途徑,在區(qū)域或用水部門間對水源進行的調(diào)配活動,在提高經(jīng)濟社會效益方面具有重要意義。
在水資源配置中,影響因素眾多,且其互相影響、制約機制非常復(fù)雜,表現(xiàn)形式多樣,水資源配置模型很難充分反映這些不確定因素的影響以及決策者的偏好,因此,為提高優(yōu)化配置成果的實用性,探索水資源配置評價的模型與方法具有重要的意義。
水資源配置評價需要對水資源優(yōu)化配置后的各項效應(yīng)進行衡量,由于各項效應(yīng)都對應(yīng)多項指標(biāo),每個指標(biāo)可劃分為多個等級,故其評價屬于多指標(biāo)評價問題,其方法應(yīng)采用綜合評價的方法[1,2]。在評價實踐中,常用的綜合評價法有聚類分析、判別分析、主成分分析、灰色關(guān)聯(lián)評價、層次分析、模糊綜合評價等等方法,通過以上方法相關(guān)研究取得了一定的成果,但這些方法也存在一些缺陷:模糊綜合評價法極值作用過大,按隸屬度最大進行級別確定,由此得到的評價結(jié)果可信度較低,結(jié)果易失真,而且在隸屬函數(shù)確定時,其主觀任意性較大,從而使得評價結(jié)果排序趨同,評價結(jié)果無法充分反映客觀實際情況;在采用灰色關(guān)聯(lián)評價、聚類分析方法時,構(gòu)建的白化函數(shù)模式通用性較差,如按最大隸屬度評價時,由于評價對象類別不同,從而使評價結(jié)果有多解;在確定評價指標(biāo)權(quán)重方面,常用層次分析法或者德爾斐法,該類方法確定權(quán)重主觀性較大,不能充分利用指標(biāo)的已知信息,使評價結(jié)果可信度降低[3,4]。
神經(jīng)網(wǎng)絡(luò)模式識別是神經(jīng)網(wǎng)絡(luò)在模式識別領(lǐng)域的具體應(yīng)用,通過建立神經(jīng)網(wǎng)絡(luò)對已有分類標(biāo)簽的目標(biāo)輸出數(shù)據(jù)進行訓(xùn)練,然后對完成訓(xùn)練的網(wǎng)絡(luò)輸入預(yù)測數(shù)據(jù),進行該數(shù)據(jù)的分類,該方法具有較強的非線性映射、自適應(yīng)、自學(xué)習(xí)能力、且魯棒性和容錯性也較好,是處理如水資源配置評價這類多指標(biāo)復(fù)雜系統(tǒng)綜合評價問題最為有效的途徑之一。當(dāng)前國內(nèi)外許多領(lǐng)域利用神經(jīng)網(wǎng)絡(luò)模式識別對數(shù)據(jù)進行分類預(yù)測,取得了有價值的成果。Kartzas等[5]用神經(jīng)網(wǎng)絡(luò)識別研究了臭氧空氣污染以及大氣參數(shù)之間的互相關(guān)系;R.Xing等[6]基于LM算法的神經(jīng)網(wǎng)絡(luò)模式識別構(gòu)建了空氣質(zhì)量預(yù)報模型,其對城市空氣質(zhì)量預(yù)報得到了高精度的預(yù)測結(jié)果;蔣志方等采用神經(jīng)網(wǎng)絡(luò)模式識別方法對空氣質(zhì)量變化規(guī)律進行了分析和預(yù)測;蓋美等基于模糊模式識別方法對海域水質(zhì)環(huán)境進行了分析研究;陳守煜等構(gòu)建了模糊模式識別模型對空氣潔凈度進行評價。上述研究結(jié)果有一定的參考性,但各個模型及相應(yīng)數(shù)據(jù)信息具體特點各異,因而在預(yù)測應(yīng)用上存在一定的局限性。因此,本文基于模式識別神經(jīng)網(wǎng)絡(luò),提出了水資源配置評價指標(biāo)及分級標(biāo)準(zhǔn),構(gòu)建了水資源配置綜合評價模型,并結(jié)合實例應(yīng)用,利用神經(jīng)網(wǎng)絡(luò)模式識別的方法對全國各省級行政區(qū)水資源配置情況進行了綜合評價與分析。
本文模式是描述客觀世界事物的一種數(shù)學(xué)模型,通過模式識別可對外界信息進行綜合思維、判斷,從而做出決策。模式識別對事物對象的特征屬性進行,根據(jù)算法判定對象類別,并使識別結(jié)果盡量與實際相符,模式識別包含通過特征和屬性(系統(tǒng)的輸入輸出數(shù)據(jù)對)來描述的事物對象的數(shù)學(xué)模型,由兩個過程組成:設(shè)計過程和實現(xiàn)過程。在設(shè)計過程中,利用相當(dāng)數(shù)量的訓(xùn)練集樣本來對分類器進行設(shè)計;然后再利用完成訓(xùn)練的分類器對測試集樣本進行分類,即實現(xiàn)過程[7,8]。
本模型構(gòu)建時模式識別神經(jīng)網(wǎng)絡(luò)為兩層前饋網(wǎng)絡(luò),其結(jié)構(gòu)如圖1所示,即一個含激活函數(shù)sigmod的隱含層,以及帶有多分類函數(shù)softmax的輸出層,如隱含層神經(jīng)元數(shù)量滿足條件,通過該多分類函數(shù)可以對任意給定的向量進行分類。
圖1 模式識別神經(jīng)網(wǎng)絡(luò)拓撲結(jié)構(gòu)圖Fig.1 pattern recognition neural network topology diagram
常見的邏輯回歸、SVM等常用于解決二分類問題,對于多分類問題,理論上也可以用邏輯回歸或SVM,如將多個二分類來組成多分類,但本研究中水資源配置綜合評價屬于多分類場景問題,且其分類類別為互斥性質(zhì),不宜采用上述分類器,因此本文提出另外一種方式即softmax分類器來處理多分類。softmax的函數(shù)如下:
(1)
一般代價函數(shù)常使用方差代價函數(shù)即均方誤差MSE。在通過梯度下降,更新權(quán)值和偏置值時,因為sigmoid激活函數(shù)的飽和性質(zhì),導(dǎo)致該代價函數(shù)的導(dǎo)數(shù)在輸入值較大時變得極小,則其權(quán)值及偏置值更新非常緩慢,幾近中止[9,10]。
因此,本文為避免此問題,代價函數(shù)改用交叉熵函數(shù),即:
(1-y(i))log[1-hθ(x(i))]
(2)
計算J(θ)對第j個參數(shù)分量θj的偏導(dǎo)得:
(3)
式中:m為樣本組數(shù)(x(i),y(i))為第i組數(shù)據(jù)及其對應(yīng)的類別標(biāo)記,x(i)為包括偏置項在內(nèi)的一個多維向量,y(i)則為表示類別的一個數(shù)。此即代價函數(shù)對參數(shù)權(quán)重的梯度,然后進行優(yōu)化。
由于水資源配置的實質(zhì)在于尋求抑制需求和增加供給之間的平衡,因此其評價應(yīng)基于水資源的現(xiàn)狀配置,按照公平、合理及高效的原則,從社會、經(jīng)濟、效率、生態(tài)以及水資源的開發(fā)利用等幾個方面,對水資源在生產(chǎn)、生活及生態(tài)用水方面的滿足度和配置合理性進行分析,同時對現(xiàn)狀及規(guī)劃配置對應(yīng)的效益分別進行綜合評價,從而判斷現(xiàn)狀配置及規(guī)劃配置條件下的合理性。而在綜合評價過程中,必須先構(gòu)建一個科學(xué)合理的評價指標(biāo)體系,在此基礎(chǔ)上才能進行配置合理性的判斷以及比較擇優(yōu)。考慮到水資源配置須充分反映社會、經(jīng)濟、效率、生態(tài)及水資源的開發(fā)利用等多方面的影響,本文在參考相關(guān)文獻的基礎(chǔ)上[10,11],選取了13個評價指標(biāo),作為構(gòu)建本模型所需的水資源配置評價指標(biāo)及分級標(biāo)準(zhǔn)體系,見表1。每個指標(biāo)都量化地劃分為11個等級,按照優(yōu)劣順序排序,從1級依次到11級。
表1 水資源配置評價指標(biāo)及分級標(biāo)準(zhǔn)Tab.1 water resource allocation evaluation index and grading standard
2.2.1 訓(xùn)練、驗證、測試集設(shè)計
本文在整個指標(biāo)體系的每個級別對應(yīng)的分級標(biāo)準(zhǔn)閾值區(qū)間,通過隨機內(nèi)插方法共組合生成300組樣本,因此共組合生成涵蓋11個等級3300組總樣本數(shù)量;然后同樣也采取隨機分配的方式,按照各占總樣本數(shù)量70%、15%、15%的比例又將其劃分為訓(xùn)練集、驗證集及測試集三類樣本,其中訓(xùn)練集樣本在訓(xùn)練過程中輸入到網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)在完成初始化之后,根據(jù)輸出值與標(biāo)注值之間的誤差不斷進行權(quán)值和偏置值的調(diào)整;驗證集樣本不直接參與到上述的訓(xùn)練調(diào)整,主要用于測度在訓(xùn)練過程中網(wǎng)絡(luò)泛化能力的表現(xiàn),在泛化能力停止改進時就停止訓(xùn)練,從而防止神經(jīng)網(wǎng)絡(luò)訓(xùn)練中發(fā)生過擬合現(xiàn)象,導(dǎo)致泛化能力的下降;測試集樣本對訓(xùn)練過程不施加影響,而是在訓(xùn)練期間及訓(xùn)練后,作為獨立于訓(xùn)練的樣本數(shù)據(jù),對神經(jīng)網(wǎng)絡(luò)的性能進行測試、分析及評價。
2.2.2 評價模型設(shè)計
本文基于模式識別神經(jīng)網(wǎng)絡(luò)構(gòu)建水資源配置評價模型,網(wǎng)絡(luò)模型拓撲結(jié)構(gòu)如上圖1所示。該模型以上表2中的各評價指標(biāo)值為輸入向量,因此輸入層向量維數(shù)相應(yīng)地確定為13;隱含層神經(jīng)元數(shù)目則根據(jù)Kolmogorv定理結(jié)合試錯方法,對比分析確定為16;以各個等級對應(yīng)的期望輸出作為輸入向量,共11個評價等級,因此輸出層神經(jīng)元數(shù)目相應(yīng)確定為11,輸出值為一向量,其維數(shù)也相應(yīng)為11,而每個標(biāo)注樣本的期望輸出同樣為維數(shù)11的向量,但由于神經(jīng)網(wǎng)絡(luò)最后一層為softmax分類層,故要求每個期望輸出向量的各元素均為0,除了其標(biāo)注等級對應(yīng)位置的元素值為1外。如標(biāo)注等級為1,期望輸出向量則為[1 0 0 0 0 0 0 0 0 0 0]’,注等級為11,則為[0 0 0 0 0 0 0 0 0 0 1]’,其余依次類推。神經(jīng)網(wǎng)絡(luò)主要訓(xùn)練參數(shù)設(shè)置:最大的訓(xùn)練輪回為1 000次,設(shè)置最小目標(biāo)為1.0×10-6,同時將網(wǎng)絡(luò)泛化能力開始下降設(shè)置為訓(xùn)練結(jié)束條件之一,當(dāng)驗證樣本產(chǎn)生的誤差開始出現(xiàn)增加即停止。
2.2.3 模型性能評價指標(biāo)
對網(wǎng)絡(luò)模型性能評價選用誤判百分率PE和交叉熵CE兩個評價指標(biāo)。誤判百分率衡量網(wǎng)絡(luò)模型對樣本的誤判率,其最小值為0表示沒有錯誤分類,最大值為100%表示全部錯判;交叉熵值較小表示更好的分類性能,如為零則意味著沒有誤差。誤判百分率PE及交叉熵CE表達式如下:
(4)
式中:n為錯誤分類判別錯誤樣本數(shù);N為進行分類判別樣本總數(shù)。
(1-yi) log(1-y_predictedi)]
(5)
式中:yi為第i個樣本期望值;y_predictedi為第i個樣本預(yù)測值。
2.2.4 模型訓(xùn)練及測試實驗結(jié)果分析
本文通過隨機內(nèi)插方法共組合生成3 300組樣本數(shù)量,并采取隨機分配的方式,按照各占總樣本數(shù)量70%、15%、15%的比例又將其劃分為訓(xùn)練集、驗證集及測試集三類樣本,即分別為2310、495、495組,訓(xùn)練集用以調(diào)整網(wǎng)絡(luò)權(quán)值偏置值、驗證集在訓(xùn)練中起到防止過擬合作用,可適時終止訓(xùn)練、測試集則獨立測試網(wǎng)絡(luò)模型的性能。主要通過誤判百分率和交叉熵值等兩個指標(biāo)并以混淆矩陣圖和交叉熵誤差動態(tài)變化圖等形式對模型訓(xùn)練及測試實驗結(jié)果進行分析。混淆矩陣圖和交叉熵誤差動態(tài)變化圖分別如圖3所示。
圖3 訓(xùn)練及測試實驗結(jié)果混淆矩陣圖Fig.3 obfuscation matrix diagram for training and testing experimental results
圖3包含了訓(xùn)練集、驗證集、測試集和全體樣本等實驗混淆矩陣,混淆矩陣橫坐標(biāo)為實際標(biāo)定類別共11類,縱坐標(biāo)為模型輸出判定類別共11類,從圖3中可以看出,訓(xùn)練集、驗證集、測試集和全體樣本實驗中,模型輸出判定類別與實際標(biāo)定類別全部符合,誤判百分率PE=0,沒有發(fā)生分類誤判現(xiàn)象;圖4交叉熵誤差動態(tài)變化圖則顯示,隨著訓(xùn)練過程的進行,交叉熵誤差不斷趨于減小,直到達到規(guī)定最小目標(biāo)誤差,并沒有發(fā)生嚴(yán)重震蕩;訓(xùn)練集和驗證集誤差動態(tài)變化基本吻合一致,交叉熵誤差最后分別為2.81×10-7、3.07×10-7,測試集交叉熵誤差動態(tài)變化趨勢也與之基本一致,其值最后為1.31×10-6,表明訓(xùn)練過程中沒有發(fā)生過擬合現(xiàn)象。由此可見,本文基于模式識別神經(jīng)網(wǎng)絡(luò)而構(gòu)建的評價模型模擬精度較高,且泛化能力較好,可用以水資源配置綜合評價,故本文在此基礎(chǔ)上,進一步將本模型實際應(yīng)用于對全國各省級行政區(qū)水資源配置綜合評價的實例分析。
圖4 交叉熵誤差動態(tài)變化圖Fig.4 dynamic change diagram of cross entropy error
全國各省級行政區(qū)水資源配置實例分析,采用的評價數(shù)據(jù)來源參考相關(guān)文獻[10,11],見表2所示。
采用本文構(gòu)建的模型對上述省級行政區(qū)水資源配置進行評價,根據(jù)上述評價指標(biāo)相應(yīng)的數(shù)據(jù),輸入到模型進行模擬計算,利用softmax多分類器直接實現(xiàn)各行政區(qū)水資源配置等級的劃分,然后對評價等級進行定性的描述分析,評價結(jié)果見表3。
通過對表3中結(jié)果的分析有如下結(jié)論:
(1)模式識別神經(jīng)網(wǎng)絡(luò)模型對全國各省級行政區(qū)的水資源配置的評價總體情況是:其評價等級基本都在3~9級之間,依次對應(yīng)為“合理”、“較合理”及“不合理”等定性評價,基于同等的標(biāo)準(zhǔn),對各地的水資源配置情況有一個較客觀而合理的反映,對于水資源管理實踐具有一定的指導(dǎo)參考價值。以上對各地水資源配置情況定性和定量的評價分析表明,基于模式識別神經(jīng)網(wǎng)絡(luò)構(gòu)建的水資源配置模型,性能精度較高,方法合理可行。
表2 各省行政區(qū)評價指標(biāo)值Tab.2 evaluation index value of provincial administrative region
(2)本文以定量評價等級1~2級對應(yīng)“最合理”定性評價描述、3~5級對應(yīng)“合理”、6~7級對應(yīng)“較合理”、8~9級對應(yīng)“不合理”。綜合評價結(jié)果顯示:江蘇、江西、廣西、遼寧、上海、湖南、廣東、海南、貴州、陜西、青海、寧夏及新疆等地配置情況合理;北京、天津、山西、吉林、浙江、安徽、福建、湖北、四川、云南及甘肅等地配置較合理;河北、內(nèi)蒙古、黑龍江、山東、河南、重慶及西藏等地配置不合理。上述各地水資源配置情況評價出現(xiàn)差距究其原因,與水資源相對的豐裕程度及經(jīng)濟發(fā)展情況都有一定關(guān)聯(lián),突出表現(xiàn)在缺水率(%)、水功能達標(biāo)率(%)、用水GDP、開發(fā)利用率(%)等評價指標(biāo)達標(biāo)情況較差,從而嚴(yán)重制約了相應(yīng)地區(qū)水資源配置整體合理性,通過大力解決其配置中公平性欠缺、經(jīng)濟高效合理性不夠、與生態(tài)協(xié)調(diào)較差等薄弱環(huán)節(jié)問題,其水資源配置合理性可得到進一步提高。
表3 全國各省級行政區(qū)水資源配置綜合評價Tab.3 comprehensive evaluation of water resources allocation in various provincial administrative regions of China
本文在分析了當(dāng)前水資源配置評價的各種方法及其存在的問題,基于神經(jīng)網(wǎng)絡(luò)模式識別的特點和原理,構(gòu)建了模式識別神經(jīng)網(wǎng)絡(luò)水資源配置評價模型,網(wǎng)絡(luò)拓撲結(jié)構(gòu)采用了適于水資源配置評價分級要求的多分類函數(shù)softmax為輸出層,代價函數(shù)以交叉熵函數(shù)代替均方差MSE,解決了模型訓(xùn)練可能出現(xiàn)緩慢甚至中止的問題;在綜合相關(guān)研究成果的基礎(chǔ)上,提出了水資源配置13個評價指標(biāo)、11個分級及相應(yīng)分級標(biāo)準(zhǔn),為水資源配置合理性判斷及比較擇優(yōu),構(gòu)建了一個科學(xué)合理的評價指標(biāo)體系基礎(chǔ);水資源配置評價模型采用的訓(xùn)練集、驗證集及測試集等數(shù)據(jù)源于在分級標(biāo)準(zhǔn)臨界值之間隨機內(nèi)插而得到,并以誤判百分率及交叉熵等作為模型性能評價指標(biāo)。訓(xùn)練及測試實驗情況表明,訓(xùn)練集、驗證集及測試集交叉熵誤差分別為2.81×10-7、3.07×10-7、1.31×10-6,且無過擬合現(xiàn)象,模式識別神經(jīng)網(wǎng)絡(luò)水資源配置評價模型精度性能較高、分類能力優(yōu)良;在此基礎(chǔ)上,將該模型應(yīng)用于實例分析,對各省級行政區(qū)水資源配置情況進行評價分級,總體情況其評價等級基本都在3~9級之間,依次對應(yīng)為“合理”、“較合理”及“不合理”等定性評價,評價結(jié)果信息較為客觀合理反映了各地水資源配置總體情況;通過差距原因分析,提出了制約地區(qū)水資源配置合理性的突出因素:缺水率、水功能達標(biāo)率、用水GDP及開發(fā)利用率等,并提出了進一步改進配置合理性的建議措施;評價結(jié)果進一步表明模型應(yīng)用于水資源配置評價實踐中的合理可行性。
□