劉 東 李 帥 付 強(qiáng) 劉春雷
(1.東北農(nóng)業(yè)大學(xué)水利與土木工程學(xué)院, 哈爾濱 150030; 2.農(nóng)業(yè)部農(nóng)業(yè)水資源高效利用重點(diǎn)實(shí)驗(yàn)室, 哈爾濱 150030)
地下水是水資源系統(tǒng)中的主要組成部分,作為地球上的重要水體,以其穩(wěn)定的供水條件、良好的水質(zhì),成為農(nóng)業(yè)、工業(yè)以及城市生活用水的重要水源,是人類社會必不可少的資源[1]。地下水資源具有可再生性,但同時(shí)具有脆弱性[2],循環(huán)周期較長,一旦賦存環(huán)境遭到破壞,再生能力將會減弱。隨著人類社會的飛速發(fā)展,長期不合理、無規(guī)則的開采使地下水水質(zhì)惡化、水位持續(xù)下降,地下水系統(tǒng)遭受破壞難以避免。因此,開展地下水水質(zhì)評價(jià)可以掌握地下水污染現(xiàn)狀,對合理開采地下水資源、保護(hù)水環(huán)境具有十分重要的意義。
迄今為止,已有眾多國內(nèi)外專家學(xué)者研究過地下水水質(zhì)評價(jià)問題。KIURSKI-MILPSEVI等[3]運(yùn)用模糊邏輯法對塞爾維亞Zrenjanin市的地下水水質(zhì)進(jìn)行了評價(jià);ZHANG等[4]運(yùn)用灰關(guān)聯(lián)分析法(GRA)評價(jià)了中國北方滹沱河沖積扇區(qū)域的地下水水質(zhì);BOUDERBALA[5]將水質(zhì)指數(shù)法(WQI)應(yīng)用于阿爾及利亞北部Low-Isser平原地區(qū)的地下水水質(zhì)評價(jià);WU等[6]應(yīng)用基于熵權(quán)的密切值法(OVM)對銀川北郊水源的地下水水質(zhì)進(jìn)行了評價(jià)。雖然上述方法在水質(zhì)評價(jià)方面取得了一定成果,但是也存在一些不足之處:模糊邏輯法在獲得評價(jià)集時(shí)采用線性加權(quán)平均的方法,容易出現(xiàn)失真、失效、跳躍等現(xiàn)象,導(dǎo)致等級評價(jià)不準(zhǔn)確[7-8];傳統(tǒng)灰關(guān)聯(lián)分析法面對復(fù)雜情況時(shí)存在評價(jià)因子權(quán)重影響程度低等缺點(diǎn)[9-10];水質(zhì)指數(shù)法缺陷在于評價(jià)結(jié)果會出現(xiàn)失真或物理意義不明確的現(xiàn)象[11-12];密切值法進(jìn)行多樣本評價(jià)時(shí),對各指標(biāo)權(quán)重的處理較為隨意,導(dǎo)致評價(jià)結(jié)果的誤差較大[13]。BP神經(jīng)網(wǎng)絡(luò)是一種基于人工智能的非線性動力學(xué)系統(tǒng),具有較強(qiáng)的自學(xué)習(xí)和自適應(yīng)能力,能夠通過已有數(shù)據(jù)信息自動調(diào)整網(wǎng)絡(luò)的閾值和權(quán)值,從而減小主觀因素的影響,使得評價(jià)結(jié)果更加符合客觀實(shí)際,已被國內(nèi)外學(xué)者廣泛應(yīng)用[14-15]。因此,本文擬構(gòu)建基于 BP神經(jīng)網(wǎng)絡(luò)的地下水水質(zhì)評價(jià)模型。然而,傳統(tǒng)BP神經(jīng)網(wǎng)絡(luò)各層的連接權(quán)值和閾值均由隨機(jī)初始化獲得,收斂速度慢,訓(xùn)練時(shí)間長且易陷入局部最優(yōu)。為了提高模型評價(jià)精度,必須改進(jìn)BP神經(jīng)網(wǎng)絡(luò)。
GANDOMI等[16]于2012年提出的KHA算法是一種新型的智能優(yōu)化算法,該算法用于優(yōu)化支持向量機(jī)(SVM)的目標(biāo)威脅估計(jì)模型[17],整體性能要優(yōu)于GSO(Group search optimization)和PSO(Particle swarm optimization);用于入侵檢測系統(tǒng)的構(gòu)建[18],性能優(yōu)于PSO、GA(Genetic algorithm);應(yīng)用于SVDD的參數(shù)優(yōu)化[19],性能優(yōu)于SA(Simulated annealing)、ACO(Ant colony optimization);應(yīng)用于汽輪機(jī)熱耗率預(yù)測問題[20],性能優(yōu)于PSO、BBO(Biogeography-based optimization)。以上研究表明,KHA具有較強(qiáng)的收斂速度和搜索能力,簡單易用、魯棒性強(qiáng),是一種性能優(yōu)越的智能優(yōu)化算法。因此,針對BP神經(jīng)網(wǎng)絡(luò)的缺陷,本文擬將磷蝦群算法引入到網(wǎng)絡(luò)連接權(quán)值和閾值的優(yōu)化過程中,改進(jìn)BP神經(jīng)網(wǎng)絡(luò)。以建三江管理局為例,構(gòu)建基于KHA優(yōu)化BP神經(jīng)網(wǎng)絡(luò)的地下水水質(zhì)綜合評價(jià)模型,分析區(qū)域地下水水質(zhì)等級空間分布特征及造成地下水水質(zhì)污染的可能成因,驗(yàn)證KHA-BP模型在區(qū)域地下水水質(zhì)評價(jià)中的可行性與優(yōu)越性。
黑龍江省農(nóng)墾建三江管理局位于黑龍江省東北部,地處三江平原腹地,位于黑龍江、松花江和烏蘇里江匯流的河間地帶。地理坐標(biāo)132°31′38″~134°32′19″E,46°49′47″~48°12′58″N。區(qū)內(nèi)水系發(fā)達(dá),河網(wǎng)縱橫交錯(cuò),地表水資源豐富[21]。作為重要的商品糧基地,建三江管理局糧食總產(chǎn)占黑龍江墾區(qū)糧食總產(chǎn)的1/3,占黑龍江省的1/9,區(qū)內(nèi)農(nóng)業(yè)生產(chǎn)主要以水稻種植為主[22]。建三江管理局下轄15個(gè)國營農(nóng)場,具體行政分區(qū)見圖1。
圖1 建三江管理局行政分區(qū)Fig.1 Administrative division map of Jiansanjiang Administration
長期以來,建三江地區(qū)由于工程調(diào)蓄能力弱,地表水利用率不高,農(nóng)業(yè)灌溉主要以開發(fā)地下水為主[23]。由于大規(guī)模抽取地下水灌溉水田,同時(shí)大量施用化肥農(nóng)藥,灌溉水?dāng)y帶污染物質(zhì)滲入地下,對地下水體造成污染,嚴(yán)重危害了飲用水安全和生態(tài)系統(tǒng)安全。因此開展建三江管理局地下水水質(zhì)評價(jià)和污染分析,對確保該地區(qū)飲用水安全、合理提出地下水資源保護(hù)措施等均具有重要的理論和現(xiàn)實(shí)意義。
圖2 各農(nóng)場地下水水質(zhì)指標(biāo)質(zhì)量濃度Fig.2 Concentration map of groundwater quality index
從2017年《黑龍江墾區(qū)統(tǒng)計(jì)年鑒》收集整理建三江管理局耕地總面積、頃均化肥施用總量、頃均氮肥施用量、頃均磷肥施用量和頃均農(nóng)藥施用量數(shù)據(jù),用于分析建三江地下水水質(zhì)污染的原因。
BP網(wǎng)絡(luò)是一種單向傳播的多層前饋神經(jīng)網(wǎng)絡(luò),標(biāo)準(zhǔn)BP網(wǎng)絡(luò)算法包括前向傳播和反向傳遞兩個(gè)方面[14-15,24-25]。在前向傳播中,輸入信號經(jīng)過輸入層、隱含層處理后,最終到達(dá)輸出層。當(dāng)輸出層得不到期望輸出時(shí),就會進(jìn)行反向傳遞,通過計(jì)算輸出層所有神經(jīng)元的期望輸出與實(shí)際值之間的總誤差對網(wǎng)絡(luò)權(quán)值和閾值進(jìn)行調(diào)整,從而使神經(jīng)網(wǎng)絡(luò)實(shí)際輸出不斷逼近期望輸出。BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 BP神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.3 BP neural network structure diagram
KHA算法是對南極海洋中磷蝦群覓食活動的模擬[16]。磷蝦群中的磷蝦個(gè)體在覓食活動中受到食物和附近磷蝦的綜合影響,在這種綜合作用下向著食物移動[26-27]。具體來說,磷蝦位置變化主要受3個(gè)因素影響:其他磷蝦個(gè)體引起的運(yùn)動、覓食行動以及隨機(jī)擴(kuò)散。
由上所知,每個(gè)磷蝦個(gè)體i的位置移動由3部分構(gòu)成
(1)
式中Xi——第i只磷蝦個(gè)體的位置
Ni——第i只磷蝦的誘導(dǎo)速度
Fi——第i只磷蝦的覓食速度
Di——第i只磷蝦的擴(kuò)散速度
(1)其他磷蝦個(gè)體影響引起的運(yùn)動
磷蝦的游動方向受到種群排斥效應(yīng)、附近磷蝦個(gè)體以及種群位置最優(yōu)個(gè)體的影響,具體表示為
Ni,new=Nmax(αi,local+αi,target)+wnNi,old
(2)
式中Ni,new——新的位置變化量
Nmax——最大誘導(dǎo)速度,通常取0.01 m/s
Ni,old——上次產(chǎn)生的位置變化量
wn——慣性權(quán)值,取值范圍[0,1]
αi,local——鄰近個(gè)體的誘導(dǎo)向量
αi,target——最優(yōu)個(gè)體提供的誘導(dǎo)向量
(2)覓食行為
磷蝦個(gè)體的覓食運(yùn)動可以表達(dá)為
Fi,new=Vf(βi,food+βi,best)+wfFi,old
(3)
式中Fi,new——新的覓食位置變化量
Fi,old——上一次覓食位置變化量
Vf——覓食速度,通常取0.02 m/s
βi,food——食物源對于個(gè)體吸引的向量
βi,best——第i個(gè)個(gè)體最優(yōu)的目標(biāo)向量
wf——慣性權(quán)值,取值范圍[0,1]
(3)隨機(jī)擴(kuò)散
磷蝦群的隨機(jī)擴(kuò)散一般由一個(gè)隨機(jī)的方向向量和磷蝦群的最大擴(kuò)散速度決定,即
Di=Dmaxδ
(4)
式中Dmax——個(gè)體最大擴(kuò)散速度,一般取0.005 m/s
δ——隨機(jī)向量,δ∈[-1,1]
隨著迭代次數(shù)的增加,磷蝦群逐漸靠近最優(yōu)位置,相應(yīng)的其隨機(jī)擴(kuò)散也應(yīng)該逐漸減弱。因此需要在式(4)中加入新的變量使得隨機(jī)擴(kuò)散部分隨迭代線性遞減,即
(5)
式中I——當(dāng)前迭代次數(shù)
Imax——最大迭代次數(shù)
經(jīng)過以上3種行為之后,在t到t+Δt的時(shí)間間隔內(nèi)磷蝦個(gè)體的位置為
(6)
(7)
式中 Δt——時(shí)間間隔常量,取決于搜索空間
Xi(t+Δt)、Xi(t)——t+Δt、t時(shí)刻的磷蝦個(gè)體位置
Uj——第j個(gè)變量的上限
Lj——第j個(gè)變量的下限
Nv——變量總數(shù),通過經(jīng)驗(yàn)發(fā)現(xiàn)
目前在普洱旅游道內(nèi)的工作人員沒有經(jīng)過系統(tǒng)的培訓(xùn),難以滿足游客的求知欲。,普洱茶文化作為云南旅游的名片,吸引了大批量的國外游客,但在景區(qū)內(nèi)外語接待人員十分缺乏。沒有新型的旅游服務(wù)人才,不能為游客提供導(dǎo)游規(guī)范化或個(gè)性化服務(wù),無法據(jù)游客個(gè)體差異提供準(zhǔn)確的養(yǎng)生指導(dǎo)。本地居民在旅游接待時(shí)還是以采摘工作為主,游客參與度低。
Ct——[0,2]區(qū)間內(nèi)的一個(gè)常數(shù),其值越小,算法的搜索步長越小
(4)遺傳操作
在KHA算法中,遺傳操作分為交叉和變異操作。交叉操作是指通過替換重組生成一個(gè)新個(gè)體的操作,即
(8)
式中xi,m——xi第m個(gè)參量
xr,m——異于xi,m的個(gè)體的第m個(gè)參量,r∈[1,2,…,Np]且r≠i
rand——[0,1]間一個(gè)均勻分布的隨機(jī)數(shù)
Cr——交叉概率
變異操作是對個(gè)體元素作變動調(diào)整的操作,即
(9)
式中xgbest,m——當(dāng)前全局最優(yōu)個(gè)體的第m個(gè)參量
μ——[0,1]之間的數(shù)
Mu——變異概率
KHA-BP算法的具體步驟如下:
(1)設(shè)定算法初始參數(shù),確定種群大小Np、最大迭代次數(shù)Mi、最大誘導(dǎo)速度Nmax、覓食速度Vf以及個(gè)體最大擴(kuò)散速度Dmax等。
(2)初始化搜索空間范圍內(nèi)的一組種群,每只磷蝦個(gè)體代表優(yōu)化問題的一個(gè)可行解。
(3)計(jì)算個(gè)體適應(yīng)度值,輸入訓(xùn)練樣本對神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并用測試樣本進(jìn)行預(yù)測,從而得到測試樣本的期望輸出X=(x1,x2,…,xn)及預(yù)測輸出Y=(y1,y2,…,yn),則個(gè)體適應(yīng)度計(jì)算公式為
F=‖xi-yi‖
(10)
本文構(gòu)建評價(jià)模型的訓(xùn)練樣本由地下水質(zhì)量分類標(biāo)準(zhǔn)數(shù)據(jù)獲得,輸出的預(yù)測則為具體的水質(zhì)類別,訓(xùn)練樣本與測試樣本的獲取方法詳見2.2.1節(jié)。
(4)計(jì)算3個(gè)影響因素引起的磷蝦位置變化量,加入遺傳操作后重新計(jì)算磷蝦個(gè)體的位置。
(5)返回步驟(3)計(jì)算個(gè)體適應(yīng)度直到滿足終止條件。
(6)輸出最優(yōu)個(gè)體位置,即最優(yōu)權(quán)值和閾值,構(gòu)建最終評價(jià)模型,得出評價(jià)結(jié)果。
KHA-BP評價(jià)模型的構(gòu)建流程如圖4所示。
圖4 KHA-BP評價(jià)模型構(gòu)建流程圖Fig.4 Flow chart of KHA-BP evaluation model
依據(jù)GB/T 14848—2017《地下水質(zhì)量標(biāo)準(zhǔn)》選取9個(gè)具有代表性的指標(biāo)作為水質(zhì)評價(jià)因子,根據(jù)GB/T 14848—2017的分類標(biāo)準(zhǔn),將水質(zhì)等級劃分為5類,各等級標(biāo)準(zhǔn)指標(biāo)濃度見表1。
2.2.1訓(xùn)練樣本集和測試樣本集的生成
由表1共得到I~V類水的5個(gè)標(biāo)準(zhǔn)等級區(qū)間,根據(jù)表1中數(shù)值可以得到用于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的幾組輸入和輸出數(shù)據(jù)。然而,僅僅利用幾組數(shù)據(jù)對BP神經(jīng)網(wǎng)絡(luò)進(jìn)行訓(xùn)練無法實(shí)現(xiàn)精確建模,得到的水質(zhì)模型也無法精確評價(jià)水質(zhì)。因此,本文對標(biāo)準(zhǔn)水質(zhì)評價(jià)指標(biāo)采用內(nèi)插取值方法對每類水質(zhì)分別生成
表1 地下水質(zhì)量分類標(biāo)準(zhǔn)Tab.1 Groundwater quality classification standard
500組樣本數(shù)據(jù),取前400組為訓(xùn)練樣本,后100組為測試樣本,以滿足水質(zhì)建模的需求,樣本生成規(guī)則以Ⅲ類水質(zhì)標(biāo)準(zhǔn)為例,如表2所示。所選指標(biāo)除pH值為適度指標(biāo)外,其他指標(biāo)均為越小越優(yōu)型指標(biāo)。為消除各指標(biāo)量綱和統(tǒng)一指標(biāo)值的變化范圍,采用歸一化方法處理上述生成的樣本數(shù)據(jù)[28]。
表2 神經(jīng)網(wǎng)絡(luò)訓(xùn)練樣本生成規(guī)則Tab.2 Generation rules of training sample of neutral network
(11)
x——原始數(shù)據(jù)
xmax、xmin——數(shù)據(jù)序列中的上、下限
xup、xdown——適度區(qū)間的上、下限
2.2.2網(wǎng)絡(luò)結(jié)構(gòu)的確定
本文選取9個(gè)水質(zhì)指標(biāo)進(jìn)行水質(zhì)評價(jià),因此神經(jīng)網(wǎng)絡(luò)的輸入層神經(jīng)元個(gè)數(shù)為9;由于輸出層的期望輸出是水質(zhì)評價(jià)等級,故輸出層有一個(gè)神經(jīng)元。采用單層隱含層的BP神經(jīng)網(wǎng)絡(luò),在隱含層節(jié)點(diǎn)數(shù)的選取上,目前并沒有統(tǒng)一的計(jì)算方法,一般采取試湊法進(jìn)行選定。通過反復(fù)訓(xùn)練,最終確定隱含層節(jié)點(diǎn)數(shù)為15。選取指數(shù)型S函數(shù),即logsig函數(shù)作為KHA-BP模型的激勵(lì)函數(shù)[29],以BP神經(jīng)網(wǎng)絡(luò)中權(quán)值和閾值為待優(yōu)化變量,利用KHA優(yōu)化BP神經(jīng)網(wǎng)絡(luò),構(gòu)建9-15-1的KHA-BP模型。參照文獻(xiàn)[16],對KHA中重要參數(shù)進(jìn)行設(shè)定,種群數(shù)量Np=30,最大迭代次數(shù)Mi=200,最大誘導(dǎo)速度Nmax=0.01 m/s,覓食速度Vf=0.02 m/s,個(gè)體最大擴(kuò)散速度Dmax=0.005 m/s。考慮算法隨機(jī)性的問題,多次運(yùn)行KHA-BP算法,選取具有較高適應(yīng)度的最優(yōu)權(quán)值和閾值構(gòu)建評價(jià)模型。
2.2.3等級模擬區(qū)間確定
利用式(11),將表1各等級臨界指標(biāo)濃度值歸一化,歸一化后數(shù)據(jù)代入上述所建的KHA-BP評價(jià)模型中,得到臨界值模擬結(jié)果和各等級模擬區(qū)間,結(jié)果如表3所示。
表3 KH-BP地下水水質(zhì)評價(jià)模型的等級模擬區(qū)間Tab.3 Hierarchical simulation interval of model of groundwater quality assessment based on KHA-BP
將圖2所示建三江管理局各農(nóng)場地下水水質(zhì)指標(biāo)值按式(11)歸一化,歸一化后數(shù)據(jù)代入所建的KHA-BP地下水水質(zhì)評價(jià)模型中,得到各農(nóng)場地下水水質(zhì)模擬結(jié)果和相應(yīng)等級,結(jié)果如表4所示。
由表4可以看出,建三江管理局各農(nóng)場地下水水質(zhì)總體較好,所有農(nóng)場水質(zhì)均處于Ⅲ類以上(包括Ⅲ類)。勝利、紅衛(wèi)、創(chuàng)業(yè)、七星4個(gè)農(nóng)場水質(zhì)等級為Ⅰ類,從水質(zhì)模擬結(jié)果來看,地下水水質(zhì)污染程度由大到小為:創(chuàng)業(yè)、紅衛(wèi)、七星、勝利,紅衛(wèi)、創(chuàng)業(yè)、七星3個(gè)農(nóng)場水質(zhì)模擬值接近所處等級區(qū)間上限,可以認(rèn)為這3個(gè)農(nóng)場地下水水質(zhì)有向Ⅱ類水質(zhì)轉(zhuǎn)化的趨勢,勝利農(nóng)場距離Ⅰ類水質(zhì)上下限均有一定距離,說明水質(zhì)較為穩(wěn)定;前哨、二道河、前鋒、鴨綠河、洪河、濃江、青龍山、大興、勤得利9個(gè)農(nóng)場水質(zhì)均為Ⅱ類,根據(jù)水質(zhì)模擬結(jié)果,地下水水質(zhì)污染程度由大到小為:前鋒、前哨、濃江、鴨綠河、青龍山、勤得利、二道河、大興、洪河,其中前鋒、前哨、濃江、鴨綠河、青龍山、勤得利6個(gè)農(nóng)場水質(zhì)模擬結(jié)果與Ⅱ類水質(zhì)上下限有一定距離,說明水質(zhì)等級穩(wěn)定,二道河、大興、洪河3個(gè)農(nóng)場水質(zhì)等級模擬結(jié)果距離Ⅱ類水質(zhì)下限很近,可以認(rèn)為這3個(gè)農(nóng)場水質(zhì)有向Ⅰ類水質(zhì)改善的趨勢;八五九、前進(jìn)2個(gè)農(nóng)場的水質(zhì)等級為Ⅲ類,根據(jù)水質(zhì)模擬結(jié)果,八五九地下水污染程度高于前進(jìn),其中前進(jìn)農(nóng)場的水質(zhì)模擬結(jié)果距離Ⅲ類水質(zhì)下限很近,說明有向Ⅱ類水質(zhì)改善的趨勢,八五九農(nóng)場水質(zhì)模擬結(jié)果與Ⅲ類水質(zhì)上下限均有一定距離,可以認(rèn)為八五九農(nóng)場地下水水質(zhì)可以基本穩(wěn)定在Ⅲ類。
表4 各農(nóng)場地下水水質(zhì)模擬結(jié)果及等級Tab.4 Simulation results and grades of groundwater quality in each farm
圖5 建三江管理局地下水水質(zhì)等級空間分布圖Fig.5 Spatial distribution map of groundwater quality of Jiansanjiang Administration
根據(jù)表4評價(jià)結(jié)果繪制建三江管理局地下水水質(zhì)等級空間分布圖,見圖5??梢钥闯?,建三江管理局地下水等級在空間分布上呈一定規(guī)律性,水質(zhì)等級為Ⅰ類的4個(gè)農(nóng)場分布較為集中,主要分布于管理局西南位置;水質(zhì)等級為Ⅱ類的除大興農(nóng)場在管理局南部,其他農(nóng)場均集中分布于北部;水質(zhì)等級為Ⅲ類的前進(jìn)農(nóng)場和八五九農(nóng)場則分布于管理局中部偏西和中部偏東位置,較為分散。
表5 評價(jià)結(jié)果中各指標(biāo)權(quán)重Tab.5 Weight of each index in evaluation results
為驗(yàn)證所建模型的穩(wěn)定性和可靠性,本文構(gòu)建基于粒子群優(yōu)化的BP神經(jīng)網(wǎng)絡(luò)模型(PSO-BP)和BP模型,對建三江管理局各農(nóng)場地下水水質(zhì)進(jìn)行評價(jià)。兩種模型均采用與KHA-BP模型相同的網(wǎng)絡(luò)結(jié)構(gòu),即9個(gè)輸入層神經(jīng)元,15個(gè)隱含層神經(jīng)元以及1個(gè)輸出層神經(jīng)元的9-15-1網(wǎng)絡(luò)結(jié)構(gòu),利用前文中的訓(xùn)練集訓(xùn)練PSO-BP模型與BP模型。其中PSO-BP模型與KHA-BP模型同樣進(jìn)行多次運(yùn)行以獲得具有較高適應(yīng)度值的最優(yōu)權(quán)值和閾值。PSO-BP模型、BP模型、KHA-BP模型的評價(jià)結(jié)果如表6所示。
由表6可以看出,BP模型、PSO-BP模型的評價(jià)結(jié)果與KHA-BP雖有差異,但總體來看建三江管理局各農(nóng)場的地下水水質(zhì)基本良好,均不低于Ⅲ類水質(zhì)。
表6 不同方法下的水質(zhì)評價(jià)結(jié)果對比Tab.6 Comparison of water quality evaluation results under different methods
表7 不同方法下的水質(zhì)評價(jià)結(jié)果指標(biāo)權(quán)重對比Tab.7 Comparison of weight of index in water quality evaluation results under different methods
采用區(qū)分度作為各種評價(jià)方法評價(jià)結(jié)果的可靠性指標(biāo)[33]。區(qū)分度概念來自于考試,指試卷測試題目對被測試者知識和能力水平的鑒別能力。本文區(qū)分度是指各種評價(jià)方法評價(jià)結(jié)果對評價(jià)對象實(shí)際水平的區(qū)別能力。
對于某一種評價(jià)方法的評價(jià)結(jié)果,假設(shè)有m個(gè)評價(jià)對象,將其按分值G高低進(jìn)行降序排列,每個(gè)分值編號為A,則函數(shù)G=f(N)是單調(diào)遞減函數(shù),評價(jià)結(jié)果分值最好的坐標(biāo)為(G1,1),分值最差的坐標(biāo)為(Gm,m),則區(qū)分度定義為
(12)
式中D——區(qū)分度
Gi——第i(i=1,2,…,m)個(gè)對象評價(jià)分值,即評價(jià)結(jié)果相鄰兩點(diǎn)距離之和與首尾兩點(diǎn)距離比值,D≥1,D越大則相鄰點(diǎn)越分散,評價(jià)結(jié)果區(qū)分度越好,評價(jià)方法可靠性越高
由于各評價(jià)方法結(jié)果極值范圍不一,為使評價(jià)結(jié)果具有可比性,需要對評價(jià)結(jié)果進(jìn)行標(biāo)準(zhǔn)化,本文將標(biāo)準(zhǔn)化處理后分值設(shè)定處于0~m之間,計(jì)算公式為
(13)
式中G′i——標(biāo)準(zhǔn)化后的評價(jià)分值
標(biāo)準(zhǔn)化后區(qū)分度的計(jì)算公式簡化為
(14)
根據(jù)式(13)和式(14)分別計(jì)算BP模型、KHA-BP模型、PSO-BP模型區(qū)分度,如表8所示。對表8中的區(qū)分度進(jìn)行排序,得出各評價(jià)方法的可靠性由大到小為:KHA-BP模型、PSO-BP模型、BP模型。
表8 各評價(jià)方法區(qū)分度Tab.8 Diversity of different evaluation methods
進(jìn)一步采用序號總和理論[34]對3種評價(jià)方法的穩(wěn)定性進(jìn)行分析。根據(jù)序號總和理論,對各種評價(jià)方法得到的排序序號進(jìn)行加和并重新排序,所得到的序號總和排序即是相對合理的排序結(jié)果。因此,哪種評價(jià)方法與相對合理排序結(jié)果的相關(guān)性更高,就可以認(rèn)為這種方法更合理,穩(wěn)定性更好[34]。評價(jià)方法穩(wěn)定性分析可參考文獻(xiàn)[34-35]。3種評價(jià)方法的排序評價(jià)結(jié)果與相對合理排序如表9所示。
表9 各評價(jià)方法的排序評價(jià)結(jié)果與相對合理排序Tab.9 Ranking evaluation results and relative rational ranking of each evaluation method
計(jì)算各評價(jià)方法排序評價(jià)結(jié)果與相對合理排序的Spearman等級相關(guān)系數(shù),結(jié)果如表10所示。
表10 各評價(jià)方法與相對合理排序的等級相關(guān)系數(shù)Tab.10 Rank correlation coefficient of each evaluation method between relative reasonable order
一般認(rèn)為,隨著排序次數(shù)的增加,接近真實(shí)排序結(jié)果的合理排序出現(xiàn)概率會更大,排序結(jié)果的穩(wěn)定性會增加[36]。因此如果經(jīng)過足夠多次的排序,大多數(shù)情況下與相對合理排序結(jié)果相關(guān)性更高的評價(jià)方法,就可以認(rèn)為這種方法相對于其他方法更穩(wěn)定。為獲得多次Spearman等級相關(guān)系數(shù),本文從15個(gè)農(nóng)場中隨機(jī)選取12個(gè)農(nóng)場重新計(jì)算各評價(jià)方法排序評價(jià)結(jié)果與相對合理排序結(jié)果的Spearman等級相關(guān)系數(shù),得到25組數(shù)據(jù),如表11所示。
表11 25次隨機(jī)抽樣各評價(jià)方法與相對合理排序的等級相關(guān)系數(shù)Tab.11 Rank correlation coefficient of each evaluation method between relative reasonable order in 25 random samples
由表11可知,Spearman等級相關(guān)系數(shù)之和分別為:BP模型13.031 5,KHA-BP模型22.842 7,PSO-BP模型19.300 7。對比表10、11可以看出,表11所得等級相關(guān)系數(shù)與表10所得等級相關(guān)系數(shù)的平均值極為接近。25次隨機(jī)抽樣的等級相關(guān)系數(shù)區(qū)間分配情況如圖6所示。
圖6 各方法等級相關(guān)系數(shù)區(qū)間分配Fig.6 Interval distribution of correlation coefficient of each method
由圖6可知,25次隨機(jī)抽樣中,BP模型的等級分配系數(shù)主要集中于[0.3,0.6],處于[0.3,0.5]的有10次,處于[0.5,0.6]有12次;PSO-BP模型的等級分配系數(shù)則主要處于[0.7,0.9]這一區(qū)間,處于[0.7,0.8]的有12次,處于[0.8,0.9]的有9次;KHA-BP模型等級分配系數(shù)全部處在[0.8,1]區(qū)間,其中分布于[0.8,0.9]的有5次,處在[0.9,1]的則多達(dá)20次。顯然,KHA-BP模型在區(qū)域地下水水質(zhì)評價(jià)中的穩(wěn)定性更好。
(1)利用KHA算法對BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值進(jìn)行優(yōu)化,建立了KHA-BP地下水水質(zhì)綜合評價(jià)模型,并以建三江管理局下轄的15個(gè)農(nóng)場為典型案例進(jìn)行地下水水質(zhì)評價(jià),研究發(fā)現(xiàn)各農(nóng)場地下水水質(zhì)基本良好,均處于Ⅲ類(包括Ⅲ類)以上。
(3)對比KHA-BP模型、PSO-BP模型以及BP模型3種評價(jià)方法的可靠性與穩(wěn)定性,結(jié)果顯示KHA-BP模型可靠性、穩(wěn)定性均優(yōu)于其他兩種評價(jià)方法,更適用于區(qū)域地下水水質(zhì)評價(jià)。