司 晴, 梁 偉
(成都市環(huán)境保護(hù)科學(xué)研究院,成都 610072)
· 水環(huán)境 ·
海水富營(yíng)養(yǎng)化評(píng)價(jià)的回歸支持向量機(jī)規(guī)范化模型
司晴, 梁偉
(成都市環(huán)境保護(hù)科學(xué)研究院,成都610072)
為了建立具有普適性的海水富營(yíng)養(yǎng)化評(píng)價(jià)模型,在對(duì)指標(biāo)值進(jìn)行規(guī)范變換的基礎(chǔ)上,采用免疫進(jìn)化遺傳優(yōu)化算法,對(duì)傳統(tǒng)的支持向量機(jī)(support vector machine, SVM)模型進(jìn)行了改進(jìn),建立了基于回歸支持向量機(jī)(support vector regression,SVR)的指標(biāo)規(guī)范化的海水富營(yíng)養(yǎng)化評(píng)價(jià)模型。并將優(yōu)化好的模型用于某海域水體富營(yíng)養(yǎng)化評(píng)價(jià),其評(píng)價(jià)結(jié)果與傳統(tǒng)的SVM模型的評(píng)價(jià)結(jié)果基本一致,且新模型較傳統(tǒng)的SVM模型具有較好的普適性和通用性。
規(guī)范變換;支持向量機(jī);海水富營(yíng)養(yǎng)化;普適性
由于對(duì)海洋的開發(fā)日益加劇,海洋污染事件頻發(fā),海水富營(yíng)養(yǎng)化日趨嚴(yán)重。對(duì)海水富營(yíng)養(yǎng)化科學(xué)、合理的評(píng)價(jià)可以為海洋的管理保護(hù)和合理開發(fā)利用提供依據(jù),諸多學(xué)者提出了多種海水富營(yíng)養(yǎng)化評(píng)價(jià)方法,有單項(xiàng)指數(shù)法、內(nèi)梅羅指數(shù)法、模糊評(píng)價(jià)法、BP神經(jīng)網(wǎng)絡(luò)評(píng)價(jià)法等[1~4]。單項(xiàng)指數(shù)法以單項(xiàng)指標(biāo)代替綜合指標(biāo)難以全面反映海水污染情況;內(nèi)梅羅指數(shù)法僅是突出了一項(xiàng)污染最嚴(yán)重的因子;模糊評(píng)價(jià)法中權(quán)重的確定和隸屬度函數(shù)設(shè)計(jì)沒有統(tǒng)一標(biāo)準(zhǔn),而權(quán)重和隸屬度函數(shù)的不同又可能造成評(píng)價(jià)結(jié)果的差異;BP神經(jīng)網(wǎng)絡(luò)隱層節(jié)點(diǎn)數(shù)的確定還沒有統(tǒng)一的標(biāo)準(zhǔn),而隱節(jié)點(diǎn)數(shù)的變化同樣會(huì)影響到評(píng)價(jià)的結(jié)果。支持向量機(jī)是對(duì)線性可分?jǐn)?shù)據(jù)尋找最優(yōu)分類平面發(fā)展而來的,合解決小樣本、高維度、非線性的問題,具有收斂數(shù)度快,推廣能力強(qiáng)的特點(diǎn),但是傳統(tǒng)的支持向量機(jī)模型[5]因徑支持向量的不同,造成核函數(shù)對(duì)各指標(biāo)不具備普適性。李祚泳等人[6~9]根據(jù)自然界普遍存在的規(guī)范化思想,提出評(píng)價(jià)體系指標(biāo)值規(guī)范變換的思想和方法,通過設(shè)置適當(dāng)?shù)闹笜?biāo)參照值和規(guī)范變換式,使得相同級(jí)別的不同指標(biāo)之間的差異較小。此方法已在地表水體評(píng)價(jià),水資源承載力評(píng)價(jià)等領(lǐng)域得到了一定程度的應(yīng)用。而在此基礎(chǔ)上建立的支持向量機(jī)模型用于海水富營(yíng)養(yǎng)化評(píng)價(jià)領(lǐng)域的研究尚未見報(bào)道。并且將該模型用于某海域水體富營(yíng)養(yǎng)化評(píng)價(jià)并與傳統(tǒng)的SVM模型評(píng)價(jià)的結(jié)果進(jìn)行比較。
1.1海水富營(yíng)養(yǎng)化指標(biāo)的參照值、規(guī)范變換式及規(guī)范值的分級(jí)標(biāo)準(zhǔn)
根據(jù)天然水體中藻類的光合作用反應(yīng)式,選擇COD、PO4-P、TN、Chl-α濃度及Phytoplankton豐度5項(xiàng)指標(biāo)作為海水富營(yíng)養(yǎng)化的評(píng)價(jià)指標(biāo)[5],根據(jù)海水質(zhì)量標(biāo)準(zhǔn)(GB3097-1997)和海水富營(yíng)養(yǎng)化研究成果,設(shè)定分級(jí)標(biāo)準(zhǔn)如表1所示[2]。為了消除各指標(biāo)之間在量綱和數(shù)值上的差別,使統(tǒng)同級(jí)標(biāo)準(zhǔn)的不同指標(biāo)的規(guī)范值之間的差異盡量小。為此,對(duì)各指標(biāo)設(shè)定適當(dāng)?shù)膮⒄罩岛鸵?guī)范變換式。經(jīng)多次試算和調(diào)試,設(shè)定5項(xiàng)海水富營(yíng)養(yǎng)化指標(biāo)的參照值cjo如表1所示,設(shè)計(jì)5項(xiàng)指標(biāo)的規(guī)范變換如式(1)和式(2)所示。
(2)
表1 5項(xiàng)富營(yíng)養(yǎng)化評(píng)價(jià)指標(biāo)參照值cjo和分級(jí)標(biāo)準(zhǔn)及標(biāo)準(zhǔn)規(guī)范值
1.2支持向量機(jī)模型的基本思想
支持向量機(jī)(SVM)的工作機(jī)理是[5~10]:對(duì)于線性可分?jǐn)?shù)據(jù),尋找一個(gè)超平面,該超平面既要保證分類精度,又要使超平面兩側(cè)的空白區(qū)域最大化。理論上,SVM能夠?qū)崿F(xiàn)線性可分?jǐn)?shù)據(jù)的最優(yōu)分類。對(duì)于線性不可分?jǐn)?shù)據(jù),則可通過核函數(shù),將其映射成為高維空間中的線性可分?jǐn)?shù)據(jù)。
圖1 支持向量機(jī)示意Fig.1 Schematic diagram of support vector machine
其基本思想可用圖1說明,由空心和實(shí)心兩種點(diǎn)代表兩類樣本,能夠?qū)⑵浞珠_的線性分類器有很多種(如圖1a中的l、m和n)。但最優(yōu)的線性分類器只有一個(gè),如圖1b所示。H為分類超平面,平行于分類超平面H且分別過兩類樣本中距超平面最近樣本的分類平面H1和H2之間的間隔稱為分離間隔(margin)。落在平面H1或H2上的樣本點(diǎn)稱作支持向量。能正確分開兩類樣本且使分類間隔最大的分類平面H,稱為最優(yōu)分類超平面(optimal separating hyperplane)。
Suykens依據(jù)結(jié)構(gòu)風(fēng)險(xiǎn)最小化原則,利用Lagrange法得到支持向量機(jī)的線性回歸模型(LS-SVR)[9]如式(3)所示:
(3)
(4)
式中,σ為徑向基函數(shù)寬度參數(shù),確定非線性映射函數(shù)的結(jié)構(gòu),從而影高維特征空間中線性回歸的復(fù)雜度。σ過小,回歸復(fù)雜度增加,容易引起模型的過擬合;σ過大,會(huì)降低模型的分辨力。過大或過小的σ值都會(huì)使模型的泛化能力降低。因此,在模型的優(yōu)化中選擇適當(dāng)?shù)摩曳浅jP(guān)鍵。‖·‖表示泛數(shù),一般用歐氏距離表示。
1.3基于指標(biāo)規(guī)范值的支持向量機(jī)模型
(5)
海水水體樣本i的富營(yíng)養(yǎng)化評(píng)價(jià)的支持向量機(jī)模型表示式如式(4)所示。
(6)
為了優(yōu)化確定式(6)中的參數(shù),需設(shè)計(jì)如式
(7)所示的優(yōu)化目標(biāo)函數(shù):
(7)
式中,yk為由式(6)計(jì)算得到的第k級(jí)標(biāo)準(zhǔn)樣本的NV-LS-SVR模型的輸出值;yk0為設(shè)定的第k級(jí)標(biāo)準(zhǔn)樣本的NV-LS-SVR模型期望輸出值,如表2所示K=3為樣本總數(shù)。
表2 NV-LS-SVR模型各級(jí)分級(jí)標(biāo)準(zhǔn)徑向基核函數(shù)中心值和模型期望輸出值yk0和實(shí)際輸出yk
1.4可調(diào)參數(shù)的優(yōu)化
經(jīng)反復(fù)調(diào)試,設(shè)定懲罰因子C=200,核函數(shù)參數(shù)σ的取值范圍設(shè)為σ∈[0,2],在滿足目標(biāo)函數(shù)式(7)的條件下,以表1中1~3級(jí)標(biāo)準(zhǔn)規(guī)范變換值作為NV-LS-SVR海水富營(yíng)養(yǎng)化評(píng)價(jià)模型的訓(xùn)練樣本,用免疫進(jìn)化遺傳算法[6]對(duì)模型中的參數(shù)αl(l=1,2,3)、σ和b反復(fù)迭代優(yōu)化。優(yōu)化算法的具體實(shí)現(xiàn)步驟及迭代公式詳見文獻(xiàn)[6]。免疫進(jìn)化算法的參數(shù)設(shè)置為:動(dòng)態(tài)調(diào)整系數(shù)A=10,δ0=0.3,群體規(guī)模K=100,最大迭代次數(shù)T=1000;誤差設(shè)置ε0=0.000001,當(dāng)目標(biāo)函數(shù)minQ(a,b,σ)=9.6566e-007<ε0時(shí)停止迭代。得到參數(shù)優(yōu)化結(jié)果如表3所示。
表3 海水富營(yíng)養(yǎng)化評(píng)價(jià)的NV-LS-SVR模型的參數(shù)優(yōu)化結(jié)果
將優(yōu)化得到的表3中的αl(l=1,2,3),σ和b代入支持向量機(jī)模型式(6),得到如式(8)所示指標(biāo)規(guī)范值的海水富營(yíng)養(yǎng)化評(píng)價(jià)的NV-LS-SVR模型表達(dá)式。
(8)
表4 某海域水質(zhì)監(jiān)測(cè)數(shù)據(jù)cj及不同模型評(píng)價(jià)結(jié)果
3.1優(yōu)化得到的NV-LS-SVR模型用于海水富營(yíng)養(yǎng)化評(píng)價(jià),不用編程,不需重新優(yōu)化,只需將各指標(biāo)代入規(guī)范變換式(1)和式(2)計(jì)算得到各指標(biāo)規(guī)范值,然后代入優(yōu)化好的模型表達(dá)式(8)計(jì)算即可。計(jì)算簡(jiǎn)單, 使用方便。
3.2對(duì)于海水富營(yíng)養(yǎng)化評(píng)價(jià)的任意m項(xiàng)指標(biāo)的監(jiān)測(cè)數(shù)據(jù)均適用。對(duì)于表1中的5項(xiàng)指標(biāo)之外的指標(biāo),只需適當(dāng)設(shè)定指標(biāo)參照值cj0和指標(biāo)值的規(guī)范變換式,使這些指標(biāo)各級(jí)標(biāo)準(zhǔn)的規(guī)范值在表1中5項(xiàng)指標(biāo)的同級(jí)標(biāo)準(zhǔn)規(guī)范值的變化范圍內(nèi),則本文優(yōu)化得出的模型表達(dá)式(8)依然可用,且不會(huì)有太大偏差。因而相對(duì)于傳統(tǒng)的SVM模型,NV-LS-SVR模型具有更好的普適性和通用性。
3.3實(shí)例分析表明,基于指標(biāo)規(guī)范值的支持向量機(jī)模型用于海水富營(yíng)養(yǎng)化評(píng)價(jià),其結(jié)果與實(shí)際符合較好,因此,該模型具有實(shí)用性和合理性。
[1]王煥松, 雷坤, 李子成, 等. 遼東灣海域水體富營(yíng)養(yǎng)化的模糊綜合評(píng)價(jià)[J]. 環(huán)境科學(xué)研究, 2010, 23(4): 413-419.
[2]王冬云, 黃焱歆. 海水富營(yíng)養(yǎng)化評(píng)價(jià)的人工神經(jīng)網(wǎng)絡(luò)方法[J]. 河北建筑科技學(xué)院學(xué)報(bào), 2001, 18(4): 27-29.
[3]時(shí)文博. 我國(guó)近岸海水富營(yíng)養(yǎng)化現(xiàn)狀及評(píng)價(jià)方法的研究探討[J]. 河北漁業(yè), 2012, 4(16): 42-46.
[4]Justus E E, Van Beusekom. A historica perspective on Wadden Sea Eutrophication[J]. helgol Mer Res, 2005, 59: 45-54.
[5]王洪禮, 王長(zhǎng)江, 李勝朋. 基于支持向量機(jī)理論的海水水質(zhì)富營(yíng)養(yǎng)化評(píng)價(jià)研究[J]. 海洋技術(shù), 2005, 24(1): 48-51.
[6]李祚泳, 王文圣, 張正健, 等. 環(huán)境信息規(guī)范對(duì)稱與普適性[M]. 北京: 科學(xué)出版社, 2011. 192-193, 223-226.
[7]梁曉龍, 李祚泳, 汪嘉楊. 基于指標(biāo)規(guī)范值的海水水質(zhì)評(píng)價(jià)的SVR模型[J]. 成都信息工程學(xué)院學(xué)報(bào), 2014, 29(2): 208-212.
[8]李祚泳, 張正健. 基于回歸支持向量機(jī)的指標(biāo)規(guī)范值的水質(zhì)評(píng)價(jià)模型[J]. 中國(guó)環(huán)境科學(xué), 2013, 33(8): 1502-1508.
[9]Scholkopf B, Smola A J. New support vector algorithms[J]. Neural Computation, 2000, 12(5): 1207-1245.
[10]Cortes C, Vapnik V. Support vector networks[J]. Machine Learning, 1995, 20: 273-297.
Evaluation Model of Seawater Eutrophication with Support Vector Regression Based on Normalized Index Values
SI Qing,LIANG Wei
(ChengduAcademyofEnvironmentSciences,Chengdu610072,China)
The purpose of this study was to explore the universal assessment model of the seawater eutrophication. On the basis of the normalized transformation for indices, the assessment model of the seawater eutrophication with support vector regression (SVR) was established. The SVR model optimized by immune evolutionary algorithm was applied to assess the seawater eutrophication and the evaluation results were basically consistent with that of traditional SVM model. The results showed that the universality and versatility of the new model were better than that of the traditional SVM.
Normalized index;support vector machine (SVM);seawater eutrophication;universal
2014-07-29
司晴(1983- ),女,四川成都人,2004年畢業(yè)于西華師范大學(xué)環(huán)境科學(xué)專業(yè),工程師,主要研究方向環(huán)境規(guī)劃與評(píng)價(jià)。
X55
A
1001-3644(2015)01-0044-04