樊東紅,曾 彥,王明娟
FCM算法在欽州灣不同時(shí)期水質(zhì)預(yù)測中的應(yīng)用
樊東紅,曾 彥,王明娟
(欽州學(xué)院 物理與材料科學(xué)學(xué)院,廣西 欽州 535000)
對欽州灣2008-2009年6個(gè)航次的調(diào)查資料進(jìn)行分析,數(shù)據(jù)共有24個(gè)指標(biāo),15個(gè)站點(diǎn)。由于指標(biāo)過多,數(shù)據(jù)處理不方便并且也不準(zhǔn)確。利用FCM模糊聚類算法對欽州灣水體中的污染物進(jìn)行分析 ,通過預(yù)測,得到2010年春、夏、秋、冬四個(gè)季度各個(gè)指標(biāo)的數(shù)據(jù),旨在了解欽州灣不同時(shí)期水質(zhì)污染狀況以及其趨勢,為該灣的環(huán)境治理以及生態(tài)環(huán)境的可持續(xù)發(fā)展提供科學(xué)依據(jù)。
生態(tài)環(huán)境;水質(zhì)預(yù)測;FCM;模糊聚類
欽州灣位于北部灣西北部海域,東鄰欽州市欽南區(qū),西鄰企沙半島,北與欽州市接壤,南臨北部灣,為典型的溺谷型半封閉式海灣。茅嶺江和欽江兩條常年河流輸入灣內(nèi),近年來,隨著沿海經(jīng)濟(jì)的迅猛發(fā)展,工業(yè)廢水與生活污水也大量排進(jìn),水域的污染負(fù)荷明顯加重[1]。為保證城市供水系統(tǒng)安全,必須實(shí)施水質(zhì)監(jiān)控、水質(zhì)預(yù)測和對突發(fā)性水質(zhì)風(fēng)險(xiǎn)進(jìn)行準(zhǔn)確預(yù)警,這對城市供水的精細(xì)化管理具有十分迫切的現(xiàn)實(shí)意義。
水質(zhì)預(yù)測是在水污染控制單元內(nèi)建立水域功能區(qū)水質(zhì)指標(biāo)與陸域相應(yīng)污染之間的輸入相應(yīng)關(guān)系,為水質(zhì)量管理提供科學(xué)依據(jù)。水質(zhì)預(yù)測通常是利用歷史數(shù)據(jù),通過一定方法推求環(huán)境變量推求環(huán)境變量與待測水質(zhì)指標(biāo)之間的非線性關(guān)系或待測水質(zhì)指標(biāo)本身隨時(shí)間的變化規(guī)律[2]。
作為基于目標(biāo)函數(shù)的動(dòng)態(tài)優(yōu)化算法FCM(Fuzzy C-Means)模糊聚類算法,廣泛應(yīng)用在數(shù)據(jù)挖掘、圖像分割、模式識別、市場營銷等領(lǐng)域,并取得了良好的效果[3]。我們根據(jù)欽州灣2008-2009年6個(gè)航次的調(diào)查資料,利用FCM模糊聚類算法對欽州灣水體中的污染物進(jìn)行了分析[4],通過預(yù)測得到2010年春、夏、秋、冬四個(gè)季度的15個(gè)站點(diǎn)各個(gè)指標(biāo)的數(shù)據(jù),旨在了解欽州灣不同時(shí)期污染狀況以及其趨勢,為該灣的環(huán)境治理以及生態(tài)環(huán)境的可持續(xù)發(fā)展提供科學(xué)依據(jù)。
通過觀察欽州灣2008~2009年的水質(zhì)數(shù)據(jù),共有24個(gè)指標(biāo),15個(gè)站點(diǎn)。指標(biāo)包括:鹽度、pH值、溶解氧、COD、磷酸鹽、亞硝酸鹽、銨鹽、油類、硅酸鹽、油類、葉綠素a、懸浮物、總磷、總氮、總貢、銅、鉛、鋅、鉻、水深、水溫、水色、透明度。由于指標(biāo)過多,對數(shù)據(jù)處理起來不方便并且也很不準(zhǔn)確。所以我們將這24個(gè)指標(biāo)分為6個(gè)小類[5-6]:鹽度、pH、溶解氧、COD一類,稱為基本類;磷酸鹽、亞硝酸鹽、銨鹽、油類、硅酸鹽一類,稱為鹽類;油類、葉綠素a、懸浮物一類,稱為有機(jī)物類;總磷、總氮一類,稱為非金屬類;總貢、銅、鉛、鋅、鉻一類,稱為金屬類;水深、水溫、水色、透明度一類稱為水的性質(zhì)類,分類情況見表1。根據(jù)這幾個(gè)小類,對6個(gè)航次的數(shù)據(jù)分別作聚類分析,運(yùn)用的方法是FCM算法[7]。
表1 水質(zhì)指標(biāo)分類Table 1 Classification of water quality indexes
根據(jù)FCM算法的Matlab程序?qū)?shù)據(jù)進(jìn)行聚類分析[8]。
(1)對2008年秋季航次的基本類進(jìn)行聚類(聚為3類),聚類結(jié)果如表2所示,3D聚類結(jié)果圖如1所示。
(2)對2008年冬季航次的鹽類進(jìn)行聚類(聚為4類),聚類結(jié)果如表2所示,3D聚類結(jié)果圖如圖2所示。
(3)對2009年春季航次的有機(jī)物類進(jìn)行聚類(聚類5類),聚類結(jié)果如表2所示,3D聚類結(jié)果圖如圖3所示。
(4)對2009年夏季航次的水的性質(zhì)類進(jìn)行聚類(聚為6類),聚類結(jié)果如表3所示,2D聚類結(jié)果圖如圖4所示。
(5)對2009年秋季航次的金屬類進(jìn)行聚類(聚為4類),聚類結(jié)果如表3所示,3D聚類結(jié)果圖如圖5所示。
(6)對2009年冬季航次的水的性質(zhì)類進(jìn)行聚類(聚為6類),結(jié)果結(jié)果如表3所示,3D聚類結(jié)果圖如圖6所示。
由于篇幅問題,以上只列出少數(shù)聚類結(jié)果。
表2 2008年秋季、2008年冬季、2009年春季聚類Table 2 Cluster results of data in autumn of 2008, winter of 2008 and spring of 2009
表3 2009年夏季、秋季、冬季聚類結(jié)果Table 3 Cluster results of data in summer of 2009,autumn of 2009 and winter of 2009
通過對所有的聚類情況進(jìn)行觀察,一個(gè)季度中的幾種聚類沒有大概相似的情況,所以本文提出一種方法,就是對一個(gè)季度中聚為相同類數(shù)的幾種情況進(jìn)行交運(yùn)算。這樣,經(jīng)過運(yùn)算后的結(jié)果是符合所有的聚類情況的。
對各個(gè)季度各種聚類情況進(jìn)行處理后得到兩種比較好的結(jié)果:
(1)2009年春季航次聚為3類的情況
6個(gè)小類經(jīng)過FCM算法聚類后的結(jié)果如表3所示。
經(jīng)過對表3的集合進(jìn)行交運(yùn)算后得到11類,結(jié)果如下:
{1}、{2}、{3}、{4,5,6}、{7}、{8}、{10}、{11}、{12}、{14}、{9,13,15}。
(2)2009年冬季航次聚為3類的情況
6個(gè)小類經(jīng)過FCM算法聚類后的結(jié)果如表 4所示。
經(jīng)過對表4的集合進(jìn)行交運(yùn)算后得到11類,結(jié)果如下:
{1}、{2}、{3}、{4,5}、{6}、{7}、{8,9,13,14}、{10}、{11}、{12}、{15}。
圖1 2008年秋季3D聚類結(jié)果Fig.1 3D cluster results in autumn of 2008
圖2 2008年冬季3D聚類結(jié)果Fig.2 3D cluster results in winter of 2008
圖3 2009年春季3D聚類結(jié)果Fig.3 3D cluster results in spring of 2009
圖4 2009年夏季2D聚類結(jié)果Fig.4 2D cluster results in summer of 2009
圖5 2009年秋季聚類Fig.5 3D cluster results in autumn of 2009
圖6 2009年冬季聚類Fig.6 3D cluster results in winter of 2009
表4 2009年春季經(jīng)過集合交運(yùn)算后的聚類結(jié)果Table 4 Cluster results of intersection operation in spring of 2009
我們以欽州灣2008年秋季航次到2009年冬季航次的水質(zhì)數(shù)據(jù)為例,進(jìn)行預(yù)測2010年四個(gè)季度的水質(zhì)情況,觀察結(jié)果進(jìn)行分析。
通過指數(shù)平滑法季節(jié)性中的三個(gè)基本條件結(jié)果和實(shí)際數(shù)據(jù)做對比,得出冬季相乘法最適合次預(yù)測模型[9]。
在這里只列出鹽度的預(yù)測結(jié)果,其他的可以根據(jù)實(shí)際數(shù)據(jù)和預(yù)測數(shù)據(jù)選擇最適合的預(yù)測方法[10]。
通過預(yù)測得到2010年春、夏、秋、冬四個(gè)季度的15個(gè)站點(diǎn)各個(gè)指標(biāo)的數(shù)據(jù),然后通過和第2節(jié)中的聚類方法對預(yù)測出來的數(shù)據(jù)進(jìn)行處理。最終得到結(jié)果:
圖7 指數(shù)平滑法的冬季相乘性結(jié)果Fig.7 Multiply results of exponential smoothing method in winter
表5 2009年冬季經(jīng)過集合交運(yùn)算后的聚類結(jié)果Table 5 Cluster results of intersection operation in winter of 2009
表6 選擇模型Table 6 Selection of model
(1)2010年春季航次預(yù)測后聚類結(jié)果如表7所示。進(jìn)行集合交運(yùn)算后得到的聚類結(jié)果為:
{1}、{2}、{3}、{4}、{5}、{6}、{7}、{8}、{9}、{10}、{11}、{12}、{13}、{14}、{15}。
(2)2010年夏季航次預(yù)測后聚類結(jié)果如表8。進(jìn)行集合交運(yùn)算后得到的聚類結(jié)果為:
{1}、{2}、{3}、{4}、{5}、{6}、{7}、{8,9,10,11}、{12}、{13}、{14}、{15}。
(3)2010年秋季航次預(yù)測后聚類結(jié)果如表9所示。進(jìn)行集合交運(yùn)算后得到的聚類結(jié)果為:
{1}、{2}、{3}、{4}、{5}、{6}、{7}、{8}、{9}、{10}、{11}、{12}、{13}、{14}、{15}。
(4)2010年冬季航次預(yù)測后聚類結(jié)果如表10所示。進(jìn)行集合交運(yùn)算后得到的聚類結(jié)果為:
{1,2}、{3}、{4}、{5}、{6}、{7,11}、{8,10}、{9}、{12}、{13}、{14}、{15}。
通過上一節(jié)的聚類結(jié)果,2010年夏季航次和冬季航次最終的聚類結(jié)果都聚為了12類,春季航次和秋季航次都是一個(gè)站點(diǎn)一個(gè)類。2010年秋季和冬季航次的聚類結(jié)果與2009年秋季航次和冬季航次的聚類結(jié)果類似,聚類次數(shù)相近:2009年秋季15類,2010年秋季15類;2009年冬季11類,2010年冬季12類。實(shí)際結(jié)合證明:預(yù)測結(jié)果是可行的。
表7 2010年春季航次預(yù)測后聚類結(jié)果Table 7 Cluster results of voyage forecast in spring of 2010
表8 2010年夏季航次預(yù)測后聚類結(jié)果Table 8 Cluster results of voyage forecast in summer of 2010
表9 2010年秋季航次預(yù)測后聚類結(jié)果Table 9 Cluster results of voyage forecast in autumn of 2010
表10 2010年冬季航次預(yù)測后聚類結(jié)果Table 10 Cluster results of voyage forecast in winter of 2010
[1] 何本茂,韋蔓新.欽州灣的生態(tài)環(huán)境特征及其與水體自凈條件的關(guān)系分析[J].海洋通報(bào),2004年第4期,51-54
[2] 胡海清,周小麗,宋 毅. LM-BP神經(jīng)網(wǎng)絡(luò)在水質(zhì)預(yù)測的應(yīng)用[J].微型電腦應(yīng)用,2011年第9期,44-46
[3] 邢 婷,邢治國,王鳳領(lǐng).基于信息熵的FCM聚類算法[J].計(jì)算機(jī)工程與設(shè)計(jì),2010,31(23):5092-5095
[4] 付 輝.模糊C-均值(FCM)聚類算法的改進(jìn)[J].科學(xué)技術(shù)與工程,2007,7(13):3121-3123.
[5] 李銳祈,胡興宜,周金星,等.基于主成分分析與聚類分析的灘地環(huán)境抑螺效果評價(jià)[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào),2010,(6): 27-31.
[6] 王 穎,彭省臨,劉 峰.模糊數(shù)學(xué)理論及其在大氣環(huán)境測評中的應(yīng)用[J]. 中南林業(yè)科技大學(xué)學(xué)報(bào),2008,(6):139-143.
[7] 張新波.兩階段模糊C-均值聚類算法[J].電路與系統(tǒng)學(xué)報(bào)[J],2005,10(2):117-120.
[8] 蔡靜穎.模糊C-均值算法的研究[D].遼寧師范大學(xué),2010.4.
[9] 吳 文.長三角遙感水質(zhì)分類技術(shù)研究[D].南京理工大學(xué).2006. 6.
[10] 宮改云,高新波,伍忠東.FCM聚類算法中模糊加權(quán)指數(shù)m的優(yōu)選方法[J].模糊系統(tǒng)與數(shù)學(xué),2005,19(1):143-148.
Application of FCM algorithm on water quality prediction of different periods in Qinzhou Bay area
FAN dong-hong, ZENG Yan, WANG Ming-juan
(School of Physics and Material Science, Qinzhou University, Qinzhou 535000, Guangxi, China)
The aerial survey data of Qinzhou Bay area by six times taken in 2008~2009 were studied, and the data involve 24 observation indexes and 15 aerial survey sites. Because of too many indexes, the data processing was not convenient and accurate. By using FCM Fuzzy clustering algorithm, the pollutants in Qinzhou Bay area waters were analyzed, and through prediction, the data of every indexes in spring, summer, autumn and winter in 2010 were obtained, thus understanding the water pollution state and trend, providing scientific basis of ecological environment's sustainable development and environmental control for Qinzhou Bay area.
ecological environment; prediction of water quality; FCM algorithm; fuzzy cluster
S718.51+2.3;X173
A
1673-923X(2012)11-0158-05
2012-08-10
廣西自然科學(xué)基金項(xiàng)目(2011GXNSFA018151);廣西教育廳科研資助項(xiàng)目(201012MS194);廣西科學(xué)研究與技術(shù)開發(fā)計(jì)劃課題(桂科攻0895004-4)
樊東紅(1964-),女,廣西忻城人,副教授,主要研究方向?yàn)橛?jì)算機(jī)應(yīng)用技術(shù)、智能推理與智能控制
曾 彥(1961-),男,廣西浦北人,副教授,主要研究方向?yàn)橹悄芡评砼c智能控制
[本文編校:歐陽欽]