• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于結(jié)構(gòu)性雙標圖的城市廢水污染物排放分析

      2016-05-04 03:29:29馬艷芳張曉琴
      陜西科技大學學報 2016年2期
      關(guān)鍵詞:聚類分析

      馬艷芳, 張曉琴

      (山西大學 數(shù)學科學學院, 山西 太原 030006)

      ?

      基于結(jié)構(gòu)性雙標圖的城市廢水污染物排放分析

      馬艷芳, 張曉琴

      (山西大學 數(shù)學科學學院, 山西 太原030006)

      摘要:雙標圖是一種基于主成分分析原理,將多維數(shù)據(jù)可視化在一張圖中的有效方法.傳統(tǒng)的雙標圖根據(jù)奇異值的分配分為協(xié)變性雙標圖、結(jié)構(gòu)性雙標圖、對稱雙標圖三種.文章主要針對結(jié)構(gòu)性雙標圖適合分析樣本點之間相似性的特點,對全國主要城市的廢水污染物排放情況做了雙標圖分析,并且和最長距離聚類法相比較,結(jié)果表明結(jié)構(gòu)性雙標圖不僅可以得到相應(yīng)的類別,而且可以得到相應(yīng)類別中的顯著性變量,為廢水處理工程提供了有力幫助.

      關(guān)鍵詞:結(jié)構(gòu)性雙標圖; 聚類分析; 廢水污染物

      0引言

      隨著近年來我國人口的增長,以及工業(yè)化、城鎮(zhèn)化發(fā)展和經(jīng)濟的迅速增長,我國的用水量也日趨增多,城市中產(chǎn)生的廢水也隨之增加.我國是一個水資源比較缺乏的國家,淡水資源只占全球的6%,同時水污染也嚴重威脅著城市居民的飲水安全,所以污水處理是水治理中不可缺的一部分,從而分析廢水中的污染物排放情況具有重大意義.已有許多學者對廢水中污染物處理做了分析與研究,例如,周為華等[1]對揚州市廢水中的氨氮做了分析;蔣琴[2]對陜西省工業(yè)廢水及其主要污染物排放量進行了預測;梁淑軒、孫漢文等[3]對中國工業(yè)廢水污染狀況以及影響因素做出分析; 陳明等[4]對北京市的工業(yè)廢水狀況做了調(diào)查;王洪波等[5]對東北三省工業(yè)廢水排放中典型污染物進行了行業(yè)分析.

      本文將用一種多元統(tǒng)計分析方法中的可視化方法——雙標圖來分析全國各個城市中主要污染物的排放情況,此方法不同于傳統(tǒng)的多元統(tǒng)計分析方法[6],如主成分分析、對應(yīng)分析[7]、相關(guān)分析,期待能更加直觀地反映出樣本集的信息.

      雙標圖于1971年由Gabriel[8]首次提出,最初來分析農(nóng)作物品種和環(huán)境的雙向數(shù)據(jù)[9];而后,Gower和Hand[10]于1996年將其與數(shù)據(jù)分析結(jié)合起來,在傳統(tǒng)雙標圖的基礎(chǔ)上進行了改進,提出基于多種距離的雙標圖,同時給出不同雙標圖的統(tǒng)一理論,將雙標圖看作是類似傳統(tǒng)散點圖的多元散點圖;Yan W[11]在2000年首次提出了GGE雙標圖,主要用于分析農(nóng)作品種和環(huán)境的關(guān)系;Aitchison和Greenacre[12]在2002年將雙標圖應(yīng)用于成分數(shù)據(jù)的分析中;Niel J.le Roux和Sugnet Gardner[13]將雙標圖作為分析多元數(shù)據(jù)的一種工具.由于雙標圖分析能夠直觀反映指標變量和樣本以及它們之間的關(guān)系,受到許多學者的推崇,已在不同的科學領(lǐng)域得到廣泛應(yīng)用,如農(nóng)業(yè)、醫(yī)學[14]、旅游[15]等.

      本文第1節(jié)主要介紹雙標圖理論知識;第2節(jié)利用結(jié)構(gòu)性雙標圖對2013年全國各個城市廢水中主要污染物排放情況做了分析,并且和傳統(tǒng)的聚類分析做了比較分析;最后給出相應(yīng)的結(jié)論.

      1雙標圖理論

      設(shè)所研究的原始數(shù)據(jù)有n個觀測樣本,p個指標變量,記為Xn×p=(xij)n×p=(X1,X2,…,Xp) ,其中xij(i=1,2,…,n;j=1,2,…,p)表示矩陣Xn×p中第i行第j列的元素;Xj=(x1j,x2j,…,xnj)T表示第j個指標變量的觀測值;xi=(xi1,xi2,…,xip)表示第i個樣本的觀測值.雙標圖分析希望在最小化信息損失的前提下,把矩陣Xn×p中的n個觀測樣本xi和p個指標變量Xj表示在同一張低維圖上,可以直觀分析矩陣中行、列以及他們之間的交互關(guān)系.

      下面給出雙標圖的構(gòu)造步驟:

      步驟1:對矩陣Xn×p進行標準化得到矩陣Zn×p,且

      Zn×p=(zij)n×p=(Z1,Z2,…,Zp)

      (1)

      其中

      i=1,2,…,n; j=1,2,…,p.

      Z=UΓVT

      (2)

      其中U=(uij)n×r=(U1,U2,…,Ur)為n×r階矩陣,Uj=(u1j,u2j,…,unj)T(j=1,2,…,r)是ZZT的非零特征值所對應(yīng)的單位正交特征向量;V=(vij)p×r=(V1,V2,…,Vr)為p×r階矩陣,Vj=(v1j,v2j,…,vpj)T(j=1,2,…,r)是ZTZ的非零特征值所對應(yīng)的單位正交特征向量;Γ=diag(λ1,λ2,…,λr)為r×r階對角矩陣,且λ1≥λ2≥…≥λr>0.

      步驟3:令

      Z=FGT

      (3)

      當α取不同的值時,所對應(yīng)雙標圖中點和向量的坐標是不一樣的,得到的雙標圖也不同.通常選取α=0,0.5,1這三個值,并且可以相應(yīng)得到三種不同的雙標圖.下面具體介紹這三種不同的雙標圖.

      (4)

      i,j=1,2,…,p

      (5)

      rij表示第i個向量與第j個向量之間的簡單相關(guān)系數(shù),即兩向量之間的夾角余弦值近似兩列指標的相關(guān)性.因此,這種雙標圖適合分析列指標之間的關(guān)系.

      (2)α=1時,稱為結(jié)構(gòu)性雙標圖(Form biplot),此時F=UΓG=V,F(xiàn)FT=ZZT,雙標圖中兩點之間的距離近似于兩個觀測樣本之間的相似性,適合分析觀測樣本及其之間的關(guān)系.

      (3)α=0.5時,稱為對稱雙標圖(Symmetric scaling biplot),此時F=UΓ1/2,G=VΓ1/2,這種α的分配介于上述兩者之間,此種雙標圖適合均衡的分析行列之間的關(guān)系.

      上述所提到的雙標圖點、向量、夾角等元素可在一張二維圖中表示,即r=2,如圖1展現(xiàn)了雙標圖中的元素,其中:點近似表示矩陣Xn×p的行信息即樣本;向量近似表示矩陣Xn×p的列信息即列指標;兩點之間的距離近似表示兩樣本的相似性;向量的長度近似表示列指標的標準差;兩向量之間的夾角的余弦值近似表示兩列指標之間的相關(guān)性;點到向量的距離近似表示標準化矩陣中該樣本點在其列指標下的值.

      圖1 二維雙標圖中的元素

      2實例分析

      廢水是指居民活動過程中排出的水及徑流雨水的總稱,一般指沒有利用或沒利用價值的水.目前,我國水資源情況不容樂觀,是一個缺水比較嚴重的國家,全國許多城市的地下水均受到不同程度的污染,并且威脅到了城市居民的飲水安全,廢水處理也成為我國城市發(fā)展不可或缺的一部分.本文對全國主要城市廢水中的主要污染物排放情況進行研究分析,數(shù)據(jù)來源于2014年中國統(tǒng)計年鑒[16],如表1所示.

      表1 全國主要城市廢水中主要污染物排放情況

      續(xù)表1

      編號城 市工業(yè)廢水排放量(V1)/萬噸工業(yè)化學需氧量排放量(V2)/噸工業(yè)氨氮排放量(V3)/噸城鎮(zhèn)生活污水排放量(V4)/萬噸生活化學需氧量排放量(V5)/噸生活氨氮排放量(V6)/噸22重 慶334515153432661089372186013621123成 都1052412321801998601025951314424貴 陽226269932932177426324449025昆 明48088115266488824840454326拉 薩378312272114792799427西 安777121615163232672629061067528蘭 州4909444627231404332806497729西 寧279815759591766016332349630銀 川6194167262741139223026261831烏魯木齊4889595066618816137094613

      2.1城市廢水主要污染物的雙標圖分析

      結(jié)構(gòu)性雙標圖中兩點之間的距離近似兩樣本點之間的相似性,根據(jù)這一特點,本文對表1中的數(shù)據(jù)做出結(jié)構(gòu)性雙標圖,見圖2所示.根據(jù)樣本到中心的距離由遠到近,以及樣本點在向量上的投影可以將所有樣本大致分為6類,可得到以下分析結(jié)果.

      圖2 全國主要城市廢水污染物排放的結(jié)構(gòu)性雙標圖

      第1類:石家莊(3)離中心最遠,可以自成一類,并且它在工業(yè)氨氮、工業(yè)廢水、工業(yè)化學這三個指標變量上的值都很高.事實上,石家莊是全國重點污染城市,部分企業(yè)污水的排放是導致石家莊廢水污染物中上述指標高的一個重要原因,居民飲用水也令人堪憂.

      第2類:上海(9)、重慶(22)是一類,因為這兩點離樣本中心的距離較遠,并且這兩個城市在城鎮(zhèn)生活污水、生活氨氮、生活化學、工業(yè)廢水這4個指標上的值很高,說明這兩個城市的廢水污染物主要是這4種污染物.近年來,重慶市的餐飲業(yè)的迅速壯大,帶動了重慶的經(jīng)濟發(fā)展,但與此同時,餐飲廢水成為重慶市污水的主要來源,廢水中的污染物大多是人們?nèi)粘I钪信欧懦龅?上海作為一個國際化的大都市,人口密集,生活污水排放量較大,工業(yè)主要集中在鄉(xiāng)鎮(zhèn),鄉(xiāng)鎮(zhèn)工業(yè)水污染日趨嚴重,導致上海、重慶這兩個城市在上述4個指標上的值很高.

      第3類:北京(1)、廣州(23)、成都(19)是一類,這些城市的污染物主要來自于生活污水、生活氨氮、生活化學,在這3個指標上的值較高.北京、廣州、成都是我國人口較密集的城市,均排在城市人口排名前六,人們?nèi)粘I町a(chǎn)生的廢水成為這些城市水污染的主要來源.

      第4類:天津(2)、杭州(11)是一類,在工業(yè)化學、工業(yè)氨氮這兩個指標上的值都較高.化工、冶金、醫(yī)藥產(chǎn)業(yè)是天津市的支柱產(chǎn)業(yè),在杭州,醫(yī)藥化學、紡織服裝處于全國領(lǐng)先地位,產(chǎn)業(yè)發(fā)展帶動經(jīng)濟的增長,同時也帶來了工業(yè)污染,廢水中工業(yè)化學、氨氮的排放量較高.

      第5類:武漢(17)、南京(10)、西安(27)、南寧(20)這些城市是一類,由于其距離中心位置比較近,其污染物的指標值較低.這些城市的工業(yè)相對不發(fā)達,并且旅游業(yè)也比較突出,水污染相對較輕,廢水中的污染物排放量相比上述所提到的城市較少.

      第6類:其余城市是一類,這些城市離樣本中心最近,并且在各個污染物指標上的值都很低,甚至為負,說明這些城市相比以上城市而言,廢水污染物排放量比較低,水污染較輕.相比前5類中所提到的城市,這些城市的經(jīng)濟相對不發(fā)達,人口密集度較低,生態(tài)環(huán)境污染相對較輕.

      2.2城市廢水主要污染物的聚類分析

      利用最長距離法聚類,得到的5類結(jié)果如圖3所示.具體為:

      第1類:石家莊.

      第2類:上海、重慶.

      第3類:北京、成都、廣州.

      第4類:杭州、天津、南寧、西安、武漢、南京.

      第5類:蘭州、銀川、??凇⒗_、哈爾濱、福州、長沙、長春、南昌、沈陽、鄭州、呼和浩特、西寧、合肥、濟南、昆明、貴陽、太原、烏魯木齊.

      圖3 全國主要城市廢水污染物排放的最長距離聚類

      2.3結(jié)構(gòu)性雙標圖和最長距離聚類法的比較

      從以上分析可以看出,結(jié)構(gòu)性雙標圖把數(shù)據(jù)分為6類,而最長距離法把數(shù)據(jù)分為5類,但兩種方法得到的類大部分是相同的,只有個別有些差異,結(jié)構(gòu)性雙標圖中的第4類和第5類在最長距離聚類法中合并為一類,其他類都是一樣的,說明結(jié)構(gòu)性雙標圖的聚類效果是不錯的,并且在圖中可以得到每一類的成因;而對于最長距離聚類法得到的5類,我們只知聚類的結(jié)果,但是每一類的顯著指標變量是不知道的,這也是聚類法的一個弊端.

      3結(jié)論

      基于結(jié)構(gòu)性雙標圖的特點,本文將該方法應(yīng)用于全國主要城市廢水污染物排放情況的數(shù)據(jù),通過雙標圖分析將全國主要城市分為6類,并且指出每一類中顯著的廢水污染物,為各個城市廢水分類處理提供了幫助.城市的發(fā)展需要經(jīng)濟的帶動,在發(fā)展經(jīng)濟的同時需要保護生態(tài)環(huán)境,水,作為生命的搖籃,更需要我們共同保護.

      參考文獻

      [1] 周為華,盛海君,朱新開.揚州市城市廢水中主要污染物調(diào)查和分析[J].化學工程與裝備,2010(8):200-205.

      [2] 蔣琴.陜西省工業(yè)廢水及其主要污染物排放量預測[D].西安:西安建筑科技大學,2012.

      [3] 梁淑軒,孫漢文.中國工業(yè)廢水污染物狀況及影響因素分析[J].環(huán)境科學與技術(shù),2007,30(5):43-48.

      [4] 陳明,任仁,王子健,等.北京工業(yè)廢水和城市污水環(huán)境激素污染狀況調(diào)查[J].環(huán)境科學研究,2007,20(6):1-7.

      [5] 王洪波,王鑫,薛南冬,等.東北三省工業(yè)廢水排放中典型污染物的行業(yè)分布特征[J].農(nóng)業(yè)環(huán)境科學學報,2006,25(6):1 685-1 690.

      [6] 陸璇,葉俊.實用多元統(tǒng)計分析[M].北京:清華大學出版社,2013.

      [7] 王育鴻,梁滿發(fā),張逸進.對應(yīng)分析模型在電視劇市場評估中的應(yīng)用[J].陜西科技大學學報(自然科學版),2011,29(12):126-130.

      [8] Gabriel K.R.The biplot graphical display of matrices with application to principal component analysis[J].Biome-trika,1971,58(3):453-467.

      [9] Bradu D,Gabriel K R.The biplot as a diagnostic tool for models of two-way tables[J].Technometrics,1978,20:47-68.

      [10] Gower J.C,Hand D.J.Biplot[M].London:Chapman & Hall,1996.

      [11] Yan W,Hunt L A,Sheng Q L,et al.Cultivar evalution and mega-environment investigation based on GGE biplot[J].Crop Sci,2000,40:596-605.

      [12] Aitchison J,Greenacre M.Biplots of compositional data[J].Journal of the Royal Statistical Society:Series C(Applied Statistics),2002,51(4):375-392.

      [13] Niel J.le Roux,Sugnet Gardner.Analysing your multivariate data as a pictorial:A case for applying biplot methodology[J].International Statistical Institute,2005,73(3):365-387.

      [14] Wouters L.,Gohlmann H.W.,Bijnens L.,et al.Graphical exploration of gene expression data:A comparative study of three multivariate methods[J].Biometrics,2003,59(4):1 131-1 139.

      [15] Pan S.,Chon K.,Song H.Y.Visualizing tourism trends:Acombination of ATLAS.ti and Biplot[J].Journal of Travel Research,2008,46(3):339-348.

      [16] 中華人民共和國國家統(tǒng)計局.中國統(tǒng)計年鑒[M].北京:中國統(tǒng)計出版社,2014.

      【責任編輯:蔣亞儒】

      The form biplot analysis of main pollutant emission in waste water in part urban cities

      MA Yan-fang, ZHANG Xiao-qin

      (School of Mathematical Science, Shanxi University, Taiyuan 030006, China)

      Abstract:Biplot analysis is an useful graphical representation of multivariate date,which is based on the principal component.Traditional biplot can be divided into three kinds according to the distri-bution of the singular values,respectively,covariance biplot,form biplot,symmetric scaling biplot.This paper aim to analyze main pollutant emission in waste water in part urban cities of China by form biplot and get the clustering results.Compared to complete linkage method,we can conclude that the form biplot not only get the coresponding clusters,but also can get significant variable in these categories.It provide the strong help for wastewater treatment projects.

      Key words:form biplot; clustering analysis; main pollutant in waste water

      中圖分類號:O212.4

      文獻標志碼:A

      文章編號:1000-5811(2016)02-0174-05

      作者簡介:馬艷芳(1989-),女,山西嵐縣人,在讀碩士研究生,研究方向:統(tǒng)計機器學習

      基金項目:山西科技廳自然科學基金項目(2015011044 ); 山西省國際合作計劃項目(2015081020)

      收稿日期:2015-11-21

      猜你喜歡
      聚類分析
      基于譜聚類算法的音頻聚類研究
      軟件導刊(2016年11期)2016-12-22 21:36:40
      基于Weka的江蘇13個地級市溫度聚類分析
      我國中部地區(qū)農(nóng)村居民消費行為階段特征分析
      基于多元統(tǒng)計方法的高校科研狀況評價分析
      價值工程(2016年31期)2016-12-03 22:21:20
      基于聚類分析的無須人工干預的中文碎紙片自動拼接
      淺析聚類分析在郫縣煙草卷煙營銷方面的應(yīng)用
      基于聚類分析研究貴州省各地區(qū)經(jīng)濟發(fā)展綜合評價
      商情(2016年39期)2016-11-21 08:45:54
      新媒體用戶行為模式分析
      農(nóng)村居民家庭人均生活消費支出分析
      基于省會城市經(jīng)濟發(fā)展程度的實證分析
      中國市場(2016年33期)2016-10-18 12:16:58
      凤凰县| 济源市| 宁明县| 南通市| 乐安县| 揭东县| 和顺县| 广河县| 乐至县| 安丘市| 焦作市| 临沧市| 江安县| 绵阳市| 龙门县| 宜君县| 五家渠市| 麻栗坡县| 天柱县| 东源县| 临沧市| 临汾市| 新沂市| 深州市| 天水市| 潼南县| 无锡市| 新田县| 武冈市| 昌黎县| 十堰市| 定远县| 宁夏| 贵溪市| 应用必备| 黔西县| 衢州市| 永昌县| 尼勒克县| 菏泽市| 丹东市|