楊 旸
(東南大學(xué) 機(jī)械工程學(xué)院,江蘇 南京 211189)
在環(huán)境保護(hù)、環(huán)境治理、城市規(guī)劃、園林設(shè)計、住宅綠地設(shè)計中,可供選擇的綠化樹種種類繁多,生理指標(biāo)也較為復(fù)雜,但各生理指標(biāo)具有一定的相關(guān)性,各不同樹種也具有一定的功能類別特性.在參考了大量論文及書籍后,本文應(yīng)用主成分分析和聚類分析的方法對綠化樹種的生理指標(biāo)和不同種類的樹種進(jìn)行分類,以期為環(huán)保部門和城市建設(shè)提供新的思路.在相關(guān)領(lǐng)域,主成分分析法被用于小興安嶺低質(zhì)林不同皆伐改造模式評價[9]、居民自愿供給城市森林生態(tài)服務(wù)研究[5],均有明顯的效果,將綠化樹種及其生理指標(biāo)運(yùn)用主成分分析法和聚類分析法,可以將各個生理指標(biāo)歸納為相似相近的類別、將各個樹種同樣劃分類別,大大簡化了實(shí)際操作中樹種選擇的難度,有效增強(qiáng)了對周圍環(huán)境的針對性,也行有效減少樹種選擇失誤造成的經(jīng)濟(jì)損失.
表1 綠化植物各項生理指標(biāo)原始數(shù)據(jù)表
本文所有的數(shù)據(jù)都收集引用自參考論文.參考論文中的數(shù)據(jù)經(jīng)過統(tǒng)計并不能涵蓋每個樹種的每個生理指標(biāo),只取了其中較為有代表性的樹種,對于缺少的項目,取參考文獻(xiàn)中所有同類樹種(同為落葉喬木、常綠喬木或者為灌木)單項指標(biāo)求平均值,同時也能降低其對整個數(shù)據(jù)分析的影響.各樹種的各項生理指標(biāo)原始數(shù)據(jù)表1.表中只列出了常規(guī)的特征性指標(biāo),而一些較少的指標(biāo),對于分析研究沒有很大影響,便沒有在表中列出.已取得的平均值在表中已用括號做出了標(biāo)記.
主成分分析法也稱主分量分析或矩陣數(shù)據(jù)分析,通過變量變換的方法把相關(guān)的變量變?yōu)槿舾刹幌嚓P(guān)的綜合指標(biāo)變量.
若某研究對象有兩項指標(biāo) ζ1和 ζ2,從總體 ζ(ζ1,ζ2)中抽取了N個樣品,它們散布在橢圓平面內(nèi)(見圖 1),指標(biāo) ζ1與 ζ2有相關(guān)性.η1和 η2分別是橢圓的長軸和短軸,η1⊥η2, 故 η1與 η2互不相關(guān).其中 η1是點(diǎn) ζ(ζ1,ζ2)在長軸上的投影坐標(biāo),η2是該點(diǎn)在短軸上的投影坐標(biāo).從圖1可以看出點(diǎn)的N個觀測值的波動大部分可以歸結(jié)為η1軸上投影點(diǎn)的波動,而η2軸上投影點(diǎn)的波動較小.若η1作為一個綜臺指標(biāo),則η1可較好地反映出N個觀測值的變化情況,η2的作用次要.綜合指標(biāo)η1稱為主成分,找出主成分的工作稱為主成分分析.
圖1 主成分分析法示意圖
可見,主成分分析即選擇恰當(dāng)?shù)耐队胺较?,將高維空間的點(diǎn)投影到低維空間上,且使低維空間上的投影盡可能多地保存原空間的信息,就是要使低維空間上投影的方差盡可能地大[6].
給定一個對象集合 X={x1,x2,…,xn},假設(shè)每個對象 xi,i=1,2…,n含有m個特征,在此用向量的方式來表示對象的特征,xi=(l1,l2,…lm),聚類分析的過程就是根據(jù)對象的特征來分析對象之間的相似程度,并根據(jù)某種聚類決策準(zhǔn)則來獲得聚類結(jié)果.聚類的結(jié)果用C={c1,c2,…,ck}表示,則聚類結(jié)果滿足以下條件:c1不為空集,i=1,2,…,k;ci∩cj不為空集,i≠j,j=1,2,…,k.模糊聚類的結(jié)果沒有上面的約束條件,模糊聚類給出的結(jié)果只是對象隸屬于每個類的程度.通常聚類分析算法一般包含四個部分:1)特征獲取與選擇;2)計算相似度;3)分組;4)聚類結(jié)果展示.
特征獲取與選擇就是為了獲得能夠恰當(dāng)表示對象屬性的數(shù)據(jù),并且減少數(shù)據(jù)的冗余度,在本文的前面一章中已經(jīng)介紹了部分特征獲取與選擇的知識.計算相似度就是根據(jù)對象的特征來計算對象之間的相似程度,在聚類過程中可能一次性的計算所有對象之間的相似度信息,也可能在聚類分析的過程中按需要來計算對象之間的相似度信息,具體的過程要依據(jù)所采用的聚類方法而定,分組就是根據(jù)對象之間的相似程度來判斷對象之間的類別信息,將類似的對象分組到同一個類中,不相似的對象分組到不同的類中.聚類結(jié)果展示可以只是簡單的輸出對象分組信息,也可以用圖形化的方式來展示聚類結(jié)果,但是目前的研究趨勢要求算法能夠自動的歸納出每個不同的分組所代表的類信息并抽象出類中對象的共同特性[12].
本文均利用SPSS軟件對所得數(shù)據(jù)進(jìn)行分析處理,得到所要的主成分分析結(jié)果和聚類分析結(jié)果
3.1.1 原始數(shù)據(jù)的處理和標(biāo)準(zhǔn)化
根據(jù)主成分分析法的要求先對原始數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,這里運(yùn)用的是SPSS統(tǒng)計軟件進(jìn)行的主成分分析,軟件在分析過程中會自動進(jìn)行標(biāo)準(zhǔn)化處理,因此在這里不給出原始數(shù)據(jù)標(biāo)準(zhǔn)化結(jié)果.表2是SPPS軟件給出的經(jīng)過標(biāo)準(zhǔn)化后對變量進(jìn)行分析計算得出的相關(guān)性表.
表2 變量相關(guān)性表
3.1.2 綠化樹種生理指標(biāo)主成分分析的計算結(jié)果
主成分分析的計算結(jié)果中,新變量所代表的方差(即對應(yīng)的特征值)貢獻(xiàn)率和由原變量變換為新變量的線性變換系數(shù)(即對應(yīng)的特征向量)就成為我們進(jìn)行綜合分析的重點(diǎn).在主成分分析中一般要求少數(shù)新變量的累積方差貢獻(xiàn)率應(yīng)大于70%[9].下列表3、表4和表5分別給出了原始數(shù)據(jù)的公因子方差、各個主成分的解釋的總方差和主成分的計算結(jié)果.圖2則是各個主成分的特征值.
圖2 主成分特征值圖(碎石圖)
圖2表明,前三個主成分積累方差貢獻(xiàn)率達(dá)到90.76%,根據(jù)主成分分析法的一般原理,可取前三個具有明顯代表性的主成分.原有的8個變量可用三個主成分表示,如表5所示.再進(jìn)過矩陣的旋轉(zhuǎn),得到相關(guān)性更為明顯的三個主成分,如表6,其中相關(guān)的變量的相關(guān)性都達(dá)到了78%以上.
本文可以依據(jù)以上計算結(jié)果繪出成分圖,表明新舊變量之間的關(guān)系.同時,也可以為原始的綠化樹種生理指標(biāo)分類再進(jìn)過旋轉(zhuǎn)矩陣旋轉(zhuǎn),得到成分圖,如圖3.
表3 原始數(shù)據(jù)公因子方差
表4 各成分解釋的總方差
表5 未旋轉(zhuǎn)的成分矩陣
表6 旋轉(zhuǎn)后的成分矩陣
3.1.3 結(jié)果分析
由主成分分析的計算結(jié)果可以看出,原變量的方差在新變量中的集中度很高,根據(jù)綠化樹種生理特性指標(biāo)的實(shí)際狀況和主成分分析的要求,本文取前3個主成分來反映原來的8個變量,其方差的累計貢獻(xiàn)率已達(dá)到90.76%,三個主成分的貢獻(xiàn)率分別為47.85%,27.81%和15.10%,三個主成分在90.76%的程度上反應(yīng)了樣本的生理特征.可以認(rèn)為,這三個主成分基本上能夠反映出原變量的變化所代表的綠化樹種生理特性.
圖3 主成分組成成分示意圖
在第一主成分中,固碳量、釋氧量、日總釋水量、蒸騰吸熱量四個指數(shù)所占權(quán)系數(shù)較大,并且四個指標(biāo)變化方向非常一致,呈幾乎完全正相關(guān).說明引起這四個指標(biāo)變化的原因相似,而處理的方式也相關(guān).在植物的生命過程中,光合作用是必不可少的,是植物生存能量的來源,其中固碳量、釋氧量、釋水量都與光合作用直接相關(guān),蒸騰吸熱量因為與釋水量有著很直接的關(guān)系,因此,蒸騰吸熱量與光合作用有著較高程度的間接關(guān)系,因此命名該成分為光合作用因子.
在第二主成分中葉片含硫量、含鉛量、干重滯塵量三個指數(shù)所占權(quán)系數(shù)較大,并且三個指標(biāo)變化方向一致,呈正相關(guān).說明三者的原因,處理相近.在植物日常生命過程中,通過葉片上的氣孔與外界進(jìn)行氣體交換,而氣孔是分布在葉片表面的.而空氣中往往因為工業(yè)污染、交通尾氣污染存在大量粉塵、二氧化硫和重金屬鉛,在氣體交換的過程中,空氣中的灰塵、二氧化硫、少量的鉛會滯留在葉片表面或者被吸入葉片內(nèi)部,因此,這三項指數(shù)都與氣體交換有著很直接的關(guān)系,因此明明該成分為氣體交換吸收因子.
圖4 組間連接樹狀圖
在第三主成分中,只有含鋅量一個指標(biāo),并且貢獻(xiàn)度遠(yuǎn)大于其他指標(biāo).鋅是植物所需的微量元素,吸收原理與第二個成分不同,雖然鋅能夠從葉表吸收,但是,由于第二成分根據(jù)分析可知其為氣體交換因此,因而排除氣體交換成分,推斷其應(yīng)為根系吸收成分,即綠化樹種對于鋅的吸收有別于上文中的第二因子,靠根系的吸收,因此命名為根系微量元素吸收因子.
3.2.1 原始數(shù)據(jù)處理
本文采用組間連接法利用SPSS軟件對綠化樹種的進(jìn)行分類,表7是得到的組間連接法的平均連接表.
3.2.2 處理所得結(jié)果
將表中數(shù)據(jù)進(jìn)行進(jìn)一步處理可得樹狀圖,如圖4所示.
3.2.3 結(jié)果分析
比對原始數(shù)據(jù)表,可知總共18中綠化樹種,可分為三大類:碧桃、榆葉梅是一類,女貞是單獨(dú)一類,余下所有樹種共為一類;三大類中的第三大類又可分為兩類:白玉蘭、白蠟、銀杏、水杉、楊樹、連翹、大葉黃楊、小葉黃楊、杜仲、懸鈴木是一類,廣玉蘭、刺柏、香樟、元寶楓、國槐是一類;該兩類中第一類又可分為兩類:白玉蘭、白蠟和剩下的樹種.
表7 聚類表
主成分分析法結(jié)果表明,綠化樹種的生理指標(biāo)可以分為三類:光合作用成分,氣體交換吸收成分和根系微量元素吸收成分.每種成分中所包含的變量都是正相關(guān)的,故在環(huán)境保護(hù)與改善、城市規(guī)劃、住宅區(qū)綠化、園林設(shè)計選擇樹種選擇樹種或?qū)G化效果進(jìn)行評價時,可以根據(jù)設(shè)計規(guī)劃要求的效果,只需從三個主要指標(biāo)進(jìn)行考慮,諸如:重點(diǎn)關(guān)注滯塵量或者鉛硫吸收量等,大大簡化了樹種選擇的難度和評價復(fù)雜性.
聚類分析結(jié)果表明,根據(jù)現(xiàn)有樹種實(shí)際功效可以將綠化樹種分類,以本文為例,在環(huán)境保護(hù)研究中,將所有各類綠化樹種進(jìn)行分析,找出各個綠化樹種之間的相互替代性,進(jìn)而在實(shí)際運(yùn)用中,在同類要求的綠化標(biāo)準(zhǔn)下,選擇該類中成本最低的樹種,能夠大大降低綠化建設(shè)的成本,提高綠化效益,帶來巨大的經(jīng)濟(jì)效益.
[1]李永杰.北京市常見綠化樹種生態(tài)效益研究[D].河北農(nóng)業(yè)大學(xué),2007.
[2]梁淑英.部分城市綠化樹種的生理特性及其對大氣污染的響應(yīng)[D].南京林業(yè)大學(xué),2008.
[3]韓煥金.城市綠化樹種生態(tài)功能研究[D].東北林業(yè)大學(xué),2002.
[4]王海燕.呼和浩特市10種主要園林樹木生理生態(tài)特性與生態(tài)效益研究[D].內(nèi)蒙古農(nóng)業(yè)大學(xué),2009.
[5]李英,裴佳音.基于聚類分析的居民自愿供給城市森林生態(tài)服務(wù)研究[J].福建:林業(yè)經(jīng)濟(jì)問題,1005-9709(2008)03-0223-05.
[6]黃勝,王斌,丁桑嵐,陳秀眉,陳德川.主成分分析法在二灘水質(zhì)監(jiān)測數(shù)據(jù)綜合分析中的應(yīng)用實(shí)例[J].重慶環(huán)境科學(xué),2003,25(2):53-56.
[7]溫淑瑤,王京,丁根宏.應(yīng)用主成分分析法評判湖泊營養(yǎng)類別[J].河海大學(xué)學(xué)報,1997,25(4):86-90.
[8]汪應(yīng)洛.系統(tǒng)工程[M].北京:機(jī)械工業(yè)出版社,2009:54-60.
[9]呂海龍,董希斌.基于主成分分析的小興安嶺低質(zhì)林不同皆伐改造模式評價[J].北京:林業(yè)科學(xué),1001-7488(2011)12-0172-07.
[10]張莉.南京常見道路綠化樹種的環(huán)境效益研究[D].南京林業(yè)大學(xué),2007.
[11]梁淑英.南京地區(qū)常見城市綠化樹種的生理生態(tài)特性及凈化大氣能力的研究[D].南京林業(yè)大學(xué),2005.
[12]唐東明.聚類分析及其應(yīng)用研究[D].電子科技大學(xué),2010.