吳明燦 楊成 徐夢婷 盧春宇
摘要:20世紀(jì)80年代以來,伴隨中國經(jīng)濟(jì)發(fā)展的進(jìn)程,環(huán)境污染問題日益突出,已發(fā)展成為可持續(xù)發(fā)展的最大制約因素之一。經(jīng)濟(jì)增長與環(huán)境問題的兩難沖突問題,已經(jīng)引起人們思考。本文將以空氣質(zhì)量作為環(huán)境狀況代表,搜集中國主要城市的經(jīng)濟(jì)發(fā)展數(shù)據(jù)和空氣質(zhì)量,研究經(jīng)濟(jì)發(fā)展水平和空氣質(zhì)量之間的關(guān)系。從PM2.5(ug/m3),環(huán)境空氣質(zhì)量綜合指數(shù)AQI,空氣質(zhì)量等級,人口(萬人),GDP(億元)五個(gè)方面進(jìn)行關(guān)聯(lián)分析,找出它們之間的聯(lián)系,對環(huán)境空氣質(zhì)量進(jìn)行評價(jià)并提出相應(yīng)的改善方案。
關(guān)鍵詞:數(shù)據(jù)挖掘;空氣質(zhì)量;AQI ;PM2.5
1.引言
自改革開放以來,我國經(jīng)濟(jì)高速發(fā)展持續(xù)了30年,這期間取得了令世界為之矚目的成就,目前中國已經(jīng)成為取代日本的世界第二大經(jīng)濟(jì)體。然而隨著我國工業(yè)化、城鎮(zhèn)化的深入推進(jìn),經(jīng)濟(jì)增長和人口增長引發(fā)的城市環(huán)境問題,尤其是城市大氣環(huán)境問題,得到各界高度關(guān)注。因此筆者以20個(gè)中國主要城市作為樣本,運(yùn)用weka以及MSBNx貝葉斯網(wǎng)分類工具等軟件,分析研究不同城市,以PM2.5為代表污染物,結(jié)合各地區(qū)人口數(shù)量、經(jīng)濟(jì)發(fā)展情況進(jìn)行分析評價(jià),探求之間關(guān)聯(lián)關(guān)系,為更好地貫徹“可持續(xù)發(fā)展”的方針提供數(shù)據(jù)依據(jù),利于后續(xù)采取環(huán)境保護(hù)及經(jīng)濟(jì)發(fā)展的協(xié)調(diào)措施。
2.數(shù)據(jù)來源
選取20個(gè)中國主要城市作為樣本,從城市、PM2.5濃度(ug/立方米)、AQI、空氣級別、人口數(shù)(萬人)、GDP(億元)六個(gè)方面進(jìn)行數(shù)據(jù)的處理與分析。
經(jīng)過調(diào)查,并收集數(shù)據(jù),初步處理調(diào)查結(jié)果。如下表所示
3.數(shù)據(jù)分析
在數(shù)據(jù)處理分析中,運(yùn)用Weka關(guān)聯(lián)規(guī)則平臺、使用Apriori算法等獲取關(guān)聯(lián)信息并進(jìn)行挖掘規(guī)則的分析。通過對上表中的數(shù)據(jù),剔除不需要的屬性值,建立關(guān)聯(lián)模型(調(diào)參,建立預(yù)測模型),并對實(shí)際調(diào)查的結(jié)果進(jìn)行關(guān)聯(lián)規(guī)則挖掘。
支持度閾值為25%、置信度閾值為85%
對上表調(diào)查結(jié)果數(shù)據(jù)進(jìn)行Apriori關(guān)聯(lián)規(guī)則挖掘(支持度閾值為20%、置信度閾值為85%),對挖掘的最佳關(guān)聯(lián)規(guī)則進(jìn)行分析
利用Apriori關(guān)聯(lián)規(guī)則對數(shù)據(jù)進(jìn)行挖掘可知:
1.人口數(shù)量小于6000人與GDP小于8869億元有強(qiáng)關(guān)聯(lián)(lift=1.46>1);
2.空氣質(zhì)量指數(shù)大于0.8與GDP小于8869億元有強(qiáng)關(guān)聯(lián)(lift=1.46>1);
由此可見,人口數(shù)量與GDP呈正相關(guān)關(guān)系,人口數(shù)量越多,GDP量越大,即正常情況下,一個(gè)城市的人口規(guī)模發(fā)展地越大,經(jīng)濟(jì)發(fā)展水平會越高。城市的空氣質(zhì)量越好(即AQI越?。?jīng)濟(jì)發(fā)展水平越高。
支持度閾值為10%,置信度閾值為55%
利用Apriori關(guān)聯(lián)規(guī)則對數(shù)據(jù)進(jìn)行挖掘,分析可知:
1.AQI數(shù)值越小,人口數(shù)量小于6000與GDP小于8869億有強(qiáng)關(guān)聯(lián)(lift=2.38>1)
2.PM2.5的濃度越小,AQI數(shù)值越小。
由此可見,PM2.5的濃度與AQI的數(shù)值呈正相關(guān),即PM2.5濃度越小,AQI的數(shù)值越小,空氣質(zhì)量越好;AQI數(shù)值越小,人口數(shù)量越小,GDP量越小。
支持度和置信度是關(guān)聯(lián)規(guī)則的兩個(gè)重要屬性,支持度確定規(guī)則可以用于給定數(shù)據(jù)集的頻繁程度,而置信度確定Y在包含X的事務(wù)中出現(xiàn)的概率。同時(shí)滿足最小支持度閾值和最小置信度閾值的規(guī)則稱為強(qiáng)規(guī)則,作用度解決了置信度忽略規(guī)則后件中出現(xiàn)的項(xiàng)集的支持度的局限性。根據(jù)關(guān)聯(lián)規(guī)則分析可粗略找出PM2.5的濃度、AQI、人口數(shù)量、GDP四者的相互關(guān)聯(lián)關(guān)系,利于后續(xù)的深入分析。
4 總結(jié)及建議
利用weka軟件對選取的數(shù)據(jù)樣本進(jìn)行處理和分析,得出的結(jié)論可知:
1.PM2.5的濃度與AQI的值呈正相關(guān),其濃度越高,AQI值越高,則空氣質(zhì)量越差
2.AQI的值與人口數(shù)量和GDP的值呈正相關(guān),說明一個(gè)城市人口規(guī)模越大,經(jīng)濟(jì)發(fā)展水平越高,空氣質(zhì)量越差。
要想實(shí)現(xiàn)可持續(xù)發(fā)展目標(biāo),人與環(huán)境要進(jìn)行協(xié)調(diào),實(shí)現(xiàn)共同發(fā)展。具體可參考如下建議:
1)調(diào)整產(chǎn)業(yè)結(jié)構(gòu),減少工業(yè)污染源的排放
2)開發(fā)新技術(shù),提供產(chǎn)品環(huán)保保證
3)加減少大空氣污染環(huán)保意識的宣傳
4)控制人口增長,適當(dāng)采用“計(jì)劃生育”政策,限制人口爆炸增長
本次課題利用Weka軟件對城市人口增長以及經(jīng)濟(jì)發(fā)展水平和空氣質(zhì)量三者之間的關(guān)系進(jìn)行分析,將理論知識運(yùn)用到實(shí)際問題中,發(fā)現(xiàn)生活中的問題,并根據(jù)分析結(jié)果提出相應(yīng)的改進(jìn)手段,有助于社會的可持續(xù)發(fā)展。
參考文獻(xiàn)
[1]朱小棟,徐欣.數(shù)據(jù)挖掘原理與商務(wù)應(yīng)用.立信會計(jì)出版社.2013.3.
[2]袁梅宇.數(shù)據(jù)挖掘與機(jī)器學(xué)習(xí)——WEKA應(yīng)用技術(shù)與實(shí)踐(第二版).清華大學(xué)出版社.2016.
[3]Jiawei Han.數(shù)據(jù)挖掘概念與技術(shù)(第三版).機(jī)械I業(yè)出版社,2012.
[4]徐新陽主編.環(huán)境評價(jià)教程.化學(xué)工業(yè)出版社.2019.09
[5]世界自然資源保護(hù)大綱1980.
[6]空氣質(zhì)量在線監(jiān)測平臺.https://www.aqistudy.cn