張雪伍,蔣家超
(1.常熟理工學院 計算機科學與工程學院,江蘇 常熟 215500;2.中國礦業(yè)大學 環(huán)境與測繪學院,江蘇 徐州 221116)
工業(yè)廢氣指企業(yè)廠區(qū)內燃料燃燒和生產(chǎn)工藝過程中產(chǎn)生的各種排入空氣的含有污染物的氣體總量[1].隨著工業(yè)化水平的提高,分布于城市周圍的工礦企業(yè)的數(shù)量和生產(chǎn)規(guī)模不斷增大,廢氣排放量也呈現(xiàn)逐年上升的發(fā)展態(tài)勢.廢氣完全降解需要一定的時間周期,因此環(huán)境中的廢氣總量具有一定的累積效應,在總量上呈現(xiàn)出復雜的非線性增長,對城市的空氣質量構成了巨大的威脅.有效地對城市工業(yè)廢氣排放量進行預測,可以更好地控制和改善城市大氣質量,為城市工業(yè)合理發(fā)展和科學布局提供依據(jù),因此設計準確、高效的城市工業(yè)廢氣排放量預測模型成為城市工業(yè)發(fā)展和規(guī)劃研究領域中的熱點.
為了對城市工業(yè)廢氣排放量進行準確預測,國內外學者對其進行了大量的研究,提出了許多預測方法,主要有回歸分析法、時間序列法、ARMA模型等,近年來又引入神經(jīng)網(wǎng)絡、灰色系統(tǒng)等理論探討新的預測方法[2-5].傳統(tǒng)的回歸分析法、時間序列法、ARMA模型等是趨勢預測,假定城市工業(yè)廢氣排放量是線性變化的,然而實際上城市工業(yè)廢氣排放量受到國家產(chǎn)業(yè)政策、國際貿易環(huán)境等因素的影響,呈現(xiàn)出非常復雜的非線性,同時具有趨勢性、隨機性和突變性,用傳統(tǒng)線性模型對其進行預測精度較低[2-3].城市工業(yè)廢氣排放量變化過程是同時含有已知信息和未知信息的動態(tài)系統(tǒng),因此很多學者將其看作一個灰色系統(tǒng),構建基于GM(1,1)的城市工業(yè)廢氣排放量預測模型,取得了較好的預測效果.然而灰色模型僅僅適應于變量呈指數(shù)級增長的數(shù)據(jù)預測[6-8],現(xiàn)實中,城市工業(yè)廢氣排放量呈現(xiàn)趨勢性變化的同時,還伴隨著隨機性和非線性,單一GM(1,1)模型對波動性較大的城市工業(yè)廢氣排放量的預測精度較低.BP神經(jīng)網(wǎng)絡模型能夠對非線性關系進行無限逼近,適合對非線性、波動性較大的問題進行建模,且預測精度較好[9-10],但由于沒有考慮變化的趨勢性,預測的穩(wěn)定性不高,經(jīng)常出現(xiàn)較大誤差.因此,本文將GM(1,1)模型與BP神經(jīng)網(wǎng)絡模型相結合構建組合預測模型,實現(xiàn)優(yōu)勢互補,提高城市工業(yè)廢氣排放量的預測精度.將GM(1,1)(簡稱,GM)與BP進行結合,構建GM-BP交叉組合模型對城市工業(yè)廢氣排放量進行預測.先通過GM(1,1)對城市工業(yè)廢氣排放量變化趨勢進行預測,然后利用BP神經(jīng)網(wǎng)絡對GM(1,1)模型的趨勢預測值進行隨機誤差修正,以適應城市工業(yè)廢氣排放量的隨機性和復雜非線性,提高預測精度.最后,通過對南京市工業(yè)廢氣排放量進行仿真,對提出的GM-BP模型進行了檢驗.
城市工業(yè)廢氣排放量在一定程度上反映了該城市的工業(yè)化水平,受到諸多因素影響,如工業(yè)生產(chǎn)工藝水平、城市工業(yè)發(fā)展規(guī)模等,并且各種因素之間存在高度的非線性相關.它的變化是非線性的,這種非線性是由變化的趨勢性和隨機性疊加而形成的.城市工業(yè)廢氣排放量預測是根據(jù)城市工業(yè)廢氣排放量的歷史數(shù)據(jù)和相關影響因素的歷史數(shù)據(jù),基于一個預測模型對其未來的排放量進行預測,表示如下:
式中y是年度城市工業(yè)廢氣排放量,g是年度城市工業(yè)廢氣排放量趨勢值,ε是城市工業(yè)廢氣排放量的隨機誤差,由相關影響因素預測.
灰色預測通過對原始數(shù)據(jù)處理和灰色建模,發(fā)現(xiàn)系統(tǒng)的演化規(guī)律,進而對系統(tǒng)未來的發(fā)展狀態(tài)做出科學的定量預測[6-9].灰色預測模型的構建是以對系統(tǒng)發(fā)展進程進行充分的定性分析為依據(jù)的,同時模型還要經(jīng)過多種檢驗合格后方能用來預測.GM(1,1)模型是灰色系統(tǒng)中常用的數(shù)列預測模型[7].在對原始數(shù)列進行定性分析的基礎上,確定適當?shù)男蛄兴阕?,然后對算子計算后的?shù)列構建GM(1,1)模型,達到指定的精度便可以對數(shù)列的未來變化進行預測[10].
BP神經(jīng)網(wǎng)絡是一種基于信號正向傳播和誤差逆向傳播的多層前饋神經(jīng)網(wǎng)絡,在大量的學習樣本和足夠的訓練次數(shù)下,能夠記憶輸入與輸出之間的映射關系[11].它一般由輸入層、隱含層(為一層或多層)和輸出構成,相鄰各層之間的神經(jīng)元為全連接,層內神經(jīng)元之間無連接.訓練過程中輸入樣本從輸入層經(jīng)由隱含層逐層處理后,傳向輸出層,若實際輸出與期望輸出誤差不能滿足要求,則進入誤差的反向傳播過程,輸出誤差被分攤到各層的所有神經(jīng)單元,但其不能被反饋到最前層.
BP神經(jīng)網(wǎng)絡學習過程中,通過正向逐層計算各層神經(jīng)元的輸出和反向對連接權重和閾值進行調整兩個過程的多次反復交替進行,直至達到收斂為止,或達到訓練次數(shù)的上限,學習過程結束,便可用該模型進行預測.理論上,BP網(wǎng)絡可以在任意精度下對映射關系進行建模,但由于受到訓練次數(shù)、學習樣本數(shù)量、隱含層神經(jīng)元個數(shù)等因素的影響,對于小樣本時序數(shù)據(jù)的預測存在一定的誤差.
城市工業(yè)廢氣排放量的變化在總體上呈現(xiàn)出一定的趨勢性,在細節(jié)上又表現(xiàn)出復雜的非線性波動.這種波動是由與工業(yè)廢氣排放直接或間接相關的影響因素變化而引起的.故此,引入交叉組合灰色神經(jīng)網(wǎng)絡模型對工業(yè)廢氣排放量進行預測,模型結構如圖1所示.
X=(x1,x2,…xi)T為 BP 網(wǎng)絡的輸入向量;H=(h1,h2,h3…h(huán)j)T為隱含層的輸入向量;ε=(ε1,…εm)T為 BP 網(wǎng)絡的輸出殘差向量;Y=(y1…ym)(ym為第m個預測指標的時間序列數(shù)據(jù)行向量)是MG(MG1…MGm)模型的輸入行向量;G=(g1,…gm)T為 GM-BP模型的輸入向量的灰色預測部分向量;ε=(ε1,…,εm)T向量為 GM-BP模型的殘差預測部分;O=(o1,…,om)T為GM-BP模型的輸出向量. 模型的期望輸出為D向量,D=(d1,d2,…dm)T.
(4)健全電網(wǎng)數(shù)據(jù)管理機制,強化數(shù)據(jù)安全管理工作。在大數(shù)據(jù)時代下,數(shù)據(jù)是一種重要的資源,為此,電力行業(yè)必須強化對數(shù)據(jù)的安全管理,建立健全的數(shù)據(jù)安全管理機制,以防重要數(shù)據(jù)丟失,加強數(shù)據(jù)的安全性與保密性,有效保護數(shù)據(jù)價值。
圖1 GM-BP預測模型結構
Ym為GMm模型的輸入的原始數(shù)據(jù)序列,有e個數(shù)據(jù),記為:
對y(0)m作1-AGO算子運算,得式(3):
用均值緊鄰算子作用于y(1)m得式(4):
根據(jù)GM(1,1)模型,可得:
通過a^=[a,b]T=(BTB)-1BTP來構建時間相應函數(shù)為
根據(jù)式(3)求得 y(1)m的模擬值
通過1-AGO算子的逆向操作獲得y(0)m的模擬值
由式(1)與式(9)可以計算GM(1,1)的模擬誤差為
圖2 城市工業(yè)廢氣排放量GM-BP模型預測流程
預測時,將GMm(1,1)模型的輸出向量與BP模型的誤差預測值 ε^m相加,作為GM-BP模型的對第m預測指標的最終預測值.
最終GM-BP模型的預測結果為
基于GM-BP模型的城市工業(yè)廢氣排放量預測流程如圖2所示.
城市工業(yè)廢氣排放量的相關因素眾多.綜合考慮數(shù)據(jù)本身的準確性和可獲得性,選取了城市工業(yè)廢渣(x1(億噸))、城市工業(yè)廢水(x2(億噸))和城市工業(yè)總產(chǎn)值(x3(億元))作為直接影響因素,城市總人口(x4(萬人))和城市GDP(x5(億元))作為間接影響因素參與城市工業(yè)廢氣排放量(y(億立方米))的預測.實驗數(shù)據(jù)來自于1981~2011年南京市統(tǒng)計年鑒(見表1),選取1981~2006年的數(shù)據(jù)作為訓練數(shù)據(jù),2007~2010年數(shù)據(jù)用來對模型進行檢驗.
表1 1981~2010年南京市工業(yè)廢氣相關因素
在Matlab7.0平臺上編寫GM(1,1)計算程序,將1981~2006年南京城市工業(yè)廢氣排放量作為輸入變量,進行GM(1,1)建模,獲得的時間響應式如式(13)所示.
利用式(13)對2007~2010年南京市工業(yè)廢氣排放量進行預測,預測結果見圖3.
由圖3可知,GM(1,1)模型能較好反映南京城市工業(yè)廢氣排放量的變化趨勢,但在廢氣排放量的波動預測方面,精度較低.
圖3 GM(1,1)預測結果
將GM(1,1)的預測值gm與實際值 y(0)m計算殘差,并將該殘差 εm與相關影響因素 x1、x2、x3、x4、x5作為訓練數(shù)據(jù)對 BP 神經(jīng)網(wǎng)絡進行訓練.網(wǎng)絡結構為5-6-1,誤差學習目標為0.0005,最大迭代次數(shù)為50000萬,學習速度為0.07.隱含層和輸出層的激活函數(shù)分別為tansig和purelin,訓練函數(shù)為traingdx,利用Matlab7.0編程對BP模型進行訓練,并對2007~2010年GM(1,1)預測殘差進行仿真,預測結果如圖4所示.
由圖4可知,BP網(wǎng)絡能夠對GM(1,1)模型的工業(yè)廢氣排放量預測的殘差進行高精度仿真.
將BP網(wǎng)絡的殘差仿真值與GM(1,1)模型的趨勢預測值進行相加,作為南京市工業(yè)廢氣排放量的預測值.為增強對比性,分別采用時間序列預測(專家模型)、多元線性回歸預測模型、GM(1,1)模型對2007~2010年南京市的工業(yè)廢氣排放量進行預測,預測的結果和誤差分別如圖5和表2所示.
圖4 GM(1,1)殘差的BP網(wǎng)絡仿真結果
圖5 GM-BP與其他模型預測結果對比
由圖3、圖5和表2可知,GM-BP的預測誤差要遠小于單一的GM(1,1)、BP網(wǎng)絡模型及其他的傳統(tǒng)模型.實驗對比結果表明,GM-BP模型是一種高精度、有效的城市工業(yè)廢氣排放量預測模型,預測結果能夠同時反映城市工業(yè)廢氣排放量的發(fā)展趨勢和隨機波動.
城市工業(yè)廢氣排放量呈現(xiàn)出復雜的非線性和隨機性,很難建立準確的數(shù)學模型對其進行描述,而單一的線性模型或隨機模型只能對城市工業(yè)廢氣排放量的部分信息進行描述,無法準確對其復雜非線性進行建模,導致預測精度較低.GM(1,1)模型具有很好的趨勢預測能力,BP神經(jīng)網(wǎng)絡能夠對非線性進行無限逼近.針對城市工業(yè)廢氣發(fā)展變化的特征,將GM(1,1)與BP進行交叉組合構建GM-BP預測模型,克服了單一GM(1,1)和BP模型的缺點,將二者的優(yōu)點進行綜合,從而提高預測精度.仿真結果表明,相對于單一城市工業(yè)廢氣排放量預測模型,GM-BP模型能同時兼顧數(shù)據(jù)序列的變化趨勢性和波動性,具有更高的預測精度,能夠應用于城市工業(yè)廢氣排放量預測.
表2 各預測模型預測平均誤差
[1]徐慶嫦.工業(yè)廢氣污染治理技術綜述[J].廣州化工,2012,40(15):186-187.
[2]沈楠.基于ARMA模型的湖南省工業(yè)廢氣排放量統(tǒng)計預測[J].中國商界,2009(9):212-213.
[3]湯鳴.西安市工業(yè)廢氣排放總量的灰色預測模型[J].西安航空技術高等??茖W校學報,2009,27(5):46-48.
[4]盧偉真.城市交通廢氣污染現(xiàn)狀及其預測方法[J].力學與實踐,2008,30(4):1-7.
[5]鄭敏敏,肖秀欽,陳慶華,等.福建省工業(yè)廢氣排放量的因子分析與灰色預測[J].環(huán)境科學與管理,2012,37(4):4-7.
[6]石為人,王燕霞,唐云建,等.基于灰色神經(jīng)網(wǎng)絡建模的水質參數(shù)預測[J].計算機應用,2009,29(6):1529-1531.
[7]劉思峰,黨耀國,方志耕.灰色系統(tǒng)理論及其應用[M].3版.北京:科學出版社,2004.
[8]LIN Chan-Ben,SU Shun-Feng,Yen-Tsen Hsu.High Precision Prediction Using Grey Models[J].Int J of Systems Science,2001,32(5):609-619.
[9]孫莉,翟永超.基于灰色BP神經(jīng)網(wǎng)絡的服裝面料規(guī)格參數(shù)預測[J].計算機應用與軟件,2012,29(7):154-156.
[10]朱世平,劉載文,王小藝,等.灰色理論與神經(jīng)網(wǎng)絡在水華預測中的應用[J].計算機工程與應用,2011,47(13):231-233.
[11]張雪伍,常晉義.PCA-BP在城市汽車保有量預測中的應用研究[J].計算機仿真,2012,29(12):376-379.