黃成
華僑大學(xué) 機(jī)電及自動(dòng)化學(xué)院 福建 廈門(mén) 361021
空氣污染通常也被我們稱(chēng)為大氣污染,隨著城市的不斷發(fā)展,我國(guó)私家車(chē)數(shù)量逐漸增加,而且越來(lái)越多的工廠被建立在城市周?chē)蛘叱鞘袃?nèi),這些工廠在工作的過(guò)程中便會(huì)不斷排放出二氧化硫、二氧化氮、一氧化碳等有毒污染物。特別地,許多傳統(tǒng)工業(yè)如煤炭、火力發(fā)電、造紙、印刷等產(chǎn)業(yè)由于設(shè)備升級(jí)困難,且對(duì)于國(guó)民經(jīng)濟(jì)與生活具有重要地位,在較長(zhǎng)的時(shí)間內(nèi)仍然會(huì)排放出大量空氣污染物,這也極大地加劇了我國(guó)的空氣污染。當(dāng)這些空氣污染物超過(guò)一定的濃度范圍之后將會(huì)嚴(yán)重危害人類(lèi)的健康,如產(chǎn)生眼部刺激癥狀、咳嗽、肺功能衰竭等急性危害和產(chǎn)生結(jié)膜炎、咽喉炎等慢性危害。特別對(duì)于孕婦、老人及兒童,空氣污染物有更加嚴(yán)重的危害,比如處于妊娠期的孕婦若長(zhǎng)期與空氣污染物接觸,會(huì)使得胎兒難以獲得充足的氧氣,使得孕婦早產(chǎn)、出生兒頭小、體重大幅下降等非健康狀況發(fā)生[1]。根據(jù)《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》(GB3095-2012)的新要求,我國(guó)從2013年1月1日起開(kāi)始對(duì)PM2.5、PM10、SO2、NO2、CO、O2等空氣污染物進(jìn)行實(shí)時(shí)監(jiān)測(cè)數(shù)據(jù),監(jiān)測(cè)的城市也由最初的74個(gè)城市增加到337個(gè)城市,使得我國(guó)的空氣污染監(jiān)測(cè)工作變得越來(lái)越完善。
在前饋神經(jīng)網(wǎng)絡(luò)中,每一個(gè)神經(jīng)元都排列成不同的層,并且每一個(gè)神經(jīng)元均只能接收從前一層神經(jīng)元傳出的信號(hào),并把接收到的信號(hào)變化處理后再傳入下一層神經(jīng)元中,且同層的神經(jīng)元信號(hào)不能互相傳遞信號(hào)。前饋神經(jīng)網(wǎng)絡(luò)具有學(xué)習(xí)簡(jiǎn)單、收斂快等特點(diǎn)[2],它經(jīng)過(guò)不斷的發(fā)展,現(xiàn)在理論研究已經(jīng)非常完善,且已經(jīng)開(kāi)始應(yīng)用于越來(lái)越多的領(lǐng)域,比如神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)膠結(jié)強(qiáng)度、神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)焦炭質(zhì)量、神經(jīng)網(wǎng)絡(luò)控制機(jī)械臂等等。本文運(yùn)用MATLAB的Neural Net fitting,對(duì)中國(guó)生態(tài)環(huán)境部發(fā)布的2013年至2020年《中國(guó)生態(tài)環(huán)境公報(bào)》PM2.5、PM10、SO2等6項(xiàng)空氣污染物年均濃度數(shù)據(jù)建立神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型,并對(duì)2021年我國(guó)PM2.5、PM10、SO2等6項(xiàng)空氣污染物年均濃度進(jìn)行了預(yù)測(cè)。
前饋神經(jīng)網(wǎng)絡(luò)是具有遞階分層結(jié)構(gòu)的網(wǎng)絡(luò),通常由輸入層、一個(gè)或多個(gè)隱藏層、輸出層構(gòu)成。該神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)特點(diǎn)是:信號(hào)只能由本層的神經(jīng)元流向下一層的神經(jīng)元,而不能由本層的神經(jīng)元流向本層其他的神經(jīng)元,簡(jiǎn)單來(lái)說(shuō)就是單向連接流通性,且各神經(jīng)元之間不存在反饋。但是,前饋神經(jīng)網(wǎng)絡(luò)仍有誤差信號(hào)的反向傳播特性,當(dāng)由輸出層輸出的實(shí)際信號(hào)與我們所期望的輸出信號(hào)有偏差時(shí),會(huì)把誤差信號(hào)再反向傳播回到神經(jīng)網(wǎng)絡(luò)中,神經(jīng)網(wǎng)絡(luò)再根據(jù)反饋的誤差信號(hào)自學(xué)習(xí)調(diào)整權(quán)值以減小誤差。下圖為前饋神經(jīng)網(wǎng)絡(luò)的基本結(jié)構(gòu)圖。
圖1 前饋神經(jīng)網(wǎng)絡(luò)基本結(jié)構(gòu)
圖2 反向誤差流程圖
BP誤差反向傳播算法利用了最小二乘法的思想,當(dāng)輸出層實(shí)際輸出信號(hào)與期望輸出信號(hào)產(chǎn)生偏差時(shí),反向梯度傳播誤差信號(hào),通過(guò)改變各層信號(hào)權(quán)值使得誤差均方值最小。上圖為反向傳播算法流程圖。
在MATLAB應(yīng)用中首先在APP應(yīng)用欄目下打開(kāi)Neural Net fitting工具箱并建立一個(gè)兩層前饋神經(jīng)網(wǎng)絡(luò),其中該神經(jīng)網(wǎng)絡(luò)包括具有sigmoid神經(jīng)元的一層隱含層和具有線性神經(jīng)元的一層輸出層。接著定義隱含層神經(jīng)元的數(shù)量為10個(gè),神經(jīng)元的數(shù)量與神經(jīng)網(wǎng)絡(luò)的擬合精度有關(guān)聯(lián),在一定條件下適當(dāng)增加神經(jīng)元的數(shù)量可以提供我們預(yù)測(cè)模型的精度。接著,我們可以選擇Levenberg-Marquardt算法、Bayesian Regularization算法或者Scaled Conjugate Gradient算法作為神經(jīng)網(wǎng)絡(luò)模型的訓(xùn)練算法。三種算法各有優(yōu)缺點(diǎn),其中Levenberg-Marquardt算法收斂速度增加,訓(xùn)練時(shí)間短,克服了傳統(tǒng)BP算法收斂于局部極小點(diǎn)等缺陷,但會(huì)消耗過(guò)多的內(nèi)存[3];Scaled Conjugate Gradient算法訓(xùn)練時(shí)間短,但是會(huì)有較大的誤差;Bayesian Regularization算法會(huì)消耗較多的訓(xùn)練時(shí)間,但是訓(xùn)練結(jié)果更準(zhǔn)確,所以最后我選擇Bayesian Regularization算法作為我的訓(xùn)練算法。
我國(guó)城市空氣污染物種類(lèi)多,本文主要采用了PM2.5、PM10、SO2、NO2、CO、O2這6種主要空氣污染物從2013年到2020年的年均濃度監(jiān)測(cè)數(shù)據(jù),其數(shù)據(jù)來(lái)源于中華人民共和國(guó)生態(tài)環(huán)境部發(fā)布的2013年至2020年《中國(guó)生態(tài)環(huán)境公報(bào)》。本文收集的數(shù)據(jù)PM2.5、PM10、SO2、NO2、CO、O2各有1組,每組數(shù)據(jù)各有8個(gè)獨(dú)立數(shù)據(jù),總共有48組數(shù)據(jù)。以下表格為各組具體的數(shù)據(jù)。以下表1為各組具體的數(shù)據(jù)。
表1 城市6項(xiàng)空氣污染物年均濃度
將PM2.5、PM10、SO2等6組城市污染物年均濃度數(shù)據(jù)每分別導(dǎo)入預(yù)測(cè)模型中,共建立6組獨(dú)立預(yù)測(cè)模型。其中每組模型輸入數(shù)據(jù)都為2013至2020的年份,而目標(biāo)輸出值為每個(gè)年份對(duì)應(yīng)的城市不同污染物年均濃度值。
建立好模型并且導(dǎo)入數(shù)據(jù)之后開(kāi)始對(duì)每組數(shù)據(jù)進(jìn)行訓(xùn)練,將PM2.5、PM10、SO2、NO2、CO、O2的年均濃度這6組不同的數(shù)據(jù)進(jìn)行不同次數(shù)的訓(xùn)練后分別得到各組數(shù)據(jù)的訓(xùn)練結(jié)果。以CO的訓(xùn)練結(jié)果為例,訓(xùn)練結(jié)束后彈出訓(xùn)練結(jié)果操作界面,在訓(xùn)練界面中不僅可以查看到訓(xùn)練算法、訓(xùn)練次數(shù)、訓(xùn)練時(shí)間等數(shù)據(jù),還能自由查看訓(xùn)練性能圖、誤差分布圖、擬合圖等圖像。通過(guò)這些圖我們能判斷預(yù)測(cè)模型的好壞,并且能根據(jù)這些圖中的數(shù)據(jù)對(duì)模型再進(jìn)行適當(dāng)調(diào)整以使預(yù)測(cè)精度達(dá)到我們的預(yù)測(cè)要求。
圖3 CO誤差分布
我們看到通過(guò)建立的神經(jīng)網(wǎng)絡(luò)預(yù)測(cè)模型擬合出的曲線與原數(shù)據(jù)點(diǎn)基本吻合,而且也能看出我們訓(xùn)練的點(diǎn)、目標(biāo)輸出點(diǎn)、檢測(cè)輸出點(diǎn)也基本吻合。除此之外,我們?cè)谡`差一欄也可以看出擬合曲線與八組數(shù)據(jù)的誤差在(±0.05)mg/m3之內(nèi),可以看出該模型擬合精度高,擬合效果好,通過(guò)此模型預(yù)測(cè)的結(jié)果具有一定的可靠性。把建立好的各組預(yù)測(cè)模型保存好后(“保持名稱(chēng)為‘net’”),在MATLAB命令行分別輸入sim(net,2021)來(lái)預(yù)測(cè)我國(guó)城市2021年細(xì)粒物(PM2.5)、可吸入顆粒物(PM10)、二氧化硫(SO2)、二氧化氮(NO2)、一氧化氮(CO)、臭氧(O2)6種城市污染物年均濃度并記錄在表2-7中。具體預(yù)測(cè)數(shù)據(jù)及原數(shù)據(jù)表2-7。
表2 PM2.5預(yù)測(cè)數(shù)據(jù)
表3 PM10預(yù)測(cè)數(shù)據(jù)
表4 O3預(yù)測(cè)數(shù)據(jù)
表5 SO2預(yù)測(cè)數(shù)據(jù)
表6 NO2預(yù)測(cè)數(shù)據(jù)
從表2-表7的預(yù)測(cè)數(shù)據(jù)與原數(shù)據(jù)相比較可以看出經(jīng)過(guò)該神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)后得出的數(shù)據(jù)具有高的精度,其誤差也較小,該神經(jīng)網(wǎng)絡(luò)模型對(duì)于預(yù)測(cè)城市細(xì)粒物(PM2.5)、可吸入顆粒物(PM10)、二氧化硫(SO2)等6項(xiàng)主要污染年均濃度具有一定可靠性。
表7 CO預(yù)測(cè)數(shù)據(jù)
通過(guò)MATLAB神經(jīng)網(wǎng)絡(luò)工具箱建模后訓(xùn)練圖像及預(yù)測(cè)結(jié)果可以得出結(jié)論:前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng)對(duì)于預(yù)測(cè)數(shù)據(jù)具有良好得性能,特別在處理大量數(shù)據(jù)、非線性系統(tǒng)時(shí)具有高效的并行處理能力與非線性映射能力。在本文中,利用前饋神經(jīng)網(wǎng)絡(luò)對(duì)我國(guó)城市6項(xiàng)主要空氣污染物年均濃度進(jìn)行有效預(yù)測(cè),數(shù)據(jù)結(jié)果也表明了該預(yù)測(cè)模型的可靠性與準(zhǔn)確性,其預(yù)測(cè)結(jié)果對(duì)于研究我國(guó)空氣污染物濃度變化趨勢(shì)也具有一定的作用。前饋神經(jīng)網(wǎng)絡(luò)系統(tǒng)具有結(jié)構(gòu)簡(jiǎn)單、易操作系統(tǒng)穩(wěn)定、處理數(shù)據(jù)快等特點(diǎn),只需要在MATLAB中編寫(xiě)程序或者直接調(diào)用數(shù)據(jù)網(wǎng)絡(luò)工具箱建立好神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu),然后再輸入數(shù)據(jù)訓(xùn)練模型,再調(diào)用神經(jīng)網(wǎng)絡(luò)模型就可對(duì)其他系統(tǒng)進(jìn)行預(yù)測(cè)[4]。隨著現(xiàn)代智能控制技術(shù)的大力發(fā)展,神經(jīng)網(wǎng)絡(luò)系統(tǒng)理論也會(huì)越來(lái)越完善,它也會(huì)在未來(lái)的社會(huì)中發(fā)揮越來(lái)越大的作用。