李付蘭
(寧夏環(huán)境科學(xué)研究院(有限責(zé)任公司)寧夏銀川 750011)
近年來,銀川市大氣污染呈現(xiàn)復(fù)合型污染特征,顆粒物(PM10)、臭氧(O3)污染問題凸顯,增加了空氣污染防治的難度。銀川市于2017 年建立了空氣質(zhì)量多模式預(yù)報(bào)系統(tǒng),包括1 個(gè)統(tǒng)計(jì)模式和4 個(gè)數(shù)值模式,數(shù)值模式系統(tǒng)包括CMAQ、NAQPMS、WRF-Chem 和CAMx 模式[1]。由于WRF 模擬的氣象場具有不確定性,排放清單的分配也無法達(dá)到非常精細(xì)且與實(shí)際排放情況完全相符,數(shù)值模式系統(tǒng)對(duì)一些具有復(fù)雜化學(xué)反應(yīng)機(jī)制的污染物生成機(jī)理不太清晰,導(dǎo)致預(yù)報(bào)結(jié)果準(zhǔn)確性不夠,尤其是對(duì)O3濃度的預(yù)報(bào)數(shù)值偏差更大。目前,常用的大氣污染物預(yù)測方法主要包括灰色GM(1,1)預(yù)測、多元回歸預(yù)測、支持向量機(jī)SVM、長短期記憶網(wǎng)絡(luò)(LongShort-TermMemory,LSTM)預(yù)測、RNN 預(yù)測等模型[2],對(duì)其優(yōu)缺點(diǎn)進(jìn)行分析,如表1 所示。
表1 不同大氣污染物預(yù)測方法的比較
針對(duì)上述問題,本文基于氣象臺(tái)空氣質(zhì)量預(yù)報(bào)數(shù)據(jù)及實(shí)測數(shù)據(jù),采用Takagi-Sugeno 模糊模型為支撐,構(gòu)建基于Fuzzy-BLS 的大氣污染物濃度預(yù)測模型,對(duì)《環(huán)境空氣質(zhì)量標(biāo)準(zhǔn)》(GB 3095—2012)明確的6 種常規(guī)大氣污染物日平均濃度進(jìn)行預(yù)測,并對(duì)預(yù)測精度進(jìn)行評(píng)估。
引入模糊推理系統(tǒng),通過If-Then 規(guī)則對(duì)氣象數(shù)據(jù)和污染物數(shù)據(jù)中所蘊(yùn)含的專家經(jīng)驗(yàn)進(jìn)行提取、表述,以達(dá)到更好的預(yù)測效果。這里針對(duì)缺少物理信息模型的情況,采用自適應(yīng)神經(jīng)模糊推理系統(tǒng)(ANFIS),但該模型在特征維數(shù)以及輸出結(jié)果等方面存在一定的局限性,為了保留模糊推理系統(tǒng)的優(yōu)勢,又使得模型便于本題目求解,引入基于寬度學(xué)習(xí)的Takagi-Sugeno模糊模型,稱為Fuzzy-BLS[3]。Fuzzy-BLS 模型原理如圖1 所示。
圖1 Fuzzy-BLS 模型原理圖
模型主要包含數(shù)據(jù)輸入層,映射節(jié)點(diǎn)、增強(qiáng)節(jié)點(diǎn)層,輸出結(jié)果層3 層。數(shù)據(jù)輸入后,通過Takagi-Sugeno 模糊子系統(tǒng)進(jìn)行初步計(jì)算,得到映射節(jié)點(diǎn),同時(shí)將模糊子系統(tǒng)結(jié)果輸入到增強(qiáng)層中,構(gòu)建增強(qiáng)節(jié)點(diǎn),將映射節(jié)點(diǎn)和增強(qiáng)節(jié)點(diǎn)通過嶺回歸求解偽逆的方式確定每個(gè)節(jié)點(diǎn)的權(quán)重,最終輸出結(jié)果。具體流程如下。
在Takagi-Sugeno 模糊模型中,通常使用If-Then 規(guī)則,即式(1)。
用數(shù)學(xué)公式表示為式(2)。
其中參數(shù)可見式(5)~(7)。
得到增強(qiáng)節(jié)點(diǎn)輸出,同時(shí)將Zi再進(jìn)行處理,得到映射節(jié)點(diǎn)輸出,即式(10)。
通過嶺回歸算法求解偽逆得到W,見式(14)和式(15)。
通過求解上述模型,即可得到大氣污染物SO2、NO2、PM10、PM2.5、CO 的單日濃度值和O3的最大8 h 滑動(dòng)平均濃度。
對(duì)PM2.5、NO2、SO2、CO、PM10一次污染物進(jìn)行預(yù)測,輸入數(shù)據(jù)主要是各污染物的預(yù)報(bào)濃度和實(shí)測濃度,經(jīng)過模型訓(xùn)練與迭代,獲得優(yōu)化后的一次污染物濃度預(yù)測值。模型結(jié)構(gòu)如圖2所示。
圖2 基于Fuzzy-BLS 的一次污染物濃度預(yù)測模型
由于O3屬于二次污染物,要考慮各種氣象條件以及NOx的影響,故輸入數(shù)據(jù)主要是O3的預(yù)報(bào)濃度、氣象因子、NO2的預(yù)報(bào)數(shù)據(jù)。以實(shí)測的O3濃度,經(jīng)過模型訓(xùn)練與迭代,獲得優(yōu)化后的O3濃度預(yù)測值。對(duì)于氣象因子選擇,本文通過PCA 降維法和相關(guān)性分析法進(jìn)行氣象因子的篩選,最終篩選出溫度、濕度、風(fēng)速、太陽輻射及雨量等因子。模型結(jié)構(gòu)如圖3 所示。
圖3 基于Fuzzy-BLS 的二次污染物濃度預(yù)測模型
為了有效評(píng)價(jià)模型的性能,本文使用2 種模型評(píng)價(jià)方法,分別是MSE 和R2。MSE 可以估計(jì)訓(xùn)練出的預(yù)測值與實(shí)際的濃度值之差的平方的期望值,MSE 的值越小,說明污染物濃度預(yù)測的精確度越高。R2是指回歸平方和與總離差平方和的一個(gè)比值,體現(xiàn)的是總離差平方和中能夠由回歸平方和來解釋的比例,數(shù)值越大,模型就越準(zhǔn)確,回歸成效就越明顯[4]。其計(jì)算如式(16)和式(17)。
選取銀川市2020 年1 月1 日—12 月31 日空氣質(zhì)量預(yù)報(bào)數(shù)據(jù)和實(shí)測數(shù)據(jù),利用建立的Fuzzy-BLS 模型,預(yù)測6 種大氣污染物的日平均濃度。同時(shí)將每種污染物的氣象臺(tái)預(yù)報(bào)濃度和模型預(yù)測濃度與實(shí)測濃度分別相減,計(jì)算二者的絕對(duì)誤差[5-6],如圖4 所示。
圖4 6 種大氣污染物預(yù)測濃度絕對(duì)誤差圖
利用6 種大氣污染物的氣象臺(tái)預(yù)報(bào)濃度和Fuzzy-BLS 模型預(yù)測濃度,計(jì)算2 種預(yù)測方法的精度,計(jì)算結(jié)果如表2 所示。
表2 2 種預(yù)測模型的精度對(duì)比表
由圖4、表2 分析可知:①本文建立的基于Fuzzy-BLS 的大氣污染物濃度預(yù)測模型預(yù)測效果較好,精度最高的是PM10和SO2,分別為0.988 和0.980,最低的是O3,預(yù)測精度是0.932,達(dá)到了較高精度;②PM10和O3的MSE 數(shù)值較大,是因?yàn)檫@2 種污染物的原始數(shù)值比較大,但精度數(shù)值都在可接受的范圍內(nèi);③對(duì)比氣象臺(tái)預(yù)報(bào)模型與本模型的預(yù)測濃度絕對(duì)誤差曲線,能夠顯著看出本模型預(yù)測精度更好,預(yù)測誤差更小。經(jīng)計(jì)算,對(duì)于一次污染物(PM10、SO2、NO2、PM2.5、CO),MSE指標(biāo)平均下降了71.7%,R2指標(biāo)提高了10.4%;對(duì)于二次污染物臭氧,MSE 指標(biāo)下降了78.0%,R2指標(biāo)提高了26.9%。
本文建立的基于Fuzzy-BLS 的大氣污染物濃度預(yù)測模型擅長處理具有時(shí)序性和非線性的數(shù)據(jù),對(duì)氣象及污染物數(shù)據(jù)具有較強(qiáng)的適用性,對(duì)多種污染物濃度預(yù)測精度較高,是一種可行的預(yù)測手段,在解決實(shí)際環(huán)境問題的過程中能夠輔助決策。同時(shí),在建立模型過程中,考慮到了多種氣象因素對(duì)大氣污染物濃度的影響,使建立的污染物濃度預(yù)測模型很大程度上能反應(yīng)實(shí)際的大氣情況,對(duì)于環(huán)境空氣質(zhì)量監(jiān)測及環(huán)境保護(hù)具有較大的參考價(jià)值,實(shí)用性和可推廣性較強(qiáng)。