黎泉 關(guān)蔚蔚 李珍寶
1. 蘭州工業(yè)學院 甘肅 蘭州 730050;
2. 蘭州天泉信息科技有限公司 甘肅 蘭州 730030;
3. 蘭州理工大學 甘肅 蘭州 730050
?;泻怏w的排放和泄漏對空氣質(zhì)量和公共健康構(gòu)成嚴重威脅。例如,博帕爾的甲基異氰酸酯泄漏事故(1984年)造成上萬人死亡[1]。與此同時,工業(yè)區(qū)釋放的空氣污染物也對附近居民的生活產(chǎn)生了不利影響。因此近年來,氣化工廠爆炸事故、森林火災等引起的有毒氣體泄漏,已在各國頻繁發(fā)生,嚴重影響人民的生命、健康和財產(chǎn)安全。2019年,我國鹽城發(fā)生化工廠爆炸以及四川發(fā)生森林火災,都造成了大面積的泄漏和擴散,這不僅危害了人們的健康,也極大地阻礙了救援工作。因此,預測有毒氣體擴散規(guī)律以及提高災害應對能力具有十分重要的意義。
大氣擴散(ADS)模型被廣泛應用于預測氣體在空氣中的傳輸和擴散。已有許多有效的預測氣體擴散的模型。常規(guī)ADS模型可大致分為3種主要類型:高斯模型、拉格朗日隨機(LS)模型和計算流體動力學(CFD)模型。高斯模型是大氣擴散預測中應用最廣泛的模型。該模型只需要幾個輸入?yún)?shù),使用簡單的表達式且計算速度快。然而,高斯模型建立在幾乎不考慮地形條件的理想的色散環(huán)境上,因此,在某些復雜的環(huán)境條件下(例如具有復雜地形的城市區(qū)域),該模型不夠精確。LS模型采用隨機方法,將氣體輸送描述為一個含有多個顆粒的馬爾可夫過程。CFD模型可以靈活地表示復雜的幾何形狀,并且在城市有建筑物地形的氣體擴散計算中保持較高的精度[2],因此被廣泛用于各種各樣的城市地形中有毒氣體擴散的預測。然而,計算流體動力學有一個很大的缺點,它需要太長的時間來執(zhí)行必要的計算,有時甚至超過幾個小時。當突然發(fā)生事故時,利用CFD模型難以及時有效地指導救援工作,因此應急響應能力較差。
綜合上述問題,許多研究人員將機器學習(ML)模型引入到大氣擴散預測中,如人工神經(jīng)網(wǎng)絡(ANN)和支持向量回歸(SVR)。ML模型通常具有很好的預測輸入和輸出之間復雜關(guān)系的能力。這些模型通過一些預先確定的分散場景進行訓練,對于這些場景,往往能夠獲得相對較高的預測精度。此外,經(jīng)過訓練的ANN或SVR預測模型的計算速度相對較快。在各種類型的人工神經(jīng)網(wǎng)絡中,反向傳播(BP)網(wǎng)絡被最廣泛地用于預測大氣擴散。與其他人工神經(jīng)網(wǎng)絡(如徑向基函數(shù)(RBF)網(wǎng)絡)相比,BP網(wǎng)絡需要確定的超參數(shù)較少。因此,BP網(wǎng)絡相對容易建立和訓練。
然而,上述研究中的大多數(shù)ML模型都是直接基于一些原始監(jiān)測參數(shù)的輸入構(gòu)建的。有了這些輸入,ML模型通常會產(chǎn)生可接受的預測結(jié)果。然而,這種輸入?yún)?shù)的選擇可能會增加模型訓練的難度,從而降低預測精度,因為原始監(jiān)測參數(shù)與輸出(濃度)之間的關(guān)系通常非常復雜。因此,盡管在上述研究中成功地測試了這些ML模型,但通過更有效的輸入選擇,可以進一步改進它們。此外,現(xiàn)有的研究通常集中在一個特定的ML模型上,而不是在氣體擴散預測中比較不同的ML模型,并在模型選擇上提供一些指導。事實上,不同的ML模型在性能上有很大差異,例如在擬合和泛化能力上。此外,通過預先確定的場景進行訓練并通過特定案例進行測試,ML模型的性能在很大程度上取決于訓練集和測試集。因此,需要分析訓練集和測試集的大小對預測性能的影響,這一分析也有助于揭示ML模型在擬合和泛化能力上的差異。
在人工智能和數(shù)據(jù)科學學科的推動下,研究人員提出了基于歷史樣本(如神經(jīng)網(wǎng)絡和機器學習)的建模方法來發(fā)現(xiàn)預測的輸入輸出之間的復雜關(guān)系。其中一個新方法是氣體探測器、人工神經(jīng)網(wǎng)絡(ANN)和PHAST模型的集成模型。在該方法中只要對模型進行預先訓練,模型參數(shù)就可以直接用于瓦斯?jié)舛鹊念A測。
雖然上述研究中的神經(jīng)網(wǎng)絡模型在氣體擴散預測方面表現(xiàn)出了突出的能力,但仍存在一些不足之處,如對高濃度點的預測不準確、濃度值為負值等。近年來,在深度學習的熱潮下,許多學者開始研究基于深度學習的預測模型,發(fā)現(xiàn)這些模型能夠更好地描述數(shù)據(jù)特征之間的關(guān)系,在預測和分類方面具有更大的優(yōu)勢。
人工神經(jīng)網(wǎng)絡是色散預測中應用最廣泛的ML模型。由于其良好的擬合能力,人工神經(jīng)網(wǎng)絡能夠逼近復雜的非線性函數(shù)。在計算效率方面,經(jīng)過訓練的人工神經(jīng)網(wǎng)絡可以快速計算預測。本文建立了反向傳播擬合網(wǎng)絡來預測特征點的濃度。這種類型的網(wǎng)絡在色散預測研究中非常流行[3]。為了獲得更高的預測精度,這里應用了兩個隱藏層。網(wǎng)絡的輸入通常是與大氣擴散有關(guān)的參數(shù)。這些參數(shù)通常包括氣象參數(shù)、與關(guān)注點相關(guān)的參數(shù)和源項。應仔細選擇這些輸入,以獲得更好的性能。至于激活單元,所有隱藏層的激活函數(shù)都是“傳遞函數(shù)”,以提高收斂速度和求解精度?!皞鬟f函數(shù)”是一種S形函數(shù),其表達式為:,相比之下,輸出層(只有一個神經(jīng)元)的激活功能是用以輸出濃度的連續(xù)值的“線性傳遞函數(shù)”。
支持向量回歸(SVR)是為解決回歸問題而開發(fā)的支持向量機(SVM)的擴展。SVR的思想基于高維特征空間中的線性回歸函數(shù),輸入數(shù)據(jù)通過核函數(shù)映射。此外,SVR并沒有最小化訓練誤差,而是試圖最小化泛化誤差,從而獲得更好的泛化效果。給定一組訓練點,其中是一個輸入,而zi∈R1是目標輸出,SVR的標準式可表示為:
長-短期記憶網(wǎng)絡(LSTM)是一種特殊類型的遞歸神經(jīng)網(wǎng)絡(RNN)。傳統(tǒng)的人工神經(jīng)網(wǎng)絡(ANN)層與層之間是完全連接的,層內(nèi)部沒有連接,而RNN的隱藏層之間是連接的。ANN和RNN的結(jié)構(gòu)對比如圖1所示。人工神經(jīng)網(wǎng)絡的輸出是相互獨立的,RNN的輸出不僅受當前輸入特征的影響,而且還受前一時刻輸出的影響,因此RNN具有更好的時間序列性能。
圖1 基于LSTM的預測模型
本文以BP模型、RNN模型與LSTM模型的預測值與實驗結(jié)果真實值進行對比,接入如圖2所示。其中,紅色線條為預測值,黑色線條為實驗結(jié)果真實值。從圖2結(jié)果中可以看出:相對于BP模型和RNN模型,LSTM模型的預測結(jié)果更加接近實驗真實值。
圖2 不同模型的預測值與實驗結(jié)果真實值對比結(jié)果
本文比較分析了用于?;卸練怏w擴散的主要預測模型。尤其對基于人工智能的氣體擴散預測模型進行了分析:首先建立原始輸入?yún)?shù);然后為了提高預測精度,由原始監(jiān)測參數(shù)形成積分高斯參數(shù),并將其作為人工智能預測模型的輸入,使用典型的現(xiàn)場數(shù)據(jù)集對兩個不同輸入的預測模型進行了分析;最后還定性分析了訓練集規(guī)模對預測模型精確度的影響。