• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      一種基于CEEMDAN-LSTM組合的水體溶解氧預(yù)測(cè)方法*

      2021-08-24 08:40:58黃健明駱德漢
      關(guān)鍵詞:溶解氧分量預(yù)測(cè)

      李 港 ,幸 興 ,黃健明 ,駱德漢

      (1.廣東工業(yè)大學(xué) 信息工程學(xué)院,廣東 廣州 510006;2.廣東瑞德智能科技股份有限公司,廣東 佛山528000;3.廣州華匠科技有限公司,廣東 佛山 511457)

      0 引言

      溶解氧(Dissolved Oxygen,DO)在水體中的含量能夠反映出水體的污染程度、生物的生長(zhǎng)狀況,是衡量水質(zhì)優(yōu)劣的重要指標(biāo)之一。而水質(zhì)的好壞直接影響水生生物的生長(zhǎng)及其產(chǎn)品品質(zhì)。所以,對(duì)DO進(jìn)行精準(zhǔn)監(jiān)測(cè)、預(yù)測(cè)和預(yù)防是非常有必要的。水產(chǎn)養(yǎng)殖池塘中的水是一個(gè)開放、非線性、動(dòng)態(tài)、復(fù)雜的系統(tǒng),水質(zhì)很容易受到物理、化學(xué)、生物和人類活動(dòng)等許多因子的影響。所以,運(yùn)用現(xiàn)代化信息技術(shù)尋找適合水質(zhì)監(jiān)測(cè)和預(yù)測(cè)的方法變得尤為迫切[1]。

      水質(zhì)參數(shù)的預(yù)測(cè)本質(zhì)上是時(shí)間序列預(yù)測(cè)問題,目前,國(guó)內(nèi)外已有多種建模方法被用于預(yù)測(cè)時(shí)間序列,并取得了不錯(cuò)的效果。文獻(xiàn)[2]設(shè)計(jì)了一種ARIMA與神經(jīng)網(wǎng)絡(luò)相結(jié)合的水質(zhì)參數(shù)預(yù)測(cè)混合模型。文獻(xiàn)[3]針對(duì)傳統(tǒng)溶解氧預(yù)測(cè)方法預(yù)測(cè)精度低和魯棒性差的問題,提出了一種基于改進(jìn)粒子群算法和最小二乘支持向量回歸模型相結(jié)合的溶解氧預(yù)測(cè)模型。文獻(xiàn)[4]為了提高水產(chǎn)養(yǎng)殖過程中的溶解氧預(yù)測(cè)精度,提出了基于PCA和LSTM的水產(chǎn)養(yǎng)殖溶解氧預(yù)測(cè)模型。文獻(xiàn)[5]針對(duì)水培養(yǎng)殖系統(tǒng)的溶解氧預(yù)測(cè)問題,提出了一種基于遺傳算法和模糊神經(jīng)網(wǎng)絡(luò)的溶解氧預(yù)測(cè)模型。文獻(xiàn)[6]為了提高不同水質(zhì)參數(shù)預(yù)測(cè)模型的精度和穩(wěn)定性,同時(shí)處理長(zhǎng)期依賴問題,提出了一種基于改進(jìn)的Dempster/Shafer(D-S)證據(jù)理論和三種RNN的集成預(yù)測(cè)方法。

      現(xiàn)代智能算法取得了良好預(yù)測(cè)效果,但溶解氧序列具有非線性和非平穩(wěn)性的特點(diǎn),勢(shì)必會(huì)影響上述方法的預(yù)測(cè)性能,所以對(duì)溶解氧序列進(jìn)行降噪處理十分必要。CEEMDAN分解獲得的各IMF(Intrinsic Mode Functions)相對(duì)簡(jiǎn)單且相互獨(dú)立,為充分提取IMF子序列的波動(dòng)特征提供了有利條件,進(jìn)而提升預(yù)測(cè)建模精度。另一方面,LSTM通過引入門控單元系統(tǒng),解決了傳統(tǒng)RNN模型訓(xùn)練中梯度爆炸和梯度消失問題,在提取序列數(shù)據(jù)中的長(zhǎng)期依賴關(guān)系方面極具優(yōu)勢(shì),可利用前期“記憶”為當(dāng)前決策提供支持,是當(dāng)前復(fù)雜高維時(shí)序數(shù)據(jù)分析中最成功的非線性建模方法之一,也是近年來數(shù)據(jù)建模領(lǐng)域的研究熱點(diǎn)。

      本文在CEEMDAN和LSTM的基礎(chǔ)上,提出了一種混合模型,該模型首先通過CEEMDAN對(duì)溶解氧時(shí)間序列進(jìn)行預(yù)處理,然后通過LSTM對(duì)其分量進(jìn)行預(yù)測(cè)。最后的預(yù)測(cè)是通過整合各分量預(yù)測(cè)結(jié)果得到的。用所提出的CEEMDAN-LSTM組合預(yù)測(cè)模型、LSTM模型、ARIMA模型、GRU模型以及 CEEMDAN-GRU組合預(yù)測(cè)模型在實(shí)驗(yàn)數(shù)據(jù)中進(jìn)行了預(yù)測(cè),實(shí)驗(yàn)結(jié)果表明,與其他模型相比,本文提出的模型在溶解氧含量預(yù)測(cè)方面具有很大的優(yōu)越性。

      1 基本理論

      1.1 CEEMDAN理論

      CEEMDAN的提出,來源于對(duì)EMD(經(jīng)驗(yàn)?zāi)B(tài)分解)算法的改進(jìn)。EMD是由美籍華人 Huang[7]提出的一種新型方法,用來處理具有非線性、非平穩(wěn)特征的信號(hào)。它能夠較好地對(duì)不同尺度下的特征信息進(jìn)行提取,不再需要提前進(jìn)行分析和研究,根據(jù)信號(hào)本身的特征就能進(jìn)行自適應(yīng)分解。但EMD分解過程中,會(huì)出現(xiàn)干擾最終分解效果的模態(tài)(頻率)混疊現(xiàn)象。

      而 EEMD(總體經(jīng)驗(yàn)?zāi)B(tài)分解)算法的出現(xiàn),通過在分解過程中加入服從正態(tài)均勻分布的白噪聲,克服了EMD模態(tài)混疊的缺陷,保證了分解的有效性[8]。但是在這個(gè)過程中引入的噪聲在多次平均后仍可能影響到子序列,最后影響預(yù)測(cè)精度。為了平滑干擾脈沖,CEEMDAN算法引入了自適應(yīng)白噪聲,使得分解過程更加完整有效,也降低了重構(gòu)誤差[9]。具體到本文的溶解氧含量預(yù)測(cè)問題中,分解步驟如下:

      (1)在原始溶解氧序列 Do(t)中添加不同幅值 ?的白噪聲wi(t),得到用來進(jìn)行分解的信號(hào),可以用式(1)表示:

      (3)用式(3)求得第一個(gè)剩余分量 r1(t),對(duì)于信號(hào)r1(t)+α1EMD1(wi(t))利用 EMD算法進(jìn)行進(jìn)一步分解,得到第二個(gè)IMF分量,如式(4)所示。定義操作符EMDj(·)為經(jīng)過 EMD分解后的第j個(gè) IMF分量。

      (5)重復(fù)步驟(4),直到剩余分量 rk(t)滿足以下停止條件:

      其中 T為溶解氧序列 Do(t)的長(zhǎng)度,閾值 S按照經(jīng)驗(yàn)設(shè)置為0.2[10]。最后得到分解完成的信號(hào),描述為如式(8)所示:

      1.2 LSTM預(yù)測(cè)模型

      由于傳統(tǒng)RNN存在著梯度消失和爆炸問題,Hochreiter[11]提出了一種遞歸神經(jīng)網(wǎng)絡(luò)(RNNs)的改進(jìn)形式,很好地解決了這個(gè)問題,這就是LSTM(Long Short-Term Memory),非常適合處理和預(yù)測(cè)長(zhǎng)時(shí)間序列,其結(jié)構(gòu)如圖1所示。

      圖1 LSTM結(jié)構(gòu)圖

      LSTM體系結(jié)構(gòu)的巧妙之處就在于通過增加遺忘門、更新門、輸入門和輸出門,使得自循環(huán)的權(quán)重是可以變化的;以及增加了一個(gè)稱為cell的存儲(chǔ)器單元,通過對(duì)這些門的操作,信息可以存儲(chǔ)在單元中、寫入單元或從單元中讀取。具體計(jì)算方程如下:

      式中,Wx和 bx,x∈(f,u,i,o) 分別是各自門的權(quán)值矩陣和偏置;上一單元的輸出yt-1和當(dāng)前單元的輸入xt集中作為L(zhǎng)STM的輸入;Ct-1和Ct分別表示先前和當(dāng)前狀態(tài);σ表示sigmoid激活函數(shù),tanh表示hyperbolic tangent激活函數(shù)。

      2 CEEMDAN-LSTM模型

      2.1 組合預(yù)測(cè)方法框架

      以往的研究發(fā)現(xiàn),CEEMDAN方法在時(shí)間序列分解方面具有優(yōu)勢(shì),而LSTM方法在長(zhǎng)時(shí)間序列預(yù)測(cè)方面具有優(yōu)勢(shì)[12]。因此,本文將這兩種方法結(jié)合起來,提出了一種用于溶解氧時(shí)間序列預(yù)測(cè)的CEEMDAN-LSTM組合方法,包括分解、分量預(yù)測(cè)和集成3個(gè)過程,具體流程圖如圖2所示。

      圖2 CEEMDAN-LSTM流程圖

      在第一階段,使用CEEMDAN方法將原始溶解氧時(shí)間序列分解為n+1個(gè)分量,包括n個(gè)IMF和一個(gè)剩余分量。

      在第二階段,利用長(zhǎng)短期記憶(LSTM)建立各分量的預(yù)測(cè)模型。然后,使用建立的模型對(duì)每個(gè)分量進(jìn)行預(yù)測(cè),最終得到不同頻率分量的預(yù)測(cè)結(jié)果。

      在第三階段,將所有分量的預(yù)測(cè)結(jié)果匯總為最終結(jié)果。雖然有許多方法可以聚合所有預(yù)測(cè)結(jié)果,但在本研究中,以相等的權(quán)重將所有分量的預(yù)測(cè)結(jié)果相加。

      2.2 模型評(píng)價(jià)指標(biāo)

      本文所述CEEMDAN-LSTM模型的訓(xùn)練和測(cè)試,都是在經(jīng)過預(yù)處理之后的溶解氧時(shí)間序列中進(jìn)行的,為了對(duì)模型進(jìn)行更加清晰的評(píng)估,選取了一些指標(biāo)進(jìn)行評(píng)價(jià),分別是均方根誤差(RMSE)、平均絕對(duì)誤差(MAE)、平均絕對(duì)百分誤差(MAPE)和擬合優(yōu)度(R2),計(jì)算公式如下:

      3 實(shí)驗(yàn)及結(jié)果分析

      3.1 實(shí)驗(yàn)準(zhǔn)備

      3.1.1 數(shù)據(jù)集

      實(shí)驗(yàn)數(shù)據(jù)來源于某河流上的水質(zhì)實(shí)時(shí)監(jiān)測(cè)站,采集的數(shù)據(jù)類型包括耗氧量、氨氮化合物、PH值和溶解氧。監(jiān)測(cè)頻率為每天一次,共計(jì)3 000天的數(shù)據(jù),單位為mg/L,本文用到的只有溶解氧含量這一數(shù)據(jù)。

      觀察數(shù)據(jù)集中的數(shù)據(jù)發(fā)現(xiàn)沒有缺省值和零值,所以不需要進(jìn)行插值處理,在數(shù)據(jù)預(yù)處理過程中主要考慮異常值檢測(cè)。本文首先對(duì)數(shù)據(jù)進(jìn)行歸一化處理,之 后采用了孤立森 林(Isolation Forest,iForest)算法進(jìn)行異常值檢測(cè)[13]。iForest不再基于距離或密度來檢測(cè)異常,消除了之前的主要計(jì)算成本;具有線性時(shí)間復(fù)雜度、低常數(shù)和低內(nèi)存需求;其擴(kuò)展能力也使它適用于超大數(shù)據(jù)量和高維問題。

      本文設(shè)置異常比例為0.025,最后得到檢測(cè)結(jié)果如圖3所示。

      從圖3中發(fā)現(xiàn)總共找出70個(gè)異常值,對(duì)于這些異常值采用剔除的方式進(jìn)行處理,處理完的數(shù)據(jù)規(guī)格為 2 930×1。

      圖3 異常值檢測(cè)結(jié)果圖

      3.1.2 對(duì)比模型

      為了驗(yàn)證所提出模型的優(yōu)越性,除單個(gè)LSTM模型外,本文還與以下幾種模型及它們與CEEMDAN算法的復(fù)合模型進(jìn)行了對(duì)比:

      (1)ARIMA模型:ARIMA(自回歸移動(dòng)平均模型)是由Box和Jenkins提出,其使用要求時(shí)間序列必須是穩(wěn)定的,如果不是,則需要將非平穩(wěn)時(shí)間序列通過差分法轉(zhuǎn)化為平穩(wěn)時(shí)間序列,然后將因變量?jī)H對(duì)它的滯后值以及隨機(jī)誤差項(xiàng)的現(xiàn)值和滯后值進(jìn)行回歸,建立模型[14]。

      (2)GRU模型:和 LSTM 一樣,GRU(Gated Recurrent Unit)是傳統(tǒng)RNN的變體,但它具有比LSTM更簡(jiǎn)單的結(jié)構(gòu),而且更容易計(jì)算和訓(xùn)練[15]。不過它們都能有效獲取到長(zhǎng)序列之間的關(guān)聯(lián),并緩解傳統(tǒng)RNN存在的梯度消失或爆炸問題。

      (3)CEEMDAN-GRU模型:為了驗(yàn)證同為RNN變體的GRU和CEEMDAN算法組合的性能,將本文所提出的CEEMDAN-LSTM模型中用到LSTM的部分替換為GRU,就得到了CEEMDAN-GRU模型。

      3.1.3 平臺(tái)和環(huán)境參數(shù)

      本文所使用計(jì)算機(jī)的配置如下:處理器為Intel Core i5-8265U,CPU頻率為1.6 GHz;內(nèi)存為 8.00 GB;操作系統(tǒng)為Windows 10(64 bit);程序設(shè)計(jì)語言為Ppython 3.8;集成開發(fā)環(huán)境為PyCharm Community Edition 2020.2.3。

      本文模型仿真在Keras框架的基礎(chǔ)上實(shí)現(xiàn)。模型訓(xùn)練的過程是使損失函數(shù)最小化,因此在定義損失函數(shù)后,設(shè)置合適的優(yōu)化器來解決參數(shù)優(yōu)化問題對(duì)實(shí)驗(yàn)結(jié)果非常重要。目前的深度學(xué)習(xí)庫(kù)中有許多優(yōu)化算法可供選擇,如隨機(jī)梯度下降(SGD)、自適應(yīng)矩估計(jì)(Adam)和均方根傳遞(RMSProp)。理想的優(yōu)化算法不僅可以利用訓(xùn)練樣本盡快得到最優(yōu)模型,而且可以防止過度擬合。為了選擇最佳的優(yōu)化器,本文進(jìn)行了對(duì)比實(shí)驗(yàn),比較了不同優(yōu)化器在訓(xùn)練LSTM模型時(shí)的均方誤差(MSE)損失。通過對(duì)比實(shí)驗(yàn)發(fā)現(xiàn)Adam方法是最好的,Adam作為一種有效的隨機(jī)優(yōu)化方法得到了廣泛的應(yīng)用。因此,在訓(xùn)練模型的過程中采用Adam優(yōu)化算法,可以更快地收斂到好的結(jié)果。對(duì)于激活函數(shù),由于網(wǎng)絡(luò)結(jié)構(gòu)不是很復(fù)雜,選擇默認(rèn)的tanh作為激活函數(shù)。在本研究中,LSTM的輸入是 2 484×6×1的數(shù)據(jù)。

      3.2 試驗(yàn)結(jié)果分析

      3.2.1 仿真分析

      首先,對(duì)于經(jīng)過預(yù)處理之后的原始溶解氧時(shí)間序列 Do(t),用上文所提到的CEEMDAN方法進(jìn)行分解。如圖4所示,是溶解氧時(shí)間序列經(jīng)過CEEMDAN分解后的IMF和剩余分量。

      圖4 CEEMDAN分解結(jié)果

      圖4中第一行所示即為數(shù)據(jù)集原始溶解氧時(shí)間序列Do(t),具有高度的非線性和非平穩(wěn)性;其下方的IMF0~IMF6為7個(gè)IMF分量,波動(dòng)頻率逐漸降低;最下面的r為剩余分量。

      分別對(duì)所得分量建立LSTM預(yù)測(cè)模型。對(duì)于每個(gè)分量,取前85%的數(shù)據(jù)作為訓(xùn)練集,后15%的數(shù)據(jù)作為測(cè)試集,數(shù)據(jù)規(guī)格分別為2 490×1和 440×1。對(duì)于劃分好的數(shù)據(jù)集,根據(jù)所構(gòu)建的網(wǎng)絡(luò)模型結(jié)構(gòu)進(jìn)行數(shù)據(jù)重構(gòu),本文設(shè)置回望窗口為6,即以前6個(gè)數(shù)據(jù)預(yù)測(cè)第6+1個(gè)數(shù)據(jù),重構(gòu)完的訓(xùn)練集輸入和輸出規(guī)格分別為2 484×6×1和 2 484×1, 測(cè)試集輸入和輸出規(guī)格分別為 434×6×1和 434×1。模型在訓(xùn)練集上進(jìn)行訓(xùn)練,完成之后保存模型并在測(cè)試集上進(jìn)行檢測(cè)。

      由此,得到了各分量預(yù)測(cè)結(jié)果。接下來,對(duì)所有預(yù)測(cè)結(jié)果進(jìn)行疊加求和,就得到原始變量的最終預(yù)測(cè)結(jié)果。

      溶解氧時(shí)間序列在CEEMDAN-LSTM模型的預(yù)測(cè)下,得到的最終預(yù)測(cè)結(jié)果如圖5所示。圖中實(shí)線是真實(shí)數(shù)據(jù),虛線是模型的預(yù)測(cè)數(shù)據(jù)。

      圖5 CEEMDAN-LSTM模型預(yù)測(cè)結(jié)果

      根據(jù)模型評(píng)價(jià)指標(biāo),所提出的CEEMDAN-LSTM模型的均方根誤差(RMSE)為 0.024 5,平均絕對(duì)誤差(MAE)為 0.016 6,平均絕對(duì)百分誤差(MAPE)為0.065 2,擬合優(yōu)度(R2)為 0.985 6。不管是從圖像上還是從數(shù)據(jù)上,都可以看出模型很好地預(yù)測(cè)了數(shù)據(jù)的走向,使用CEEMDAN-LSTM預(yù)測(cè)模型可以很好地利用前期輸入的數(shù)據(jù)預(yù)測(cè)之后一段時(shí)間的數(shù)據(jù)。

      3.2.2 模型對(duì)比分析

      為了研究該方法的性能,本文和其他方法進(jìn)行了對(duì)比,預(yù)測(cè)結(jié)果曲線對(duì)比如圖6所示。此外,還對(duì)各預(yù)測(cè)模型的預(yù)測(cè)值和真實(shí)值進(jìn)行了嚴(yán)格的定量分析,具體統(tǒng)計(jì)結(jié)果如表1所示。

      圖6 各模型預(yù)測(cè)結(jié)果對(duì)比圖

      表1 各模型評(píng)價(jià)指標(biāo)對(duì)比

      從圖6可以看出,ARIMA模型可以預(yù)測(cè)出數(shù)據(jù)走向,但是存在很大的時(shí)差,其余模型都有較好的預(yù)測(cè)效果,但是在圖中無法肉眼辨別優(yōu)劣,所以結(jié)合表1中的模型評(píng)價(jià)參數(shù)進(jìn)行比較。其中,從RMSE、MAE和MAPE這三個(gè)評(píng)價(jià)指標(biāo)來看,其數(shù)值越接近于0,效果越好。另外,根據(jù)評(píng)價(jià)指標(biāo) R2來看,其數(shù)值越接近于1,則模型效果越好。綜合上述四個(gè)評(píng)價(jià)指標(biāo)考慮,可以得出結(jié)論,本文提出的CEEMDAN-LSTM模型在水體溶解氧含量預(yù)測(cè)問題上具有更好的表現(xiàn)。

      4 結(jié)論

      為了提高水體溶解氧時(shí)間序列的預(yù)測(cè)性能,提出了一種CEEMDAN和LSTM相結(jié)合的混合預(yù)測(cè)模型CEEMDAN-LSTM。該方法利用CEEMDAN將一個(gè)復(fù)雜的溶解氧時(shí)間序列分解為多個(gè)分量,然后利用基于LSTM的預(yù)測(cè)模型分別對(duì)每個(gè)分量進(jìn)行預(yù)測(cè),最終的預(yù)測(cè)結(jié)果由各分量的預(yù)測(cè)結(jié)果以相等的權(quán)值累加得到。實(shí)驗(yàn)結(jié)果表明,該組合模型的預(yù)測(cè)效果優(yōu)于本文所對(duì)比的其他預(yù)測(cè)模型,“分解與集成”框架可以顯著提高溶解氧時(shí)間序列預(yù)測(cè)的性能。CEEMDAN參數(shù)的選擇對(duì)預(yù)測(cè)結(jié)果有顯著影響,因此,如何在時(shí)間序列分解過程中有效地選擇合理的參數(shù),將是今后研究的重點(diǎn)。

      猜你喜歡
      溶解氧分量預(yù)測(cè)
      無可預(yù)測(cè)
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      帽子的分量
      淺析水中溶解氧的測(cè)定
      一物千斤
      智族GQ(2019年9期)2019-10-28 08:16:21
      論《哈姆雷特》中良心的分量
      分量
      污水活性污泥處理過程的溶解氧增益調(diào)度控制
      城市河道洲灘對(duì)水流溶解氧分布的影響
      淄博市| 虞城县| 花莲市| 山西省| 静海县| 项城市| 巴楚县| 铁力市| 泌阳县| 罗江县| 化州市| 喀喇| 称多县| 深州市| 台南市| 阿合奇县| 巴马| 普格县| 保靖县| 淮滨县| 汽车| 永宁县| 新津县| 南平市| 黄浦区| 阿拉善左旗| 武强县| 湘阴县| 丹阳市| 塔城市| 长垣县| 休宁县| 合作市| 蓬莱市| 旬阳县| 长岛县| 龙山县| 长寿区| 定兴县| 万载县| 纳雍县|