陳英義 方曉敏 梅思遠(yuǎn) 于輝輝 楊 玲
(1.中國(guó)農(nóng)業(yè)大學(xué)信息與電氣工程學(xué)院, 北京 100083; 2.農(nóng)業(yè)農(nóng)村部農(nóng)業(yè)信息獲取重點(diǎn)實(shí)驗(yàn)室, 北京 100083;3.國(guó)家數(shù)字漁業(yè)創(chuàng)新中心, 北京 100083; 4.北京林業(yè)大學(xué)信息學(xué)院, 北京 100083)
溶解氧含量是決定水產(chǎn)養(yǎng)殖產(chǎn)量的重要因素,它影響著水生物的生長(zhǎng)速度和養(yǎng)殖的飼料比,是決定養(yǎng)殖成功與否的重要指標(biāo)之一[1-2],過(guò)低或過(guò)高的溶解氧含量都會(huì)導(dǎo)致養(yǎng)殖生物死亡。由于它具有時(shí)序性、不穩(wěn)定性和非線性等特點(diǎn),且受多種因素影響,各因素之間存在復(fù)雜的耦合關(guān)系[3],所以難以建立具有普適性的模型,實(shí)現(xiàn)精準(zhǔn)預(yù)測(cè)。以多層感知機(jī)(Multi-layer perceptron, MLP)、支持向量機(jī)(Support vector machine, SVM)和誤差反向傳播神經(jīng)網(wǎng)絡(luò)(Back propagation neural network, BPNN)為代表的淺層機(jī)器學(xué)習(xí)方法具有極大的局限性[4-5],易引入冗余數(shù)據(jù),且針對(duì)復(fù)雜問(wèn)題的泛化能力受到一定的制約,尤其是在大數(shù)據(jù)的處理方面魯棒性差,不能完全學(xué)習(xí)到數(shù)據(jù)的本質(zhì)特征[6],無(wú)法滿(mǎn)足溶解氧預(yù)測(cè)的要求。
以長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM)為代表的深度學(xué)習(xí)方法因具備挖掘長(zhǎng)距離時(shí)序數(shù)據(jù)信息的能力而被廣泛應(yīng)用于各個(gè)領(lǐng)域[7]。宋剛等[8]利用 LSTM對(duì)不同類(lèi)型的股票股價(jià)進(jìn)行預(yù)測(cè),證明該模型能夠很好地處理具有長(zhǎng)期依賴(lài)關(guān)系、復(fù)雜的非線性問(wèn)題。滿(mǎn)春濤等[9]將3種影響因子的不同組合作為L(zhǎng)STM的輸入,研究其對(duì)交通流量預(yù)測(cè)精度的影響。若影響因子過(guò)多,該試驗(yàn)方法將過(guò)于繁雜,并且輸入越長(zhǎng),數(shù)據(jù)間包含的信息量就越大,傳統(tǒng)的LSTM模型在訓(xùn)練過(guò)程中會(huì)表現(xiàn)出明顯的不穩(wěn)定性,出現(xiàn)梯度消失的現(xiàn)象。因此,傳統(tǒng)的LSTM模型無(wú)法捕捉數(shù)據(jù)間長(zhǎng)期的相互依賴(lài)性。針對(duì)以上問(wèn)題,陸繼翔等[10]利用卷積神經(jīng)網(wǎng)絡(luò)(CNN)有效提取負(fù)荷、氣象、峰谷電價(jià)等之間的潛在關(guān)系,形成特征向量[11],以此向量構(gòu)造時(shí)序序列,輸入至LSTM中進(jìn)行短期負(fù)荷預(yù)測(cè),綜合CNN和LSTM的優(yōu)點(diǎn),提高了短期負(fù)荷的預(yù)測(cè)精度。SUN等[12]利用CNN-LSTM預(yù)測(cè)了受到各種氣候數(shù)據(jù)和環(huán)境數(shù)據(jù)影響的市縣級(jí)季中和季末大豆產(chǎn)量,均取得了較好的效果。CNN-LSTM模型在處理具有多種影響因素的非線性時(shí)序序列預(yù)測(cè)問(wèn)題時(shí)表現(xiàn)良好。目前,CNN-LSTM模型已廣泛應(yīng)用于語(yǔ)音識(shí)別和文本分類(lèi)領(lǐng)域[13-16],但在水產(chǎn)養(yǎng)殖領(lǐng)域的應(yīng)用較少。
本文提出混合WT-CNN-LSTM溶解氧預(yù)測(cè)模型,并將預(yù)測(cè)結(jié)果同門(mén)控神經(jīng)網(wǎng)絡(luò)(Gated recurrent unit, GRU)、LSTM、WT-GRU、WT-LSTM和WT-CNN-GRU 5種模型進(jìn)行對(duì)比,探索具有較高準(zhǔn)確度、適應(yīng)性和泛化性能的水產(chǎn)養(yǎng)殖溶解氧預(yù)測(cè)模型,解決傳統(tǒng)溶解氧預(yù)測(cè)模型易引入冗余數(shù)據(jù)、無(wú)法完全學(xué)習(xí)到數(shù)據(jù)的本質(zhì)特征、魯棒性差的問(wèn)題,以進(jìn)一步提高溶解氧長(zhǎng)期預(yù)測(cè)精度。
試驗(yàn)于浙江省湖州市吳興區(qū)八里店現(xiàn)代農(nóng)業(yè)綜合開(kāi)發(fā)區(qū)內(nèi)的浙江省淡水水產(chǎn)養(yǎng)殖研究所綜合試驗(yàn)基地進(jìn)行。所選池塘長(zhǎng)為30 m、寬為30 m、水深約1.2 m,養(yǎng)殖品種為雜交鲌魚(yú),池塘中央安裝了一個(gè)葉輪式增氧機(jī)。結(jié)合已有設(shè)備和池塘情況,將4個(gè)溶解氧在線監(jiān)測(cè)傳感器分別置于水深0.6 m處。為了避開(kāi)位于池塘中間的增氧機(jī),4個(gè)傳感器分別放置于圖1所示的位置。傳感器上傳的變量包括溶解氧含量和水溫。氣象站放置于池塘東北角,上傳的有效變量包括風(fēng)速、風(fēng)向和太陽(yáng)輻射,共3種氣象參數(shù)。試驗(yàn)時(shí)間為2017年7月15日—8月2日,由于夏季天氣多變,試驗(yàn)期間包含了晴天、大風(fēng)、陰雨、雷電、多云等多種復(fù)雜天氣情況。
圖1 池塘傳感器分布圖Fig.1 Distribution map of sensors in pond
數(shù)據(jù)的真實(shí)性和可靠性是模型預(yù)測(cè)性能的決定性因素,而水產(chǎn)養(yǎng)殖生物的排泄物、飼料殘余、藻類(lèi)等因素都會(huì)導(dǎo)致水體污濁[17],試驗(yàn)所使用的傳感器在水體中放置時(shí)間過(guò)長(zhǎng)會(huì)被污染物附著,從而導(dǎo)致采集的數(shù)據(jù)略有偏差,雖然定時(shí)清洗,但也無(wú)法避免少量噪聲數(shù)據(jù)。另外,一些難以控制的系統(tǒng)誤差、隨機(jī)誤差與人為誤差等也會(huì)導(dǎo)致水質(zhì)數(shù)據(jù)和氣象數(shù)據(jù)存在噪聲污染。因此,在訓(xùn)練模型前,對(duì)數(shù)據(jù)進(jìn)行清洗降噪是必不可少的步驟。
本文采用具有自適應(yīng)性的小波變換[18]對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以實(shí)現(xiàn)在保留有效信息的前提下減少噪聲[19],盡可能維持溶解氧含量數(shù)據(jù)的時(shí)序性、連續(xù)性和可靠性。小波變換能夠通過(guò)不同分辨率對(duì)時(shí)間序列進(jìn)行分解,將原始信號(hào)分解成不同頻率的子信號(hào),使得原始信號(hào)的時(shí)序概況和細(xì)節(jié)部分盡可能多地被發(fā)現(xiàn),因此成為當(dāng)前分析時(shí)間序列的有效工具[20]。其流程如圖2所示。
圖2 小波變換流程圖Fig.2 Process of wavelet transform
具體步驟為:
(1)小波分解:根據(jù)不同變量的數(shù)據(jù)特征選擇最佳小波函數(shù)對(duì)含噪信號(hào)進(jìn)行分解,本文使用了常見(jiàn)的haar、coif、sym、db 4種小波。
(2)閾值量化:為分解后每一層的高頻系數(shù)選擇合適的閾值,本文采用的是全局閾值。
(3)小波重構(gòu):根據(jù)第1層至第N層的高頻系數(shù)和第N層的低頻系數(shù)進(jìn)行小波重構(gòu),最終實(shí)現(xiàn)降噪。
(4)降噪效果評(píng)價(jià):一般來(lái)說(shuō),信號(hào)的信噪比(Signal to noise ratio, SNR)與估計(jì)信號(hào)同原始信號(hào)的均方根誤差(Root mean squared error, RMSE)是評(píng)價(jià)降噪效果的標(biāo)準(zhǔn),SNR越大,RMSE越小,降噪效果越好。
2.2.1卷積神經(jīng)網(wǎng)絡(luò)
針對(duì)溶解氧影響因素多,且影響因子間存在復(fù)雜的耦合關(guān)系這一特點(diǎn),本文使用 CNN 來(lái)挖掘輸入變量間的潛在信息。它采用局部連接和共享權(quán)值的方式,通過(guò)卷積層和池化層交替使用來(lái)獲取原始數(shù)據(jù)的有效表征,自動(dòng)提取原始數(shù)據(jù)的有用特征形成特征向量[21-22]。構(gòu)建卷積層和池化層的具體步驟為:
(1)確定輸入樣本尺寸,初始化卷積層和池化層中的卷積核尺寸和數(shù)量。
(2)將降噪后的數(shù)據(jù)輸入CNN模型。
(3)通過(guò)改變池化層中卷積核的尺寸,對(duì)比最終結(jié)果,選擇池化層中卷積核的最佳尺寸。
2.2.2長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)
LSTM網(wǎng)絡(luò)是循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent neural network, RNN)的改進(jìn)版本。標(biāo)準(zhǔn)的RNN結(jié)構(gòu)中只有一個(gè)神經(jīng)元、一個(gè)tanh層進(jìn)行重復(fù)學(xué)習(xí),而LSTM引入了“門(mén)”的結(jié)構(gòu)來(lái)去除或者增加信息到細(xì)胞狀態(tài)的能力[23-24],具體架構(gòu)如圖3所示。
圖3 LSTM結(jié)構(gòu)圖Fig.3 Structure diagram of LSTM
σ層輸出0~1之間的數(shù)值,描述每個(gè)部分可以通過(guò)的量。LSTM擁有3個(gè)門(mén),即輸入門(mén)、輸出門(mén)和遺忘門(mén),來(lái)保護(hù)和控制細(xì)胞狀態(tài)。遺忘門(mén)決定從“細(xì)胞”中丟棄的信息,輸入門(mén)決定將要更新的值,輸入門(mén)和遺忘門(mén)協(xié)同更新細(xì)胞的信息編碼。LSTM模型相應(yīng)計(jì)算公式為
ft=σ(Wf[ht-1,xt]+bf)
(1)
it=σ(Wi[ht-1,xt]+bi)
(2)
Ct=tanh(WC[ht-1,xt]+bC)
(3)
C′t=ftC′t-1+itCt
(4)
ot=σ(Wo[ht-1,xt]+bo)
(5)
ht=ottanh(C′t)
(6)
式中it、ft、ot——輸入門(mén)、遺忘門(mén)、輸出門(mén)
xt——t時(shí)刻的輸入
σ(·)——sigmoid激活函數(shù)
tanh(·)——雙曲正切激活函數(shù)
Wi、Wf、Wo——輸入門(mén)、遺忘門(mén)、輸出門(mén)權(quán)重
WC——候選向量權(quán)重
bi、bf、bo——輸入門(mén)、遺忘門(mén)、輸出門(mén)偏置
bC——候選向量偏置
Ct——t時(shí)刻的候選向量
C′t——t時(shí)刻的候選向量更新值
ht、ht-1——t、t-1時(shí)間點(diǎn)模型的所有輸出
2.2.3CNN-LSTM模型構(gòu)建
CNN多用于特征工程,而LSTM在時(shí)序序列上作用效果顯著。本文結(jié)合兩類(lèi)模型的各自特性,在LSTM網(wǎng)絡(luò)的隱藏層之前加入卷積層和池化層,如圖4所示。將溶解氧和另外4個(gè)影響因子串聯(lián)成向量表示,形成了一個(gè)全新的時(shí)序序列輸入模型,在卷積層和池化層進(jìn)行特征提取形成特征向量之后進(jìn)入LSTM模型。由于本文所使用的數(shù)據(jù)集時(shí)間間隔為5 min,則預(yù)測(cè)2 h后的溶解氧含量的步長(zhǎng)即為24,具體步驟為:
圖4 CNN-LSTM結(jié)構(gòu)圖Fig.4 Structure diagram of CNN-LSTM
(1)首先將訓(xùn)練集輸入原始的LSTM模型進(jìn)行訓(xùn)練,找出最適宜的隱藏層節(jié)點(diǎn)數(shù)。
(2)根據(jù)輸入樣本尺寸,在LSTM的隱藏層之前加入卷積層和池化層,初始化卷積層和池化層中的卷積核尺寸和數(shù)量。
(3)通過(guò)改變池化層中卷積核的尺寸,對(duì)比最終結(jié)果,選擇池化層中卷積核的最佳尺寸,從而完成模型構(gòu)建。
水產(chǎn)養(yǎng)殖溶解氧含量受多種因素影響且隨時(shí)間呈非線性變化,為了捕捉因素間的長(zhǎng)期依懶性,提高預(yù)測(cè)精度,結(jié)合以上算法,本文提出了基于WT-CNN-LSTM的水產(chǎn)養(yǎng)殖溶解氧預(yù)測(cè)模型,具體預(yù)測(cè)流程如圖5所示。
圖5 WT-CNN-LSTM流程圖Fig.5 Flowchart of WT-CNN-LSTM
使用該模型進(jìn)行水產(chǎn)養(yǎng)殖溶解氧預(yù)測(cè)的步驟為:
(1)設(shè)計(jì)試驗(yàn)方案,采集溶解氧含量、水溫以及風(fēng)速、風(fēng)向、太陽(yáng)輻射3種氣象因子,總計(jì)5種參數(shù)作為數(shù)據(jù)集。
(2)依據(jù)該數(shù)據(jù)集中不同參數(shù)的特性選擇合適的小波函數(shù)進(jìn)行降噪處理。
(3)對(duì)數(shù)據(jù)集進(jìn)行標(biāo)準(zhǔn)化,初步按照7∶3的比例分配訓(xùn)練集和測(cè)試集。
(4)初始化模型參數(shù),將訓(xùn)練集輸入至CNN-LSTM模型中,模型自身不斷進(jìn)行特征提取和參數(shù)優(yōu)化,直至損失函數(shù)最小模型準(zhǔn)確率最高或達(dá)到既定訓(xùn)練輪數(shù)時(shí)停止。
(5)輸入測(cè)試集測(cè)試模型的性能,通過(guò)模型的評(píng)價(jià)指標(biāo),與其他模型進(jìn)行對(duì)比,得出最優(yōu)的水產(chǎn)養(yǎng)殖溶解氧預(yù)測(cè)模型。
為了克服RNN無(wú)法對(duì)信息進(jìn)行精細(xì)化處理的問(wèn)題[25],HOCHREATER和SCHMIDHUBER在1997年提出了RNN的變體LSTM,而GRU[26]則是LSTM的一個(gè)變體。LSTM的重復(fù)網(wǎng)絡(luò)模塊的結(jié)構(gòu)很復(fù)雜,它實(shí)現(xiàn)了3個(gè)門(mén)計(jì)算,即遺忘門(mén)、輸入門(mén)和輸出門(mén),而GRU模型只包含2個(gè)門(mén),如圖6所示,分別為更新門(mén)(zt)和重置門(mén)(rt),結(jié)構(gòu)更加簡(jiǎn)單。
圖6 GRU結(jié)構(gòu)圖Fig.6 Structure diagram of GRU
更新門(mén)用于控制前一時(shí)刻的狀態(tài)信息被帶入到當(dāng)前狀態(tài)中的程度,更新門(mén)的值越大說(shuō)明前一時(shí)刻的狀態(tài)信息帶入越多。重置門(mén)用于控制忽略前一時(shí)刻的狀態(tài)信息的程度,重置門(mén)的值越小說(shuō)明忽略得越多。GRU與LSTM十分相似,理論上來(lái)說(shuō),GRU比LSTM少一個(gè)門(mén),這樣就少幾個(gè)矩陣乘法,在訓(xùn)練數(shù)據(jù)很大的情況下GRU能節(jié)省很多時(shí)間,但二者效果需要依不同應(yīng)用場(chǎng)景而定。因此,本文將CNN-GRU、GRU、LSTM作為CNN-LSTM的對(duì)比模型,對(duì)模型的預(yù)測(cè)效果進(jìn)行比較,最終得出最佳水產(chǎn)養(yǎng)殖溶解氧預(yù)測(cè)模型。
為了使每個(gè)變量的降噪效果達(dá)到最好,使用haar、coif、sym10和db5 4種小波函數(shù)分別對(duì)5種變量進(jìn)行降噪處理,通過(guò)對(duì)比評(píng)價(jià)指標(biāo)SNR和RMSE,尋找每個(gè)變量的最佳降噪小波函數(shù),結(jié)果如表1所示。試驗(yàn)中,使用ddencmp函數(shù)獲取序列在降噪過(guò)程中的默認(rèn)閾值,此閾值為全局軟閾值。
遵循SNR越高,RMSE越小,小波降噪效果越好的原則,依據(jù)表1得出的結(jié)果,最終確定的小波函數(shù)組合為:風(fēng)向使用haar,風(fēng)速和太陽(yáng)輻射使用coif,溶解氧含量使用sym10,水溫使用db5,降噪后的結(jié)果如圖7所示。降噪后得到一個(gè)大小為9 681×5的數(shù)據(jù)集。
圖7 基于組合小波函數(shù)的5種變量降噪的結(jié)果Fig.7 Results of noise reduction of five variables by combined wavelet function
表1 5種變量的降噪效果對(duì)比Tab.1 Comparison of noise reduction effects of five variables
降噪后的數(shù)據(jù)集按照7∶3的比例分為訓(xùn)練集和測(cè)試集后,將訓(xùn)練集輸入傳統(tǒng)的LSTM模型中,設(shè)置不同的隱藏層節(jié)點(diǎn)數(shù)對(duì)比模型結(jié)果,如表2所示。模型的評(píng)價(jià)指標(biāo)選擇了平均絕對(duì)誤差(Mean absolute error, MAE)、均方根誤差(RMSE)和決定系數(shù)(R2)。R2越接近1,表明模型對(duì)數(shù)據(jù)擬合的效果越好。
從表2可以看出,當(dāng)隱藏層節(jié)點(diǎn)數(shù)為1 000時(shí),傳統(tǒng)LSTM模型性能最好。然后,將卷積層和池化層添加至模型中,輸入訓(xùn)練集,設(shè)置每次迭代時(shí)輸入的樣本數(shù)量為20,即batch_size 為20;由于采集數(shù)據(jù)的時(shí)間間隔為5 min,需要預(yù)測(cè)的是2 h后水產(chǎn)養(yǎng)殖溶解氧,因此本文設(shè)置每個(gè)輸入樣本的大小為24×5,即time_step 為24;卷積核個(gè)數(shù)設(shè)置為64個(gè),即filters為64,且卷積核的大小都為5×1。對(duì)于每個(gè)輸入樣本,經(jīng)過(guò)64個(gè)卷積核卷積之后樣本從24×5變?yōu)?4×1×64。本文選擇的池化方式為最大池化,池化層尺寸對(duì)比結(jié)果如表3所示。
表2 隱藏層節(jié)點(diǎn)數(shù)對(duì)比Tab.2 Comparison of number of nodes in hidden layer
表3 池化層參數(shù)對(duì)比Tab.3 Comparison of parameters of pooling layer
從表3可以得出,當(dāng)池化層尺寸為3時(shí),模型擬合效果最好,因此,CNN-LSTM整個(gè)模型網(wǎng)絡(luò)的結(jié)構(gòu)如圖8所示。
圖8 CNN-LSTM模型網(wǎng)絡(luò)結(jié)構(gòu)圖Fig.8 Structure diagram of CNN-LSTM network
模型構(gòu)建完成后,為了研究訓(xùn)練集的尺寸對(duì)模型性能的影響,使用不同尺寸的訓(xùn)練集對(duì)模型進(jìn)行如表4所示的試驗(yàn)。從表中可以看出,當(dāng)訓(xùn)練集尺寸為8 500時(shí),模型的性能最好。
圖9 6個(gè)模型的預(yù)測(cè)結(jié)果Fig.9 Prediction results of six models
表4 訓(xùn)練集尺寸對(duì)比Tab.4 Comparison of size of training set
建立的WT-CNN-LSTM預(yù)測(cè)模型以及5個(gè)對(duì)比模型(WT-CNN-GRU、WT-LSTM、WT-GRU、LSTM、GRU)的性能對(duì)比如表5所示,6個(gè)模型的預(yù)測(cè)結(jié)果如圖9所示,圖中縱坐標(biāo)表示的是將溶解氧含量標(biāo)準(zhǔn)化處理后的數(shù)值??梢钥闯觯瑢?duì)LSTM模型來(lái)說(shuō),經(jīng)過(guò)WT進(jìn)行數(shù)據(jù)降噪后,模型的MAE和RMSE降低了11.86%和14.14%,R2提高了2.52%;再經(jīng)過(guò)CNN對(duì)數(shù)據(jù)進(jìn)行特征提取后,模型的MAE和RMSE降低了19.30%和8.03%,R2提高了2.03%,提高了模型的預(yù)測(cè)準(zhǔn)確率。對(duì)GRU模型來(lái)說(shuō),WT使得模型的MAE和RMSE降低了14.42%和17.68%,R2提高了4.15%;然后加入CNN使得模型的MAE和RMSE降低了20.11%和16.41%,R2提高了1.94%。結(jié)果表明,6種模型中,WT-CNN-LSTM的性能最優(yōu),其MAE、RMSE和R2分別為0.138、0.229(比傳統(tǒng)LSTM模型分別優(yōu)化了28.87%、21.03%)和0.954,對(duì)數(shù)據(jù)的擬合效果(R2)依次比其他5種模型高0.85%、2.03%、2.80%、4.61%和7.07%。因此,本文提出的WT-CNN-LSTM模型能夠很好地避免噪聲影響,充分挖掘數(shù)據(jù)間的隱藏信息,較理想地預(yù)測(cè)2 h后的水產(chǎn)養(yǎng)殖溶解氧含量,為水產(chǎn)養(yǎng)殖溶解氧含量的預(yù)測(cè)預(yù)警提供了可靠的決策依據(jù)。
表5 模型性能對(duì)比Tab.5 Comparison of model performance
以上結(jié)果表明,本文提出的WT-CNN-LSTM表現(xiàn)出良好的預(yù)測(cè)性能。在未來(lái)的研究中,可以從以下3方面入手,進(jìn)一步改進(jìn)水產(chǎn)養(yǎng)殖溶解氧預(yù)測(cè)模型:①由于溶解氧含量受氣象因素的影響較大,本次試驗(yàn)時(shí)間較短,難以保證氣候情況的多樣性,因此,下一步還需要設(shè)計(jì)長(zhǎng)期或具有周期性的試驗(yàn)方案,構(gòu)建更完善的數(shù)據(jù)集,增強(qiáng)模型的泛化能力。②由于溶解氧在不同季節(jié)的變化趨勢(shì)不同,對(duì)預(yù)測(cè)模型的準(zhǔn)確率也有一定影響[27],因此,采集數(shù)據(jù)時(shí)可分季節(jié)采集。同時(shí),可為每個(gè)傳感器配備專(zhuān)用的自動(dòng)清洗裝備,從根源處減少冗余數(shù)據(jù)。③與CNN和LSTM同屬于第三代人工智能神經(jīng)網(wǎng)絡(luò)的脈沖神經(jīng)網(wǎng)絡(luò)(Spiking neural network, SNN)[28]被認(rèn)為是能接近仿生機(jī)制的神經(jīng)網(wǎng)絡(luò)模型,其模型基礎(chǔ)和運(yùn)算方式與哺乳動(dòng)物腦更為接近。SNN在特征工程上也被廣泛應(yīng)用,并取得了較理想的效果[29-31]。未來(lái)可探索SNN在水產(chǎn)養(yǎng)殖溶解氧預(yù)測(cè)中的可行性。
為了解決溶解氧影響因子過(guò)多、預(yù)測(cè)困難的問(wèn)題,提出了WT-CNN-LSTM預(yù)測(cè)模型,進(jìn)一步挖掘因子間的長(zhǎng)期依賴(lài)性,提高預(yù)測(cè)精度。針對(duì)水產(chǎn)養(yǎng)殖溶解氧的時(shí)序性和非線性,選擇廣泛應(yīng)用于時(shí)間序列預(yù)測(cè)、且性能優(yōu)越的長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)(LSTM),預(yù)測(cè)2 h后的溶解氧含量;針對(duì)數(shù)據(jù)采集過(guò)程中存在的由環(huán)境因素、人為因素和系統(tǒng)因素產(chǎn)生的噪聲數(shù)據(jù),提出了基于不同小波函數(shù)組合的小波變換(WT)方法,盡可能減少數(shù)據(jù)集中的噪聲,為建立精準(zhǔn)預(yù)測(cè)模型提供可靠數(shù)據(jù)支持。結(jié)果表明,降噪后,模型對(duì)數(shù)據(jù)的擬合精度 (R2)提高了2.52%;使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)挖掘并保存各變量與水產(chǎn)養(yǎng)殖溶解氧之間的潛在信息,將模型的擬合精度提高了2.03%, WT-CNN-LSTM模型預(yù)測(cè)效果良好,其MAE、RMSE和R2分別為0.138、0.229和0.954,比傳統(tǒng)LSTM模型分別優(yōu)化了28.87%、21.03%和4.61%。