• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于LSTM-NeuralProphet 模型的城市需水預(yù)測(cè)方法研究

      2023-09-22 01:07:08范怡靜
      中國(guó)農(nóng)村水利水電 2023年9期
      關(guān)鍵詞:需水需水量預(yù)測(cè)

      范怡靜,劉 真,苑 佳,劉 心

      (河北工程大學(xué)信息與電氣工程學(xué)院,河北 邯鄲 056038)

      0 引 言

      全球超過(guò)一半的城市面臨水資源供需失衡的問(wèn)題,水資源的不均衡分布、水質(zhì)污染和城市擴(kuò)張等因素而導(dǎo)致的城市水資源利用率低的問(wèn)題越來(lái)越嚴(yán)峻。城市水資源預(yù)測(cè)是保障水資源供需平衡,提高水資源利用率的關(guān)鍵技術(shù)之一。但城市需水量受人口、地域、天氣、經(jīng)濟(jì)發(fā)展等諸多因素影響,具有較強(qiáng)的非線性和不確定性,城市需水的精準(zhǔn)預(yù)測(cè)具有一定難度,受到學(xué)術(shù)界和實(shí)際應(yīng)用領(lǐng)域的廣泛關(guān)注[1]。從預(yù)測(cè)尺度出發(fā),需水預(yù)測(cè)可分為三大類:短期預(yù)測(cè)(每小時(shí)至每月預(yù)測(cè))、中期預(yù)測(cè)(1~10 年以內(nèi)的年度預(yù)測(cè))和長(zhǎng)期預(yù)測(cè)(超過(guò)10 年),中期和長(zhǎng)期預(yù)測(cè)有助于制定有關(guān)投資規(guī)劃和產(chǎn)能擴(kuò)張的戰(zhàn)術(shù)決策,短期預(yù)測(cè)影響水務(wù)公司的運(yùn)營(yíng)決策[2]。與長(zhǎng)期預(yù)測(cè)在制定戰(zhàn)略規(guī)劃方面具有重要意義相比,短期預(yù)測(cè)對(duì)于水務(wù)公司來(lái)說(shuō)同樣至關(guān)重要,短期需水預(yù)測(cè)能夠影響運(yùn)營(yíng)決策,對(duì)于城市供水保障、水資源利用和可持續(xù)發(fā)展具有重要意義。因此,提高短期城市需水預(yù)測(cè)的準(zhǔn)確性至關(guān)重要。

      目前存在多種不同的方法用于短期城市需水預(yù)測(cè),常用的方法有遺傳神經(jīng)網(wǎng)絡(luò)模型[3]、BP(Back Propagation)神經(jīng)網(wǎng)絡(luò)[4]、支持向量機(jī)模型[5]、灰色模型[6]和ARIMA 模型(Autoregressive Integrated Moving Average model)[7]等,基于城市用水?dāng)?shù)據(jù)的時(shí)間序列特性預(yù)測(cè)未來(lái)的需水?dāng)?shù)據(jù)。Chang H 等[7]使用逐步多元回歸和ARIMA 模型分析了季節(jié)性趨勢(shì)下降的城市需水量與氣候變量之間的關(guān)系對(duì)需水量進(jìn)行預(yù)測(cè)。劉鑫[8]提出K-Means聚類算法(K-Means clustering algorithm)和季節(jié)性滑動(dòng)平均自回歸模型耦合方法預(yù)測(cè)2020 年1-8 月水廠及行政區(qū)的逐月供水?dāng)?shù)據(jù)。以上兩種方法均采用時(shí)序模型,這類模型對(duì)數(shù)據(jù)的節(jié)日效應(yīng)和變化趨勢(shì)點(diǎn)的適應(yīng)性較差,而被用于數(shù)據(jù)預(yù)測(cè)的Neural-Prophet 模型[9]在時(shí)間序列數(shù)據(jù)預(yù)測(cè)具有很強(qiáng)的優(yōu)勢(shì),能夠出色地適應(yīng)數(shù)據(jù)的節(jié)日效應(yīng)和變化趨勢(shì)點(diǎn)。但長(zhǎng)期歷史數(shù)據(jù)中的隱藏特征不止這些,LSTM(Long Short Term Memory networks)在學(xué)習(xí)和挖掘長(zhǎng)期歷史數(shù)據(jù)中的隱藏非線性和非周期性等特征有獨(dú)特的優(yōu)勢(shì)[10],郭冠呈[11]建立了雙向長(zhǎng)短時(shí)記憶循環(huán)神經(jīng)網(wǎng)絡(luò)模型預(yù)測(cè)常州市某DMA 入口15 min 的水量。董云城[12]開展了基于ARIMA-LSTM 的城市供水量組合預(yù)測(cè)模型研究。

      目前已實(shí)現(xiàn)的短期城市需水預(yù)測(cè)技術(shù)大多集中在固定時(shí)隙預(yù)測(cè)上,無(wú)法適應(yīng)時(shí)隙的變化,而城市需水量受不同季節(jié)影響,需水量的峰值、波動(dòng)不同。因此,本文對(duì)四季24 h 時(shí)間分辨率和夏季15 min 時(shí)間分辨率兩種不同時(shí)隙的城市需水量進(jìn)行預(yù)測(cè),提出了一種將NeuralProphet(NP)與長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)相結(jié)合的LSTM-NeuralProphet模型,該模型將NeuralProphet和LSTM的優(yōu)點(diǎn)結(jié)合起來(lái),NeuralProphet模型考慮數(shù)據(jù)的周期性、節(jié)日效應(yīng)和變化趨勢(shì)點(diǎn),LSTM 模型學(xué)習(xí)長(zhǎng)期歷史數(shù)據(jù)的特征。本研究使用Anomaly Transformer 模型對(duì)異常值檢測(cè),并分段擬合校正數(shù)據(jù),采用主成分分析法對(duì)需水影響因子進(jìn)行分析,校正后的數(shù)據(jù)輸入NeuralProphet 模型和LSTM 模型中產(chǎn)生對(duì)應(yīng)的輸出特征,將這些輸出特征和需水影響因子輸入到AutoML,在AutoML 的標(biāo)準(zhǔn)模型分析中選取3 個(gè)效果最好的模型作為Stacking模型的基學(xué)習(xí)器,得到最終的預(yù)測(cè)結(jié)果。

      1 城市短期需水預(yù)測(cè)模型

      為了提高不同時(shí)隙粒度的城市需水量預(yù)測(cè)精度,本文提出了一種將NeuralProphet(NP)與長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(LSTM)相結(jié)合的LSTM-NeuralProphet 模型。需水預(yù)測(cè)模型主要分為以下3 個(gè)模塊:數(shù)據(jù)預(yù)處理部分基于Anomaly-Transformer 模型進(jìn)行異常值檢測(cè),采用分段曲線擬合對(duì)異常值校正,通過(guò)主成分分析法分析影響因子;預(yù)測(cè)模型部分使用了LSTM 和Optune 優(yōu)化后的NeuralProphet 預(yù)測(cè)模型;模型耦合部分通過(guò)安全網(wǎng)機(jī)制過(guò)濾輸入特征,采用AutoML 選取Stacking 模型的基學(xué)習(xí)器,設(shè)計(jì)的需水預(yù)測(cè)模型總體架構(gòu)如圖1所示。

      圖1 需水預(yù)測(cè)模型總體架構(gòu)圖Fig.1 Overall structure diagram of water demand prediction model

      1.1 基于Anomaly Transformer 和PCA 的 數(shù) 據(jù)預(yù)處理

      1.1.1 異常值檢測(cè)——Anomaly Transformer模型

      Anomaly Transformer 模型[13]是一種基于自監(jiān)督學(xué)習(xí)的時(shí)序異常檢測(cè)模型,如圖2 所示,利用全新的關(guān)聯(lián)視角,建立時(shí)間序列中的每個(gè)數(shù)據(jù)點(diǎn)與整個(gè)序列之間的聯(lián)系。這種關(guān)聯(lián)蘊(yùn)含著豐富的時(shí)序模式,具有信息含量。該模型采用Anomaly-Attention 和前饋層的交替堆疊的結(jié)構(gòu),增強(qiáng)了模型從多層次特征中學(xué)習(xí)潛在時(shí)序關(guān)聯(lián)的能力。Anomaly-Attention 由prior-association 和series-association 兩個(gè)分支組成,其中prior-association 使用可學(xué)習(xí)的高斯核來(lái)計(jì)算相對(duì)時(shí)間距離,而series-association分支則從原始序列中學(xué)習(xí)關(guān)聯(lián)。在每一層的Anomaly-Attention中,模型通過(guò)query、key、value和可學(xué)習(xí)的scale參數(shù)矩陣來(lái)計(jì)算注意力權(quán)重,進(jìn)而得到每個(gè)數(shù)據(jù)點(diǎn)的潛在聯(lián)系。通過(guò)這種方式,Anomaly Transformer 模型可以更加準(zhǔn)確地檢測(cè)到城市需水時(shí)序中的異常點(diǎn)。由于設(shè)備出錯(cuò)等原因,城市24 h需水量和15 min 需水量檢測(cè)常出現(xiàn)異常值,因此,采用Anomaly Transformer模型進(jìn)行異常值檢測(cè)。

      圖2 Anomaly Transformer框架圖Fig.2 Anomaly Transformer frame diagram

      1.1.2 影響因子篩選——主成分分析

      PCA(Principal Component Analysis)是通過(guò)線性變換將原始數(shù)據(jù)映射到新的坐標(biāo)系中,使得新坐標(biāo)系下的方差較大,從而找到原始數(shù)據(jù)的主要方向,將原始數(shù)據(jù)進(jìn)行中心化處理,計(jì)算出協(xié)方差矩陣,并對(duì)其進(jìn)行特征值分解,分解后得到原始數(shù)據(jù)在新坐標(biāo)系下的投影矩陣(主成分),每個(gè)主成分代表原始數(shù)據(jù)的一個(gè)方向,同時(shí)對(duì)應(yīng)著一個(gè)特征值,特征值越大表示對(duì)應(yīng)的主成分包含的信息越多。與傳統(tǒng)的相關(guān)性分析相比,在處理屬于高維數(shù)據(jù)的氣象影響因子,解決避免模型過(guò)擬合問(wèn)題中,PCA可有效簡(jiǎn)化分析過(guò)程,提高城市需水預(yù)測(cè)準(zhǔn)確性,消除自變量之間的多重共線性。

      1.2 基于LSTM-NeuralProphet 的城市需水預(yù)測(cè)模型

      1.2.1 長(zhǎng)短時(shí)記憶神經(jīng)網(wǎng)絡(luò)

      LSTM(Long Short-Term Memory)一種常用的循環(huán)神經(jīng)網(wǎng)絡(luò),針對(duì)傳統(tǒng)RNN模型在訓(xùn)練過(guò)程中容易出現(xiàn)的梯度消失和梯度爆炸問(wèn)題[14],LSTM 采用門控結(jié)構(gòu),提高模型預(yù)測(cè)精度。LSTM 模型的核心是LSTM 單元(LSTM cell),LSTM 單元的輸入由當(dāng)前時(shí)刻的輸入、上一個(gè)時(shí)刻的輸出和上一個(gè)時(shí)刻的單元狀態(tài)共同決定,根據(jù)門控機(jī)制來(lái)決定輸入、遺忘和輸出的權(quán)重,更新單元狀態(tài)和輸出。

      式中:xt是LSTM 模型在時(shí)刻t的輸入;ht-1是LSTM 模型在時(shí)刻t-1的輸出;ct-1是LSTM模型在時(shí)刻t-1的細(xì)胞狀態(tài);it、ft和ot分別是當(dāng)前時(shí)刻的輸入門、遺忘門和輸出門的輸出;σ( )是sigmoid函數(shù);⊙表示按元素相乘;W和b是模型的參數(shù)。

      最后,LSTM 模型在時(shí)刻t的輸出為ht,同時(shí)ct也會(huì)作為下一個(gè)時(shí)刻的單元狀態(tài)輸入到模型中。由于城市需水?dāng)?shù)據(jù)存在明顯的時(shí)間序列特征,利用 LSTM 神經(jīng)網(wǎng)絡(luò)挖掘數(shù)據(jù)中時(shí)間序列的變化規(guī)律。

      1.2.2 NeuralProphet預(yù)測(cè)模型原理

      NeuralProphet 模型[9]是FbProphet 的改進(jìn)模型,將深度學(xué)習(xí)項(xiàng)集成到滯后數(shù)據(jù)擬合的方程中,模型的超參數(shù)可以自動(dòng)調(diào)整,具備更好的預(yù)測(cè)性能。但是,模型里regulation 調(diào)整會(huì)直接影響整體分布,為了避免過(guò)擬合問(wèn)題并且提高模型的泛化能力,需要進(jìn)行自動(dòng)化參數(shù)調(diào)優(yōu)。相比于Grid Search 等其他超參數(shù)調(diào)優(yōu)框架,Optuna 尋優(yōu)速度更快,更加適合城市需水?dāng)?shù)據(jù)集。

      圖3 NeuralProphet原理圖Fig.3 NeuralProphet schematic

      NeuralProphet模型的預(yù)測(cè)過(guò)程如下:

      式中:T(t)代表趨勢(shì)部分,表示時(shí)間序列數(shù)據(jù)中的長(zhǎng)期(上升或下降)趨勢(shì),使用線性或非線性函數(shù)來(lái)建模;S(t)代表季節(jié)性部分,表示時(shí)間序列數(shù)據(jù)中的短期(每周、每月或每季度)的周期性變化;E(t)代表特殊事件,表示時(shí)間序列數(shù)據(jù)中的異常值;F(t)代表未來(lái)回歸項(xiàng),表示時(shí)間序列數(shù)據(jù)中由于特定的節(jié)假日而引起的變化;A(t)代表自回歸部分,表示時(shí)間序列數(shù)據(jù)中的歷史數(shù)據(jù)對(duì)當(dāng)前時(shí)間的影響;L(t)代表滯后回歸項(xiàng),是t時(shí)刻外生變量滯后觀測(cè)的回歸效應(yīng)。綜合這些部分,NeuralProphet 模型可以很好地捕捉城市需水?dāng)?shù)據(jù)中的各種影響因素,從而實(shí)現(xiàn)更加準(zhǔn)確的預(yù)測(cè)。

      1.2.3 LSTM-NeuralProphet模型

      LSTM-NeuralProphet模型是一種基于神經(jīng)網(wǎng)絡(luò)的時(shí)間序列預(yù)測(cè)模型,如圖4所示。該模型考慮到兩個(gè)不同時(shí)隙:較短的時(shí)間尺度(15 min)和較長(zhǎng)的時(shí)間尺度(24 h),將校正后的兩個(gè)不同時(shí)隙的數(shù)據(jù)集分別輸入到NeuralProphet 模型和LSTM 模型中產(chǎn)生對(duì)應(yīng)的輸出特征f1N、f1L和f2N、f2L。采 用Pycaret 庫(kù)實(shí)現(xiàn)AutoML,將f1N、f1L和f2N、f2L輸入到AutoML,在AutoML 的標(biāo)準(zhǔn)模型分析中選取3 個(gè)效果最好的模型作為Stacking 模型的基學(xué)習(xí)器,得到最終的預(yù)測(cè)結(jié)果,同時(shí),為了提高LSTM-NeuralProphet模型的準(zhǔn)確性,AutoML 中還使用主成分分析選取額外的回歸因子。

      圖4 LSTM-NeuralProphet模型框架圖Fig.4 LSTM-NeuralProphet model frame diagram

      為了確保該方法的準(zhǔn)確性引入安全網(wǎng)機(jī)制,在LSTMNeuralProphet 模型中加入了一個(gè)安全網(wǎng)機(jī)制,選取兩種方法平均誤差的2%為安全網(wǎng)機(jī)制的閾值。在需水預(yù)測(cè)過(guò)程中,判斷兩種方法所預(yù)測(cè)結(jié)果之間的平均誤差是否大于安全機(jī)制的閾值,若其中一種方法在準(zhǔn)確性方面的表現(xiàn)明顯低于另一種方法,那么表現(xiàn)較差的模型將被排除在LSTM-NeuralProphet 模型之外。

      1.3 超參數(shù)調(diào)優(yōu)

      利用城市需水?dāng)?shù)據(jù)集訓(xùn)練不同的模型,將所提出的LSTMNeuralProphet 模型與NeuralProphet 模型、LSTM 模型、BP 模型進(jìn)行比較。其中NeuralProphet 模型的超參數(shù)可以自動(dòng)調(diào)整,以獲得最佳性能。同時(shí)也存在一個(gè)缺點(diǎn),模型里regulation 調(diào)整會(huì)直接影響整體分布,為了避免過(guò)擬合并且提高模型的泛化能力,自動(dòng)化參數(shù)調(diào)優(yōu)至關(guān)重要。相比于Grid Search 等其他超參數(shù)調(diào)優(yōu)框架,Optuna尋優(yōu)速度更快,更加適合城市需水?dāng)?shù)據(jù)集。

      Optuna 的原理基于貝葉斯優(yōu)化算法,主要包含了3 個(gè)核心組件:Trial,Study 和Sampler。Trial 對(duì)超參數(shù)組合進(jìn)行評(píng)估;Study 管理和控制Trials 的流程;TPE 算法不斷根據(jù)超參數(shù)的選擇有可能達(dá)到最優(yōu)的超參數(shù)組合;Sampler選取下一個(gè)超參數(shù)組合的實(shí)際過(guò)程。這個(gè)過(guò)程中,Optuna 采用貝葉斯優(yōu)化算法提高了超參數(shù)搜索效率,從而更加高效地構(gòu)建高性能的機(jī)器學(xué)習(xí)模型。通過(guò)Optune 超參數(shù)優(yōu)化NeuralProphet,選擇隱藏層數(shù)為2,搜索空間設(shè)置如表1 所示。對(duì)于LSTM 模型,如果增加隱藏單元的個(gè)數(shù),性能會(huì)有所提高,但訓(xùn)練模型的時(shí)間也會(huì)增加。綜合預(yù)測(cè)性能和成本,設(shè)置隱藏單元的個(gè)數(shù)為200,對(duì)LSTM 模型進(jìn)行訓(xùn)練,以得到兩種場(chǎng)景下最優(yōu)結(jié)果。

      表1 Optune的搜索區(qū)間Tab.1 Optune′s search interval

      2 需水?dāng)?shù)據(jù)來(lái)源及分析

      2.1 數(shù)據(jù)來(lái)源

      北京市和邢臺(tái)市都處于暖溫帶半濕潤(rùn)大陸性氣候區(qū),冬季寒冷干燥,夏季炎熱潮濕,春秋兩季氣候溫和,四季分明,如何合理充分利用水資源,對(duì)社會(huì)經(jīng)濟(jì)及城市的發(fā)展具有重要的影響[15]。因此,選取以24 h為單位的北京市水務(wù)局(2016年1月1日至2022年9月30日)的原始用水?dāng)?shù)據(jù)和以15 min為單位邢臺(tái)市某水廠(2022 年夏季)原始用水?dāng)?shù)據(jù)。其中80%的數(shù)據(jù)作為訓(xùn)練集,其余20%的數(shù)據(jù)作為測(cè)試集。北京市的氣象數(shù)據(jù)來(lái)源于國(guó)家氣象信息中心,共包含13 個(gè)氣象要素:最高溫度f(wàn)0,最低溫度f(wàn)1,平均溫度f(wàn)2,天氣狀況f3,風(fēng)向f4,風(fēng)速f5,空氣質(zhì)量f6,空氣質(zhì)量分?jǐn)?shù)f7,最大露點(diǎn)f8,最小露點(diǎn)f9,平均露點(diǎn)f10,平均降水量f11,最大降水量f12,如表2所示。

      表2 關(guān)于城市需水量的影響因子Tab.2 On the influencing factors of urban water demand

      2.2 異常值檢測(cè)及校正結(jié)果分析

      城市用水量常常由于設(shè)備出錯(cuò)等原因出現(xiàn)異常值,本文利用Anomaly-Transformer 模型分別對(duì)以24 h 為單位的北京市水務(wù)局(2016 年1 月1 日至2022 年9 月30 日)的原始用水?dāng)?shù)據(jù)和以15 min 為單位邢臺(tái)市某水廠(2022 年夏季)原始用水?dāng)?shù)據(jù)進(jìn)行異常值檢測(cè)。根據(jù)數(shù)據(jù)特點(diǎn)分別以年為單位和以天為單位進(jìn)行數(shù)據(jù)劃分,再利用分段曲線擬合,擬合后按順序把不同時(shí)間段校正結(jié)果拼接起來(lái)。選出原始水文時(shí)序數(shù)據(jù){ai}中的非空值進(jìn)行分段曲線擬合,用該結(jié)果替代相應(yīng)位置的缺失值。經(jīng)過(guò)校正后獲得的時(shí)間序列數(shù)據(jù)記為{gi},對(duì){gi}用Anomaly-Transformer 的方法進(jìn)行異常值檢測(cè),該模型包含3 層,我們將隱藏狀態(tài)的通道數(shù)dmodel 設(shè)置為512,win_size 設(shè)置為14。為了權(quán)衡損失函數(shù)的兩個(gè)部分,所有數(shù)據(jù)集的超參數(shù)λ 設(shè)置為3。我們使用初始學(xué)習(xí)率為10-4的ADAM優(yōu)化器,設(shè)置早停策略,訓(xùn)練過(guò)程將在30 個(gè)周期內(nèi)提前停止,批量大小為16。將檢測(cè)出的異常值二次分段曲線擬合填補(bǔ),結(jié)果如圖5所示。

      圖5 分段曲線擬合Fig.5 Piecewise curve fitting method

      采用相同步驟,用全局曲線擬合對(duì)缺失值填補(bǔ)和異常值校正,并與分段曲線擬合對(duì)比。圖5 與圖6 對(duì)比可以看出,針對(duì)凹凸性發(fā)生改變的時(shí)間序列數(shù)據(jù),分段擬合曲線能更好地體現(xiàn)時(shí)序變化趨勢(shì)。

      圖6 全局曲線擬合Fig.6 Global curve fitting method

      2.3 需水量影響因子的率定

      對(duì)于城市用水量與時(shí)間、溫度、降水量、空氣質(zhì)量等影響因素密切相關(guān),具有復(fù)雜性、非線性、時(shí)變性的特點(diǎn)。為了提高模型的泛化能力和魯棒性,本文利用皮爾遜相關(guān)性分析和主成分分析方法分別對(duì)北京市城市日用水量及用水影響因素?cái)?shù)據(jù)進(jìn)行分析,得到各影響因素與城市日用水量的關(guān)聯(lián)程度。定義北京市日用水量為y,影響因子為f0~f12,并對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理。使用SPSS 軟件對(duì)統(tǒng)計(jì)數(shù)據(jù)進(jìn)行相關(guān)性分析,得到相關(guān)系數(shù)表。

      在表3中篩選出城市用水量的主要影響因子。關(guān)聯(lián)度的下限值取0.6,即選擇的主要影響因子為相關(guān)性大于0.6 的影響因子:f0、f1、f2、f8,可以作為城市需水預(yù)測(cè)模型的輸入。同時(shí),發(fā)現(xiàn)很多自變量之間的相關(guān)度達(dá)到0.6 以上,各個(gè)自變量之間的相關(guān)性很高,反映出模型自變量之間具有很強(qiáng)的多重共線性。為了解決自變量較多并且有多重共線性的問(wèn)題,我們選擇用SPSS進(jìn)行主成分分析,得到表4。

      表3 影響因子的相關(guān)性Tab.3 The correlation of influence factors

      表4 影響因子解釋的總方差Tab.4 The total variance of the influence factor interpretation

      為了使主成分分析法解釋更高效并且最小化城市需水預(yù)測(cè)模型的數(shù)據(jù)冗余,保留數(shù)值大于1 的特征值數(shù)據(jù)。表4 在只提取了4 個(gè)主成分的情況下,累計(jì)方差貢獻(xiàn)率就達(dá)到了91.745%。第5 個(gè)主成分的特征值只有0.513,因此提取前4 個(gè)主成分比較合適,可以用這4 個(gè)主成分來(lái)代替原來(lái)的11 個(gè)變量,因此,可以用4 個(gè)主成分來(lái)代替所有自變量,命名為:FAC1_1、FAC2_1、FAC3_1、FAC4_1。

      3 實(shí)驗(yàn)結(jié)果分析與討論

      3.1 模型評(píng)價(jià)指標(biāo)

      用6 個(gè)性能指標(biāo)評(píng)估測(cè)試結(jié)果,分別為:平均百分比誤差MAPE、均方根誤差RMSE、平均絕對(duì)誤差MAE、均方誤差MSE、均方根對(duì)數(shù)誤差RMSLE和決定系數(shù)R2。采用如下公式計(jì)算預(yù)測(cè)結(jié)果的性能參數(shù),其中n為數(shù)據(jù)點(diǎn)個(gè)數(shù),yi為實(shí)際值,為預(yù)測(cè)值,真實(shí)觀測(cè)值的平均值 。

      3.2 案例分析

      3.2.1 數(shù)據(jù)預(yù)處理一:異常值校正對(duì)比

      為了檢驗(yàn)分段擬合校正和全局?jǐn)M合校正對(duì)城市需水預(yù)測(cè)的影響,根據(jù)章節(jié)2.2 異常值檢測(cè)及校正結(jié)果分析,使用分段擬合和全局?jǐn)M合對(duì)用水量進(jìn)行缺失值填補(bǔ)和異常值校正,將這兩種擬合結(jié)果分別輸入到LSTM-NeuralProphet 模型中,其中所有的訓(xùn)練和測(cè)試都是使用相同運(yùn)行環(huán)境進(jìn)行。AutoML 標(biāo)準(zhǔn)模型選取效果最好的模型:Extra Trees Regressor 作為Stacking 模型的基學(xué)習(xí)器。由表5 預(yù)測(cè)結(jié)果可知,主成分回歸的回歸系數(shù)更接近1,以天為單位全年用水量分段擬合的數(shù)據(jù)與原始數(shù)據(jù)的預(yù)測(cè)結(jié)果相比MAE、MSE、RMSE、RMSLE、MAPE分別降低了5.824 4、204.806 1、5.762 4、0.012 6、1.64%,以15 min 為單位夏季用水量分段擬合的數(shù)據(jù)與原始數(shù)據(jù)的預(yù)測(cè)結(jié)果相比MAE、MSE、RMSE、RMSLE、MAPE分別降低了442.982 562、304 685.355 67、250.873 26、0.0380 02、1.66%。因此,本文使用分段擬合優(yōu)于全局?jǐn)M合。

      表5 不同異常值校正方法的結(jié)果對(duì)比Tab.5 Comparison of results of different correction methods for outliers

      3.2.2 數(shù)據(jù)預(yù)處理二:需水影響因子對(duì)比

      為了進(jìn)一步顯示原始幾個(gè)原始自變量與提取的主成分因子對(duì)城市需水預(yù)測(cè)的影響在模型中引入篩選的兩組影響因子作為額外的輸入信號(hào)。根據(jù)章節(jié)2.3 需水量影響因子的率定,皮爾遜相關(guān)性分析選取的影響因子為f0、f1、f2、f8;主成分分析提取出4 個(gè)影響因子為FAC1_1、FAC2_1、FAC3_1、FAC4_1。將這兩種分析法所選取的影響因子加入LSTM-NeuralProphet 模型中,其中所有的訓(xùn)練和測(cè)試都是使用相同運(yùn)行環(huán)境進(jìn)行。AutoML標(biāo)準(zhǔn)模型選取效果最好的模型Gradient Boosting Regressor 作為Stacking 模型的基學(xué)習(xí)器。由表6 預(yù)測(cè)結(jié)果可知,主成分回歸的回歸系數(shù)更接近1,MAE、MSE、RMSE、RMSLE、MAPE分別降低了0.288 7、6.033 8、0.240 8、0.008、0.1%。因此,本文使用主成分分析法在提取影響因子時(shí)優(yōu)于用皮爾遜相關(guān)性分析。

      表6 不同影響因子的結(jié)果對(duì)比Tab.6 Comparison of the results of different influencing factors

      3.2.3 案例一:24 h需水預(yù)測(cè)

      對(duì)模型進(jìn)行訓(xùn)練后,對(duì)2016 年1 月1 日至2022 年9 月30 日的北京市水務(wù)局的用水?dāng)?shù)據(jù)進(jìn)行了劃分80%作為訓(xùn)練集,其余20%作為測(cè)試集。所有的訓(xùn)練和測(cè)試都是使用相同運(yùn)行環(huán)境下進(jìn)行。AutoML 標(biāo)準(zhǔn)模型分析比較結(jié)果如表8 所示,選取前3個(gè)效果最好的模型:線性回歸、最小角回歸、貝葉斯嶺回歸作為Stacking模型的基學(xué)習(xí)器。

      表7 不同預(yù)測(cè)模型的結(jié)果對(duì)比(24 h)Tab.7 Comparison of results from different prediction models(24 h)

      表8 AutoML標(biāo)準(zhǔn)模型分析比較結(jié)果(24 h)Tab.8 AutoML standard model analysis and comparison results(24 h)

      在2016 年1 月1 日至2022 年9 月30 日逐日進(jìn)行預(yù)測(cè)時(shí),將預(yù)測(cè)步長(zhǎng)設(shè)置為單步預(yù)測(cè)。圖7 的殘差圖可以直觀看出LSTM模型的性能惡化,不能保證預(yù)測(cè)的準(zhǔn)確性。圖8、圖10 顯示NeuralProphet模型的性能與LSTM-NeuralProphet 模型的性能最接近。表7 中詳細(xì)比較了具有6 個(gè)性能指標(biāo)的24 h 需水預(yù)測(cè)。對(duì)比LSTM 模型、NeuralProphet 模型、BP 模型和LSTM-Neural-Prophet 模型,所提出的LSTM-NeuralProphet 模型在6 個(gè)性能指標(biāo)的結(jié)果都優(yōu)于其他3種模型,提高了預(yù)測(cè)精度。

      圖7 基于24 h數(shù)據(jù)集的LSTM 模型預(yù)測(cè)結(jié)果Fig.7 Prediction results of LSTM model based on 24 h data set

      圖8 基于24 h數(shù)據(jù)集的NeuralProphet模型預(yù)測(cè)結(jié)果Fig.8 Prediction results of NeuralProphet model based on 24 h data set

      圖9 基于24 h數(shù)據(jù)集的BP模型預(yù)測(cè)結(jié)果Fig.9 Prediction results of BP model based on 24 h data set

      圖10 基于24 h數(shù)據(jù)集的LSTM-NeuralProphet模型預(yù)測(cè)結(jié)果Fig.10 Prediction results of LSTM-NeuralProphet model based on 24 h data set

      表9 不同預(yù)測(cè)模型的結(jié)果對(duì)比(15 min)Tab.9 Comparison of results of different prediction models (15 min)

      3.2.4 案例二:15 min需水預(yù)測(cè)

      對(duì)模型進(jìn)行訓(xùn)練后,對(duì)2022年夏季的邢臺(tái)市某水廠數(shù)據(jù)進(jìn)行了劃分80%作為訓(xùn)練集,其余20%作為測(cè)試集。所有的訓(xùn)練和測(cè)試都是使用相同運(yùn)行環(huán)境下進(jìn)行。AutoML 標(biāo)準(zhǔn)模型分析比較結(jié)果如表10 所示,選取前3 個(gè)效果最好的模型:線性回歸、貝葉斯嶺回歸、正交匹配追蹤算法作為Stacking 模型的基學(xué)習(xí)器。

      表10 AutoML標(biāo)準(zhǔn)模型分析比較結(jié)果(15 min)Tab.10 AutoML Standard Model analysis and comparison results (15 min)

      在2022年夏季每15 min預(yù)測(cè)進(jìn)行預(yù)測(cè)時(shí),將預(yù)測(cè)步長(zhǎng)設(shè)置為單步預(yù)測(cè)。圖12、圖13的殘差圖可以直觀看出NeuralProphet和BP模型的性能惡化,不能保證預(yù)測(cè)的準(zhǔn)確性。圖11、圖14顯示LSTM 模型的性能與LSTM-NeuralProphet 模型的性能最接近。表9 中詳細(xì)比較了具有6 個(gè)性能指標(biāo)的15 min 需水預(yù)測(cè),對(duì)比LSTM 模型、NeuralProphet 模型、BP 模型和LSTM-Neural-Prophet 模型,所提出的LSTM-NeuralProphet 模型在6 個(gè)性能指標(biāo)的結(jié)果都優(yōu)于其他3種模型,提高了預(yù)測(cè)精度。

      圖11 基于15 min數(shù)據(jù)集的LSTM 模型預(yù)測(cè)結(jié)果Fig.11 Prediction results of LSTM model based on 15 min data set

      圖12 基于15 min數(shù)據(jù)集的NeuralProphet模型預(yù)測(cè)結(jié)果Fig.12 Prediction results of NeuralProphet model based on 15 min data set

      圖13 基于15 min數(shù)據(jù)集的BP模型預(yù)測(cè)結(jié)果Fig.13 Prediction results of BP model based on 15 min data set

      4 結(jié) 論

      研究提出了一種基于LSTM-NeuralProphet 模型的雙時(shí)間尺度城市需水預(yù)測(cè)模型,使用北京市和邢臺(tái)市兩個(gè)城市的需水時(shí)間序列進(jìn)行預(yù)測(cè),得到如下結(jié)論。

      (1)數(shù)據(jù)的質(zhì)量直接決定了模型的預(yù)測(cè)和泛化能力的好壞,但早期的模型通常忽略了離群點(diǎn)的處理,為了提高短期需水量預(yù)測(cè)模型的精確度,本文提出了一種基于Anomaly-Transformer的水文時(shí)間序列異常值檢測(cè)和分段擬合校正模型。實(shí)驗(yàn)結(jié)果表明,該模型可以得到較高準(zhǔn)確率的預(yù)測(cè)結(jié)果。

      (2)對(duì)比了皮爾遜相關(guān)性分析和主成分分析提取的影響因子,結(jié)果表明,對(duì)于數(shù)量較多且相互關(guān)聯(lián)的影響因子,主成分分析優(yōu)于皮爾遜相關(guān)性分析。PCA 只取前后方差較大的幾個(gè)主成分來(lái)代表原變量,同時(shí)可以消除自變量之間的多重共線性,在減少了計(jì)算工作量同時(shí)大大提高需水預(yù)測(cè)模型的精度。

      (3)將LSTM-NeuralProphet 模型應(yīng)用于預(yù)測(cè)夏季15 min 超短周期時(shí)間分辨率和24 h 中周期時(shí)間分辨率這兩種不同時(shí)隙的用水量,均得到了較為理想的預(yù)測(cè)結(jié)果。實(shí)驗(yàn)結(jié)果在一定程度上體現(xiàn)了該模型的泛化能力和健壯性,為城市需水預(yù)測(cè)提供了新思路,對(duì)于城市供水等領(lǐng)域具有一定的借鑒意義。

      猜你喜歡
      需水需水量預(yù)測(cè)
      無(wú)可預(yù)測(cè)
      黃河之聲(2022年10期)2022-09-27 13:59:46
      選修2-2期中考試預(yù)測(cè)卷(A卷)
      選修2-2期中考試預(yù)測(cè)卷(B卷)
      南京城市中心區(qū)生態(tài)需水量探析
      新立城水庫(kù)生態(tài)需水及調(diào)度研究
      建平縣生態(tài)需水保障程度研究
      組合預(yù)測(cè)模型在區(qū)域需水量預(yù)測(cè)中的應(yīng)用
      不必預(yù)測(cè)未來(lái),只需把握現(xiàn)在
      帕滿灌區(qū)供需水量平衡分析
      大洋河生態(tài)需水量分析與評(píng)價(jià)
      巴里| 三河市| 沙田区| 嘉鱼县| 分宜县| 姚安县| 肇源县| 天镇县| 鄯善县| 育儿| 襄城县| 盈江县| 临洮县| 太谷县| 谷城县| 潞西市| 六枝特区| 岳西县| 天津市| 芮城县| 囊谦县| 西贡区| 乌鲁木齐市| 绿春县| 邓州市| 门头沟区| 阿勒泰市| 佛学| 全椒县| 大方县| 观塘区| 获嘉县| 梁山县| 丘北县| 乌拉特前旗| 金堂县| 西林县| 武穴市| 金门县| 宁波市| 静安区|