吳昀 王云龍 王艦 董志 徐能
1.浙江能源天然氣集團(tuán)有限公司 浙江 杭州 310000
2.浙江博臣能源有限公司 浙江 杭州 310000
隨著我國(guó)能源結(jié)構(gòu)轉(zhuǎn)型的不斷深入,近年來(lái)天然氣消耗量逐年增加[1]。準(zhǔn)確的天然氣負(fù)荷預(yù)測(cè)技術(shù)對(duì)天然氣管網(wǎng)的運(yùn)行和管理具有重要意義。研究表明,基于機(jī)器學(xué)習(xí)或深度學(xué)習(xí)的數(shù)據(jù)驅(qū)動(dòng)方法相較于其他方法具有更高的精度[2],是天然氣負(fù)荷預(yù)測(cè)的重要研究領(lǐng)域。
但是,目前的天然氣負(fù)荷預(yù)測(cè)研究主要集中在確定的點(diǎn)預(yù)測(cè),即預(yù)測(cè)不同時(shí)刻的負(fù)荷數(shù)值。由于數(shù)據(jù)噪聲以及模型局限性等原因,模型的點(diǎn)預(yù)測(cè)結(jié)果通常具有不確定性,預(yù)測(cè)模型無(wú)法給出該結(jié)果與真實(shí)值的誤差,也無(wú)法量化預(yù)測(cè)結(jié)果的波動(dòng)范圍。天然氣負(fù)荷預(yù)測(cè)的不確定性會(huì)降低基于預(yù)測(cè)的運(yùn)行可靠性[3]。因此,對(duì)天然氣負(fù)荷預(yù)測(cè)模型的不確定性進(jìn)行準(zhǔn)確估計(jì)是保證模型實(shí)際使用可靠性的關(guān)鍵。
目前,關(guān)于天然氣預(yù)測(cè)模型不確定性估計(jì)的研究十分稀少。而在其他能源負(fù)荷預(yù)測(cè)領(lǐng)域,主流的量化預(yù)測(cè)模型不確定性的方法為預(yù)測(cè)區(qū)間估計(jì)法[4]。預(yù)測(cè)區(qū)間是對(duì)預(yù)測(cè)不確定性的一種定量化描述手段,它定義了實(shí)際值落在某一區(qū)間內(nèi)的概率。
由于預(yù)測(cè)問(wèn)題和預(yù)測(cè)模型的多樣性,預(yù)測(cè)殘差的統(tǒng)計(jì)分布也各不相同。因此,相較于傳統(tǒng)的需要對(duì)殘差分布做出假設(shè)的區(qū)間估計(jì)方法,不對(duì)殘差分布做假設(shè)的方法具有更高的可靠性與泛用性,此類(lèi)方法可大致分為神經(jīng)網(wǎng)絡(luò)法和殘差聚類(lèi)法。神經(jīng)網(wǎng)絡(luò)法是指通過(guò)構(gòu)建神經(jīng)網(wǎng)絡(luò)來(lái)擬合預(yù)測(cè)區(qū)間上下界的方法,AK等[5]通過(guò)非支配排序遺傳算法訓(xùn)練多層感知器,來(lái)預(yù)測(cè)風(fēng)電負(fù)荷的預(yù)測(cè)區(qū)間。殘差聚類(lèi)法是指通過(guò)計(jì)算模型在訓(xùn)練集上的殘差分布來(lái)估算該模型在預(yù)測(cè)時(shí)的預(yù)測(cè)區(qū)間。章超波等[6]提出了一種基于聚類(lèi)和殘差分位數(shù)的建筑負(fù)荷預(yù)測(cè)區(qū)間估計(jì)方法。該方法相較于神經(jīng)網(wǎng)絡(luò)法具有更高的計(jì)算效率,且神經(jīng)網(wǎng)絡(luò)法建立的神經(jīng)網(wǎng)絡(luò)模型會(huì)引入新的不確定性,因此殘差聚類(lèi)法具有更高的可靠性。
由此可見(jiàn),預(yù)測(cè)區(qū)間估計(jì)法是量化模型預(yù)測(cè)不確定性的重要方法,已在電力、環(huán)境以及建筑負(fù)荷預(yù)測(cè)領(lǐng)域得到了廣泛應(yīng)用。但是,目前關(guān)于天然氣負(fù)荷預(yù)測(cè)模型不確定性的研究較少,還沒(méi)有針對(duì)天然氣負(fù)荷預(yù)測(cè)區(qū)間估計(jì)方法的深入研究。
本文建立了一種基于聚類(lèi)的天然氣負(fù)荷預(yù)測(cè)不確定性估計(jì)方法。相較于前人的方法,本方法優(yōu)化了聚類(lèi)算法的選擇,并采用敏感性分析方法量化循環(huán)神經(jīng)網(wǎng)絡(luò)模型輸入對(duì)輸出的影響,旨在得到更佳的歷史殘差分布和區(qū)間估計(jì)精度。
如圖1所示,本文建立的區(qū)間估計(jì)方法主要包含2個(gè)步驟:模型殘差聚類(lèi)和預(yù)測(cè)區(qū)間估計(jì)。模型殘差聚類(lèi)為基于訓(xùn)練的預(yù)測(cè)模型得到輸入特征的貢獻(xiàn)度,根據(jù)貢獻(xiàn)度對(duì)輸入進(jìn)行加權(quán),然后對(duì)加權(quán)后的輸入進(jìn)行聚類(lèi),在剔除異常殘差后得到多組歷史殘差分布。預(yù)測(cè)區(qū)間估計(jì)為實(shí)時(shí)匹配預(yù)測(cè)點(diǎn)最佳的殘差分布,在該分布內(nèi)計(jì)算模型預(yù)測(cè)值的預(yù)測(cè)區(qū)間。
圖1 方法流程圖
長(zhǎng)短期記憶神經(jīng)網(wǎng)絡(luò)(l ong short-term memory,LSTM)在天然氣負(fù)荷預(yù)測(cè)領(lǐng)域應(yīng)用較為廣泛[7]。研究表明,通過(guò)將LSTM與人工神經(jīng)網(wǎng)絡(luò)結(jié)合,能夠提高LSTM對(duì)建筑負(fù)荷預(yù)測(cè)的精度[8]。因此,本文采用了一種基于LSTM和反向傳播神經(jīng)網(wǎng)絡(luò)(back propagation neutral network,BPNN)的天然氣負(fù)荷預(yù)測(cè)混合模型LSTM-BPNN。其結(jié)構(gòu)如圖2所示。
圖2 LSTM-BPNN模型結(jié)構(gòu)示意圖
基于數(shù)據(jù)驅(qū)動(dòng)的預(yù)測(cè)模型為黑箱模型,而黑箱模型的可解釋性較差。本研究采用敏感性分析方法[9]計(jì)算模型輸入對(duì)輸出的貢獻(xiàn)程度,此方法可以量化各輸入對(duì)天然氣預(yù)測(cè)值的影響程度。計(jì)算方法如式(1)所示。
式中:U為預(yù)測(cè)區(qū)間的上界;L為預(yù)測(cè)區(qū)間的下界;Q為預(yù)測(cè)樣本相匹配的殘差簇內(nèi)的殘差百分位數(shù);β為小于0的殘差占比;為模型預(yù)測(cè)值,100×(1-α)%為名義置信區(qū)間。
在預(yù)測(cè)結(jié)果評(píng)估指標(biāo)方面,本文采用均方根誤差(root mean squared error,RMSE)、平均絕對(duì)誤差(mean absolute error,MAE)和決定系數(shù)(coefficient of determination,R2),如式(8)至式(10)所示。
本節(jié)選取浙江某天然氣門(mén)站作為實(shí)例驗(yàn)證的數(shù)據(jù)來(lái)源。門(mén)站收集了2020年8月至2021年8月的運(yùn)行數(shù)據(jù)。除此之外本節(jié)還選取了當(dāng)?shù)氐奶鞖庑畔?,包括溫度和降雨量。本文將一年中?0%的樣本點(diǎn)作為訓(xùn)練集,后15%為驗(yàn)證集,最后15%為測(cè)試集。
本文選擇當(dāng)前時(shí)刻天然氣負(fù)荷、前1、2、23、24h的天然氣負(fù)荷、預(yù)測(cè)時(shí)刻的溫度、降雨和小時(shí)作為輸入特征,輸出為未來(lái)1h的天然氣負(fù)荷。LSTM-BPNN模型在在測(cè)試集上的預(yù)測(cè)精度如表1所示。
表1 LSTM-BPNN模型在測(cè)試集上的精度
利用敏感性分析來(lái)評(píng)判模型各個(gè)輸入對(duì)輸出的影響,所計(jì)算出的敏感性指數(shù)越大,則該特征對(duì)模型輸出的影響越大。各個(gè)輸入特征敏感性指數(shù)如表2所示。
表2 模型特征的敏感性指數(shù)
為了得到最合適的聚類(lèi)數(shù)目,本文令k取1~6,名義置信區(qū)間取60%~90%(以10%為間隔)。結(jié)果顯示k取5時(shí)區(qū)間估計(jì)效果最佳,此時(shí)ACE絕對(duì)值的平均值最小,如表3所示。結(jié)果表明對(duì)輸入進(jìn)行加權(quán)后,ACE絕對(duì)值的平均值的最佳值小于非加權(quán)時(shí)的最佳值。
表3 不同k下的ACE絕對(duì)值的平均值
k取5時(shí),其中一個(gè)殘差簇的異常殘差剔除結(jié)果如圖3所示,其中灰底部分為異常殘差。在核密度估計(jì)中,帶寬取10000,縮放因子取0.02。
圖3 殘差簇的殘差分布圖
圖4展示PINC取80%時(shí)某隨機(jī)時(shí)間段內(nèi)的預(yù)測(cè)區(qū)間曲線實(shí)例。結(jié)果顯示該區(qū)間估計(jì)算法能夠追蹤預(yù)測(cè)點(diǎn)的變化情況。
圖4 PINC取80%時(shí)預(yù)測(cè)負(fù)荷、實(shí)際負(fù)荷及預(yù)測(cè)區(qū)間曲線
表4列出了k取5時(shí),在測(cè)試集上取更多PINC時(shí)PICP和ACE計(jì)算結(jié)果。由表可知,本文建立的預(yù)測(cè)區(qū)間估計(jì)方法得到的PICP與PINC差值很小,這表明本文建立的方法具有較好的效果。
表4 預(yù)測(cè)區(qū)間估計(jì)結(jié)果(k = 5)
本研究將區(qū)間估計(jì)方法引入到天然氣負(fù)荷預(yù)測(cè)不確定性問(wèn)題的研究中,結(jié)果顯示此方法具有較高的區(qū)間估計(jì)精度,預(yù)測(cè)區(qū)間平均覆蓋誤差為0.46%。具有良好預(yù)測(cè)區(qū)間估計(jì)精度。并為評(píng)估天然氣負(fù)荷預(yù)測(cè)模型不確定性提供了新思路。
本研究?jī)H采用LSTM-BPNN混合模型對(duì)此區(qū)間估計(jì)方法進(jìn)行了驗(yàn)證,但此方法沒(méi)有對(duì)殘差分布做出假設(shè),理論上可用于任何數(shù)據(jù)驅(qū)動(dòng)模型的預(yù)測(cè)區(qū)間估計(jì)。
后續(xù)的工作可以進(jìn)一步研究該預(yù)測(cè)區(qū)間估計(jì)方法在天然氣負(fù)荷預(yù)測(cè)或其他能源預(yù)測(cè)問(wèn)題上的性能。并探究此方法在天然氣系統(tǒng)調(diào)度和運(yùn)行方面的應(yīng)用。