張騰達,李 琦,陳 波
(內(nèi)蒙古科技大學信息工程學院,內(nèi)蒙古 包頭 014010)
區(qū)域供熱系統(tǒng)(District Heating System,DHS)的目標是利用局部熱源通過管道分布向建筑物供應(yīng)熱量。由于我國北方地區(qū)的氣候原因,供熱面積巨大,因此改善區(qū)域供熱系統(tǒng)的運行對于節(jié)約能源有著重要意義。在熱負荷預測中,按照預測周期時間的長短,可分為超短期熱負荷預測、短期負荷預測、中期負荷預測以及長期負荷預測,其中短期熱負荷預測的目的是使供熱量與需求量相匹配。
由于區(qū)域供熱系統(tǒng)自身具有非線性、大滯后、多變量、強耦合的特點,隨著硬件能力的提升和機器學習的快速發(fā)展,為熱負荷預測的發(fā)展帶來了新契機。Fang等分析了芬蘭第二大城市埃斯波的熱需求和室外溫度對熱負荷預測的影響,并且結(jié)合線性回歸的SARIMA模型對熱負荷進行短期預測,獲得較高的精度,但不足的是該模型需要大量連續(xù)且充分的歷史數(shù)據(jù)。Zhao等提出一種負荷預測模糊控制策略,對空調(diào)系統(tǒng)進行前饋模糊控制,這種控制方法被認為是在保證室內(nèi)舒適性的同時降低能耗的有效方法,以天津大學某地源熱泵系統(tǒng)為例,驗證了該控制策略的有效性。但是疏忽了控制過程中由于時滯原因?qū)е碌膮?shù)變化因素。王琎等提出一種基于DWT和特征選擇的熱負荷預測模型,與單一ETR和DNN 模型相比更能充分提取數(shù)據(jù)的非線性特征并且獲得更高的精度。姜平等利用T-S模糊神經(jīng)網(wǎng)絡(luò)建立熱負荷的預測模型預測第二天的熱負荷,證明算法具有較好的擬合效果,由于訓練數(shù)據(jù)為過去48小時的144組數(shù)據(jù),因此還需要大量數(shù)據(jù)檢驗其有效性。Izadyar N等提出了極限學習機的方法,并評估了人工神經(jīng)網(wǎng)絡(luò)和遺傳編程的算法,得到極限學習機算法在區(qū)域供熱系統(tǒng)中熱負荷預測的優(yōu)越性。李琦等在傳統(tǒng)的BP神經(jīng)網(wǎng)絡(luò)基礎(chǔ)上采用改進的BP算法得到未來24小時的熱負荷預測值。劉鵬飛等通過灰色關(guān)聯(lián)法對影響熱負荷預測的因素做了相關(guān)性分析,得到影響熱負荷相關(guān)性最大的因素是供回水溫度、供水流量和室外溫度,同時選取一個月的數(shù)據(jù)采用灰色神經(jīng)網(wǎng)絡(luò)模型預測熱負荷。近年來,由于深度學習的發(fā)展,神經(jīng)網(wǎng)絡(luò)在其它方面也有長足的發(fā)展,孫海蓉等將改進的深度信念網(wǎng)絡(luò)(DBN)模型和支撐向量機回歸(SVR)模型相結(jié)合用來預測電力負荷,通過實際數(shù)據(jù)仿真證明其是一種有效的預測方法。孫瑞奇對LSTM模型進行了模型結(jié)構(gòu)和算法的改進,挖掘出股票價格時間序列中的隱含規(guī)律,對股票價格實現(xiàn)短期預測。
基于以上研究內(nèi)容,結(jié)合LSTM神經(jīng)網(wǎng)絡(luò)精度高、有效克服“維數(shù)災(zāi)”和泛化能力強的優(yōu)點,首先收集整理一年供暖周期大量真實歷史數(shù)據(jù),對數(shù)據(jù)進行歸一化處理,然后將室外溫度作為影響熱負荷變化的核心因素,將室外溫度序列和熱負荷序列之間的非線性關(guān)系進行LSTM建模,充分發(fā)現(xiàn)數(shù)據(jù)之間的客觀規(guī)律,為防止過擬合,在LSTM模型的隱層加入DropoutWrapper函數(shù)來提高模型的性能。此外,加入風力因素作為模型的輸入,與上述模型分別進行未來24小時熱負荷預測實驗,同時與支持向量機的3種不同核函數(shù)方法進行對比實驗,最后,驗證LSTM模型對處理時間序列問題的可行性和優(yōu)越性。
區(qū)域性供熱系統(tǒng)由熱源、熱力站、熱用戶以及連接它們之間的管網(wǎng)構(gòu)成。各部分之間裝有循環(huán)泵、過濾器、電動閥等各類測量儀表,形成了一個結(jié)構(gòu)復雜的非線性控制系統(tǒng)。為了滿足不同區(qū)域熱用戶的供熱量,熱力站對不同區(qū)域熱用戶供熱量的需求對應(yīng)不同的供給量。如圖1所示為區(qū)域供熱系統(tǒng)原理圖,其中由熱電廠與熱力站構(gòu)成的為一次側(cè),經(jīng)熱力站分配給熱用戶熱量之間構(gòu)成二次側(cè),熱電廠將生產(chǎn)的熱量通過換熱器和水泵機組將熱量由一次側(cè)管網(wǎng)輸送到熱力站,熱力站再經(jīng)二次側(cè)管網(wǎng)將熱量供給到熱用戶群。針對熱用戶熱量需求和熱量供給不平衡問題,本文對熱負荷預測采用不同方法進行介紹。
圖1 區(qū)域供熱系統(tǒng)原理圖
LSTM算法來源于循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),由于RNN激活函數(shù)為tanh,在反向傳播更新上一時刻參數(shù)的時候,若參數(shù)W初始化為小于1的數(shù)時,就會出現(xiàn)梯度消失的現(xiàn)象,只能具有短期記憶,鑒于此LSTM神經(jīng)網(wǎng)絡(luò)利用門控單元將長、短期記憶結(jié)合起來,解決了梯度消失的難題。
圖2 LSTM神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)圖
LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖如圖2所示,該模型神經(jīng)網(wǎng)絡(luò)由3個“門”組成:遺忘門、輸入門和輸出門,更新過程如式(1)-式(6)所示。
=([-1,]+)
(1)
=([-1,]+)
(2)
(3)
(4)
=([-1,]+)
(5)
=*tanh()
(6)
式中:和tanh 為激活函數(shù),、、、和、、、分別是3個“門”對應(yīng)相關(guān)的權(quán)重矩陣和偏置向量。在LSTM神經(jīng)網(wǎng)絡(luò)更新過程中,輸入門是決定要將哪些信息更新到新細胞中,遺忘門是將和-1作為輸入,經(jīng)過sigmoid函數(shù)再與上一時刻-1作乘積以決定哪些信息保留,最后輸出門根據(jù)輸出概率值得到輸出預測值。
總之,LSTM神經(jīng)網(wǎng)絡(luò)通過“門”來選擇需要的信息,區(qū)別于傳統(tǒng)的神經(jīng)網(wǎng)絡(luò),通過sigmoid和tanh激活函數(shù),使網(wǎng)絡(luò)降低了梯度消失和梯度爆炸問題出現(xiàn)的可能性,除此之外,LSTM神經(jīng)網(wǎng)絡(luò)的優(yōu)勢在于可以依據(jù)當前時刻的數(shù)據(jù)對下一時刻數(shù)據(jù)產(chǎn)生影響,同時挖掘到數(shù)據(jù)之間的關(guān)系,更適合處理基于時間序列的熱負荷預測問題。
熱負荷的預測是保障供熱系統(tǒng)“按需供熱”和熱用戶舒適安全的基礎(chǔ),供熱系統(tǒng)本身的特點有三個:1、室外天氣因素方面:氣溫、光照強度、風速、空氣濕度以及紫外線強度,其中溫度是最大的影響因素;2、熱力公司方面:管網(wǎng)壓力、溫度和供熱流量等;3、非線性、時滯性、以及不同人群不同的生活方式,都會對熱負荷預測帶來一定的影響,因此,選取合適的熱負荷預測方案,建立恰當?shù)臒嶝摵深A測模型對于現(xiàn)場控制具有指導性意義。對于熱負荷預測的流程,首先通過熱力公司提供的歷史工況數(shù)據(jù),對數(shù)據(jù)進行預處理,由于區(qū)域供熱系統(tǒng)具有明顯的時間序列特征,LSTM神經(jīng)網(wǎng)絡(luò)對于時間序列的問題有獨特的優(yōu)勢,因此選擇該模型并利用Python語言在Tensorflow庫下進行編程,同時對網(wǎng)絡(luò)參數(shù)不斷進行優(yōu)化改進,預測下一時刻的熱負荷值,最終循環(huán)迭代預測下一天的24小時熱負荷序列。
本文數(shù)據(jù)來源于包頭某熱力公司的歷史供熱數(shù)據(jù),由于數(shù)據(jù)在采集和存儲的時候難免會因為環(huán)境或者人為、硬件和軟件等因素存在不符合常規(guī)的數(shù)據(jù),比如溫度短時間的驟變和數(shù)據(jù)的缺失等,LSTM神經(jīng)網(wǎng)絡(luò)模型對于數(shù)據(jù)集的完整性和冗余性以及相關(guān)性都有一定要求,因此,干凈、簡潔有效的數(shù)據(jù)是模型對于發(fā)現(xiàn)數(shù)據(jù)之間客觀規(guī)律的重要保障。在整理數(shù)據(jù)過程中,天氣數(shù)據(jù)來源于中國天氣網(wǎng),其準確性和可靠性較高,常用的離群點分析方法有簡單統(tǒng)計量分析:取數(shù)據(jù)的最大值和最小值范圍內(nèi)的數(shù)據(jù),范圍之外的數(shù)據(jù)稱為異常值;3σ原則:一組測定值中與平均值的偏差超過3倍標準差的值;箱線圖分析等。本文首先采用3σ原則發(fā)現(xiàn)異常值,由于前后時間差為1小時,所以利用前后各2個時間點數(shù)據(jù)的平均值作為該異常值的替代值,如圖3所示為熱負荷原始數(shù)據(jù)和處理之后的對比圖。
圖3 數(shù)據(jù)處理前后對比圖
如圖4所示為熱力站熱負荷預測模型結(jié)構(gòu)圖,由于室外溫度會影響熱水在管網(wǎng)中傳遞時的熱量,因此室外溫度和熱負荷都在時間序列上對下一時刻的熱負荷會產(chǎn)生影響,將歷史的熱量值和與其對應(yīng)的歷史溫度,以及未來時刻的溫度值作為神經(jīng)網(wǎng)絡(luò)的輸入,預測未來時刻的熱負荷。模型數(shù)據(jù)以 24 小時為一個周期,輸入數(shù)據(jù)格式分別為batch_size:24,time_step:1,input_size:3,三個輸入變量分別為歷史室外溫度、熱負荷值和未來時刻室外溫度,每次訓練結(jié)束輸出一個輸出變量,為避免過擬合現(xiàn)象,在模型的隱層加入DropoutWrapper函數(shù),當網(wǎng)絡(luò)中每個單元在每次有數(shù)據(jù)輸入時,都以一定的概率正常輸出,其它輸出為0。利用這種有效的正則化的方式,可以有效的防止過擬合,提高模型的性能,達到熱負荷預測的目標。
圖4 LSTM 的熱負荷預測模型
本次數(shù)據(jù)選用包頭市熱力公司2019年11月份至2020年2月份的供暖時間采集的數(shù)據(jù),室外溫度數(shù)據(jù)來源于中國天氣網(wǎng),每1小時采集一組數(shù)據(jù),每天采集24組數(shù)據(jù),共計采集120天的歷史數(shù)據(jù),累計收集數(shù)據(jù)2880組數(shù)據(jù),其中把最后一天的24組數(shù)據(jù)作為驗證集,用來驗證模型的泛化能力,剩余2856組數(shù)據(jù)按照4:1的比例分為訓練集和測試集。經(jīng)處理后的數(shù)據(jù)如表1所示,根據(jù)多次預測比對試驗隱藏層設(shè)置為3層,節(jié)點個數(shù)為8,學習率為0.0002,循環(huán)迭代2000次時,預測效果最好,如圖5和圖6所示為經(jīng)LSTM神經(jīng)網(wǎng)絡(luò)訓練之后驗證未來24小時熱力站1的相對誤差和熱負荷預測結(jié)果。
圖5 熱力站1熱負荷預測相對誤差
表1 熱負荷預測數(shù)據(jù)
圖6 熱力站1熱負荷預測結(jié)果
為了驗證模型的泛化能力,另挑選同樣時間段的熱力站2作為實驗對象,在相同實驗環(huán)境下進行實驗,其相對誤差和預測結(jié)果如圖7和8所示。
圖7 熱力站2熱負荷預測相對誤差
圖8 熱力站2熱負荷預測結(jié)果
經(jīng)過兩組實驗分析,熱力站1和熱力站2的最大相對誤差分別為4.4%和5.01%,平均相對誤差分別為1.24%和2.35%??梢园l(fā)現(xiàn),熱力站1的熱負荷值相比熱力站2要大一個數(shù)量級,這是因為不同熱力站在實際工況中會對應(yīng)不同規(guī)模的熱用戶群體?;贚STM的熱負荷預測模型誤差較小,基本滿足目標函數(shù)的需求。
除了室外溫度是影響熱負荷值的第一大因素外,風力因素也是一個重要的直接影響因素,在實際生活中,當上一時刻和下一時刻的檢測溫度相同的情況下,也有可能熱需求是大小不同的,因為較強的風速會導致熱需求的增加,特別是建筑物的老化程度不同也會使得熱負荷發(fā)生變化,所以在輸入端加入了風力因素,這樣對于基于時間序列的預測模型提供了一個約束條件,有利于模型精度的提高。因此,本文將風力因素作為一個新的輸入因素,對熱力站1和熱力站2在相同參數(shù)下實驗。如圖9-12所示為熱力站在有風力因素和無風、力因素的情況下的相對誤差和熱負荷預測結(jié)果圖。
圖9 熱力站1有無風力因素相對誤差對比圖
圖10 熱力站1有無風力熱負荷值對比圖
圖11 熱力站2有無風力因素相對誤差對比圖
圖12 熱力站2有無風力因素熱負荷值對比圖
根據(jù)實驗數(shù)據(jù)結(jié)果如表2所示。不難發(fā)現(xiàn),在加入風力因素之后,熱力站1和熱力站2的平均相對誤差分別降低了0.03%和0.17%。通過驗證未來24小時的熱負荷值,可以看出來,熱負荷和氣溫基本呈反比的關(guān)系,熱負荷會隨著氣溫的降低而升高,特別是16時之后的熱負荷,尤其明顯,因為在0時-10時的階段,溫度變化基本在零下1℃到零上2℃階段變化,而11時-23時溫差變化明顯,因此熱負荷值也會產(chǎn)生較為明顯的變化,這也符合包頭市溫度變化趨勢。因此,這項實驗為熱負荷預測的準確提供了理論依據(jù),并且精度滿足實驗要求。將該模型與SVM的三種核函數(shù)進行預測對比。SVM是針對二分類問題提出的一種算法,使得超平面距離最近的樣本點的距離最大,在處理類似區(qū)域供熱系統(tǒng)的問題時,常用核函數(shù)來解決訓練樣本線性不可分的問題,典型核函數(shù)包括線性核函數(shù)、多項式核函數(shù)和徑向基(Radial Basis Function,RBF)核函數(shù),為了驗證SVM的預測性能,以熱力站1有風力因素數(shù)據(jù)為例,仿真過程采用與LSTM相同的環(huán)境條件和一致的輸入數(shù)據(jù),驗證集同樣為最后一天的24組數(shù)據(jù),如表3為其各項指標對比。對三種方法求相對誤差并可視化預測結(jié)果如圖13和14所示。
表2 有無風力因素對比結(jié)果
圖13 SVM三種核函數(shù)預測相對誤差
圖14 SVM三種核函數(shù)預測結(jié)果
表3 SVM模型預測與指標對比
三種核函數(shù)的預測結(jié)果中,均方誤差從大到小依次為,多項式>徑向基>線性核函數(shù),但是從其相對誤差表現(xiàn)來看,表現(xiàn)最好的線性核函數(shù)最大相對誤差為4.79%,平均相對誤差為1.29%,相比于LSTM神經(jīng)網(wǎng)絡(luò),最大相對誤差高出了0.42%;徑向基核函數(shù)最大相對誤差(6.74%)比LSTM高出了2.37%,可見,對于時間序列的熱負荷預測模型而言,長短期記憶神經(jīng)網(wǎng)絡(luò)更具有優(yōu)勢。
為了進一步提高熱負荷預測精度,本文將深度學習框架LSTM神經(jīng)網(wǎng)絡(luò)模型作為熱負荷的預測模型,算法研究表明:
1) LSTM模型可以更好的發(fā)掘歷史數(shù)據(jù)之間的規(guī)律,模型中隱含層加入DropoutWrapper函數(shù)能有效防止過擬合,對模型的預測精度起到了促進作用。
2) 通過考慮風力因素對熱負荷預測的影響,證明了其作為影響因素的重要性。
3) 采用大量真實歷史數(shù)據(jù)進行對比實驗,驗證模型的有效性,同時與三種不同的核函數(shù)方法做對比分析,證明了所提方法的有效性。
綜上,通過對熱負荷的預測,得到未來時刻的熱負荷值,這將為熱量的優(yōu)化控制研究奠定基礎(chǔ),有利于控制系統(tǒng)按照未來熱負荷的變化情況去控制供水流量或者溫度,對于按需供熱和節(jié)能減排有重要意義。