蘇 運 田英杰 郭乃網(wǎng) 徐東輝 龐 悅 周向東
1(國網(wǎng)上海市電力公司電力科學研究院 上海 200437)2(復(fù)旦大學計算機科學技術(shù)學院 上海 200433)
建筑用電能耗占全球總體耗能的40%,而且這個比例還在持續(xù)增加,特別是在發(fā)展中國家。準確預(yù)測建筑物的用電能耗對于在建筑物運營期間優(yōu)化能源使用設(shè)備的運行至關(guān)重要[1-3]。一旦了解建筑物內(nèi)能源消耗的情況,就可以制定適當?shù)墓?jié)能策略。例如,通過能耗預(yù)測可以獲得樓宇用戶在一定時段內(nèi)的用電行為,從而設(shè)置加熱或制冷設(shè)備的使用時間,對高峰時段的需求進行合理的分配。
近幾年,越來越多學者開始重視和研究商業(yè)樓宇負荷用電預(yù)測。商業(yè)樓宇的用電消耗與氣候和建筑信息等外部影響因素具有一定的相關(guān)性[4-5]。最近的研究工作表明在這些因素中,由于樓宇中人流量與耗能設(shè)備相互作用,人流數(shù)據(jù)對能耗預(yù)測具有較大的影響[6-7]。安裝在樓宇內(nèi)的智能監(jiān)控系統(tǒng)能夠采集獲取人流數(shù)據(jù),并且已經(jīng)投入到建筑能耗預(yù)測模型的構(gòu)建中。研究發(fā)現(xiàn),結(jié)合建筑人流數(shù)據(jù)可以改善建筑能耗預(yù)測性能,但是現(xiàn)有模型未能充分利用建筑的人流數(shù)據(jù)。
下面我們基于真實數(shù)據(jù)來研究電力數(shù)據(jù)和人流數(shù)據(jù)的關(guān)系??紤]到用電量和移動數(shù)據(jù)的量綱不同,我們首先對其分別做歸一化。圖1是某商業(yè)寫字樓的總體負荷用電量的時間序列和對應(yīng)的寫字樓內(nèi)移動人數(shù)時間序列的曲線對比。
從圖1可知,該建筑的負荷用電(實線)和移動人員數(shù)據(jù)(虛線)存在一定的正相關(guān)性。隨著時間推移,當寫字樓內(nèi)移動人數(shù)增加時,該建筑的用電量也存在上升現(xiàn)象。可以解釋為當建筑內(nèi)的人數(shù)增加,單位空間內(nèi)的能耗隨之升高,表現(xiàn)為用電負荷的提高。
根據(jù)這種耦合現(xiàn)象,本文提出一種基于移動人流數(shù)據(jù)的商業(yè)樓宇負荷用電預(yù)測方法LMO(Linear model with occupancy data)。該方法不僅考慮了樓宇的歷史用電數(shù)據(jù),還同時考慮時間、天氣以及移動人流數(shù)據(jù),與傳統(tǒng)方法相比,特別是增加了對建筑內(nèi)部人員變化因素的利用。實驗結(jié)果表明,我們提出的LMO方法能夠利用過去時刻的移動人流和電力數(shù)據(jù)的耦合性來指導對未來時刻的電力時間序列的預(yù)測,由于引入更多的先驗和耦合信息,減少了問題的不確定性。因此,相比于傳統(tǒng)方法,本文提出的預(yù)測方法具有更高的預(yù)測精度。
針對商業(yè)樓宇負荷用電預(yù)測的問題,已經(jīng)有許多學者提出了各種預(yù)測模型。研究認為樓宇用電能耗除了受到氣溫、降雨量和節(jié)假日等因素的影響,還會受到與使用者的多少,即內(nèi)部人員等相關(guān)因素的影響[8]。隨著采集設(shè)備的更新?lián)Q代,目前已經(jīng)可以較為容易地獲得樓宇建筑內(nèi)的人員移動的情況。因此,通過這些新的數(shù)據(jù),可以對樓宇用戶行為特征進行研究,進而分析獲得移動人流數(shù)據(jù)對于建筑的能源消耗的影響。
在已知的用電預(yù)測研究中,氣象、溫度等外部影響用能的因素獲得了高度的關(guān)注,如Kwoket等[9-10]使用了多層感知機(MLP)作為模型的預(yù)測框架,將溫度、降雨量和風速等多個外因輸入到人工神經(jīng)網(wǎng)絡(luò)ANN(Artificial neural networks)的輸入層,最后輸出層的數(shù)值作為將來時刻的用電能耗。方濤濤等[11]提出的基于BP-Adaboost算法進行建筑用電預(yù)測。 Li等[12]首先采用粒子群優(yōu)化iPSO(Particle swarm optimization)算法來優(yōu)化神經(jīng)網(wǎng)絡(luò)的參數(shù),然后采用主成分分析方法進行特征選擇以及簡化預(yù)測模式。Sandels等[13]先對數(shù)據(jù)進行相關(guān)性分析對特征篩選,然后采用逐步回歸函數(shù)進行數(shù)據(jù)擬合。Wang等[14]基于蒙特卡羅模擬和馬爾可夫鏈模型來構(gòu)建室內(nèi)人流數(shù)據(jù)和設(shè)備耗能之間的函數(shù)關(guān)系。
勞倫斯伯克利國家實驗室模型(LBNL)[15]模型是一種考慮了室外溫度和時間兩種外因的線性回歸模型,它通過分段策略從原始數(shù)據(jù)提取出對應(yīng)的特征表達?;贚BNL,Liang等[16]提出結(jié)合移動數(shù)據(jù)的用電預(yù)測模型。實驗結(jié)果表明,雖然移動數(shù)據(jù)有助于提高樓宇負荷總體用電預(yù)測,但未能明顯地提高模型的預(yù)測能力。雖然建筑內(nèi)部移動人員的數(shù)量和負荷用電數(shù)據(jù)存在一定相關(guān)性,但是不同用戶用電行為的差異性會降低相關(guān)性。對此,Song等[17]利用建筑內(nèi)部人員數(shù)據(jù)的多樣性信息來構(gòu)建出一種新的負荷預(yù)測模型,實驗表明新模型僅僅利用少量的歷史數(shù)據(jù)就可以達到較高的預(yù)測精度。Wang等[18]提出了一種集成學習方法EBT(Ensemble Bagging Tree),融合了氣象數(shù)據(jù)、樓宇移動人流和智能電表數(shù)據(jù)進行電力負荷預(yù)測,比較傳統(tǒng)方法的預(yù)測精度提高1.66%,同時,提高了40%的計算效率。
本文利用移動人流數(shù)據(jù)與電力負荷數(shù)據(jù)之間的耦合性,結(jié)合移動人流因素建立LMO商業(yè)樓宇用電預(yù)測模型,相較于傳統(tǒng)方法提高了商業(yè)樓宇用電預(yù)測精度。
已知某商業(yè)樓宇的n個時刻的歷史用電時間序列X,以及n個時刻對應(yīng)的歷史移動人流時間序列P:
X=(x1,x2,…,xn)∈Rn
(1)
P=(p1,p2,…,pn)∈Rn
(2)
本文研究的問題是:給定上述歷史電力時間序列X和移動人流時間序列P,移動人流時間序列對預(yù)測該樓宇未來一段時間內(nèi)的電力負荷時間序列的影響,其中要預(yù)測的未來m個時刻的電力值表示為:
Y=(y1,y2,…,ym)∈Rm
(3)
這一問題的本質(zhì)是:針對某個樓宇,不考慮人流因素,從X到Y(jié)的映射f1:Rn→Rm與結(jié)合移動人流因素,從(X,P)到Y(jié)的映射f2:(Rn,Rn)→Rm比較,通過預(yù)測精度的評價指標(例如,均方誤差的偏離系數(shù)CVRMSE、均方根誤差RMSE、平均絕對百分比誤差MAPE等) 的對比,研究出移動人流因素對電力負荷預(yù)測的影響。
我們采用根據(jù)歷史電力負荷預(yù)測未來電力負荷值的線性模型作為基準預(yù)測模型,在線性模型的基礎(chǔ)上將移動人流因素引入后根據(jù)歷史電力負荷與預(yù)測時刻的人流量進行電力負荷預(yù)測,經(jīng)實驗驗證,引入人流因素后的電力預(yù)測模型具有更高的預(yù)測準確度。
線性模型LM(Linear Model)是預(yù)測模型中常用而有效的基準預(yù)測模型。因此采用線性模型作為基礎(chǔ)對照模型往往具有普遍參考意義。
對任意t時刻的預(yù)測值可表示為:
(4)
式中:T是歷史窗口大小(即考慮歷史點的個數(shù)),xt-i為歷史負荷。訓練模型學習給定歷史窗口T下αi的值進而預(yù)測t時刻的電力負荷。訓練模型損失函數(shù)是均方根誤差RMSE:
(5)
式中:p是訓練時數(shù)據(jù)樣本數(shù)。
為驗證移動人流因素和電力負荷值存在正相關(guān)性的假設(shè),我們以圖1所示數(shù)據(jù)為例計算了移動人流時間序列與電力負荷時間序列之間的相關(guān)系數(shù),計算結(jié)果為0.88,表明二者之間存在較強的正相關(guān)性。因此本文方法通過在預(yù)測模型中考慮移動人流數(shù)據(jù)來提高預(yù)測能力:我們在線性基準預(yù)測模型下引入移動人流因素進行預(yù)測。預(yù)測電力值可表示為式(4)中根據(jù)歷史電力值的用電預(yù)測值與根據(jù)目標時刻移動人流的用電預(yù)測的線性和構(gòu)成。
基于人流因素的電力負荷預(yù)測模型如圖2所示。
受到LBNL預(yù)測模型的啟發(fā),我們在預(yù)測模型中將移動人流量做分段化處理:根據(jù)數(shù)據(jù)集中人流量的最大值與最小值計算出人流量取值范圍并將其分為N個等值區(qū)間,記任意一區(qū)間為[Si,flr,Si,up),1≤i≤N。對某時刻相應(yīng)的移動人流量pt,將其轉(zhuǎn)化為分到N個等值區(qū)間大小內(nèi)的分量值,由各分量值構(gòu)建人流特征向量[pt,1+pt,2+…+pt,N],且pt=pt,1+pt,2+…+pt,N。其中任意一段分量值pt,i的計算方法如下:
(6)
將分段化處理后的移動人流因素引入預(yù)測模型,建立移動人流因素預(yù)測用電分量如下:
(7)
結(jié)合目標時刻基于移動人流因素的用電預(yù)測分量與根據(jù)歷史電力值的用電預(yù)測分量,本文提出的LMO用電預(yù)測模型在任意一點的yt預(yù)測值可表示為:
(8)
訓練模型學習給定歷史窗口T和分段數(shù)N下各αi和βk的值預(yù)測t時刻的電力負荷并與基準測預(yù)測模型在各項預(yù)測精度評價指標上進行對比。訓練模型損失函數(shù)同樣是均方根誤差RMSE:
(9)
式中:q是訓練時數(shù)據(jù)樣本數(shù)。
(1) 實驗數(shù)據(jù) 實驗使用的數(shù)據(jù)集來自國家電網(wǎng)電力公司。這一項目旨在研究移動人流因素對電力負荷預(yù)測的影響。我們選取了不同類型的商業(yè)樓宇包括辦公寫字樓、綜合商業(yè)樓和酒店樓宇進行電力負荷預(yù)測。電力時間序列和移動人流時間序列相關(guān)情況見表1。其中數(shù)據(jù)的采樣率為96點/天,表中序列采樣自2017年12月至2018年4月期間。
(2) 移動人流因素對比實驗 為研究移動人流因素對電力負荷預(yù)測的影響,在相同參數(shù)下分別對不同類型的商業(yè)樓宇使用基準預(yù)測模型與引入人流因素后的預(yù)測模型進行對比實驗。評價指標綜合了平均絕對百分誤差MAPE、均方根誤差RMSE、MAE與CVRMSE。
(10)
(11)
(12)
(13)
對實驗中嘉麒大廈和華寧國際廣場數(shù)據(jù)集用前76天做訓練集,76~83天為驗證集,84~91天為測試集。虹橋萬豪酒店用第67~74天為訓練集,75~82天為驗證集,83~90天預(yù)測為測試集,目標均為預(yù)測一周672點電力值。
其各項評價指標對比結(jié)果如表2所示。從表2中可以看出,LMO模型在MAPE等各項預(yù)測精度評估指標中均優(yōu)于LM模型,引入人流因素進行預(yù)測顯著提高了預(yù)測精度。
表2 引入人流因素前后的預(yù)測精度對比
續(xù)表2
圖3至圖5更加直觀地展示了引入移動人流因素前后對電力時間序列預(yù)測的影響。其中橫向坐標軸為時刻,縱向坐標軸為時刻所對應(yīng)的電力值大小。圖中結(jié)果均取自各樓宇實驗的測試集。
(a) LM(b) LMO圖3 辦公樓實驗對比
(a) LM(b) LMO圖4 綜合樓實驗對比
(a) LM(b) LMO圖5 酒店樓實驗對比
(3) 引入移動人流的用電負荷預(yù)測 結(jié)合上述圖表可以看出,引入人流后辦公樓的預(yù)測準確度提升了9.97%,綜合樓預(yù)測準確度提升了6.62%,酒店樓的預(yù)測準確度提升了6.27%,引入人流因素后的預(yù)測模型在各項預(yù)測精度指標上都有提升。實驗結(jié)果表明了移動人流因素與電力負荷值是一種正相關(guān)關(guān)系,并且二者之間的聯(lián)系可以在線性預(yù)測模型中體現(xiàn)出來。
本文提出一種融合移動人流數(shù)據(jù)的多維時間序列預(yù)測模型,首次將移動人流因素引入進行耦合性輔助預(yù)測,在商業(yè)樓宇數(shù)據(jù)集上提升了用電量預(yù)測的準確性。根據(jù)移動人流數(shù)量為模型引入更多的先驗知識,提高模型的魯棒性。實驗結(jié)果表明,LMO能夠充分利用外部因素來保證樓宇用電預(yù)測的準確性。因此,相比于傳統(tǒng)方法,本文提出的預(yù)測方法具有更高的預(yù)測精度。