江世雄, 黃鴻標(biāo), 陳蘇芳, 肖榮洋
(1. 武漢大學(xué) 動(dòng)力與機(jī)械學(xué)院, 武漢 430072; 2. 國(guó)網(wǎng)福建省電力有限公司 龍巖供電公司, 福建 龍巖 364000)
隨著人口的持續(xù)增長(zhǎng)與經(jīng)濟(jì)的飛速發(fā)展,全球能源消耗和環(huán)境問(wèn)題已逐漸成為研究熱點(diǎn)[1].根據(jù)相關(guān)數(shù)據(jù)顯示,全球約有39%的能源消耗及38%的溫室氣體排放來(lái)自于建筑能耗[2-3],因此有必要對(duì)建筑能耗進(jìn)行合理的預(yù)測(cè)與控制,以提供更加精準(zhǔn)的能源供應(yīng),從而緩解能源緊缺態(tài)勢(shì)并減少溫室氣體的排放[4].
國(guó)內(nèi)外對(duì)建筑能耗已有諸多研究,如周璇等[5]針對(duì)建筑內(nèi)照明及插座能耗具有隨機(jī)性且難以預(yù)測(cè)的特征,利用長(zhǎng)短時(shí)記憶網(wǎng)絡(luò)(LSTM)模型提出了基于深度學(xué)習(xí)的多步預(yù)測(cè)建模方法,有效提高了預(yù)測(cè)精度,但其對(duì)于樓宇能耗的全方位預(yù)測(cè)效果仍有待深入研究;李紅蓮等[6]利用歷史氣象和能耗數(shù)據(jù),采用Morphing法對(duì)國(guó)內(nèi)典型城市辦公建筑的全年能耗進(jìn)行模擬,預(yù)估了氣候變化下建筑能耗的變化趨勢(shì),為更加精準(zhǔn)的能源供應(yīng)提供了依據(jù);Damrongsak等[7]研究了商場(chǎng)能耗數(shù)據(jù),并提出一種多元線性回歸方法深入挖掘了能源消耗與其他環(huán)境參數(shù)的關(guān)系,進(jìn)而有效預(yù)測(cè)了建筑物電能消耗;而Kannari等[8]提出了一種結(jié)合物理建模與機(jī)器學(xué)習(xí)的新方法,通過(guò)人工神經(jīng)網(wǎng)絡(luò)完成對(duì)數(shù)據(jù)集參數(shù)的訓(xùn)練和學(xué)習(xí),其兼顧了預(yù)測(cè)模型魯棒性、準(zhǔn)確性及推理速度.
但上述方法對(duì)能耗的預(yù)測(cè)大多僅針對(duì)于電能,故在實(shí)際建筑物能耗的預(yù)測(cè)中存在一定局限性[9],因此,本文基于遺傳算法(GA)改進(jìn)LSTM-BP神經(jīng)網(wǎng)絡(luò),提出了一種智能建筑用能行為的預(yù)測(cè)方法.
在智慧樓宇用能行為預(yù)測(cè)之前,需要明確用能類型,因此所提方法基于K-means聚類算法來(lái)劃分樓宇的用能類型,從而提高后續(xù)預(yù)測(cè)的準(zhǔn)確性.
算法將一組N個(gè)未標(biāo)記的數(shù)據(jù)量聚類劃分為K個(gè)類型,且每個(gè)簇的質(zhì)心可計(jì)算為同一簇中所有數(shù)據(jù)點(diǎn)的平均值,聚類過(guò)程如下:
1) 隨機(jī)或根據(jù)一些先驗(yàn)知識(shí)初始化k個(gè)數(shù)據(jù)點(diǎn)R=[R1,R2,…,Rk].
2) 計(jì)算每個(gè)數(shù)據(jù)點(diǎn)x與質(zhì)心之間的距離,并將每個(gè)數(shù)據(jù)點(diǎn)指定給最近的質(zhì)心.數(shù)學(xué)公式表述為
xi∈Rwifd(xi,Rw) (1) 式中,d(xi,Rj)表示數(shù)據(jù)點(diǎn)xi和質(zhì)心Rj之間的距離,且所提方法采用歐幾里德距離. 3) 重新計(jì)算每個(gè)簇的質(zhì)心,直至收斂,質(zhì)心計(jì)算表達(dá)式為 (2) 式中,Nk為數(shù)據(jù)點(diǎn)質(zhì)心的數(shù)量. 智能樓宇使用的能源主要有電能、天然氣、冷能及熱能等[10],本文通過(guò)各自的測(cè)量裝置獲取數(shù)據(jù),并利用K-means聚類算法進(jìn)行分析處理,從而得到樓宇用能行為特征.其中,以某工業(yè)住宅小區(qū)混合樓宇為目標(biāo),選取常用的電能、熱能與冷能作為能耗研究對(duì)象進(jìn)行分析,則該智慧樓宇的電能消耗曲線如圖1所示. 圖1 電能消耗曲線Fig.1 Electric energy consumption curves 由圖1可以看出,用戶用電行為習(xí)慣可分為4種類型,分別表示為EA、EB、EC和ED.EA曲線平行于水平軸,則此類用戶整體功率較低,無(wú)明顯波動(dòng)且功耗小,故可推測(cè)其處于空載狀態(tài),僅有少量線損;EB用戶曲線波動(dòng)明顯,用電高峰主要出現(xiàn)在早晚時(shí)段,且晝夜曲線波動(dòng)較小,所以其大概率為上班族;EC曲線全天呈現(xiàn)多個(gè)功率峰值,且峰值在早期、中期和晚期均有出現(xiàn),則推測(cè)用戶為老年家庭;而ED的能量消耗曲線在一天中呈現(xiàn)多個(gè)峰值,但白天為一個(gè)小峰值,夜間則是一個(gè)遠(yuǎn)高于其他曲線的大峰值,因此該用戶可能是有幾代人的混合家庭. 同樣,以該小區(qū)冬季某一天熱能消耗作為研究對(duì)象,獲得的熱能變化曲線如圖2所示. 圖2 熱能消耗曲線Fig.2 Thermal energy consumption curves 從圖2可以看出,熱能消耗行為可分為3類:GA曲線的高峰僅出現(xiàn)在早晚,因此用戶大概率是上班族;GB曲線全天均呈現(xiàn)多個(gè)能耗峰值,說(shuō)明樓宇內(nèi)全天候有人,故此類用戶應(yīng)是幾代人的混合家庭;GC曲線幾乎僅在晚間有高耗能,所以用戶有可能是學(xué)生類型的人群. 對(duì)于樓宇冷能消耗,則主要選取夏季某典型高溫天氣作為研究對(duì)象,能耗曲線如圖3所示. 圖3 冷能消耗曲線Fig.3 Cold energy consumption curves 由圖3可知,對(duì)于冷能的消耗,不同用戶具有不同的表現(xiàn).其中CA表現(xiàn)為非工作時(shí)間較為明顯,而上班時(shí)間幾乎無(wú)冷能消耗,大概率為上班族;CB和CC則與之相反,大部分冷能負(fù)荷為白天工作時(shí)間,大概率為工業(yè)或企業(yè)用戶,且在部分時(shí)間呈現(xiàn)用能高峰. LSTM網(wǎng)絡(luò)主要通過(guò)輸入門、遺忘門和輸出門來(lái)實(shí)現(xiàn)信息的保護(hù)與控制.其中遺忘門表示網(wǎng)絡(luò)從單元中丟棄的信息,即通過(guò)讀取前一時(shí)刻的輸出結(jié)果ht-1和外部輸入xt,以輸出“0”或“1”,“1”表示完全保留,而“0”表示完全接受.LSTM的遺忘門計(jì)算表達(dá)式為 f=δ(ωf[ht-1,xt]+bf) (3) 式中:δ為激活函數(shù);ω、b分別為網(wǎng)絡(luò)的權(quán)重和偏置量. (4) 最終輸出門的計(jì)算表達(dá)式為 (5) LSTM神經(jīng)網(wǎng)絡(luò)的結(jié)構(gòu)對(duì)其預(yù)測(cè)性能具有顯著影響,為此引入反向傳播神經(jīng)網(wǎng)絡(luò)(BP)用于確定各種權(quán)重值與偏差,以提高模型的預(yù)測(cè)準(zhǔn)確性.所構(gòu)成的LSTM-BP神經(jīng)網(wǎng)絡(luò)的整體結(jié)構(gòu)如圖4所示. 圖4 LSTM-BP神經(jīng)網(wǎng)絡(luò)的整體結(jié)構(gòu)Fig.4 Overall structure of LSTM-BP neural network 在LSTM-BP神經(jīng)網(wǎng)絡(luò)中,原始數(shù)據(jù)輸入LSTM網(wǎng)絡(luò)的輸入層,考慮到數(shù)據(jù)過(guò)載問(wèn)題,將遺忘門設(shè)為一層且其神經(jīng)元數(shù)量不超過(guò)30個(gè).然后將LSTM網(wǎng)絡(luò)的輸出層數(shù)據(jù)作為BP神經(jīng)網(wǎng)絡(luò)的輸入,經(jīng)過(guò)分析處理后得到最終的預(yù)測(cè)結(jié)果.其中將BP神經(jīng)網(wǎng)絡(luò)的隱藏層設(shè)為3層,而每層神經(jīng)元的數(shù)量則需根據(jù)實(shí)際研究對(duì)象進(jìn)行選取. 為了使LSTM-BP神經(jīng)網(wǎng)絡(luò)架構(gòu)具有多維空間,故采用GA優(yōu)化確定LSTM-BP超參數(shù)的最佳值,其包括LSTM及BP網(wǎng)絡(luò)層次數(shù)量[11-12]、每層中神經(jīng)元數(shù)量以及相應(yīng)的丟棄率與學(xué)習(xí)率. GA算法是一種基于自然選擇理論以及遺傳機(jī)制的強(qiáng)大進(jìn)化算法.其將待優(yōu)化參數(shù)組成編碼串,并根據(jù)一定的適應(yīng)度函數(shù)和一系列遺傳操作對(duì)每個(gè)個(gè)體進(jìn)行種群篩選,從而保留具有高適應(yīng)度值的個(gè)體,再形成新的群體.新群體中個(gè)體的適應(yīng)值不斷提高,直至滿足迭代終止條件,具有最高適應(yīng)值的個(gè)體即為優(yōu)化參數(shù)的最優(yōu)解[13].由于GA算法獨(dú)特的相似性與生物進(jìn)化的工作原理,使其能在復(fù)雜空間中進(jìn)行全局優(yōu)化搜索,且具有較強(qiáng)的魯棒性[14]. GA算法優(yōu)化LSTM-BP神經(jīng)網(wǎng)絡(luò)的具體步驟如下: 1) 參數(shù)初始化:設(shè)置種群規(guī)模、交叉概率、變異概率、最大迭代次數(shù)及誤差極值等主要參數(shù). 2) 根據(jù)個(gè)體適應(yīng)度值的大小進(jìn)行排序,并計(jì)算每個(gè)個(gè)體的評(píng)價(jià)函數(shù),其中將預(yù)測(cè)模型的平均絕對(duì)誤差(MAE)作為適應(yīng)度值[15],然后對(duì)其排序并將計(jì)算出的平均適應(yīng)度值作為閾值,再選擇適應(yīng)度大于平均適應(yīng)度的個(gè)體組成新的種群. 3) 確定是否達(dá)到所需的種群規(guī)模,若達(dá)到,進(jìn)行交叉、變異遺傳操作等;否則重復(fù)步驟2). 4) 根據(jù)尋優(yōu)得到的最優(yōu)個(gè)體作為L(zhǎng)STM-BP神經(jīng)網(wǎng)絡(luò)的權(quán)值和閾值. 5) 使用LSTM-BP神經(jīng)網(wǎng)絡(luò)傳播正信息,計(jì)算全局誤差并判斷是否達(dá)到迭代終止條件.若滿足條件,結(jié)束模型學(xué)習(xí)并輸出預(yù)測(cè)結(jié)果;否則進(jìn)行LSTM-BP網(wǎng)絡(luò)的反向傳播,修改權(quán)重并返回至步驟4),重復(fù)模型學(xué)習(xí). 利用GA優(yōu)化的LSTM-BP神經(jīng)網(wǎng)絡(luò)模型來(lái)預(yù)測(cè)智慧樓宇的用能行為.將智慧樓宇的電能、天然氣等能源使用量以及當(dāng)?shù)靥鞖鉅顟B(tài)的信息輸入預(yù)測(cè)模型,從而實(shí)現(xiàn)對(duì)用戶用能行為的預(yù)估.所提智慧樓宇用能行為預(yù)測(cè)流程如圖5所示,主要流程如下: 圖5 基于改進(jìn)LSTM-BP模型的用能行為預(yù)測(cè)流程Fig.5 Prediction process for energy consumption behavior based on improved LSTM-BP model 1) 采集用能數(shù)據(jù)并對(duì)其進(jìn)行聚類預(yù)處理,得到樓宇明確的用能類型.同時(shí),將數(shù)據(jù)集劃分為訓(xùn)練集和測(cè)試集. 2) 訓(xùn)練LSTM模型并初始化預(yù)測(cè)模型參數(shù),然后將訓(xùn)練集輸入模型,利用GA算法進(jìn)行反復(fù)迭代優(yōu)化,得到MAE最小化的模型參數(shù). 3) 訓(xùn)練BP模型,將LSTM模型輸出值作為BP網(wǎng)絡(luò)的輸入進(jìn)行訓(xùn)練.同樣,利用GA算法優(yōu)化BP網(wǎng)絡(luò)模型的參數(shù),當(dāng)達(dá)到預(yù)設(shè)目標(biāo),則能夠獲得最佳的LSTM-BP網(wǎng)絡(luò)預(yù)測(cè)模型. 4) 將測(cè)試集數(shù)據(jù)輸入訓(xùn)練好的LSTM-BP模型中,對(duì)模型輸出的數(shù)據(jù)進(jìn)行反歸一化處理,并將預(yù)測(cè)結(jié)果與實(shí)際樣本加以對(duì)比,從而得到高精度的用能行為預(yù)測(cè)結(jié)果. 基于TensorFlow深度學(xué)習(xí)框架對(duì)所提方法進(jìn)行實(shí)驗(yàn)分析.其中,數(shù)據(jù)集選取東部地區(qū)某智慧住宅2020年3月12日至2020年5月20日的用戶耗能相關(guān)數(shù)據(jù).信息采集頻率為30 min,共1.43×107條用戶信息用于智慧樓宇用能行為的分析預(yù)測(cè). 由于GA算法中選擇、交叉和變異概率的選值對(duì)所提方法的預(yù)測(cè)性能存在較大影響,故將種群規(guī)模與最大迭代次數(shù)分別設(shè)為20及50.在不同選擇、交叉和變異概率下所提方法的MAE變化如圖6所示.經(jīng)過(guò)GA算法改進(jìn)后的模型中LSTM隱藏層為2層,BP神經(jīng)網(wǎng)絡(luò)隱藏層為3層,加上輸出與輸入層,整體模型共有7層.其中LSTM每層28個(gè)神經(jīng)元,BP神經(jīng)網(wǎng)絡(luò)每層神經(jīng)元個(gè)數(shù)為31個(gè). 圖6 不同選擇、交叉和變異概率下的模型MAE變化曲線Fig.6 MAE variation curves under different selection, crossover and mutation probabilities 由圖6可以看出,優(yōu)化迭代開(kāi)始時(shí)MAE波動(dòng)較大,迭代次數(shù)超過(guò)30后,預(yù)測(cè)模型趨于收斂.交叉操作的概率用于判定兩個(gè)個(gè)體是否進(jìn)行交叉,變異操作的概率表示允許少數(shù)個(gè)體存在變異情況,以避免陷入局部最優(yōu),其取值應(yīng)綜合考慮算法性能.當(dāng)選擇概率取值較小時(shí),算法收斂較慢甚至不收斂.當(dāng)選擇、交叉及變異概率分別為0.8、0.2和0.2時(shí),MAE將達(dá)到最小,且僅為1.85 J.因此在本方法中將GA算法的3種概率值分別設(shè)為0.8、0.2和0.2,以實(shí)現(xiàn)最佳的預(yù)測(cè)性能. 針對(duì)智慧樓宇用戶常用的電能、熱能及冷能耗量進(jìn)行預(yù)測(cè)分析,采用12 h與48 h的預(yù)測(cè)結(jié)果如圖7所示. 圖7 所提方法不同時(shí)間范圍的預(yù)測(cè)結(jié)果Fig.7 Prediction results obtained by as-proposed method within different time ranges 由圖7可以看出,12 h的預(yù)測(cè)值與實(shí)際值基本一致,而48 h的預(yù)測(cè)值與實(shí)際值則仍存在一定偏差.原因是時(shí)間范圍越廣,可變因素越多,對(duì)模型的預(yù)測(cè)性能要求也就越高.從電能耗量曲線中可明顯看出,48 h的預(yù)測(cè)值存在明顯的波動(dòng),這可能是所提模型出現(xiàn)了過(guò)度收斂,且電能受環(huán)境、社會(huì)因素影響較大而導(dǎo)致的結(jié)果.但總體而言,本文方法的預(yù)測(cè)結(jié)果與真實(shí)值基本接近,滿足設(shè)計(jì)目標(biāo). 為了論證所提方法的預(yù)測(cè)性能,將其與文獻(xiàn)[5]、文獻(xiàn)[7]及文獻(xiàn)[8]的預(yù)測(cè)結(jié)果進(jìn)行對(duì)比,如圖8所示. 圖8 不同方法的MAE對(duì)比結(jié)果Fig.8 MAE comparison results among different methods 由圖8可以看出,相比于其他對(duì)比方法,所提方法能實(shí)現(xiàn)最快收斂且MAE值最小.由于所提方法在K-means聚類獲得用戶行為類型的基礎(chǔ)上,通過(guò)利用LSTM-BP神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)分析得到預(yù)測(cè)結(jié)果,所以能最大程度地保證預(yù)測(cè)準(zhǔn)確性.然而文獻(xiàn)[5]使用LSTM網(wǎng)絡(luò)以及文獻(xiàn)[7]僅采用多元線性回歸方法來(lái)進(jìn)行預(yù)測(cè),單一模型的處理性能不佳,故二者預(yù)測(cè)誤差均較大;而文獻(xiàn)[8]在物理建模的基礎(chǔ)上利用人工神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)能耗預(yù)測(cè),預(yù)測(cè)性能較單一模型有所提升,但缺乏多能源類型的考慮. 隨著“碳達(dá)峰”、“碳中和”戰(zhàn)略目標(biāo)的實(shí)施,對(duì)于高耗能的智慧樓宇進(jìn)行節(jié)能減排成為了必然趨勢(shì).本文提出了一種用能行為預(yù)測(cè)方法,為能源調(diào)控提供參考.通過(guò)引入K-means聚類算法對(duì)用戶的用能行為類型進(jìn)行劃分后,將用能數(shù)據(jù)輸入GA改進(jìn)的LSTM-BP模型進(jìn)行預(yù)測(cè)分析,以估計(jì)智慧樓宇的用能行為.基于TensorFlow框架的實(shí)驗(yàn)結(jié)果表明,當(dāng)選擇、交叉及變異概率分別為0.8、0.2與0.2時(shí),所提方法的性能最佳.算法MAE值約為1.79 J,因此能夠穩(wěn)定、高精度地預(yù)測(cè)不同時(shí)間的智慧樓宇用能行為.1.2 智慧樓宇用能行為特征
2 智慧樓宇用能行為預(yù)測(cè)模型
2.1 LSTM-BP神經(jīng)網(wǎng)絡(luò)
2.2 基于GA改進(jìn)的LSTM-BP網(wǎng)絡(luò)模型
2.3 基于改進(jìn)LSTM-BP的用能行為預(yù)測(cè)模型
3 實(shí)驗(yàn)結(jié)果與分析
3.1 參數(shù)分析
3.2 用能行為分析
3.3 預(yù)測(cè)性能分析
4 結(jié) 論