葉從周(上海市建筑科學(xué)研究院有限公司,上海 200032)
隨著新一代信息技術(shù)的發(fā)展,人工智能技術(shù)在建筑節(jié)能減排上的應(yīng)用越來越受到重視,尤其在建筑能源管理系統(tǒng)(Energy management system for Interligent Building ,BEMS)的領(lǐng)域中,通過人工智能 AI 與物聯(lián)網(wǎng)技術(shù)的相結(jié)合(AIoT 技術(shù)),使得建筑智能化水平得到顯著提高[1]。
BEMS 借助目前的物聯(lián)網(wǎng)技術(shù),將智能電表等設(shè)備采集的能耗及建筑運(yùn)行數(shù)據(jù)匯總整理,可用于優(yōu)化建筑用能,然而,目前樓宇內(nèi) BEMS 主要用于支持能源實(shí)時(shí)計(jì)量與分項(xiàng)分類數(shù)據(jù)的統(tǒng)計(jì)分析,對(duì)于推動(dòng)能源優(yōu)化管理、用能系統(tǒng)智慧運(yùn)行的功能相對(duì)較弱,BEMS 在建筑能效提升中的作用沒有得以充分發(fā)揮。
在此背景下,本文引入聚類分析技術(shù),研究其與建筑能源管理系統(tǒng)的結(jié)合應(yīng)用,通過開展相關(guān)的數(shù)據(jù)試驗(yàn),為大數(shù)據(jù)技術(shù)支撐建筑能源系統(tǒng)優(yōu)化運(yùn)行構(gòu)建適合的方法。
聚類分析是一種挖掘大量未知分類的相似數(shù)據(jù)背后是否某種信息或者規(guī)律的數(shù)據(jù)挖掘技術(shù),而其中時(shí)間序列聚類,則是指對(duì)一組按時(shí)間順序變化的數(shù)據(jù)進(jìn)行聚類。時(shí)間序列聚類一般可以根據(jù)時(shí)間序列的分段方式,分為三種方式[2]:完整時(shí)間段聚類、子序列時(shí)間段聚類以及時(shí)間點(diǎn)聚類。本文主要采用了完整時(shí)間段聚類的方式,來對(duì)建筑能耗數(shù)據(jù)進(jìn)行聚類。
時(shí)間序列聚類在建筑節(jié)能領(lǐng)域的主要應(yīng)用有三種[2]:識(shí)別時(shí)間序列數(shù)據(jù)中的動(dòng)態(tài)變化、預(yù)測與推薦以及模式識(shí)別。在建筑節(jié)能領(lǐng)域,基于時(shí)間序列聚類分析的主要研究有:建筑用能的模式識(shí)別[3-4]、需求側(cè)管理、建筑用能預(yù)測、建筑用能異常數(shù)據(jù)檢測。BEMS 主要包含兩大應(yīng)用場景:建筑用能系統(tǒng)運(yùn)行管理和設(shè)備設(shè)施維護(hù)維修管理。如能將時(shí)間序列聚類的應(yīng)用模式與BEMS的應(yīng)用場景相結(jié)合,則能發(fā)揮該項(xiàng)技術(shù)對(duì)公共建筑能源管理運(yùn)行策略和設(shè)備運(yùn)維的重要作用。
本文選取某棟建筑的某塊電表全年采集數(shù)據(jù)建立樣本,引入時(shí)間序列聚類算法,開展數(shù)據(jù)試驗(yàn),通過對(duì)建筑用能時(shí)間序列數(shù)據(jù)的曲線進(jìn)行分類分析,從中尋找建筑能耗變化與分布特征,形成對(duì)能耗數(shù)據(jù)、設(shè)備維護(hù)、節(jié)能管控措施的指導(dǎo)意見,并建立相關(guān)模型,為研究結(jié)果向其他電表、建筑等更大范圍的推廣提供準(zhǔn)備。
試驗(yàn)方法如下:首先,提取某電表一整年的小時(shí)總能耗數(shù)據(jù),將整年數(shù)據(jù)劃分為一個(gè) 365×24 的矩陣,以天為單位,一天24h 組成一條時(shí)間序列曲線,共建立 365 條時(shí)間序列曲線;通過混合多種聚類算法清洗數(shù)據(jù),剔除異常曲線;將清洗后數(shù)據(jù)進(jìn)行二次聚類;分析聚類之后的結(jié)果,統(tǒng)計(jì)所處分類的能耗曲線的所在月份、天氣等數(shù)據(jù)信息,為建筑能耗模式識(shí)別和能耗預(yù)測做好準(zhǔn)備。試驗(yàn)流程如圖 1 所示。
圖1 試驗(yàn)流程圖
基于以上研究思路,本試驗(yàn)選用 K-means 和 DBSCAN兩個(gè)聚類算法,并依據(jù)能耗數(shù)據(jù)特征,選擇K-means 特征維度。
K-means 聚類是最著名的聚類算法之一,在時(shí)間序列領(lǐng)域應(yīng)用廣泛[11-12],其原理為通過將數(shù)據(jù)分為K 個(gè)簇中,使得簇內(nèi)的各個(gè)數(shù)據(jù)到中心點(diǎn)的距離差平方和最小。K-means算法最重要的是如何定義簇的數(shù)量K和如何定義距離的計(jì)算方式。
在建筑能源管理中,通常根據(jù)設(shè)備用途,將建筑用電分為照明、空調(diào)、動(dòng)力以及特殊用電。其中,照明與動(dòng)力用電受工作日因素的影響較大,而空調(diào)用電則受季節(jié)因素的影響較大?;诖耍囼?yàn)中將 K 設(shè)置為 6,即(過渡季,供熱季,供冷季)×(工作日,節(jié)假日)[5]。
針對(duì)時(shí)間序列數(shù)據(jù),計(jì)算距離的方式,常用的有歐幾里得距離、皮爾森系數(shù)、DTW 等。根據(jù)建筑能耗數(shù)據(jù)的特點(diǎn),本試驗(yàn)選擇歐幾里得距離作為判斷每個(gè)點(diǎn)到每個(gè)簇中心距離遠(yuǎn)近的指標(biāo)。原因在于:建筑能耗時(shí)序數(shù)據(jù)與建筑設(shè)備(如:空調(diào)、照明燈具)的開關(guān)時(shí)間,有著強(qiáng)相關(guān)性,這一特點(diǎn)在辦公類建筑的表現(xiàn)尤為明顯。所以,在通過聚類計(jì)算能耗時(shí)間序列曲線相似度的時(shí)候,不能采用諸如 DTW 等算法,原因是這類算法主要用于計(jì)算時(shí)間序列數(shù)據(jù)波動(dòng)趨勢的相似度[6],而建筑能耗曲線則是需要相同時(shí)間點(diǎn)的能耗在計(jì)算距離時(shí)一一對(duì)應(yīng),計(jì)算各條由 24 個(gè)點(diǎn) /d 組成的能耗曲線相互之間相似度。通過 K-means 聚類算法,得到每個(gè)簇的中心,使得簇心曲線上的每個(gè)點(diǎn)有其實(shí)際的物理意義,為之后的設(shè)備運(yùn)行策略優(yōu)化提供統(tǒng)計(jì)學(xué)意義上的支撐。
DBSCAN 是一種基于空間密度的聚類算法,在對(duì)能耗負(fù)荷進(jìn)行數(shù)據(jù)分析的研究中,已有廣泛的討論和應(yīng)用。在建筑能耗數(shù)據(jù)的采集過程中,由于儀表異常,統(tǒng)計(jì)錯(cuò)誤等因素,造成能耗數(shù)據(jù)分析的困難。因此,需要對(duì)數(shù)據(jù)進(jìn)行必要的清洗。本試驗(yàn)將采用 K-means 和 DBSCAN 混合的方法,先用K-means 聚類對(duì)能耗數(shù)據(jù)進(jìn)行劃分,再對(duì)劃分后的能耗數(shù)據(jù)分別進(jìn)行 DBSCAN 聚類,將其中被識(shí)別為異常的能耗曲線剔除,為之后的算法分析提供更有價(jià)值的能耗數(shù)據(jù)。
本試驗(yàn)樣本數(shù)據(jù)來源于上海某辦公建筑高壓電表 2020年全年能耗數(shù)據(jù)集,試驗(yàn)過程隨機(jī)挑選了其中一塊電表開展研究。
首先,整理一年數(shù)據(jù)去除有缺失的天數(shù),然后對(duì)其進(jìn)行首次聚類,聚類部分結(jié)果如圖 2 所示。
圖2 對(duì)電表能耗數(shù)據(jù)第一次聚類
然后,對(duì)聚類后的每一類數(shù)據(jù)進(jìn)行二次密度聚類(DBSCAN),結(jié)果如圖 3 所示,其中虛線被算法判斷為臟數(shù)據(jù):
圖3 通過密度聚類清洗數(shù)據(jù)
對(duì)清洗后的數(shù)據(jù)再次進(jìn)行 K-means 聚類,結(jié)果如圖 4所示。
圖4 K-means 聚類后每一類的簇中心
觀察圖 4 發(fā)現(xiàn):簇心曲線趨勢基本相同,主要區(qū)別在于開關(guān)機(jī)時(shí)間(曲線升高幅度變大所在時(shí)間)、工作時(shí)間用能和非工作時(shí)間用能高低。其中,類別 0 及類別 1 曲線開機(jī)時(shí)間為早上 6 點(diǎn)左右而,其他顏色的曲線開機(jī)時(shí)間則是早上 5點(diǎn)左右,而關(guān)機(jī)時(shí)間則皆為晚上 22 點(diǎn)左右。
進(jìn)一步對(duì)聚類結(jié)果進(jìn)行統(tǒng)計(jì)分析,結(jié)果如表 1 所示,該表統(tǒng)計(jì)了各類別在全年 12 個(gè)月以及工作日、非工作日所占的天數(shù)。某類別在某月中所占天數(shù)越多,說明越符合該月份的用能規(guī)律。觀察表內(nèi)數(shù)據(jù),可以發(fā)現(xiàn)每一個(gè)簇的曲線波動(dòng)趨勢,和月份有顯著關(guān)系,說明電表用能與各月份所在季節(jié)有著強(qiáng)相關(guān)性,這符合本試驗(yàn)針對(duì)供熱季、供冷季和過渡季來設(shè)置 K-means 聚類中 K 個(gè)簇的預(yù)期。
表1 聚類后統(tǒng)計(jì)結(jié)果單位:d
分析能耗曲線的月份分布情況,可以發(fā)現(xiàn)類別 0 和類別2 表征了 2、3 和 4 月份用能規(guī)律,類別 1 表征了 7 月與 12月、類別 3 表征了 8 月至 12 月、類別 5 則表征一部分 9 月及 10 月;而工作日和非工作日分布均勻,對(duì)該電表的能耗無明顯影響,推測該電表所在區(qū)域?yàn)榉寝k公場所,查閱樓宇配電文件得知:該電表用電正是位于該樓 B 1 層的觀光及餐飲區(qū)域,故該統(tǒng)計(jì)結(jié)果反映的運(yùn)行特征基本符合預(yù)期,說明聚類具有實(shí)際物理意義,可以為進(jìn)一步分析提供數(shù)據(jù)支撐和實(shí)際意義。
又以 9 月中旬至 10 月中旬為例,分析聚類結(jié)果與日期、天氣的對(duì)應(yīng)關(guān)系,如表 2 所示,發(fā)現(xiàn):類別 3 曲線和類別 5 曲線所處日期段在天氣和節(jié)假日的分布上無明顯差別,即天氣和人流量應(yīng)對(duì)能耗無特別影響,能耗曲線上卻出現(xiàn)高低差異,可推測在該電表下,存在節(jié)能空間。
表2 聚類結(jié)果(部分)與日期、天氣對(duì)應(yīng)表
進(jìn)一步,將實(shí)際值與簇心值以及每個(gè)類的上四分位與下四分位作對(duì)比,如圖 5 、圖 6 所示。
圖5 逐時(shí)能耗值與每類簇心值及上、下四分位值的對(duì)比—高于上四分衛(wèi)
圖6 逐時(shí)能耗值與每類簇心值及上、下四分位值的對(duì)比—低于下四分衛(wèi)
如圖所示,當(dāng)實(shí)際值出現(xiàn)明顯高于或低于合理范圍時(shí),可能是用能異常的表征,此時(shí) BEMS 可以記錄具體問題發(fā)生時(shí)間點(diǎn),并針對(duì)不同的用能異?,F(xiàn)象,提示相應(yīng)的管理建議;如果用能過高,可根據(jù)數(shù)據(jù)所在時(shí)刻,排查是否因額外活動(dòng)造成用能升高、是否存在非正常使用或應(yīng)關(guān)未關(guān)的設(shè)備,并統(tǒng)計(jì)過高用能出現(xiàn)頻次,為優(yōu)化設(shè)備管理流程、合理使用能源指明方向,對(duì)于存在條件的樓宇,BEMS 可將判定結(jié)果及管控策略發(fā)送至樓宇自控系統(tǒng),由其自動(dòng)執(zhí)行所需的自檢和優(yōu)化。當(dāng)出現(xiàn)數(shù)據(jù)顯著波動(dòng),則考慮電表故障,此時(shí)BEMS 可統(tǒng)計(jì)數(shù)據(jù)波動(dòng)出現(xiàn)頻次,并提示物業(yè)排查問題,若電表并無損壞,則懷疑電表所接設(shè)備存在頻繁重啟,進(jìn)一步提示物業(yè)排查電表所接設(shè)備是否損壞及是否需要及時(shí)更換,以避免不必要的用能損耗以及建筑內(nèi)人員不適。從聚類分析結(jié)果推導(dǎo)建筑能源系統(tǒng)優(yōu)化運(yùn)行策略的流程如圖 7 所示。
圖7 從聚類分析結(jié)果推導(dǎo)建筑能源系統(tǒng)優(yōu)化運(yùn)行策略的流程
本文以基于聚類分析的面向公共建筑的能耗管理優(yōu)化運(yùn)行策略中的應(yīng)用研究,以上海某辦公建筑的電表監(jiān)測數(shù)據(jù)為對(duì)象,通過混合聚類分析,開展數(shù)據(jù)試驗(yàn)。在試驗(yàn)中分別使用了 K-means 和 DBSCAN 兩種聚類算法,發(fā)現(xiàn)使用K-means 聚類算法對(duì)能耗數(shù)據(jù)進(jìn)行分類,分類結(jié)果具有實(shí)際物理意義,與該電表計(jì)量位置的功能相符;對(duì)聚類結(jié)果開展進(jìn)一步分析,結(jié)合天氣或者節(jié)假日等數(shù)據(jù),可用于判斷建筑用能是否存在異常,為推導(dǎo)可能出現(xiàn)用能異?,F(xiàn)象背后的原因提供統(tǒng)計(jì)學(xué)意義上的邏輯支撐,從而為業(yè)主在節(jié)能減排上提供支持。
本文的研究驗(yàn)證了聚類分析算法在建筑能耗異常數(shù)據(jù)檢測、建筑用能模式識(shí)別中的可用性,未來,本文工作成果可通過嵌入樓宇能源管理平臺(tái)實(shí)現(xiàn)規(guī)?;茝V應(yīng)用,同時(shí),還可面向建筑用能預(yù)測、需求側(cè)管理的目標(biāo)持續(xù)深入開發(fā),以更充分地挖掘聚類分析在建筑能源系統(tǒng)優(yōu)化運(yùn)行中的價(jià)值,為實(shí)現(xiàn)建筑節(jié)能降碳提供更重要的支撐。