馬玉鑫
(上海電氣集團(tuán)股份有限公司中央研究院,上海 200070)
IT/通信/控制技術(shù)是現(xiàn)代微電網(wǎng)運(yùn)營(yíng)階段的核心技術(shù),微電網(wǎng)的建設(shè)目標(biāo)是使終端設(shè)備和電網(wǎng)調(diào)度互相協(xié)同工作,使系統(tǒng)的穩(wěn)定性、可靠性最大化,同時(shí),使投資和環(huán)境影響最小化[1-2]。由于微電網(wǎng)系統(tǒng)規(guī)劃與運(yùn)行、收益估算、能源交易等功能都需要依賴精準(zhǔn)的負(fù)荷預(yù)測(cè),所以負(fù)荷預(yù)測(cè)在近年愈發(fā)受到人們的關(guān)注。根據(jù)預(yù)測(cè)時(shí)間間隔的不同,負(fù)荷預(yù)測(cè)被劃分為超短期負(fù)荷預(yù)測(cè)、短期負(fù)荷預(yù)測(cè)、中期負(fù)荷預(yù)測(cè)和長(zhǎng)期負(fù)荷預(yù)測(cè),一般的,這四類的分界為一天、兩周和三年[3-5]。
因?yàn)槌唐谪?fù)荷預(yù)測(cè)算法執(zhí)行的間隔短,而且微電網(wǎng)的負(fù)荷波動(dòng)明顯大于大電網(wǎng)的波動(dòng),這對(duì)預(yù)測(cè)算法的速度和精度提出了雙重高要求。在數(shù)據(jù)積累較理想的情況下,超短期負(fù)荷預(yù)測(cè)應(yīng)用的算法一般為人工神經(jīng)網(wǎng)絡(luò)(Artificial Neural Network, ANN)以及支持向量機(jī)(Support Vector Machine, SVM),其中SVM又因其引入了結(jié)構(gòu)風(fēng)險(xiǎn)最小化的理論,而備受青睞[6-7]。然而,傳統(tǒng)的ANN容易陷入局部極值而SVM計(jì)算耗時(shí)較長(zhǎng),在微電網(wǎng)負(fù)荷預(yù)測(cè)的實(shí)際應(yīng)用中均遇到了問(wèn)題。極限學(xué)習(xí)機(jī)(Extreme Learning Machine, ELM)是一種結(jié)構(gòu)簡(jiǎn)單的單層前饋神經(jīng)網(wǎng)絡(luò),它的計(jì)算速度快,泛化性能優(yōu)秀,已經(jīng)被應(yīng)用于電力負(fù)荷分析與預(yù)測(cè)[8-11]。
直接應(yīng)用ELM確實(shí)可以有效提高超短期負(fù)荷預(yù)測(cè)的精度,獲得了比傳統(tǒng)的回歸算法更好的預(yù)測(cè)結(jié)果[12-16]。然而,隨著微電網(wǎng)系統(tǒng)設(shè)備種類增多、結(jié)構(gòu)日趨復(fù)雜,采集的測(cè)點(diǎn)數(shù)和測(cè)點(diǎn)種類也在不斷增多,而且為了保證監(jiān)測(cè)與控制的功效,采集頻率也逐步加快,所以超短期負(fù)荷預(yù)測(cè)模型在訓(xùn)練過(guò)程中的干擾因素越來(lái)越多,對(duì)確保模型精度提出了更高的要求。而且,對(duì)于實(shí)際工程,影響模型精度的關(guān)鍵因素難以直觀辨識(shí),所以僅選取相關(guān)性較大的部分變量進(jìn)行建模,可能會(huì)造成預(yù)測(cè)模型精度較差的問(wèn)題。但是,如果將采集到的全部變量都用于建模,反而會(huì)因維度增大而導(dǎo)致計(jì)算復(fù)雜度變高,影響模型的泛化能力[17]。
通過(guò)引入主成分分析(Principal Component Analysis, PCA)算法消除變量間的共線性特點(diǎn),然后利用SVM建模,獲得了比傳統(tǒng)SVM更優(yōu)秀的負(fù)荷預(yù)測(cè)結(jié)果[18-20]。然而,主成分分析的目標(biāo)是為了將數(shù)據(jù)方差變化最大的方向保留下來(lái),以此最大限度的“展開(kāi)”數(shù)據(jù),對(duì)于服從或接近服從高斯分布的數(shù)據(jù)集有較好的應(yīng)用效果。但是,負(fù)荷數(shù)據(jù)具有較強(qiáng)隨機(jī)性,且電壓電流等變量明顯不服從高斯分布,所以PCA在負(fù)荷數(shù)據(jù)的特征提取中會(huì)丟失部分重要信息[21]。局部保持投影(Locality Preserving Projections, LPP)通過(guò)保持局部鄰域結(jié)構(gòu)完整,可以克服上述問(wèn)題的同時(shí),實(shí)現(xiàn)特征提取[22]。
為解決電力負(fù)荷數(shù)據(jù)高維度、非高斯的特性造成預(yù)測(cè)模型精度降低的問(wèn)題,本文提出了一種基于LPP-ELM的微電網(wǎng)超短期負(fù)荷預(yù)測(cè)算法。首先,選取具有相同天氣、溫度因素的歷史數(shù)據(jù)作為相似日,并根據(jù)負(fù)荷數(shù)據(jù)的時(shí)序相關(guān)性組成訓(xùn)練數(shù)據(jù)集,然后,通過(guò)LPP進(jìn)行特征提取,在訓(xùn)練數(shù)據(jù)的特征空間中利用ELM訓(xùn)練預(yù)測(cè)模型。最終,通過(guò)對(duì)某公司實(shí)際運(yùn)行負(fù)荷的實(shí)驗(yàn),驗(yàn)證了提出算法的有效性和優(yōu)越性。
LPP算法通過(guò)計(jì)算得到一個(gè)保持?jǐn)?shù)據(jù)局部結(jié)構(gòu)的投影矩陣P∈Rm×P(p<m),將原始高維空間X=[x1,x2,…,xn]T∈Rn×m轉(zhuǎn)變?yōu)榈途S特征空間Y=[y1,y2,…,yn]T∈Rn×P,其中n 代表數(shù)據(jù)的樣本個(gè)數(shù),m和p分別代表X和Y的維度。LPP算法的具體步驟如下:
(1)構(gòu)建鄰接圖:根據(jù)歐式距離,為X中每個(gè)數(shù)據(jù)xi,xj∈X且i,j=1,…,n,選擇距離最近的k個(gè)數(shù)據(jù)點(diǎn)為近鄰。若樣本點(diǎn)xj屬于樣本點(diǎn)xi的k個(gè)近鄰中的任意一個(gè),則在結(jié)點(diǎn)i與結(jié)點(diǎn)j之間連一條直線。否則,不連線。
(2)計(jì)算權(quán)重:假設(shè)W為待求取的權(quán)重矩陣,結(jié)點(diǎn)i與結(jié)點(diǎn)j之間權(quán)重為Wij。若結(jié)點(diǎn)之間無(wú)連線,則權(quán)重值為零。若結(jié)點(diǎn)之間有連線,則權(quán)重值使用式(1)進(jìn)行計(jì)算:
其中,t為高斯核參數(shù)。
(3)特征映射:通過(guò)求解式(2),得到特征向量α∈ Rm×m,投影矩陣P∈ Rm×p(p <m)為最小的p個(gè)特征值λ對(duì)應(yīng)的特征向量:
D為對(duì)角矩陣,其元素值為權(quán)重矩陣的列的和。最后,特征空間的向量可以表示為:
ELM是由黃廣斌教授提出的一種基于單隱含層前向神經(jīng)網(wǎng)絡(luò)的機(jī)器學(xué)習(xí)算法[8]。將LPP提取的特征空間樣本的轉(zhuǎn)置為訓(xùn)練樣本中的輸入,將原始空間中實(shí)際的負(fù)荷值,… ,t ]∈ R1×n作為輸出,隱含層神經(jīng)元個(gè)n數(shù)為h,激勵(lì)函數(shù)為g(yT),則標(biāo)準(zhǔn)單隱含層前向神經(jīng)網(wǎng)絡(luò)的數(shù)學(xué)模型為:
其中,wi是連接第i個(gè)隱含層節(jié)點(diǎn)與所有輸入節(jié)點(diǎn)的權(quán)值向量,βi是連接第i個(gè)隱含層節(jié)點(diǎn)與所有輸出節(jié)點(diǎn)的權(quán)值向量,bi是第i個(gè)隱含層節(jié)點(diǎn)的閾值。wi·yTj表示二者的內(nèi)積。g(yT)可選為sigmoid、sine或RBF函數(shù)等。如要使得該模型能近似表征LPP特征空間,滿足則存在βi,wi,bi滿足以下等式:
因此,這n個(gè)等式可以被寫(xiě)作Hβ=T,其中:
式中H被稱為神經(jīng)網(wǎng)絡(luò)的隱含層輸出矩陣。根據(jù)文獻(xiàn)[8]所述,式(6)的優(yōu)化問(wèn)題最終被轉(zhuǎn)化為:
其中H?是H的Moore-Penrose廣義逆矩陣。
為了解決負(fù)荷數(shù)據(jù)高維度、非高斯的問(wèn)題,本文提出了基于LPP-ELM的超短期負(fù)荷預(yù)測(cè)算法,其具體流程如下:
(1)根據(jù)被預(yù)測(cè)日的季節(jié)類型(第一類包含1、2、12月,第二類包含4、5、6月,第三類包含7、8、9月,第四類包含3、10、11月),匹配選取v天歷史數(shù)據(jù)作為總數(shù)據(jù)集。
(2)確定負(fù)荷預(yù)測(cè)的參考?xì)v史樣本點(diǎn)數(shù)L,即預(yù)測(cè)T+1時(shí)刻的負(fù)荷功率,需要參考T,T-1,…,T-L+1共L個(gè)時(shí)刻的負(fù)荷功率值。
(3)構(gòu)造LPP算法的輸入數(shù)據(jù)集X=[x1,x2,…,xn]T∈Rv(s-L)×(13+L),其中s為每天收集的樣本數(shù),固定的13列分別為功率因數(shù)、電網(wǎng)頻率、三相相電流、相電壓、線電壓、每日最高溫和最低溫。
(5) 將 標(biāo) 準(zhǔn) 化 后 的 特 征 空 間Y∈Rv(s?L)×p和 負(fù)荷 曲 線F ∈Rv(s?L)×1輸 入ELM算 法 建 立 預(yù) 測(cè) 模 型
(6)對(duì)被測(cè)日數(shù)據(jù)Xt,首先構(gòu)造Yt=Xt·P,輸入預(yù)測(cè)模型中,得到T+1時(shí)刻被預(yù)測(cè)值Fp =f( Y tT)。
實(shí)驗(yàn)數(shù)據(jù)來(lái)源于上海某公司某幢辦公樓在2014年7月至2015年6月期間采集的負(fù)荷數(shù)據(jù),采樣頻率為5分鐘/次,其中負(fù)荷數(shù)據(jù)主要從各電表處獲取,而每日天氣如最高溫、最低溫則參考天氣預(yù)報(bào)的信息。
選取ELM算法、PCA-ELM算法與本文提出的LPP-ELM算法進(jìn)行對(duì)比。經(jīng)過(guò)交叉驗(yàn)證,選取特征提取維度p=6,LPP算法近鄰個(gè)數(shù)k=30,ELM隱含層個(gè)數(shù)h=50,ELM選用sigmoid函數(shù)作為激勵(lì)函數(shù)。
表1 三種算法在不同季節(jié)的MAPE值對(duì)比Table 1 MAPE values of three algorithms in different seasons
通過(guò)表1可以看出,本文提出的LPP-ELM算法在3-11月的負(fù)荷預(yù)測(cè)中,表現(xiàn)均優(yōu)于ELM和PCA-ELM算法。夏季(7、8、9月)中,三個(gè)算法的MAPE值均高于其他季節(jié),原因是夏季空調(diào)開(kāi)啟后負(fù)荷波動(dòng)比較劇烈,進(jìn)行精準(zhǔn)預(yù)測(cè)的難度變大。
通過(guò)圖1可以看出,2014年10月26日的負(fù)荷數(shù)據(jù)明顯不服從高斯分布,由于PCA算法自身的局限性,所以PCA在特征提取時(shí)會(huì)遺漏部分信息,使特征空間無(wú)法完整表達(dá)原始數(shù)據(jù)空間的結(jié)構(gòu)。
圖1 2014年10月26日實(shí)際負(fù)荷曲線的高斯分布擬合結(jié)果Fig.1 The Gaussian distribution fitting result of the actual load data in 2014-10-26
針對(duì)上述負(fù)荷數(shù)據(jù),圖2展示了ELM和LPP-ELM預(yù)測(cè)結(jié)果。從曲線趨勢(shì)可以看出,本日為非工作日,LPP-ELM的預(yù)測(cè)值可以更好的反映出負(fù)荷的波動(dòng)情況,更接近實(shí)際的負(fù)荷曲線,所以取得了17.70%的MAPE值,相比ELM小3.09%,此時(shí)PCA-ELM取得的結(jié)果介于二者之間,為18.73%。
圖2 2014年10月26日負(fù)荷實(shí)際值與預(yù)測(cè)值曲線Fig.2 Actual and predicted load data in 2014-10-26
圖3展示了2015年6月10日的PCA-ELM、LPP-ELM預(yù)測(cè)值與實(shí)際值對(duì)比,可以看出兩種算法都能較好的預(yù)測(cè)負(fù)荷的波動(dòng),但是如圖中圈出部分所示,PCA-ELM在部分時(shí)刻會(huì)出現(xiàn)預(yù)測(cè)明顯失準(zhǔn)的情況,其MAPE值只能達(dá)到16.77%,而LPP-ELM算法因?yàn)樵谟?xùn)練建模時(shí)通過(guò)保持局部鄰域結(jié)構(gòu),克服了數(shù)據(jù)的非高斯問(wèn)題,完整表達(dá)了負(fù)荷數(shù)據(jù)的特征,MAPE值達(dá)到了15.42%。
圖3 2015年6月10日負(fù)荷實(shí)際值與預(yù)測(cè)值曲線Fig.3 Actual and predicted load data in 2015-06-10
負(fù)荷數(shù)據(jù)部分變量服從非高斯分布且預(yù)測(cè)模型的建立需要使用系統(tǒng)的多種被測(cè)量。此時(shí)直接使用傳統(tǒng)ELM算法,模型精度會(huì)因被測(cè)量中存在噪聲干擾而下降。然而先使用傳統(tǒng)PCA算法進(jìn)行特征提取后再使用ELM建模,則會(huì)因?yàn)镻CA的高斯分布假設(shè)無(wú)法得到滿足,導(dǎo)致其特征提取能力下降,最終同樣使得建立的預(yù)測(cè)模型精度降低。針對(duì)負(fù)荷數(shù)據(jù)的此種特性,本文提出了一種 LPPELM算法并將其應(yīng)用在微電網(wǎng)超短期負(fù)荷預(yù)測(cè)中。LPP的引入可以保證由特征提取獲得的特征空間信息精度不會(huì)因?yàn)橛?xùn)練數(shù)據(jù)包含復(fù)雜數(shù)學(xué)分布而受到影響。最后,通過(guò)對(duì)上海某公司某幢辦公樓的實(shí)際負(fù)荷數(shù)據(jù)的實(shí)驗(yàn),驗(yàn)證了LPP-ELM算法的有效性。