張 賁,邵常寧,趙 燃
(1.國(guó)家電網(wǎng)公司華北分部,北京 100053;2.北京清軟創(chuàng)新科技有限公司,北京 100085)
短期負(fù)荷預(yù)測(cè)是電力系統(tǒng)運(yùn)行的重要輔助決策手段,為電力調(diào)度部門安排日發(fā)電計(jì)劃、機(jī)組組合、優(yōu)化潮流以及經(jīng)濟(jì)調(diào)度提供科學(xué)依據(jù),對(duì)于保障國(guó)民經(jīng)濟(jì)安全運(yùn)行有重要意義。
多年來許多學(xué)者對(duì)短期負(fù)荷預(yù)測(cè)進(jìn)行了深入的研究,提出了大量的預(yù)測(cè)方法。這些方法從機(jī)理上大體可分為2類:基于趨勢(shì)外推思想的數(shù)學(xué)算法和考慮相關(guān)因素的智能算法?;谮厔?shì)外推思想的算法主要包括倍比平滑法、時(shí)間序列法、回歸模型法等[1],這些方法以探究負(fù)荷本身的發(fā)展規(guī)律為思想進(jìn)行預(yù)測(cè),大多數(shù)以線性模型為主。外推方法在相關(guān)因素影響弱的地方能取得不錯(cuò)的效果,但遇到相關(guān)因素變化劇烈的地方精度會(huì)變得很差,而且無法處理非線性問題??紤]相關(guān)因素的智能算法主要包括模糊邏輯法、人工神經(jīng)網(wǎng)絡(luò)(ANN)[2]和支持向量機(jī)(SVM)[3]等。這些方法是將經(jīng)過自適應(yīng)訓(xùn)練[4]后的相關(guān)因素量化參數(shù)作為輸入,建立龐大的非線性映射模型進(jìn)行運(yùn)算,能夠得到比較精確的預(yù)測(cè)結(jié)果。但其缺點(diǎn)為在數(shù)據(jù)處理、函數(shù)構(gòu)造、參數(shù)優(yōu)化等方面難度較大,一定程度限制了其應(yīng)用。
一般而言,傳統(tǒng)外推方法能夠基本體現(xiàn)刨除未知因素之外用戶的用電習(xí)慣和負(fù)荷規(guī)律,預(yù)測(cè)結(jié)果與實(shí)際負(fù)荷之間的誤差與相關(guān)因素會(huì)有著強(qiáng)烈的依賴關(guān)系。對(duì)于特定地區(qū)而言,在一段時(shí)間內(nèi)某些相關(guān)因素的影響可能會(huì)穩(wěn)定存在[5]。本文所采取的思路即通過對(duì)歷史負(fù)荷預(yù)測(cè)誤差的研究建立誤差與相關(guān)因素的合理映射,從而對(duì)未來負(fù)荷預(yù)測(cè)進(jìn)行修正以達(dá)到提高預(yù)測(cè)精度的目的。
誤差修正預(yù)測(cè)總體思路可以分為基于頻域分解法虛擬預(yù)測(cè)、建立誤差與相關(guān)因素映射、預(yù)測(cè)結(jié)果修正3個(gè)階段,如圖1所示。
圖1 誤差修正預(yù)測(cè)總體思路Fig.1 General concept of forecasting with deviation correction
首先對(duì)采集到的歷史負(fù)荷、氣象數(shù)據(jù)進(jìn)行預(yù)處理以提高數(shù)據(jù)質(zhì)量,然后利用傳統(tǒng)頻域分解預(yù)測(cè)方法進(jìn)行虛擬預(yù)測(cè),與實(shí)際負(fù)荷相比得到多日預(yù)測(cè)誤差。對(duì)預(yù)測(cè)誤差與氣象指標(biāo)進(jìn)行線性檢驗(yàn),根據(jù)相關(guān)特性采取相應(yīng)的回歸模型進(jìn)行誤差預(yù)測(cè),并對(duì)傳統(tǒng)方式的預(yù)測(cè)結(jié)果進(jìn)行修正。在建立誤差預(yù)測(cè)流程前需要進(jìn)行以下幾個(gè)部分的準(zhǔn)備工作。
虛擬預(yù)測(cè)是負(fù)荷預(yù)測(cè)研究的常用手段,通過歷史負(fù)荷及相關(guān)因素(例如氣象)數(shù)據(jù)對(duì)已知負(fù)荷日進(jìn)行假定的預(yù)測(cè),通過虛擬預(yù)測(cè)的結(jié)果和歷史實(shí)際負(fù)荷的對(duì)比分析研究預(yù)測(cè)的精確度,探究影響預(yù)測(cè)精度的原因等。
豐富而準(zhǔn)確的歷史數(shù)據(jù)是負(fù)荷分析和預(yù)測(cè)工作的前提,預(yù)測(cè)前有必要對(duì)歷史不良數(shù)據(jù)進(jìn)行辨識(shí)與修正。文獻(xiàn)[4]提到了幾種常用的不良數(shù)據(jù)辨識(shí)修正方法,包括神經(jīng)網(wǎng)絡(luò)法、基于聚類分析及模糊理論的方法、間隙統(tǒng)計(jì)法(GSA)、殘差修正法等[6],主要針對(duì)大量歷史數(shù)據(jù)的自動(dòng)辨識(shí)修正。本文研究的歷史樣本僅為一個(gè)月,數(shù)據(jù)較少,采取如下的簡(jiǎn)單辨識(shí)方法。
a.確定歷史樣本。
設(shè)歷史樣本第 i天 t時(shí)刻的負(fù)荷為 Pi,t(i=1,2,…,n;t=1,2,…,T),n 為歷史天數(shù),T 為采樣點(diǎn)數(shù)。第s天為第i天的同類型日,s=i±7,則其t時(shí)刻的歷史負(fù)荷為 Ps,t。
b.逐點(diǎn)計(jì)算負(fù)荷偏差率:
設(shè)定偏差率的閾值為30%,超過閾值則視為不良數(shù)據(jù)需進(jìn)行修正,不超過閾值則視為有效數(shù)據(jù)。
c.不良數(shù)據(jù)校正。
采取相鄰2點(diǎn)的負(fù)荷偏差率平均值作為校正偏差計(jì)算本點(diǎn)修正數(shù)據(jù),計(jì)算公式如下:
氣象因素的變化是影響負(fù)荷需求變動(dòng)的重要因素,與預(yù)測(cè)誤差具有內(nèi)在關(guān)聯(lián)性。通常人們對(duì)外界冷熱干濕的感覺是在溫度、濕度及風(fēng)力等多種氣象因素的綜合作用形成下,單一氣象指標(biāo)無法準(zhǔn)確描述人體的真實(shí)感覺。因此很多學(xué)者前后提出了許多考慮多個(gè)氣象因素的綜合氣象指數(shù)模型,如實(shí)感溫度、溫濕指數(shù)、風(fēng)冷力指數(shù)、人體舒適度等[7]。本文所涉及的綜合氣象指標(biāo)主要有以下3個(gè)。
a.實(shí)感溫度指數(shù)。
實(shí)感溫度是指人體在不同氣溫、濕度和風(fēng)速條件下,所產(chǎn)生的熱感覺指標(biāo)。實(shí)感溫度以靜止飽和的大氣(風(fēng)速為0時(shí),相對(duì)濕度為100%)條件下使人產(chǎn)生舒適的溫度,來代表不同風(fēng)速、不同相對(duì)濕度、不同氣溫使人產(chǎn)生的同樣感覺。計(jì)算公式如式(1)所示。
其中,Te、Ta、Rh、v 分別為實(shí)感溫度(℃)、氣溫(℃)、相對(duì)濕度(%)、風(fēng)速(m/s)。
b.溫濕指數(shù)。
溫濕指數(shù)是考慮溫度和濕度2種氣象因素的綜合氣象指標(biāo),計(jì)算公式如下:
其中,ET為溫濕指數(shù)(℃);Td為 14∶00 的溫度(℃);Rd為 14∶00 的相對(duì)濕度(%)。
c.舒適度指標(biāo)。
舒適度指數(shù)是度量溫度、濕度、風(fēng)速等氣象要素對(duì)人體的綜合作用,表征人體在大氣環(huán)境中舒適與否的綜合指標(biāo)。其計(jì)算公式為:
其中,k為人體舒適度指數(shù)。
上述3種綜合氣象指標(biāo)各有側(cè)重,需要根據(jù)地區(qū)的地理和氣候特點(diǎn)選取科學(xué)權(quán)重進(jìn)行建模。
電力負(fù)荷是具有較強(qiáng)周期性的時(shí)間序列,因此可以通過時(shí)間序列的頻域分解方法進(jìn)行分析[8]。設(shè)多日(一般取 14 d)的持續(xù)負(fù)荷序列為 P(t)(t=1,2,…,nT),對(duì)其作離散傅里葉變換(DFT)可得:
由離散傅里葉變換求得系數(shù)ai、bi,得到負(fù)荷序列分解后的一系列相互正交的正余弦分量和直流分量。根據(jù)頻譜特征提取出不同的頻率分量,通過離散傅里葉逆變換(IDFT)將其還原到時(shí)域,并通過適當(dāng)組合重構(gòu)出下式:
其中,日周期分量 a0+D(t)和周周期分量 W(t)為標(biāo)準(zhǔn)的周期序列,體現(xiàn)了人們不受干擾的規(guī)律性用電特征,預(yù)測(cè)時(shí)可以直接外推獲得;L(t)為低頻分量,體現(xiàn)了變換速度緩慢的相關(guān)因素對(duì)負(fù)荷的影響,可以通過建模的方式作逼近預(yù)測(cè);H(t)為高頻分量,體現(xiàn)了電力負(fù)荷的隨機(jī)波動(dòng),具有不可預(yù)測(cè)性。
剩余分量處理方法為低頻分量平滑方式[9],即待預(yù)測(cè)日t時(shí)刻的低頻分量為同一時(shí)刻各天歷史負(fù)荷低頻分量的一次指數(shù)平滑結(jié)果。
設(shè)平滑系數(shù)為 α?(0,1),根據(jù)“近大遠(yuǎn)小”原則可將歷史上第j天的權(quán)重設(shè)定為αn-j+1,可得歸一化的權(quán)重為,則待預(yù)測(cè)日t時(shí)刻的低頻分量預(yù)測(cè)值為:
忽略高頻分量可得待預(yù)測(cè)日的預(yù)測(cè)結(jié)果:
其中,a0+Ds,t、Ws,t分別為待預(yù)測(cè)同類型日的日周期分量、周周期分量。
傳統(tǒng)頻域分解預(yù)測(cè)方法產(chǎn)生誤差的主要原因?yàn)榈皖l分量預(yù)測(cè)不準(zhǔn)和高頻分量的忽略。高頻分量屬于噪聲分量,不可預(yù)測(cè)且含量小,可不予處理;目前所采取的低頻分量的預(yù)測(cè)方法主要有平滑方式、相關(guān)方式等,均無法跟蹤相關(guān)因素的變化而導(dǎo)致預(yù)測(cè)效果較差??紤]到相對(duì)于某個(gè)特定地區(qū)而言在一段時(shí)間內(nèi)某種相關(guān)因素的變化會(huì)遵循一定規(guī)律,而預(yù)測(cè)的誤差也會(huì)隨之呈現(xiàn)穩(wěn)定的變化趨勢(shì),因此通過虛擬預(yù)測(cè)可以建立相關(guān)因素與誤差的映射。
第i天t時(shí)刻預(yù)測(cè)誤差為實(shí)際負(fù)荷與頻域分量法(低頻分量平滑方式)的差值:
設(shè)第i天第m種相關(guān)因素的映射值為xi,m,這里的映射值是指通過攝動(dòng)方式進(jìn)行自適應(yīng)訓(xùn)練得到的最優(yōu)值,具體訓(xùn)練方法見文獻(xiàn)[3]所述。以氣象因素為例,很多情況下由于條件限制無法得到逐時(shí)氣象信息,而只能得到某一天的氣象特征指標(biāo),如最高溫度、平均溫度、風(fēng)速、相對(duì)濕度等。由式(1)—(3)可以得到單一氣象因素與綜合氣象指標(biāo)的非線性映射為:
其中,yi,1、yi,2、yi,3分別為實(shí)感溫度、溫濕指數(shù)與人體舒適度指數(shù)。為了與誤差建立一一對(duì)應(yīng)關(guān)系,需要對(duì)每天的逐點(diǎn)誤差進(jìn)行標(biāo)幺化處理,恰當(dāng)?shù)剡x取誤差的基值Ei。建立誤差基值與綜合氣象指標(biāo)的數(shù)學(xué)映射如式(10)所示。
由上式得到綜合考慮3種綜合氣象指標(biāo)的線性回歸模型,每種指標(biāo)的回歸系數(shù)即反映了該氣象綜合指標(biāo)在該地區(qū)和特定時(shí)間段的合理性。
通過回歸分析可以檢驗(yàn)映射模型的線性度。以線性相關(guān)系數(shù)R2=0.8為檢驗(yàn)標(biāo)準(zhǔn),如果擬合系數(shù)大于0.8并且通過F檢驗(yàn),可以認(rèn)為是線性模型進(jìn)行多元線性回歸分析;如果擬合系數(shù)小于0.8或者沒有通過F檢驗(yàn),則視為非線性模型,采取支持向量機(jī)回歸分析。
支持向量機(jī)是由Vapnik等[10]提出的統(tǒng)計(jì)理論中發(fā)展而來的。大量研究顯示支持向量機(jī)能夠彌補(bǔ)ANN、模糊邏輯等人工智能算法的網(wǎng)絡(luò)結(jié)構(gòu)復(fù)雜、訓(xùn)練時(shí)間長(zhǎng)的不足,在處理小樣本、非線性、高維數(shù)等實(shí)際問題時(shí)具有優(yōu)勢(shì),可以建立完善的非線性負(fù)荷預(yù)測(cè)模型。支持向量機(jī)的具體算法參見文獻(xiàn)[11],這里不再贅述。
對(duì)于大部分地區(qū)而言,在氣象平穩(wěn)的春冬季傳統(tǒng)預(yù)測(cè)方法精度足夠高,而在氣象劇烈變化的夏季預(yù)測(cè)精度較低,預(yù)測(cè)誤差與氣象因素會(huì)呈較強(qiáng)的線性相關(guān)特性。絕大多數(shù)情況下利用多元線性回歸分析即可得到擬合精度良好的線性模型,使問題得到簡(jiǎn)化。
預(yù)測(cè)結(jié)果修正可以按以下步驟進(jìn)行。
a.傳統(tǒng)預(yù)測(cè)結(jié)果處理。
b.待預(yù)測(cè)日誤差基值預(yù)測(cè)。
設(shè)當(dāng)日預(yù)報(bào)氣象因素映射值為 x0,1、x0,2、…、x0,m,根據(jù) 2.2 節(jié)得到綜合氣象指標(biāo)預(yù)測(cè)值:
c.待預(yù)測(cè)日逐點(diǎn)誤差預(yù)測(cè)。
采取平滑的方式得到待預(yù)測(cè)日誤差預(yù)測(cè)標(biāo)幺曲線。設(shè)平滑系數(shù)β,則待預(yù)測(cè)日的誤差標(biāo)幺曲線為:
將標(biāo)幺曲線有名化可得待預(yù)測(cè)日逐點(diǎn)誤差e0,t=
經(jīng)過上述過程就可以得到誤差修正的最終預(yù)測(cè)結(jié)果:
以某省夏季負(fù)荷為算例進(jìn)行研究,所采用的歷史樣本為2013年8月1日至8月25日負(fù)荷數(shù)據(jù)及氣象數(shù)據(jù),對(duì)16日至25日10 d的負(fù)荷進(jìn)行虛擬預(yù)測(cè),每個(gè)虛擬預(yù)測(cè)日都對(duì)其基準(zhǔn)日前兩周的負(fù)荷數(shù)據(jù)進(jìn)行頻域分解。得到虛擬預(yù)測(cè)的誤差進(jìn)行建模后,對(duì)待預(yù)測(cè)日27日的負(fù)荷進(jìn)行修正得到最后預(yù)測(cè)結(jié)果。以16日的虛擬預(yù)測(cè)為例,基準(zhǔn)日前的兩周1日至14日的頻域分解結(jié)果如圖2所示,圖中橫軸td值為0、1 表示第 1 天 00∶00、12∶00,2、3 表示第 2 天 00∶00、12∶00,其他依此類推。
可以看到日分量和周分量為強(qiáng)周期性時(shí)間序列,而低頻分量和高頻分量的劇烈波動(dòng)也反映了該省夏季氣象條件不穩(wěn)定的特征。按照第2.1節(jié)中所述的算法求得10 d歷史負(fù)荷虛擬預(yù)測(cè)的誤差,其三維分布如圖3所示。
圖3顯示誤差分布是呈現(xiàn)相同趨勢(shì)的一簇曲線,并在相同的時(shí)間出現(xiàn)峰谷值等。
在建立線性映射前需要首先對(duì)3種綜合氣象指標(biāo)與誤差分布的關(guān)系進(jìn)行研究,以確定哪種綜合指標(biāo)對(duì)誤差分布具有主導(dǎo)影響。計(jì)算虛擬預(yù)測(cè)10 d的實(shí)感溫度、溫濕指數(shù)和人體舒適度,分別與預(yù)測(cè)誤差做擬合,其散點(diǎn)分布圖4所示。
圖2 頻域分解結(jié)果Fig.2 Results of frequency-domain decomposition
圖3 虛擬預(yù)測(cè)誤差分布三維圖Fig.3 3D diagram of virtual forecasting deviation distribution
觀察散點(diǎn)圖發(fā)現(xiàn),3種氣象因素與誤差基值的分布均有一定線性相關(guān)度。綜合考慮各個(gè)影響因素提出的線性回歸模型為:
其中,yi,1、yi,2、yi,3分別為歷史第 i天的實(shí)感溫度、溫濕指數(shù)和人體舒適度3種綜合氣象指標(biāo)。多元線性回歸分析結(jié)果如表1所示。
圖4 綜合氣象指標(biāo)與誤差散點(diǎn)圖分布Fig.4 Scatter diagram of deviation distribution for comprehensive meteorological indexes
表1 多元線性回歸分析結(jié)果Table1 Results of multivariate linear regression analysis
由表1可知,線性相關(guān)系數(shù)R2=0.8788,F(xiàn)統(tǒng)計(jì)量對(duì)應(yīng)的概率P=0.0014<0.05(顯著性水平缺省值),可以用線性模型來建立誤差與綜合氣象指標(biāo)的之間的映射??梢钥吹綔貪裰笖?shù)的擬合系數(shù)較大,證明了該省夏季的溫濕指數(shù)是較為合理的綜合氣象指標(biāo)。
獲取待預(yù)測(cè)日的氣象預(yù)報(bào)值 x0,1、x0,2、x0,3、x0,4,用第2.3節(jié)中的方式進(jìn)行誤差預(yù)測(cè)并得到誤差修正后的預(yù)測(cè)結(jié)果。誤差修正后的預(yù)測(cè)結(jié)果、未加修正的預(yù)測(cè)結(jié)果及實(shí)際負(fù)荷曲線的比較如圖5所示。
圖5 修正結(jié)果對(duì)比Fig.5 Comparison among real load,uncorrected forecasting and corrected forecasting
由圖5可以看到,經(jīng)過誤差修正后的預(yù)測(cè)結(jié)果與實(shí)際負(fù)荷曲線的吻合度較高,尤其在峰谷段非常精確地符合實(shí)際用電規(guī)律,相比未加修正的預(yù)測(cè)結(jié)果精度有明顯改善。其預(yù)測(cè)精度改善的根本原因?yàn)橥ㄟ^頻域分解算法將氣象對(duì)負(fù)荷的影響以誤差的形式從原負(fù)荷中剝離處理,對(duì)氣象因素以歸納為綜合氣象的方式與負(fù)荷進(jìn)行了非線性相關(guān)建模,得到了高相關(guān)系數(shù)的誤差修正模型。國(guó)家電力調(diào)度考核標(biāo)準(zhǔn)提供的日負(fù)荷精準(zhǔn)率計(jì)算公式[12]如下:
其中,N為第i日負(fù)荷總點(diǎn)數(shù);dit=(負(fù)荷預(yù)測(cè)值-負(fù)荷實(shí)際值)/負(fù)荷實(shí)際值×100%。根據(jù)準(zhǔn)確率計(jì)算公式得到修正前后的準(zhǔn)確率對(duì)比如表2所示。
表2 修正前后準(zhǔn)確率對(duì)比Table 2 Comparison of accuracy between with and without correction
由上述結(jié)果可以看到8月16日負(fù)荷經(jīng)過誤差修正模型進(jìn)行修正后的預(yù)測(cè)結(jié)果相比修正前提高了約6%,達(dá)到了非常高的預(yù)測(cè)精度。為了驗(yàn)證誤差修正模型的預(yù)測(cè)效果,取考慮相關(guān)因素的預(yù)測(cè)模型中基于相似度計(jì)算的模式識(shí)別法和相似度外推法作為對(duì)照,按照本文的研究思路對(duì)2013年夏季6、7、8這3個(gè)月的負(fù)荷進(jìn)行了算例研究,得到的各模型預(yù)測(cè)結(jié)果平均準(zhǔn)確率對(duì)比如表3所示。
表3 多月平均預(yù)測(cè)準(zhǔn)確率對(duì)比Table 3 Comparison of average forecasting accuracy for several months
表3顯示經(jīng)過誤差修正模型的平均預(yù)測(cè)準(zhǔn)確率具有明顯的優(yōu)勢(shì),相比模式識(shí)別法和相似度外推法準(zhǔn)確率提高約2%~3%,在氣象波動(dòng)劇烈、預(yù)測(cè)精度普遍較低的夏季達(dá)到了約96%的預(yù)測(cè)精度,體現(xiàn)了該模型的優(yōu)越性。
本文通過對(duì)傳統(tǒng)預(yù)測(cè)誤差的分析論證表明傳統(tǒng)預(yù)測(cè)方法的預(yù)測(cè)誤差具有規(guī)律性,與特定的相關(guān)因素存在關(guān)聯(lián),可以與之建立映射。頻域分解的預(yù)測(cè)誤差主要由非周期分量的預(yù)測(cè)不準(zhǔn)所致,非周期分量與氣象因素具有較大關(guān)系。通過綜合氣象指標(biāo)建立起單一氣象指標(biāo)的映射集合,與預(yù)測(cè)誤差具有強(qiáng)線性相關(guān)關(guān)系,可以建立綜合氣象指標(biāo)與預(yù)測(cè)誤差的線性回歸模型。最后以某省夏季負(fù)荷為例進(jìn)行了算例驗(yàn)證,并跟目前常用的考慮相關(guān)因素的預(yù)測(cè)算法進(jìn)行預(yù)測(cè)效果對(duì)比,預(yù)測(cè)精度平均提高了2%~3%,充分證明本文所提出的誤差修正預(yù)測(cè)思路的正確性。
誤差修正是負(fù)荷預(yù)測(cè)的一個(gè)新思路,因?yàn)轭A(yù)測(cè)誤差往往蘊(yùn)含著實(shí)際中某種因素的穩(wěn)定影響,因此誤差規(guī)律的研究是有價(jià)值的。對(duì)于自然氣象條件不穩(wěn)定的地區(qū)可以用支持向量機(jī)、神經(jīng)網(wǎng)絡(luò)或者模糊邏輯等方式進(jìn)行非線性映射工具,結(jié)合本文所提出的線性回歸模型可以構(gòu)成完整的誤差修正預(yù)測(cè)體系,提高預(yù)測(cè)精度。
同時(shí),在實(shí)際應(yīng)用中,誤差修正的預(yù)測(cè)方法還存在依賴氣象信息的準(zhǔn)確性、復(fù)雜映射關(guān)系難以確定等缺點(diǎn)。本文提出誤差修正是負(fù)荷預(yù)測(cè)的一個(gè)較新思路,有待進(jìn)一步探討和完善。