楊乘勝,張世超,朱海東,趙竟,張永涵,張庭玉
(1.南京華盾電力信息安全測(cè)評(píng)有限公司,江蘇 南京 210000;2.中國(guó)華電集團(tuán)有限公司,北京 100031;)
隨著國(guó)內(nèi)電力市場(chǎng)的有序推進(jìn),我國(guó)的電力市場(chǎng)已初具規(guī)模。在電力市場(chǎng)現(xiàn)貨交易的場(chǎng)景中,市場(chǎng)出清價(jià)是整個(gè)電力市場(chǎng)的核心要素之一,是直接影響發(fā)電側(cè)利潤(rùn)與競(jìng)標(biāo)策略的重要參數(shù)。
當(dāng)前電力市場(chǎng)出清價(jià)格預(yù)測(cè)研究中一個(gè)經(jīng)典的預(yù)測(cè)方法就是使用歷史連續(xù)序列進(jìn)行預(yù)測(cè)[1]?;陔娏κ袌?chǎng)的模糊性以及動(dòng)態(tài)變化的隨機(jī)性,灰色系統(tǒng)理論也常被應(yīng)用于負(fù)荷預(yù)測(cè)和電價(jià)預(yù)測(cè)中[2],文獻(xiàn)[3]提出了一種基于數(shù)據(jù)挖掘與支持向量機(jī)的出清價(jià)格預(yù)測(cè)方法。文獻(xiàn)[4]應(yīng)用多日機(jī)組數(shù)據(jù)和日前出清環(huán)節(jié)數(shù)據(jù),提出了一種組合模型優(yōu)化安排系統(tǒng)機(jī)組開(kāi)機(jī)方式。文獻(xiàn)[5]則是采取了奇異值分析結(jié)合機(jī)器學(xué)習(xí)方法進(jìn)行預(yù)測(cè)的方法。
隨著深度學(xué)習(xí)的發(fā)展,一系列時(shí)間序列預(yù)測(cè)的深度學(xué)習(xí)模型也開(kāi)始應(yīng)用于電力市場(chǎng)中。文獻(xiàn)[6]提出了一種基于經(jīng)驗(yàn)?zāi)J椒纸馀cLSTM的序列電價(jià)預(yù)測(cè)模型。文獻(xiàn)[7]采用最大信息系數(shù)相關(guān)性和改進(jìn)多層級(jí)門(mén)控的方法對(duì)LSTM模型進(jìn)行改進(jìn),提升了短期電價(jià)的預(yù)測(cè)精度。此外,還有使用DeepESN[8],Attention-GRU[9]等深度神經(jīng)網(wǎng)絡(luò)模型進(jìn)行電價(jià)預(yù)測(cè)的研究方法,也都在相應(yīng)的場(chǎng)景中取得了不錯(cuò)的效果。
然而,國(guó)內(nèi)的電力市場(chǎng)起步較晚,各區(qū)域電力市場(chǎng)政策不統(tǒng)一,難以形成統(tǒng)一的標(biāo)準(zhǔn)的數(shù)據(jù)集。此外,國(guó)內(nèi)電力市場(chǎng)的歷史數(shù)據(jù)普遍不公開(kāi),導(dǎo)致現(xiàn)有的數(shù)據(jù)量較少。因此很多基于大數(shù)據(jù)的電力市場(chǎng)出清價(jià)格預(yù)測(cè)模型難以在這類小樣本數(shù)據(jù)上達(dá)到良好的效果。為了實(shí)現(xiàn)小樣本和不連續(xù)數(shù)據(jù)上的出清價(jià)格預(yù)測(cè),本文提出了一種基于日前披露數(shù)據(jù)相似性的電力市場(chǎng)出清價(jià)格預(yù)測(cè)方法,并在某區(qū)域電力市場(chǎng)交易的試運(yùn)行數(shù)據(jù)上進(jìn)行了測(cè)試,通過(guò)實(shí)驗(yàn)證明了本文方法的有效性。
在電力市場(chǎng)出清價(jià)格預(yù)測(cè)問(wèn)題中,日前披露數(shù)據(jù)信息對(duì)于市場(chǎng)報(bào)價(jià)預(yù)期有著重要的影響,如負(fù)荷預(yù)測(cè)、裝機(jī)容量、停運(yùn)預(yù)測(cè)等供需信息的披露能夠?qū)Ξ?dāng)前的市場(chǎng)環(huán)境有較為準(zhǔn)確的判斷[10-11]。然而,在數(shù)據(jù)量有限的情況下,機(jī)器學(xué)習(xí)和深度學(xué)習(xí)算法難以對(duì)數(shù)據(jù)的規(guī)律進(jìn)行無(wú)偏差的估計(jì)[12]。國(guó)內(nèi)的電力市場(chǎng)交易普遍處于試運(yùn)行階段,不僅數(shù)據(jù)量有限,而且通常在運(yùn)行一段時(shí)間后就會(huì)暫停運(yùn)行,使獲得的數(shù)據(jù)集出現(xiàn)時(shí)間不連續(xù)的情況[13],因此一些基于時(shí)序分析的預(yù)測(cè)算法也不能達(dá)到很好的預(yù)測(cè)效果。
相比于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等方法,基于日前披露數(shù)據(jù)相似性的預(yù)測(cè)方法對(duì)于數(shù)據(jù)量的要求相對(duì)較低,只要相似度算法得當(dāng),就可以達(dá)到較好的預(yù)測(cè)結(jié)果,不會(huì)出現(xiàn)因?yàn)橛?xùn)練數(shù)據(jù)不平衡而導(dǎo)致過(guò)擬合或者欠擬合問(wèn)題。
在日前披露數(shù)據(jù)中會(huì)公布每日的負(fù)荷、電價(jià)、需求值等相關(guān)數(shù)據(jù),組成一個(gè)y= (x1,x2,……,xn)的向量用于描述當(dāng)日的特征。如圖1所示,本文計(jì)算電力市場(chǎng)交易日前披露數(shù)據(jù)各指標(biāo)間的相關(guān)性,通過(guò)相關(guān)性矩陣可以發(fā)現(xiàn)日前出清價(jià)格與各項(xiàng)指標(biāo)數(shù)據(jù)之間具有不同的相關(guān)性程度。而在日前披露數(shù)據(jù)中,某日各項(xiàng)指標(biāo)數(shù)據(jù)與待預(yù)測(cè)數(shù)據(jù)各項(xiàng)指標(biāo)數(shù)據(jù)相似的情況下,日前出清價(jià)格也具有一定的相似性。
圖1 相關(guān)性分析圖Fig.1 Correlation analysis chart
由于某些指標(biāo)數(shù)據(jù)與日前出清價(jià)格的相關(guān)性較弱,在預(yù)測(cè)時(shí)引入這些因素,反而可能會(huì)影響預(yù)測(cè)的精度。根據(jù)統(tǒng)計(jì)學(xué)中的相關(guān)性原則[14-15],當(dāng)相關(guān)性的絕對(duì)值小于0.4時(shí),則可以認(rèn)為二者的相關(guān)性較弱甚至不具備相關(guān)性;當(dāng)相關(guān)性的絕對(duì)值大于0.4且小于0.6時(shí),說(shuō)明二者具有一定的相關(guān)性;當(dāng)相關(guān)性的絕對(duì)值大于0.6且小于0.8時(shí),說(shuō)明二者具有較為明顯的相關(guān)性;當(dāng)相關(guān)性的絕對(duì)值大于0.8時(shí),說(shuō)明二者已經(jīng)具有很明顯的強(qiáng)相關(guān)性。因此本文在進(jìn)行日前出清價(jià)格預(yù)測(cè)前,預(yù)先對(duì)日前披露數(shù)據(jù)進(jìn)行了處理,只選擇了相關(guān)性大于0.4的指標(biāo)數(shù)據(jù)用于相似性的計(jì)算,以降低無(wú)關(guān)指標(biāo)數(shù)據(jù)對(duì)于預(yù)測(cè)的影響。
通過(guò)相關(guān)性分析的結(jié)果可以看出,日前出清價(jià)格與多項(xiàng)指標(biāo)都具有一定的相關(guān)性,并且日前出清價(jià)格與各項(xiàng)指標(biāo)數(shù)據(jù)間也并非是一種單一的線性對(duì)應(yīng)關(guān)系[16-17]。簡(jiǎn)單的用某項(xiàng)單一的影響因素來(lái)預(yù)測(cè)日前出清價(jià)格就會(huì)出現(xiàn)很大的局限性,因此單一的模型就難以實(shí)現(xiàn)準(zhǔn)確的預(yù)測(cè)效果[18]。而電廠中存在的指標(biāo)數(shù)據(jù)類型繁多,各項(xiàng)指標(biāo)數(shù)據(jù)對(duì)于日前出清價(jià)格的影響也各不相同,盲目地將所有指標(biāo)作為日前出清價(jià)格的影響因素會(huì)降低強(qiáng)相關(guān)指標(biāo)數(shù)據(jù)對(duì)于日前出清價(jià)格的影響權(quán)重,從而導(dǎo)致預(yù)測(cè)效果受到干擾。
相比于機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等算法,盡管基于日前披露數(shù)據(jù)相似性的預(yù)測(cè)算法對(duì)于數(shù)據(jù)量的依賴要更小,但歷史數(shù)據(jù)的質(zhì)量同樣會(huì)影響預(yù)測(cè)結(jié)果,若數(shù)據(jù)過(guò)少或涵蓋范圍過(guò)于局限,難以找到與待預(yù)測(cè)數(shù)據(jù)近似情況或能夠查找到的最近似數(shù)據(jù)與待預(yù)測(cè)數(shù)據(jù)的結(jié)果差距過(guò)大,這些情況都會(huì)影響最終的預(yù)測(cè)效果。
為了保證算法的可行性,確定歷史披露數(shù)據(jù)能否足夠支撐預(yù)測(cè)工作,本文通過(guò)層次聚類方法對(duì)歷史披露數(shù)據(jù)進(jìn)行聚類分析,將歷史數(shù)據(jù)按照日前出清價(jià)格分為若干個(gè)組。日前披露數(shù)據(jù)每15分鐘進(jìn)行一次測(cè)點(diǎn)記錄,每天產(chǎn)生96條測(cè)點(diǎn)數(shù)據(jù)。由于數(shù)據(jù)存在不完全連續(xù)的情況,本文使用了2020年8月、11月和12月三個(gè)月的數(shù)據(jù)進(jìn)行了分析,并用前71個(gè)自然日的測(cè)點(diǎn)數(shù)據(jù)模擬歷史數(shù)據(jù),以12月后21個(gè)自然日的測(cè)點(diǎn)數(shù)據(jù)模擬待預(yù)測(cè)數(shù)據(jù)。如表1、表2所示,分別統(tǒng)計(jì)了模擬歷史數(shù)據(jù)和模擬待預(yù)測(cè)數(shù)據(jù)的出清價(jià)格分布情況。
表1 模擬歷史數(shù)據(jù)出清價(jià)格區(qū)間分布情況Tab.1 Distribution of clearing price range of simulated historical data
續(xù)表1
表2 模擬預(yù)測(cè)數(shù)據(jù)出清價(jià)格區(qū)間分布情況Tab.2 Distribution of clearing price range of simulated forecast data
通過(guò)聚類分析可以發(fā)現(xiàn),日前出清價(jià)格多集中在中低價(jià)格段,價(jià)格極高的極端情況相對(duì)較為少見(jiàn)。在模擬歷史數(shù)據(jù)中,價(jià)格高于400的數(shù)據(jù)占比僅為2.6%。在模擬的測(cè)試數(shù)據(jù)中,高于400的數(shù)據(jù)占比僅為1.9%。因此根據(jù)聚類分析的結(jié)果可知,2020年8月、11月和12月三個(gè)月中前71個(gè)自然日的模擬歷史數(shù)據(jù)基本已經(jīng)能夠涵蓋模擬預(yù)測(cè)數(shù)據(jù)中的絕大部分情況。盡管當(dāng)前的試運(yùn)行數(shù)據(jù)較少并且不連續(xù),但是歷史數(shù)據(jù)仍然對(duì)日前出清價(jià)格的預(yù)測(cè)有著較為重要的意義。
盡管模擬歷史數(shù)據(jù)中某些情況較為少見(jiàn),如日前出清價(jià)格在800-900、1035-1200以及1248-1400等區(qū)間段時(shí),缺少可用的歷史數(shù)據(jù)進(jìn)行支持,因此若待預(yù)測(cè)數(shù)據(jù)出現(xiàn)在這些區(qū)間時(shí),算法就不能準(zhǔn)確地預(yù)測(cè)出日前出清價(jià)格。但是通過(guò)觀察模擬的待預(yù)測(cè)數(shù)據(jù)可以發(fā)現(xiàn),在這些區(qū)間內(nèi)分布的數(shù)據(jù)同樣不常見(jiàn),出清價(jià)格高于800的情況,在模擬歷史數(shù)據(jù)占比僅為1.1%,而在模擬預(yù)測(cè)數(shù)據(jù)中占比甚至不超過(guò)1%。即使出現(xiàn)了類似的情況也可以在這類情況發(fā)生后將該情況添加到歷史數(shù)據(jù)中,為后續(xù)的預(yù)測(cè)提供經(jīng)驗(yàn)。從數(shù)據(jù)的分布情況上可以看出兩個(gè)月左右的歷史數(shù)據(jù)基本可以滿足預(yù)測(cè)的需要。
為了增強(qiáng)算法的預(yù)測(cè)能力,每當(dāng)出清價(jià)格結(jié)果更新時(shí)就將該條記錄加入到歷史數(shù)據(jù)庫(kù)中,這樣即使某一天的待預(yù)測(cè)數(shù)據(jù)中出現(xiàn)了歷史數(shù)據(jù)中沒(méi)有的情況,也可以及時(shí)將這種情況記錄下來(lái),為后續(xù)的預(yù)測(cè)提供指導(dǎo)。隨著歷史數(shù)據(jù)庫(kù)的擴(kuò)充,歷史數(shù)據(jù)中涵蓋的數(shù)據(jù)指標(biāo)的組合情況也會(huì)更加豐富,預(yù)測(cè)的精度和準(zhǔn)確性也就進(jìn)一步提高。
傳統(tǒng)的相似日法中需要對(duì)各影響因素相似度的權(quán)重進(jìn)行賦值[19]。在電力市場(chǎng)出清價(jià)格預(yù)測(cè)問(wèn)題中,人工賦值的方式極大地依賴于研究者的市場(chǎng)經(jīng)驗(yàn),若研究者的市場(chǎng)經(jīng)驗(yàn)不足,那么設(shè)置的參數(shù)就可能不合理。并且不同市場(chǎng)情況存在差異,某一地區(qū)的市場(chǎng)難以適應(yīng)其他地區(qū)的市場(chǎng),尤其在面對(duì)復(fù)雜市場(chǎng)情況時(shí),已有經(jīng)驗(yàn)也很有可能出現(xiàn)偏差。
本文使用皮爾森相關(guān)系數(shù)來(lái)衡量各指標(biāo)與日前出清價(jià)格之間的相關(guān)性程度,以確定各指標(biāo)數(shù)據(jù)對(duì)日前出清價(jià)格的影響[20]。使用相關(guān)系數(shù)分析方法確定的參數(shù)值能夠根據(jù)市場(chǎng)的實(shí)際情況進(jìn)行動(dòng)態(tài)調(diào)整,通過(guò)自適應(yīng)的求解參數(shù)可以增強(qiáng)算法的準(zhǔn)確性和通用性,避免了人為經(jīng)驗(yàn)賦值對(duì)預(yù)測(cè)結(jié)果造成的偏差,將不同的指標(biāo)類型對(duì)于日前出清價(jià)格的影響程度進(jìn)行量化,并且參與到實(shí)際的相似性計(jì)算之中。
(1)
為了解決各項(xiàng)指標(biāo)數(shù)據(jù)與日前出清價(jià)格之間相關(guān)性程度不同的問(wèn)題,本文將各指標(biāo)數(shù)據(jù)與日前出清價(jià)格的相關(guān)性進(jìn)行了量化處理并作為相關(guān)系數(shù)參與到了相似性的計(jì)算當(dāng)中。
由公式(1)可知,相關(guān)性的計(jì)算結(jié)果取值范圍處于[-1,1]之間,當(dāng)指標(biāo)數(shù)據(jù)與日前出清價(jià)格的相關(guān)性絕對(duì)值越接近1時(shí),說(shuō)明該指標(biāo)對(duì)日前出清價(jià)格的影響程度就越大。由于指標(biāo)數(shù)據(jù)與日前出清價(jià)格的相關(guān)性程度會(huì)影響到數(shù)據(jù)之間相似性的計(jì)算,因此在計(jì)算相似性時(shí)就需要將各指標(biāo)數(shù)據(jù)與日前出清價(jià)格的相關(guān)性考慮在內(nèi)。
當(dāng)某項(xiàng)指標(biāo)數(shù)據(jù)與日前出清價(jià)格的相關(guān)性越高時(shí),該指標(biāo)數(shù)據(jù)的計(jì)算結(jié)果對(duì)相似性的影響要高于與日前出清價(jià)格的相關(guān)性較低的指標(biāo)。當(dāng)待預(yù)測(cè)數(shù)據(jù)與歷史數(shù)據(jù)中兩種指標(biāo)的距離相同的情況下,與日前出清價(jià)格相關(guān)性更強(qiáng)的指標(biāo)對(duì)兩條數(shù)據(jù)相似性程度的決定權(quán)重更高。
ξ(x,y)=1-|r|
(2)
本文基于指標(biāo)數(shù)據(jù)與日前出清價(jià)格的相關(guān)性,建立了一種相關(guān)系數(shù)計(jì)算方法。如公式(2)所示,ξ(x,y)為指標(biāo)數(shù)據(jù)與日前出清價(jià)格間的影響系數(shù),r為指標(biāo)數(shù)據(jù)與日前出清價(jià)格間的相關(guān)性計(jì)算結(jié)果。當(dāng)歷史數(shù)據(jù)與待預(yù)測(cè)數(shù)據(jù)中的某項(xiàng)指標(biāo)具有較強(qiáng)的相關(guān)性時(shí),其相關(guān)系數(shù)越小。在指標(biāo)數(shù)據(jù)的差值上乘以該相關(guān)系數(shù)會(huì)使兩個(gè)數(shù)據(jù)在該指標(biāo)上計(jì)算出的距離變得更小,最終會(huì)認(rèn)定相關(guān)性更強(qiáng)的指標(biāo)對(duì)相似性的影響要更大。
本文提出的相似性計(jì)算方法是在對(duì)應(yīng)指標(biāo)數(shù)據(jù)上計(jì)算均方誤差并乘以對(duì)應(yīng)相關(guān)系數(shù)的方式,以此來(lái)衡量待預(yù)測(cè)數(shù)據(jù)與歷史數(shù)據(jù)的差異程度。計(jì)算的結(jié)果越小就說(shuō)明兩個(gè)數(shù)據(jù)之間的相似性越強(qiáng),日前出清價(jià)格也就越接近。
表3 相關(guān)系數(shù)樣例Tab.3 Example of correlation coefficient
(3)
在進(jìn)行預(yù)測(cè)時(shí),算法會(huì)按照公式3給出的計(jì)算公式將待預(yù)測(cè)數(shù)據(jù)與歷史數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行一一比對(duì),并找到相似距離最低的歷史數(shù)據(jù),將該日期的日前出清價(jià)格作為預(yù)測(cè)結(jié)果。同樣以上文中表3的情況為例,歷史數(shù)據(jù)A與待預(yù)測(cè)數(shù)據(jù)的計(jì)算結(jié)果Sa就會(huì)變?yōu)棣蝍·(100-120)2+ξb·(50-50)2,最終的相似性距離Sa=400ξa。采用相同的計(jì)算方法,歷史數(shù)據(jù)B與待預(yù)測(cè)數(shù)據(jù)的相似性距離Sb=400ξb。假設(shè)此處指標(biāo)A與日前出清價(jià)格的相關(guān)性ra要強(qiáng)于指標(biāo)B與日前出清價(jià)格的相關(guān)性rb。由本文2.1節(jié)可知,計(jì)算指標(biāo)與日前出清價(jià)格的相關(guān)性程度越高,相關(guān)性系數(shù)越小,因此ξa<ξb,最終使得Sa 在進(jìn)行計(jì)算的過(guò)程中,可能會(huì)出現(xiàn)多條歷史記錄與待預(yù)測(cè)數(shù)據(jù)的計(jì)算結(jié)果相似的情況,這時(shí)應(yīng)當(dāng)選取時(shí)間最接近待預(yù)測(cè)數(shù)據(jù)的歷史數(shù)據(jù)作為最終結(jié)果。這是因?yàn)槲锢砹康淖兓厔?shì)更多地取決于歷史時(shí)段中近期的發(fā)展規(guī)律,相比之下,遠(yuǎn)期的歷史數(shù)據(jù)與待預(yù)測(cè)數(shù)據(jù)的相關(guān)性比近期數(shù)據(jù)更弱。尤其在試運(yùn)行及電力市場(chǎng)探索階段,由于交易規(guī)則、運(yùn)營(yíng)模式等情況的變動(dòng),交易用戶會(huì)根據(jù)市場(chǎng)情況不斷的調(diào)整各自的交易策略,這就導(dǎo)致不同時(shí)間段的市場(chǎng)交易情況都有所不同,而每個(gè)時(shí)間段內(nèi)的交易情況會(huì)更加相似,因此近期的交易數(shù)據(jù)參考價(jià)值更高。 盡管直接采用歷史日前出清價(jià)格作為預(yù)測(cè)結(jié)果會(huì)存在一定的誤差,即使在兩個(gè)數(shù)據(jù)極其相似的情況下,日前出清價(jià)格也會(huì)存在差異,但從聚類分析時(shí)可知,相似數(shù)據(jù)的存在的區(qū)域較為狹窄,基本都處在一個(gè)較小的值域之內(nèi),因此該方法還是能預(yù)測(cè)出一個(gè)較為準(zhǔn)確的結(jié)果。并且隨著交易數(shù)據(jù)量增多,歷史數(shù)據(jù)的數(shù)量也會(huì)不斷進(jìn)行累積,在進(jìn)行長(zhǎng)期的預(yù)測(cè)時(shí),實(shí)際的出清價(jià)格會(huì)不斷地更新到歷史數(shù)據(jù)庫(kù)中,歷史數(shù)據(jù)中包含的日前出清價(jià)格的涵蓋范圍也會(huì)增加,預(yù)測(cè)結(jié)果會(huì)不斷得到修正,使最終得到的結(jié)果更加準(zhǔn)確。 本文選取了某區(qū)域電力市場(chǎng)交易試運(yùn)行數(shù)據(jù)上2020年8月、11月和12月三個(gè)月的數(shù)據(jù)進(jìn)行了測(cè)試,以8月、11月以及12月前10天的數(shù)據(jù)模擬歷史出清數(shù)據(jù),對(duì)之后21天的出清價(jià)格進(jìn)行預(yù)測(cè)。日前披露數(shù)據(jù)中包括了日前出清價(jià)格、負(fù)荷預(yù)測(cè)情況、機(jī)組容量情況、輸送電情況等31項(xiàng)指標(biāo)的情況,指標(biāo)數(shù)據(jù)每15分鐘進(jìn)行一次更新記錄,每天共有96條測(cè)點(diǎn)數(shù)據(jù)。經(jīng)過(guò)相關(guān)性分析和歷史披露數(shù)據(jù)分析等分析后,在原始數(shù)據(jù)的基礎(chǔ)上,選取了與日前出清數(shù)據(jù)相關(guān)性絕對(duì)值大于0.4的指標(biāo)項(xiàng)作為實(shí)驗(yàn)的樣本。 本文在92天共計(jì)8832條測(cè)點(diǎn)數(shù)據(jù)上進(jìn)行了實(shí)驗(yàn),將前6816條測(cè)點(diǎn)數(shù)據(jù)模擬為歷史數(shù)據(jù),對(duì)后續(xù)2016個(gè)測(cè)點(diǎn)進(jìn)行了預(yù)測(cè),得到了如圖2所示的結(jié)果。 圖2 預(yù)測(cè)值與實(shí)際值對(duì)比圖Fig.2 Comparison of predicted value and actual value 從圖2中可以看出,本文提出的方法在實(shí)際的運(yùn)用中具有較為準(zhǔn)確的效果,尤其是在大多數(shù)較為規(guī)律的周期中,預(yù)測(cè)的結(jié)果都較為準(zhǔn)確。但同樣也有一些不準(zhǔn)確的預(yù)測(cè)存在,如在一些含有突變點(diǎn)的測(cè)點(diǎn)位置,預(yù)測(cè)的結(jié)果會(huì)存在著少量的偏差。這是因?yàn)橄啾扔诰哂休^強(qiáng)規(guī)律性和周期性的負(fù)荷預(yù)測(cè),電力市場(chǎng)交易還會(huì)在很大程度上受到競(jìng)爭(zhēng)、供求關(guān)系等人為因素以及輸電阻塞、網(wǎng)損或線損等環(huán)境因素的影響,進(jìn)而產(chǎn)生“價(jià)格釘”的問(wèn)題,表現(xiàn)出價(jià)格的隨機(jī)波動(dòng)性和突然跳躍性[21],尤其在風(fēng)電[22-23]、水電[24]、光伏[25]等一些受環(huán)境影響因素較大的能源上表現(xiàn)更為明顯,當(dāng)發(fā)電負(fù)荷產(chǎn)生較大的波動(dòng)時(shí),就會(huì)直接反應(yīng)在價(jià)格波動(dòng)上[26-28]。當(dāng)這些數(shù)據(jù)存在于歷史數(shù)據(jù)中時(shí),就會(huì)導(dǎo)致算法預(yù)測(cè)出的部分結(jié)果產(chǎn)生一定的偏差,將部分正常的日前出清價(jià)格預(yù)測(cè)為價(jià)格較高的價(jià)格釘。但與整體的預(yù)測(cè)結(jié)果相比,價(jià)格釘?shù)那闆r本身就是一個(gè)較為少數(shù)的情況,在數(shù)據(jù)量較少的情況下,價(jià)格釘出現(xiàn)的頻率也就更低,盡管可以通過(guò)人工合成樣本增加價(jià)格釘出現(xiàn)的頻率以提高對(duì)于價(jià)格釘?shù)念A(yù)測(cè)準(zhǔn)確率,但伴隨著人工合成樣本比重的增加,這些樣本會(huì)影響其他類型樣本的預(yù)測(cè)準(zhǔn)確率。 此外,本文搭建了一個(gè)SVR模型[29](支持向量回歸, support vector regression)以及一個(gè)具有4個(gè)隱藏層的LSTM模型(長(zhǎng)短期記憶網(wǎng)絡(luò), Long Short-Term Memory)用于算法效果的對(duì)比。其中LSTM模型的批尺寸為64,迭代次數(shù)為50次,采用adam作為優(yōu)化器。 如表3所示,展示了三種算法在21天共計(jì)2016個(gè)測(cè)點(diǎn)數(shù)據(jù)上的均方根誤差結(jié)果。 通過(guò)表4可以看出,在數(shù)據(jù)量少且數(shù)據(jù)中間存在時(shí)間不連續(xù)的情況下,基于日前披露數(shù)據(jù)的相似性的預(yù)測(cè)方法要明顯優(yōu)于其他兩種方法。由于數(shù)據(jù)量和數(shù)據(jù)條件的限制,在實(shí)驗(yàn)的過(guò)程中SVR對(duì)于價(jià)格釘?shù)念A(yù)測(cè)出現(xiàn)了很大偏差,在數(shù)據(jù)波動(dòng)和跳躍過(guò)大時(shí),均不能準(zhǔn)確的進(jìn)行預(yù)測(cè);而在LSTM模型中則出現(xiàn)了較為明顯的過(guò)擬合現(xiàn)象,隨著訓(xùn)練的進(jìn)行,訓(xùn)練集的損失會(huì)逐漸減少,但用模擬的待預(yù)測(cè)數(shù)據(jù)的損失反而會(huì)增大,最終導(dǎo)致了預(yù)測(cè)結(jié)果的不佳。因此在國(guó)內(nèi)現(xiàn)有電力市場(chǎng)數(shù)據(jù)較為缺乏的情況下,通過(guò)相似性模型來(lái)預(yù)測(cè)日前出清價(jià)格是一種較為合適的預(yù)測(cè)方法。 表4 三種算法比較結(jié)果Tab.4 Comparison results of three algorithms 本文運(yùn)用了一種基于日前披露數(shù)據(jù)相似性的出清價(jià)格預(yù)測(cè)算法,通過(guò)在日前披露數(shù)據(jù)中尋找相似條件的歷史數(shù)據(jù),對(duì)出清價(jià)格進(jìn)行預(yù)測(cè)。首先計(jì)算各指標(biāo)數(shù)據(jù)與出清價(jià)格的相關(guān)性確定各指標(biāo)對(duì)出清價(jià)格的影響權(quán)重,選出相關(guān)性大于0.4的指標(biāo)作為影響因素。通過(guò)計(jì)算待預(yù)測(cè)數(shù)據(jù)各指標(biāo)與歷史數(shù)據(jù)各指標(biāo)之間距離,結(jié)合之前計(jì)算出的各指標(biāo)數(shù)據(jù)的權(quán)重,搜索到相似性最高的歷史數(shù)據(jù),最終給出預(yù)測(cè)結(jié)果。通過(guò)在某區(qū)域電力市場(chǎng)的交易數(shù)據(jù)上的實(shí)驗(yàn)結(jié)果,證明本文提出的方法在實(shí)際的區(qū)域電力市場(chǎng)交易應(yīng)用中具有較好的精度和可行性。本文提出的方法基于統(tǒng)計(jì)原理,無(wú)需進(jìn)行大量訓(xùn)練的過(guò)程,對(duì)于設(shè)備的性能要求較低,在工程實(shí)踐中也有較好的應(yīng)用和參考價(jià)值。2.3 實(shí)驗(yàn)與分析
3 結(jié)論