王士興,陳樹恒,劉群英,韓 楊,CHEN Zhe,胡維昊
(1. 電子科技大學(xué) 機械與電氣工程學(xué)院,四川 成都 611731;2. 電子科技大學(xué) 自動化工程學(xué)院,四川 成都 611731;3. 奧爾堡大學(xué) 能源技術(shù)系,丹麥 奧爾堡9220)
2021 年,我國政府將實現(xiàn)碳達峰和碳中和目標的時間表寫入政府工作報告中,大力發(fā)展清潔能源是實現(xiàn)該目標的重要途徑之一,但風電等清潔能源規(guī)模的不斷擴大將會給電網(wǎng)帶來更多的不確定性,這些不確定性會極大地影響電力系統(tǒng)運行的穩(wěn)定性、安全性和經(jīng)濟性,計及多風電場間的相關(guān)性,建立風電功率的隨機性模型對進一步研究電力系統(tǒng)概率潮流和概率優(yōu)化問題具有重要意義[1]。
近年來,國內(nèi)外學(xué)者對風電功率的隨機性與相關(guān)性建模問題進行了大量研究[2]。文獻[3]借助線性相關(guān)因子和秩相關(guān)系數(shù)構(gòu)建相依性模型,實現(xiàn)了對多風電場相關(guān)關(guān)系的描述,但該模型的計算精度較低。針對該問題,文獻[4]在風電功率建模時引入混合Copula 模型,文獻[5-6]對混合滕結(jié)構(gòu)的Copula模型進行改進,文獻[7]將核密度估計法與Copula函數(shù)相結(jié)合以實現(xiàn)數(shù)據(jù)采樣,這些改進均在一定程度上提高了風電功率隨機性模型的性能,然而,受地理、氣候等因素的影響,不同區(qū)域多風電場間的相依程度是不同的,Copula 函數(shù)在描述不同隨機性模型時的精度差別較大。針對該問題,文獻[8]提出利用高斯混合模型GMM(Gaussian Mixture Model)對多風電場相關(guān)性進行描述,理論上該模型可以描述任意隨機性分布,文獻[9]進一步對GMM 的定義域進行修正并設(shè)計歸一化的基于截斷的分布模型,雖然這些改進在一定程度上提高了聯(lián)合分布模型的精度,但模型的精度仍受到樣本數(shù)據(jù)分布因素的影響。
概率潮流計算是分析隨機風電功率接入后電力系統(tǒng)潮流分布的有效方法。蒙特卡羅抽樣方法是一種經(jīng)典的概率潮流計算方法,但在面對較大規(guī)模的電網(wǎng)時,該方法的計算效率較低[10]。相比較而言,基于隨機變量平均值、標準差、偏度和峰度等數(shù)據(jù)特征的2m+1 點估計法[11]利用較少的采樣數(shù)據(jù)點即可求得滿足精確度要求的計算結(jié)果。
針對現(xiàn)有研究的不足,本文進一步改進GMM 并提出一種相對完整、精準的基于GMM 的多風電場相關(guān)性建模方法,并將該方法應(yīng)用于電力系統(tǒng)概率潮流計算。與傳統(tǒng)的風電功率隨機性建模方法和基本高斯混合建模方法相比,本文方法的創(chuàng)新點如下:通過引入補償系數(shù)建立截斷式GMM,該模型在描述多風電場相關(guān)性時具有明顯的擬合精度優(yōu)勢;基于數(shù)據(jù)篩選過程提出一種改進的參數(shù)計算方法,該方法有效地提高了模型的精度和求解速度;在點估計法框架下,設(shè)計一種基于計算機數(shù)值求解的改進Nataf變換求解算法,該算法解決了傳統(tǒng)Nataf變換的積分求解難題。
決定風電場特性的是風速或風電功率數(shù)據(jù),受地理、氣候等因素影響,不同地區(qū)風電場風速的概率分布模型不同。風電功率Pw與風速v直接相關(guān),兩者之間的關(guān)系如附錄A式(A1)所示。
附錄B圖B1(a)、(b)分別為某年內(nèi)每隔5 min記錄的某風電場100 m 高處的風速數(shù)據(jù)和歸一化風電功率數(shù)據(jù),共計105 120 個數(shù)據(jù)點。受切入風速、額定風速和切出風速的影響,風電功率在0 和1 p.u.的聚集性較高。然而,式(A1)沒有考慮風速時序、恢復(fù)風速條件和風機狀態(tài)等因素影響,實際上,基于式(A1)將風速轉(zhuǎn)換形成的功率數(shù)據(jù)與實際功率數(shù)據(jù)之間存在一定的差距。本文將使用風電功率數(shù)據(jù)對多風電場的相關(guān)關(guān)系進行建模,以直接降低在將風速轉(zhuǎn)換為風電功率的過程中產(chǎn)生的誤差。
1.2.1 GMM基本原理
GMM 是多個高斯分布函數(shù)的疊加組合,即總體的概率分布模型由多個子高斯模型構(gòu)成,高斯分布良好的數(shù)學(xué)品質(zhì)使得GMM具有較高的應(yīng)用潛能[12]。附錄A式(A2)—(A4)給出了高斯函數(shù)的概率模型。
1.2.2 GMM求解方法
通常利用極大似然估計MLE(Maximum Likelihood Estimation)近似求解GMM,如式(1)所示。
本節(jié)將結(jié)合多風電場出力聯(lián)合分布特性對基于GMM 的建模方法進行改進,包括篩選模型訓(xùn)練數(shù)據(jù)、改進模型概率函數(shù)和簡化參數(shù)判斷準則。
圖1 為兩風電場功率的聯(lián)合分布直方圖(圖中風電場1 功率和風電場2 功率均為標幺值,后同)。由圖可見,模型在等邊際點0 處的分布密度過高,由于GMM 由多個子高斯模型疊加構(gòu)成,密度過高的邊際點會影響子高斯模型的參數(shù)求解過程,進而影響GMM 的擬合精度,為了提高參數(shù)求解精度,需要提前篩選GMM的訓(xùn)練數(shù)據(jù)。
圖1 歸一化的風電功率聯(lián)合分布直方圖Fig.1 Histogram of joint distribution of normalized wind power
篩選邊際點首先要利用核密度估計法,其是一種用于估計未知密度函數(shù)的非參數(shù)檢驗方法。附錄B圖B2為GMM訓(xùn)練數(shù)據(jù)的篩選流程,利用核密度估計法計算各點的概率密度,篩選出聯(lián)合分布中概率密度過高點,對剩余點重復(fù)該篩選過程,直至篩選后的數(shù)據(jù)滿足式(2)。
式中:ppoint為篩選后點的概率密度;pmax為模型概率密度的最大值;pedge為篩選出的概率密度過高點的概率密度。圖2 為篩選后歸一化的風電功率聯(lián)合分布直方圖。由圖可見,篩選后的聯(lián)合分布直方圖中聚集區(qū)分布清晰且無過高密度點,篩選出的邊際點數(shù)量少且分布集中,其概率模型通過直接統(tǒng)計獲得。
圖2 篩選后歸一化的風電功率聯(lián)合分布直方圖Fig.2 Histogram of joint distribution of normalized wind power after screening
引入數(shù)據(jù)篩選過程后,用于GMM 建模的數(shù)據(jù)量與實際聯(lián)合分布的數(shù)據(jù)量是不同的,需要按照式(3)在GMM中添加補償系數(shù)以修正模型概率。
式中:pfact為修正概率模型的概率密度函數(shù);kscr為篩選過程形成的概率模型修正系數(shù);pGMM為對應(yīng)低密度數(shù)據(jù)區(qū)的GMM 概率密度函數(shù);Nall為原始聯(lián)合分布訓(xùn)練數(shù)據(jù)點數(shù);Nmid為篩選后的訓(xùn)練數(shù)據(jù)點數(shù)。
數(shù)據(jù)篩選過程極大地減少了數(shù)據(jù)聚集分布特性對GMM精度的影響,提高了模型精確度和適用性。
GMM 通過迭代過程進行求解,在處理大量樣本數(shù)據(jù)時,求解該模型的計算復(fù)雜度極高。在GMM中,概率密度受單一子高斯模型的影響較大,求解GMM 的關(guān)鍵是確定子高斯模型的數(shù)量,即聚集區(qū)數(shù)量。對于大量樣本數(shù)據(jù),k-means算法可以快速求解聚集區(qū)數(shù)量,因此,本文利用該算法判斷聚集區(qū)數(shù)量,從而確定子高斯模型的數(shù)量以降低參數(shù)求解過程的復(fù)雜度。
在k-means算法中,評價聚集程度的核心指標是誤差平方和SSE(Sum of Squared Errors)[13]:
式中:vSSE為SSE 指標;k為聚集區(qū)數(shù)量;Ci為第i個簇;xp為Ci中樣本點的位置;mi為第i個簇的質(zhì)心。
判斷樣本數(shù)據(jù)聚類數(shù)的一種常見方法是手肘法。隨著k的增大,樣本簇的數(shù)量增加,每個簇的聚合程度提高,vSSE降低。當k小于真實聚類數(shù)時,k增大可以明顯提高每個簇的聚合程度,vSSE迅速降低;當k達到真實聚類數(shù)時,隨著k的繼續(xù)增大,vSSE的變化趨于平緩。圖3為vSSE、MLE 負值與k的函數(shù)關(guān)系。MLE 是判斷GMM 擬合程度的重要指標,其值越大,擬合效果越好。由圖可見:vSSE與k的關(guān)系呈現(xiàn)一個手肘形狀,肘部拐點可以在一定程度上反映真實聚類數(shù);隨著k的增大,vSSE與MLE 負值的變化趨勢相同,通過vSSE的變化可以確定子高斯模型數(shù)量。由于k-means 算法的計算復(fù)雜度遠低于求解GMM 的EM算法,因此,借助k-means算法可以縮短計算時間。
圖3 vSSE、MLE負值與k的關(guān)系Fig.3 Relationship between vSSE,negative value of MLE and k
GMM 的定義域與歸一化的風電功率聯(lián)合分布模型的定義域不同,本文通過式(5)對GMM 的概率密度函數(shù)進行改進,設(shè)計截斷式GMM 來描述聯(lián)合分布模型。
式中:pimp為改進后的GMM 函數(shù)概率密度;X為多維隨機變量;sgn(·)為階躍函數(shù),一維的sgn(·)定義如式(6)所示;ptrun( )X|θ為截斷前的GMM 概率密度函數(shù),θ為未知參數(shù)向量。
式中:x為一維隨機變量。
利用基于迭代的EM 算法求解改進的GMM 參數(shù),并利用式(7)增加的補償系數(shù),得到最終的參數(shù)。
式中:ktrun為截斷引入的概率補償系數(shù);Ptrun為原始概率函數(shù)。引入補償系數(shù)的截斷式GMM 可以較好地適應(yīng)歸一化的風電場功率數(shù)據(jù)的分布,其定義域準確,描述效果好。
改進的多風電場歸一化功率描述模型為:
點估計法計算過程簡單,描述準確,適用于獨立的隨機變量。結(jié)合Nataf變換的點估計法,可對多個相關(guān)隨機變量進行采樣。本文提出一種基于Nataf變換的求解方法,使點估計法可應(yīng)用于更復(fù)雜的模型。
對于一維隨機變量函數(shù)Z=Z(x),可以在標準正態(tài)變量空間中取適量點描述數(shù)據(jù)特征,2m+1 點估計法應(yīng)用廣泛,計算精度高[14]。附錄C 表C1 為基于Gauss-Hermite 積分方法計算得到的三點估計法、五點估計法和七點估計法的獨立正態(tài)隨機變量的采樣點與相應(yīng)權(quán)重。在滿足計算要求的情況下,本文選取三點估計法來降低計算量。
Nataf 變換可實現(xiàn)相關(guān)隨機變量組與獨立正態(tài)變量組的轉(zhuǎn)換[15],Nataf 變換過程如附錄B 圖B3 所示。在Nataf正變換中,通過式(9)將n維原始隨機變量X=[x1,x2,…,xn]轉(zhuǎn)換為n維相關(guān)正態(tài)隨機變量Y=[y1,y2,…,yn],再通過式(10)利用Nataf變換矩陣B將相關(guān)正態(tài)隨機變量轉(zhuǎn)換為n維獨立正態(tài)隨機變量Z=[z1,z2,…,zn]。其中,xi(i=1,2,…,n)為第i維隨機變量,yi(i=1,2,…,n)為第i維相關(guān)正態(tài)隨機變量,zi(i=1,2,…,n)為第i維不相關(guān)正態(tài)隨機變量。
式中:Φ( )· 為標準正態(tài)分布的累計函數(shù);Fi(xi)為第i維隨機變量的原始分布函數(shù)。式(10)中矩陣B是通過Cholesky 分解對稱正定矩陣ρ0得到的下三角矩陣,如式(11)所示。
式中:ρij表示xi和xj間的相關(guān)性;ui、uj分別為xi、xj的期望;σi、σj分別為xi、xj的標準差;ρ0ij表示zi和zj間的相關(guān)性;φij(zi,zj,ρ0ij)為具有相關(guān)系數(shù)的聯(lián)合分布函數(shù)。
Nataf 變換是一種求解多變量相關(guān)關(guān)系的成熟算法。常見的變量相關(guān)關(guān)系可以利用式(12)的積分求解函數(shù)進行求解。對于復(fù)雜模型,可以利用半經(jīng)驗公式對其進行簡化再利用式(12)進行求解。半經(jīng)驗公式僅能對Copula函數(shù)、多次函數(shù)、冪函數(shù)等進行變換求解,其應(yīng)用范圍限制了Nataf 變換的求解效果,當待求解函數(shù)不能表示為上述函數(shù)之和時,基于半經(jīng)驗函數(shù)的Nataf 變換中的相關(guān)關(guān)系系數(shù)往往不可解或者求解過程過于復(fù)雜。當隨機變量使用帶有離散變量的改進截斷式GMM 描述時,半經(jīng)驗公式的缺陷導(dǎo)致Nataf 變換矩陣B無法求解,針對該問題,本文設(shè)計一種Nataf估算變換來替代半經(jīng)驗公式,形成一種具有較低計算復(fù)雜度和較高精確度的求解算法。
確定性潮流的約束方程可以表示為:
式中:R為輸出變量,包括發(fā)電機機端電壓、線路傳輸有功功率Pij、線路傳輸無功功率Qij;G(·)為基于節(jié)點導(dǎo)納矩陣的函數(shù)[16];Xin為輸入變量,包括各節(jié)點的有功功率Pi和無功功率Qi、補償無功功率Qin等?;诟倪M點估計法的概率潮流計算流程如附錄B 圖B4所示。
仿真實驗平臺是搭載64位Windows操作系統(tǒng)的計算機,CPU 為Intel Core i5-8265U,1.60 GHz,RAM為8 GB,程序開發(fā)語言為MATLAB 2018b。
本文使用美國東海岸2 座風電場的風電功率數(shù)據(jù),數(shù)據(jù)來自WIND Toolkit。分別使用高斯Copula函數(shù)、t分布Copula函數(shù)[10]、傳統(tǒng)GMM分布函數(shù)[17]和改進的GMM 分布函數(shù)對歸一化功率相關(guān)關(guān)系進行建模,并對各模型進行比較。
1)改進的GMM擬合精度。
圖4 為不同模型對2 座風電場相關(guān)功率的擬合圖。由圖可知,在描述模型時,3 種常規(guī)模型均存在較大的誤差。為定量分析模型的精度,本文選用二階歐氏距離d作為評價指標,如式(15)所示。
表1為4種模型的二階歐氏距離。由表可知,改進的GMM精度相較于其他模型具有明顯優(yōu)勢。
表1 4種模型的二階歐氏距離比較Table 1 Comparison of second-order Euclideandistance among four models
2)篩選過程在提高模型精度中的效果。
為提高擬合精度,本文設(shè)計了基于核密度估計法的篩選過程。圖5 為數(shù)據(jù)篩選后改進的GMM 擬合圖,篩選點主要為(0,0)、(1,1) p.u.。由圖可知,篩選過程解決了GMM 受訓(xùn)練數(shù)據(jù)制約的問題,篩選后的數(shù)據(jù)擬合圖完整反映了2 座風電場功率數(shù)據(jù)分布的相關(guān)關(guān)系。對比表1 的傳統(tǒng)GMM 和改進的GMM精度可知,引入篩選過程的GMM誤差僅為傳統(tǒng)GMM誤差的15%。表2 為數(shù)據(jù)篩選前后改進的GMM 的MLE,由表可知,篩選過程顯著提高了模型的精度。改進的GMM模型參數(shù)如附錄C表C2所示。
圖5 數(shù)據(jù)篩選后改進的GMM擬合圖Fig.5 Fitting diagram of improved GMM after data selection
表2 MLE比較Table 2 Comparison of MLE
3)改進參數(shù)計算方法的優(yōu)勢。
求解參數(shù)須先選擇合適的k值,假設(shè)k的取值范圍為1~9,表3 為基于2 種計算方法求解k值的計算時間。由表可知,基于k-means 算法通過vSSE判斷k值的計算時間相較于直接求解明顯縮短。
表3 2種計算方法的計算時間對比Table 3 Comparison of calculation time between two calculation methods
利用Nataf 估算變換得到三點估計法的采樣結(jié)果,如附錄C 表C3 所示?;诟怕食绷鲾?shù)字仿真實驗驗證本文所提概率潮流計算方法的準確性和計算效率優(yōu)勢。實驗基于IEEE 18 節(jié)點系統(tǒng),節(jié)點2、17、18 各接入1 座功率為40 kW 的風電場?;谌c估計法與蒙特卡羅抽樣方法得到的計算時間如表4 所示,基于2 種方法得到的節(jié)點15 電壓的概率分布圖如圖6 所示。其中,蒙特卡羅抽樣方法的樣本點規(guī)模為10000。由表4可知,在保證實際精度要求的條件下,三點估計法大幅縮短了計算時間,提高了計算效率。圖6 中,受到采樣點較少的影響,2 種方法得到的分布圖僅能大致擬合,但三點估計法基本滿足實際分析需求。
表4 基于三點估計法和蒙特卡羅抽樣方法得到的計算時間Table 4 Calculation time obtained by three-point estimation method and Monte Carlo sampling method單位:s
圖6 基于三點估計法和蒙特卡羅抽樣方法得到的節(jié)點15電壓的概率分布Fig.6 Probabilistic distribution of voltage at Bus 15 obtained by three-point estimation method and Monte Carlo sampling method
附錄C 表C4給出了IEEE 18節(jié)點系統(tǒng)中部分關(guān)鍵節(jié)點的電壓和線路總損耗的均值和標準差。表中,三點估計法潮流計算結(jié)果的電壓均值與實際值的相對誤差均小于0.05%,電壓標準差與實際值的相對誤差均小于5%,線路總損耗的均值、方差與實際值之間的相對誤差均較小,可滿足實際應(yīng)用需求。
本文在建立GMM 的基礎(chǔ)上,改進多風電場聯(lián)合概率分布模型的計算過程,通過數(shù)字仿真實驗得到如下結(jié)論:
1)本文基于補償系數(shù)的截斷式GMM 在函數(shù)圖像數(shù)據(jù)擬合和歐氏距離精度指標擬合方面具有明顯優(yōu)勢,歐氏距離誤差指標僅為傳統(tǒng)Copula 函數(shù)模型的2%左右;
2)本文設(shè)計的數(shù)據(jù)篩選過程解決了GMM 受訓(xùn)練數(shù)據(jù)聚集特性影響的問題,使改進的GMM 歐氏距離誤差指標降低至傳統(tǒng)GMM的20%以下;
3)采用本文設(shè)計的參數(shù)計算方法求解GMM 中的k值時,計算時間明顯縮短,相較于直接求解的計算時間約縮短了50%;
4)本文所提出的基于Nataf 估算變換的三點估計法的潮流計算方法進一步提高了計算結(jié)果的精度,與實際值相比,采用本文所提方法得到的關(guān)鍵節(jié)點電壓以及線路總損耗誤差小于5%,滿足實際應(yīng)用需求。
附錄見本刊網(wǎng)絡(luò)版(http://www.epae.cn)。