李常生,許星煜,石 磊,李 揚,靳文麗
(國網(wǎng)甘肅省電力有限公司酒泉供電公司,甘肅 酒泉 735000)
經(jīng)濟的快速發(fā)展,電力需求的不斷提高,現(xiàn)有容量已經(jīng)不能滿足實際情況。隨著客戶申請新裝、增容的數(shù)量不斷增加,客戶新裝、增容也成為電力負(fù)荷預(yù)測不可忽略的一部分。負(fù)荷預(yù)測的準(zhǔn)確性將直接影響到電力企業(yè)投資、電力系統(tǒng)網(wǎng)絡(luò)布局及運行的合理性。另外,根據(jù)準(zhǔn)確的電力負(fù)荷預(yù)測結(jié)果可以經(jīng)濟合理地安排電網(wǎng)內(nèi)部發(fā)電機組的啟停,保持電網(wǎng)運行的安全穩(wěn)定性,減少不必要的旋轉(zhuǎn)儲備容量,合理安排機組檢修計劃,保障社會的正常生產(chǎn)和生活,有效地降低發(fā)電成本,提高經(jīng)濟效益和社會效益。所以,基于客戶新裝、增容戶數(shù)關(guān)聯(lián)分析對電力負(fù)荷預(yù)測的研究急需開展。
本文提出的基于客戶新裝、增容戶數(shù)關(guān)聯(lián)性分析下的區(qū)域用電量增長預(yù)測方法流程如圖1所示。
圖1 基于客戶新裝、增容戶數(shù)關(guān)聯(lián)性分析下的區(qū)域用電量增長預(yù)測方法流程
首先計算第t年和第t-1年對應(yīng)月份的電量差值ΔQ和對應(yīng)月份用戶新裝增容戶數(shù)差值Δn之間的皮爾遜相關(guān)系數(shù)ρxy(Pearson Correlation Coefficient)和斯皮爾曼相關(guān)系數(shù)rs(Spearman's Rank Correlation Coefficient)。
根據(jù)ρxy、rs判斷ΔQ與Δn是否存在相關(guān)關(guān)系。若兩變量之間不存在相關(guān)關(guān)系,則區(qū)域用電量預(yù)測不必考慮用戶新裝、增容戶數(shù)的影響;若存在相關(guān)關(guān)系,則根據(jù)ρxy、rs的相對大小判斷兩變量之間是否存在線性關(guān)系。
當(dāng)ρxy≈rs時,即|ρxy-rs|<ε,ε是一個很小的正數(shù),變量之間存在線性關(guān)系,利用線性回歸擬合ΔQ與Δn之間的線性表達(dá)式ΔQ=WΔn+b。當(dāng)ΔQ與Δn之間不存在線性關(guān)系時,利用多項式擬合ΔQ與Δn之間的表達(dá)式ΔQ=,m是多項式階數(shù)。
相關(guān)性分析用來分析變量之間的相關(guān)關(guān)系。常用來描述變量之間的相關(guān)關(guān)系的指標(biāo)是皮爾遜相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù)。
皮爾遜相關(guān)系數(shù)ρxy用來度量兩個變量之間的線性關(guān)系。斯皮爾曼相關(guān)系數(shù)rs反映變量之間的變化趨勢的方向和程度。與皮爾遜相關(guān)系數(shù)相比,斯皮爾曼相關(guān)系數(shù)評估變量之間的單調(diào)關(guān)系,不易受到錯誤值和極端值的影響。
線性回歸分析常用于研究自變量與因變量之間的線性相關(guān)性[1]。線性回歸擬合參數(shù)簡單,計算量小,計算速度快,但只能擬合線性關(guān)系。
線性回歸分析的模型:
式中,βi,i=0,1,2,…,n是回歸系數(shù),且與xi,i=0,1,2,…,n無關(guān)。
若存在n個獨立觀測數(shù)據(jù)[bi,ai1,ai2,…,aim],其中,bi為y的觀察值,aij是xij的觀察值,i=1,2,…,n,j=1,2,…,m(n>m)。
由式(1)可得:
利用最小二乘估計,使得誤差平方和最小,即可得到回歸系數(shù)β,如式(3):
多項式回歸可以擬合變量之間復(fù)雜的非線性關(guān)系,但多項式回歸計算量大,并且多項式階數(shù)不易確定,計算速度慢[2]。
多項式回歸分析的模型:
式中,βi,i=0,1,2,…,m是回歸系數(shù),m是多項式階數(shù)。
假設(shè)目前存在n組數(shù)據(jù)樣本(x1,y1)、(x2,y2)、…、(xn,yn)。其中,yi為第i個樣本的輸出真實值,y^i為根據(jù)式(4)擬合的輸出值(i=1,2,…,n),最小化損失函數(shù),如式(5),即可得到最優(yōu)擬合參數(shù)β。
3.3.1 均方誤差
均方誤差(Mean Squared Error,MSE)反映了預(yù)測數(shù)據(jù)與原始數(shù)據(jù)之間的差異。
3.3.2 擬合優(yōu)度
擬合優(yōu)度是指回歸曲線對觀測值的擬合程度,反映了回歸曲線對觀測值信息的利用程度。度量擬合優(yōu)度的統(tǒng)計量是可決系數(shù)R2。R2越接近1,說明回歸曲線的觀測值擬合程度越好。假設(shè)目前存在n組數(shù)據(jù)樣本(x1,y1)、(x2,y2)、…、(xn,yn)。其中,yi為第i個樣本的輸出真實值,y^i為擬合值(i=1,2,…,n)。定義兩個指標(biāo):總平方和SST和回歸平方和SSR,如式(6)。
可決系數(shù)R2的公式:
本文選取3個典型地區(qū)電量數(shù)據(jù),時間范圍為2017年1月到2019年12月,共36個數(shù)據(jù)點,包括月份用電量和當(dāng)月用戶新裝、增容戶數(shù)。
電量差值ΔQ與用戶新裝、增容戶數(shù)差值△n的相關(guān)系數(shù)見表1。
表1 ΔQ與Δn的相關(guān)系數(shù)
由表1可以看出,地區(qū)1的ΔQ與Δn沒有相關(guān)關(guān)系,所以在用電量預(yù)測時,可以不用考慮用戶新裝、增容戶數(shù)對用電量的影響。地區(qū)2的ρxy和rs都比較大,且兩者的值接近,所以地區(qū)2的ΔQ與Δn有強線性關(guān)系,可以用線性回歸擬合。地區(qū)3的ΔQ與Δn具有相關(guān)關(guān)系,但ρxy明顯小于rs,所以兩者可以用多項式擬合。
調(diào)用matlab2018a工具箱cftool對地區(qū)2進(jìn)行線性回歸擬合,如圖2所示。
圖2 地區(qū)2ΔQ與Δn的線性回歸圖
圖2中,在置信度為95%的情況下,擬合直線為ΔQ=0.000395Δn+0.000716。擬合結(jié)果的MSE=1.741×10-6,R2=0.902,可以準(zhǔn)確地根據(jù)地區(qū)2的Δn預(yù)測出ΔQ。
調(diào)用matlab2018a工具箱cftool對地區(qū)3進(jìn)行多項式回歸擬合,如圖3所示。
圖3中,擬合曲線的最高項為3次項,系數(shù)擬合在置信度為95%的情況下,擬合曲線表達(dá)式如式(8):
圖3 地區(qū)3ΔQ與Δn的多項式回歸圖
擬合結(jié)果的MSE=0.001,R2=0.996,可以準(zhǔn)確地根據(jù)地區(qū)3的Δn預(yù)測出ΔQ。
基于受到客戶新裝增容的影響,電量的變化是單調(diào)變化這一假設(shè),本文提出基于客戶新裝、增容戶數(shù)關(guān)聯(lián)性分析下的區(qū)域用電量增長預(yù)測方法。利用皮爾遜相關(guān)系數(shù)和斯皮爾曼相關(guān)系數(shù),確定ΔQ與Δn之間的相關(guān)關(guān)系,并針對不同情況選擇不同方式擬合兩者的表達(dá)式:若ΔQ與Δn線性相關(guān),則使用線性擬合,避免復(fù)雜的多項式計算;若ΔQ與Δn非線性相關(guān),則使用多項式擬合,確保得到Δn與Δn之間精確的表達(dá)式。最后通過算例分析證明了該方法的有效性。