梁 濤,崔 潔,石 歡,李宗琪
(河北工業(yè)大學(xué),天津 300131)
在過去十幾年里,人們對可再生能源的利用給予了高度的重視,其中風(fēng)能的裝機容量最大,成為占比最高的可再生能源[1]。風(fēng)電機組功率曲線可以為風(fēng)電機組故障診斷、功率預(yù)測等工作提供一定的理論依據(jù)。然而由于制作商提供的功率曲線都是在特定的測試環(huán)境下給出的,不同風(fēng)電場所處的地理環(huán)境不同,即使是同一風(fēng)場內(nèi)的風(fēng)機也會因為風(fēng)機的分布位置不同和尾流效應(yīng)等因素而使每臺風(fēng)機的功率曲線都不盡相同[2]。為了更實際的了解風(fēng)機性能,需要對風(fēng)電機組功率曲線進(jìn)行擬合。
在風(fēng)機實測數(shù)據(jù)中,往往含有大量異常數(shù)據(jù)點,若不將這些異常點剔除將嚴(yán)重影響曲線擬合效果。剔除異常點通常采用的方法包括:四分位數(shù)法、k-means聚類法和基于密度聚類[3]的方法。其中,四分位數(shù)法檢測異常點的效果不穩(wěn)定,會出現(xiàn)漏檢的現(xiàn)象;k-means聚類算法初始值的確定對聚類結(jié)果有很大影響且只適用于凸數(shù)據(jù)集;基于密度聚類的方法對樣本分布不均勻的數(shù)據(jù)集通常不能得到很好的效果。
曲線擬合方法主要分為兩類:參數(shù)法和非參數(shù)法。參數(shù)法是以數(shù)學(xué)模型為基礎(chǔ)的,求出模型的各個參數(shù)就能確定該模型,如:分段線性回歸擬合法、多項式回歸擬合法[4]、基于概率分布模型的曲線擬合法等。參數(shù)模型的優(yōu)點是推理過程易于理解,便于計算。但在數(shù)據(jù)結(jié)構(gòu)復(fù)雜的情況下,參數(shù)模型的擬合效果往往不如非參數(shù)模型。非參數(shù)化方法不會預(yù)先指定函數(shù)模型,而是從數(shù)據(jù)本身獲得所需要的信息,適應(yīng)能力強,效果較穩(wěn)定。常用的非參數(shù)模型主要包括:神經(jīng)網(wǎng)絡(luò)、模糊邏輯方法等。
本文大體分為異常點剔除、曲線擬合和效果評估三個步驟。由于本研究的數(shù)據(jù)是稠密均勻的,采用帶噪聲應(yīng)用的密度空間聚類 (Density-Based Spatial Clustering of Applications with Noise,DBSCAN)算法對原始數(shù)據(jù)集進(jìn)行聚類分析,剔除異常數(shù)據(jù)點,然后以多項式回歸曲線擬合法作為基準(zhǔn)模型,對其余三種回歸模型展開了討論分析,并將它們應(yīng)用于SCADA系統(tǒng)記錄的實測數(shù)據(jù)中,最后從擬合精度方面對四種模型的擬合效果進(jìn)行評價。
圖1為河北某風(fēng)電場SCADA系統(tǒng)記錄的16號風(fēng)機從2018年1月1日至2018年1月30日期間共4320對數(shù)據(jù)的風(fēng)速-功率散點圖,由圖可見,從風(fēng)電場采集到的數(shù)據(jù)中含有很多異常點,這些異常點會對功率曲線的建模精度產(chǎn)生很大影響。
圖1 風(fēng)速-功率散點數(shù)據(jù)圖
DBSCAN是一種基于密度的聚類算法,數(shù)據(jù)點密集的區(qū)域代表了風(fēng)機運行的基準(zhǔn)狀態(tài)。DBSCAN通過半徑參數(shù)Eps和鄰域密度閾值MinPts來描述樣本分布的緊密程度。采用文獻(xiàn)[5]中的經(jīng)驗數(shù)值,取鄰域密度閾值為4,半徑參數(shù)的值通過繪制k-距離曲線方法得到,k-距離曲線圖明顯拐點位置為對應(yīng)的較好參數(shù)。剔除異常點之后的散點圖如圖2。
圖2 剔除異常點后的散點圖
曲線建模方法主要分為參數(shù)法和非參數(shù)法,到目前為止,沒有哪一種建模方法能夠在任何數(shù)據(jù)情況下都表現(xiàn)出最優(yōu)的擬合效果[6]。研究不同的功率曲線建模方法,并確定一種可以為該種類型的數(shù)據(jù)集帶來最好建模效果的方法是十分有必要的。
多項式曲線擬合已被廣泛應(yīng)用于風(fēng)力發(fā)電機組功率曲線建模技術(shù)中,其原理是用多項式函數(shù)的形式來描繪一個區(qū)域內(nèi)所有觀測點散點分布的大致走向,展開系數(shù)由最小二乘法確定。設(shè)函數(shù)的k階多項式為
P=Vβ+ε
(1)
其中
P=(p1,p2,…,pN)T,β=(β1,β2,…,βk)T,
(2)
應(yīng)用最小二乘法確定多項式系數(shù)得:
β=(VTV)-1VTP
(3)
采用經(jīng)驗法確定的多項式階數(shù)會嚴(yán)重影響擬合精度,為了獲得最佳擬合效果,通過誤差評價指標(biāo)來確定擬合階數(shù)。由圖3的運行結(jié)果可知,當(dāng)階數(shù)為12時獲得的擬合效果最好。多項式擬合功率曲線散點圖的效果如圖4。
圖3 階數(shù)選擇結(jié)果圖
圖4 多項式擬合風(fēng)速-功率曲線
多項式曲線擬合法受異常點的影響較大,尤其是在切入風(fēng)速和切出風(fēng)速附近,擬合效果欠佳。為了減弱異常點對擬合效果的影響,采用局部加權(quán)多項式方法對散點進(jìn)行擬合。局部加權(quán)多項式法屬于非參數(shù)法,對于每一個需要預(yù)測的點,都要重新根據(jù)整個數(shù)據(jù)集計算模型,使得數(shù)據(jù)本身適應(yīng)性較好,擬合精度更高,但計算量較大,訓(xùn)練時間較長。
局部加權(quán)多項式擬合在特定目標(biāo)點v0建立模型:
J(β)=arg min(P-Vβ)TWs(v0)(P-Vβ)
(4)
得系數(shù)矩陣為:
β=(VTWs(v0)V)-1VTWs(v0)P
(5)
其中Ws(v0)是權(quán)值系數(shù)矩陣,采用高斯核函數(shù)作為平滑核函數(shù)計算權(quán)值系數(shù)陣。局部加權(quán)多項式法擬合的功率曲線如圖5。
圖5 局部加權(quán)多項式擬合風(fēng)速-功率曲線
通過對比圖4和圖5的擬合曲線可以發(fā)現(xiàn),在切入風(fēng)速和切出風(fēng)速附近,局部加權(quán)多項式擬合法比多項式擬合法表現(xiàn)出了更好的性能。
雖然局部加權(quán)多項式擬合法能擬合出功率曲線模型的大致形狀,但從圖5可以看出,局部加權(quán)多項式法在拐點處的擬合效果欠佳,從而無法得到風(fēng)速與功率之間非線性關(guān)系的理想近似值。樣條擬合實際是采用分段擬合的原則,在鄰近的兩個節(jié)點之間用低階多項式來擬合該段散點,并且要在這些節(jié)點兩端保證一定的連續(xù)性使曲線光滑,從而用低階的樣條插值產(chǎn)生和高階多項式擬合類似的效果,在曲線拐點附近擬合效果良好。
最常用的樣條擬合法是三次樣條曲線擬合法,假設(shè)在區(qū)間[a,b]上有a=x0 1)B(x)在區(qū)間[a,b]上有連續(xù)的一階和二階連續(xù)導(dǎo)數(shù); 2)B(x)在每一個小區(qū)間[xi,xi+1] (i=0,…,n-1)上都是不高于三次的多項式。則稱B(x)是以x為節(jié)點的三次樣條函數(shù)。B(x)在某一節(jié)點處的函數(shù)為 Bi(x)=ai+bi(x-xi)+ci(x-xi)2+di(x-xi)3 (6) 由定義的約束條件可得 (7) 計算出 (8) 其中 hi=xi+1-xi,Di=B″(xi)(i=1,2,…,n) (9) 在自由邊界條件下,即D0=Dn=0時,將(8)帶入式(7)得式(10) (10) 解矩陣方程可得D0=D1=Dn,即可得B(x)函數(shù)表達(dá)式。圖6顯示了在使用5個和10個等距節(jié)點時,由16號風(fēng)機數(shù)據(jù)建立的三次樣條擬合模型。由于樣條擬合通過增加節(jié)數(shù)而引入了靈活性,所以三次樣條擬合在平穩(wěn)性和適應(yīng)性方面優(yōu)于多項式擬合。 圖6 三次樣條法擬合風(fēng)速-功率曲線 由圖6可以看出,三次樣條擬合法在曲線彎曲部分可以提供良好的擬合效果,保證了曲線的光滑性,但對于直線段的擬合效果不好,在三次樣條擬合的基礎(chǔ)上引入B樣條函數(shù)。B樣條函數(shù)的最大優(yōu)點就是具有局部性,即改變某一個控制點的位置只會對相鄰曲線段的擬合效果產(chǎn)生影響而不會影響整條曲線,因此采用三次B樣條擬合可以對曲線進(jìn)行小范圍調(diào)整以提高擬合精度。 p次B樣條曲線方程為: (11) 其中Pi(i=0,1,…,n)為可以改變曲線形狀的控制點,u=[u0,u1,…,um]為節(jié)點矢量,Ni,p(u) (i=0,1,…,n)為p次B樣條基函數(shù),通常由節(jié)點矢量根據(jù)Cox-deBoor遞推式(12)得出: (12) 由此,三次B樣條曲線方程為 (13) 在計算準(zhǔn)均勻三次B樣條曲線時會使曲線的首末端點與首末型值點相對應(yīng),內(nèi)部型值點依序作為擬合曲線的分段點,則由型值點qi(i=0,1,…,n)擬合出來的曲線共有n段,需要的控制點Pj(j=0,1,…,n+2)共有n+3個,節(jié)點矢量為u=[u0,u1,…,un+6],為確定型值點對應(yīng)的三次B樣條基函數(shù),采用向心參數(shù)化方法計算各段所對應(yīng)的節(jié)點為 u0=u1=u2=u3=0, un+3=un+4=un+5=un+6=1 (14) 將式(14)帶入式(12)即可得出三次B樣條基函數(shù)。 由位于曲線上的的型值點和三次B樣條基函數(shù)即可反求出所需的各個控制點,由(13)即可擬合出所需的風(fēng)速功率曲線。 準(zhǔn)均勻三次B樣條擬合法通過10個型值點擬合出的風(fēng)速-功率曲線如圖7。 圖7 三次B樣條曲線擬合 圖8為四種曲線擬合方法得到的風(fēng)速-功率曲線。 圖8 四種功率曲線對比 由于風(fēng)電機組風(fēng)速-功率的散點圖呈帶狀分布,各個散點與擬合出的曲線之間存在一定的距離[7],為了評估各個模型擬合曲線的能力,本文選用MAE(平均絕對誤差)、RMSE(均方根誤差)和R2(R平方)來評價模型精度。 (15) (16) (17) 為了更準(zhǔn)確的反映各種方法的曲線擬合能力,根據(jù)風(fēng)電場風(fēng)機位置分布圖分別選取距離16號風(fēng)機近的23號風(fēng)機和距離較遠(yuǎn)的7號風(fēng)機對擬合效果進(jìn)行驗證,對兩臺風(fēng)機同樣選取從2018年1月1日至2018年1月30日期間共4320對數(shù)據(jù)進(jìn)行散點圖的擬合。各建模方法的誤差計算結(jié)果見表1。 表1 各建模方法誤差計算結(jié)果 考慮到風(fēng)電機組功率曲線的精確建模對于風(fēng)電機組狀態(tài)監(jiān)測及功率預(yù)測有著重要的意義,本文提出了四種估算風(fēng)電機組功率曲線的參數(shù)和非參數(shù)模型,以多項式擬合法為基準(zhǔn)展開討論。多項式擬合法受異常點影響較大,若想獲得較高的擬合精度必須采用高階多項式進(jìn)行擬合,但階數(shù)過高容易產(chǎn)生過擬合的現(xiàn)象,由此,引入了局部加權(quán)擬合法。局部加權(quán)擬合法受異常點的影響較小,可以大致擬合出曲線輪廓,但在曲線拐點處擬合效果欠佳。三次樣條擬合法通過增加一系列節(jié)點來引入靈活性,克服了局部加權(quán)擬合法的缺點而對直線段的擬合容易產(chǎn)生較大波動。最后,提出了三次B樣條曲線擬合法,它即保留了三次樣條的優(yōu)點又克服了其缺點。 本文選取三臺風(fēng)力發(fā)電機對所提出的方法進(jìn)行了性能分析,使用四種誤差評價指標(biāo)來評估每種方法的準(zhǔn)確性。研究結(jié)果表明,與其它分析方法相比,三次B樣條擬合法具有更好的性能。3.4 三次B樣條
4 模型性能評估
5 結(jié)論