胡 陽(yáng), 喬依林
(華北電力大學(xué)控制與計(jì)算機(jī)工程學(xué)院, 北京市 102206)
隨著大數(shù)據(jù)時(shí)代到來(lái),面對(duì)風(fēng)電運(yùn)行管理維護(hù)的巨大挑戰(zhàn)[1],國(guó)內(nèi)專家學(xué)者紛紛聚焦風(fēng)電大數(shù)據(jù),但因棄風(fēng)限電現(xiàn)象嚴(yán)峻,可靠完整風(fēng)電數(shù)據(jù)獲取困難,在風(fēng)電特性建模、風(fēng)功率預(yù)測(cè)等研究工作中[2-3],勢(shì)必會(huì)降低建模、預(yù)測(cè)等應(yīng)用的準(zhǔn)確度。因此,有必要通過(guò)技術(shù)手段清洗風(fēng)機(jī)歷史運(yùn)行數(shù)據(jù),以得到有效、完整的風(fēng)功率數(shù)據(jù)。這對(duì)提高風(fēng)電場(chǎng)理論功率恢復(fù)的可靠性、合理評(píng)價(jià)風(fēng)電場(chǎng)及集群運(yùn)行的安全性和經(jīng)濟(jì)性等相關(guān)研究工作具有重大意義[4]。
異常數(shù)據(jù)主要表現(xiàn)為超出機(jī)組安全運(yùn)行邊界或違背機(jī)組正常運(yùn)行特性,其主要來(lái)源包括異常天氣引發(fā)風(fēng)輪氣動(dòng)特性改變、風(fēng)機(jī)關(guān)鍵設(shè)備故障維修以及棄風(fēng)限電造成風(fēng)機(jī)停機(jī)或限負(fù)荷運(yùn)行等。在此背景下異常數(shù)據(jù)清洗主要存在3種方法:①根據(jù)風(fēng)機(jī)運(yùn)行特性進(jìn)行簡(jiǎn)單識(shí)別和剔除;②根據(jù)異常數(shù)據(jù)特征選擇合適的識(shí)別剔除方法;③建立非線性風(fēng)功率曲線模型識(shí)別剔除異常數(shù)據(jù)。文獻(xiàn)[5]基于出廠功率曲線,采用組內(nèi)方差清洗算法識(shí)別剔除異常數(shù)據(jù),與現(xiàn)場(chǎng)實(shí)際結(jié)合不緊密,處理結(jié)果存在較大誤差;文獻(xiàn)[6-7]分析了傳統(tǒng)統(tǒng)計(jì)學(xué)和新興不確定理論在電力系統(tǒng)中的應(yīng)用及意義,系統(tǒng)闡述了不確定理論體系的基本概念及其關(guān)系,指明電力系統(tǒng)分析中引入不確定理論的必要性,給出其應(yīng)用性能評(píng)估指標(biāo)。缺失數(shù)據(jù)重構(gòu)重點(diǎn)是建立填補(bǔ)模型,插值法最為常用,如拉格朗日或牛頓多項(xiàng)式法插值,但存在高階插值大幅度波動(dòng)現(xiàn)象;分段低次插值可有效提高準(zhǔn)確度和穩(wěn)定性,如分段線性或三次Hermite插值法,其中前者插值函數(shù)導(dǎo)數(shù)是間斷的,后者插值函數(shù)滿足導(dǎo)數(shù)連續(xù)要求,而且還滿足插值節(jié)點(diǎn)函數(shù)值、一階甚至高階導(dǎo)數(shù)與被插函數(shù)一致,具有較高插值精度。文獻(xiàn)[8]和文獻(xiàn)[9]分別針對(duì)不同工程實(shí)踐應(yīng)用中的連續(xù)函數(shù)或線條中存在的缺失情況,提出基于Hermite插值法分段構(gòu)造插值函數(shù)再整合求解的策略并分析優(yōu)化插值間距,給出相應(yīng)取值區(qū)間,缺失重構(gòu)效果顯著。分析本文風(fēng)速、功率數(shù)據(jù)的重構(gòu)特點(diǎn),其本身就是離散序列且采樣間隔遠(yuǎn)小于以上文獻(xiàn)中給出的建議取值區(qū)間,滿足分段Hermite插值法的應(yīng)用要求。
本文利用風(fēng)電場(chǎng)數(shù)據(jù)采集與監(jiān)控(SCADA)系統(tǒng)中的歷史運(yùn)行數(shù)據(jù),首先基于風(fēng)機(jī)運(yùn)行機(jī)理及運(yùn)行策略、Copula理論[10-12]等建立精細(xì)化置信等效功率邊界模型,識(shí)別剔除異常數(shù)據(jù),提高數(shù)據(jù)的有效性;其次,采用分段三次Hermite插值法重構(gòu)缺失數(shù)據(jù),提高數(shù)據(jù)完整性;然后,定義置信度帶寬比等性能指標(biāo)評(píng)估清洗后數(shù)據(jù)的質(zhì)量;最后,提出了基于k折交叉驗(yàn)證的數(shù)據(jù)清洗模型校驗(yàn)策略并進(jìn)行算例分析。引入條件概率、置信區(qū)間等概念來(lái)描述風(fēng)速、功率實(shí)測(cè)數(shù)據(jù)分布特性,更加符合客觀事實(shí);相比于傳統(tǒng)3-sigma法直接構(gòu)造邊界模型,本文邊界模型首先采用機(jī)理法分段劃間隔進(jìn)行初篩剔除,然后分區(qū)域建立邊界模型,顯然本文方法對(duì)異常數(shù)據(jù)識(shí)別剔除更加精細(xì)化、精準(zhǔn)率更高;最后,針對(duì)具體應(yīng)用問(wèn)題選取合適數(shù)據(jù)重構(gòu)方法,高效準(zhǔn)確地填補(bǔ)重構(gòu)缺失數(shù)據(jù),為風(fēng)機(jī)(風(fēng)電場(chǎng))功率恢復(fù)、預(yù)測(cè)等相關(guān)研究提供可靠、完整的基礎(chǔ)數(shù)據(jù)。
風(fēng)功率自身存在顯著不確定性,給異常數(shù)據(jù)識(shí)別剔除帶來(lái)了挑戰(zhàn),因而引入基于概率統(tǒng)計(jì)方法的置信等效功率曲線帶來(lái)描述風(fēng)功率數(shù)據(jù)不確定性。首先,基于風(fēng)機(jī)運(yùn)行機(jī)理和策略分段精細(xì)化剔除,如圖1所示,在各分段區(qū)域結(jié)合風(fēng)速、風(fēng)輪轉(zhuǎn)速和功率關(guān)聯(lián)運(yùn)行特性給出三維聯(lián)合邊界,該邊界考慮變量不確定性,引入縮放系數(shù)形成彈性運(yùn)行邊界,初篩剔除異常數(shù)據(jù)。然后,在此基礎(chǔ)上結(jié)合風(fēng)機(jī)運(yùn)行策略,將其風(fēng)速—功率散點(diǎn)圖進(jìn)行區(qū)域劃分,根據(jù)風(fēng)機(jī)運(yùn)行機(jī)理,區(qū)域Ⅰ未達(dá)到切入風(fēng)速,初篩即可準(zhǔn)確剔除;區(qū)域Ⅱ,Ⅲ,Ⅳ內(nèi)運(yùn)行控制策略不盡完全相同,但風(fēng)機(jī)整體運(yùn)行狀態(tài)相對(duì)穩(wěn)定,在初篩剔除基礎(chǔ)上結(jié)合核密度估計(jì)和Copula理論求取置信等效功率邊界線。
圖1 基于運(yùn)行區(qū)域劃分的三維聯(lián)合分段篩選示意圖Fig.1 Schematic diagram of three-dimensional united segment selection based on operation region partition
一般情況下,三葉片水平軸雙饋風(fēng)機(jī)的全工況運(yùn)行策略可以劃分為如下5個(gè)運(yùn)行區(qū)間,如圖1所示。以相同采樣周期采集不同時(shí)段下的風(fēng)速V、轉(zhuǎn)速ωr和功率P時(shí)間序列,結(jié)合風(fēng)機(jī)機(jī)電系統(tǒng)的物理運(yùn)行安全極限得到如下數(shù)據(jù)剔除過(guò)程。
1)區(qū)域Ⅰ:當(dāng)0≤V 綜上所述,根據(jù)以上剔除原則分段精細(xì)化初篩剔除異常數(shù)據(jù)。需要強(qiáng)調(diào)的是,第1)步和第4)步可選擇性分段,第2)步和第3)步必須分段,適當(dāng)分段區(qū)間大小會(huì)達(dá)到良好的初篩剔除效果,大大增加了有效數(shù)據(jù)量的占比。 經(jīng)初篩剔除后基于Copula函數(shù)建立置信等效功率曲線帶模型[11],進(jìn)一步剔除異常數(shù)據(jù)。對(duì)區(qū)域Ⅱ,Ⅲ,Ⅳ采用二元Copula函數(shù)來(lái)描述風(fēng)速、功率之間相關(guān)性[12],建立置信等效功率邊界線模型。 采用核密度估計(jì)法分別統(tǒng)計(jì)區(qū)域Ⅱ,Ⅲ,Ⅳ內(nèi)風(fēng)速、功率邊緣概率分布情況,根據(jù)其聯(lián)合頻率分布直方圖,分別選取合適的Copula函數(shù),其中區(qū)域Ⅱ,Ⅲ,Ⅳ依次呈現(xiàn)上尾部、對(duì)稱尾部、下尾部特性,依次選取二元Gumbel Copula函數(shù)、二元Frank Copula函數(shù)、二元Clayton Copula函數(shù)。 1)基于Copula函數(shù)構(gòu)造風(fēng)速—功率聯(lián)合概率分布函數(shù)C(FP(P),FV(V),ψ),采用半?yún)?shù)法擬合未知相關(guān)參數(shù)ψ,確定C(FP(P),FV(V)),給定基于核密度估計(jì)求取的風(fēng)速累積概率分布取值,可得到功率累積概率分布取值的條件概率分布函數(shù): (1) 式中:FV(V)和FP(P)分別為采用核密度估計(jì)得到的風(fēng)速V和輸出功率P的邊緣累積概率分布函數(shù)。 (2) 在不同風(fēng)速區(qū)間段內(nèi)根據(jù)風(fēng)速值的變化,依次計(jì)算相應(yīng)置信度條件下對(duì)應(yīng)的輸出功率上、下分位點(diǎn),即可得到區(qū)域Ⅱ,Ⅲ,Ⅳ上置信等效功率邊界線。選用多臺(tái)某型號(hào)風(fēng)機(jī)全年運(yùn)行數(shù)據(jù),不斷修正該等效功率邊界線,直至達(dá)到基本穩(wěn)定,確定具有一定泛化能力等效功率邊界模型,可直接清洗該型號(hào)風(fēng)機(jī)的風(fēng)速、功率運(yùn)行數(shù)據(jù)。 利用前述邊界模型清洗風(fēng)機(jī)數(shù)據(jù),處理后數(shù)據(jù)中必然存在數(shù)據(jù)遺漏,數(shù)據(jù)完整性遭到破壞,不利于數(shù)據(jù)進(jìn)一步分析利用,有必要在時(shí)間序列上重構(gòu)風(fēng)速、功率數(shù)據(jù)中存在的小段缺失數(shù)據(jù)。分析本文應(yīng)用實(shí)際,顯然缺失數(shù)據(jù)一般分為非連續(xù)點(diǎn)和連續(xù)點(diǎn),其中前者可直接利用Hermite插值法構(gòu)造插值函數(shù),對(duì)缺失數(shù)據(jù)點(diǎn)進(jìn)行填補(bǔ);后者為進(jìn)一步提高數(shù)據(jù)填補(bǔ)精度,采用分段Hermite插值法構(gòu)造插值函數(shù)依次填補(bǔ)缺失數(shù)據(jù)點(diǎn)。 根據(jù)Hermite插值理論及其應(yīng)用要求,選取典型的兩點(diǎn)三次Hermite插值法,即已知互異節(jié)點(diǎn)xk和xk+1及相應(yīng)函數(shù)值gi和一階導(dǎo)數(shù)值gi′(i=k,k+1),則存在唯一Hermite插值多項(xiàng)式H3(x)在節(jié)點(diǎn)xk和xk+1之間滿足:H3(x)=g(x),H3′(x)=g′(x)。采用基函數(shù)法解得: (3) 實(shí)際應(yīng)用過(guò)程中,從風(fēng)電場(chǎng)數(shù)據(jù)系統(tǒng)中僅可獲取風(fēng)速、功率時(shí)間序列上數(shù)據(jù)即僅已知插值節(jié)點(diǎn)函數(shù)值,其一階導(dǎo)數(shù)值用插值節(jié)點(diǎn)與鄰近已知節(jié)點(diǎn)差商近似獲得,即gi′=(gi-gm)/(xi-xm),其中i=k,m=k-1或i=k+1,m=k+2。 針對(duì)處理后數(shù)據(jù)的質(zhì)量評(píng)估,本文提出新方法。首先,按照區(qū)域劃分,分別采用核密度估計(jì)法統(tǒng)計(jì)、對(duì)比數(shù)據(jù)清洗前后的概率分布特性,定性分析數(shù)據(jù)處理效果,直觀考量數(shù)據(jù)完整性及有效性;然后,定義置信度帶寬比χ作為主要性能評(píng)價(jià)指標(biāo),同時(shí)選取一些描述統(tǒng)計(jì)量如偏度ξ、峰度γ等共同構(gòu)成數(shù)據(jù)質(zhì)量評(píng)價(jià)體系,其中置信度帶寬比定義:顯著性水平α條件下,置信度1-α與其對(duì)應(yīng)置信區(qū)間之比,如式(4)所示(以功率為統(tǒng)計(jì)變量)。 (4) 置信度帶寬比反映數(shù)據(jù)的有效性,值越大數(shù)據(jù)可利用率越高;偏度反映數(shù)據(jù)分布的對(duì)稱特性,絕對(duì)值越小數(shù)據(jù)分布越對(duì)稱;峰度反映數(shù)據(jù)在峰值附近的集中程度,值越大分布越集中。 考慮數(shù)據(jù)建模對(duì)樣本量的要求及模型正確性、穩(wěn)定性和可靠性評(píng)估,這里采用k折交叉驗(yàn)證法校驗(yàn)?zāi)P?。按照不同區(qū)域劃分,分別對(duì)其置信等效功率邊界線模型進(jìn)行k折交叉驗(yàn)證。計(jì)算置信度帶寬比、偏度、峰度等性能評(píng)價(jià)指標(biāo),各指標(biāo)收斂穩(wěn)定,完成邊界模型校驗(yàn)。 將原始數(shù)據(jù)隨機(jī)k等分得到子集樣本,各子集依次作為校驗(yàn)集,剩余k-1個(gè)子集作為訓(xùn)練集,得到各校驗(yàn)集的評(píng)價(jià)指標(biāo)值,各取均值作為本次k等分后模型校驗(yàn)指標(biāo)值,多次隨機(jī)k等分重復(fù)計(jì)算。 為驗(yàn)證前述所提數(shù)據(jù)剔除、重構(gòu)、模型校驗(yàn)等方法的合理性、有效性,隨機(jī)選取國(guó)內(nèi)某風(fēng)電場(chǎng)中2臺(tái)同型號(hào)風(fēng)機(jī)為樣本機(jī),采集2016年1月1日至2016年12月31日歷史運(yùn)行數(shù)據(jù)進(jìn)行算例分析,采樣周期為10 min。風(fēng)機(jī)型號(hào)為UP82-1500,基本參數(shù)如下:切入、切出、額定風(fēng)速及額定轉(zhuǎn)速對(duì)應(yīng)風(fēng)速依次為3,20,10.8,9.2 m/s;最低、最高及額定轉(zhuǎn)速依次為9,17.4,17.3 r/min;額定功率為1.5 MW。 風(fēng)機(jī)1和2采集整年數(shù)據(jù)分別為51 012個(gè)和50 711個(gè)風(fēng)速—功率數(shù)據(jù)對(duì),以單臺(tái)風(fēng)機(jī)V-P原始數(shù)據(jù)散點(diǎn)圖為基礎(chǔ),按區(qū)域Ⅱ,Ⅲ,Ⅳ統(tǒng)計(jì)風(fēng)速、功率聯(lián)合概率分布情況,對(duì)應(yīng)選取合適Copula函數(shù)建立置信等效功率邊界線模型,直接清洗原始數(shù)據(jù);構(gòu)造分段兩點(diǎn)三次Hermite插值多項(xiàng)式分別在風(fēng)速、功率時(shí)間序列上插值重構(gòu)缺失段(點(diǎn))。處理前后V-P數(shù)據(jù)散點(diǎn)圖及置信等效功率邊界線模型見(jiàn)下文4.2節(jié)。數(shù)據(jù)處理統(tǒng)計(jì)情況如下:風(fēng)機(jī)1和風(fēng)機(jī)2初篩剔除、邊界線模型剔除及插值填補(bǔ)數(shù)據(jù)量依次為29 261和27 195,2 520和2 247,445和513,占比依次為57.4%和53.6%,4.49%和4.43%,2.31%和2.41。由圖及統(tǒng)計(jì)數(shù)據(jù)可知,該方法為識(shí)別剔除風(fēng)機(jī)運(yùn)行數(shù)據(jù)中的異常數(shù)據(jù)提供了合理有效方法,能夠高效完成原始數(shù)據(jù)清洗,合理提取風(fēng)速、功率有效數(shù)據(jù),具有一定普適性。 基于處理后高質(zhì)量風(fēng)功率數(shù)據(jù),結(jié)合Bin法和最小二乘法求取風(fēng)機(jī)理論功率曲線,實(shí)現(xiàn)理論功率恢復(fù)計(jì)算,修復(fù)風(fēng)電功率時(shí)間序列上大段的缺失數(shù)據(jù),對(duì)比基于出廠功率曲線的恢復(fù)計(jì)算值,分別計(jì)算實(shí)測(cè)功率與兩組恢復(fù)值之間的平均絕對(duì)百分比誤差(MAPE)、均方根誤差(RMSE)及平均誤差(ME)等性能指標(biāo)[20],對(duì)其進(jìn)行定量評(píng)估,風(fēng)機(jī)1和風(fēng)機(jī)2實(shí)測(cè)功率與本文方法/出廠功率曲線法功率恢復(fù)值之間的MAPE,RMSE,ME性能指標(biāo)計(jì)算結(jié)果如表1所示,二者功率時(shí)序圖如圖2所示。 表1 性能指標(biāo)計(jì)算結(jié)果Table 1 Calculation results of performance index 圖2 風(fēng)功率時(shí)序圖Fig.2 Sequence diagram of wind power MAPE公式如下: (5) 式中:xi和yi(i=1,2,…)分別表示風(fēng)機(jī)功率實(shí)測(cè)值和理論值。 由圖2可知,兩種方法理論恢復(fù)值均處在邊界線內(nèi),充分說(shuō)明了邊界線模型的科學(xué)合理性,其中本文方法對(duì)應(yīng)理論恢復(fù)值更貼近實(shí)測(cè)功率;由性能指標(biāo)計(jì)算結(jié)果可知,本文方法恢復(fù)值與實(shí)測(cè)功率數(shù)據(jù)之間偏離度更低,吻合度更高。 4.1節(jié)已表明針對(duì)不同風(fēng)機(jī)原始數(shù)據(jù),清洗方法均可實(shí)現(xiàn)高占比異常數(shù)據(jù)識(shí)別剔除,且進(jìn)一步可高效修復(fù)風(fēng)電功率。本節(jié)對(duì)文中提出的置信等效功率邊界模型評(píng)價(jià)及校驗(yàn)策略進(jìn)行算例實(shí)施。按區(qū)域Ⅱ,Ⅲ,Ⅳ統(tǒng)計(jì)處理前后數(shù)據(jù)的概率分布特性,概率密度分布圖定性對(duì)比及評(píng)價(jià)指標(biāo)定量比較,不同區(qū)域功率概率密度分布如圖3所示,性能指標(biāo)計(jì)算結(jié)果如表2所示。 由圖3及表2中指標(biāo)結(jié)果可知,各區(qū)域數(shù)據(jù)均更加貼近風(fēng)電功率規(guī)律特性,各項(xiàng)性能指標(biāo)明顯改變,直觀反映了本文方法處理后數(shù)據(jù)一致性、完整性等特性顯著改善,使用價(jià)值明顯提升。 考慮本文方法與直接Copula法(不考慮風(fēng)機(jī)運(yùn)行區(qū)間劃分的本文方法)及傳統(tǒng)3-sigma法進(jìn)行對(duì)比,基于原始數(shù)據(jù)依次分別建立功率邊界線模型,清洗數(shù)據(jù)。不同邊界模型如圖4所示,性能指標(biāo)計(jì)算結(jié)果如表3所示。 圖3 功率概率統(tǒng)計(jì)圖Fig.3 Statistical diagram of power probability 風(fēng)機(jī)編號(hào)分區(qū)處理前處理后χξγχξγ區(qū)域Ⅱ0.174 1.409 1.4520.196 1.058 1.919 1區(qū)域Ⅲ0.029-0.815-0.7120.052 0.168-0.152區(qū)域Ⅳ0.021-1.752 0.4090.084-1.399 1.989 區(qū)域Ⅱ0.163 1.331 1.3620.181 0.989 1.775 2區(qū)域Ⅲ0.031-0.632-0.5320.041 0.213-0.354區(qū)域Ⅳ0.026-1.657 0.3780.068-1.217 1.534 圖4 不同邊界線模型對(duì)比圖Fig.4 Contrast diagram of different boundary line models 由圖4可知,相比于3-sigma模型,本文模型在整個(gè)區(qū)域內(nèi)對(duì)異常數(shù)據(jù)的識(shí)別率顯著提高,相比于直接Copula模型,本文模型在區(qū)域Ⅱ和Ⅲ內(nèi)對(duì)異常數(shù)據(jù)的誤識(shí)別率明顯降低,數(shù)據(jù)識(shí)別更精準(zhǔn),精細(xì)劃區(qū)建模效果顯著;另一方面從表3中指標(biāo)結(jié)果可見(jiàn),風(fēng)機(jī)實(shí)測(cè)數(shù)據(jù)經(jīng)本文方法清洗后數(shù)據(jù)質(zhì)量顯著提高,風(fēng)功率數(shù)據(jù)的完整性、一致性及準(zhǔn)確性等特性明顯改善。 針對(duì)區(qū)域Ⅱ利用本文所提出的k折交叉檢驗(yàn)法,對(duì)該段邊界線模型進(jìn)行實(shí)例校驗(yàn),綜合考慮后本文取k=3。 表3 性能指標(biāo)計(jì)算結(jié)果Table 3 Calculation results of performance index 風(fēng)速—功率數(shù)據(jù)樣本容量為1.2×105對(duì),5次三等分隨機(jī)抽取各樣本子集容量4×104對(duì),風(fēng)機(jī)1(風(fēng)機(jī)2)性能指標(biāo)置信度帶寬比、偏度、峰度5次均值標(biāo)準(zhǔn)差依次為0.004 3,0.001 1,0.009 3(0.004 4,0.004 7,0.004 8)。 顯然所提邊界模型建立方案是可行的,模型校驗(yàn)表明其具有良好的穩(wěn)定性,對(duì)數(shù)據(jù)具有良好適應(yīng)性,一定時(shí)間段內(nèi)滿足數(shù)據(jù)清洗精度。 本文選取風(fēng)電場(chǎng)SCADA系統(tǒng)中歷史運(yùn)行數(shù)據(jù)為研究對(duì)象,分析其運(yùn)行特性并根據(jù)風(fēng)機(jī)運(yùn)行機(jī)理實(shí)施數(shù)據(jù)初篩并基于Copula函數(shù)劃區(qū)建立置信等效功率邊界模型,給出一定風(fēng)速下風(fēng)機(jī)理論功率邊界值作為其不確定性描述,可實(shí)現(xiàn)異常數(shù)據(jù)直接識(shí)別剔除,且全面考慮了風(fēng)速隨機(jī)波動(dòng)性及機(jī)械運(yùn)轉(zhuǎn)風(fēng)機(jī)能量轉(zhuǎn)換時(shí)必然存在的抖動(dòng)性;采用分段兩點(diǎn)三次Hermite插值法重構(gòu)缺失數(shù)據(jù),數(shù)據(jù)完整性得到改善;定義置信度帶寬比等性能指標(biāo)綜合評(píng)價(jià)數(shù)據(jù)清洗質(zhì)量,處理后數(shù)據(jù)質(zhì)量明顯提高,制定模型評(píng)價(jià)體系和校驗(yàn)機(jī)制,直觀表征邊界模型優(yōu)良特性。最后,利用風(fēng)機(jī)實(shí)測(cè)數(shù)據(jù)進(jìn)行算例分析,可知上述數(shù)據(jù)清洗方法有效避免了機(jī)組檢修、故障、限電等情況對(duì)SCADA系統(tǒng)中風(fēng)電數(shù)據(jù)結(jié)構(gòu)分布造成破壞,處理后正常數(shù)據(jù)占比顯著提升,表明所提方法的有效性及合理性,為今后風(fēng)功率預(yù)測(cè)、風(fēng)機(jī)理論功率恢復(fù)、風(fēng)機(jī)故障診斷等研究奠定堅(jiān)實(shí)基礎(chǔ)。 此外,本文尚存在如下不足:各區(qū)域風(fēng)速功率之間相關(guān)特性復(fù)雜,需要優(yōu)化選取單一Copula函數(shù)或混合Copula函數(shù),以建立準(zhǔn)確的置信等效功率邊界模型;數(shù)據(jù)重構(gòu)過(guò)程中發(fā)現(xiàn)分段三次Hermite法對(duì)大段缺失數(shù)據(jù)填補(bǔ)效果欠佳,有必要對(duì)其進(jìn)行深入研究??紤]到上述不足及其對(duì)風(fēng)速功率數(shù)據(jù)清洗、風(fēng)機(jī)/風(fēng)電場(chǎng)功率恢復(fù)及預(yù)測(cè)、性能評(píng)價(jià)、效益評(píng)估等相關(guān)工作的影響,后續(xù)研究將進(jìn)一步開(kāi)展。1.2 基于Copula理論的置信等效功率邊界建模
2 基于分段三次Hermite插值法的數(shù)據(jù)重構(gòu)
3 數(shù)據(jù)清洗模型評(píng)價(jià)及驗(yàn)證
3.1 數(shù)據(jù)清洗質(zhì)量評(píng)價(jià)指標(biāo)
3.2 k折交叉驗(yàn)證法模型驗(yàn)證
4 算例分析
4.1 數(shù)據(jù)清洗模型建立
4.2 模型評(píng)價(jià)及校驗(yàn)
5 結(jié)語(yǔ)