文 | 馬強,劉波,安宗文
?
基于核密度估計的風速建模方法﹡
文 | 馬強,劉波,安宗文
風能作為一種清潔可再生資源,正在被越來越多的國家用以發(fā)電并作為改善能源結構的一種措施。風能具有的隨機性、波動性及間歇性特點將對風電機組的安全穩(wěn)定運行帶來影響;同時,風速預測也是風功率預測的關鍵步驟之一。目前,風速模型主要從概率分布角度出發(fā)對其隨機性進行描述,當研究短周期或某些特殊時段的風速分布特性時,由于氣候變化等隨機因素影響的明顯增強,將會導致兩峰甚至多峰風速分布情況的出現(xiàn)。因此,對于多峰風速分布情況,如何對其進行有效的風速分布描述及建立相應的風速模型,具有一定的研究意義。
基于此,本文針對風速分布可能呈現(xiàn)單峰、雙峰或多峰的特性,提出一種基于核密度估計建立風速模型的方法。通過MATLAB對實測風速進行核密度估計并繪制概率密度估計值曲線;利用權重系數(shù)組合多個正態(tài)分布對概率密度估計值曲線進行擬合,從而獲得風速的概率密度函數(shù);由概率密度函數(shù)生成隨機風速樣本并通過殘差值和確定系數(shù)對擬合精度進行檢驗。
為了獲得總體概率密度分布,常用的方法有參數(shù)法和非參數(shù)法。
參數(shù)法由樣本的頻率直方圖輪廓假設總體的概率密度分布,并通過樣本對分布參數(shù)進行估計。如圖1所示,樣本的頻率直方圖輪廓呈單峰狀,近似正態(tài)分布。因此假設總體服從正態(tài)分布,并通過樣本對正態(tài)分布參數(shù)μ,σ進行估計得到總體的概率密度分布,如圖2所示。
參數(shù)法依賴于對總體分布的假設,并且對分布參數(shù)進行估計時所涉及函數(shù)常為多元函數(shù),需使用最大似然估計等方法借助編程計算獲得參數(shù)估計值,過程相對復雜。威布爾模型、權重系數(shù)組合模型都屬于參數(shù)法。
非參數(shù)法則根據(jù)某一點處概率密度值與該點附近包含樣本個數(shù)間的關系對其進行估計,無需假設總體分布及參數(shù)估計,引用經(jīng)驗密度函數(shù)^f( x )作為總體密度函數(shù)的一個非參數(shù)估計,如式(1)所示:
式中,n為樣本總數(shù);hi表示每個區(qū)間的長度,稱為帶寬; ni為該帶寬內(nèi)樣本點個數(shù)。某一點x處的概率密度估計值大小與該點附近包含的樣本點個數(shù)有關。若x附近樣本點較多,則概率密度估計值較大,反之較小。
由式(1)可知,某一點處的密度函數(shù)估計值依賴于區(qū)間的劃分。為了克服區(qū)間劃分的限制,Paren提出按照鄰域內(nèi)各點距離x的遠近來確定其貢獻大小,即核密度估計,如式(2)所示:
式中,K為核函數(shù),即某個分布的密度函數(shù),常用分布有正態(tài)分布、均勻分布等;Xi為樣本值,h為帶寬。
實際上,核函數(shù)K的選取對于概率密度估計值影響不大,而帶寬h的選取則會直接影響概率密度估計值。取較大的值則有更多的樣本點對概率密度估計值產(chǎn)生影響,生成曲線越光滑,但也丟失了部分數(shù)據(jù)信息;取較小的值,則生成曲線為不光滑折線,但能反映每個數(shù)據(jù)所包含的信息。
通過核密度估計,可以獲得各樣本點的概率密度估計值,但不能像參數(shù)法一樣獲得總體的概率密度函數(shù)。
一、 風速模型的建立
(一)以風電場的實測風速數(shù)據(jù)為基礎,利用MATLAB軟件調(diào)用ksdensity函數(shù)對實測風速數(shù)據(jù)進行核密度估計,獲取風速分布的概率密度估計值并繪制其曲線。
(二)針對概率密度估計值曲線,利用權重系數(shù)組合多個正態(tài)分布進行擬合,表達式為:
式中, n為所用正態(tài)分布個數(shù), ai、 bi、ci為分布參數(shù),i =1,2 n 。擬合過程可通過MATLAB的曲線擬合工具箱實現(xiàn),所用正態(tài)分布個數(shù)由函數(shù)f(x)曲線與概率密度估計值曲線的接近程度決定。擬合所獲得的函數(shù)f(x),即為實測風速的概率密度函數(shù)。
二、 風速模型的驗證
由擬合獲得的概率密度函數(shù)f(x),基于蒙特卡羅方法通過MATLAB編程生成符合該分布函數(shù)的隨機風速模型進行擬合精度檢驗。
(一) 殘差值ew
殘差值為實測風速vi由小到大排序后,與隨機風速模型樣本v^i之差的平方和,表達式為:
(二) 確定系數(shù)R2
確定系數(shù)是用于檢驗某種分布與原數(shù)據(jù)分布是否一致的統(tǒng)計方法,表達式為:
式中,R2越接近1,則擬合越好,模型參考價值越高。
表1 某風電場一個月實測風速數(shù)據(jù)
表2 多峰風速建模時概率密度函數(shù)參數(shù)值
表3 短期風速模型擬合精度比較
表4 某風電場2006年全年實測風速數(shù)據(jù)
表5 單峰風速建模時概率密度函數(shù)參數(shù)值
表6 長期風速模型擬合精度比較
一、風速分布呈多峰狀時
基于表1中的實測數(shù)據(jù),通過本文風速模型的建模方法,計算分析可知,當所用正態(tài)分布的個數(shù)n取5時,f(x)曲線與實測風速概率密度估計值曲線最接近,f(x)各參數(shù)的計算結果如表2所示。
根據(jù)表1中的數(shù)據(jù)(考慮到風電場方面的利益,所以只是在表1中列舉了部分數(shù)據(jù))分別繪制實測風速頻率直方圖、本文風速模型概率密度曲線及威布爾模型概率密度曲線,如圖3所示。圖3中該風電場一個月的實測風速分布呈多峰狀,本文風速模型概率密度曲線與實測風速頻率直方圖輪廓更為接近,對于多峰情況的描述更加準確。
采用蒙特卡羅方法,生成威布爾模型、本文風速模型的隨機風速樣本,并計算得到殘差值、確定系數(shù),如表3所示。表3中,本文風速模型的樣本殘差值為93.9797,遠小于威布爾模型的樣本殘差值;同時,確定系數(shù)達到99.36%,相較于威布爾模型提高了4.48%。
二、風速分布呈單峰狀時
基于美國國家可再生能源實驗室(NREL)提供的某風電場2006年全年風速數(shù)據(jù),如表4所示。基于表4中的實測數(shù)據(jù),通過本文風速模型的建模方法,計算分析可知,當所用正態(tài)分布的個數(shù)n取5時,f(x)曲線與實測風速概率密度估計值曲線最接近,f(x)各參數(shù)如表5所示。
根據(jù)表4中的數(shù)據(jù)分別繪制實測風速頻率直方圖、本文風速模型概率密度曲線、威布爾模型概率密度曲線,見圖4。圖4中,對于風速分布呈單峰狀時,本文風速模型概率密度曲線對于實測風速頻率直方圖輪廓發(fā)生細微變化處的描述更加準確,有利于還原真實的風速分布。
采用蒙特卡羅方法,生成威布爾模型、本文風速模型的隨機風速樣本,并計算得到殘差值、確定系數(shù),如表6所示。表6中,威布爾模型對于單峰風速分布具有較高的擬合精度,但本文方法風速模型在擬合精度上仍高于威布爾模型。
本文基于核密度估計提出了一種建立風速模型的方法,并通過MATLAB軟件分別對實測風速分布呈單峰、多峰的情況進行了擬合。由擬合結果得出以下結論:本文方法所建模型對于單峰、多峰風速分布均具有較高的擬合精度,能夠為風能預測以及可靠性評估等研究提供更加準確的風速模型。
(作者單位:蘭州理工大學機電工程學院)
基金項目:﹡國家科學自然基金(51265025)——《基于載荷條件及失效相關的風電齒輪箱壽命建?!?/p>