夏麗麗, 蘇 華
(1.西南交通大學(xué) 數(shù)學(xué)學(xué)院,成都 610031;2.四川航天長(zhǎng)征裝備制造有限公司,成都 610199)
風(fēng)能是清潔的可再生能源,發(fā)展風(fēng)能對(duì)于改善能源結(jié)構(gòu)、保護(hù)生態(tài)環(huán)境等方面有及其重要的意義。中國(guó)地形分布復(fù)雜,除了沿海地區(qū)、高原地區(qū)存在豐富的風(fēng)能源,山區(qū)的風(fēng)能源也很值得研究,本文對(duì)云南山區(qū)的風(fēng)速數(shù)據(jù)進(jìn)行研究。在實(shí)際研究中發(fā)現(xiàn),準(zhǔn)確得到風(fēng)速數(shù)據(jù)的概率密度函數(shù)將減少風(fēng)能輸出估算的不確定性?,F(xiàn)在許多概率分布都用于風(fēng)速分布的研究,張盼盼[1]比較了正態(tài)分布和威布爾分布,分析哪種分布函數(shù)模擬風(fēng)速分布的效果比較理想,得到的結(jié)果是兩參數(shù)威布爾分布是擬合風(fēng)速較好的模型;楊曉鵬等[2]通過(guò)數(shù)值模擬一年云南風(fēng)速,對(duì)云南風(fēng)能資源分布進(jìn)行研究;洪祖蘭等[3]對(duì)云南省356個(gè)測(cè)風(fēng)塔的地理分布以及風(fēng)速風(fēng)況特征進(jìn)行研究;Nage[4]比較了威布爾分布和瑞利分布,從分布的統(tǒng)計(jì)分析來(lái)看,威布爾分布在擬合概率密度分布方面比瑞利分布更好;Wais[5]提出使用三參數(shù)威布爾分布用于擬合風(fēng)速數(shù)據(jù),結(jié)果表明:對(duì)于零風(fēng)速的較高概率,三參數(shù)威布爾分布與雙參數(shù)威布爾分布相比給出了更好的結(jié)果;Kantar等[6]提出擴(kuò)展廣義Lindley分布可替代風(fēng)速分布用于評(píng)估風(fēng)能潛力;Morgan等[7]在評(píng)估海上風(fēng)電場(chǎng)時(shí),認(rèn)為兩參數(shù)對(duì)數(shù)正態(tài)分布在估計(jì)極端風(fēng)速方面表現(xiàn)最佳;Pishgar-Komleh等[8]在分析Firouzkooh地區(qū)的風(fēng)速數(shù)據(jù)時(shí),在威布爾和瑞利分布函數(shù)的基礎(chǔ)上很好地得到了風(fēng)速的實(shí)際值。
本研究的主要目的是評(píng)估各類(lèi)分布對(duì)于云南風(fēng)速的適用性,并確定最適合在云南山區(qū)建模的風(fēng)速數(shù)據(jù)的分布。本文選取了幾種常規(guī)分布,應(yīng)用極大似然方法進(jìn)行參數(shù)估計(jì),選取決定系數(shù)R2、Kolmogorov-Smirnov檢驗(yàn)、卡方檢驗(yàn)、均方根誤差(RMSE)和貝葉斯信息準(zhǔn)則(BIC)進(jìn)行擬合優(yōu)度檢驗(yàn),在直方圖畫(huà)出擬合曲線(xiàn)以及QQ圖進(jìn)行直觀(guān)分析,并利用所選分布計(jì)算各個(gè)站點(diǎn)理論風(fēng)功率密度與實(shí)際風(fēng)功率密度比較相對(duì)誤差。
最常用的分布有威布爾分布、伽馬分布[9]、對(duì)數(shù)正態(tài)分布、正態(tài)分布、瑞利分布[10],它們的概率密度函數(shù)由表1給出。
表1 所選分布的概率密度函數(shù)和風(fēng)功率密度函數(shù)Table 1 Probability density function and wind power density function of selected distribution
常用的參數(shù)估計(jì)方法有最大似然估計(jì)、矩法估計(jì)和最小二乘法[7-9]??紤]數(shù)據(jù)的量比較大,此處選用極大似然估計(jì)來(lái)進(jìn)行參數(shù)估計(jì)。
極大似然方法是常用的分布參數(shù)估計(jì)方法之一,在該方法中,通過(guò)最大化似然函數(shù)或?qū)?shù)似然函數(shù)來(lái)估計(jì)參數(shù)。似然函數(shù)是模型參數(shù)的函數(shù),由式(1)給出:
(1)
其中,f(vi;θ)是概率密度函數(shù),vi是第i個(gè)風(fēng)速數(shù)據(jù),n是數(shù)據(jù)點(diǎn)的數(shù)量,θ是分布的參數(shù)向量。為了減小計(jì)算的復(fù)雜性,通常采用對(duì)數(shù)似然函數(shù)來(lái)估計(jì)概率分布的參數(shù)。對(duì)數(shù)似然函數(shù)表示為
(2)
為了評(píng)估不同模型在確定風(fēng)速分布方面的準(zhǔn)確性,選擇以下5個(gè)指標(biāo):決定系數(shù)R2、卡方統(tǒng)計(jì)量χ2、K-S檢驗(yàn)、RMSE以及BIC準(zhǔn)則進(jìn)行分布的擬合優(yōu)度評(píng)估[11]。
(3)
(4)
(5)
(4) 均方根誤差檢驗(yàn)(RMSE)。均方根誤差檢驗(yàn)(RMSE)描述了觀(guān)測(cè)概率與預(yù)測(cè)概率之間實(shí)際偏差的逐項(xiàng)比較,RMSE值SRMSE越小表示分布擬合越好[1]。均方根誤差檢驗(yàn)值定義為
(6)
(5) 貝葉斯信息(BIC)準(zhǔn)則。衡量統(tǒng)計(jì)模型擬合優(yōu)良性的一種標(biāo)準(zhǔn),BIC值越小,說(shuō)明模型擬合越好。BIC值定義為
SBIC=-2lnL+klnn
(7)
其中n是數(shù)據(jù)的個(gè)數(shù),L是似然函數(shù),k是參數(shù)個(gè)數(shù)。
數(shù)據(jù)來(lái)自云南山區(qū)的4個(gè)氣象站點(diǎn),站點(diǎn)0579位于雙柏縣愛(ài)尼山鄉(xiāng)(南),站點(diǎn)8415位于馬龍縣納章鎮(zhèn)瓦古沖村,站點(diǎn)0229曲靖市富源縣墨紅鎮(zhèn),站點(diǎn)8013位于云縣。在本研究中,使用10 m高度的每10 min平均風(fēng)速。這些風(fēng)速數(shù)據(jù)記錄在云南的4個(gè)氣象站。高度、記錄周期、經(jīng)緯度以及海拔等信息如表2所示。表3列出了各站點(diǎn)中風(fēng)速數(shù)據(jù)的最大值、平均值、中值、標(biāo)準(zhǔn)差、偏度系數(shù)和峰度系數(shù)等統(tǒng)計(jì)數(shù)據(jù),從表3可以看出,所有偏度系數(shù)均大于0,說(shuō)明風(fēng)速分布均是右偏分布。
表2 研究站點(diǎn)的地理位置Table 2 The geographical location of the research stations
表3 站點(diǎn)風(fēng)速數(shù)據(jù)的描述性統(tǒng)計(jì)Table 3 Descriptive statistics of wind speed data at the stations
3.2.1 模型評(píng)估
對(duì)于每個(gè)站點(diǎn),基于不同分布,采用極大似然方法估計(jì)每種分布的參數(shù),表4中給出了極大似然理論對(duì)于混合分布和威布爾分布的參數(shù)估計(jì)值。表5分別給出雙柏縣站點(diǎn)、富源縣站點(diǎn)、云縣站點(diǎn)、馬龍縣站點(diǎn)包含威布爾分布在內(nèi)的5個(gè)分布,基于RMSE、卡方統(tǒng)計(jì)量χ2、K-S檢驗(yàn),決定系數(shù)(R2)以及BIC準(zhǔn)則,通過(guò)式(4)—式(7)進(jìn)行擬合優(yōu)度值計(jì)算。
表4 所有站點(diǎn)不同分布的參數(shù)估計(jì)值Table 4 Estimated values of the parameters of different distributions of all stations
表5 所有站點(diǎn)擬合優(yōu)度檢驗(yàn)的值Table 5 All stations goodness of fit test value
從表5中可以看出:雙柏縣站點(diǎn)基于R2,SK-S、卡方統(tǒng)計(jì)量、SRMSE以及SBIC,威布爾分布表現(xiàn)最好;馬龍縣站點(diǎn)基于上述5個(gè)檢驗(yàn)得出正態(tài)分布表現(xiàn)最好;云縣基于5個(gè)檢驗(yàn)得出威布爾分布和正態(tài)分布表現(xiàn)都好,從數(shù)值上來(lái)看差別不大;富源縣站點(diǎn)瑞利分布表現(xiàn)較好,其次是威布爾分布和伽馬分布,三者差別較小。為了準(zhǔn)確判別云南山區(qū)風(fēng)速最合適的頻率分布,考慮引入直方圖和QQ圖進(jìn)行更直觀(guān)的比較。
3.2.2 模型直方圖和QQ圖的比較
一般來(lái)說(shuō),樣本容量越大,頻率分布直方圖就會(huì)無(wú)限接近總體密度曲線(xiàn),就越精確地反映總體的分布規(guī)律,即越精確地反映總體在各個(gè)范圍內(nèi)取值百分比。在直方圖中畫(huà)出擬合分布的密度曲線(xiàn)可以直觀(guān)看出擬合曲線(xiàn)與樣本直方圖的擬合程度,從而直觀(guān)地判斷分布對(duì)于樣本數(shù)據(jù)擬合的優(yōu)良性。除此之外,在統(tǒng)計(jì)學(xué)中,QQ(分位數(shù)-分位數(shù))是通過(guò)圖形比較兩個(gè)概率分布的方法。如果被比較的兩個(gè)分布相似,則QQ圖中的點(diǎn)將大致位于線(xiàn)y=x上。此處QQ圖用于比較站點(diǎn)數(shù)據(jù)與理論分布的擬合程度,圖中的點(diǎn)越接近線(xiàn)y=x,則說(shuō)明該理論分布對(duì)數(shù)據(jù)擬合較好。
針對(duì)表4得出的結(jié)論,在直方圖中畫(huà)出各個(gè)理論分布的密度曲線(xiàn)比較擬合結(jié)果。圖1—圖4分別針對(duì)各個(gè)站點(diǎn)畫(huà)出直方圖以及數(shù)據(jù)與理論分布的QQ圖,以進(jìn)行更直觀(guān)的比較。
由圖1—圖4可以看出:富源縣站點(diǎn)和雙柏縣站點(diǎn)直方圖和QQ圖顯示威布爾分布更合適在直方圖的擬合密度曲線(xiàn)中表現(xiàn)出最好的結(jié)果。雖然馬龍縣和云縣的威布爾分布密度曲線(xiàn)和正態(tài)分布曲線(xiàn)在直方圖中表現(xiàn)有所差別,但是發(fā)現(xiàn)二者的QQ圖曲線(xiàn)幾乎重合在一起。為了對(duì)云南山區(qū)風(fēng)速分布的選擇更加合理,下面從風(fēng)功率密度的角度來(lái)分析。
對(duì)于觀(guān)測(cè)區(qū)域的風(fēng)況特征進(jìn)行分析,有助于估算風(fēng)能潛力。風(fēng)功率概率密度函數(shù)在風(fēng)力渦輪機(jī)的設(shè)計(jì)過(guò)程和潛在場(chǎng)地可用的風(fēng)力資源評(píng)估過(guò)程中都是有用的。在科學(xué)文獻(xiàn)中,通常使用對(duì)應(yīng)于標(biāo)準(zhǔn)條件(海平面,15 ℃)的恒定值空氣密度ρ=1.225 kg/m3。通過(guò)葉片掃掠區(qū)域Sw以速度V飛行的風(fēng)力隨著其速度的立方增加,因此每單位面積的風(fēng)流中可用的功率(風(fēng)功率密度)可表示為[12]
(8)
其中:ρ是空氣密度,取決于海拔高度、氣壓和溫度。平均風(fēng)功率密度基于風(fēng)速的分布函數(shù)f(V)定義為
(9)
實(shí)際樣本的風(fēng)功率密度計(jì)算公式為
(10)
其中:n是觀(guān)測(cè)樣本的個(gè)數(shù)。表6給出了4個(gè)站點(diǎn)風(fēng)功率密度值與真實(shí)值的比較結(jié)果。
表6 4個(gè)站點(diǎn)基于分布的風(fēng)功率密度理論值與實(shí)際風(fēng)功率密度及其相對(duì)誤差Table 6 Theoretical values of wind power density and actual wind power density values at four stations and their relative errors
使用真實(shí)數(shù)據(jù)獲得的結(jié)果與各個(gè)分布的解析式獲得的結(jié)果之間的比較是通過(guò)相對(duì)百分比誤差來(lái)評(píng)估的,該值顯示了對(duì)應(yīng)分布的準(zhǔn)確性,定義為
(11)
從表6中可以看出:威布爾分布下的理論風(fēng)功率密度與實(shí)際相對(duì)誤差富源縣為0.53,馬龍縣為0.05,雙柏縣為0.09,云縣為0.197,故威布爾分布為4個(gè)站點(diǎn)中所選分布對(duì)于實(shí)際分布擬合最好的分布,對(duì)于風(fēng)功率密度的估算最接近實(shí)際值。
使用5種常規(guī)分布對(duì)云南山區(qū)風(fēng)速做擬合,并給出綜合評(píng)價(jià)。擬合優(yōu)度從數(shù)值大小的角度看,威布爾分布、正態(tài)分布以及瑞利分布在4個(gè)站點(diǎn)呈現(xiàn)較好結(jié)果,但數(shù)值角度的結(jié)果說(shuō)服力不夠強(qiáng)。為了更加直觀(guān),選取實(shí)際數(shù)據(jù)直方圖與分布密度曲線(xiàn)擬合性進(jìn)行比較,發(fā)現(xiàn)威布爾分布在富源縣和雙柏縣站點(diǎn)呈現(xiàn)較好結(jié)果,在馬龍縣和云縣正態(tài)分布和威布爾分布的結(jié)果都比較好。為了仔細(xì)區(qū)分,從實(shí)際角度出發(fā),利用標(biāo)準(zhǔn)空氣密度下風(fēng)功率密度來(lái)比較,根據(jù)理論分布數(shù)據(jù)和實(shí)際數(shù)據(jù)相對(duì)誤差圖可以看出威布爾分布的結(jié)果最好。綜合上述比較,威布爾分布最適合云南山區(qū)的風(fēng)速。