張 冉,賈 悅
(河北水利電力學(xué)院/遙感與智慧水利創(chuàng)新中心,河北 滄州 061001)
IPCC第五次會(huì)議上明確指出,全球海陸平均溫度逐年呈現(xiàn)明顯的線性升高趨勢(shì),全球變暖現(xiàn)象的發(fā)生造成了區(qū)域干旱發(fā)生頻繁,對(duì)全球環(huán)境造成了十分惡劣的影響[1]。已有研究表明,輻射是影響區(qū)域干旱的最主要因素之一,因此探求區(qū)域輻射變化規(guī)律對(duì)區(qū)域環(huán)境保護(hù)政策的制定具有十分重要的意義[2]。同時(shí),現(xiàn)如今發(fā)展新能源是國(guó)內(nèi)外相關(guān)部門(mén)的研究熱點(diǎn),而輻射由于其具有清潔、豐富且可再生的特點(diǎn),已成為了現(xiàn)如今主要應(yīng)用的清潔能源之一[3-4]。而獲得Rs數(shù)據(jù)最精確的方法是通過(guò)比熱計(jì)實(shí)測(cè)獲得,但這種方法成本高、耗時(shí)高,同時(shí)全國(guó)752個(gè)氣象站點(diǎn)中,僅有122個(gè)站點(diǎn)可獲得實(shí)測(cè)Rs數(shù)據(jù),這極大程度上限制了實(shí)測(cè)Rs數(shù)據(jù)的獲得[5]。因此,急需找出合適的模型進(jìn)行估算,高精度高效率獲取Rs數(shù)據(jù)。目前針對(duì)的Rs計(jì)算方法主要分為經(jīng)驗(yàn)?zāi)P?、機(jī)器學(xué)習(xí)模型、輻射傳遞模型和衛(wèi)星遙感方法4種[6]。其中,經(jīng)驗(yàn)?zāi)P秃蜋C(jī)器學(xué)習(xí)模型由于對(duì)氣象數(shù)據(jù)的要求較低和較高的精度,成為了應(yīng)用最廣泛的模型[7]。Rs計(jì)算經(jīng)驗(yàn)?zāi)P椭饕囟确ê洼椛浞?大類,Jahani[8],Chen[9],鄒麗萍[10]等研究人員發(fā)現(xiàn)在不同地區(qū),不同方法所表現(xiàn)出的精度不同。自適應(yīng)性神經(jīng)網(wǎng)絡(luò)、M5樹(shù)模型[11]等機(jī)器學(xué)習(xí)模型均在Rs估算中得到了應(yīng)用,并取得了一定的進(jìn)展。
京津冀地區(qū)位于我國(guó)半干旱地區(qū),屬于溫帶半濕潤(rùn)半干旱季風(fēng)氣候,降水分布不均勻,其所在區(qū)域土壤較肥沃,是重要的首都經(jīng)濟(jì)圈[12-13]。因此在該區(qū)域找出Rs的最優(yōu)估計(jì)方法對(duì)當(dāng)?shù)毓喔葲Q策及防旱制度制定具有十分重要的意義。本文基于3種機(jī)器學(xué)習(xí)模型、3種溫度法經(jīng)驗(yàn)?zāi)P秃?種輻射法經(jīng)驗(yàn)?zāi)P?,以區(qū)域?qū)崪y(cè)Rs數(shù)據(jù)為依據(jù),找出適用于該地區(qū)Rs最優(yōu)估算模型。
本文選擇區(qū)域內(nèi)均有實(shí)測(cè)輻射資料的樂(lè)亭、天津和北京3個(gè)站點(diǎn),基于站點(diǎn)1994~2017年的實(shí)測(cè)數(shù)據(jù)對(duì)模型進(jìn)行訓(xùn)練與模擬,站點(diǎn)分布圖可見(jiàn)圖1。站點(diǎn)數(shù)據(jù)均來(lái)自國(guó)家氣象中心,包括實(shí)測(cè)輻射Rs,風(fēng)速U2,最高溫度Tmax,最低溫度Tmin,日照時(shí)數(shù)n,相對(duì)濕度RH,數(shù)據(jù)質(zhì)量良好。
圖1 研究區(qū)域站點(diǎn)分布圖
2.2.1 Angstrom-Prescott模型(AP)
Angstrom[14]通過(guò)分析最大日照時(shí)數(shù)與平均日照時(shí)數(shù)的關(guān)系,提出了AP模型,具體公式如下:
(1)
式中,Rs為總輻射,MJ m-2d-1;Ra為大氣頂層輻射,MJ m-2d-1;a,b為常數(shù);n為日照時(shí)數(shù),h;N為最大可能日照時(shí)數(shù),h。
2.2.2 Ogelman模型(OG)
Ogelman等[15]研究發(fā)現(xiàn)了一個(gè)二次多項(xiàng)式,可用于模擬Rs,具體公式如下:
(2)
式中參數(shù)與上述一致。
2.2.3 Glover-McCulloch模型(GM)
Glover和McCulloch[16]將站點(diǎn)緯度的影響,研究了估算Rs的模型,公式如下:
(3)
式中,φ為緯度取值。
2.3.1 Hargreaves-Samani模型(HS)
Hargreaves-Samani[17]模型僅考慮溫度即可估算Rs,公式如下:
Rs=[C(Tmax-Tmin))0.5]×Ra
(4)
式中,C為經(jīng)驗(yàn)系數(shù);Tmax和Tmin分別為最高和最低溫度,℃;其余參數(shù)與前文一致。
2.3.2 Bristow-Campbell模型(BC)
Bristow and Campbell[18]基于Ra和溫度差數(shù)據(jù),提出了BC模型,具體公式如下:
Rs=a[1-exp(-bΔTc)]×Ra
(5)
式中,c為常數(shù),△T為溫度差,℃,其余參數(shù)與前文一致。
2.3.3 Annandale模型(AD)
Annandale等[19]基于HS模型,將海拔與氣壓層厚度引入模型,得出的AD模型公式如下:
Rs=a[(1+2.7×10-5Z)ΔT0.5]×Ra
(6)
式中,Z為站點(diǎn)海拔高度,m;其余參數(shù)與前文一致。
2.4.1 極限學(xué)習(xí)機(jī)模型(ELM)
極限學(xué)習(xí)機(jī)模型(ELM)主要可分為輸入層、隱含層和輸出層3部分,其收斂速度快、精度高,被廣泛應(yīng)用于回歸檢驗(yàn)中,具體步驟可見(jiàn)文獻(xiàn)[20]。
2.4.2 廣義回歸神經(jīng)網(wǎng)絡(luò)模型(GRNN)
廣義回歸神經(jīng)網(wǎng)絡(luò)模型(GRNN)[21]是依據(jù)概率最大原則計(jì)算網(wǎng)絡(luò)輸出的徑向基網(wǎng)絡(luò)。適于解決各類非線性問(wèn)題,由輸入層、模式層、求和層和輸出層等4層神經(jīng)元組成。
2.4.3 小波神經(jīng)網(wǎng)絡(luò)模型(WNN)
小波神經(jīng)網(wǎng)絡(luò)模型(WNN)是一種以BP神經(jīng)網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為基礎(chǔ),將小波基函數(shù)作為隱含層節(jié)點(diǎn)傳遞函數(shù),信號(hào)向前傳播的神經(jīng)網(wǎng)絡(luò),具體形式可見(jiàn)文獻(xiàn)[22]。
利用均方根誤差(RMSE)、模型效率系數(shù)(Ens)和決定系數(shù)(R2)分析各模型模擬精度,具體公式如下:
(7)
(8)
(9)
引入GPI指數(shù),比較多個(gè)模型多個(gè)評(píng)價(jià)指標(biāo)的最終精度:
(10)
式中,αj為常數(shù),RMSE取1,Ens和R2取-1;gj為不同指標(biāo)的縮放值的中位數(shù);yij為不同指標(biāo)的尺度值。
圖2~圖4為京津冀地區(qū)3個(gè)站點(diǎn)不同模型Rs日值擬合對(duì)比。由圖中可以看出,不同模型對(duì)Rs的模擬精度存在一定差異。在機(jī)器學(xué)習(xí)模型中,ELM模型表現(xiàn)出了較高的精度,其模擬值與實(shí)測(cè)值的擬合方程斜率在3個(gè)站點(diǎn)分別為0.873、0.935和0.889,GRNN模型精度次之,WNN模型精度較低;在輻射法中,OG模型精度較高,其模擬值與實(shí)測(cè)值的擬合方程斜率在3個(gè)站點(diǎn)分別為0.911、0.949和0.909,AP模型精度次之,GM模型精度較低;在溫度法中,3種模型對(duì)Rs日值模擬的精度由高到低依次為BC模型>HS模型>AD模型。綜合比較不同模型可知,輻射法和機(jī)器學(xué)習(xí)模型的計(jì)算精度要顯著高于溫度法,其中,OG模型和ELM模型在Rs日值模擬方面表現(xiàn)出了較高的精度。
圖2 河北樂(lè)亭站不同模型Rs模擬擬合圖
圖3 天津站不同模型Rs模擬擬合圖
圖4 北京站不同模型Rs模擬擬合圖
圖5為京津冀地區(qū)3個(gè)站點(diǎn)不同模型Rs月值擬合對(duì)比。由圖中可以看出,不同模型對(duì)Rs月值的模擬精度存在一定差異,但基本趨勢(shì)一致,均呈開(kāi)口向下的二次拋物線型式。不同模型模擬的Rs值在5月份達(dá)到最高值,而在12月份取值最低,約80%的Rs均集中在了3~10月的主要作物生長(zhǎng)季。對(duì)于不同模型,溫度法模擬的Rs月值與實(shí)測(cè)值的變化趨勢(shì)差異較大,而ELM模型在模擬Rs月值時(shí)與實(shí)測(cè)值的擬合效果最高。
圖5 不同模型Rs月值模擬擬合圖
圖6為不同模型在不同站點(diǎn)的精度指標(biāo)計(jì)算結(jié)果。由圖中可以看出,RMSE、R2和Ens組成的評(píng)價(jià)指標(biāo)體系可較好地反映不同模型模擬結(jié)果的誤差與一致性,可較好反映出不同模型的計(jì)算精度。其中,3類模型的計(jì)算精度表現(xiàn)為機(jī)器學(xué)習(xí)模型>輻射法>溫度法,ELM模型計(jì)算精度最高,其RMSE為2.393 MJ m-2d-1、R2為0.898,Ens為0.888,GPI為0.192,在輻射法中OG模型計(jì)算精度最高,其RMSE、R2、Ens和GPI分別為2.673 MJ m-2d-1、0.887、0.855和0.017,9種模型計(jì)算精度由高到低排列依次為ELM模型、OG模型、GRNN模型、WNN模型、GM模型、AP模型、HS模型、AD模型、BC模型。ELM模型克服了傳統(tǒng)神經(jīng)網(wǎng)絡(luò)模型的缺點(diǎn),具備學(xué)習(xí)速度快、泛化能力強(qiáng)、不存在局部極小值和過(guò)擬合等問(wèn)題的優(yōu)點(diǎn),這可能是ELM模型在模擬Rs時(shí)精度最高的原因。
圖6 不同模型Rs精度對(duì)比
為進(jìn)一步證明ELM模型的精度,本文對(duì)該模型的可移植性進(jìn)行了分析。將3個(gè)站點(diǎn)任意2個(gè)站點(diǎn)作為模型訓(xùn)練數(shù)據(jù)集,第3個(gè)站點(diǎn)作為模型驗(yàn)證數(shù)據(jù)集,計(jì)算了不同情況的模型模擬精度,結(jié)果見(jiàn)下表。由表中可以看出,采用不同參數(shù)輸入集的情況下,ELM模型仍能保持較高的精度,其R2和Ens均在0.88以上,進(jìn)一步證明了ELM模型計(jì)算精度的穩(wěn)定性。
表 ELM模型可移植性分析
本文基于機(jī)器學(xué)習(xí)模型、輻射法和溫度法共9種計(jì)算模型,找出了京津冀地區(qū)模擬Rs的最優(yōu)模型,并得出以下結(jié)論:
在Rs日值的模擬中,ELM模型和OG模型的擬合方程斜率分別為0.873、0.935和0.889,0.911、0.949和0.909,表明這2個(gè)模型在京津冀地區(qū)Rs日值的模擬中的精度較高;
通過(guò)計(jì)算不同模型的精度指標(biāo)可知,ELM模型RMSE、R2、Ens和GPI分別為2.393 MJ m-2d-1、0.898, 0.888和0.192,計(jì)算精度最高,ELM模型可作為京津冀地區(qū)Rs計(jì)算的標(biāo)準(zhǔn)模型使用。
本文證明了ELM模型在京津冀地區(qū)Rs計(jì)算的精確性,但由于該模型的權(quán)值和隱藏偏差是隨機(jī)確定的,其計(jì)算精度可進(jìn)一步提高。粒子群算法(PSO)是一種常用的優(yōu)化算法,在模型優(yōu)化中已證明了該算法的精度,基于粒子群算法優(yōu)化的極限學(xué)習(xí)機(jī)模型(PSO-ELM)可進(jìn)一步提高區(qū)域Rs計(jì)算的精度,可在今后的研究中進(jìn)一步討論。這一有效測(cè)量京津冀地區(qū)的Rs機(jī)械模型的發(fā)現(xiàn)將極大的推動(dòng)未來(lái)京津冀地區(qū)的Rs的研究進(jìn)展,為我國(guó)太陽(yáng)能新能源的開(kāi)發(fā)利用直接帶來(lái)巨大的益處。