• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于梯度提升決策樹多特征結(jié)合的茶葉產(chǎn)量預(yù)測

    2021-08-23 03:29:26徐愛俊周素茵
    關(guān)鍵詞:茶區(qū)氣象茶葉

    丁 鵬,徐愛俊,周素茵*

    ( 1. 浙江農(nóng)林大學(xué)信息工程學(xué)院,浙江 杭州 311300;2. 浙江省林業(yè)智能監(jiān)測與信息技術(shù)研究重點(diǎn)實(shí)驗(yàn)室,浙江 杭州 311300)

    【研究意義】作物產(chǎn)量的精準(zhǔn)預(yù)測,能夠?yàn)閲肄r(nóng)業(yè)管理和相關(guān)政策的制訂提供有效支撐[1],同時(shí)在計(jì)劃、生產(chǎn)手段、當(dāng)前決策、運(yùn)輸、庫存和風(fēng)險(xiǎn)管理等方面都具有非常重要的作用[2-3]。茶葉作為我國的一種重要經(jīng)濟(jì)作物,研究其產(chǎn)量預(yù)測模型意義重大?!厩叭搜芯窟M(jìn)展】Moslem Abdipour等[4]建立以紅花次枝的數(shù)量、枝干重、花序中的傘形花序數(shù)以及生物學(xué)產(chǎn)量為輸入的紅花產(chǎn)量人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)預(yù)測模型和多元線性回歸(multiple linear regression,MLR)模型,結(jié)果表明ANN模型的決定系數(shù)、平均絕對誤差和均方根誤差均優(yōu)于MLR。Gniewko Niedbala[5]同樣利用ANN模型,以氣象數(shù)據(jù)和礦物施肥信息為特征預(yù)測冬油菜產(chǎn)量,預(yù)測效果良好,但ANN模型的結(jié)果可解釋性較低,學(xué)習(xí)時(shí)間較長且參數(shù)較復(fù)雜;劉峻明等[6]構(gòu)建多種變量組合的隨機(jī)森林冬小麥產(chǎn)量預(yù)測模型,各模型預(yù)測效果較好,決定系數(shù)均基本高于0.75;Yaping Cai等[7]利用衛(wèi)星反演的遙感植被指數(shù)和氣候變量,構(gòu)建與小麥產(chǎn)量之間的線性方法LASSO以及3種非線性方法,研究表明氣候數(shù)據(jù)與衛(wèi)星數(shù)據(jù)相結(jié)合的非線性方法的預(yù)測效果均優(yōu)于線性方法。任建強(qiáng)等[8]基于歸一化植被指數(shù)和一元線性回歸模型預(yù)測美國各州玉米產(chǎn)量,但一元線性回歸模型的決定系數(shù)較低?,F(xiàn)有關(guān)于作物產(chǎn)量預(yù)測的研究雖然較多,但是茶葉產(chǎn)量預(yù)測方面的卻較少,主要包括兩類:一是通過建立多元線性回歸分析模型[9-10],實(shí)現(xiàn)茶葉產(chǎn)量預(yù)測,但氣象特征較少、不全面,且該研究的線性模型僅進(jìn)行了擬合,并未對模型的預(yù)測效果進(jìn)行驗(yàn)證與測試;二是通過構(gòu)建灰色神經(jīng)網(wǎng)絡(luò)預(yù)測茶葉產(chǎn)量[11],但該研究僅以非自然因素為輸入特征,研究樣本量較少且難以分析特征變量對產(chǎn)量的影響??傊?,現(xiàn)有關(guān)于茶葉產(chǎn)量預(yù)測的研究存在以下問題:特征構(gòu)建不全面、不深入,難以反映具體特征變量對產(chǎn)量的影響,樣本規(guī)模較小且大多以省市為單位進(jìn)行產(chǎn)量預(yù)測等[9-11]?!颈狙芯壳腥朦c(diǎn)】上述關(guān)于作物產(chǎn)量預(yù)測的研究雖然都選取了多維特征,但基本都未將社會(huì)發(fā)展特征加入特征集之中,忽略或事先排除了社會(huì)發(fā)展特征的影響,例如令目標(biāo)變量為作物單產(chǎn),排除種植面積的影響,可能會(huì)導(dǎo)致模型預(yù)測效果受影響,且無法分析社會(huì)發(fā)展特征對產(chǎn)量所造成的影響以及與其他因素對產(chǎn)量的影響進(jìn)行對比。另外,茶葉的生長發(fā)育環(huán)境十分復(fù)雜[12],茶葉的產(chǎn)量受到社會(huì)技術(shù)水平、空間位置、氣象條件等多種因素的影響。梯度提升決策樹是對真實(shí)分布擬合最好的機(jī)器學(xué)習(xí)算法之一,它通過學(xué)習(xí)得到多個(gè)弱分類器并進(jìn)行多次迭代來提升模型的性能[13],具有預(yù)測精度高、構(gòu)建過程簡便、能處理非線性、連續(xù)和離散數(shù)據(jù)、結(jié)果可解釋等優(yōu)點(diǎn)[14-17],該算法在電力工程、交通運(yùn)輸、控制工程[18-20]等多個(gè)領(lǐng)域均有應(yīng)用,但在茶葉產(chǎn)量預(yù)測上尚未有相關(guān)報(bào)道?!緮M解決的關(guān)鍵問題】因此,本文基于梯度提升決策樹算法,以浙江省為研究區(qū)域,結(jié)合各茶葉主產(chǎn)區(qū)的茶葉年產(chǎn)量數(shù)據(jù)、空間氣象數(shù)據(jù)和社會(huì)發(fā)展特征,選擇不同特征或不同茶區(qū)建立茶葉估產(chǎn)模型,并分析不同特征或不同茶區(qū)對預(yù)測結(jié)果的影響,以期確定影響茶葉產(chǎn)量的決定性和輔助性因素,為茶葉生產(chǎn)管理提供指導(dǎo)意見,并為預(yù)測區(qū)域茶葉產(chǎn)量提供新思路。

    1 材料與方法

    1.1 研究區(qū)概況

    浙江省位于中國東南沿海,東經(jīng)118°01'~123°10',北緯27°02'~31°11'之間,屬亞熱帶季風(fēng)氣候,四季分明,年氣溫適中,光照較多,降水充足,空氣濕潤。年平均氣溫15~18 ℃,年平均降水量在1500~2000 mm,年平均日照時(shí)數(shù)1710~2100 h。根據(jù)氣候、自然條件、山脈以及行政區(qū)劃等,可將浙江省劃分為浙西北、浙東、浙南和浙中四大茶區(qū)[21],茶葉產(chǎn)量依次分別約占全省茶葉的35%、45%、5%和15%。

    1.2 數(shù)據(jù)來源

    本研究的茶葉產(chǎn)量數(shù)據(jù)和社會(huì)發(fā)展要素分別來自《浙江省統(tǒng)計(jì)年鑒》[22]記載的主要茶葉產(chǎn)區(qū)(縣級行政區(qū))的茶葉年產(chǎn)量資料和社會(huì)發(fā)展資料,覆蓋了1995-2016年間連續(xù)為茶葉主產(chǎn)區(qū)的24個(gè)縣(市區(qū))的共528個(gè)有效數(shù)據(jù),這24個(gè)茶葉主產(chǎn)區(qū)均不屬于浙南茶區(qū)。茶葉主產(chǎn)區(qū)的空間位置數(shù)據(jù)從各縣(市區(qū))的氣象觀測站獲得,分布情況如圖1。氣象數(shù)據(jù)源于《中國地面氣候資料日值數(shù)據(jù)集(V3.0)》[23],提取浙江省內(nèi)各茶葉主產(chǎn)區(qū)1995-2016年間的逐日氣象數(shù)據(jù),并通過空間插值方法[24]填充缺失的氣象數(shù)據(jù)。

    1.3 研究方法

    1.3.1 GBDT模型構(gòu)建 (1)特征集構(gòu)建。本研究模型的特征集共分為兩類:空間氣象特征集和社會(huì)發(fā)展特征集??臻g氣象特征集中的空間特征包括各茶葉主產(chǎn)區(qū)的經(jīng)度、緯度、高程3個(gè)特征;根據(jù)浙江省茶樹主栽品種和茶葉生產(chǎn)現(xiàn)狀,將茶葉生育期大致劃分為春梢(3-5月)、夏梢(6-8月)和秋梢(9-11月)3個(gè)生長期[25]。冬季的氣候和極端天氣情況等也顯著影響茶葉的產(chǎn)量,為了體現(xiàn)不同時(shí)期的氣象要素對茶葉產(chǎn)量的影響,根據(jù)茶葉生育期按季節(jié)進(jìn)行劃分,其中12、1、2月為冬季,3-5月為春季,6-8月為夏季,9-11月為秋季。茶葉的產(chǎn)量受氣溫、相對濕度、降水量、日照等氣象要素的影響[18],空間氣象特征集中的氣象特征如下:首先,以年為單位,提取浙江省每年(起始月份為前一年12月)的年均氣溫、年均相對濕度、年降水量、年日照時(shí)數(shù),共4個(gè)特征;其次,以月為單位提取浙江省每年各季節(jié)的氣象特征,其中月平均氣溫、月平均相對濕度、月日照時(shí)數(shù)、月降水量、月最大風(fēng)速、月最高氣壓為各月均有的共6個(gè)氣象特征。此外,冬季特有的氣象特征為月負(fù)積溫、月日最低溫不高于零下4 ℃的總天數(shù),冬季氣象特征共計(jì)24個(gè);春季特有的氣象特征為月日平均氣溫在10~25 ℃之間的總天數(shù)、日平均氣溫不低于10 ℃的活動(dòng)積溫,春季氣象特征共計(jì)24個(gè);夏季特有的氣象特征為月日最高溫不低于35 ℃的總天數(shù),夏季氣象特征共計(jì)21個(gè);秋季特有的氣象特征為日平均氣溫不低于10 ℃的活動(dòng)積溫,秋季氣象特征共計(jì)21個(gè)。最終,確定空間氣象特征共計(jì)97個(gè)。

    社會(huì)發(fā)展特征主要是指茶葉的種植規(guī)模、社會(huì)技術(shù)等影響茶葉產(chǎn)量的因素,具體包括茶園面積、農(nóng)業(yè)機(jī)械總動(dòng)力、有效灌溉面積、農(nóng)村用電量、化肥施用量(折純)5個(gè)特征。其中后4個(gè)特征在茶葉產(chǎn)業(yè)中的數(shù)據(jù)均未有文獻(xiàn)記載且難以搜集,所以本文選取縣(市區(qū))整體的指標(biāo)數(shù)據(jù)為特征變量,雖然不能完全代表茶葉產(chǎn)業(yè),但是能反映農(nóng)作物生長的總的社會(huì)環(huán)境和條件,提高茶葉產(chǎn)量預(yù)測的精度。

    (2)GBDT模型。梯度提升決策樹是一種Boosting算法[26](圖2),其基分類器一般選用分類回歸樹(classification and regression tree,CART),通過多輪迭代,每輪產(chǎn)生一個(gè)弱分類器, 最終將所有弱分類器加權(quán)求和后即得到集成模型,具體描述如下:

    (1)

    式中,Τ(x;Φm)為決策樹,Φm為決策樹參數(shù),x為樣本數(shù)據(jù),M為決策樹個(gè)數(shù),ωm為決策樹的權(quán)重,模型共迭代M次,其中第m次的模型為:

    Fm(x)=Fm-1(x)+ωmΤ(x;Φm)

    (2)

    式中,F(xiàn)m-1(x)為當(dāng)前模型,利用最小化損失函數(shù)來確定下一輪決策樹參數(shù):

    (3)

    L[yi,Fm-1(xi)+ωmΤ(xi;Φm)]=[yi-(Fm-1(xi)+ωmΤ(xi;Φm))]2

    (4)

    1.3.2 特征重要度計(jì)算 特征重要度反映了不同特征變量對目標(biāo)變量[各縣(市區(qū))茶葉年產(chǎn)量]的影響程度,GBDT模型對不同特征變量重要性的計(jì)算的基本思想是:首先計(jì)算特征變量j在單棵決策樹中的重要度,如式(5)所示。

    (5)

    (6)

    1.4 模型評價(jià)指標(biāo)

    GBDT模型效果的評價(jià)指標(biāo)采用:決定系數(shù)(coefficient of determination,R-Squared)、均方根誤差(root mean square error,RMSE)和平均絕對誤差(mean absolute error,MAE),三者的計(jì)算方法分別如式(7)、(8)和(9)所示。

    (7)

    (8)

    (9)

    2 結(jié)果與分析

    2.1 不同特征變量類型對模型的影響分析

    以1995-2011年的數(shù)據(jù)作為訓(xùn)練樣本,分別使用97個(gè)空間氣象特征、5個(gè)社會(huì)發(fā)展特征以及全部特征變量作為特征集訓(xùn)練GBDT產(chǎn)量預(yù)測模型,多次試驗(yàn)使各個(gè)模型參數(shù)均達(dá)到最優(yōu)。從圖3中可以看出以空間氣象特征做特征集的模型的預(yù)測效果較差,趨勢較平緩,R-Squared僅為0.44,RMSE高達(dá)3454 t,MAE高達(dá)2074 t,樣本分布比較松散,預(yù)測結(jié)果大部分遠(yuǎn)低于實(shí)際值;以社會(huì)發(fā)展特征做特征集的模型的預(yù)測效果較好,R-Squared達(dá)到0.80,RMSE為2037 t,MAE為1388 t;以全部特征變量做特征集的模型的預(yù)測效果最佳,R-Squared達(dá)到0.90,RMSE為1492 t,MAE為1050 t,樣本分布于1∶1線附近,預(yù)測結(jié)果相較于另外兩個(gè)特征集表現(xiàn)出更小的偏差。

    僅使用空間氣象特征預(yù)測茶葉產(chǎn)量時(shí),由于未考慮茶園面積增加、技術(shù)進(jìn)步等重要的影響茶葉產(chǎn)量的社會(huì)發(fā)展因素,導(dǎo)致預(yù)測結(jié)果的偏差較大;而僅使用社會(huì)發(fā)展特征預(yù)測茶葉產(chǎn)量的預(yù)測精度高,說明社會(huì)發(fā)展特征對茶葉總體產(chǎn)量的影響很大;當(dāng)空間氣象特征與社會(huì)發(fā)展特征結(jié)合預(yù)測茶葉產(chǎn)量時(shí),預(yù)測精度再次提升,說明這兩類特征對茶葉的預(yù)測都有貢獻(xiàn),只是空間氣象特征的貢獻(xiàn)比較小。因此,在對茶葉產(chǎn)量進(jìn)行預(yù)測時(shí),需要重點(diǎn)考慮社會(huì)發(fā)展特征,同時(shí)也要考慮空間氣象特征的影響。

    2.2 不同季節(jié)對模型的影響分析

    為探究不同季節(jié)對茶葉產(chǎn)量和模型預(yù)測精度的影響,并通過某一季節(jié)的數(shù)據(jù)預(yù)測整年的茶葉產(chǎn)量,以1995-2011年的數(shù)據(jù)作為訓(xùn)練集,2012-2016年的數(shù)據(jù)作為驗(yàn)證集,分別建立春季、夏季、秋季、冬季四個(gè)季節(jié)的空間氣象特征和各季度的社會(huì)發(fā)展特征結(jié)合的特征集,并進(jìn)行模型的訓(xùn)練與驗(yàn)證。由圖4可知,4個(gè)季節(jié)的預(yù)測精度均較高,R-Squared均達(dá)到0.85以上,RMSE和MAE的值均較低,其中春季和冬季的預(yù)測精度比另外兩個(gè)季節(jié)高。由于浙江省春茶的產(chǎn)量占了極大的比重,其次霜凍是茶葉生產(chǎn)中最常見的一種自然災(zāi)害,低溫又是引起霜凍的主要原因,而霜凍和低溫多發(fā)生于冬季和早春時(shí)節(jié),會(huì)使茶芽受到凍害,導(dǎo)致茶葉產(chǎn)量下降,另外春季適宜的氣溫和積溫會(huì)加快茶芽的萌動(dòng)與發(fā)育,使得茶葉產(chǎn)量上升,故冬季與春季的氣象要素對茶葉產(chǎn)量的影響較大。而夏季與秋季的茶葉產(chǎn)量占比較小,其中夏季茶葉產(chǎn)量主要受到高溫天氣的影響,秋季的氣象要素對茶葉產(chǎn)量的影響較小。綜上所述,利用春季或冬季的空間氣象特征和社會(huì)發(fā)展特征建立GBDT模型可達(dá)到較好的茶葉估產(chǎn)效果。

    2.3 不同茶區(qū)對模型的影響分析

    各茶區(qū)氣候條件、空間位置、技術(shù)發(fā)展等均有差異,為了探究分茶區(qū)預(yù)測茶葉產(chǎn)量是否會(huì)提升預(yù)測效果,以1995-2011年的數(shù)據(jù)作為訓(xùn)練集,2012-2016年的數(shù)據(jù)作為驗(yàn)證集,將研究數(shù)據(jù)按茶區(qū)進(jìn)行劃分,即將浙江省24個(gè)茶葉主產(chǎn)區(qū)進(jìn)行劃分(浙西北茶區(qū)共包含8個(gè)縣(市區(qū))、浙東茶區(qū)共包含9個(gè)縣(市區(qū))、浙中茶區(qū)共包含7個(gè)縣(市區(qū))),并分別將各茶區(qū)的空間氣象特征和社會(huì)發(fā)展特征作為特征集,進(jìn)行模型的訓(xùn)練與驗(yàn)證,結(jié)果如圖5-a~c所示。再以所有茶葉產(chǎn)區(qū)的空間氣象特征和社會(huì)發(fā)展特征作為特征集,并訓(xùn)練模型,驗(yàn)證模型階段需對不同茶區(qū)的茶葉產(chǎn)量數(shù)據(jù)分別進(jìn)行驗(yàn)證,結(jié)果如圖5-d~f春茶的產(chǎn)量占了極大的比重,其次霜凍是茶葉生產(chǎn)x測各茶區(qū)茶葉產(chǎn)量的模型的R-Squared分別為0.78、0.93、0.81,RMSE分別為1611、1452、1698 t,MAE分別為1014、1094、1116 t;以所有茶區(qū)的數(shù)據(jù)來預(yù)測各茶區(qū)茶葉產(chǎn)量的模型的R-Squared分別為0.86、0.94、0.80,RMSE分別為1312、1374、1724 t,MAE分別為978、996、1211 t??梢婋m然中茶區(qū)的估產(chǎn)模型的預(yù)測效果略有降低,但整體上后者估產(chǎn)效果更好,東茶區(qū)的估產(chǎn)模型的預(yù)測效果略有提高,西北茶區(qū)估產(chǎn)模型的預(yù)測效果提高較明顯,R-Squared提高0.08,RMSE降低299 t,MAE降低36 t。

    特別地,可以發(fā)現(xiàn)無論是以西北茶區(qū)的數(shù)據(jù)還是以整個(gè)茶區(qū)的數(shù)據(jù)作為特征集,西北茶區(qū)的茶葉產(chǎn)量預(yù)測模型的R-Squared的值雖然不高,但是RMSE和MAE值都相對偏低,可能原因是其預(yù)測值與實(shí)際值比較相近,預(yù)測誤差較低,但是預(yù)測值的變異度較低,與實(shí)際值的平均值差距不大,導(dǎo)致西北茶區(qū)的茶葉產(chǎn)量預(yù)測模型的可靠度相對略低。

    另外,根據(jù)茶葉主產(chǎn)區(qū)的茶葉年產(chǎn)數(shù)據(jù)可知,浙西北茶區(qū)和浙東茶區(qū)的茶葉產(chǎn)量分布比較均衡,而浙中茶區(qū)的茶葉產(chǎn)量總體偏低,均分布于15 000 t以下且集中分布于5000 t以內(nèi),所以預(yù)測浙中茶區(qū)茶葉產(chǎn)量時(shí),由于同個(gè)茶區(qū)內(nèi)地理位置相近,樣本特征比較相似,易令預(yù)測值靠近訓(xùn)練樣本分布集中的方向。浙西北茶區(qū)和浙東茶區(qū)的茶葉產(chǎn)量預(yù)測精度較高,預(yù)測值與實(shí)際值相比并無明顯偏向,而浙中茶區(qū)的茶葉產(chǎn)量預(yù)測精度較低,實(shí)際產(chǎn)量較高時(shí)往往會(huì)被低估。

    綜上,若分茶區(qū)進(jìn)行預(yù)測,雖然將樣本進(jìn)行了劃分,但不同茶區(qū)樣本之間的差異不足以降低模型的預(yù)測效果,反而會(huì)使樣本量減少、樣本的覆蓋面和模型的泛化能力降低,導(dǎo)致驗(yàn)證樣本與訓(xùn)練樣本有較大差異時(shí),預(yù)測效果變差。因此,無需按茶區(qū)分別構(gòu)建估產(chǎn)模型對各茶區(qū)的茶葉產(chǎn)量進(jìn)行預(yù)測,擴(kuò)大特征集的樣本容量,利用所有茶區(qū)的數(shù)據(jù)所構(gòu)建的估產(chǎn)模型可達(dá)到更好的產(chǎn)量預(yù)測效果。

    2.4 特征變量對茶葉產(chǎn)量的影響

    利用1995-2016年浙江省茶葉的特征數(shù)據(jù)和產(chǎn)量數(shù)據(jù)分別進(jìn)行基于GBDT的特征重要度分析和特征變量與產(chǎn)量之間的相關(guān)性分析,按重要程度由高到低排序。從表1中可以發(fā)現(xiàn)排名前3的均為社會(huì)發(fā)展特征,依次為茶園面積、農(nóng)村用電量、有效灌溉面積,其重要度遠(yuǎn)高于其他特征變量,且它們的|r|極顯著,值也較大。經(jīng)統(tǒng)計(jì),5個(gè)社會(huì)發(fā)展特征的重要度共高達(dá)0.708,其中茶園面積的重要度更是高達(dá)0.501,說明社會(huì)發(fā)展特征對茶葉產(chǎn)量的影響起著主導(dǎo)作用,決定了產(chǎn)量的基本數(shù)值。

    表1 特征變量的重要度及與產(chǎn)量之間的相關(guān)性分析

    第4~10位的特征變量均為空間氣象特征,重要度較低,分布于0.02~0.06之間,第10位之后的特征變量重要度基本都低于0.01。經(jīng)統(tǒng)計(jì),97個(gè)空間氣象特征的重要度共達(dá)0.292,表明空間氣象特征對茶葉產(chǎn)量的影響起著輔助作用。其中空間特征的重要度共達(dá)0.062,年氣象特征的重要度共達(dá)0.035,春、夏、秋、冬季氣象特征的重要度分別達(dá)0.051、0.047、0.043、0.054,春季和冬季氣象特征的重要度相對較高,這與2.2節(jié)中的研究結(jié)果相一致。另外,氣象要素中年(月)平均氣溫、年(月)平均相對濕度等具有相對較高的重要度,分別達(dá)到0.048和0.055,平均氣溫會(huì)影響茶芽的萌動(dòng)、生長狀況(旺盛、抑制、停止)等,茶葉喜濕,所以平均相對濕度也影響著茶葉的產(chǎn)量,這與以往研究結(jié)果相一致[27-28]。上述結(jié)論再一次印證了之前的研究結(jié)果,即社會(huì)發(fā)展特征對茶葉產(chǎn)量的影響起著決定性作用,而空間氣象特征對茶葉產(chǎn)量的影響作用較小。

    從|r|可以看出,社會(huì)發(fā)展特征的重要度與|r|基本呈正相關(guān)關(guān)系,而空間氣象特征的重要度與|r|并無明顯關(guān)系,例如前10位中的3月平均氣溫和1月負(fù)積溫的|r|并不顯著,其余空間氣象特征|r|值也基本只在0.11~0.15之間,而后10位中的4月平均濕度和3月降水量的|r|卻十分顯著,|r|值也分別達(dá)到0.211和0.134。另外,11~91位的空間氣象特征的|r|值大致分布在0~0.2之間,顯著性也無明顯分布規(guī)律。說明單個(gè)空間氣象特征與茶葉產(chǎn)量的相關(guān)性不太具有參考意義,其原因可能是:現(xiàn)代種植技術(shù)以及品種的提升會(huì)削弱氣候、位置等要素對產(chǎn)量所帶來的影響。所以多維、全方位的特征更加適合茶葉產(chǎn)量的預(yù)測。

    3 討 論

    若選取各縣(市區(qū))茶機(jī)(采茶機(jī)械和修剪機(jī)械)擁有量、茶機(jī)總動(dòng)力、茶園面積、茶園有效灌溉面積等與茶葉產(chǎn)量更加密切相關(guān)的社會(huì)發(fā)展要素作為特征,可能會(huì)進(jìn)一步提升模型的預(yù)測效果,但是以各縣(市區(qū))為單位的與茶機(jī)或茶園相關(guān)的數(shù)據(jù)(除茶園面積)并未記載也難以收集,故本研究只能選取有記載的、較宏觀卻適宜的數(shù)據(jù),例如農(nóng)機(jī)總動(dòng)力替代茶機(jī)總動(dòng)力、縣(市區(qū))的有效灌溉面積替代茶園有效灌溉面積等。另外,由于資料記載有限,主要茶葉產(chǎn)區(qū)數(shù)和總樣本數(shù)偏少,且茶葉主產(chǎn)區(qū)中未包含茶葉總產(chǎn)量最少的浙南茶區(qū)的縣(市區(qū)),樣本數(shù)據(jù)不全面,可能會(huì)降低估產(chǎn)模型的泛化能力。

    茶葉產(chǎn)量會(huì)受到諸多要素的影響,所以其產(chǎn)量預(yù)測是一項(xiàng)復(fù)雜的研究工作,不僅需要選取適宜的特征變量、預(yù)測精度高,而且需要結(jié)果可解釋性高。本文引入社會(huì)發(fā)展特征是為了確切地分析社會(huì)環(huán)境對茶葉產(chǎn)量的影響,同時(shí)能對比分析不同類型特征變量對產(chǎn)量的影響程度,確定影響程度較大的因素,為茶葉的生產(chǎn)管理提供指導(dǎo)意見。因此,關(guān)于多特征的非線性茶葉產(chǎn)量預(yù)測模型的研究是具有一定意義的且是以后的研究重點(diǎn)。

    4 結(jié) 論

    本文基于梯度提升決策樹算法,結(jié)合浙江省地面氣候資料數(shù)據(jù)、空間特征、社會(huì)發(fā)展特征與茶葉年產(chǎn)量數(shù)據(jù),建立茶葉產(chǎn)量預(yù)測模型,并探討各個(gè)特征的重要度以及其對茶葉產(chǎn)量的影響。

    (1)相較于空間氣象特征或社會(huì)發(fā)展特征,以空間氣象特征和社會(huì)發(fā)展特征為特征集的模型的預(yù)測效果最佳,其決定系數(shù)R-Squared達(dá)到0.90,RMSE為1492 t,MAE為1050 t。另外,社會(huì)發(fā)展特征對產(chǎn)量預(yù)測效果具有巨大貢獻(xiàn),其模型的R-Squared達(dá)到0.80。

    (2)利用春季和冬季的氣象特征預(yù)測茶葉產(chǎn)量,效果要優(yōu)于夏季和秋季,R-Squared均達(dá)到0.89,而利用秋季的氣象特征估產(chǎn)的精度最低,R-Squared達(dá)到0.86,說明春、冬兩季的氣候因素對茶葉產(chǎn)量的影響更大,秋季的影響最小。

    (3)通過計(jì)算特征重要度發(fā)現(xiàn),除社會(huì)發(fā)展特征外,空間氣象特征中空間特征、年氣象特征、春季氣象特征、冬季氣象特征對產(chǎn)量影響較大,氣象因素中年(月)平均氣溫、年(月)平均相對濕度對產(chǎn)量影響較大。另外,社會(huì)發(fā)展特征的重要度與|r|呈正相關(guān)關(guān)系,空間氣象特征的重要度與|r|不具有明顯關(guān)系。

    猜你喜歡
    茶區(qū)氣象茶葉
    氣象
    商洛茶區(qū)無性系茶苗高效栽植技術(shù)
    《茶葉通訊》簡介
    茶葉通訊(2022年2期)2022-11-15 08:53:56
    氣象樹
    北緣茶區(qū)秋季修剪對茶樹越冬及次年茶芽萌發(fā)影響的探討
    《內(nèi)蒙古氣象》征稿簡則
    藏族對茶葉情有獨(dú)鐘
    創(chuàng)造(2020年5期)2020-09-10 09:19:22
    大國氣象
    香噴噴的茶葉
    快樂語文(2018年36期)2018-03-12 00:56:02
    生態(tài)茶區(qū)旅游開發(fā)與保護(hù)管理淺析
    福建茶葉(2018年11期)2018-01-19 04:07:44
    襄城县| 自治县| 东安县| 遂溪县| 宜君县| 宁南县| 万全县| 昌平区| 茂名市| 新丰县| 满城县| 西林县| 桃源县| 慈溪市| 广德县| 吉隆县| 郓城县| 乳源| 阿克苏市| 马关县| 绥宁县| 克什克腾旗| 普洱| 德化县| 纳雍县| 克东县| 连平县| 恩施市| 灵璧县| 个旧市| 贞丰县| 永胜县| 南开区| 宜州市| 哈密市| 山东| 任丘市| 潼关县| 吉安市| 常熟市| 成武县|