• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于GA-SVR的疫情下各省糧食產(chǎn)量模型研究

    2023-05-30 02:04:11童曉星孟梁張凌志
    安徽農(nóng)學(xué)通報(bào) 2023年6期
    關(guān)鍵詞:預(yù)測

    童曉星 孟梁 張凌志

    摘要 利用ε-SVR(支持向量回歸)的理論,提出了一種大型傳染病對當(dāng)年各省糧食產(chǎn)量影響的模型,通過選取感染人口占比、近5年播種面積等16個(gè)因素,用1961—2020年被戊型肝炎、霍亂、嚴(yán)重急性呼吸綜合征(SARS)和新冠肺炎影響的北京等52?。ㄊ小⒆灾螀^(qū))糧食產(chǎn)量數(shù)據(jù)進(jìn)行建模,通過GA(貪婪算法)對核函數(shù)參數(shù)進(jìn)行局部最優(yōu)取值,當(dāng)核函數(shù)中的γ值取值0.031、懲罰系數(shù)C取值5.0E+4、損失函數(shù)參數(shù)P取值0.000 98時(shí),模型擬合平均相對誤差0.92%,決定系數(shù)0.99。應(yīng)用該模型對2020年被新冠肺炎疫情影響到的浙江、湖北省,2003年被SARS病毒影響到的甘肅、陜西、廣東省以及1978年被登革熱影響到的廣東省的6組產(chǎn)量數(shù)據(jù)進(jìn)行預(yù)測,平均相對誤差為3.12%。為衡量大型傳染病對糧食產(chǎn)量的影響程度,對去除感染人口占比和死亡人口占比2個(gè)因素后重新建模,新模型擬合平均相對誤差為0.97%,預(yù)測平均相對誤差為3.52%,表明大型傳染病對糧食產(chǎn)量有一定的影響,但影響較小?;贕A-SVR的大型傳染病對國內(nèi)糧食產(chǎn)量影響的模型可有效預(yù)測疫情下當(dāng)年各省糧食產(chǎn)量,為短期內(nèi)地區(qū)糧食產(chǎn)量預(yù)測提供了新方法,也為國家宏觀調(diào)控提供了新依據(jù)。

    關(guān)鍵詞 支持向量回歸;大型傳染?。划?dāng)年各省糧食產(chǎn)量;貪婪算法;預(yù)測

    中圖分類號 T18;S114? ?文獻(xiàn)標(biāo)識碼 A

    文章編號 1007-7731(2023)06-0055-05

    2020年初,全球暴發(fā)了新冠肺炎疫情,由于新冠病毒傳染力強(qiáng),導(dǎo)致傳播范圍廣、感染人數(shù)多。2020年4月初,全球多國發(fā)布申明,為確保本國糧食供給,停止糧食出口。在疫情下,準(zhǔn)確預(yù)測當(dāng)年糧食產(chǎn)量可以幫助國家或地區(qū)更好地掌握農(nóng)業(yè)生態(tài)發(fā)展趨勢、保障人們生活的基本要求。雖然當(dāng)前已有不少糧食預(yù)測的方法,如Nerlove模型[1]、系統(tǒng)動(dòng)力學(xué)模型[2]、IPSO-BP模型[3]、時(shí)間序列模型等[4],但對于大型傳染病疫情下的地區(qū)糧食產(chǎn)量預(yù)測的研究仍然較少。

    近些年來,隨著人工智能、機(jī)器學(xué)習(xí)技術(shù)的發(fā)展,SVM支持向量機(jī)這種具備較強(qiáng)泛化能力和廣泛適用性的算法已被普遍應(yīng)用到農(nóng)業(yè)生產(chǎn)預(yù)測、分類和圖像識別等領(lǐng)域,如滴灌灌水器流量預(yù)測[5],玉米、大豆、水稻識別[6],現(xiàn)代農(nóng)業(yè)氣象分析[7],灌溉耕地研究[8],茶園地形數(shù)據(jù)研究等[9],而SVM最終解決的是凸二次規(guī)劃問題[10],在處理局部極限極值的問題上優(yōu)于神經(jīng)網(wǎng)絡(luò)。在本次研究課題中,由于新冠肺炎疫情的發(fā)生,存在個(gè)別地區(qū)暴發(fā)較嚴(yán)重,個(gè)別地區(qū)暴發(fā)較緩和等特點(diǎn),SVM算法更易得到全局最優(yōu)解。傳統(tǒng)的SVM算法僅局限于二元分類,ε-SVR是在傳統(tǒng)二元分類的基礎(chǔ)上可對回歸問題進(jìn)行拓展的算法[11]。

    1 理論基礎(chǔ)

    1.1 SVR及其核函數(shù)

    SVM作為一種二值分類模型(非0即1),模型建立在特征空間上的間隔最大的線性分類器之上,為使SVM可對連續(xù)性數(shù)值作回歸預(yù)測,通過多次分類迭代的方式優(yōu)化后提出了SVR模型。本文經(jīng)過多次試驗(yàn),確定徑向基函數(shù)(RBF)為本數(shù)據(jù)建立模型的最佳核函數(shù)。相關(guān)計(jì)算公式如下:

    徑向基分類器的特點(diǎn)是每個(gè)基函數(shù)的中心對應(yīng)于一個(gè)支持向量,輸出權(quán)值都是由算法自動(dòng)確定。其內(nèi)積函數(shù)類似人腦的神經(jīng)中樞特性,不同的S參數(shù)值相應(yīng)的分類面差別較大。

    Christopher J. C. Burges曾對線性核函數(shù)、多項(xiàng)式核函數(shù)和徑向基核函數(shù)進(jìn)行了試驗(yàn)比較,不同的核函數(shù)對不同的數(shù)據(jù)庫各有優(yōu)劣[12],也有基于UCI基準(zhǔn)庫上的數(shù)據(jù)分析的研究表明徑向基核函數(shù)性能略為優(yōu)良 [13]。

    1.2 核函數(shù)中重要參數(shù)γ、C、P

    γ:設(shè)置核函數(shù)中γ的值,隨著γ的增大,存在對于測試集分類效果差而對訓(xùn)練分類效果好的情況,并且容易泛化誤差出現(xiàn)過擬合,一般取值在0.01[14]附近。本文通過迭代運(yùn)算,得出最佳值為0.031。

    C:懲罰因子。C表征對離群點(diǎn)的重視程度,C值大時(shí)對誤差分類的懲罰增大,C值小時(shí)對誤差分類的懲罰減小。本研究中由于樣本較小,而大規(guī)模傳染病造成的影響不可忽視性,故C值取值較大,當(dāng)取值5.0E+4時(shí),模型預(yù)測值和原始值的擬合度最高。

    P代表SVM中損失函數(shù)中的參數(shù)b。SVM中的損失函數(shù)定義為合頁(hinge)損失函數(shù)和正則化項(xiàng)之和,可用以下公式表示:

    式中:代表取正值函數(shù)。

    如果被正確分類,則損失為0,如果未被正確分類,則損失為z,[λω2]為了防止過擬合,進(jìn)而增強(qiáng)泛化能力,合頁損失函數(shù)表示預(yù)測不正確的類別([i≠j])累加之和,而參數(shù)b代表著損失閾值,b值越高,損失計(jì)算越高。

    1.3 GA(貪婪算法)

    本文通過GA算法實(shí)現(xiàn)SVR核函數(shù)中γ、C、P的選值,GA算法旨在某個(gè)范圍內(nèi)取最優(yōu)解,而不是全局最優(yōu)解,通過對γ分成0~0.001、0.001~0.01、0.01~0.1、0.1~1等4個(gè)范圍,C分成0~0.1、0.1~1、1~10、10~100、100~1 000、1 000~1.0 E+4、1.0 E+4~1.0 E+5共7個(gè)范圍,P分成0~1.0E-5、1.0E-5~1.0E-4、1.0E-4~1.0E-3、0.001~0.01、0.01~0.1、0.1~1共6個(gè)范圍,γ、C、P的默認(rèn)值分別為0.1、1、0.1,設(shè)置GA的第1個(gè)節(jié)點(diǎn)為改變?chǔ)玫娜≈?,分別取值0、0.001、0.01、0.1、1,第2個(gè)節(jié)點(diǎn)為C的7個(gè)取值,第3個(gè)節(jié)點(diǎn)為P的6個(gè)取值,這樣平均誤差最小的即為最優(yōu)的γ、C、P的取值/取值范圍。這里,對C的取值需要特別注意,以往對于C值的取值往往是遍歷、迭代的方法,通常C越大說明錯(cuò)誤懲罰越高,得出的模型擬合度高,容易出現(xiàn)過擬合的情況,這種情況對于新數(shù)據(jù)的適用性較低。本文通過GA算法,得出在C在一定閉合區(qū)域下的最優(yōu)解,避免過擬合的現(xiàn)象。

    2 糧食產(chǎn)量預(yù)測模型

    2.1 訓(xùn)練樣本

    本文選取2020年新冠肺炎疫情期間的北京、天津等29個(gè)省(市、自治區(qū)),2003年SARS期間發(fā)生傳播的北京、天津等21個(gè)?。ㄊ?、自治區(qū))糧食產(chǎn)量數(shù)據(jù),1961年霍亂發(fā)生傳播的廣東省糧食產(chǎn)量數(shù)據(jù)以及1986年戊型肝炎發(fā)生傳播的新疆維吾爾自治區(qū)糧食產(chǎn)量數(shù)據(jù)作為訓(xùn)練樣本。2020年山東、廣東新冠肺炎病毒感染人數(shù)分別達(dá)10 165人、12 624人,2003年北京SARS病毒感染人數(shù)達(dá)2 434人,1961年廣東省霍亂感染人數(shù)達(dá)4 319人,1986年新疆戊型肝炎感染人數(shù)達(dá)119 280人,傳染病感染絕對數(shù)較大,可驗(yàn)證模型的廣泛適用性。

    2.2 預(yù)測樣本

    本文選取了2020年新冠肺炎期間的浙江、湖北省,2003年SARS疫情期間的廣東、陜西、甘肅3個(gè)省份糧食產(chǎn)量數(shù)據(jù)以及1978年登革熱疫情流行的廣東省糧食產(chǎn)量數(shù)據(jù)作為預(yù)測樣本。2020年湖北新冠肺炎病例達(dá)6.8萬,1978年廣東登革熱病例達(dá)2.2萬,比較能驗(yàn)證模型的適應(yīng)性。

    3 數(shù)據(jù)預(yù)處理與方法分析

    3.1 數(shù)據(jù)預(yù)處理

    根據(jù)現(xiàn)有研究,對于機(jī)器學(xué)習(xí)方法研究糧食產(chǎn)量的影響因素,主要考慮糧食作物播種面積、化肥施用量、糧食作物有效灌溉面積等因素[15-16]。考慮到本文主要是研究疫情下的糧食產(chǎn)量預(yù)測,故加入了疫情程度因素和當(dāng)?shù)貏?wù)農(nóng)人數(shù)(農(nóng)村從業(yè)人員數(shù))及變化趨勢,近些年糧食產(chǎn)量發(fā)展趨勢可涵蓋化肥施用量等其他次要因素。

    綜上,本文將主要因素歸為以下4類:①疫情影響力。由于各省份的人口數(shù)存在差異,故感染人口和死亡人口2個(gè)維度不能準(zhǔn)確說明疫情的嚴(yán)重性,所以選取了感染人口和死亡人口占年底總?cè)丝跀?shù)的比重作為疫情嚴(yán)重程度的指標(biāo);②糧食播種面積因素。近些年根據(jù)政策播種面積有所變化,帶來的糧食產(chǎn)量影響也是很直觀、明顯的,所以選取了近5年的糧食播種面積;③務(wù)農(nóng)人口。此處用“農(nóng)村從業(yè)人口”來代替,近5年的農(nóng)村從業(yè)人口可更好地反映務(wù)農(nóng)人口變化趨勢;④當(dāng)?shù)丶Z食產(chǎn)量。前一年當(dāng)?shù)丶Z食產(chǎn)量可作為當(dāng)年糧食產(chǎn)量預(yù)估的最直接依據(jù)之一,為了更好地體現(xiàn)糧食產(chǎn)量變化的趨勢,選取了近4年的當(dāng)?shù)丶Z食產(chǎn)量數(shù)據(jù)。

    對本模型建立的數(shù)據(jù)處理如下:①感染人口和亡人口占比2個(gè)參數(shù)。由于疫情差異,如2003年SARS時(shí)期遼寧僅3例,而1986年新疆戊型肝炎發(fā)病近12萬例,為體現(xiàn)不同地區(qū)疫情影響程度的差異,對該2個(gè)參數(shù)保留原格式;②糧食播種面積、農(nóng)村從業(yè)人口。以第n-4年的糧食播種面積和農(nóng)村從業(yè)人口作為基準(zhǔn),對第n-3年、第n-2年、第n-1年和當(dāng)年的數(shù)據(jù)做歸一化處理(如疫情發(fā)生在2000年,則第n-4年、第n-3年、第n-2年、第n-1年和當(dāng)年分別代表1996年、1997年、1998年、1999年和2000年);③糧食產(chǎn)量。以第n-4年的糧食產(chǎn)量作為基準(zhǔn),對第n-3年、第n-2年、第n-1年的產(chǎn)量做歸一化處理。模型訓(xùn)練樣本數(shù)據(jù)見表1。

    3.2 方法分析

    經(jīng)過試驗(yàn),通過GA算法對核函數(shù)參數(shù)取值,當(dāng)γ在0.01~0.1、C在1.0E+4~1.0E+5和P在1.0E-4~1.0E-3范圍內(nèi),平均相對誤差最小,再進(jìn)一步調(diào)整,當(dāng)γ=0.031時(shí),訓(xùn)練樣本平均相對誤差在2%左右,當(dāng)γ>0.031并逐步增大時(shí),訓(xùn)練樣本平均相對誤差仍然在2%左右,但預(yù)測樣本平均相對誤差明顯增大,當(dāng)γ<0.031并繼續(xù)減小時(shí),訓(xùn)練樣本平均相對誤差逐步上升,說明擬合度下降。

    對懲罰因子C進(jìn)行調(diào)整,當(dāng)C<1.0E+4時(shí),訓(xùn)練樣本平均相對誤差在5%左右,且C越小擬合度越低,當(dāng)C>1.0E+4并逐步增大時(shí),訓(xùn)練樣本平均相對誤差逐步減小,當(dāng)C取值5.0E+4時(shí),訓(xùn)練樣本平均相對誤差為0.92%,預(yù)測樣本平均相對誤差為3.11%,當(dāng)C取值>5.0E+4且繼續(xù)增大時(shí),訓(xùn)練樣本平均相對誤差略微減小,但是預(yù)測樣本平均相對誤差的增加幅度較大,說明預(yù)測效果下降。

    P代表對損失函數(shù)中的參數(shù)b,對P進(jìn)行調(diào)整,當(dāng)P>0.000 98且逐步增大時(shí),訓(xùn)練樣本平均相對誤差逐步變大,擬合度下降,當(dāng)P<0.000 98且逐步減小時(shí),訓(xùn)練樣本平均相對誤差逐步變小,但預(yù)測樣本平均相對誤差的增加幅度較大,說明預(yù)測效果下降。

    4 預(yù)測樣本當(dāng)年糧食產(chǎn)量預(yù)測結(jié)果

    事實(shí)表明,當(dāng)γ=0.031、C=5.0E+4、P=0.000 98時(shí),模型擬合度較好,訓(xùn)練樣本的平均相對誤差為0.92%,決定系數(shù)達(dá)0.99,同時(shí)預(yù)測樣本平均相對誤差為3.11%,滿足對傳染病發(fā)生當(dāng)年的地區(qū)糧食產(chǎn)量預(yù)測需求,而GA-SVR由于其對少量樣本的案例模型建模,可通過參數(shù)優(yōu)化設(shè)置,使其泛化能力較強(qiáng),所以基于GA-SVR的糧食產(chǎn)量模型可對地區(qū)短期糧食產(chǎn)量預(yù)測提供準(zhǔn)確的參考數(shù)據(jù)。訓(xùn)練樣本結(jié)果見表2,預(yù)測結(jié)果見表3。

    為了研究大型傳染病是否對當(dāng)年的糧食產(chǎn)量具有重大影響,本文對于原有樣本去除疫情程度的2個(gè)參數(shù)(感染人口占比、死亡人數(shù)占比)后再次進(jìn)行建模發(fā)現(xiàn),訓(xùn)練樣本擬合平均相對誤差為0.97%,預(yù)測樣本平均相對誤差為3.52%,決定系數(shù)同樣達(dá)到0.99。事實(shí)表明,該模型對地區(qū)短期糧食產(chǎn)量預(yù)測同樣具有較好的參考性。含疫情因素和不含疫情因素預(yù)測結(jié)果見表4。

    5 大型傳染病對糧食產(chǎn)量的影響

    由于國內(nèi)大型傳染病樣本有限,屬于小樣本數(shù)據(jù)分析,GA-SVR方法對于少量樣本擬合、泛化能力均較優(yōu)秀,通過參數(shù)的優(yōu)化設(shè)置,模型建立和驗(yàn)證得到以下結(jié)論:①在γ=0.031、C=5.0E+4、P=0.000 98時(shí),模型可以較好地對樣本數(shù)據(jù)進(jìn)行擬合,預(yù)測效果也比較好,說明基于GA-SVR的大型傳染病糧食產(chǎn)量模型準(zhǔn)確、可靠。②在除去表示疫情程度的感染人口占比和死亡人口占比2個(gè)參數(shù)后重新建模,新模型仍然可以較好地對建模樣本數(shù)據(jù)擬合,對目標(biāo)樣本進(jìn)行預(yù)測,雖然較含疫情參數(shù)的模型平均相對誤差略大,但在基于現(xiàn)有國內(nèi)大型傳染病疫情數(shù)據(jù)建模,疫情對當(dāng)年地區(qū)糧食產(chǎn)量的影響有限。

    該方法可以在大型傳染病疫情環(huán)境下,提供當(dāng)年各省糧食產(chǎn)量預(yù)測,為國家糧食宏觀調(diào)控提供參考。

    6 參考文獻(xiàn)

    [1] 李東林,左其亭,張偉,等.基于Nerlove方法的塔里木河流域農(nóng)業(yè)水資源配置模型[J].水資源保護(hù),2021,37(2):75-80.

    [2] 王倩,黃凱.基于系統(tǒng)動(dòng)力學(xué)的北京市農(nóng)業(yè)水足跡模擬與影響因素分析[J].系統(tǒng)工程,2021,39(3):13-24.

    [3] 胡程磊,劉永華,高菊玲.基于IPSO-BP模型的糧食產(chǎn)量預(yù)測方法研究[J].中國農(nóng)機(jī)化學(xué)報(bào),2021,42(3):136-141.

    [4] 李桐,董維紅,張琦琛,等.基于時(shí)間序列模型的黑龍江省糧食水足跡分析與預(yù)測[J].排灌機(jī)械工程學(xué)報(bào),2020,38(11):1152-1159.

    [5] 郭霖,白丹,王新端,等.基于支持向量機(jī)的滴灌灌水器流量預(yù)測模型建立與驗(yàn)證[J].農(nóng)業(yè)工程學(xué)報(bào),2018,34(2):74-82

    [6] 梁繼,鄭鎮(zhèn)煒,夏詩婷,等.高分六號紅邊特征的農(nóng)作物識別與評估[J].遙感學(xué)報(bào),2020,24(10):1168-1179.

    [7] 李穎,陳懷亮.機(jī)器學(xué)習(xí)技術(shù)在現(xiàn)代農(nóng)業(yè)氣象中的應(yīng)用[J].應(yīng)用氣象學(xué)報(bào),2020,31(3):257-266.

    [8] 陳曉璐,王彥芳,張紅梅,等.基于ESTARFM NDVI的察汗淖爾流域灌溉耕地提取方法研究[J].中國生態(tài)農(nóng)業(yè)學(xué)報(bào)(中英文),2021,29(6):1105-1116.

    [9] 熊皓麗,周小成,汪小欽,等. 基于GEE云平臺(tái)的福建省10 m分辨率茶園專題空間分布制圖[J].地球信息科學(xué)學(xué)報(bào),2021,23(7):1325-1337.

    [10] VAPNIK V N.The nature of statistical learning theory[M].New York:Springer,1999.

    [11] 冼廣銘,曾碧卿.ε-支持向量回歸機(jī)算法及其應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2008(17):40-42.

    [12] BURGES C J C.A tutorial on support vector machines for pattern rec-ognition[J].Data Mining and Knowledge Discovery,1998(2):121-167.

    [13] 林升梁,劉志.基于RBF核函數(shù)的支持向量機(jī)參數(shù)選擇[J]. 浙江工業(yè)大學(xué)學(xué)報(bào),2007(2):163-167.

    [14] 成鵬,汪西莉.SVR參數(shù)對非線性函數(shù)擬合的影響[J].計(jì)算機(jī)工程,2011,37(3):189,191,194.

    [15] 高心怡,韓飛.基于混合智能算法的支持向量機(jī)的糧食產(chǎn)量預(yù)測[J].江蘇大學(xué)學(xué)報(bào)(自然科學(xué)版),2020,41(3):301-306.

    [16] 伍丹華,周禮梅.基于BP神經(jīng)網(wǎng)絡(luò)的糧食產(chǎn)量預(yù)測[J].農(nóng)業(yè)工程技術(shù),2020,40(27):51-53.

    (責(zé)編:張宏民)

    基金項(xiàng)目 國家自然科學(xué)基金項(xiàng)目(41877425);上海市自然科學(xué)基金項(xiàng)目(21ZR1446800)。

    作者簡介 童曉星(1983—),男,浙江慈溪人,碩士,講師。研究方向:農(nóng)業(yè)電氣化與自動(dòng)化。

    猜你喜歡
    預(yù)測
    無可預(yù)測
    黃河之聲(2022年10期)2022-09-27 13:59:46
    基于PCC-CNN-GRU的短期風(fēng)電功率預(yù)測
    選修2—2期中考試預(yù)測卷(A卷)答案與提示
    選修2-2期中考試預(yù)測卷(A卷)
    選修2-2期中考試預(yù)測卷(B卷)
    選修2—2期中考試預(yù)測卷(B卷)
    選修2—2期中考試預(yù)測卷(A卷)
    選修2—2期中考試預(yù)測卷(B卷)答案與提示
    “預(yù)測”得準(zhǔn)
    不可預(yù)測
    共和县| 龙里县| 来宾市| 扎兰屯市| 鹤山市| 嘉定区| 布尔津县| 越西县| 吉水县| 承德市| 新竹市| 龙陵县| 拜城县| 准格尔旗| 临澧县| 农安县| 北辰区| 叶城县| 武胜县| 武定县| 石河子市| 江阴市| 蒲江县| 丰都县| 扶沟县| 松溪县| 曲松县| 金门县| 武清区| 尼木县| 墨玉县| 扬州市| 渭源县| 美姑县| 凯里市| 红原县| 伊金霍洛旗| 民和| 新野县| 晴隆县| 陵水|