• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于機(jī)器學(xué)習(xí)的區(qū)域快遞包裝需求預(yù)測(cè)優(yōu)化研究

    2024-01-20 06:48:36劉戰(zhàn)豫張宇飛
    包裝工程 2024年1期
    關(guān)鍵詞:需求預(yù)測(cè)特征選擇遺傳算法

    劉戰(zhàn)豫,張宇飛

    基于機(jī)器學(xué)習(xí)的區(qū)域快遞包裝需求預(yù)測(cè)優(yōu)化研究

    劉戰(zhàn)豫1,2,張宇飛1

    (1.河南理工大學(xué) 工商管理學(xué)院能源經(jīng)濟(jì)研究中心,河南 焦作 454000; 2.太行發(fā)展研究院,河南 焦作 454000)

    快遞包裝需求預(yù)測(cè)精準(zhǔn)程度是智慧物流體系化建設(shè)的重要基礎(chǔ),本文主要通過(guò)對(duì)不同機(jī)器學(xué)習(xí)方法、不同特征選擇方法、不同參數(shù)尋優(yōu)方法的比較,選取快遞包裝需求預(yù)測(cè)更加精準(zhǔn)的方法,分析主要特征對(duì)快遞包裝需求的影響,優(yōu)化區(qū)域快遞包裝需求的研究。首先通過(guò)不同的機(jī)器學(xué)習(xí)方法進(jìn)行比較;然后通過(guò)不同的特征選擇方法進(jìn)行比較,通過(guò)不同參數(shù)尋優(yōu)方法比較確定遺傳算法對(duì)優(yōu)化隨機(jī)森林模型參數(shù)的效果;最后為了更好地解釋模型,引入SHAP分析的方法,對(duì)不同特征的重要性進(jìn)行分析。改進(jìn)的隨機(jī)森林預(yù)測(cè)模型效果最好,MAE值、MAPE值、RMSE值、2分別為2 783、5.1%、4 343、0.99。女性人口和第三產(chǎn)業(yè)值是影響快遞包裝需求最為關(guān)鍵的因素。所提出的預(yù)測(cè)方法有更好的準(zhǔn)確性及可解釋性,能為快遞包裝需求預(yù)測(cè)提供有力的決策支持。

    快遞包裝;隨機(jī)森林;需求預(yù)測(cè)

    隨著全球經(jīng)濟(jì)發(fā)展和時(shí)代科技的進(jìn)步,物流發(fā)展的機(jī)遇與挑戰(zhàn)并存,區(qū)域快遞包裝需求因受不確定性因素影響較大,常呈現(xiàn)出隨機(jī)性、非平穩(wěn)性等特點(diǎn),不能準(zhǔn)確預(yù)測(cè)快遞包裝需求態(tài)勢(shì),會(huì)制約物流企業(yè)快遞業(yè)務(wù)高質(zhì)量增長(zhǎng)。針對(duì)此問(wèn)題,根據(jù)快遞包裝需求的不同層次和不同時(shí)間緯度的變化,構(gòu)建準(zhǔn)確高效的需求預(yù)測(cè)模型,通過(guò)信息和算法實(shí)現(xiàn)供需高、效率準(zhǔn)確的匹配研究,將有助于智慧物流體系建設(shè),促進(jìn)數(shù)字化包裝管理,使物流企業(yè)決策更加科學(xué)合理,有利于物流業(yè)高質(zhì)量發(fā)展[1]。

    在需求預(yù)測(cè)研究中,部分學(xué)者們采用傳統(tǒng)的數(shù)理統(tǒng)計(jì)方法對(duì)數(shù)據(jù)進(jìn)行預(yù)測(cè)分析,如灰色預(yù)測(cè)模型[2]、ARIMA模型[3]、SARIMA和多元回歸相結(jié)合[4]。然而隨著大數(shù)據(jù)時(shí)代的到來(lái),對(duì)數(shù)據(jù)的處理難度呈幾何倍增,高維度、高容量的數(shù)據(jù)難以通過(guò)傳統(tǒng)數(shù)理統(tǒng)計(jì)方法來(lái)處理,機(jī)器學(xué)習(xí)在處理此類問(wèn)題時(shí)的優(yōu)勢(shì)日趨明顯。

    隨著機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘的快速發(fā)展,機(jī)器學(xué)習(xí)逐漸應(yīng)用于需求預(yù)測(cè)領(lǐng)域,在電力需求[5]、產(chǎn)品需求[6]、能源需求[7]等領(lǐng)域已有成熟運(yùn)用。馮易等[8]指出相比于單一學(xué)習(xí)器,如隨機(jī)森林等集成學(xué)習(xí)器更具優(yōu)勢(shì)。Feng等[9]利用RBF神經(jīng)網(wǎng)絡(luò)對(duì)我國(guó)能源需求進(jìn)行預(yù)測(cè)。李國(guó)祥等[10]利用LSTM模型對(duì)區(qū)域物流進(jìn)行預(yù)測(cè)。孫俊軍等[11]利用XGBoost模型對(duì)紙包裝行業(yè)的訂單量進(jìn)行預(yù)測(cè)。Zhang等[12]利用BP神經(jīng)網(wǎng)絡(luò)進(jìn)行預(yù)測(cè),均取得較好效果。同時(shí),也有學(xué)者為更好提高預(yù)測(cè)精度,提升模型運(yùn)算效率,利用組合模型來(lái)進(jìn)行預(yù)測(cè),如將灰色預(yù)測(cè)模型和BP神經(jīng)網(wǎng)絡(luò)相結(jié)合[13],利用蟻群算法優(yōu)化支持向量機(jī)[14],利用主成分分析結(jié)合神經(jīng)網(wǎng)絡(luò)模型進(jìn)行預(yù)測(cè)[15]。

    在包裝領(lǐng)域,學(xué)者們較多關(guān)注貨架期預(yù)測(cè)[16-18]和包裝工程、包裝材料等相關(guān)領(lǐng)域預(yù)測(cè)[19-20],鮮有利用機(jī)器學(xué)習(xí)對(duì)區(qū)域快遞包裝需求進(jìn)行預(yù)測(cè)分析的研究。因此本文通過(guò)將不同預(yù)測(cè)模型引入?yún)^(qū)域快遞包裝需求中,通過(guò)對(duì)比選取最優(yōu)模型,并對(duì)最優(yōu)模型進(jìn)一步優(yōu)化以提升預(yù)測(cè)精度。

    1 研究對(duì)象

    本文以河南省快遞包裝需求為例,相關(guān)快遞包裝需求影響因素?cái)?shù)據(jù)來(lái)源于對(duì)國(guó)家統(tǒng)計(jì)局和歷年《河南統(tǒng)計(jì)年鑒》的整理??爝f包裝數(shù)據(jù)按照行業(yè)公布數(shù)據(jù)進(jìn)行計(jì)算,并采用物流業(yè)相關(guān)數(shù)據(jù)進(jìn)行修正[21-22]。

    1.1 研究對(duì)象描述

    河南作為中原人口大省,2022年常住人口已達(dá)到9 872萬(wàn)人,消費(fèi)市場(chǎng)規(guī)模化增長(zhǎng)顯著。快遞量在2022年達(dá)到44.53億件,2023年前8個(gè)月河南快遞業(yè)務(wù)量為36.19億件,居全國(guó)第6,同比增長(zhǎng)了24.5%。河南消費(fèi)市場(chǎng)規(guī)?;鲩L(zhǎng)帶來(lái)快遞需求量激增,快遞需求激增的同時(shí)對(duì)快遞包裝產(chǎn)生了巨大影響??爝f包裝量的準(zhǔn)確評(píng)估與預(yù)測(cè)對(duì)物流業(yè)高質(zhì)量發(fā)展具有積極促進(jìn)作用。鑒于此,亟須對(duì)河南省快遞包裝量預(yù)測(cè)進(jìn)行優(yōu)化提升,為快遞包裝產(chǎn)業(yè)科學(xué)規(guī)劃奠定基礎(chǔ)。

    1.2 影響因素分析

    區(qū)域性快遞包裝需求有著地區(qū)性特點(diǎn),受當(dāng)?shù)厣鐣?huì)和經(jīng)濟(jì)因素影響,同時(shí)快遞包裝作為快遞產(chǎn)業(yè)鏈上重要一環(huán),依賴于地區(qū)物流業(yè)發(fā)展水平。本文從地區(qū)經(jīng)濟(jì)現(xiàn)狀出發(fā),通過(guò)借鑒其他文獻(xiàn)資料[22,23,24],結(jié)合實(shí)際性、科學(xué)性以及可獲取性原則,將影響快遞包裝需求量的因素歸結(jié)為區(qū)域物流、經(jīng)濟(jì)發(fā)展、消費(fèi)水平、人口規(guī)模四大類。

    1)區(qū)域物流??爝f需求趨勢(shì)和快遞包裝需求趨勢(shì)一致。快遞包裝作為快遞產(chǎn)業(yè)鏈上的重要一環(huán),與快遞產(chǎn)業(yè)的發(fā)展和快遞量的需求密不可分。當(dāng)快遞行業(yè)低迷,快遞使用量少時(shí),快遞包裝的需求也會(huì)隨之下降,反之,當(dāng)快遞需求提升,與之密切相關(guān)的快遞包裝需求也隨之提升。本文通過(guò)貨運(yùn)量、郵政業(yè)務(wù)總量等來(lái)體現(xiàn)快遞的發(fā)展和需求。

    2)經(jīng)濟(jì)發(fā)展??爝f包裝需求受當(dāng)?shù)卣w經(jīng)濟(jì)趨勢(shì)影響,當(dāng)?shù)亟?jīng)濟(jì)呈現(xiàn)下行趨勢(shì)時(shí),地區(qū)產(chǎn)業(yè)負(fù)擔(dān)重,訂單少,對(duì)外快遞運(yùn)輸量少,快遞包裝需求也會(huì)隨之下降,反之,則會(huì)上升。本文通過(guò)地區(qū)生產(chǎn)總值和第一、二、三產(chǎn)業(yè)產(chǎn)值等來(lái)體現(xiàn)當(dāng)?shù)亟?jīng)濟(jì)情況。

    3)消費(fèi)水平。居民消費(fèi)水平與快遞需求呈正相關(guān),消費(fèi)者的消費(fèi)能力強(qiáng),快遞購(gòu)買量大,快遞包裝的需求就高。同時(shí),考慮到互聯(lián)網(wǎng)的應(yīng)用促進(jìn)了電商的發(fā)展,帶來(lái)快遞需求量的不斷提升,故將互聯(lián)網(wǎng)普及也作為影響因素納入指標(biāo)之中。

    4)人口規(guī)模。人口基數(shù)對(duì)快遞包裝需求有間接的影響。在其他條件一定的情況下,人口基數(shù)越大,快遞使用頻率越高,快遞包裝的需求量越大。為更好地分析不同性別對(duì)快遞包裝需求的影響,將人口分為男性人口和女性人口作為輸入特征,方便進(jìn)行模型可解釋分析。

    1.3 指標(biāo)體系構(gòu)建

    根據(jù)四大類變量指標(biāo),按照物流業(yè)相關(guān)文獻(xiàn)[24-25]和物流業(yè)統(tǒng)計(jì)年鑒,提出相應(yīng)的觀測(cè)指標(biāo)。第1類采用貨運(yùn)量、貨物周轉(zhuǎn)量、進(jìn)出口總額、郵政業(yè)務(wù)總量、基礎(chǔ)設(shè)施投資增速等指標(biāo);第2類采用地區(qū)生產(chǎn)總值、第一、二、三產(chǎn)業(yè)產(chǎn)值、商品零售價(jià)格指數(shù)、社會(huì)消費(fèi)品零售總額等指標(biāo);第3類采用互聯(lián)網(wǎng)用戶數(shù)、居民消費(fèi)價(jià)格指數(shù)、人均消費(fèi)支出、人均可支配收入等指標(biāo);第4類采用男性人口和女性人口等指標(biāo)。具體如表1所示。

    表1 影響因素選取

    Tab.1 Selection of influencing factors

    2 研究設(shè)計(jì)

    2.1 預(yù)測(cè)方法優(yōu)化

    隨機(jī)森林算法(RF)是由Breiman(2001)所提出的一種集成學(xué)習(xí)算法,該算法利用自助聚集策略提取多個(gè)樣本,為每個(gè)樣本構(gòu)建一個(gè)子樹(shù),結(jié)合所有子樹(shù)的預(yù)測(cè)結(jié)果得到最終預(yù)測(cè)值,因此隨機(jī)森林算法具備更顯著的泛化性和準(zhǔn)確性。隨機(jī)森林算法的基本內(nèi)核是多個(gè)弱學(xué)習(xí)器組成一個(gè)強(qiáng)學(xué)習(xí)器來(lái)提高全局準(zhǔn)確性,因此該模型具備較強(qiáng)的魯棒性。與此同時(shí),隨機(jī)森林算法模型中的參數(shù)會(huì)影響模型整體性能,如max_depth反映了樹(shù)的復(fù)雜程度。雖然更高的深度有利于學(xué)習(xí)樣本之間的邏輯關(guān)系,但過(guò)高的深度又容易造成模型擬合過(guò)高,因此選擇正確的參數(shù)集合,對(duì)模型性能提升具有重要意義[26-27]。本文通過(guò)遺傳算法對(duì)模型參數(shù)采用迭代尋優(yōu)的方式得到最佳參數(shù),同時(shí)鑒于冗雜的樣本特征會(huì)產(chǎn)生噪聲,對(duì)模型學(xué)習(xí)能力產(chǎn)生負(fù)向影響,因此使用Boruta算法對(duì)特征進(jìn)行選取。預(yù)測(cè)流程如下,具體流程如圖1所示。

    1)通過(guò)分析初步選擇模型特征。

    圖1 預(yù)測(cè)模型流程

    2)使用Boruta算法對(duì)模型特征進(jìn)行選取,其通過(guò)迭代構(gòu)造原始特征和陰影特征的重要性(Z-score),并以Z-score為評(píng)價(jià)指標(biāo)進(jìn)行對(duì)比。只有原始特征重要性高于最好陰影特征重要性的原始特征才被判定為重要特征。

    3)將“快遞包裝需求預(yù)測(cè)”作為預(yù)測(cè)目標(biāo),劃分訓(xùn)練集和測(cè)試集,并進(jìn)行初步預(yù)測(cè)分析。

    4)初始化種群,將實(shí)際值和預(yù)測(cè)值之間的誤差作為適應(yīng)度函數(shù)不斷進(jìn)行迭代,利用遺傳算法自適應(yīng)調(diào)整隨機(jī)森林模型參數(shù)。

    為確定模型預(yù)測(cè)能力,本文選擇常見(jiàn)的平均絕對(duì)誤差(Mean Absolute Error, MAE),平均絕對(duì)百分比誤差(Mean Absolute Percentage Error, MAPE),均方根誤差(Root Mean Square Error, RMSE)和擬合優(yōu)度2作為評(píng)價(jià)指標(biāo)對(duì)模型預(yù)測(cè)效果進(jìn)行評(píng)價(jià)。同時(shí)鑒于BP神經(jīng)網(wǎng)絡(luò)、隨機(jī)森林等算法模型在相同參數(shù)下所得結(jié)果略有差異,為更好檢驗(yàn)?zāi)P托阅埽疚倪x擇重復(fù)實(shí)驗(yàn)的方法,驗(yàn)證所得結(jié)果[10]。

    2.2 優(yōu)化過(guò)程分析

    2.2.1 不同機(jī)器學(xué)習(xí)方法比較

    為更好地顯示模型性能,方便進(jìn)一步分析,本文通過(guò)與其他預(yù)測(cè)模型進(jìn)行比較,展現(xiàn)不同模型對(duì)數(shù)據(jù)處理和算法學(xué)習(xí)的能力。采用未進(jìn)行處理的特征進(jìn)行輸入,同時(shí)除PSO-BP模型外均采用默認(rèn)參數(shù)進(jìn)行預(yù)測(cè),以選取最優(yōu)模型進(jìn)行進(jìn)一步優(yōu)化。具體結(jié)果如表2所示。

    通過(guò)試驗(yàn)結(jié)果可以看出隨機(jī)森林模型在各評(píng)價(jià)指標(biāo)的表現(xiàn)上均優(yōu)于其他模型。綜合來(lái)看,盡管如PSO-BP模型經(jīng)過(guò)算法調(diào)參,但相對(duì)隨機(jī)森林表現(xiàn)來(lái)說(shuō),其性能還是有所欠缺。而其他模型如GBDT,雖在2中與隨機(jī)森林持平,但在其他指標(biāo)中則落后于隨機(jī)森林模型。本文為更好地挖掘隨機(jī)森林模型潛力,對(duì)輸入特征和模型參數(shù)進(jìn)行進(jìn)一步處理。

    表2 不同機(jī)器學(xué)習(xí)方法實(shí)驗(yàn)結(jié)果

    Tab.2 Experimental results of different machine learning methods

    2.2.2 不同特征選擇方法比較

    特征選擇可以提高模型的泛化能力,減小冗余數(shù)據(jù)對(duì)模型性能的影響。對(duì)于特征選擇,本文選擇使用過(guò)濾式特征選擇法、封裝式特征選擇法、嵌入式特征選擇法[28]。Boruta算法在已有研究中已被證明在特征選擇實(shí)踐中具有良好效果[29-30],因此引入Boruta算法進(jìn)行特征選擇,并與其他方法進(jìn)行比較??紤]到部分研究在模型構(gòu)建中未進(jìn)行特征選擇,因此將不進(jìn)行特征選擇的方法也納入比較范圍。

    通過(guò)表3可以看出,根據(jù)MAE值從大到小排名為Boruta、嵌入式特征選擇方法、無(wú)特征選擇、封裝式特征選擇方法、過(guò)濾式特征選擇方法;根據(jù)MAPE值從大到小排名則是Boruta、嵌入式特征選擇方法、封裝式特征選擇方法、無(wú)特征選擇、過(guò)濾式特征選擇方法;根據(jù)RMSE值從大到小排名則是Boruta、嵌入式特征選擇方法、無(wú)特征選擇、封裝式特征選擇方法、過(guò)濾式特征選擇方法;根據(jù)2從大到小排名則是Boruta、嵌入式特征選擇方法=無(wú)特征選擇、封裝式特征選擇方法、過(guò)濾式特征選擇方法。綜合來(lái)說(shuō)Boruta算法表現(xiàn)最優(yōu),相對(duì)于其他特征選擇方法,其MAE值、MAPE值、RMSE值、2均為優(yōu)異。傳統(tǒng)的特征選擇方法所選特征子集具有較差的穩(wěn)定性,而B(niǎo)oruta算法能夠在不降低預(yù)測(cè)準(zhǔn)確率和精確率的情況下,有效移除冗雜數(shù)據(jù),減少數(shù)據(jù)的噪聲和擾動(dòng)。

    表3 不同特征選擇方法實(shí)驗(yàn)結(jié)果

    Tab.3 Experimental results of different feature selection methods

    2.2.3 不同參數(shù)尋優(yōu)方法比較

    最好玩的就是iPad了。令人走火入魔的游戲,大快人心的漫畫(huà),搞笑的視頻段子,都是我的最愛(ài)。還等什么?上手就玩“吃雞”。不過(guò)我很有自覺(jué)性,只有老媽看不到,才能想玩多久就玩多久。再好吃的雞,也有吃撐的時(shí)候,這會(huì)兒我已頭暈?zāi)垦?,站不起身?/p>

    隨機(jī)森林模型包含框架參數(shù)和決策樹(shù)參數(shù)2種,通過(guò)算法自動(dòng)尋找到各參數(shù)之間的平衡,能夠控制模型的復(fù)雜程度和擬合程度,防止過(guò)擬合現(xiàn)象的發(fā)生,有利于充分調(diào)動(dòng)模型性能,挖掘模型潛能。將經(jīng)過(guò)特征選取的指標(biāo)作為輸入變量,通過(guò)參數(shù)尋優(yōu)方法對(duì)模型進(jìn)行調(diào)參,促使模型達(dá)到相對(duì)最優(yōu)性能。模型參數(shù)具體調(diào)參范圍如表4所示,評(píng)價(jià)結(jié)果如表5所示。

    表4 參數(shù)搜索范圍

    Tab.4 Specific parameter settings

    據(jù)表5所示,根據(jù)MAE值從大到小排名為遺傳算法、貝葉斯優(yōu)化、網(wǎng)格搜索、網(wǎng)格隨機(jī)搜索、默認(rèn)參數(shù);根據(jù)MAPE值從大到小排名為遺傳算法、默認(rèn)參數(shù)、貝葉斯優(yōu)化、網(wǎng)格搜索、網(wǎng)格隨機(jī)搜索;根據(jù)RMSE值從大到小排名為遺傳算法、貝葉斯優(yōu)化、網(wǎng)格搜索、網(wǎng)格隨機(jī)搜索、默認(rèn)參數(shù);根據(jù)2從大到小排名為遺傳算法=貝葉斯優(yōu)化=網(wǎng)格搜索、網(wǎng)格隨機(jī)搜索=默認(rèn)參數(shù)。網(wǎng)格搜索和網(wǎng)格隨機(jī)搜索方法相對(duì)貝葉斯優(yōu)化和遺傳算法來(lái)說(shuō),存在難以處理多優(yōu)化組合的缺點(diǎn)。當(dāng)待優(yōu)化組合較多,數(shù)量級(jí)超過(guò)上萬(wàn)個(gè)組合時(shí),對(duì)網(wǎng)絡(luò)搜索方法和網(wǎng)格隨機(jī)搜索方法的處理能力帶來(lái)極大挑戰(zhàn)。網(wǎng)格搜索方法是遍歷所有組合,使用窮舉法去尋找最優(yōu)組合,網(wǎng)格隨機(jī)搜索方法是采用隨機(jī)搜索的方法尋找最優(yōu),雖然降低了大量數(shù)據(jù)所造成的臃腫現(xiàn)象,但是其隨機(jī)因素導(dǎo)致尋優(yōu)結(jié)果易出現(xiàn)較大波動(dòng)。貝葉斯優(yōu)化雖然經(jīng)過(guò)對(duì)目標(biāo)函數(shù)的不斷學(xué)習(xí),使得到的信息不斷更新目標(biāo)函數(shù)先驗(yàn)分布,進(jìn)而優(yōu)化全局結(jié)果預(yù)測(cè)參數(shù),但是相對(duì)遺傳算法來(lái)說(shuō),其初始化存在隨機(jī)性,進(jìn)而導(dǎo)致結(jié)果存在波動(dòng)。遺傳算法在經(jīng)過(guò)多輪迭代之后具備魯棒性,預(yù)測(cè)結(jié)果相對(duì)更加準(zhǔn)確和穩(wěn)定。綜合來(lái)看,經(jīng)過(guò)Boruta算法進(jìn)行特征選取,使用遺傳算法優(yōu)化后的隨機(jī)森林模型(Bor-GA-RF)進(jìn)行預(yù)測(cè),所達(dá)到的效果為最優(yōu),預(yù)測(cè)對(duì)比圖如圖2所示,評(píng)價(jià)指標(biāo)MAE值、MAPE值、RMSE值、2分別為2 783、5.1%、4 343、0.99。

    2.3 重要特征分析

    SHAP特征重要性指各個(gè)特征在模型預(yù)測(cè)中,對(duì)提高模型整體預(yù)測(cè)性能的貢獻(xiàn)程度的大小,使用各特征對(duì)目標(biāo)變量影響程度的絕對(duì)值來(lái)表現(xiàn)[31]。它能夠更加直接地顯示出不同特征指標(biāo)對(duì)模型的影響程度,重要性程度越高,該特征變量對(duì)快遞包裝需求預(yù)測(cè)的影響就越大。通過(guò)SHAP分析可以更好地了解不同特征對(duì)快遞包裝需求預(yù)測(cè)的影響。

    表5 不同參數(shù)選擇方法實(shí)驗(yàn)結(jié)果

    Tab.5 Experimental results of different parameter selection methods

    圖2 預(yù)測(cè)值和實(shí)際值對(duì)比

    為更全面了解不同特征對(duì)快遞包裝需求預(yù)測(cè)的影響,對(duì)Boruta算法特征選擇過(guò)的數(shù)據(jù)進(jìn)行進(jìn)一步分析,如圖3所示。影響快遞包裝需求預(yù)測(cè)的重要程度按從大到小排序是女性人口(X11)、第三產(chǎn)業(yè)值(X4)、男性人口(X10)、郵政業(yè)務(wù)總量(X15)、第二產(chǎn)業(yè)值(X3)、人均可支配收入(X14)、互聯(lián)網(wǎng)用戶(X17)。女性人口對(duì)快遞包裝需求預(yù)測(cè)的影響程度高于其他特征。

    圖3 特征重要程度排序

    從圖3可以看出,女性人口和第三產(chǎn)業(yè)值是影響快遞包裝需求最為關(guān)鍵的因素。第三產(chǎn)業(yè)對(duì)快遞包裝需求的影響遠(yuǎn)高于其他產(chǎn)業(yè)經(jīng)濟(jì),這是快遞包裝需求與快遞行業(yè)發(fā)展密切相關(guān)的體現(xiàn),郵政業(yè)務(wù)總量的影響力也佐證了這一點(diǎn)。同時(shí)“她經(jīng)濟(jì)”的到來(lái),女性消費(fèi)者在網(wǎng)絡(luò)購(gòu)物之中相對(duì)于男性更容易成癮,也更具沖動(dòng)性[32],這導(dǎo)致了女性消費(fèi)者對(duì)快遞的需求更強(qiáng),對(duì)快遞包裝需求的影響遠(yuǎn)高于男性。

    3 結(jié)語(yǔ)

    通過(guò)總結(jié)可以得出以下結(jié)論:相對(duì)于其他預(yù)測(cè)方法,隨機(jī)森林預(yù)測(cè)模型具有較好的預(yù)測(cè)精度;Boruta特征選擇方法在該模型實(shí)踐中優(yōu)于其他特征選擇方法;經(jīng)過(guò)遺傳算法調(diào)參所得到的最終預(yù)測(cè)組合模型(Bor-GA-RF)的性能優(yōu)于其他調(diào)參方法所優(yōu)化的預(yù)測(cè)模型的性能,Bor-GA-RF組合模型在區(qū)域快遞包裝需求預(yù)測(cè)中精度更高;通過(guò)模型可解釋分析的探索,能夠可視化地看出經(jīng)過(guò)Boruta算法篩選后的特征在模型預(yù)測(cè)中對(duì)模型的影響,如女性人口對(duì)快遞包裝需求的影響高于男性人口,究其原因是女性消費(fèi)者在網(wǎng)絡(luò)購(gòu)物之中相對(duì)于男性更容易成癮。

    本研究仍存在許多不足需要改進(jìn),在未來(lái)的研究中,可以考慮引入更詳細(xì)的數(shù)據(jù),以提升預(yù)測(cè)模型的學(xué)習(xí)能力,從而達(dá)到更好的預(yù)測(cè)效果。同時(shí)在未來(lái)還可以考慮使用更好的機(jī)器學(xué)習(xí)方法和更好的優(yōu)化算法來(lái)解決問(wèn)題。

    [1] 冉茂亮, 陳彥如, 楊新彪. 基于EEMD-LMD- LSTM-LEC深度學(xué)習(xí)模型的短時(shí)物流需求預(yù)測(cè)[J]. 控制與決策, 2022, 37(10): 2513-2523.

    RAN M L, CHEN Y R, YANG X B. Short-Term Logistics Demand Forecasting Based on EEMD-LMD- LSTM-LEC Deep Learning Model[J]. Control and Decision, 2022, 37(10): 2513-2523.

    [2] HU Y C. Constructing Grey Prediction Models Using Grey Relational Analysis and Neural Networks for Magnesium Material Demand Forecasting[J]. Applied Soft Computing, 2020, 93: 106398.

    [3] DEY B, ROY B, DATTA S, et al. Forecasting Ethanol Demand in India to Meet Future Blending Targets: A Comparison of ARIMA and Various Regression Models[J]. Energy Reports, 2023, 9: 411-418.

    [4] FANG T T, LAHDELMA R. Evaluation of a Multiple Linear Regression Model and SARIMA Model in Forecasting Heat Demand for District Heating System[J]. Applied Energy, 2016, 179: 544-552.

    [5] JNR E O N, ZIGGAH Y Y. Electricity Demand Forecasting Based on Feature Extraction and Optimized Backpropagation Neural Network[J]. e-Prime-Advances in Electrical Engineering, Electronics and Energy, 2023, 6: 100293.

    [6] KIM S. Innovating Knowledge and Information for a Firm-Level Automobile Demand Forecast System: A Machine Learning Perspective[J]. Journal of Innovation & Knowledge, 2023, 8(2): 100355.

    [7] EMAMI J M, GHADERI S F. Energy Demand Forecasting in Seven Sectors by an Optimization Model Based on Machine Learning Algorithms[J]. Sustainable Cities and Society, 2023, 95: 104623.

    [8] 馮易, 王杜娟, 胡知能, 等. 基于改進(jìn)LightGBM集成模型的胃癌存活性預(yù)測(cè)方法[J]. 中國(guó)管理科學(xué), 2023, 31(10): 234-244.

    FENG Y, WANG D J, HU Z N, et al. Prediction Method for Gastric Cancer Survivability Based on an Improved LightGBM Ensemble Model[J]. Chinese Journal of Management Science, 2023, 31(10): 234-244.

    [9] FENG X, BAO W, HA B. Prediction on China Energy Demand Based on RBF Neural Network Model[J]. Advanced Materials Research, 2013, 805/806: 1421-1424.

    [10] 李國(guó)祥, 馬文斌, 夏國(guó)恩. 基于深度學(xué)習(xí)的物流需求預(yù)測(cè)模型研究[J]. 系統(tǒng)科學(xué)學(xué)報(bào), 2021, 29(2): 85-89.

    LI G X, MA W B, XIA G E. Research on Logistics Demand Forecast Mode Based on Deep Learning[J]. Chinese Journal of Systems Science, 2021, 29(2): 85-89.

    [11] 孫俊軍, 張偉, 張一等. 面向紙包裝行業(yè)的訂單預(yù)測(cè)模型構(gòu)建與應(yīng)用研究[J]. 包裝工程, 2023, 44(S2): 132-139.

    SUN J J, ZHANG W, ZHANG Y, et al. Research on the Construction and Application of Order Prediction Model for the Paper Packaging Industry[J]. Packaging Engineering, 2023, 44(S2): 132-139.

    [12] ZHANG D H, LOU S. The Application Research of Neural Network and BP Algorithm in Stock Price Pattern Classification and Prediction[J]. Future Generation Computer Systems, 2021, 115(aug.): 872-879.

    [13] HUANG L J, XIE G J, ZHAO W D, et al. Regional Logistics Demand Forecasting: A BP Neural Network Approach[J]. Complex & Intelligent Systems, 2023, 9(3): 2297-2312.

    [14] YU N, XU W, YU K L. Research on Regional Logistics Demand Forecast Based on Improved Support Vector Machine: A Case Study of Qingdao City under the New Free Trade Zone Strategy[J]. IEEE Access, 2020, 99: 1.

    [15] CHEN Y, WU Q M, SHAO L J. Urban Cold-Chain Logistics Demand Predicting Model Based on Improved Neural Network Model[J]. International Journal of Metrology and Quality Engineering, 2020, 11: 5.

    [16] AN Y Q, LIU N, XIONG J, et al. Quality Changes and Shelf-Life Prediction of Pre-Processed Snakehead Fish Fillet Seasoned by Yeast Extract: Affected by Packaging Method and Storage Temperature[J]. Food Chemistry Advances, 2023, 3(3): 100418.

    [17] MOHI-ALDEN K, OMID M, RAJABIPOUR A, et al. Quality and Shelf-Life Prediction of Cauliflower under Modified Atmosphere Packaging by Using Artificial Neural Networks and Image Processing[J]. Computers and Electronics in Agriculture, 2019, 163(7): 104861.

    [18] 蔡佳昂, 盧立新, 盧莉璟, 等. 全脂奶粉包裝內(nèi)外水分傳質(zhì)及其防潮包裝貨架期預(yù)測(cè)[J]. 包裝工程, 2022, 43(17): 42-48.

    CAI J A, LU L X, LU L J, et al. Moisture Mass Transfer Inside and Outside Whole Milk Powder Packaging and Shelf Life Prediction of Moisture-Proof Packaging[J]. Packaging Engineering, 2022, 43(17): 42-48.

    [19] KROELL N, CHEN X Z, MAGHMOUMI A, et al. Sensor-Based Particle Mass Prediction of Lightweight Packaging Waste Using Machine Learning Algorithms[J]. Waste Management, 2021, 136: 253-265.

    [20] 陳雅, 姜?jiǎng)P譯, 李耀翔, 等. 基于近紅外的PE包裝藍(lán)莓新鮮度無(wú)損檢測(cè)[J]. 包裝工程, 2022, 43(7): 1-10.

    CHEN Y, JIANG K Y, LI Y X, et al. Nondestructive Detection of Freshness of PE Packaged Blueberries Based on NIR[J]. Packaging Engineering, 2022, 43(7): 1-10.

    [21] 夏文匯, 張?zhí)m蕤, 夏乾尹, 等. 基于 “一帶一路” 的重慶物流灰色模型預(yù)測(cè)及包裝管理研究[J]. 重慶理工大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2020, 34(5): 58-66.

    [22] 張道順. S企業(yè)物料需求預(yù)測(cè)與配送路徑優(yōu)化研究[D]. 濟(jì)南: 山東財(cái)經(jīng)大學(xué), 2022.

    ZHANG D S. Research on Material Demand Forecast and Distribution Path Optimization of S Enterprise[D]. Jinan: Shandong University of Finance and Economics, 2022.

    [23] 冀琴, 朱敏, 劉睿. 重慶市中心城區(qū)快遞自提點(diǎn)空間格局及影響因素研究——基于POI數(shù)據(jù)[J]. 重慶師范大學(xué)學(xué)報(bào)(自然科學(xué)版), 2021, 38(3): 121-128.

    JI Q, ZHU M, LIU R. The Spatial Pattern and Relation of the Pickup Points Based on POI in Chongqing[J]. Journal of Chongqing Normal University (Natural Science), 2021, 38(3): 121-128.

    [24] 徐曉燕, 楊慧敏, 呂修凱, 等. 基于山東省不同模型的物流需求預(yù)測(cè)比較研究[J]. 包裝工程, 2022, 43(23): 207-215.

    XU X Y, YANG H M, LYU X K, et al. Comparative Research on Forecast of Logistics Demand in Shandong Province Based on Different Models[J]. Packaging Engineering, 2022, 43(23): 207-215.

    [25] 李林漢, 岳一飛, 田衛(wèi)民. 基于PCA與Markov殘差灰色模型的京津冀物流能力評(píng)價(jià)和預(yù)測(cè)[J]. 北京交通大學(xué)學(xué)報(bào)(社會(huì)科學(xué)版), 2019, 18(2): 129-142.

    LI L H, YUE Y F, TIAN W M. Principal Component Analysis and Markov Residual Grey Based Evaluation and Prediction of Logistics Capabilities of Beij ing, Tianj in and Hebei[J]. Journal of Beijing Jiaotong University (Social Sciences Edition), 2019, 18(2): 129-142.

    [26] 朱昶勝, 李歲寒. 基于改進(jìn)果蠅優(yōu)化算法的隨機(jī)森林回歸模型及其在風(fēng)速預(yù)測(cè)中的應(yīng)用[J]. 蘭州理工大學(xué)學(xué)報(bào), 2021, 47(4): 83-90.

    ZHU C S, LI S H. Random Forest Regression Model Based on Improved Fruit Fly Optimization Algorithm and Its Application in Wind Speed Forecasting[J]. Journal of Lanzhou University of Technology, 2021, 47(4): 83-90.

    [27] PROBST P, WRIGHT M, BOULESTEIX A L. Hyperparameters and Tuning Strategies for Random Forest[J]. Wiley Interdisciplinary Reviews: Data Mining and Knowledge Discovery, 2018, 9(3): 1-18.

    [28] 郭海湘, 黃媛玥, 顧明赟, 等. 基于自適應(yīng)多分類器系統(tǒng)的甲狀腺疾病診斷方法研究[J]. 系統(tǒng)工程理論與實(shí)踐, 2018, 38(8): 2123-2134.

    GUO H X, HUANG Y Y, GU M Y, et al. Thyroid Disease Diagnosis Method Research Based on Adaptive Multiple Classifier System[J]. Systems Engineering-Theory & Practice, 2018, 38(8): 2123-2134.

    [29] HABIBI A, DELAVAR M, SADEGHIAN M, et al. A Hybrid of Ensemble Machine Learning Models with RFE and Boruta Wrapper-Based Algorithms for Flash Flood Susceptibility Assessment[J]. International Journal of Applied Earth Observation and Geoinformation, 2023, 122(122): 103401.

    [30] GHOSH I, DATTA CHAUDHURI T, ALFARO-CORTS E, et al. A Hybrid Approach to Forecasting Futures Prices with Simultaneous Consideration of Optimality in Ensemble Feature Selection and Advanced Artificial Intelligence[J]. Technological Forecasting and Social Change, 2022, 181: 121757.

    [31] PARSA A B, MOVAHEDI A, TAGHIPOUR H, et al. Toward Safer Highways, Application of XGBoost and SHAP for Real-Time Accident Detection and Feature Analysis[J]. Accident; Analysis and Prevention, 2020, 136: 105405.

    [32] 金祖旭. 電子商務(wù)市場(chǎng)中 “她經(jīng)濟(jì)” 模式精準(zhǔn)營(yíng)銷策略[J]. 商業(yè)經(jīng)濟(jì)研究, 2017(23): 59-61.

    JIN Z X. Precision Marketing Strategy of "other Economy" Model in E-Commerce Market[J]. Journal of Commercial Economics, 2017(23): 59-61.

    Optimization of Regional Express Packaging Demand Prediction Based on Machine Learning

    LIU Zhanyu1,2,ZHANG Yufei1

    (1. Energy Economics Research Center of the School of Business Administration, Henan Polytechnic University, Henan Jiaozuo 454000, China; 2. Taihang Development Research Institute, Henan Jiaozuo 454000, China)

    The degree of accuracy of express packaging demand prediction is an important foundation for the construction of intelligent logistics systemization. The work aims to compare different machine learning methods, different feature selection methods, and different parameter optimization methods, to select a more accurate method of express packaging demand prediction, analyze the impact of the main features on demands of express packaging, and optimize the study of regional express packaging demand. Firstly, through comparison with different machine learning methods, different feature selection methods, and different parameter optimization methods, the effect of genetic algorithm on optimizing parameters of the random forest (RF) model was determined. Finally, in order to better explain the model, the method of SHAP analysis was introduced to analyze the importance of different features. The results showed that the improved random forest prediction model was the most effective with MAE value, MAPE value, RMSE value and2of 2 783, 5.1%, 4 343 and 0.99 respectively, and that female population and tertiary industry value were the most critical factors affecting the demand for express packaging. The results show that the proposed prediction method has better accuracy and interpretability, and can provide powerful decision support for express packaging demand prediction.

    express packaging; RF; demand prediction

    TB114

    A

    1001-3563(2024)01-0246-08

    10.19554/j.cnki.1001-3563.2024.01.029

    2023-08-06

    2023年度河南省政府決策研究招標(biāo)課題(2023JC031);河南省高等學(xué)校重點(diǎn)科研項(xiàng)目軟科學(xué)計(jì)劃(24A630014)

    猜你喜歡
    需求預(yù)測(cè)特征選擇遺傳算法
    基于貝葉斯最大熵的電動(dòng)汽車充電需求預(yù)測(cè)
    吉林電力(2022年2期)2022-11-10 09:24:42
    基于自適應(yīng)遺傳算法的CSAMT一維反演
    一種基于遺傳算法的聚類分析方法在DNA序列比較中的應(yīng)用
    基于遺傳算法和LS-SVM的財(cái)務(wù)危機(jī)預(yù)測(cè)
    基于計(jì)算實(shí)驗(yàn)的公共交通需求預(yù)測(cè)方法
    Kmeans 應(yīng)用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    聯(lián)合互信息水下目標(biāo)特征選擇算法
    基于改進(jìn)的遺傳算法的模糊聚類算法
    基于特征選擇和RRVPMCD的滾動(dòng)軸承故障診斷方法
    中國(guó)中長(zhǎng)期煤炭需求預(yù)測(cè)
    怀远县| 玉树县| 云和县| 民丰县| 尼勒克县| 神木县| 景洪市| 苗栗市| 鄂州市| 彭州市| 保德县| 营山县| 丹寨县| 沐川县| 临朐县| 安福县| 海安县| 滦南县| 定日县| 女性| 吉安市| 海林市| 宁安市| 信阳市| 漳州市| 昌江| 仁化县| 惠安县| 千阳县| 汕头市| 且末县| 连州市| 临夏市| 公主岭市| 惠水县| 吴忠市| 永康市| 嫩江县| 偏关县| 阜新市| 张家口市|