• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于深度學(xué)習(xí)的電子商務(wù)銷售預(yù)測(cè)

      2024-08-08 00:00:00王澤菡徐毓暉王曉文
      科技創(chuàng)新與應(yīng)用 2024年23期

      摘 要:隨著手機(jī)端購物平臺(tái)興起,消費(fèi)者購物行為出現(xiàn)明顯改變。線上銷售迅速成為各行各業(yè)主要銷售渠道之一。傳統(tǒng)的預(yù)測(cè)方法主要以數(shù)據(jù)挖掘?yàn)橹?,雖然簡(jiǎn)單易用,但是難以處理復(fù)雜的非線性時(shí)間序列,因此該文提出一種基于LSTM-DNN的預(yù)測(cè)模型,在同LSTM與RNN進(jìn)行比較后,新模型具有明顯優(yōu)勢(shì),可有效提高預(yù)測(cè)精度,對(duì)電商企業(yè)降低管理成本具有重要意義。

      關(guān)鍵詞:深度學(xué)習(xí);電商銷售;時(shí)間序列;購物平臺(tái);預(yù)測(cè)模型

      中圖分類號(hào):F713.36 文獻(xiàn)標(biāo)志碼:A 文章編號(hào):2095-2945(2024)23-0040-05

      Abstract: With the rise of mobile shopping platform, consumer shopping behavior has changed significantly. Online sales have quickly become one of the main sales channels in various industries. The traditional prediction method is mainly based on data mining, which is simple and easy to use, but it is difficult to deal with complex nonlinear time series, so this paper proposes a prediction model based on LSTM-DNN. Compared with LSTM and RNN, the new model has obvious advantages, effectively improves the prediction accuracy, and is of great significance for e-commerce enterprises to reduce management costs.

      Keywords: deep learning; e-commerce sales; time series; shopping platform; prediction model

      電商銷售市場(chǎng)在經(jīng)濟(jì)增長(zhǎng)中具有革命性作用。電商銷售市場(chǎng)快速崛起,帶動(dòng)著國(guó)民經(jīng)濟(jì)飛速發(fā)展,給創(chuàng)造就業(yè)機(jī)會(huì)、提高市場(chǎng)活力、促進(jìn)創(chuàng)新發(fā)展帶來了巨大潛力。但當(dāng)用戶需求遠(yuǎn)小于產(chǎn)能增長(zhǎng)時(shí),將會(huì)出現(xiàn)產(chǎn)能過剩,從而導(dǎo)致電商市場(chǎng)萎靡,甚至給整體金融市場(chǎng)造成巨大損失。自2009年,每年“雙十一”購物節(jié)后,由于消費(fèi)者對(duì)優(yōu)惠商品的需求通常集中在有限的時(shí)間內(nèi),電商平臺(tái)為了滿足需求,通常提前增加產(chǎn)能,包括增加倉儲(chǔ)和物流設(shè)施,加大供應(yīng)鏈規(guī)模等[1]。但當(dāng)客戶需求降低后,許多商家便面臨庫存積壓、盈利下降等問題。因此,客戶銷量直接影響電商經(jīng)濟(jì)發(fā)展,同時(shí)電商市場(chǎng)良好發(fā)展對(duì)國(guó)民經(jīng)濟(jì)具有重大影響,所以對(duì)銷量做出合理預(yù)測(cè),為商家提供參考標(biāo)準(zhǔn),有利于促進(jìn)市場(chǎng)的良性循環(huán)。

      近些年來,關(guān)于電商銷售預(yù)測(cè),主要分為傳統(tǒng)統(tǒng)計(jì)法、數(shù)據(jù)挖掘法與機(jī)器學(xué)習(xí)法3個(gè)方向。在傳統(tǒng)統(tǒng)計(jì)方面主要利用自回歸綜合移動(dòng)平均(ARIMA)、霍爾特-溫特(HoltWinters)等方法,通過對(duì)歷史銷售數(shù)據(jù)進(jìn)行時(shí)間序列分析,捕捉銷售數(shù)據(jù)的季節(jié)性與趨勢(shì),從而進(jìn)行預(yù)測(cè)[2]。雖然傳統(tǒng)統(tǒng)計(jì)方法簡(jiǎn)單易用,但在處理復(fù)雜非線性關(guān)系時(shí)效果不佳。在數(shù)據(jù)挖掘方面,主要利用關(guān)聯(lián)規(guī)則挖掘和聚類分析等方法。通過挖掘商品之間的關(guān)聯(lián)性和潛在的交叉銷售機(jī)會(huì),或者將銷售數(shù)據(jù)分組幫助企業(yè)了解市場(chǎng)細(xì)分的特點(diǎn),從而優(yōu)化商品組合與制定相應(yīng)價(jià)格。在機(jī)器學(xué)習(xí)方面,主要利用隨機(jī)森林、梯度提升樹等集成學(xué)習(xí)方法處理數(shù)據(jù),但是隨著算力的提升,機(jī)器學(xué)習(xí)的分支深度學(xué)習(xí)中的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)與長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)在預(yù)測(cè)方面也展示出良好效果[3]。準(zhǔn)確預(yù)測(cè)電商銷售價(jià)格,是推動(dòng)電商行業(yè)進(jìn)步的關(guān)鍵,該研究有助于政府部門把控并及時(shí)調(diào)整電商行業(yè)發(fā)展,避免因價(jià)格而導(dǎo)致產(chǎn)能過剩,從而引發(fā)經(jīng)濟(jì)問題。

      1 研究方法

      本章首先對(duì)電商銷售預(yù)測(cè)的2種基于傳統(tǒng)方法與深度學(xué)習(xí)的預(yù)測(cè)模式進(jìn)行介紹,之后對(duì)研究使用的長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)與深度神經(jīng)網(wǎng)絡(luò)(DNN)作出詳細(xì)介紹。

      1.1 電商銷售預(yù)測(cè)

      1.1.1 基于傳統(tǒng)方法的預(yù)測(cè)模式

      傳統(tǒng)的電商銷售預(yù)測(cè)方法主要包括時(shí)間序列分析、回歸分析、趨勢(shì)分析。時(shí)間序列分析利用歷史銷售數(shù)據(jù)中的時(shí)間模式,如移動(dòng)平均法和指數(shù)平滑法,來預(yù)測(cè)未來趨勢(shì);回歸分析則建立數(shù)學(xué)模型,考慮多個(gè)自變量,如廣告投入、季節(jié)性變化,以描述銷售量與影響因素之間的關(guān)系;趨勢(shì)分析旨在識(shí)別長(zhǎng)期趨勢(shì),通過圖表和統(tǒng)計(jì)工具分析銷售數(shù)據(jù)的發(fā)展方向。盡管這些傳統(tǒng)方法對(duì)于預(yù)測(cè)提供了基礎(chǔ),但在處理非線性關(guān)系和突發(fā)事件方面還存在明顯局限性[4]。

      1.1.2 基于深度學(xué)習(xí)的預(yù)測(cè)模式

      深度學(xué)習(xí)方法在電商銷售預(yù)測(cè)中展現(xiàn)了強(qiáng)大的潛力,其中循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)、卷積神經(jīng)網(wǎng)絡(luò)(CNN)、長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)、注意力機(jī)制和深度神經(jīng)網(wǎng)絡(luò)集成等技術(shù)成為關(guān)鍵工具。RNN能有效處理時(shí)間序列數(shù)據(jù)的時(shí)間依賴性,CNN可捕捉局部特征,LSTM處理長(zhǎng)期依賴關(guān)系,而注意力機(jī)制和深度神經(jīng)網(wǎng)絡(luò)集成提高了模型對(duì)復(fù)雜模式的理解和預(yù)測(cè)準(zhǔn)確性[3]。盡管深度學(xué)習(xí)方法需要更多的數(shù)據(jù)和計(jì)算資源,并對(duì)超參數(shù)調(diào)整敏感,但在處理大規(guī)模數(shù)據(jù)和復(fù)雜關(guān)系方面相較傳統(tǒng)方法更具優(yōu)勢(shì)。

      1.2 LSTM

      長(zhǎng)短期記憶網(wǎng)絡(luò)(LSTM)是一種特殊的循環(huán)神經(jīng)網(wǎng)絡(luò)(Recurrent Neural Network,RNN),旨在解決傳統(tǒng)RNN面臨的梯度消失和梯度爆炸問題。LSTM通過引入門控機(jī)制,能夠有效地捕捉和記憶長(zhǎng)期依賴關(guān)系,使其在處理序列數(shù)據(jù)時(shí)表現(xiàn)更為出色。LSTM模型的核心結(jié)構(gòu)是記憶元(memory cell),用于存儲(chǔ)長(zhǎng)期依賴關(guān)系,其由3個(gè)門控機(jī)制組成:輸入門(Input gate),控制當(dāng)前輸入信息對(duì)記憶元的影響程度;遺忘門(Forget gate),控制之前記憶信息遺忘的程度;輸出門(Output gate),控制記憶元信息輸出的程度。其各自數(shù)學(xué)表達(dá)式如下

      式中:σ為sigmoid函數(shù);W為權(quán)重矩陣;b為偏置向量;ft為遺忘門輸出;it為輸入門輸出;ct為記憶元輸出;ot為輸出門輸出;ht為當(dāng)前時(shí)刻的隱狀態(tài);xt為當(dāng)前時(shí)刻的輸入。LSTM工作過程如圖1所示。

      1.3 DNN

      深度神經(jīng)網(wǎng)絡(luò)(DNN)是一種人工神經(jīng)網(wǎng)絡(luò),由多個(gè)層的神經(jīng)元組成,每層之間相互連接,其結(jié)構(gòu)如圖2所示。

      圖2中輸入層主要接受輸入數(shù)據(jù),隱藏層對(duì)輸入數(shù)據(jù)進(jìn)行非線性變換,提取特征,最后再由輸出層將預(yù)測(cè)結(jié)果輸出。DNN可以包含一個(gè)或多個(gè)隱藏層。隱藏層的數(shù)量和每個(gè)隱藏層的神經(jīng)元數(shù)量決定了DNN的復(fù)雜度。如圖2所示,DNN在得到數(shù)據(jù)后,經(jīng)過輸入層進(jìn)入網(wǎng)絡(luò),再由隱藏層進(jìn)行非線性變換,從而提取特征,最后由輸出層將結(jié)果輸出。

      2 研究設(shè)計(jì)

      本章將對(duì)研究設(shè)計(jì)作出詳細(xì)介紹,其中包括電商銷售預(yù)測(cè)所使用的模型框架與預(yù)測(cè)算法LSTM-DNN的算法流程介紹。

      2.1 預(yù)測(cè)模型框架

      本文主要利用LSTM與DNN構(gòu)建神經(jīng)網(wǎng)絡(luò)對(duì)電商銷售數(shù)據(jù)進(jìn)行預(yù)測(cè)。為此,將深度學(xué)習(xí)應(yīng)用于電商銷售預(yù)測(cè),總體研究流程如圖3所示,研究流程主要分為以下2個(gè)部分:數(shù)據(jù)處理與模型構(gòu)建。

      第一部分:數(shù)據(jù)處理。對(duì)原始數(shù)據(jù)進(jìn)行缺失值與異常值處理,并進(jìn)行特征提取。

      第二部分:模型構(gòu)建。對(duì)處理后的數(shù)據(jù)使用LSTM-DNN進(jìn)行預(yù)測(cè),并得到最后結(jié)果。

      2.2 預(yù)測(cè)算法LSTM-DNN

      在電商銷售預(yù)測(cè)的研究中,其關(guān)鍵是對(duì)長(zhǎng)時(shí)間的非線性時(shí)間序列進(jìn)行擬合,因此本研究提出了一種基于LSTM-DNN的預(yù)測(cè)算法,算法主要由2部分組成:LSTM層和DNN層。該算法主要利用LSTM捕捉時(shí)間序列的長(zhǎng)期依賴關(guān)系,并利用DNN進(jìn)行非線性擬合,以提高預(yù)測(cè)精度。由于在電商銷售任務(wù)中,特征間具有較強(qiáng)的耦合性,因此需要將不同維度特征進(jìn)行解耦訓(xùn)練,將構(gòu)造好的時(shí)間序列輸入到LSTM中,之后通過DNN達(dá)到輸入空間到輸出空間的映射,從而實(shí)現(xiàn)時(shí)間序列預(yù)測(cè)的目的。具體實(shí)現(xiàn)步驟如圖4所示。

      經(jīng)過圖4的算法流程對(duì)LSTM-DNN模型進(jìn)行訓(xùn)練后,可將實(shí)時(shí)數(shù)據(jù)輸入模型中,則可得到對(duì)未來銷售額的預(yù)測(cè)。

      3 實(shí)驗(yàn)與結(jié)果分析

      基于上述過程,本章將對(duì)實(shí)驗(yàn)過程及結(jié)果進(jìn)行描述與分析。首先,將對(duì)數(shù)據(jù)來源與預(yù)處理做出介紹,然后將對(duì)研究所提出的模型進(jìn)行構(gòu)建與訓(xùn)練,并對(duì)訓(xùn)練的模型進(jìn)行評(píng)估,最后分析結(jié)果,并與其他算法進(jìn)行比較。

      3.1 數(shù)據(jù)集介紹及預(yù)處理

      3.1.1 數(shù)據(jù)集介紹

      本文采用的數(shù)據(jù)集為廣州抖音直播電商銷售的真實(shí)數(shù)據(jù),抖音直播帶貨是一種通過抖音平臺(tái)實(shí)時(shí)視頻直播的商業(yè)模式,由知名主播或網(wǎng)紅通過吸引觀眾的注意力,展示和介紹各種商品,實(shí)時(shí)與觀眾互動(dòng),推動(dòng)商品銷售的過程。觀眾可以通過彈幕互動(dòng),獲得專屬優(yōu)惠,并在直播中完成購物。這種形式的直播通過豐富的商品介紹、實(shí)時(shí)促銷、用戶互動(dòng),為消費(fèi)者提供了一種富有趣味性和參與感的購物體驗(yàn),同時(shí)也成為品牌推廣和銷售的創(chuàng)新途徑,推動(dòng)了電商行業(yè)的快速發(fā)展。

      該數(shù)據(jù)主要包含2023年1月20日至2023年7月20日之間發(fā)生的交易。主要涉及中國(guó)31個(gè)省份,共52 172筆交易,152種不同商品。其中,主要包含16個(gè)特征,分別是購買數(shù)量、商品單價(jià)、實(shí)際支付、商品運(yùn)費(fèi)、優(yōu)惠總額、交易時(shí)間、平臺(tái)優(yōu)惠、商家優(yōu)惠、支付優(yōu)惠、紅包抵扣、支付方式、發(fā)貨地區(qū)、購買渠道、廣告渠道、流量來源和帶貨達(dá)人。其詳細(xì)情況見表1。

      3.1.2 數(shù)據(jù)預(yù)處理

      此數(shù)據(jù)集經(jīng)過脫敏處理,和實(shí)際電商銷售成交量、成交金額等存在一定差異,但是對(duì)整體數(shù)據(jù)特性沒有影響。但數(shù)據(jù)依然存在一定缺失,因此對(duì)數(shù)據(jù)進(jìn)行預(yù)處理,以匹配模型需求。

      部分商品由于在數(shù)據(jù)收集過程中,受到預(yù)售或優(yōu)惠等因素影響,在一定時(shí)間內(nèi),只存在用戶行為而沒有銷售信息的情況。此外,由于后臺(tái)日志缺失等原因同樣會(huì)導(dǎo)致銷售信息出現(xiàn)缺失。由于以上情況,導(dǎo)致數(shù)據(jù)出現(xiàn)缺失,對(duì)模型訓(xùn)練的完整性產(chǎn)生極大影響。因此,在本研究中,采用三次樣條插值法對(duì)缺失數(shù)據(jù)進(jìn)行插值補(bǔ)全。采用該算法有以下3點(diǎn)理由:①現(xiàn)實(shí)性。線性插值與近鄰插值等簡(jiǎn)單插值法,雖然減少了計(jì)算量,但是難以擬合現(xiàn)實(shí)數(shù)據(jù)。②平滑性。三次樣條插值法能夠提供平滑的曲線,因?yàn)槠湓谝欢ǚ秶鷥?nèi)使用低次多項(xiàng)式進(jìn)行擬合。③連續(xù)性。三次樣條插值法要求插值曲線在每個(gè)數(shù)據(jù)點(diǎn)處具有一定的導(dǎo)數(shù)連續(xù)性。

      三次樣條插值法是一種插值技術(shù),通過將數(shù)據(jù)點(diǎn)分段連接成多個(gè)三次多項(xiàng)式,確保插值曲線在各數(shù)據(jù)點(diǎn)處連續(xù)且光滑,具有一階和二階導(dǎo)數(shù)的連續(xù)性。通過滿足插值條件和平滑性條件,構(gòu)建方程組并求解,最終得到一條光滑的曲線,廣泛應(yīng)用于科學(xué)計(jì)算和工程領(lǐng)域,提供有效的數(shù)據(jù)擬合和插值解決方案。

      3.2 模型訓(xùn)練

      在訓(xùn)練時(shí),將數(shù)據(jù)集中152種商品交易的前4個(gè)月時(shí)間,即2023年1月20日至2023年5月20日的交易情況作為訓(xùn)練集進(jìn)行訓(xùn)練。

      經(jīng)過實(shí)驗(yàn),最后將LSTM層數(shù)確定為12層,同時(shí)為了防止過擬合,將在每層加入0.3的隨機(jī)失活(dropout)層。同時(shí)在訓(xùn)練過程中,選擇均方誤差(MSE)作為損失函數(shù),其計(jì)算公式如下所示

      在訓(xùn)練過程中,優(yōu)化器采用Adam函數(shù),Adam函數(shù)屬于梯度下降算法的一種,其在隨機(jī)梯度下降(SGD)的基礎(chǔ)上引入了一階動(dòng)量、二階動(dòng)量與修正項(xiàng),將修正后的一階動(dòng)量與二階動(dòng)量帶入?yún)?shù)并更新公式,通過以上操作模型收斂更為穩(wěn)定,且自適應(yīng)效果更佳。

      接下來是對(duì)DNN網(wǎng)絡(luò)的訓(xùn)練,經(jīng)過多次參數(shù)調(diào)試,確定最佳的參數(shù)結(jié)構(gòu),其中最后將DNN層數(shù)設(shè)置為4層,神經(jīng)元個(gè)數(shù)分別設(shè)置為15,4,15,激活函數(shù)分別為“relu”“sigmoid”“relu”“relu”。2種激活函數(shù)計(jì)算公式如下所示

      DNN在優(yōu)化過程中同樣使用Adam優(yōu)化器與MSE作為損失函數(shù)。

      3.3 評(píng)價(jià)指標(biāo)

      當(dāng)模型訓(xùn)練完善后,分別將152種商品2023年5月20日至2023年7月20日的交易數(shù)據(jù)作為測(cè)試集,進(jìn)行模型評(píng)價(jià)。

      在模型評(píng)價(jià)方面,本文采用均方根誤差(RMSE)和平均相對(duì)精度(R2)2個(gè)性能指標(biāo)來評(píng)估模型的性能。其中,均方根誤差(RMSE)值越小,表示模型效果越佳,而R2值越接近1,表示模型效果越佳。2種評(píng)價(jià)模型定義為

      3.4 結(jié)果與分析

      在經(jīng)過多輪訓(xùn)練與測(cè)試后,在152種商品中,將2個(gè)指標(biāo)結(jié)果取平均數(shù),并分別對(duì)LSTM、RNN、LSTM-DNN在訓(xùn)練100輪、500輪、1 000輪的情況下進(jìn)行比較,其結(jié)果見表2。

      通過與LSTM和RNN進(jìn)行多輪訓(xùn)練與比較后,可知隨著訓(xùn)練次數(shù)的增多LSTM-DNN的精度優(yōu)于其余2個(gè)算法,并且通過結(jié)果發(fā)現(xiàn),在經(jīng)過1 000輪訓(xùn)練后LSTM與RNN的效果近似,進(jìn)一步證明模型優(yōu)化的關(guān)鍵性,并且對(duì)比100輪到500輪與500輪到1 000輪之間可以發(fā)現(xiàn),損失值逐漸變小,說明模型開始逐漸擬合。

      4 結(jié)束語

      LSTM-DNN模型的優(yōu)勢(shì)在于其對(duì)序列數(shù)據(jù)的高效處理能力,從而能夠更好地捕捉銷售數(shù)據(jù)中的時(shí)序關(guān)系和潛在模式。通過對(duì)歷史銷售數(shù)據(jù)的學(xué)習(xí),模型不僅能夠準(zhǔn)確預(yù)測(cè)未來銷售趨勢(shì),還能夠識(shí)別出潛在的市場(chǎng)變化和消費(fèi)者行為演變。然而,深度學(xué)習(xí)模型仍有很多局限,其性能受到數(shù)據(jù)質(zhì)量、特征選擇等多方面因素的影響。在未來的研究和實(shí)踐中,需要不斷優(yōu)化模型,結(jié)合更多領(lǐng)域?qū)I(yè)知識(shí),使其更加適應(yīng)不同業(yè)務(wù)場(chǎng)景的需求。

      參考文獻(xiàn):

      [1] 張夏恒.跨境電商類型與運(yùn)作模式[J].中國(guó)流通經(jīng)濟(jì),2017,31(1):76-83.

      [2] 劉麗佳,李曉雪,王海濱,等.考慮節(jié)假日的ARIMA模型在酸奶銷量預(yù)測(cè)中的應(yīng)用[J].計(jì)算機(jī)科學(xué)與應(yīng)用,2023,13(12):2172-2179.

      [3] 柯苗,黃華國(guó).基于LSTM神經(jīng)網(wǎng)絡(luò)的電商商品銷售預(yù)測(cè)方法[J].福建師大福清分校學(xué)報(bào),2020(5):83-89.

      [4] 姜曉紅,曹慧敏.基于ARIMA模型的電商銷售預(yù)測(cè)及R語言實(shí)現(xiàn)[J].物流科技,2019,42(4):52-56,69.

      基金項(xiàng)目:廣東大學(xué)生科技創(chuàng)新培育專項(xiàng)資金資助項(xiàng)目(pdjh2022b0642)

      第一作者簡(jiǎn)介:王澤菡(2001-),男。研究方向?yàn)樯疃葘W(xué)習(xí)、數(shù)據(jù)分析。

      *通信作者:徐毓暉(1985-),女。研究方向?yàn)殡娚啼N售、人工智能。

      渭南市| 师宗县| 贵南县| 汪清县| 资中县| 沙河市| 蒙城县| 秭归县| 简阳市| 吐鲁番市| 大宁县| 阿拉善左旗| 汤阴县| 尼玛县| 屏东县| 和平区| 元氏县| 阜新市| 尚义县| 岫岩| 宣化县| 青龙| 尼玛县| 达拉特旗| 基隆市| 定西市| 简阳市| 沧源| 江阴市| 海安县| 娱乐| 商城县| 肥西县| 遵化市| 凌源市| 志丹县| 平原县| 勃利县| 德江县| 法库县| 安岳县|