唐甜甜,周 偉
(蘭州交通大學(xué) 數(shù)理學(xué)院,蘭州 730070)
近年來,深度學(xué)習(xí)(DL)方法和技術(shù)已成功應(yīng)用于各種現(xiàn)實(shí)世界中具有挑戰(zhàn)性的預(yù)測問題,包括時(shí)間序列預(yù)測。企業(yè)根據(jù)消費(fèi)者的數(shù)據(jù)挖掘規(guī)律,使用深度學(xué)習(xí)模型作出未來的預(yù)測,并在此基礎(chǔ)上決策出更優(yōu)的營銷方案。因此,現(xiàn)代企業(yè)要想優(yōu)化營銷策略使收益最大化,就必須首先進(jìn)行銷售額預(yù)測,這為企業(yè)未來發(fā)展奠定了堅(jiān)實(shí)的基礎(chǔ)。
由于深度學(xué)習(xí)帶來了深刻的性能改進(jìn),機(jī)器學(xué)習(xí)(ML)得到了快速發(fā)展。深度學(xué)習(xí)在機(jī)器學(xué)習(xí)的許多領(lǐng)域都超越了以往的先進(jìn)方法,比如自然語言處理[1]、圖像處理[2]和語音生成[3]。文獻(xiàn)[4]利用時(shí)間序列的值構(gòu)建統(tǒng)計(jì)模型,用未來價(jià)格的走勢提取有用的市場信息。
對金融資產(chǎn)未來走勢進(jìn)行回歸的任務(wù)一直是許多研究者最近工作的主題,如文獻(xiàn)[5-7]。使用人工神經(jīng)網(wǎng)絡(luò)等機(jī)器學(xué)習(xí)組件改進(jìn)和增強(qiáng)已驗(yàn)證的模型。采用新的混合模型和神經(jīng)網(wǎng)絡(luò)對原有的性能進(jìn)行改進(jìn)[8-10]。文獻(xiàn)[11-12]提出了利用自編碼器產(chǎn)生最優(yōu)投資組合的深度投資組合理論,并將自動編碼器用于對價(jià)格進(jìn)行編碼;然后,對模型進(jìn)行微調(diào),以預(yù)測價(jià)格的變動幅度是否會超過中間值以及這種變動的方向。隨著深度學(xué)習(xí)概念的提出,商業(yè)領(lǐng)域展現(xiàn)了濃厚的興趣,并逐步成為研究的主導(dǎo)者。文獻(xiàn)[13-15]采用雙線性投影思想、智能選擇和時(shí)間注意機(jī)制相結(jié)合的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來預(yù)測未來的價(jià)格運(yùn)動。基于深度學(xué)習(xí)領(lǐng)域,分析不同神經(jīng)網(wǎng)絡(luò)模型的處理能力,憑借著LSTM能充分考慮時(shí)序數(shù)據(jù)先后關(guān)系,文獻(xiàn)[16-20]將CNN提取的有效特征輸入到LSTM,構(gòu)建CNN-LSTM組合模型。
值得一提的是,電商以及零售類銷售數(shù)據(jù)不是平穩(wěn)的,因此,任何機(jī)器學(xué)習(xí)模型都很難預(yù)測未來值。在此基礎(chǔ)上,以某潔日用品促銷決策銷售數(shù)據(jù)為研究對象,收集了銷售額和與銷售額發(fā)展趨勢相關(guān)的特征作為建模數(shù)據(jù),在對原始數(shù)據(jù)進(jìn)行平穩(wěn)特征轉(zhuǎn)換、異常值處理、缺失值填充、獨(dú)熱編碼以及變量相關(guān)性分析等工作的基礎(chǔ)上,主要工作為:
1)提出結(jié)構(gòu)化方法將原數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)銷售值特征,該方法可以與深度學(xué)習(xí)CNN-LSTM串聯(lián)預(yù)測模型有效結(jié)合。
2)將所提出的組合模型與先前提出的采用平穩(wěn)價(jià)格特征的方法在測試集上的預(yù)測結(jié)果與機(jī)器學(xué)習(xí)算法(XGBoost、SVM)、神經(jīng)網(wǎng)絡(luò)模型(CNN、LSTM),就擬合效果和評判指標(biāo)兩方面進(jìn)行比較分析,驗(yàn)證了所提出的模型更具穩(wěn)健性和優(yōu)越性。
利用時(shí)間序列的值,如價(jià)格波動的金融產(chǎn)品交易市場,可以構(gòu)建統(tǒng)計(jì)模型,協(xié)助提取有用的信息,即市場的當(dāng)前狀態(tài)的概率和一組可能的未來狀態(tài),如價(jià)格或波動性變化。許多模型,比如布萊克·斯科爾斯·默頓模型[4],試圖用數(shù)學(xué)方法推導(dǎo)出期權(quán)的價(jià)格,并可用于提供對未來價(jià)格走勢的有用指示。
使用人工神經(jīng)網(wǎng)絡(luò)[8]等機(jī)器學(xué)習(xí)組件改進(jìn)和增強(qiáng)了Garch等已驗(yàn)證的模型。采用新的混合模型和神經(jīng)網(wǎng)絡(luò)對原有的性能[9]進(jìn)行改進(jìn)。在文獻(xiàn)[10]中,神經(jīng)網(wǎng)絡(luò)被用來預(yù)測未來匯率。對該模型進(jìn)行了日預(yù)測和年預(yù)測的檢驗(yàn),得出了短期預(yù)測更準(zhǔn)確的結(jié)論。在文獻(xiàn)[11]中,提出了利用自編碼器產(chǎn)生最優(yōu)投資組合的深度投資組合理論。這種方法的表現(xiàn)好于幾個已確立的基準(zhǔn),比如生物技術(shù)IBB指數(shù)。同樣,在文獻(xiàn)[12]中,另一種類型的自動編碼器被稱為受限玻爾茲曼機(jī)(RBM),用于對股票的月末價(jià)格進(jìn)行編碼。然后,對模型進(jìn)行微調(diào),以預(yù)測價(jià)格的變動幅度是否會超過中間值以及這種變動的方向。隨著深度學(xué)習(xí)概念的提出,商業(yè)領(lǐng)域展現(xiàn)了濃厚的興趣,并逐步成為研究的主導(dǎo)者。在文獻(xiàn)[13]中,采用雙線性投影思想和時(shí)間注意機(jī)制相結(jié)合的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)來預(yù)測(limit order book,LOB)中價(jià)。類似地,在文獻(xiàn)[14-15]中,利用LOB數(shù)據(jù)以及機(jī)器學(xué)習(xí)方法,如多線性方法和智能特征選擇來預(yù)測未來的價(jià)格運(yùn)動。
針對單一模型泛化能力較弱的問題,文獻(xiàn)[16-20]結(jié)合CNN和LSTM較為新穎的學(xué)習(xí)模型來預(yù)測股票的指數(shù)、CPI以及短期電力負(fù)荷,由于深度學(xué)習(xí)方法的非平穩(wěn)特性,直接利用這類數(shù)據(jù)也是不可能的。因此,在特征工程時(shí)兼顧提取特征方法使它們生成平穩(wěn)特征,結(jié)合CNN的特征提取特性和LSTM的時(shí)間序列建模能力構(gòu)建串聯(lián)CNN-LSTM模型。此模型有助于企業(yè)深入理解銷售額的影響因素以及與變量間的相關(guān)性,由此著手來深入考察日用品經(jīng)濟(jì)的走勢和變化情況,作出更優(yōu)的決策。
本節(jié)還將引入前面描述的兩個模型的強(qiáng)大組合。CNN模型使用因果卷積為每個時(shí)間步生成一組特征。本質(zhì)上,CNN是銷售時(shí)間序列數(shù)據(jù)的特征提取器,它產(chǎn)生了與原始特征長度相同的新的特征時(shí)間序列,每個特征都有相對應(yīng)的時(shí)間步長。然后在CNN生成的時(shí)間序列上應(yīng)用LSTM層,然后為每個時(shí)間步長生成一個標(biāo)簽。這種工作方式與完全連接層非常相似,但是LSTM允許模型合并過去步驟中的特性,而不是完全連接層。構(gòu)建CNN-LSTM模型的預(yù)測流程,見圖1。
圖1 CNN-LSTM模型預(yù)測流程框圖
基本思路是:
1)特征工程將原始數(shù)據(jù)映射到機(jī)器學(xué)習(xí)特征,包括將原銷售值轉(zhuǎn)換為平穩(wěn)銷售特征、對數(shù)據(jù)進(jìn)行異常值檢測、缺失值的查看、獨(dú)熱編碼和相關(guān)性分析等基礎(chǔ)問題。
2)CNN-LSTM模型主要是由CNN和LSTM網(wǎng)絡(luò)串聯(lián)組成,輸入層接收特征工程處理完的日用品銷售額數(shù)據(jù),同時(shí)切分?jǐn)?shù)據(jù)集。
3)CNN層接收影響銷售額及多影響變量的輸入,并將卷積過程中提取的特征信息傳遞到LSTM層。
4)LSTM層實(shí)現(xiàn)對目標(biāo)變量銷售額準(zhǔn)確的時(shí)間序列預(yù)測并進(jìn)行建模。
5)最后,全連接層將預(yù)測的特征向量以一維形式輸出,生成的預(yù)測數(shù)據(jù)通過評價(jià)指標(biāo)來評估模型的性能。
首先,該網(wǎng)絡(luò)起始層為輸入層,接收銷售額以及相關(guān)的多種變量,即各種促銷方式。其隱層網(wǎng)絡(luò)結(jié)構(gòu)如圖2所示。CNN層實(shí)現(xiàn)各種促銷方式特征變量的卷積操作并將結(jié)果輸出到下一層,即在處理銷售額序列時(shí),每個filter即權(quán)重參數(shù)矩陣提取每個特征圖上的中心以及邊緣信息,通過矩陣求內(nèi)積的計(jì)算方式將特征結(jié)果抽取并表達(dá)。
圖2 CNN網(wǎng)絡(luò)結(jié)構(gòu)圖
在該網(wǎng)絡(luò)層中,引入因果填充來避免使用未來信息生成當(dāng)前時(shí)間步長的特征。使用一系列卷積層可以捕獲時(shí)間序列的精細(xì)時(shí)間動態(tài),并將時(shí)間上的距離特征關(guān)聯(lián)起來。
(1)
(2)
池化層的作用是為了減小特征圖的空間大小,減少網(wǎng)絡(luò)的訓(xùn)練參數(shù)。池化層之后的特征圖大小遵循向下取整原則,在下采樣的過程中,特征圖具有局部平移不變性。銷售額預(yù)測采用最大池化操作,通過前一層級的最大值來表征可以抑制過擬合的發(fā)生,最大池化層操作可表示為:
(3)
LSTM是CNN-LSTM模型中CNN的后續(xù)連接層。LSTM將數(shù)據(jù)傳送至輸入門,通過遺忘門中的權(quán)重矩陣來選擇記憶或遺忘前一層的信息,以及記憶前隱層信息的比重。融合新特征信息和更新前隱層信息來保持長期記憶,存儲信息的單元需激活每個門單元來更新細(xì)胞狀態(tài),每個門單元都是被控制在0~1的連續(xù)值。LSTM的3個門(遺忘門、傳入門和輸出門)獨(dú)立存儲單元的狀態(tài),每一個流程都由矩陣間求內(nèi)積的方式來確定。
因?yàn)槭褂玫氖菨M填充的因果卷積,所有的卷積層產(chǎn)生相同的時(shí)間步長t,因此不需要擔(dān)心標(biāo)簽對齊到正確的時(shí)間步長。LSTM網(wǎng)絡(luò)結(jié)構(gòu)如圖3所示。
圖3 LSTM網(wǎng)絡(luò)結(jié)構(gòu)圖
在t階段,將帶有時(shí)間信息的it傳送給輸入門,通過遺忘門ft來更新隱層ht的特征信息,最終將攜帶隱含信息的向量通過門ot輸出,那么該單元的更新情況可表示為:
it=σ(Wpipt+Whiht-1+Wcict-1+bi)
(4)
ft=σ(Wpfpt+Whfht-1+Wcfct-1+bf)
(5)
ot=σ(Wpopt+Whoht-1+Wcoct+bo)
(6)
式中:第t階段的細(xì)胞狀態(tài)為ct,σ一般采用tanh激活函數(shù),將輸入映射到[-1,1]。共享權(quán)重矩陣為W,偏移向量記為b。LSTM在t階段的ct和ht的更新情況可表示為:
ct=ftct-1+itσ(Wpcpt+Whcht-1+bc)
(7)
ht=otσ(ct)
(8)
全連接層將輸入設(shè)為hl={h1,h2,…,hl},其中l(wèi)為LSTM的單元數(shù),該層相應(yīng)的運(yùn)算公式為:
(9)
她一邊啃面包,一邊把和她工作時(shí)間有沖突的公司都勾了出來。如果招聘方向和她的專業(yè)很吻合,就一定要想辦法調(diào)整上班時(shí)間,如果不太吻合,就先不去了,到時(shí)讓同學(xué)幫忙拿一份招聘材料,按照流程投遞簡歷就行了。差十分鐘六點(diǎn)半時(shí),顏曉晨趕到了藍(lán)月酒吧。
(10)
(11)
(12)
在已有研究經(jīng)驗(yàn)的基礎(chǔ)上,首先對和鯨社區(qū)公開數(shù)據(jù)集,即某潔日用品銷售額相關(guān)數(shù)據(jù)進(jìn)行篩選分析,然后選取微信推送次數(shù)、本地電視廣告投入、線上廣告投入、門店海報(bào)陳列、門店銷售人員、門店促銷事件等6個特征作為影響銷售額的變量來考慮其與銷售額之間的動態(tài)關(guān)系。此6個特征變量與目標(biāo)變量銷售額為同一頻率數(shù)據(jù)。
如果沒有某種預(yù)處理,原始數(shù)據(jù)不能直接用于任何深度學(xué)習(xí)任務(wù)。對于日用品的銷售額來說,可能會因?yàn)楣?jié)日促銷、“雙11”活動等而波動和增加,達(dá)到從未見過的水平。這意味著銷售值的統(tǒng)計(jì)數(shù)據(jù)會隨著時(shí)間發(fā)生顯著變化,使得時(shí)間序列是非平穩(wěn)的。簡單地將所有銷售值歸一化并不能解決非平穩(wěn)性,因?yàn)榭偸菚须[藏的數(shù)據(jù),這些數(shù)據(jù)可能會改變當(dāng)前數(shù)據(jù)中不存在的值的分布范圍。為了解決這個問題,提出了將價(jià)格數(shù)據(jù)完全轉(zhuǎn)換為平穩(wěn)特征的新方法。
2.2.1異常值及缺失值處理
建模需要對數(shù)據(jù)進(jìn)行缺失值處理并剔除異常值,查看初始數(shù)據(jù),發(fā)現(xiàn)“本地電視廣告投入”變量有缺失值,用中位數(shù)填補(bǔ)“本地電視廣告投入”的空值。該數(shù)據(jù)集無明顯的異常值,則無需處理。
2.2.2數(shù)據(jù)預(yù)處理及獨(dú)熱編碼
1)歸一化
數(shù)據(jù)分布趨于正態(tài)化可加速模型的收斂,故將其進(jìn)行歸一化處理:
(13)
通過式(13)將變量數(shù)據(jù)處理為[0,1]之間的數(shù)據(jù),并將特征工程處理后的數(shù)據(jù)作為CNN-LSTM網(wǎng)絡(luò)的輸入。
這種歸一化就避免了一個主要的問題,那就是日用品銷售額的分布變化,這可能是由節(jié)假日或在較長時(shí)間內(nèi)可能發(fā)生的大變動等事件引起的。
不幸的是,這給深度學(xué)習(xí)模型預(yù)測帶來了另一個重要問題。除去特殊節(jié)日以及促銷活動,其他日子的銷售額之間的差異總是非常小,使用標(biāo)準(zhǔn)的統(tǒng)計(jì)數(shù)據(jù)標(biāo)準(zhǔn)化方法(z-score)提取這種數(shù)據(jù)的特征是困難的。在這項(xiàng)工作中,提出了一個新的方法來補(bǔ)救這個問題。
2)數(shù)據(jù)標(biāo)準(zhǔn)化
不是規(guī)范化數(shù)據(jù)的原始值,而是利用自然對數(shù)(ln)對訓(xùn)練和測試數(shù)據(jù)進(jìn)行了轉(zhuǎn)換,以均勻化模式的可變性和穩(wěn)定性,并降低指數(shù)趨勢,再以中間價(jià)格替代原始銷售值。這消除了銷售值的非平穩(wěn)性,使特征提取過程更容易,并顯著提高了深度學(xué)習(xí)模型的性能。
(14)
2.2.3變量間的相關(guān)性分析
通過表1可以發(fā)現(xiàn),本地電視廣告投入與銷售額之間的相關(guān)性達(dá)到0.588 3,是9種促銷方式中最強(qiáng)的;與銷售額關(guān)系較強(qiáng)的還有門店銷售人員、門店海報(bào)陳列。而線上廣告投入與門店促銷事件、本地電視廣告投入與門店銷售人員間存在較強(qiáng)的正相關(guān)性;考慮到是否需要對數(shù)據(jù)進(jìn)行降維,用熱力圖描繪所有變量之間的相關(guān)性,結(jié)果如圖4所示。
圖4 熱力圖
表1 相關(guān)系數(shù)
從上述得到的熱力圖可以看出,原始數(shù)據(jù)之間的相關(guān)系數(shù)基本都小于0.5,不存在非常顯著的相關(guān)關(guān)系,說明數(shù)據(jù)分布離散,特征變量之間基本不存在冗余,因此未采用PCA進(jìn)行降維處理,進(jìn)而丟失太多信息。相關(guān)系數(shù)的大小反映出不同促銷手段對商品銷售額的影響力度,以便商家優(yōu)化促銷方式。
在構(gòu)建CNN-LSTM模型的基礎(chǔ)上,在運(yùn)行Windows 10操作系統(tǒng)的PC上用Python 3.7編寫代碼。深度學(xué)習(xí)模型使用keras庫作為后端實(shí)現(xiàn),而機(jī)器學(xué)習(xí)模型使用sklearn庫實(shí)現(xiàn)。通過學(xué)習(xí)經(jīng)特征工程處理的訓(xùn)練數(shù)據(jù)集得到預(yù)測模型,在訓(xùn)練模型時(shí),迭代次數(shù)的取值對最終預(yù)測模型的精度有很大影響。迭代次數(shù)少,模型不能完全訓(xùn)練,導(dǎo)致模型擬合不足。如果迭代次數(shù)過多,模型會過度學(xué)習(xí),浪費(fèi)計(jì)算資源,導(dǎo)致模型過度擬合,計(jì)算速度變慢。設(shè)置迭代次數(shù)為1 000次,模型在訓(xùn)練過程中自動保存最優(yōu)模型。從考慮時(shí)序數(shù)據(jù)特征的角度搭建卷積、池化、LSTM和全連接層其網(wǎng)絡(luò)層級的結(jié)構(gòu)。調(diào)參是一個動態(tài)的行為,它是可學(xué)習(xí)的,是一個不斷優(yōu)化的過程。每個層級都可以調(diào)整filter數(shù)目、kernel大小和stride數(shù)目等參數(shù),模型收斂速度以及學(xué)習(xí)性能與這些參數(shù)的設(shè)置息息相關(guān)。為了更好地進(jìn)行銷售額預(yù)測分析,調(diào)整參數(shù)來優(yōu)化網(wǎng)絡(luò)結(jié)構(gòu)。
CNN-LSTM網(wǎng)絡(luò)結(jié)構(gòu)參數(shù)設(shè)置為:所有LSTM和CNN-LSTM的模型都經(jīng)過50個時(shí)期的自適應(yīng)矩估計(jì)(ADAM)訓(xùn)練,批量等于128,使用均方損失函數(shù),激活函數(shù)選取ReLU函數(shù),LSTM中激活函數(shù)選取tanh函數(shù)。ADAM算法確保在訓(xùn)練過程中,學(xué)習(xí)步驟相對于參數(shù)梯度是尺度不變的。此外,為了確保在卷積運(yùn)算過程中不會遺漏任何特征,應(yīng)用了相同的填充。從預(yù)測的角度來看,預(yù)測范圍對于模型的預(yù)測精度至關(guān)重要。預(yù)測范圍代表預(yù)測下一個每日銷售額的預(yù)測模型所考慮的每日銷售額的數(shù)量。更具體地說,設(shè)置預(yù)測范圍等于7的情況下,將7天的影響因素?cái)?shù)據(jù)作為特征變量,意味著模型考慮了從7天收集的數(shù)據(jù),并用于預(yù)測第8天的銷售額,即目標(biāo)變量。在本研究中,所有評估模型的回歸性能通過MSE、MAE和R2來測量。
2.4.1預(yù)測結(jié)果分析
將測試數(shù)據(jù)傳送到訓(xùn)練好的CNN-LSTM模型中,得到日用品銷售額預(yù)測數(shù)據(jù)和擬合情況,見圖5。從擬合效果可以看出,模型的預(yù)測值與實(shí)際值較為接近。
圖5 CNN-LSTM預(yù)測數(shù)據(jù)曲線
根據(jù)式(10)—(12)的誤差評判指標(biāo)計(jì)算得到預(yù)測準(zhǔn)確性的誤差,見表2。
表2 CNN-LSTM模型預(yù)測結(jié)果
可以看出,模型的誤差值相對較小,這可能是因?yàn)槟P鸵肓宋⑿磐扑痛螖?shù)、本地電視廣告投入、線上廣告投入、門店海報(bào)陳列、門店銷售人員、門店促銷事件等作為影響因素。另外,從指標(biāo)值得出模型在預(yù)測分析中表現(xiàn)較為出色。
2.4.2與傳統(tǒng)機(jī)器學(xué)習(xí)模型的比較
CNN-LSTM模型與XGBoost和SVM模型的擬合曲線見圖6。為了增加模型擬合效果的清晰度,截取部分測試集來展示。總體而言,從數(shù)據(jù)分布擬合情況來看,CNN-LSTM模型生成的預(yù)測效果曲線偏離程度不大,而傳統(tǒng)模型的預(yù)測值相對實(shí)際值來說聚集效果也較好,但在個別轉(zhuǎn)折點(diǎn)出現(xiàn)了離群值。
圖6 模型預(yù)測結(jié)果1
得到CNN-LSTM、XGBoost和SVM模型的預(yù)測評價(jià)指標(biāo)MSE、MAE和R2,見表3。
表3 CNN-LSTM與傳統(tǒng)模型預(yù)測結(jié)果
可以看出,CNN-LSTM模型的MSE和MAE數(shù)值均為最小,R2數(shù)值最大,說明模型擬合效果最好,其次是SVM模型,且XGBoost模型和SVM模型在預(yù)測方面性能相差不大。
2.4.3與其他深度學(xué)習(xí)方法的比較
將CNN-LSTM模型與單一LSTM、CNN深度學(xué)習(xí)模型進(jìn)行比較,在測試集上得到預(yù)測結(jié)果,見圖7。
圖7 模型預(yù)測結(jié)果2
在深度模型預(yù)測中,CNN-LSTM模型依然表現(xiàn)突出,但三者之間預(yù)測曲線都相對緊密地圍繞在實(shí)際值附近。得到CNN-LSTM與LSTM、CNN模型的預(yù)測評價(jià)指標(biāo)MSE、MAE和R2,見表4。
表4 CNN-LSTM與其他深度學(xué)習(xí)模型預(yù)測結(jié)果
可以看出,CNN-LSTM模型的預(yù)測誤差相對較小,說明模型的學(xué)習(xí)能力較好,在測試集上的表現(xiàn)更為出色,在預(yù)測精度方面也略優(yōu)于LSTM、CNN模型。同時(shí),單一的LSTM和CNN深度學(xué)習(xí)模型的預(yù)測誤差也均相對較小。
提出了一種新的將銷售數(shù)據(jù)轉(zhuǎn)換為平穩(wěn)特征的方法,適用于不同的深度學(xué)習(xí)模型。在商業(yè)領(lǐng)域,不少學(xué)者研究預(yù)測價(jià)格,但對銷售額影響因素分析及預(yù)測的甚少。故針對日用品銷售額預(yù)測,為了增強(qiáng)模型的可解釋性,先對數(shù)據(jù)進(jìn)行特征工程操作以及變量間的相關(guān)性分析,然后將CNN和LSTM直接融合串聯(lián)形成CNN-LSTM深度網(wǎng)絡(luò)模型。為了評判模型的性能,畫出生成預(yù)測結(jié)果擬合曲線并計(jì)算指標(biāo)值,從曲線擬合效果和評價(jià)指標(biāo)的反饋中,展現(xiàn)出CNN-LSTM模型在預(yù)測分析中的獨(dú)特優(yōu)勢。且在測試集上的穩(wěn)健性比XGBoost、SVM、LSTM、CNN模型都略勝一籌。為經(jīng)濟(jì)領(lǐng)域企業(yè)調(diào)整促銷方式,進(jìn)而獲取更高的銷售額提供了方案。
未來有幾個有趣的研究方向。與所有的深度學(xué)習(xí)應(yīng)用一樣,更多的數(shù)據(jù)將使用更大的模型,神經(jīng)網(wǎng)絡(luò)也可以用于執(zhí)行一種智能提取有用的特性,從一個特定的深度和有限時(shí)間間隔的事件,這將避免以后失去信息,并允許模型產(chǎn)生預(yù)測一個特定時(shí)期內(nèi)而不是之后的事件。另一個重要的補(bǔ)充是注意機(jī)制,它將允許網(wǎng)絡(luò)更好地觀察特征,允許它忽略數(shù)據(jù)的噪聲部分,只使用相關(guān)信息。