梁亮
[摘 ? ?要] 在強調(diào)大數(shù)據(jù)、互聯(lián)網(wǎng)、實體經(jīng)濟與人工智能充分融合的當下,電子商務成為人們關(guān)注的焦點。本文以深度學習為切入點,在簡單介紹核心理論內(nèi)涵的基礎(chǔ)上,從電商平臺的角度出發(fā),對客戶數(shù)據(jù)進行了分析,并綜合考慮多方因素,提出了可使數(shù)據(jù)分析結(jié)論更加精準的方法,希望能夠給相關(guān)人員以啟發(fā),為電子商務注入前進所需的動力。
[關(guān)鍵詞] 電子商務;客戶;深度學習;數(shù)據(jù)分析
doi : 10 . 3969 / j . issn . 1673 - 0194 . 2020. 21. 062
[中圖分類號] F713.36 ? [文獻標識碼] ?A ? ? ?[文章編號] ?1673 - 0194(2020)21- 0141- 02
0 ? ? ?前 ? ?言
電商的出現(xiàn)使生活更加便利,卻也帶來了一系列問題,對數(shù)據(jù)進行挖掘和分析,可使相關(guān)企業(yè)在面對挑戰(zhàn)時擁有更大的勝算。在此背景下,相關(guān)人員選擇以深度學習為切入點,針對電商客戶數(shù)據(jù)制定有別于過去的分析方法,所取得效果也十分令人矚目。由此可見,本文所研究課題擁有較為突出的社會價值,應當引起重視。
1 ? ? ?理論概述
1.1 ? 電子商務
近幾年,以京東和淘寶為首的電商品牌,給人們生活帶來了極大便利,電商平臺的特征,主要表現(xiàn)為低于實體經(jīng)濟的運營成本,還有更符合預期的消費模式。深度學習理念的提出,使相關(guān)人員意識到,以客戶數(shù)據(jù)為依托,充分利用深度學習和數(shù)據(jù)挖掘法,對客戶所做出購買等行為進行分析,為電商平臺提供對體驗進行升級的方向,確保電商平臺對客戶擁有更為強大的吸引力。
電子商務指的是以互聯(lián)網(wǎng)為載體對商貿(mào)活動進行開展的運營模式,強調(diào)網(wǎng)上購物與電子支付。2013年至今,電商企業(yè)紛紛將提供高效服務視為工作重心,在電子商務得到大力推廣的背景下,將其視為交易首選平臺的人員數(shù)量不斷增加,數(shù)據(jù)信息逐年增加,這部分信息主要由購買行為、客戶評價和反饋構(gòu)成,如何對相關(guān)數(shù)據(jù)加以應用,準確把握客戶行為所呈現(xiàn)出規(guī)律,自然成為相關(guān)行業(yè)討論的重點,這是因為客戶行為有助于電商對潛在消費群體加以識別,促使瀏覽者向消費者進行轉(zhuǎn)變,其經(jīng)濟價值及現(xiàn)實意義均有目共睹。
1.2 ? 客戶數(shù)據(jù)分析
針對電商客戶所開展數(shù)據(jù)分析工作,強調(diào)以客戶瀏覽記錄、歷史訪問和服務器日志為依據(jù),對行為規(guī)律進行提煉,以此來達到實時預測客戶購買傾向與行為的目的。從電商平臺的視角來看,這樣做有助于自身對客戶行為加以掌握,并有針對性地推薦商品,調(diào)整進貨和出貨的具體數(shù)量,另外,在對營銷策略進行制定時,數(shù)據(jù)分析所得結(jié)論,同樣有無法被替代的作用。早在20世紀90年代,部分學者就已將網(wǎng)絡(luò)數(shù)據(jù)視為研究重點,并成立了對電商客戶所涉及數(shù)據(jù)進行分析的機構(gòu)。信息時代的到來,加快了電子商務推廣和普及的速度,可被用來分析客戶數(shù)據(jù)的方法也不斷增加,其中,具有代表性的有神經(jīng)網(wǎng)絡(luò)法、決策樹法和貝葉斯分類法。上述方法存在較為明顯的共性特征,即驅(qū)動力為數(shù)據(jù),將客戶信息和行為視為切入點,從中對特征設(shè)計所需因素進行篩選,再經(jīng)由計算機學習法,對模型進行訓練。另外,上述過程又被稱為深度學習,這點應引起重視。
2 ? ? ?數(shù)據(jù)分析
2.1 ? 分析方向
近幾年,在飛速發(fā)展的科技的加持下,深度學習模型逐漸走向成熟,其中,本文研究的CNN、RNN,還有DNN、DBN均已在語音識別、信息處理等領(lǐng)域得到應用,所取得效果也十分顯著。在對電商客戶數(shù)據(jù)進行分析時,相關(guān)人員應做到以客戶數(shù)據(jù)為依據(jù),根據(jù)分析結(jié)果,對其行為進行預測,當然,這也是電商平臺的主要工作。在深度學習得到推廣的背景下,電商平臺對客戶數(shù)據(jù)的掌握愈發(fā)全面,數(shù)據(jù)庫的形成,使預測工作擁有了更加理想的針對性和實時性,這便是智慧化預測的開端。由此可見,可被用來進行數(shù)據(jù)分析的體系,通常要滿足以下要求:第一,以統(tǒng)計學、數(shù)據(jù)挖掘和機器學習為切入點,完成提取數(shù)據(jù)特征的操作;第二,根據(jù)所提取特征,對相關(guān)知識庫進行構(gòu)建,確保數(shù)據(jù)輸入、行為預測等內(nèi)容均被納入所構(gòu)建體系。
2.2 ? 數(shù)據(jù)處理
第一步,以電商交互系統(tǒng)為載體,對交互日志進行抽取,搜集客戶分析所需數(shù)據(jù);第二步,對數(shù)據(jù)進行預處理,例如,清洗數(shù)據(jù),將異常值去除,以及對缺失值進行填充,確保數(shù)據(jù)滿足唯一性的要求,使行為預測及后續(xù)工作的開展,擁有全面且有效的保障。
2.3 ? 特征提取
以原始數(shù)據(jù)為依托,對客戶購買行為所表現(xiàn)出特征進行提取,再利用現(xiàn)有分類方法,將特征劃分為動態(tài)/靜態(tài)或原始/拓展,通過對不同類別特征進行整合的方式,形成有別于過去的全新特征。研究表明,要想使預估效果達到預期,關(guān)鍵是參考數(shù)據(jù)與特征,對模型預估上限加以明確,并對模型進行調(diào)整,由此可見,如何增強所構(gòu)建特征的科學性,已成為使客戶數(shù)據(jù)得到精準分析的保障,在未來一段時間內(nèi),該項工作將成為研究的主要內(nèi)容。
2.4 ? 模型構(gòu)建
預測模型是否準確,通常會給數(shù)據(jù)分析帶來直接影響,甚至對分析結(jié)果的有效性有決定作用?,F(xiàn)階段,大量預測模型被投入使用,但現(xiàn)有模型的準確性,普遍和預期存在較大差距,如何以數(shù)據(jù)分析為依據(jù),對客戶行為進行預測,成為了電商平臺關(guān)注的重點。眾所周知,電子商務的特點,主要表現(xiàn)為數(shù)據(jù)量大和處理難度高,現(xiàn)有模型均不具備對全部問題加以解決的能力,其中,大部分模型都符合理論模型的特征,強調(diào)對影響因素進行定性分析。研究表明,在很長一段時間內(nèi),Logistic回歸法均占據(jù)著主導地位,從本質(zhì)來說,該回歸法屬于線性分類模型之一,其特征表現(xiàn)為對輸入所提出要求相對嚴格,例如,目標對象應滿足線性可分條件,而隨機森林法、Badding法的性能,普遍會受到一定程度的限制?;诖?,本文以深入學習為切入點,對分析電商客戶數(shù)據(jù)的方法進行探究,具體內(nèi)容如下:
2.4.1 ? 理論概述
Hinton是首位提出深度學習概念的學者。作為機器學習研究全新方向,深度學習主要被用來對神經(jīng)網(wǎng)絡(luò)較易受到學習能力制約的問題,以逐層貪婪學習為原則,通過對非線性網(wǎng)絡(luò)進行深入學習的方式,獲得機器學習所需特征,為預測結(jié)果所具備精準性提供保障。
從本質(zhì)上說,深度學習強調(diào)的是對數(shù)據(jù)表征進行學習,旨在對完善模型進行創(chuàng)建,并以未標記數(shù)據(jù)為依托,對表示方法加以掌握?,F(xiàn)階段,針對深度學習所展開研究,主要涉及以下方面:其一,以卷積運算為核心的神經(jīng)網(wǎng)絡(luò),即CNN;其二,以多層神經(jīng)元為核心的神經(jīng)網(wǎng)絡(luò),通常分為稀疏編碼和自編碼;其三,以自編碼網(wǎng)絡(luò)為載體,通過開展預訓練的方式,對深度置信網(wǎng)絡(luò)加以優(yōu)化。
2.4.2 ? 特征構(gòu)建
特征構(gòu)建主要由三個階段組成,分別是選擇特征、對樣本測試集與訓練集進行劃分和特征處理。從某個層面來說,選擇特征是確保預測模型得到有效構(gòu)建的前提,要求相關(guān)人員以現(xiàn)有數(shù)據(jù)集為依托,確定分類所需特征集,通過提升模型精準度的方式,將運行時間控制在合理長度。由于不同維度對特征量綱、單位所提出要求,通常有較為顯著的差異存在,評估特征所擁有權(quán)重也會受到影響,因此,要想避免預估效果受到影響,關(guān)鍵是通過特征管理的方式,達到歸一化處理的目的。
2.4.3 ? 確定并驗證模型
深度學習強調(diào)以算法為依托,在現(xiàn)有假設(shè)空間中對最優(yōu)假設(shè)進行確定,而預測方法要求相關(guān)人員從多個角度對分析工作進行開展,在所處理數(shù)據(jù)不同的基礎(chǔ)上,利用現(xiàn)有方法對客戶所開展活動進行預測,通常會取得不同的結(jié)論,可以說,任何學習問題都有相應的算法,但是,并不存在適用于全部領(lǐng)域的算法,在此背景下,學者紛紛將目光轉(zhuǎn)向?qū)我凰惴ㄟM行整合,形成擁有良好普適性的模型的方面,希望能夠通過相關(guān)研究的開展,確保算法可發(fā)揮出應有作用,而合成算法所應用方法,也因此而成為對算法準確率起決定作用的因素。
待上文所提及工作告一段落,相關(guān)人員便應對模型進行確定并驗證。一方面,利用CNN和RNN對模型框架進行構(gòu)建,以此為基礎(chǔ),隨機抽取數(shù)據(jù)負樣本并對網(wǎng)絡(luò)層數(shù)加以調(diào)整,在明確損失函數(shù)后,經(jīng)由BP算法對輸出誤差進行反向傳播,并以Adam算法為依托,完成模型參數(shù)的優(yōu)化處理。另一方面,利用尚未經(jīng)過訓練的客戶數(shù)據(jù),對模型所具備泛化能力進行驗證,若預測結(jié)果和預期相差較遠,相關(guān)人員應對模型進行重新設(shè)計與訓練。
3 ? ? ?結(jié) ? ?論
通過分析文章內(nèi)容可知,以數(shù)據(jù)分析所得結(jié)論為依據(jù),對客戶行為進行預測,現(xiàn)已成為電商領(lǐng)域所研究的主要內(nèi)容,在深度學習模型逐漸趨于完善的背景下,對客戶行為進行預測的精準度不斷提升,但是黑盒特征的存在,導致深度學習無法為基于特征提取所開展定性研究工作提供支持,因此,未來一段時間內(nèi),由深度學習延伸出的可視技術(shù)將成為研究的重點。
主要參考文獻
[1]孫曉凱,倪卿元,陳文強.圖像增強方法在深度學習圖像識別場景應用中的可行性研究[J].電信科學,2020,36(z1):172-179.
[2]戴成華,宋偲皓,薛繼待,等.基于人工智能視頻深度處理技術(shù)的景區(qū)智慧化管理探索研究[J].科技通報,2019,35(4):108-114.
[3]曹曉明,張永和,閆海亮,等.人工智能視域下的學習參與度識別方法研究——基于一項多模態(tài)數(shù)據(jù)融合的深度學習實驗分析[J].遠程教育雜志,2019,37(1):32-44.