格倫·厄本 阿爾喬姆·季莫申科 帕拉姆維爾·迪隆 約翰·豪澤
深度學習在大數(shù)據(jù)庫分析方面的優(yōu)勢越來越明顯,它可以從中摸索出規(guī)律并得出洞見。不難想象有一天,企業(yè)能夠廣泛整合各種數(shù)據(jù)庫,以更高的水準和更強的分析能力來識別消費者需求,并利用所得信息進行精準的市場營銷。
深度學習和普通數(shù)據(jù)分析究竟有何不同?它是實現(xiàn)了質(zhì)的飛躍,還只是稍有改進?為了比較兩者的作用,作者研究了一個與信用卡市場相關(guān)的大型數(shù)據(jù)庫,探尋多層次深度學習模型是否可以比傳統(tǒng)模型更準確地預測人們對信用卡的選擇。
該數(shù)據(jù)庫源自大型信用卡網(wǎng)絡供應商NerdWallet,其中包括點擊流、人口統(tǒng)計和廣告曝光等相關(guān)信息。作者利用這個數(shù)據(jù)庫比較了三種顧客選擇信用卡的模型。第一種是簡單線性回歸模型,第二種是簡單的深度學習模型,第三種是簡單深度學習模型的加強版。
根據(jù)分析,兩種基于深度學習的模型都能夠比傳統(tǒng)方法更準確地預測用戶對于信用卡的選擇。然而,改進并沒有預期的那么大:簡單線性回歸模型的準確率為70.5%,簡單深度學習模型的預測準確率稍高一些,為71.7%,復雜深度學習模型的預測準確率為73%。
既然深度學習對選擇預測的改進有限,市場營銷部門是否還有必要投資該技術(shù)并開發(fā)其關(guān)鍵能力?作者認為,和傳統(tǒng)的數(shù)據(jù)分析相比,深度學習帶來的預測準確率的小幅提升,在多數(shù)情況下不大可能產(chǎn)生足夠豐厚的回報,因此不值得大舉投資。在試水之前,企業(yè)不但要考慮可能的收益,還要考慮執(zhí)行的風險和成本。
深度學習的主要缺點在于很難確定哪些變量能對消費者的選擇產(chǎn)生更大的影響。是信用卡旅行獎勵還是低利率?由于變量是通過眾多影響選擇的潛在層進行處理的,因此很難衡量其中某一個變量的影響。營銷經(jīng)理的直覺判斷很難與模型結(jié)果相關(guān)聯(lián),這將使深度學習的實施變得困難。
當然,還有其他因素需要考慮。獲取深度學習技術(shù)需要成本,實施該技術(shù)也需要相關(guān)人員,同時還可能導致額外數(shù)據(jù)成本。除此之外,即使使用當今的快速計算機,深度學習模型也需要大量的計算資源,并且可能需要較長的運行時間。大多數(shù)情況下,除非預測準確性的小幅提升能夠大大降低成本或增加收益,否則用深度學習取代傳統(tǒng)數(shù)據(jù)分析缺乏充足的理由。
盡管如此,作者仍然認為,某些情況下深度學習前景光明。與傳統(tǒng)的線性回歸模型相比,深度學習在分析包括圖像和非數(shù)值數(shù)據(jù)在內(nèi)的“豐富”數(shù)據(jù)庫方面具有顯著優(yōu)勢。這些豐富數(shù)據(jù)涵蓋了用戶生成的所有信息(例如亞馬遜評論、Instagram帖子、臉書帖子以及公司網(wǎng)站上的評論),其潛在價值是巨大的。
深度學習特別適合識別異質(zhì)和非結(jié)構(gòu)化數(shù)據(jù)中的模式。例如,有一種基于深度學習的模型可以幫助汽車設計師預測消費者對繪圖板上的汽車原型有何反應,同時也可產(chǎn)生新產(chǎn)品創(chuàng)意。另一個案例中,研究人員根據(jù)客戶的新聞消費行為創(chuàng)建了一個模型,以預測他們將來閱讀新聞的習慣。最近,企業(yè)已經(jīng)開始使用深度學習來分析消費者在社交媒體上發(fā)布的品牌服裝圖片,同時預測哪些商品的客戶退貨率最高,哪些優(yōu)惠券產(chǎn)生的利潤最大。
隨著基于深度學習的新算法和更豐富的數(shù)據(jù)庫的出現(xiàn),深度學習有望提供更好的結(jié)果。
格倫·厄本 阿爾喬姆·季莫申科 帕拉姆維爾·迪隆 約翰·豪澤
深度學習在人工智能(AI)應用方面正取得令人矚目的成果。例如,通過蘋果手機智能語音助手Siri將人聲轉(zhuǎn)換成計算機命令,用戶可以獲取所需問題的答案,發(fā)送個人信息以及在不熟悉的路段尋求導航服務。自動駕駛則解放了人們的雙手,雖然目前僅局限于高速公路,但這項技術(shù)最終會在城市街道中普及。在生物學領(lǐng)域,研究人員正在為基于DNA的藥物研制新分子。
鑒于上述活動都是通過深度學習進行的,許多人都想知道這些方法將如何改變營銷的未來。它們將在多大程度上幫助企業(yè)設計出可贏利的新產(chǎn)品和服務,從而滿足客戶需求?
深度學習技術(shù)在大數(shù)據(jù)庫分析方面的優(yōu)勢越來越明顯,它可以從中摸索出規(guī)律并得出洞見。不難想象有一天,企業(yè)能夠廣泛整合各種數(shù)據(jù)庫,以更高的水準和更強的分析能力來識別消費者需求,并利用所得信息進行市場營銷。例如,不久之后,被人臉識別出的消費者在采購生鮮食品時,可能會收到根據(jù)他們的購買習慣贈送的個性化優(yōu)惠券。將來,廣告也可能會根據(jù)消費者的不同個性單獨設計,并在他們觀看YouTube時實時投放。深度學習還可用于設計產(chǎn)品以滿足消費者的個人需求,然后通過自動3D打印系統(tǒng)生產(chǎn)并交付。
不同類型的企業(yè)將嘗試以各自不同的方式發(fā)揮深度學習的作用。汽車制造商可能會利用這一技術(shù)瞄準新客戶、改進購買流程或針對特定消費者需要的產(chǎn)品功能進行微調(diào)。完成上述任務需要憑借海量的相關(guān)數(shù)據(jù),包括汽車維修數(shù)據(jù)、消費者對汽車質(zhì)量和可靠性的評級、機動車注冊登記信息、有關(guān)購車和用戶體驗的推特(Twitter)帖子、臉書(Facebook)上向人們展示自己汽車的帖子、制造商的消費者關(guān)系管理數(shù)據(jù)文件以及互聯(lián)網(wǎng)上的點擊。同時,銀行可以借助深度學習開發(fā)新產(chǎn)品或服務,并定制促銷活動。通過分析客戶貸款歷史、信用卡交易、儲蓄和支票賬戶記錄、網(wǎng)站點擊量、社交媒體行為、產(chǎn)品評級和搜索歷史等數(shù)據(jù),銀行對某些客戶的喜好了如指掌。例如,居住在城市社區(qū)中的40歲專業(yè)人士最希望從信用卡中獲得什么?是旅行獎勵?買家保障?現(xiàn)金返還還是低利率?
可以肯定的是,許多管理者已經(jīng)將數(shù)據(jù)分析與統(tǒng)計模型和重點數(shù)據(jù)庫相結(jié)合,從而追蹤品牌績效、安排促銷活動并做出開支決策。那么,深度學習和普通數(shù)據(jù)分析有何不同?它是實現(xiàn)了質(zhì)的飛躍,還只是稍有改進?在本文中,我們將參照針對信用卡所做的一項研究來審視這些問題。同時,我們也會討論這項研究對于數(shù)據(jù)分析未來發(fā)展方向的啟示。
盡管我們在深度學習方面仍處于摸索階段,但現(xiàn)在問這樣的問題并非為時過早:與管理者所習慣的現(xiàn)有數(shù)據(jù)分析方法相比,深度學習究竟能給企業(yè)帶來什么?它可以提供更好的預測嗎?如果不能,如何改進?為了利用其最新和最強大的功能,企業(yè)必須在數(shù)據(jù)和技術(shù)方面進行哪些投資?我們的研究表明,盡管深度學習的效果可能不會立竿見影,也不會在每種情況下都能大幅提高預測的準確性,但我們?nèi)杂欣碛蓪@項技術(shù)的應用前景保持樂觀。
為了將深度學習與傳統(tǒng)的營銷數(shù)據(jù)分析方法進行比較,我們研究了一個與信用卡市場相關(guān)的大型數(shù)據(jù)庫,該數(shù)據(jù)庫源自大型信用卡網(wǎng)絡供應商NerdWallet,其中包括點擊流、人口統(tǒng)計和廣告曝光等相關(guān)信息。我們想看看多層次深度學習模型是否可以比傳統(tǒng)模型更準確地預測人們對信用卡的選擇。
能夠準確預測顧客的選擇是改進決策的第一步。這些決策涉及產(chǎn)品設計、媒體資源分配、產(chǎn)品推廣(本案例中的產(chǎn)品是信用卡)以及目標顧客的鎖定。想了解人們在選擇信用卡時最看重的是什么,就需要進行實驗并設計預測模型。直覺告訴我們,與更簡單的回歸模型相比,深度學習將提供更清晰且更具價值的圖景。為了檢驗這一假設,我們做了一項研究,看看26萬名顧客是如何選擇信用卡的。這一研究將25個人口因素(包括年齡、性別、家庭收入等一目了然的信息以及信用評分、消費者目前擁有的信用卡和郵政編碼等詳細分類信息)、每張卡的132個屬性(例如利率、是否提供獎勵積分、旅行里程數(shù)、現(xiàn)金返還以及年度會員卡費和余額轉(zhuǎn)賬費)以及每個人申請的卡片都考慮在內(nèi)。
NerdWallet網(wǎng)站匯總了來自數(shù)百家銀行大約2,000種不同信用卡的信息和專家評論,以便顧客比較它們的功能,確定哪些屬性對自己更重要。用戶在線瀏覽的產(chǎn)品通常會被記錄在案。用戶點擊進去以后,查看更多詳細信息或者選擇特定卡片進行比較的過程也會被記錄在案。用戶在NerdWallet網(wǎng)站上確定自己需要哪種信用卡之后,將被引導至相應銀行的網(wǎng)站以完成申請。出于研究目的,我們將這一步視為用戶做出的最終選擇。
我們利用NerdWallet的數(shù)據(jù)庫比較了三種選擇模型。(參見副欄“數(shù)據(jù)分析的技術(shù)說明”)第一種是以個人用戶人口統(tǒng)計因素和信用卡屬性為變量的簡單線性回歸模型。每一個變量通過方程式都會對消費者選擇產(chǎn)生簡單而又直接的影響,變量之間沒有相互作用。例如,個人客戶每消費1,000美元獲得的獎勵里程數(shù)乘以0.058的系數(shù),可能有助于預測消費者是否會選擇美國運通經(jīng)典綠卡。
第二種是簡單的深度學習模型,該模型在輸入變量和選擇概率之間包含了隱藏層。每個輸入變量(例如獎勵里程)都會和一個潛變量相關(guān)聯(lián),而該潛變量同時又與選擇概率相關(guān)聯(lián)。潛變量沒有具體確定,它們是第一級輸入變量的組合,同時又與下一級模型的其他潛變量相關(guān)聯(lián)。以此類推,后續(xù)的潛變量又是其他潛變量的組合。似乎沒必要搞得這么復雜,但深度學習的優(yōu)勢恰恰就在于連接隱藏層中的潛變量,否則就不能稱為“深度學習”。我們的模型有三個層次。第一層捕獲了觀察到的信用卡屬性和人口統(tǒng)計因素對一組潛變量的影響;接下來,我們研究了這些潛變量對后續(xù)潛變量層的影響。最終,我們希望通過這三個允許復雜交互和非線性的隱藏層,更準確地預測用戶對于信用卡的選擇。
第三種是簡單深度學習模型的加強版,其中因變量是選擇概率以及消費者在最終選擇時考慮使用的特定卡片。它將購買過程中的詳細信息和用戶關(guān)心的其他信用卡(基于他們的點擊流)的詳細信息等因素考慮在內(nèi)。通過將這一額外的考慮步驟添加到購買過程中,我們認為可能會提高基本深度學習模型用戶選擇預測的準確性。
根據(jù)分析,兩種基于深度學習的模型都能夠比傳統(tǒng)方法更準確地預測用戶對于信用卡的選擇。(參見副欄“深度學習如何超越傳統(tǒng)的營銷數(shù)據(jù)分析”)然而,改進并沒有我們預期的那么大。
簡單線性回歸模型的準確率為70.5%。這意味著在70.5%的情況下,我們能夠準確預測某位特定消費者對信用卡的選擇。簡單深度學習模型的預測準確率稍高一些,為71.7%,復雜深度學習模型的預測準確率為73%。
我們曾以為,添加更多潛變量層將大大提高預測的準確率。然而事實并非如此。憑經(jīng)驗優(yōu)化的線性回歸模型同樣準確可靠。包括人口因素和信用卡屬性在內(nèi)的眾多參數(shù)確保了傳統(tǒng)方式預測的準確性。
我們的研究是否能夠揭示深度學習的潛力?既然深度學習對選擇預測的改進有限,市場營銷部門是否還有必要投資該技術(shù)并開發(fā)其關(guān)鍵能力?我們認為,和傳統(tǒng)的數(shù)據(jù)分析相比,深度學習帶來的預測準確率的小幅提升,在多數(shù)情況下不大可能產(chǎn)生足夠豐厚的回報,因此不值得大舉投資。在試水之前,企業(yè)不但要考慮可能的收益,還要考慮執(zhí)行的風險和成本。
深度學習的主要缺點在于很難確定哪些變量能對消費者的選擇產(chǎn)生更大的影響。是信用卡旅行獎勵還是低利率?由于變量是通過眾多影響選擇的潛在層進行處理的,因此很難衡量其中某一個變量的影響。我們固然可以模擬一個變量中變化的影響,但該影響取決于深度學習模型的復雜結(jié)構(gòu)中使用的所有其他變量的級別。營銷經(jīng)理的直覺判斷很難與模型結(jié)果相關(guān)聯(lián),這將使深度學習的實施變得困難。
當然,還有其他因素需要考慮。獲取深度學習技術(shù)需要成本,實施該技術(shù)也需要相關(guān)人員,同時還可能導致額外數(shù)據(jù)成本。除此之外,即使使用當今的快速計算機,深度學習模型也需要大量的計算資源,并且可能需要較長的運行時間。如果要求實時實施,上述擔憂將成為深度學習技術(shù)中一個實實在在的短板。大多數(shù)情況下,除非預測準確性的小幅提升能夠大大降低成本或增加收益,否則用深度學習取代傳統(tǒng)數(shù)據(jù)分析缺乏充足的理由。
盡管如此,我們?nèi)匀徽J為,某些情況下深度學習前景光明。正如我們所指出的那樣,與傳統(tǒng)的線性回歸模型相比,深度學習在分析包括圖像和非數(shù)值數(shù)據(jù)在內(nèi)的“豐富”數(shù)據(jù)庫方面具有顯著優(yōu)勢。這些豐富數(shù)據(jù)涵蓋了用戶生成的所有信息(例如亞馬遜評論、Instagram帖子、臉書帖子以及公司網(wǎng)站上的評論),其潛在價值是巨大的。盡管NerdWallet網(wǎng)站包含高度精細的搜索和產(chǎn)品數(shù)據(jù),但它的數(shù)據(jù)服務并沒有達到足夠豐富的水平,因此其優(yōu)勢也沒有得到充分發(fā)揮。掌握消費者對信用卡的口頭評價可能會提高預測的準確性。
深度學習特別適合識別異質(zhì)和非結(jié)構(gòu)化數(shù)據(jù)中的模式。例如,本文幾位作者最近開發(fā)了一種基于深度學習的模型,以幫助汽車設計師預測消費者對繪圖板上的汽車原型有何反應,同時也產(chǎn)生新產(chǎn)品創(chuàng)意。另一個案例中,研究人員根據(jù)客戶的新聞消費行為創(chuàng)建了一個模型,以預測他們將來閱讀新聞的習慣。最近,企業(yè)已經(jīng)開始使用深度學習來分析消費者在社交媒體上發(fā)布的品牌服裝圖片,同時預測哪些商品的客戶退貨率最高,哪些優(yōu)惠券產(chǎn)生的利潤最大。管理人員可以據(jù)此制定更好的產(chǎn)品退貨政策以及更有效的折扣策略。我們中一些人的前期研究表明,深度學習可以幫助企業(yè)更有效地預篩用戶生成的內(nèi)容,從而將數(shù)據(jù)分析師的工作重點放在具有高度信息量的評論上,這些評論能夠以比傳統(tǒng)方法低得多的成本識別客戶需求。
深度學習的應用機會層出不窮。它鼓勵實驗,并使得A/B測試能夠根據(jù)觀察到的結(jié)果實時調(diào)整。我們已經(jīng)開發(fā)出一種簡單的人工智能方法,可以將在線廣告的圖像和內(nèi)容與消費者的認知風格相匹配,同時設計實時有效的實驗系統(tǒng),為每組客戶靈活獲取最佳的廣告文案?,F(xiàn)有的統(tǒng)計模型能夠讓公司將廣告定位到在線消費者。然而,人工智能系統(tǒng)可以讓營銷人員根據(jù)個人的認知和交流風格定制廣告文案,根據(jù)他們的視覺偏好自定義圖片和圖形,同時結(jié)合統(tǒng)計數(shù)據(jù)和其他證據(jù)使其決策風格與之相符。這些應用已經(jīng)取得了良好的成效。隨著基于深度學習的新算法和更豐富的數(shù)據(jù)庫的出現(xiàn),深度學習有望提供更好的結(jié)果。
上述討論對企業(yè)而言意味著什么?根據(jù)我們的經(jīng)驗,我們?yōu)闋I銷經(jīng)理總結(jié)了以下幾條啟示。
1.關(guān)注未來機會 基于統(tǒng)計的傳統(tǒng)系統(tǒng)仍將在營銷數(shù)據(jù)分析中發(fā)揮關(guān)鍵作用,但深度學習遲早會改善當前的運營,并為新問題提供解決方案。這方面最有潛力的領(lǐng)域包括更復雜的促銷預算和規(guī)劃、更高級的客戶定位以及更完善的新產(chǎn)品開發(fā)。
2.創(chuàng)建豐富的數(shù)據(jù)庫 整合多種數(shù)據(jù)源和數(shù)據(jù)類型可能會在市場反應分析和營銷資源的優(yōu)化方面取得重大進展。深度學習的最大成本往往涉及數(shù)據(jù)獲取、數(shù)據(jù)庫的創(chuàng)建和維護。在我們針對用戶選擇信用卡的調(diào)查中,超過50%的成本與數(shù)據(jù)的收集、標記以及清理有關(guān)。因此,認為深度學習值得在業(yè)務中推廣的管理者應該投資于軟件,以便從公司網(wǎng)站、亞馬遜、推特和Instagram收集消費者評論,以及客戶個人搜索和購買決定的點擊流記錄。
3.通過培訓和招新的方式培養(yǎng)能力 想要發(fā)揮深度學習的優(yōu)勢,熟悉數(shù)據(jù)庫的全職專家必不可少。他們知道如何最大程度地利用豐富的數(shù)據(jù),解決以前從未解決過的營銷問題,并發(fā)現(xiàn)新的戰(zhàn)略視角。處理豐富的數(shù)據(jù),需要人工智能方面的高端知識,以及聘請顧問以補充現(xiàn)有內(nèi)部人員的充足預算。
4.制訂實驗計劃 除了使用深度學習進行更好、更高效的A/B實驗,你還可以用它來測試新的營銷變量。這方面最大的潛力可能在于,系統(tǒng)性地使用不同變量,展開有針對性的實驗,評估反應情況。目前來看最好的做法是對每位用戶采用不同的實時刺激,然后通過深度學習方法分析實驗結(jié)果。
盡管深度學習的實施需要付出較高的成本,也面臨諸多挑戰(zhàn),但它使得分析豐富的數(shù)據(jù)庫和開展實時實驗成為可能,我們對它提升營銷實踐的潛力充滿信心。深度學習應用于營銷數(shù)據(jù)分析,可以起到如下幾點作用:(1)改善對市場反應的預測,從而幫助實現(xiàn)利潤和營銷投資回報率(ROI)的最大化;(2)揭示產(chǎn)品開發(fā)的新機會;(3)允許更有針對性的產(chǎn)品設計、分銷、促銷以及媒體優(yōu)化。盡管舊數(shù)據(jù)和傳統(tǒng)數(shù)據(jù)分析收益甚微,但在很多新的數(shù)據(jù)分析應用中,準確性和洞察力的提高將證明在深度學習技術(shù)和數(shù)據(jù)上投資是值得的。