劉燕 張瓊 呂佳敏 謝瑩 陳輝 鄭培
摘?要:煙草行業(yè)擁抱數(shù)字化,如何利用海量卷煙數(shù)據(jù)更好地為卷煙品牌培育賦能,成為煙草行業(yè)的工作重點。大數(shù)據(jù)算法的發(fā)展與應(yīng)用,讓精準營銷變得更有科學依據(jù),助力精準品牌培育。因此,文章以湖南省衡陽縣轄區(qū)在銷的卷煙品牌為研究對象,通過收集卷煙品牌主客觀指標數(shù)據(jù),采用協(xié)同過濾模型和K-means聚類等算法進行分析,旨在探索基于關(guān)聯(lián)推薦算法的卷煙品牌精準培育方法,形成一套可移植的方法論,助力新卷煙品牌實現(xiàn)更好的品牌培育效果。
關(guān)鍵詞:關(guān)聯(lián)推薦;精準營銷;K-means聚類;品牌培育
中圖分類號:F274文獻標識碼:A文章編號:1005-6432(2023)35-0123-04?
DOI:10.13939/j.cnki.zgsc.2023.35.123
1?引言
2023年全國煙草半年工作會議作出不斷深化改革創(chuàng)新、持續(xù)增強發(fā)展動能的部署,要求充分發(fā)揮品牌帶動發(fā)展作用。而煙草行業(yè)數(shù)字化的海量煙草數(shù)據(jù)資源尚未得到充分發(fā)掘利用,如何利用卷煙數(shù)據(jù)更好地為卷煙品牌培育賦能,成為煙草行業(yè)工作重點。
文章以湖南省衡陽縣轄區(qū)在銷的卷煙品牌為研究對象,通過收集卷煙品牌主客觀指標數(shù)據(jù),借助K-means聚類、協(xié)同過濾等關(guān)聯(lián)推薦算法,分析出不同卷煙品牌之間的關(guān)聯(lián)程度,形成以暢銷煙為品牌定點的關(guān)聯(lián)推薦列表,為新卷煙品牌培養(yǎng)提供更具針對性和高效性的關(guān)聯(lián)推薦方法論指導。
2?指標選取與數(shù)據(jù)收集
2.1?主客觀指標選擇與調(diào)研
文章基于深入訪談,在深入洞察卷煙市場信息后,總結(jié)歸納出14個卷煙品牌主客觀指標并形成調(diào)研表進行指標調(diào)研,其中包括包裝軟硬、卷煙規(guī)格、價類等11個客觀指標。另依據(jù)《卷煙感官技術(shù)要求》,選取了刺激性、香味以及余味3個主觀指標,采用5級量表進行指標評分。
客觀指標由衡陽市煙草公司衡陽縣分公司客戶服務(wù)分部工作人員調(diào)取內(nèi)部官方指標數(shù)據(jù),進行分類填寫匯總。主觀指標由代表性零售商組織進行卷煙品吸并進行填寫,上報后統(tǒng)一匯總。
2.2?數(shù)據(jù)收集基本情況
衡陽縣域內(nèi)在銷卷煙品規(guī)共179種,其中,國產(chǎn)卷煙170種,進口卷煙9種。國產(chǎn)卷煙中,湖南省內(nèi)煙有30種,余下140種為國產(chǎn)省外煙,保證了衡陽縣卷煙市場的品牌多樣性。根據(jù)衡陽縣2023年1月至5月各卷煙品牌總銷額和總銷量統(tǒng)計結(jié)果可知,衡陽縣卷煙市場呈現(xiàn)出明顯的品牌偏向性,以芙蓉王(硬)為代表的芙蓉王系列、白沙系列與雙喜系列在衡陽縣卷煙市場占據(jù)著絕對的市場龍頭地位。如圖1和圖2所示。
3?關(guān)聯(lián)推薦模型分析
3.1?協(xié)同過濾模型
協(xié)同過濾(collaborative?filtering,CF)算法是一類用于推薦系統(tǒng)的算法。而基于項目的協(xié)同過濾算法(CF)以項目作為標準來思考問題,算法本體根據(jù)用戶行為來判定項目間的相似度。文章選用卷煙品牌主客觀指標作為數(shù)據(jù)基礎(chǔ),既有卷煙產(chǎn)品本身的特征,也有用戶評價賦予的特征,因此選用基于物品的協(xié)同過濾算法以及CF算法進行數(shù)據(jù)分析。
3.1.1?特征提取及數(shù)據(jù)處理
文章結(jié)合深入訪談結(jié)果和市場卷煙消費者看重指標,最終選取了九項指標進行協(xié)同過濾分析。主觀指標具體評分由調(diào)研數(shù)據(jù)加權(quán)平均得出,焦油含量取mg/支,對其余的客觀指標見表1所示的卷煙產(chǎn)品指標信息編碼表進行編碼轉(zhuǎn)化,得到如表2所示的標準化指標數(shù)據(jù)。
圖1?2023年1月至5月總銷售額TOP20卷煙產(chǎn)品(元)
圖2?2023年1月至5月總銷售量TOP20卷煙產(chǎn)品(條)
計算卷煙產(chǎn)品相似度,采用的是余弦相似度公式:
similarityi,j=∑u∈Uijrui·ruj?∑u∈Uijr2ui·?∑u∈Uijr2uj(1)
其中,Uij表示對物品i和j都有評分的用戶集合,rui表示用戶u對物品i的評分。
生成推薦列表呈現(xiàn)的推薦分數(shù)是基于卷煙產(chǎn)品相似度的加權(quán)平均推薦分數(shù):
r^uj=∑i∈Iusimilarity(i,j)·rui∑i∈Iusimilarity(i,j)(2)
其中,Iu表示用戶u已評分的物品集合。
3.1.2?分析結(jié)果展示
文章采用Python設(shè)計卷煙產(chǎn)品的協(xié)同過濾分析程序,進行各個卷煙產(chǎn)品之間的相似性計算,并生成卷煙產(chǎn)品的相似性矩陣。文章選取衡陽縣域王牌產(chǎn)品芙蓉王(硬)作為示例產(chǎn)品進行關(guān)聯(lián)推薦分析。當輸入芙蓉王(硬)進行推薦產(chǎn)品的相似度查詢,可以得到程序推薦的相似產(chǎn)品列表,如表3所示。
3.2?K-means聚類模型
K-means算法是一種常見的聚類分析方法,旨在將相似的數(shù)據(jù)點分配到預(yù)先定義的K個簇中。
一般采用歐氏距離來表示樣本之間的相似度關(guān)系。距離公式如下所示:
du,v=∑|ui-v|(3)
其中,ui表示數(shù)據(jù)成員,v表示k個簇的中心。
文章同時采用K-means算法,對卷煙品牌主客觀指標數(shù)據(jù)進行聚類分析,以得出關(guān)聯(lián)推薦分析結(jié)果,同時輔助驗證協(xié)同過濾分析模型給出的結(jié)果可靠性。
3.2.1?數(shù)據(jù)處理
文章通過肘部法(elbow?method),得出合適的聚類數(shù)量為3,其后文章采用了主成分分析(PCA)方法,將原始數(shù)據(jù)的多維特征空間降維到三維空間,評價指標Silhouette?Score為0.347,Davies-Bouldin?Index為1.080,Calinski-Harabasz?Index為79.867,說明聚類結(jié)果在這三個指標下都表現(xiàn)良好,降維聚類后的結(jié)果如圖3所示。
通過對每個簇心進行進一步分析,識別出簇心代表性產(chǎn)品,并從中獲得有關(guān)產(chǎn)品特征和市場定位的洞察,如表4所示。
3.2.2?基于K-means聚類的產(chǎn)品培育建議
文章基于相似度關(guān)聯(lián)推薦的邏輯,選取市場表現(xiàn)較好的簇心產(chǎn)品作為代表性產(chǎn)品,而培育產(chǎn)品則是簇心周圍距離最近的產(chǎn)品群,梳理總結(jié)得出三大類可用于指導衡陽縣實施精準卷煙品牌培育的產(chǎn)品培育對照表,部分對照表如表5所示。
3.3?K-means與CF算法結(jié)合推薦
協(xié)同過濾模型與K-means聚類模型在指導卷煙品牌精準培育的關(guān)聯(lián)推薦結(jié)果方面,分析預(yù)測是否一致,文章對這兩種算法結(jié)果進行了對照檢驗,隨機抽取白煙(精品)作為驗證目標產(chǎn)品,在CF算法中輸入白沙(精品)作為相似性產(chǎn)品的對照產(chǎn)品,生成的相似性矩陣和推薦列表進行比對后可以發(fā)現(xiàn),基本上兩者的推薦產(chǎn)品都實現(xiàn)了重合,且相似度都能夠達到98%。因此從另一個方面驗證了兩種推薦算法的可靠性,對應(yīng)關(guān)系如表6所示。
4?以關(guān)聯(lián)推薦算法指導卷煙品牌精準培育的方法探析
文章探索了兩種關(guān)聯(lián)推薦算法在卷煙品牌精準培育上的指導路徑,結(jié)果驗證均可行。無論是協(xié)同過濾模型還是K-means聚類模型都可以基于產(chǎn)品指標數(shù)據(jù)算出產(chǎn)品之間的相似性,從而指導關(guān)聯(lián)推薦的營銷策略組合選擇,如可以基于產(chǎn)品相似度指數(shù)給出以老帶新的模版化的陳列組合方式選擇。
卷煙企業(yè)想要基于關(guān)聯(lián)推薦算法實施卷煙品牌精準培育,可以將兩種推薦算法并入一套程序,先后輸出聚類結(jié)果和基于物品的協(xié)同推薦,采用云數(shù)據(jù)庫協(xié)同更新,幫助煙草專賣局統(tǒng)一獲取和更新原煙草產(chǎn)品特性矩陣,包括增減煙草產(chǎn)品、修改特性值、增加其余客觀指標以幫助更好地分析產(chǎn)品相關(guān)性。經(jīng)銷商也可以通過程序錄入新產(chǎn)品的主觀指標反饋,從而更好地擴充修正原產(chǎn)品評價矩陣內(nèi)的數(shù)據(jù)內(nèi)容,實現(xiàn)系統(tǒng)迭代更新。
參考文獻:
[1]鄭陽洋.基于大數(shù)據(jù)時代的卷煙精準營銷模式研究[J].財經(jīng)界,2021(30):49-50.
[2]唐明翔.?深化“數(shù)據(jù)營銷”?探索“科學管理之路”——卷煙品牌精準培育體系構(gòu)建[C]//廣西壯族自治區(qū)煙草公司柳州市公司.廣西壯族自治區(qū)煙草公司柳州市公司2020年學術(shù)論文匯編,2020:208-214.
[3]王雄峰.?衡陽市煙草公司省外卷煙品牌培育研究[D].衡陽:南華大學,2020.
[4]羅登山.解析GB?5606.4-2005《卷煙感官技術(shù)要求》[J].煙草科技,2005(9):47-48.
[5]徐翔宇,劉建明.基于多層次項目相似度的協(xié)同過濾推薦算法[J].計算機科學,2016,43(10):262-265,291.
[6]韓琮師.?K-means聚類算法優(yōu)化及其在電商平臺精準營銷中的應(yīng)用研究[D].青島:山東科技大學,2020.
[7]梁子敬,賀帥,李洋,等.煙草品牌培育的現(xiàn)狀及對策研究[J].品牌與標準化,2021(5):14-15.
[8]馬駿珍.?基于數(shù)據(jù)挖掘的卷煙品牌培育“三找”新方法實踐與探索[C]//中國煙草學會.中國煙草2013年學術(shù)年會論文集,2013:324-328.