譚凱波 周靜
摘 要:隨著社會(huì)的不斷發(fā)展,化妝品成為現(xiàn)代女性不可或缺的必需品,掌握顧客消費(fèi)習(xí)慣,是提升銷(xiāo)售策略的重要方法和手段?;诖耍疚膶?duì)關(guān)聯(lián)規(guī)則算法(Apriori)算法的相關(guān)定義及其原理進(jìn)行了剖析,并以某網(wǎng)店交易數(shù)據(jù)為例,利用關(guān)聯(lián)規(guī)則算法(Apriori)分析了各種化妝品之間的強(qiáng)關(guān)聯(lián)關(guān)系,為化妝品銷(xiāo)售提供了決策參考。
關(guān)鍵詞:化妝品;Apriori算法;關(guān)聯(lián)規(guī)則;消費(fèi)習(xí)慣
1 引言
近年來(lái),隨著生活物質(zhì)水平的不斷提高,人們對(duì)生活的追求越來(lái)越高,尤其在當(dāng)代很多女性為追求時(shí)代潮流開(kāi)始頻繁的使用化妝品。線上線下的化妝品店的出現(xiàn),生成了大量的銷(xiāo)售交易數(shù)據(jù)。對(duì)這些數(shù)據(jù)進(jìn)行了解分析,可以找尋其中的強(qiáng)關(guān)聯(lián)關(guān)系,進(jìn)而掌握顧客消費(fèi)習(xí)慣,提升銷(xiāo)售策略。
2 關(guān)聯(lián)規(guī)則與Apriori算法
關(guān)聯(lián)規(guī)則分析算法(Apriori)的主要功能是挖掘所有支持度和置信度分別大于等于預(yù)定的最小支持度(Min-Support)和最小可信度(Min-Confidence)的關(guān)聯(lián)關(guān)系。從而描述了一個(gè)事物中某些屬性同時(shí)出現(xiàn)的規(guī)律和模式。
2.1 相關(guān)定義
關(guān)聯(lián)規(guī)則分析算法(Apriori)又稱為關(guān)聯(lián)規(guī)則學(xué)習(xí),是指在大規(guī)模數(shù)據(jù)集中尋找數(shù)據(jù)之間的關(guān)聯(lián)規(guī)則。相關(guān)定義說(shuō)明如下:
(1)項(xiàng)集
包含事物的集合稱為項(xiàng)集,包含k個(gè)項(xiàng)的項(xiàng)集稱為k-項(xiàng)集。
(2)支持度與置信度
支持度和置信度是用來(lái)量化關(guān)聯(lián)分析是否成功的兩個(gè)指標(biāo)。支持度是數(shù)據(jù)集中某項(xiàng)記錄所占的比例。置信度是針對(duì)一條具體的關(guān)聯(lián)規(guī)則來(lái)定義的,表示包含A事務(wù)中同時(shí)包含B事務(wù)的比例,即同時(shí)包含A和B的事務(wù)占包含A事務(wù)的比例[1]。其計(jì)算公式分別為:
(3)頻繁項(xiàng)集
頻繁項(xiàng)集是經(jīng)常出現(xiàn)在一起的事物的集合,只要某個(gè)項(xiàng)集的支持度大于給定的閾值,那么該項(xiàng)集稱作頻繁項(xiàng)集。
(4)關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是表示兩種物品之間存在的聯(lián)系,大于或等于最小支持度閾值和最小置信度閾值的規(guī)則叫做強(qiáng)關(guān)聯(lián)規(guī)則。找出強(qiáng)關(guān)聯(lián)規(guī)則是關(guān)聯(lián)分析的最終目標(biāo)。
2.2 Apriori算法原理
Agrawal在1993年設(shè)計(jì)了一個(gè)基本Apriori算法并提出了挖掘關(guān)聯(lián)規(guī)則的一個(gè)重要的基于兩階段頻集思想的方法,這是最典型的層次算法,是布爾關(guān)聯(lián)規(guī)則挖掘算法中最成功的一類(lèi)算法。其核心技術(shù)為其它各類(lèi)布爾關(guān)聯(lián)規(guī)則挖掘算法所廣泛采用[2]。
Apriori算法是將關(guān)聯(lián)規(guī)則挖掘算法的設(shè)計(jì)分解為兩個(gè)子問(wèn)題:
①所有支持度大于所設(shè)定最小支持度的項(xiàng)集(Itemset) , 這些項(xiàng)集被稱為頻集(Frequent Itemset) 。
②使用第1步找到的頻集產(chǎn)生期望的規(guī)則。Apriori算法是一種寬度優(yōu)先算法, 通過(guò)對(duì)數(shù)據(jù)庫(kù)D的多次掃描來(lái)發(fā)現(xiàn)所有的頻繁項(xiàng)目集。在每一次掃描中只考慮具有同一長(zhǎng)度k (即項(xiàng)目集中所含項(xiàng)目的個(gè)數(shù))的所有項(xiàng)目集。
在第1次掃描中Apriori算法計(jì)算D中所有單個(gè)項(xiàng)目的支持度,生成所有長(zhǎng)度為1的頻繁項(xiàng)目集L1。在后續(xù)掃描的第k次中,首先以前一次掃描中所發(fā)現(xiàn)的所有頻繁項(xiàng)目集為基礎(chǔ),生成所有新的候選項(xiàng)目集(Candidate Itemsets)即潛在的頻繁項(xiàng)目集,然后掃描數(shù)據(jù)庫(kù)D,計(jì)算這些候選項(xiàng)目集的支持度,最后確定候選項(xiàng)目集中哪一些真正成為頻繁項(xiàng)目集Ck。如此循環(huán)下去,一直重復(fù)上述過(guò)程直到再也發(fā)現(xiàn)不了新的頻繁項(xiàng)目集[3]。Apriori的具體計(jì)算過(guò)程如下:
①在數(shù)據(jù)庫(kù)集D中掃描所有記錄,找出頻繁1項(xiàng)集的集合,記作L1
②其次在L1中找出頻繁2項(xiàng)集的集合,記作L2
③在L2中找出頻繁3項(xiàng)集的集合,記作L3
④如此下去,直到不能找到頻繁k-項(xiàng)集。
3 實(shí)例分析
隨著人們生活水平的提高,女性對(duì)化妝品的選購(gòu)?fù)ǖ啦粌H僅只在實(shí)體店中購(gòu)買(mǎi)還可以利用網(wǎng)上購(gòu)物,網(wǎng)絡(luò)化妝品經(jīng)銷(xiāo)商對(duì)于銷(xiāo)售產(chǎn)品的越來(lái)越受到關(guān)注。利用網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行關(guān)聯(lián)規(guī)則分析,可以掌握女性顧客關(guān)于化妝品的消費(fèi)習(xí)慣,從而提升銷(xiāo)售策略。
3.1 化妝品數(shù)據(jù)收集
本文從淘寶網(wǎng)站上獲取國(guó)內(nèi)某知名品牌化妝品的用戶購(gòu)買(mǎi)清單,經(jīng)過(guò)隨機(jī)抽樣選取十條交易記錄作為分析對(duì)象。其交易數(shù)據(jù)如下表1所示
表1中,TID是一個(gè)唯一的標(biāo)識(shí),數(shù)據(jù)庫(kù)中的每一條交易記錄稱為一筆事務(wù)。每條交易記錄對(duì)應(yīng)的商品顯示為“1”表示這筆交易購(gòu)買(mǎi)了該商品,否則顯示為0。如表1中所示,在TID等于1的事務(wù)中,顧客購(gòu)買(mǎi)了精華露、清瑩露和精華霜。
3.2 基于Apriori算法的挖掘過(guò)程
下面用實(shí)例展示利用Apriori算法對(duì)交易數(shù)據(jù)進(jìn)行挖掘,從而發(fā)現(xiàn)關(guān)聯(lián)規(guī)則的過(guò)程。定義數(shù)據(jù)集{D}={精華露,清瑩露,洗面乳,隔離乳,精華霜,化妝水},設(shè)置最小支持度minsup=0.4,設(shè)置最小置信度minconf=0.9,由Apriori算法在數(shù)據(jù)集{D}中確定的頻繁1-項(xiàng)集如下表2所示:
同理可得,根據(jù)表2中的頻繁1-項(xiàng)集,尋找滿足最小支持度(minsup)要求的頻繁2-項(xiàng)集、頻繁3-項(xiàng)集,將沒(méi)有達(dá)到最小支持度的舍去,其結(jié)果分別如表3、表4所示。
基于頻繁3-項(xiàng)集,生成的候選4-項(xiàng)集為空集,則頻繁4-項(xiàng)集為空,算法停止。
3.3 關(guān)聯(lián)規(guī)則結(jié)果
由表4可知,l1, l2, l5滿足最小支持度(minsup=0.4)的要求,關(guān)聯(lián)關(guān)系存在。故剔除其余指標(biāo),只保留l1和l2, l5間的相互影響關(guān)系。篩選出最小支持度α=0.4的關(guān)聯(lián)規(guī)則,然后設(shè)置最小置信度為0.9,確定強(qiáng)關(guān)聯(lián)規(guī)則。各指標(biāo)間的關(guān)聯(lián)規(guī)則如表5所示。
從表5中可以發(fā)現(xiàn)有3組關(guān)聯(lián)規(guī)則置信度均為100%,符合最小置信度(minconf=0.9)的要求,分別為:{ l1(精華露), l2(清瑩露), l5(精華霜)},{ l1(精華露), l5(精華霜)},{ l2(清瑩露), l5(精華霜)}
4 結(jié)果討論分析
從以上強(qiáng)關(guān)聯(lián)規(guī)則中可以初步的得出簡(jiǎn)略結(jié)論。
①首先從規(guī)則l1∩l2=>l5可以得出,顧客只要選購(gòu)了精華露和清瑩露的就一定會(huì)夠購(gòu)買(mǎi)精華霜。
②然后,從規(guī)則l1=>l5可以得出,顧客選購(gòu)了精華露的就一定會(huì)選購(gòu)精華霜。
③其次,從規(guī)則l2=>l5可以得出,顧客選購(gòu)了清瑩露的就一定會(huì)選購(gòu)精華霜。
根據(jù)以上的關(guān)聯(lián)規(guī)則,可以運(yùn)用到具體銷(xiāo)售實(shí)踐當(dāng)中去,以便掌握顧客消費(fèi)習(xí)慣,提升銷(xiāo)售策略。例如,為提升該店的銷(xiāo)售額,可以針對(duì)分析中關(guān)聯(lián)性很強(qiáng)的商品,如將精華露、清瑩露和精華霜進(jìn)行捆綁銷(xiāo)售。針對(duì)其它關(guān)聯(lián)性的商品,可在節(jié)假日實(shí)行促銷(xiāo)等活動(dòng)。
5 結(jié)語(yǔ)
本文對(duì)淘寶某化妝品網(wǎng)店的交易數(shù)據(jù)進(jìn)行簡(jiǎn)單的隨機(jī)抽取,抽取的樣本為10個(gè),如果抽取的樣本更大,數(shù)據(jù)更多,分析的結(jié)果也就更加的精準(zhǔn)。不僅僅在化妝品商中,甚至在整個(gè)商業(yè)行中,如果能夠?qū)⑦@種關(guān)聯(lián)規(guī)則與Apriori算法有效的運(yùn)用在線上線下的銷(xiāo)售中,通過(guò)消費(fèi)者的交易數(shù)據(jù),挖掘出顧客購(gòu)買(mǎi)商品之間的強(qiáng)關(guān)聯(lián)規(guī)則,了解消費(fèi)者在購(gòu)買(mǎi)商品過(guò)程中的行為習(xí)慣,可為商家的管理層在制定相應(yīng)的營(yíng)銷(xiāo)策略時(shí)提供參考和依據(jù),在提升交易額的同時(shí),也可以使經(jīng)銷(xiāo)商改善服務(wù)質(zhì)量,真正實(shí)現(xiàn)“顧客就是上帝”的經(jīng)營(yíng)理念。
參考文獻(xiàn):
[1]Python數(shù)據(jù)分析與挖掘?qū)崙?zhàn)[M],機(jī)械工業(yè)出版社,張良均, 2019.
[2]肖勁松,林子禹,毛超.關(guān)聯(lián)規(guī)則在零售商業(yè)的應(yīng)用[J], 計(jì)算機(jī)工程, 2004, 30 (3) :189-190.
[3]王方華, 陳潔.數(shù)據(jù)庫(kù)營(yíng)銷(xiāo)[M].上海:上海交通大學(xué)出版社, 2006.