李金海,何有世,張 鵬
1.泰州學(xué)院 計(jì)算機(jī)科學(xué)與技術(shù)學(xué)院,江蘇 泰州225300
2.江蘇大學(xué) 管理學(xué)院,江蘇 鎮(zhèn)江212013
3.泰州學(xué)院 經(jīng)濟(jì)與管理學(xué)院,江蘇 泰州225300
自2010年3月4日美團(tuán)出現(xiàn)以來(lái),我國(guó)的團(tuán)購(gòu)行業(yè)已經(jīng)經(jīng)歷了10個(gè)年頭。這10年里,團(tuán)購(gòu)經(jīng)歷了一系列過(guò)山車式的發(fā)展。團(tuán)購(gòu)作為一種新興的電子商務(wù)模式,主要通過(guò)如下三種形式提高用戶與商家的議價(jià)能力,包括,消費(fèi)者自行組團(tuán)、商家組織團(tuán)購(gòu)、專業(yè)團(tuán)購(gòu)網(wǎng)站的形式,根據(jù)薄利多銷的原理,商家可以給出低于零售價(jià)格的團(tuán)購(gòu)折扣。
目前,由于商家進(jìn)入團(tuán)購(gòu)平臺(tái)的限制并不高,導(dǎo)致各團(tuán)購(gòu)平臺(tái)的產(chǎn)品數(shù)量都較多,同一產(chǎn)品可能在多個(gè)團(tuán)購(gòu)平臺(tái)同時(shí)存在,而且可能存在不同的團(tuán)購(gòu)方案。這不僅給平臺(tái)的收益帶來(lái)了影響,也使消費(fèi)者需要花費(fèi)更多的時(shí)間去發(fā)現(xiàn)滿意的團(tuán)購(gòu)產(chǎn)品。面對(duì)越來(lái)越激烈的競(jìng)爭(zhēng)環(huán)境,團(tuán)購(gòu)平臺(tái)面臨著諸多的挑戰(zhàn),主要的問(wèn)題就是:團(tuán)購(gòu)平臺(tái)如何提升團(tuán)購(gòu)用戶的個(gè)性化服務(wù);以及如何利用消費(fèi)者的社會(huì)影響力增加收益。團(tuán)購(gòu)?fù)扑]通過(guò)分析個(gè)人偏好、情境敏感性及社會(huì)影響力發(fā)現(xiàn)對(duì)產(chǎn)品感興趣及情境適宜的一群消費(fèi)者去完成團(tuán)購(gòu)交易。
傳統(tǒng)的推薦系統(tǒng)是向個(gè)體用戶提供個(gè)性化推薦。但是團(tuán)購(gòu)?fù)扑]中的產(chǎn)品并不是推薦給個(gè)人而是一個(gè)群體[1]。這就使得推薦系統(tǒng)的相關(guān)研究需要解決群體的推薦,盡量滿足所有群體人員的偏好[2]。一般情況下,團(tuán)購(gòu)?fù)扑]只是利用群體人員偏好的簡(jiǎn)單聚合產(chǎn)生推薦結(jié)果,導(dǎo)致部分成員的偏好,特別是那些不活躍成員的偏好被忽視了。
因此,國(guó)內(nèi)外學(xué)者在傳統(tǒng)推薦模式的基礎(chǔ)上,提出了一些改進(jìn)的方案[3-4]。如,國(guó)外學(xué)者在提高群體推薦質(zhì)量的同時(shí),兼顧滿足個(gè)體的個(gè)性化需求[5]。國(guó)內(nèi)學(xué)者結(jié)合云模型和改進(jìn)均方差的協(xié)同過(guò)濾推薦方法,為團(tuán)購(gòu)網(wǎng)站的用戶提供個(gè)性化推薦[6]。但團(tuán)購(gòu)?fù)扑]機(jī)制設(shè)計(jì)方面的相關(guān)研究仍鳳毛麟角。
消費(fèi)者一般傾向于選擇具有相似興趣或頻繁交互的群體一起購(gòu)買團(tuán)購(gòu)產(chǎn)品,隨著微信、微博等網(wǎng)絡(luò)社交軟件以及移動(dòng)終端的不斷普及,社會(huì)交往互動(dòng)聯(lián)系更加頻繁,以“拼多多”為代表的社交團(tuán)購(gòu)的銷售模式也應(yīng)運(yùn)而生[7]。而且,由于社會(huì)影響力的作用,個(gè)體消費(fèi)者的消費(fèi)行為也可能被群體所影響[8]。團(tuán)購(gòu)商家通過(guò)找到與目標(biāo)消費(fèi)者具有同樣購(gòu)買興趣的合適消費(fèi)者群體,能夠增加產(chǎn)品的銷售量。因此,針對(duì)潛在消費(fèi)者挖掘合適的群體是增加其購(gòu)買意愿的有效途徑。針對(duì)目標(biāo)消費(fèi)者通過(guò)提供群體名單,利用群體成員的社會(huì)影響力可以增強(qiáng)其購(gòu)買團(tuán)購(gòu)產(chǎn)品的意愿。
(1)用戶偏好分析
用戶偏好模型是團(tuán)購(gòu)?fù)扑]以及個(gè)性化服務(wù)中的關(guān)鍵因素,用戶偏好包含經(jīng)長(zhǎng)期演化形成的長(zhǎng)期偏好以及基于情境形成的短期偏好[9]。有研究結(jié)合社會(huì)網(wǎng)絡(luò)分析以及語(yǔ)義分析改進(jìn)推薦的效果[10]?;诒倔w的建模方法是一種用于處理用戶偏好的有效方法[11]。本研究采用本體模型評(píng)估用戶偏好與產(chǎn)品之間的相似性。而且本體被認(rèn)為是對(duì)情境語(yǔ)義進(jìn)行建模的最有效工具,情境信息可以通過(guò)領(lǐng)域本體構(gòu)建情境本體,使情境現(xiàn)實(shí)中的實(shí)體被形式化,映射為機(jī)器可理解、可共享的知識(shí)結(jié)構(gòu),用于情境語(yǔ)義的推理[12]。
(2)情境語(yǔ)義推理
大多數(shù)推薦系統(tǒng)在形成推薦時(shí),只考慮了用戶與產(chǎn)品信息,忽略了情境信息,如位置、天氣、時(shí)間等[13]。團(tuán)購(gòu)?fù)扑]不同于一般的推薦系統(tǒng),它實(shí)現(xiàn)了線上信息與線下信息的融合,對(duì)情境信息特別敏感[14]。目前,學(xué)術(shù)界關(guān)于融合情境信息的推薦系統(tǒng)研究主要三種不同的范式:①情境預(yù)先過(guò)濾。基于特殊的情境首先選擇數(shù)據(jù)或創(chuàng)建數(shù)據(jù),之后的推薦基于傳統(tǒng)的推薦系統(tǒng)。②情境后期過(guò)濾。首先基于整體數(shù)據(jù)利用傳統(tǒng)推薦產(chǎn)生推薦結(jié)果,然后為每個(gè)用戶基于情境信息調(diào)整推薦結(jié)果。③情境建模。情境信息被直接應(yīng)用于模型處理工程中。本研究基于本體技術(shù)設(shè)計(jì)情境語(yǔ)義推理模型。
隨著移動(dòng)智能終端的激增,為移動(dòng)團(tuán)購(gòu)平臺(tái)提供了更多的商機(jī),獲取用戶的情境信息可以實(shí)現(xiàn)及時(shí)速遞、個(gè)性化服務(wù)等[15]。其中,位置信息在團(tuán)購(gòu)?fù)扑]的情境中起到重要作用[16]。本研究將在團(tuán)購(gòu)?fù)扑]機(jī)制中考慮情境信息,主要測(cè)量消費(fèi)者與團(tuán)購(gòu)實(shí)體店的地理便利性、天氣狀況以及時(shí)間因素對(duì)消費(fèi)者選擇的影響。
(3)社會(huì)心理學(xué)理論
相關(guān)研究表明,用戶參與團(tuán)購(gòu)的動(dòng)機(jī),除了與折扣有關(guān)外,羊群效應(yīng)也起到相當(dāng)大的影響[17],團(tuán)購(gòu)網(wǎng)站會(huì)將已加入團(tuán)購(gòu)的用戶信息推送給消費(fèi)者,使他們受到群體的影響或壓力,個(gè)人的購(gòu)買決定可能會(huì)受到群體的影響,形成從眾效應(yīng)。
諸多研究表明,社會(huì)影響在團(tuán)購(gòu)?fù)扑]中扮演了重要的角色[18]。當(dāng)消費(fèi)者適應(yīng)群體成員的行為或態(tài)度時(shí),社會(huì)影響會(huì)產(chǎn)生作用。在團(tuán)購(gòu)?fù)扑]中,群體成員間并不需要面對(duì)面的交流,只需了解群體成員的相關(guān)信息就可以發(fā)揮社會(huì)影響的作用。
本研究將通過(guò)提供具有高聚合的群體成員組成的團(tuán)購(gòu)名單產(chǎn)生的社會(huì)影響力來(lái)增加消費(fèi)者團(tuán)購(gòu)的意愿。
(4)團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò)構(gòu)建
團(tuán)購(gòu)網(wǎng)絡(luò)的成員可以看作以特定方式相聯(lián)系的一種網(wǎng)絡(luò)拓?fù)湫螒B(tài),是一種特殊的復(fù)雜網(wǎng)絡(luò),因此,引入復(fù)雜網(wǎng)絡(luò)思想劃分團(tuán)購(gòu)社區(qū)(群體)以及計(jì)算聚合度[19]。將團(tuán)購(gòu)網(wǎng)絡(luò)中的每個(gè)成員設(shè)定為復(fù)雜網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),將成員間的相互關(guān)系表示為節(jié)點(diǎn)的鏈接,構(gòu)建團(tuán)購(gòu)用戶組成的復(fù)雜網(wǎng)絡(luò)。團(tuán)購(gòu)?fù)扑]不同于傳統(tǒng)推薦,不能片面地看待團(tuán)購(gòu)網(wǎng)絡(luò)中各用戶的購(gòu)買意愿,需要結(jié)合用戶節(jié)點(diǎn)內(nèi)容之間的語(yǔ)義關(guān)聯(lián),基于團(tuán)購(gòu)網(wǎng)絡(luò)全局識(shí)別對(duì)指定產(chǎn)品具有綜合購(gòu)買意愿的社區(qū)。本研究以網(wǎng)絡(luò)化的視角來(lái)描述團(tuán)購(gòu)成員之間的關(guān)聯(lián),提出基于復(fù)雜網(wǎng)絡(luò)的團(tuán)購(gòu)?fù)扑]方法。
團(tuán)購(gòu)平臺(tái)主要存在著兩種待推薦的產(chǎn)品:?jiǎn)稳速?gòu)買多人消費(fèi)類產(chǎn)品、多人購(gòu)買多人消費(fèi)類產(chǎn)品。
本研究將單人購(gòu)買多人消費(fèi)類產(chǎn)品定義為產(chǎn)品類型A:是指那些價(jià)格不是太貴,只需要一個(gè)人購(gòu)買,但允許多人一起消費(fèi)的產(chǎn)品。如“多人用餐券”。針對(duì)這種類型的產(chǎn)品,團(tuán)購(gòu)?fù)扑]機(jī)制就是要挖掘最愿意購(gòu)買產(chǎn)品A的消費(fèi)者。
本研究將多人購(gòu)買多人消費(fèi)類產(chǎn)品定義為產(chǎn)品類型B:是指那些價(jià)格較貴,同時(shí)有最少團(tuán)購(gòu)參與人數(shù)的限制,每個(gè)團(tuán)體人員只需要支付自己的相應(yīng)費(fèi)用。如“旅游團(tuán)購(gòu)券”。針對(duì)這種類型的產(chǎn)品,團(tuán)購(gòu)?fù)扑]機(jī)制就需要利用團(tuán)體中具有較強(qiáng)社會(huì)影響力成員的作用,來(lái)增加社區(qū)內(nèi)其他成員購(gòu)買的意愿。
在團(tuán)購(gòu)?fù)扑]機(jī)制的設(shè)計(jì)過(guò)程中,要綜合考慮用戶偏好與產(chǎn)品特征的相似性、消費(fèi)者的情境便利性、團(tuán)體成員的社會(huì)影響力?;诖耍O(shè)計(jì)團(tuán)購(gòu)?fù)扑]系統(tǒng)的各模塊功能:
(1)基于情境語(yǔ)義推理的偏好分析模塊
該模塊的作用在于通過(guò)對(duì)比分析用戶偏好與產(chǎn)品特征的相似性,找出對(duì)目標(biāo)產(chǎn)品感興趣的潛在消費(fèi)者;然后通過(guò)收集用戶的情境信息基于情境語(yǔ)義推理劃分出那些在地里便利性以及其他情境相似的消費(fèi)者社區(qū)。
(2)基于復(fù)雜網(wǎng)絡(luò)的社會(huì)影響分析模塊
該模塊用于劃分團(tuán)購(gòu)社區(qū),以及評(píng)測(cè)社區(qū)中成員對(duì)產(chǎn)品的評(píng)價(jià)對(duì)于其他成員的影響。消費(fèi)者更容易受到那些對(duì)產(chǎn)品評(píng)價(jià)相似以及更信任的社區(qū)成員的影響。
團(tuán)購(gòu)?fù)扑]系統(tǒng)的總體框架如圖1所示。
圖1 團(tuán)購(gòu)?fù)扑]系統(tǒng)的總體框架Fig.1 Overall framework of group recommendation system
在計(jì)算用戶與產(chǎn)品的相似性前,首先需要構(gòu)建基于本體的用戶偏好模型。以消費(fèi)者的歷史消費(fèi)行為構(gòu)建用戶偏好本體,并利用本體的層次化結(jié)構(gòu),將每一個(gè)產(chǎn)品按照屬性進(jìn)行層次劃分,構(gòu)建產(chǎn)品屬性本體。要實(shí)現(xiàn)團(tuán)購(gòu)?fù)扑],就必須依據(jù)用戶偏好本體中蘊(yùn)含的情境語(yǔ)義,找出情境與用戶興趣的關(guān)聯(lián)性,進(jìn)而根據(jù)用戶的當(dāng)前情境,推導(dǎo)出用戶感興趣的產(chǎn)品。
系統(tǒng)將針對(duì)每個(gè)團(tuán)購(gòu)用戶生成一套其專屬的推薦規(guī)則集,以實(shí)現(xiàn)對(duì)團(tuán)購(gòu)的推薦[20]。由情境語(yǔ)義推理機(jī)將用戶的當(dāng)前情境與用戶推薦規(guī)則進(jìn)行匹配,通過(guò)推薦規(guī)則集預(yù)測(cè)用戶在當(dāng)前情境下偏好的產(chǎn)品屬性,將生產(chǎn)的產(chǎn)品屬性與產(chǎn)品屬性本體進(jìn)行比較,通過(guò)Jaccard算法計(jì)算用戶i偏好與產(chǎn)品c的相似性JAic?;谇榫痴Z(yǔ)義推理的相似性計(jì)算流程如圖2所示。
圖2 基于情境語(yǔ)義推理的相似性計(jì)算流程Fig.2 Similarity calculation process based on contextual semantics reasoning
其中,通過(guò)語(yǔ)義分析,將用戶偏好本體分解為產(chǎn)品屬性概念集與情境屬性概念集兩部分;借鑒關(guān)聯(lián)規(guī)則挖掘技術(shù)的思想,挖掘產(chǎn)品屬性概念集與情境屬性概念集之間的頻繁關(guān)聯(lián)模式。
在上述的相似性計(jì)算過(guò)程中,基于用戶偏好本體產(chǎn)生團(tuán)購(gòu)?fù)扑]規(guī)則是實(shí)現(xiàn)團(tuán)購(gòu)?fù)扑]的關(guān)鍵。團(tuán)購(gòu)?fù)扑]規(guī)則生成的具體過(guò)程如下:
假定用戶i的用戶偏好本體實(shí)例集為POS。首先從POS里的每一個(gè)用戶偏好實(shí)例po中,抽取兩個(gè)概念集:PNS和CNS,PNS包含產(chǎn)品屬性實(shí)例概念,CNS包含情境屬性實(shí)例概念。從用戶偏好本體實(shí)例中抽取的部分PNS和CNS概念集如表1所示,其中,括號(hào)中為實(shí)例概念所屬的概念類。在情境屬性概念集CNS中共抽取三類情景屬性,包括:地理(Location)、天氣(Weather)以及時(shí)間(Time)。為了保證Apriori關(guān)聯(lián)規(guī)則挖掘算法的適用性,對(duì)三類情景屬性的具體指標(biāo)進(jìn)行統(tǒng)一定義,其中,地理(Location)指標(biāo)包括,市中心、郊區(qū);天氣(Weather)指標(biāo)包括,晴天、多云、陰天、雨天、雪天;時(shí)間(Time)指標(biāo)包括,白天、晚上、工作日、周末。
表1 部分產(chǎn)品屬性概念集PNS與情境屬性概念集CNSTable 1 Part of product attribute concept set PNS and context attribute concept set CNS
從某個(gè)用戶偏好實(shí)例po中抽取的概念是彼此關(guān)聯(lián)的,利用Apriori關(guān)聯(lián)規(guī)則挖掘算法可以從POS抽取的所有概念集中歸納出頻繁概念關(guān)聯(lián)模式。
本文基于Python數(shù)據(jù)分析技術(shù)進(jìn)行Apriori關(guān)聯(lián)規(guī)則挖掘算法的實(shí)現(xiàn),Python的第三方庫(kù)mlxtend庫(kù)中集成了Apriori關(guān)聯(lián)規(guī)則挖掘算法,通過(guò)以下命令導(dǎo)入Apriori算法:
Apriori算法共四個(gè)參數(shù),將從用戶偏好本體實(shí)例中抽取的PNS和CNS概念集賦值給數(shù)據(jù)集參數(shù)df=(PNS+CNS),設(shè)定頻繁項(xiàng)集最小支持度min_support=0.6,設(shè)定顯示項(xiàng)目列名use_colnames=True,設(shè)定不限制最大項(xiàng)目組合數(shù)max_len=None。
通過(guò)Apriori關(guān)聯(lián)規(guī)則挖掘算法的運(yùn)行,可以得到頻繁項(xiàng)集最小支持度大于0.6的頻繁項(xiàng)集。對(duì)于每一個(gè)頻繁項(xiàng)集(頻繁概念關(guān)聯(lián)模式),將屬于CNS的情境屬性概念視為前提,PNS中的產(chǎn)品屬性概念視為結(jié)果,相關(guān)聯(lián)的CNS和PNS生成推薦規(guī)則。
部分頻繁概念關(guān)聯(lián)模式及其對(duì)應(yīng)推薦規(guī)則的實(shí)例如表2所示。
表2 部分頻繁概念關(guān)聯(lián)模式及其對(duì)應(yīng)推薦規(guī)則Table 2 Part of frequent concept association patterns and corresponding recommended rules
團(tuán)購(gòu)平臺(tái)中的每個(gè)成員設(shè)定為復(fù)雜網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn),節(jié)點(diǎn)的鏈接由成員間的相互關(guān)系表示,構(gòu)建團(tuán)購(gòu)用戶的復(fù)雜網(wǎng)絡(luò)G=(V,E)。G為無(wú)向加權(quán)圖,V={v1,v2,…,vn}是復(fù)雜網(wǎng)絡(luò)中的n個(gè)節(jié)點(diǎn),即n個(gè)團(tuán)購(gòu)成員集合,E是vi與vj組成的邊的集合,通過(guò)節(jié)點(diǎn)之間的相似性wij確定邊(vi,vj),wij是用戶i與用戶j的偏好相似度。若用戶i與j的用戶偏好本體經(jīng)語(yǔ)義分析后得到的產(chǎn)品屬性概念集為PAi與PAj,則用戶i與j的偏好相似度wij為:
上述只是計(jì)算了用戶i與j的偏好相似性,為了完成團(tuán)購(gòu)?fù)扑],還需要計(jì)算用戶所處社區(qū)對(duì)其的全局社會(huì)影響力。用戶與社區(qū)成員的相似性越大,那么該成員對(duì)其的團(tuán)購(gòu)購(gòu)買影響力越大。如果相似性較大的成員購(gòu)買某產(chǎn)品的可能性較大,那么該用戶也很有可能購(gòu)買此產(chǎn)品。所以,用戶團(tuán)購(gòu)某產(chǎn)品的意愿受社會(huì)影響的大小應(yīng)該由全部社區(qū)成員對(duì)其的影響綜合決定。若社區(qū)成員為F個(gè),則用戶i團(tuán)購(gòu)產(chǎn)品c的意愿受社會(huì)影響的大小SIiC定義為:
基于用戶i偏好與產(chǎn)品c的相似性JAic以及用戶i團(tuán)購(gòu)產(chǎn)品c的意愿受社會(huì)影響的大小SIiC綜合得到用戶i團(tuán)購(gòu)產(chǎn)品c的意愿得分GWic。考慮到每個(gè)用戶受偏好相似性及社會(huì)影響的程度是不同的,基于社會(huì)心理學(xué)理論中的從眾效應(yīng),社區(qū)成員數(shù)F越大,用戶所受到社會(huì)的影響或壓力也隨之增加。因此,本文以平均社區(qū)成員數(shù)M為權(quán)重基準(zhǔn),設(shè)定當(dāng)社區(qū)成員數(shù)F>M時(shí),社會(huì)影響的權(quán)重增大,當(dāng)社區(qū)成員數(shù)F 針對(duì)團(tuán)購(gòu)平臺(tái)中的單人購(gòu)買多人消費(fèi)類產(chǎn)品,團(tuán)購(gòu)成員傾向于選擇具有相似用戶偏好的其他成員一起去消費(fèi),因此,為潛在團(tuán)購(gòu)消費(fèi)者發(fā)掘合適社區(qū)成員是加強(qiáng)其購(gòu)買意愿的主要途徑。針對(duì)產(chǎn)品類型A,團(tuán)購(gòu)?fù)扑]機(jī)制在于發(fā)掘具有較高購(gòu)買意愿的消費(fèi)者,以及從他的朋友中甄別同樣具有較高購(gòu)買意愿的其他成員。通過(guò)比較每個(gè)社區(qū)的聚合度,可以發(fā)現(xiàn)具有最高聚合度的社區(qū),并將這個(gè)社區(qū)中團(tuán)購(gòu)意愿得分最高的消費(fèi)者視為最優(yōu)潛在團(tuán)購(gòu)消費(fèi)者。在具體的團(tuán)購(gòu)?fù)扑]機(jī)制設(shè)計(jì)中涉及到社區(qū)的劃分及聚合度計(jì)算。 (1)社區(qū)劃分 團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò)中的“社區(qū)結(jié)構(gòu)特性”是由于成員之間存在偏好的相似性,所以團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò)會(huì)依據(jù)用戶偏好呈現(xiàn)出社區(qū)結(jié)構(gòu),并通過(guò)劃分的團(tuán)購(gòu)社區(qū)定位成員的所屬社區(qū)。 而團(tuán)購(gòu)網(wǎng)絡(luò)社區(qū)的劃分,是以具有相似特征的成員節(jié)點(diǎn)為中心,形成若干規(guī)模不等的局部用戶偏好相似度較大的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu),所形成的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)就是劃分的團(tuán)購(gòu)網(wǎng)絡(luò)社區(qū)。 團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò)中成員節(jié)點(diǎn)間除了具有偏好相似性之外,社區(qū)結(jié)構(gòu)還存在另一個(gè)特征即重疊性,指團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò)中的某些節(jié)點(diǎn)同時(shí)屬于多個(gè)社區(qū),如成員節(jié)點(diǎn)Vi同時(shí)與社區(qū)X和Y中的成員用戶偏好相似,那么節(jié)點(diǎn)Vi就被同時(shí)劃分到社區(qū)X和Y中,這樣的節(jié)點(diǎn)被稱為“騎墻節(jié)點(diǎn)”。 傳統(tǒng)的社區(qū)結(jié)構(gòu)劃分方法都是從節(jié)點(diǎn)的角度出發(fā),把網(wǎng)絡(luò)中的節(jié)點(diǎn)看作是研究對(duì)象,根據(jù)節(jié)點(diǎn)之間的相似度,把它們劃分到不同的社區(qū),這樣的處理方法很難從根本上解決“騎墻節(jié)點(diǎn)”的歸屬問(wèn)題??紤]到團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò)的重疊性,本研究采用一種能夠劃分重疊性的算法[21],該算法以邊為研究對(duì)象,依據(jù)邊之間的相似度對(duì)網(wǎng)絡(luò)進(jìn)行社區(qū)劃分,由于邊的社區(qū)歸屬性是唯一確定的,這就可以避免“騎墻節(jié)點(diǎn)”對(duì)社區(qū)劃分結(jié)果的影響。該算法核心思想是根據(jù)邊的凝聚過(guò)程得到網(wǎng)絡(luò)的層次樹(shù)結(jié)構(gòu),在合適位置對(duì)層次樹(shù)進(jìn)行切割,從而得到網(wǎng)絡(luò)的社區(qū)結(jié)構(gòu)。為了實(shí)現(xiàn)邊的凝聚過(guò)程,首先定義相鄰邊的相似度S: 其中,對(duì)于相鄰邊eik和ejk,若它們同時(shí)連接到公共節(jié)點(diǎn)k上,則稱節(jié)點(diǎn)k為基節(jié)點(diǎn),節(jié)點(diǎn)i、j稱為關(guān)聯(lián)節(jié)點(diǎn)。對(duì)于任意節(jié)點(diǎn)i,定義節(jié)點(diǎn)i的廣泛鄰居節(jié)點(diǎn)為n+(x),則: 其中,d(i,x)為節(jié)點(diǎn)i和x之間的最短路徑長(zhǎng)度。 在定義了相鄰邊的相似度S后,就可以進(jìn)行邊的凝聚。邊的凝聚流程如下所示: 步驟1進(jìn)行網(wǎng)絡(luò)社區(qū)的初始化。 步驟2將每一條邊視作一個(gè)社區(qū)。 步驟3計(jì)算相鄰社區(qū)之間邊的相似度。 步驟4合并相似度最大的兩個(gè)社區(qū)。 步驟5反復(fù)執(zhí)行凝練過(guò)程。 步驟6網(wǎng)絡(luò)凝練為一個(gè)社區(qū),算法終止。 經(jīng)過(guò)上述流程后就可以得到團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò)的層次樹(shù)結(jié)構(gòu)。 而如何從層次樹(shù)結(jié)構(gòu)中劃分需要的社區(qū),則是由目標(biāo)產(chǎn)品設(shè)定的消費(fèi)人員數(shù)目n決定,在層次樹(shù)狀圖中選擇社區(qū)成員數(shù)目a為n的位置,對(duì)其進(jìn)行切割,得到如圖3所示的社區(qū)劃分結(jié)果。與以節(jié)點(diǎn)為研究對(duì)象進(jìn)行社區(qū)劃分相比,以邊為研究對(duì)象更容易發(fā)現(xiàn)社區(qū)的重疊部分。 圖3 基于邊的團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò)社區(qū)劃分結(jié)果Fig.3 Division results of group purchase social network community based on edge (2)聚合度的計(jì)算 在計(jì)算社區(qū)的聚合度前,首先需要計(jì)算社區(qū)的網(wǎng)絡(luò)密度,網(wǎng)絡(luò)密度反映的是相鄰節(jié)點(diǎn)之間聯(lián)系的緊密程度,社區(qū)的網(wǎng)絡(luò)密度越大,說(shuō)明社區(qū)成員間聯(lián)系越緊密,一起參與團(tuán)購(gòu)的意愿越強(qiáng)烈。 經(jīng)過(guò)社區(qū)劃分后,假設(shè)社區(qū)X中包含成員節(jié)點(diǎn)V(x)個(gè),邊E(x)個(gè),則社區(qū)X的網(wǎng)絡(luò)密度為: 選擇網(wǎng)絡(luò)密度較大的社區(qū)進(jìn)行下一步聚合度的計(jì)算。聚合度分析的目的是為了從眾多的社區(qū)中找出聚合度較高的社區(qū),如果一個(gè)社區(qū)具有較高的平均鏈接強(qiáng)度,可以推測(cè)這個(gè)社區(qū)中的大部分成員具有相似的偏好,且更易受社區(qū)成員的影響。成員vi和vj間的鏈接強(qiáng)度由vi和vj的偏好相似度wij決定。 對(duì)于特定社區(qū)X,聚合度通過(guò)測(cè)量社區(qū)X中每個(gè)鏈接的鏈接強(qiáng)度聚集系數(shù)得到: 最終,具有最高聚合度的社區(qū)中團(tuán)購(gòu)意愿得分最高的成員會(huì)被當(dāng)作主要推薦對(duì)象。 在針對(duì)團(tuán)購(gòu)平臺(tái)中的單人購(gòu)買多人消費(fèi)類產(chǎn)品研究的基礎(chǔ)上,繼續(xù)研究多人購(gòu)買多人消費(fèi)類產(chǎn)品的團(tuán)購(gòu)?fù)扑]問(wèn)題。發(fā)現(xiàn)并形成具有高聚合度的社區(qū),向社區(qū)中的所有成員進(jìn)行團(tuán)購(gòu)?fù)扑],有益于整個(gè)社區(qū)的團(tuán)購(gòu)購(gòu)買意愿。為了增強(qiáng)潛在消費(fèi)者的購(gòu)買意愿,還可以將社區(qū)成員名單同時(shí)推薦給潛在消費(fèi)者。 若目標(biāo)團(tuán)購(gòu)產(chǎn)品B需要n個(gè)成員同時(shí)購(gòu)買,首先,需要確定具有較高團(tuán)購(gòu)意愿的N個(gè)潛在消費(fèi)者,然后列出所有可能的含n個(gè)成員的社區(qū),則共有CnN個(gè)潛在團(tuán)購(gòu)社區(qū)。并計(jì)算每個(gè)潛在團(tuán)購(gòu)社區(qū)的聚合度,最終,具有最高社區(qū)聚合度的前k個(gè)社區(qū)將作為團(tuán)購(gòu)社區(qū)的推薦目標(biāo),推薦的內(nèi)容包括目標(biāo)產(chǎn)品以及社區(qū)成員名單。其中,產(chǎn)品類型B的聚合度計(jì)算與產(chǎn)品類型A的聚合度計(jì)算同理,這里不再贅述。 為了評(píng)估本研究設(shè)計(jì)的團(tuán)購(gòu)?fù)扑]機(jī)制的有效性,仿真實(shí)驗(yàn)構(gòu)建了團(tuán)購(gòu)網(wǎng)絡(luò),構(gòu)建的團(tuán)購(gòu)網(wǎng)絡(luò)如圖4所示(由于網(wǎng)絡(luò)圖較大,截取其中的10個(gè)節(jié)點(diǎn)進(jìn)行展示),團(tuán)購(gòu)網(wǎng)絡(luò)的統(tǒng)計(jì)信息如表3所示。 表3 團(tuán)購(gòu)網(wǎng)絡(luò)統(tǒng)計(jì)信息Table 3 Statistics of group purchase network 圖4 團(tuán)購(gòu)網(wǎng)絡(luò)示例Fig.4 Example of group purchase network 仿真實(shí)驗(yàn)的具體步驟如下: 步驟1數(shù)據(jù)收集。利用Python的爬蟲(chóng)框架采集團(tuán)購(gòu)網(wǎng)上實(shí)驗(yàn)對(duì)象的已有團(tuán)購(gòu)消費(fèi)記錄信息,通過(guò)Python爬蟲(chóng)采集:分類-Classification、區(qū)域-Address、價(jià)格-Price、星級(jí)-Star,其中,通過(guò)標(biāo)簽類名class=“breadcrumbs”,可以獲取分類-Classification,通過(guò)標(biāo)簽類名class=“address”,可以獲取區(qū)域-Address,通過(guò)標(biāo)簽類名class=“score clear”,可以獲取價(jià)格-Price、星級(jí)-Star。 步驟2數(shù)據(jù)預(yù)處理。對(duì)原始數(shù)據(jù)進(jìn)行清理,提取實(shí)驗(yàn)數(shù)據(jù)中的情景屬性、產(chǎn)品屬性以及評(píng)價(jià)信息,其中,針對(duì)產(chǎn)品屬性以及評(píng)價(jià)信息,將分類-Classification統(tǒng)一為團(tuán)購(gòu)的標(biāo)準(zhǔn)分類,將區(qū)域-Address統(tǒng)一為市中心、郊區(qū);將價(jià)格-Price統(tǒng)一為便宜、適中、昂貴;將星級(jí)-Star統(tǒng)一為1~5。針對(duì)情景屬性,以實(shí)驗(yàn)對(duì)象的所在地為地理-Location,地理情景屬性衡量指標(biāo)統(tǒng)一為市中心、郊區(qū);消費(fèi)時(shí)間為時(shí)間-Time,時(shí)間情景屬性衡量指標(biāo)統(tǒng)一為白天、晚上、工作日、周末;并根據(jù)消費(fèi)時(shí)間推導(dǎo)出當(dāng)時(shí)的天氣-Weather,天氣情景屬性衡量指標(biāo)統(tǒng)一為晴天、多云、陰天、雨天、雪天。 步驟3團(tuán)購(gòu)產(chǎn)品的設(shè)定。設(shè)定20個(gè)虛擬的團(tuán)購(gòu)產(chǎn)品,其中,單人購(gòu)買多人消費(fèi)類產(chǎn)品A共10個(gè)、多人購(gòu)買多人消費(fèi)類產(chǎn)品B共10個(gè)。團(tuán)購(gòu)產(chǎn)品具體信息如表4所示。 表4 設(shè)定的團(tuán)購(gòu)產(chǎn)品具體信息Table 4 Specific information of group purchase product 步驟4用戶偏好本體與產(chǎn)品屬性本體的構(gòu)建。以實(shí)驗(yàn)對(duì)象的歷史消費(fèi)行為數(shù)據(jù)構(gòu)建用戶偏好本體;并利用本體的層次化結(jié)構(gòu),將20個(gè)虛擬的團(tuán)購(gòu)產(chǎn)品按照屬性進(jìn)行層次劃分,構(gòu)建產(chǎn)品屬性本體。 步驟5團(tuán)購(gòu)?fù)扑]模式歸納。基于用戶偏好本體中的產(chǎn)品屬性概念集與情境屬性概念集,利用關(guān)聯(lián)規(guī)則挖掘技術(shù),挖掘產(chǎn)品屬性概念集與情境屬性概念集之間的頻繁關(guān)聯(lián)模式,為每個(gè)實(shí)驗(yàn)對(duì)象生成一套其專屬的推薦規(guī)則集。 步驟6團(tuán)購(gòu)情景的設(shè)定。為每個(gè)實(shí)驗(yàn)對(duì)象設(shè)定10個(gè)虛擬的團(tuán)購(gòu)情景。 步驟7基于用戶偏好的產(chǎn)品購(gòu)買意愿計(jì)算。由情境語(yǔ)義推理機(jī)將實(shí)驗(yàn)對(duì)象的當(dāng)前虛擬情境與實(shí)驗(yàn)對(duì)象對(duì)應(yīng)的推薦規(guī)則進(jìn)行匹配,通過(guò)推薦規(guī)則集預(yù)測(cè)用戶在當(dāng)前虛擬情境下偏好的產(chǎn)品屬性,將生產(chǎn)的產(chǎn)品屬性與產(chǎn)品屬性本體進(jìn)行比較,通過(guò)Jaccard算法計(jì)算實(shí)驗(yàn)對(duì)象偏好與產(chǎn)品的相似性,該相似性就是實(shí)驗(yàn)對(duì)象的產(chǎn)品購(gòu)買意愿。 步驟8團(tuán)購(gòu)?fù)扑]。 產(chǎn)品類型A的團(tuán)購(gòu)?fù)扑]。首先對(duì)500名實(shí)驗(yàn)對(duì)象組成的團(tuán)購(gòu)網(wǎng)絡(luò)劃分社區(qū),然后計(jì)算每個(gè)社區(qū)的聚合度,具有最高聚合度的社區(qū)中產(chǎn)品購(gòu)買意愿得分最高的成員就是產(chǎn)品類型A的團(tuán)購(gòu)?fù)扑]對(duì)象,同時(shí)向其推薦社區(qū)成員名單。以團(tuán)購(gòu)產(chǎn)品編號(hào)2為例,設(shè)定的團(tuán)購(gòu)產(chǎn)品中產(chǎn)品2所需消費(fèi)人數(shù)最大為4人,因此,在層次樹(shù)狀圖中選擇社區(qū)成員數(shù)目a為4的位置,對(duì)其進(jìn)行社區(qū)劃分。推薦對(duì)象及社區(qū)成員名單如表5所示。 表5 推薦對(duì)象及社區(qū)成員名單示例Table 5 Example of names of recommended people and community members 步驟9團(tuán)購(gòu)?fù)扑]結(jié)果反饋。通過(guò)調(diào)查問(wèn)卷收集被推薦實(shí)驗(yàn)對(duì)象對(duì)團(tuán)購(gòu)?fù)扑]結(jié)果的反饋滿意度,同時(shí)收集他們對(duì)推薦的社區(qū)成員名單的滿意度,滿意度得分區(qū)間為[0,5],得分越高,用戶的滿意度越高。 步驟10推薦機(jī)制有效性分析。為了評(píng)估本研究的推薦機(jī)制有效性,將其與單獨(dú)考慮單一影響因素的基于情境推理的偏好分析模塊以及基于復(fù)雜網(wǎng)絡(luò)的社會(huì)影響分析模塊兩種方法的精確性進(jìn)行對(duì)比分析。評(píng)估包括兩個(gè)部分:對(duì)推薦產(chǎn)品的滿意度、對(duì)推薦社區(qū)成員名單的滿意度。將每個(gè)算法推薦信息(包括推薦產(chǎn)品以及社區(qū)成員名單)的反饋結(jié)果匯總后進(jìn)行對(duì)比分析,如表7所示。最后,對(duì)匯總表7的對(duì)比結(jié)果進(jìn)行統(tǒng)計(jì)分析,得到產(chǎn)品類型A不同推薦機(jī)制的用戶滿意度如圖5所示,得到產(chǎn)品類型B不同推薦機(jī)制的用戶滿意度如圖6所示。同時(shí),將每個(gè)算法推薦信息(只包括推薦產(chǎn)品,無(wú)社區(qū)成員名單)的反饋結(jié)果匯總后進(jìn)行對(duì)比分析,如表8所示。最后,對(duì)匯總表7與表8的對(duì)比結(jié)果進(jìn)行統(tǒng)計(jì)分析,得到有無(wú)社區(qū)成員名單的用戶滿意度如圖7所示。 表6 推薦產(chǎn)品及社區(qū)成員名單示例Table 6 Example of recommended products and community members 表8 推薦信息反饋結(jié)果匯總(無(wú)社區(qū)成員名單)Table 8 Summary of feedback results of recommendation information(Not include list of community members) 圖5 產(chǎn)品類型A不同推薦機(jī)制的用戶滿意度Fig.5 User satisfaction of product type A with different recommendation mechanisms 圖6 產(chǎn)品類型B不同推薦機(jī)制的用戶滿意度Fig.6 User satisfaction of product type B with different recommendation mechanisms 圖7 有無(wú)社區(qū)成員名單的用戶滿意度Fig.7 User satisfaction of having or having notlist of community members 表7 推薦信息反饋結(jié)果匯總(有社區(qū)成員名單)Table 7 Summary of feedback results of recommendation information(Include list of community members) 圖5、圖6顯示了對(duì)不同推薦機(jī)制的滿意度反饋結(jié)果,由圖可知,綜合情境語(yǔ)義推理以及社會(huì)影響的團(tuán)購(gòu)?fù)扑]機(jī)制具有最高的滿意度得分,傳統(tǒng)的推薦機(jī)制的滿意度得分最低。實(shí)驗(yàn)結(jié)果表明綜合情境語(yǔ)義推理以及社會(huì)影響的團(tuán)購(gòu)?fù)扑]機(jī)制較其他的推薦機(jī)制具有較高的推薦有效性。同時(shí)實(shí)驗(yàn)結(jié)果揭示了,針對(duì)產(chǎn)品類型A,用戶偏好影響較社會(huì)影響具有更重要的作用;而針對(duì)產(chǎn)品類型B,社會(huì)影響較用戶偏好影響具有更重要的作用??梢?jiàn)當(dāng)只需要向個(gè)人推薦時(shí),用戶偏好的影響更重要,當(dāng)向多人同時(shí)推薦時(shí),群體間的社會(huì)影響更重要。 圖7顯示了有無(wú)社區(qū)成員名單對(duì)不同推薦機(jī)制的滿意度反饋結(jié)果,由圖7可知,無(wú)論是哪種推薦機(jī)制,生成社區(qū)成員名單的推薦都較直接推薦產(chǎn)品具有更好的推薦滿意度。當(dāng)推薦目標(biāo)產(chǎn)品的同時(shí)推薦社區(qū)成員名單,會(huì)提升潛在團(tuán)購(gòu)成員的團(tuán)購(gòu)意愿。 本研究分別針對(duì)團(tuán)購(gòu)平臺(tái)中的兩種類型產(chǎn)品(單人購(gòu)買多人消費(fèi)類產(chǎn)品、多人購(gòu)買多人消費(fèi)類產(chǎn)品)設(shè)計(jì)了一種團(tuán)購(gòu)?fù)扑]機(jī)制,該推薦機(jī)制綜合考慮了用戶長(zhǎng)期偏好以及基于情境形成的短期偏好,并結(jié)合社會(huì)心理學(xué)理論,引入復(fù)雜網(wǎng)絡(luò)構(gòu)建團(tuán)購(gòu)社會(huì)網(wǎng)絡(luò),考慮社區(qū)成員間的社會(huì)影響力,通過(guò)計(jì)算團(tuán)購(gòu)社區(qū)的聚合度,來(lái)完成最終的團(tuán)購(gòu)?fù)扑]。對(duì)于單人購(gòu)買多人消費(fèi)類產(chǎn)品,識(shí)別具有較高團(tuán)購(gòu)意愿的潛在消費(fèi)者,并為其建議具有較高聚合度的社區(qū)成員。對(duì)于多人購(gòu)買多人消費(fèi)類產(chǎn)品,識(shí)別具有較高團(tuán)購(gòu)意愿的一群潛在消費(fèi)者,并從這一群消費(fèi)者中選擇具有較高社區(qū)聚合度的組合。 本研究全面考慮了用戶偏好、現(xiàn)實(shí)情境及社會(huì)影響對(duì)消費(fèi)者團(tuán)購(gòu)意愿可能產(chǎn)生的影響,而且提出了基于復(fù)雜網(wǎng)絡(luò)聚合度的計(jì)算,可以有效評(píng)估社區(qū)的團(tuán)購(gòu)購(gòu)買意愿。該團(tuán)購(gòu)?fù)扑]機(jī)制,可以有效提升團(tuán)購(gòu)?fù)扑]的成功率。 該團(tuán)購(gòu)?fù)扑]機(jī)制的有效性雖然得到了驗(yàn)證,但仍有一些團(tuán)購(gòu)?fù)扑]的特殊問(wèn)題沒(méi)有有效解決,如,一個(gè)消費(fèi)者可以屬于多個(gè)社區(qū),當(dāng)同時(shí)為這些社區(qū)推薦同一個(gè)產(chǎn)品時(shí),消費(fèi)者該如何選擇,這并不是簡(jiǎn)單的通過(guò)聚合度高低就能解決的問(wèn)題。另外,每個(gè)用戶受偏好相似性及社會(huì)影響的程度是不同的,本文基于社會(huì)心理學(xué)理論中的從眾效應(yīng)對(duì)社會(huì)影響的權(quán)重進(jìn)行調(diào)節(jié),后期還需要通過(guò)實(shí)證研究計(jì)算出偏好相似性及社會(huì)影響對(duì)用戶團(tuán)購(gòu)影響的不同權(quán)重。2.3 產(chǎn)品類型A的推薦
2.4 產(chǎn)品類型B的推薦
3 仿真實(shí)驗(yàn)
4 結(jié)語(yǔ)