許寧菲 程生雪 王虎 程艷霞 江長斌
摘要:社會化電商中的意見領袖在產(chǎn)品的選擇和購買上對其他用戶產(chǎn)生較大的影響,同時引導著社區(qū)的話題討論。為了更加準確識別社會化電商中的意見領袖,從網(wǎng)絡結構的角度出發(fā),借鑒了PageRank算法的基本思想,綜合考慮了用戶的行為特征,基于多指標綜合評價方法設計了ActivityRank算法對用戶的活躍度進行排序,以此識別意見領袖。據(jù)此,綜合考慮了用戶行為和社會網(wǎng)絡結構,提高了意見領袖識別的準確性。
關鍵詞:社會化電商;意見領袖;ActivityRank算法;PageRank算法
中圖分類號:F27文獻標識碼:Adoi:10.19311/j.cnki.1672-3198.2019.15.022
1引言
隨著網(wǎng)購用戶的大規(guī)模增長,信息傳播方式從線下到線上的轉變,網(wǎng)絡營銷的價值逐漸得到商家的認可和重視,企業(yè)營銷信息開始利用社交社區(qū)傳播。擁有社會化特征的社交網(wǎng)絡結合了傳統(tǒng)電子商務,慢慢演化成社會化電子商務。社會化電子商務(Social Commerce)也稱“社交電商”,是傳統(tǒng)電子商務的一種衍生模式。主要指利用社交媒介和網(wǎng)絡媒介進行傳播,借助社交互動、用戶自生內容等方式來促進產(chǎn)品的消費的一種電子商務模式。社會化電子商務目前主要有三種形式: 基于傳統(tǒng)電商發(fā)展的社區(qū),如淘寶的微淘、網(wǎng)易考拉的種草社區(qū),都是在傳統(tǒng)電商的基礎上發(fā)展起來的;也有與社交媒體結合的電商模式,典型的有微博、微信等依靠平臺進行營銷的模式;以及社區(qū)與電商同步發(fā)展的第三方社會化電商平臺,典型的例如小紅書、蘑菇街等平臺。
意見領袖在通常意義上理解為可以通過各種形式對他人的態(tài)度或者行為產(chǎn)生一定影響甚至改變的個人。社會化電商社區(qū)中的意見領袖不僅通過發(fā)表自身的產(chǎn)品使用感受將產(chǎn)品印象傳達給更多潛在消費者,而且借助其個人特質魅力引領消費者的購物趨勢,從而對潛在消費者的購買決策和品牌認知態(tài)度產(chǎn)生影響和改變。報告《2018年社會化電子商務》中的數(shù)據(jù)顯示,社會化電商的意見領袖在社會化電商社區(qū)中發(fā)揮著重要作用。 越來越多的企業(yè)開始重視各類社交網(wǎng)絡中意見領袖的識別,以期通過意見領袖引導網(wǎng)絡信息傳播,達到最佳的傳播效果。因此,如何正確識別社會化商務平臺中的意見領袖對于企業(yè)和平臺來說都具有重要價值。
2PageRank算法介紹
在社會化電商平臺社區(qū)中,意見領袖通常指在某段時間內具有較大影響力的用戶,因此,如何識別意見領袖可以轉化為如何計算用戶影響力。目前研究節(jié)點影響力的算法中已經(jīng)存在較多成果,大部分算法基于PageRank算法和HITS算法的基礎上進行改進。
PageRank是一種衡量網(wǎng)頁重要度的經(jīng)典算法,最早是由Larry Page和Sergey Brin提出,并且成果應用在Google網(wǎng)站。PageRank是基于“被很多高質量的網(wǎng)頁鏈接到的網(wǎng)頁一定也是高質量網(wǎng)頁” 的回歸關系,來判定所有網(wǎng)頁的重要性。其核心思想有兩點:(1)網(wǎng)頁的重要性由其他網(wǎng)頁的鏈接數(shù)量衡量,鏈接網(wǎng)頁的數(shù)量越多說明網(wǎng)頁越重要。(2)如果一個網(wǎng)頁被一個高PageRank值的網(wǎng)頁鏈接到,那么該網(wǎng)頁的PageRank值也會較高。
PageRank算法的基本原理是每個網(wǎng)頁都有一個初始的PR值,通過鏈接關系將每個網(wǎng)頁的PR值進行均勻分,經(jīng)過反復迭代之后最終達到穩(wěn)定收斂的網(wǎng)頁PR值狀態(tài)。如圖1所示,圖中的4個網(wǎng)頁存在相互鏈接的關系。 PR值會均勻地傳遞給這鏈接到的兩個網(wǎng)頁,在原有PR值的基礎上增加傳遞過來的PR值,同時將累加的PR值繼續(xù)均勻分配給下一層鏈接到的網(wǎng)頁。根據(jù)這樣的規(guī)律, PR值多層均勻傳遞最終每個網(wǎng)頁都會有一個穩(wěn)定的PR值。因此對于任意網(wǎng)頁i,它的PageRank值可表示為如公式(1)所示
PRvi=1-dn+d∑vj∈E(vi)PR(vj)N(vj)(1)
PRvi:網(wǎng)頁vi的PageRank值;
PR(vj):網(wǎng)頁vj的PageRank值;
N(vj):網(wǎng)頁vj鏈出到其他網(wǎng)頁的鏈接數(shù)量;
E(vi):鏈入到網(wǎng)頁vi的網(wǎng)頁合集;
n:網(wǎng)絡中網(wǎng)頁總數(shù);
d:阻尼系數(shù),通常取0.85,表示用戶在瀏覽某個網(wǎng)頁后瀏覽鏈出網(wǎng)頁的概率,1-dn表示重新選擇一個隨機網(wǎng)頁瀏覽的概率。
3ActivityRank算法構建
社會化電商社區(qū)中,用戶的行為主要有瀏覽筆記、發(fā)布筆記、分享鏈接、評論、點贊、收藏、關注等,例如像小紅書 APP,社區(qū)里的用戶主要行為集中在發(fā)表和瀏覽筆記、評論及回復等。社區(qū)中的用戶影響力可以結合用戶之間的互動來進行衡量。陳芬融合多種用戶特征,包括影響力、活躍度、專業(yè)性、支持度和傳播力構建了系統(tǒng)的網(wǎng)絡意見領袖識別指標體系,基于新浪微博的真實數(shù)據(jù)對意見領袖進行識別。根據(jù)其他學者的研究,同時考慮社會化電子商務的具體特點,創(chuàng)造性系數(shù)可以以用戶發(fā)布內容情況表示;互動性系數(shù)則以多個用戶之間的關注狀況表示;認可度系數(shù)通過用戶發(fā)表內容所獲得的點贊和收藏量來表示,如圖2所示可以將以上系數(shù)轉換為社會化電商社區(qū)中用戶的活躍度,因此分配AR值的依據(jù)就是活躍度。
ActivityRank算法的主要思路是在各個用戶之間關注關系的基礎上,利用用戶的創(chuàng)造性、互動性和認可度等用戶行為特征指標轉化成用戶活躍度,利用用戶活躍度來分配用戶之間 AR值。采取綜合指標評價的方法同時考慮多種因素對用戶節(jié)點活躍度的影響,可以避免均勻分配AR值,使算法更加貼近現(xiàn)實,更加科學合理。
3.1創(chuàng)造性系數(shù)
社會化電商社區(qū)中的用戶最主要的動作就是發(fā)表和瀏覽,用戶生產(chǎn)的內容往往會影響其在社會化電商社區(qū)中的影響力。通常用戶發(fā)表的內容數(shù)量與其創(chuàng)造力成正比,因此本文的用戶創(chuàng)造力系數(shù)主要用用戶發(fā)表內容數(shù)表示。設社會化電商社區(qū)的一個用戶 u,Nu(t0,tw)指用戶u從注冊時間t0到tw內發(fā)表的內容數(shù),則tw時刻用戶u的創(chuàng)造力系數(shù)Createu如下:
Createu(tw)=Nu(t0,tw)tw-t0(2)
3.2互動性系數(shù)
一般來說,用戶關注他人越多,越容易關注其他用戶的動態(tài),粉絲數(shù)越多,其他用戶越可能進行交流,互動程度越高。設社會化電商社區(qū)網(wǎng)絡中的一個節(jié)點為用戶u,F(xiàn)ollowut0,tw表示用戶u從注冊時間t0到tw內關注其他用戶數(shù)量,F(xiàn)ansu(t0,tw)為用戶u從注冊時間t0到tw內獲得的粉絲數(shù),其中α和β分別代表用戶u關注他人數(shù)量和粉絲數(shù)量的權值系數(shù)。則tw時刻用戶u互動性系數(shù)Interactu如下:
Interactu(tw)=
α·Followut0,tw+β·Fansu(t0,tw)tw-t0(3)
3.3認可度系數(shù)
認可度系數(shù)可以用用戶每篇發(fā)布內容的平均獲贊和收藏的數(shù)量情況,以此來避免低價值的高頻內容對最終排名產(chǎn)生的影響。因此,用戶的認可度系數(shù)越高,表示用戶發(fā)布的內容獲得了越多人的喜愛和收藏,內容質量得到的認可度越高,具有更大的影響力。設社會化電商社區(qū)中的一個用戶為u,Likeu(t0,tw)為用戶u從注冊時間t0到tw內發(fā)布內容所獲得的點贊數(shù),Collectu(t0,tw)為用戶u從注冊時間t0到tw內發(fā)布的內容獲得的收藏數(shù),Nu(t0,tw)為用戶u在時間t內發(fā)表的內容數(shù),則tw時刻用戶u的發(fā)布內容的認可度系數(shù)Recognitionu如下:
Recognitionu(tw)=γ·Likeu(t0,tw)+δ·Collectu(t0,tw)Nu(t0,tw)(4)
綜上所述,用戶的創(chuàng)造性系數(shù)、互動性系數(shù)和認可度系數(shù),均可以反映用戶在社會化電商社區(qū)中的影響力。 ActivityRank算法中可以看到,用戶的創(chuàng)造性越大、互動性越高以及內容的認可度越高,則用戶在社會化電商社區(qū)中的活躍度就越大,用戶影響力也越大。因此用戶活躍度的計算主要分為兩步:每個指標的無量綱轉以及指標權重的計算。第一步的主要目的是將現(xiàn)實情況中具有不同計量單位的指標轉化成無量綱的數(shù)據(jù),進行標準化處理。第二步的目的是為了科學衡量每個指標對用戶活躍度的貢獻。因此在ActivityRank算法中首先將指標進行歸一化,使最終數(shù)據(jù)取值均為(0,1]。 由于特征數(shù)據(jù)跨度較大,如用戶粉絲數(shù)高的用戶可以達到百萬級別,低的用戶甚至一個粉絲都沒有,因此本文采用對數(shù)歸一化處理方法。 這種處理方式計算簡單、運算速度快、處理后數(shù)據(jù)跨度小。 因此社會化電商社區(qū)中用戶u的活躍度Au的表示方法如下:
Au=ω1·lgCreateulgCreatemax+ω2·lgInteractulgInteractmax+ω3·lgRecognitionulgRecognitionmax(5)
在指標權重的計算中,一般的我們可以用平均加權的方法計算用戶間的影響力,即三者權重相等。由于本文選取的指標采用層次化的分層結構,其結構與思想正好與層次分析法相吻合,為了使評價模型更加準確,本文采用層次分析法確定權重系數(shù)。最終各特征指標的權重向量為(0.11,0.309,0.581)。
現(xiàn)假設社會化電商社區(qū)中一個用戶v關注m個用戶,u是被關注用戶中的一個,則 A(v,u)表示用戶v給用戶u的分配的ActivityRank值的比例,該值由用戶u的活躍度Au來決定,用戶活躍度的分配計算公式為
Av,u=Au∑mi=1Ai(6)
則ActivityRank算法如下:
ARu=1-dn+d∑u∈E(u)Av,uAR(v)(7)
從ActivityRank算法的角度來看,用戶的活躍度越高,表示粉絲對該用戶的關注越高,則這個用戶分配到的AR值越高。相反用戶的活躍度越低,表示粉絲對該用戶的關注程序越低,則這個用戶分配到的AR值越低。ActivityRank算法中可以發(fā)現(xiàn)粉絲對不同用戶之間的關注情況有高有低,而具體的關注程度則可以用用戶的活躍度來表示。因此ActivityRank算法也更加符合生活中的實際情況,通常在團隊中我們會更加關注活躍度高的用戶。
4實證分析
本文選取了小紅書社區(qū)中護膚分類下隨機選取的用戶,按照雪球采樣的方法爬取用戶信息以及用戶之間的關注關系。對爬取的用戶信息進行處理,將關注數(shù)與粉絲數(shù)都很少同時幾乎從未發(fā)布過筆記的用戶刪除,實驗共抓取了4626個用戶的信息。將這部分用戶信息進行出入度分析,分析結果顯示這部分用戶的關注數(shù)量以及粉絲數(shù)量都遵循冪率分布,且具有胖尾特性,表明該社會網(wǎng)絡有無標度特性,符合使用社會網(wǎng)絡分析方法的條件。
根據(jù)用戶相互之間的關注情況,生成用戶關注矩陣。 若用戶A關注用戶B,則值為1;若用戶A未關注B,則值為0。ActivityRank算法是根據(jù)用戶關注關系來決定AR值的分配情況。
根據(jù)第一階段中的ActivityRank算法的計算公式,利用matlab實現(xiàn) ActivityRank算法,其中阻尼系數(shù) d取值為0.85,在52次迭代運行后得到收斂的結果,用戶的AR值都趨于穩(wěn)定。
根據(jù)ActivityRank算法可以得到用戶活躍度排序,經(jīng)過ActivityRank值的排序,用戶影響力的評價在用戶關注關系的基礎上增加了用戶本身的行為特性。排名前十的用戶如表1所示。
從排名中可以看到排名第一的用戶為“林允 Jelly”,其粉絲數(shù)最高,雖然她發(fā)布的筆記不是很多,但是發(fā)布的筆記內容大多都以視頻的形式呈現(xiàn),質量很高,而且其明星身份加成,獲得了較多的點贊和收藏,因此其ActivityRank值遠高于其他用戶,活躍度值最高。用戶“Bunny0905”雖然粉絲數(shù)較少,但是她發(fā)布的筆記數(shù)較多,由于其表現(xiàn)相對較為活躍,排名仍然比粉絲數(shù)更多的后面幾位用戶更高。
5結論
本文基于 PageRank算法的思想提出 ActivityRank算法,從用戶的創(chuàng)造性、互動性和認可度幾個維度綜合計算用戶活躍度,并利用用戶活躍度進行社會化電商平臺的意見領袖識別。意見領袖往往是社會化電商社區(qū)網(wǎng)絡中較為活躍的節(jié)點用戶。但是不僅僅依靠用戶的粉絲數(shù)量來判斷用戶在社會化電商社區(qū)中的影響力。還要綜合考慮用戶的創(chuàng)造性、互動性和認可度等因素。 對于平臺和商家來說,可以發(fā)掘綜合指數(shù)較高的網(wǎng)絡節(jié)點用戶,培養(yǎng)這批用戶成為社區(qū)內的意見領袖。識別早期的意見領袖,可以借助意見領袖引導社區(qū)的話題,促進社區(qū)的交流氛圍。
參考文獻
[1]Travers J,Milgram S.An Experimental Study of the Small World Problem[J].Sociometry,1969,32(4).
[2]Chi S W,Zang J B,Mele A,et al.Argonaute HITS-CLIP decodes microRNA-mRNA interaction maps[J].Nature,2009,460(7254).
[3]徐德志,申紅婷.網(wǎng)頁排名算法及其應用[J].貴州大學學報(自然科學版),2007,(5).
[4]陳芬,陳佩帆,吳鵬,薛春香.融合用戶特征與多級文本傾向性分析的網(wǎng)絡意見領袖識別[J].情報理論與實踐,2018,41(07).
[5]吳慧,張紹武,林鴻飛.微博社交網(wǎng)絡的用戶影響力評價方法[J].中文信息學報,2017,(04).