湯 胤, 徐永歡, 陳 劍
(1.暨南大學(xué)管理學(xué)院,廣東廣州510632;2.中山大學(xué)新華學(xué)院管理學(xué)院,廣東廣州510507)
自Rogers 從提出創(chuàng)新擴(kuò)散以來,創(chuàng)新的范圍已經(jīng)從新技術(shù)擴(kuò)大到新產(chǎn)品,新方法,或者新觀念、群體現(xiàn)象以及不同個(gè)體的行為等,而“擴(kuò)散”一詞則涵蓋了有計(jì)劃性的傳播和自發(fā)性無計(jì)劃傳播兩層含義,并且是一個(gè)過程,包含創(chuàng)新、渠道、時(shí)間以及社會體系等四個(gè)要素[1,2].實(shí)踐中,移動社交應(yīng)用市場的競爭已經(jīng)非常激烈,對于很多新興的社交應(yīng)用(app 等各種形式),鑒于其社交屬性,用戶使用的基礎(chǔ)是必須有一定的用戶數(shù)量,若不能在一定期間內(nèi)集聚一批用戶群體(即形成羊群效應(yīng)),產(chǎn)品很可能失敗.從很多初創(chuàng)項(xiàng)目中觀察到,社交應(yīng)用本身可以滿足用戶需求前提下,初始種子用戶群體在整體人群中比較分散,可能會引起傳播障礙,影響用戶數(shù)增長;而另一方面,若初始種子用戶群體非常緊密,難免有覆蓋不到的區(qū)域,是否同樣會影響傳播速度?圖1 刻畫了同樣數(shù)量種子用戶群體在社交網(wǎng)絡(luò)中的不同分布(x 代表每個(gè)小團(tuán)體中節(jié)點(diǎn)的個(gè)數(shù),y代表彼此不直接相連的小團(tuán)體個(gè)數(shù)),到底哪種更有助于用戶增長呢?將這個(gè)問題擴(kuò)大至共享經(jīng)濟(jì)應(yīng)用(如共享單車)中,基于物理空間的初始資源投放也提出了類似的問題.
圖1 同樣數(shù)量種子用戶群體(初始資源)在社交網(wǎng)絡(luò)中的不同分布Fig 1 .Different distribution of seed user of same size in social network
理論研究方面,早期往往采用定性或者問卷調(diào)查方法,Bass 混合擴(kuò)散模型最早采用仿真方式,成功地預(yù)測了耐用消費(fèi)品銷量并發(fā)現(xiàn)影響創(chuàng)新擴(kuò)散的重要因素[3].但Bass 模型僅反映宏觀特征,對于社會系統(tǒng)內(nèi)單獨(dú)個(gè)體交互作用后的行為的非線性的涌現(xiàn)缺乏對創(chuàng)新擴(kuò)散微觀機(jī)理的考察,而且模型忽略了采納時(shí)間和交互時(shí)間,包括其后Bass 模型族系均有這個(gè)問題.而創(chuàng)新擴(kuò)散的本質(zhì)是大量潛在消費(fèi)者的微觀采納決策集中涌現(xiàn)為宏觀層面的行為模式[4].大量的研究證實(shí),復(fù)雜社會網(wǎng)絡(luò)與創(chuàng)新擴(kuò)散之間存在相互影響.一方面,社會網(wǎng)絡(luò)(如人際關(guān)系網(wǎng)絡(luò))是創(chuàng)新擴(kuò)散的重要渠道.社會網(wǎng)絡(luò)中個(gè)體對某種創(chuàng)新(社交應(yīng)用、共享單車應(yīng)用等)的選擇容易受到與之關(guān)聯(lián)的鄰居個(gè)體選擇的影響,即存在網(wǎng)絡(luò)效應(yīng)[5?7].宏觀的擴(kuò)散模型無法考慮采納者的異質(zhì)性,忽略了微觀層面消費(fèi)者個(gè)性與社會交互等特點(diǎn)對產(chǎn)品擴(kuò)散的影響,從而使其在現(xiàn)實(shí)應(yīng)用中出現(xiàn)了一定的局限.尤其是隨著移動互聯(lián)網(wǎng)的普及以及社會化媒體的出現(xiàn),使得潛在的消費(fèi)個(gè)體決策行為越來越多地受到來自周邊其他個(gè)體選擇的影響.忽略了這種交互作用,將難以準(zhǔn)確的描述和解釋具有網(wǎng)絡(luò)外部效應(yīng)的創(chuàng)新擴(kuò)散.
20 世紀(jì)90年代以后, 閾值模型、滲流模型、元胞自動機(jī)模型、Agent-based 模型以及多智能體模型等開始從微觀角度刻畫創(chuàng)新擴(kuò)散的動力學(xué)過程,并在創(chuàng)新擴(kuò)散的前期預(yù)測方面體現(xiàn)出有效性和穩(wěn)定性的特征[8?13].Granovetter 提出的門檻模型(閾值模型)充分考慮了信息接收者的特性和信息傳播具有記憶效應(yīng),能夠更為直觀地展示社會系統(tǒng)結(jié)構(gòu)對創(chuàng)新擴(kuò)散的影響,特別適用于社會動態(tài)問題的仿真研究[14,15],如郭靜等[16]基于此模型加上影響力傳播權(quán)重算法,指出度量用戶間影響力對商品營銷和推廣具有重要作用.趙良杰等運(yùn)用微觀擴(kuò)散模型仿真分析消費(fèi)者交互作用對網(wǎng)絡(luò)效應(yīng)產(chǎn)品擴(kuò)散的影響[17].
除了考慮微觀個(gè)體,網(wǎng)絡(luò)結(jié)構(gòu)的差異也被證明可以促進(jìn)或者阻礙創(chuàng)新在這個(gè)社會中的擴(kuò)散.真實(shí)社會網(wǎng)絡(luò)呈現(xiàn)Barabási-Albert 網(wǎng)絡(luò)的無標(biāo)度特性和Watts-Strogatz 小世界特性,其特征結(jié)構(gòu)顯著影響新產(chǎn)品在整個(gè)網(wǎng)絡(luò)中的擴(kuò)散[18?20].高聚類網(wǎng)絡(luò)具有很多的冗余連接拓?fù)浣Y(jié)構(gòu),Centola 等發(fā)現(xiàn)行為在高聚類的網(wǎng)絡(luò)上傳播速度更快,與社交產(chǎn)品的內(nèi)秉社交屬性仍然有所區(qū)別,也未發(fā)現(xiàn)其增長瓶頸[21].Delre 等[22]以小世界網(wǎng)絡(luò)為背景,發(fā)現(xiàn)最優(yōu)的目標(biāo)市場選擇策略是選擇多個(gè)相互分散、高度聚類的小型消費(fèi)者群體.趙保國等[23]認(rèn)為網(wǎng)絡(luò)效應(yīng)的存在不僅改變了傳統(tǒng)擴(kuò)散模式,而且對個(gè)體采納行為有重要影響,進(jìn)而指出直接網(wǎng)絡(luò)效應(yīng)和間接網(wǎng)絡(luò)效應(yīng)對競爭性產(chǎn)品擴(kuò)散具有階段性影響.趙正龍等[24]基于個(gè)體的差異化選擇特征角度,分析了復(fù)雜社會網(wǎng)絡(luò)上的擴(kuò)散過程及其影響因素, 有助于企業(yè)有效管理和控制具有差異化選擇特征的擴(kuò)散.Peres等[25]對比分析了不同網(wǎng)絡(luò)結(jié)構(gòu)對創(chuàng)新擴(kuò)散生命周期的影響效應(yīng),并指出消費(fèi)者網(wǎng)絡(luò)是諸多環(huán)境和關(guān)系(如網(wǎng)絡(luò)外部性、消費(fèi)者口碑、社會信號等)疊加作用的結(jié)果.杜賓[26]根據(jù)社會學(xué)習(xí)的主體認(rèn)知過程和消費(fèi)者網(wǎng)絡(luò)結(jié)構(gòu)的線上線下差異性,探索多層次網(wǎng)絡(luò)疊加條件下的擴(kuò)散規(guī)律.孫耀吾等[27]基于小世界網(wǎng)絡(luò)研究企業(yè)聯(lián)盟知識擴(kuò)散特征,發(fā)現(xiàn)集聚系數(shù)增加和特征路徑長度減少可以加快擴(kuò)散效應(yīng).
有學(xué)者開始從網(wǎng)絡(luò)視角出發(fā),結(jié)合傳染病模型來研究創(chuàng)新擴(kuò)散的問題.Choi 等[28]構(gòu)建了基于SIS 傳染病模型的平均場擴(kuò)散過程,利用隨機(jī)占優(yōu)理論分析了網(wǎng)絡(luò)平均度、度分布異質(zhì)性以及“鄰居效應(yīng)”對擴(kuò)散的影響.病毒傳播模型為創(chuàng)新擴(kuò)散的研究提供新的研究視角和方法,從而使得基于復(fù)雜網(wǎng)絡(luò)的計(jì)算機(jī)仿真的研究動態(tài)演化成為可能,仿真過程也更貼近現(xiàn)實(shí)網(wǎng)絡(luò)的創(chuàng)新擴(kuò)散過程.
隨著研究的深入,有部分學(xué)者開始關(guān)注種子顧客對于初期創(chuàng)新擴(kuò)散以及創(chuàng)新在整個(gè)網(wǎng)絡(luò)中的擴(kuò)散的重要作用,并且更多從影響力的角度來研究意見領(lǐng)袖型種子顧客對創(chuàng)新擴(kuò)散的影響[29],或者通過構(gòu)建無標(biāo)度社會網(wǎng)絡(luò)來研究病毒營銷活動,探討在消費(fèi)者網(wǎng)絡(luò)中選擇初始影響者的方法[30].研究發(fā)現(xiàn),技術(shù)擴(kuò)散的早期,網(wǎng)絡(luò)中出現(xiàn)種子顧客或者意見領(lǐng)袖會加速創(chuàng)新在社會網(wǎng)絡(luò)中的擴(kuò)散[31].黃敏學(xué)等將意見領(lǐng)袖所依存的網(wǎng)絡(luò)劃分為社交網(wǎng)絡(luò)和消費(fèi)咨詢網(wǎng)絡(luò),分析了網(wǎng)絡(luò)節(jié)點(diǎn)的信息創(chuàng)造和網(wǎng)絡(luò)結(jié)構(gòu)對于網(wǎng)絡(luò)關(guān)系構(gòu)建以及意見領(lǐng)袖形成的影響[32].Peng 等[33]在研究微博信息的最終流行度時(shí),發(fā)現(xiàn)信息傳播早期轉(zhuǎn)發(fā)者的拓?fù)浣Y(jié)構(gòu)和最終流行程度有很大相關(guān)性,若用戶所發(fā)信息早期的傳播深度較廣,則有利于信息在社會網(wǎng)絡(luò)中的廣泛傳播.而典型的興趣社交網(wǎng)絡(luò)微博的用戶轉(zhuǎn)發(fā)消息的概率受其鄰居中已轉(zhuǎn)發(fā)此消息鄰居之間形成的連通圖的個(gè)數(shù)的正面影響[34].在實(shí)物商品在某企業(yè)員工中的擴(kuò)散模擬中發(fā)現(xiàn),種子用戶分布越分散,創(chuàng)新擴(kuò)散獲得市場成功所需要的時(shí)間就越短[35].
總之,目前微觀層面的研究往往對網(wǎng)絡(luò)拓?fù)涮卣鞯拿枋鲆约吧鐣W(wǎng)絡(luò)拓?fù)湫再|(zhì)的應(yīng)用研究,比如說初始條件對擴(kuò)散影響的相關(guān)研究,更多關(guān)注初始種子用戶影響力對創(chuàng)新擴(kuò)散的影響,忽略了擴(kuò)散過程中所選取的種子用戶在社交網(wǎng)絡(luò)的網(wǎng)絡(luò)分布特征的差異、種子用戶之間的連接關(guān)系差異,也可能會引起的擴(kuò)散效率的不同.另外,當(dāng)前關(guān)于種子用戶分布對創(chuàng)新擴(kuò)散的研究方法多為數(shù)學(xué)模型演繹或用少量節(jié)點(diǎn)的網(wǎng)絡(luò),而在線社交網(wǎng)絡(luò)是一種典型的復(fù)雜網(wǎng)絡(luò),節(jié)點(diǎn)數(shù)量繁多、結(jié)構(gòu)關(guān)系復(fù)雜,若脫離現(xiàn)實(shí)網(wǎng)絡(luò)數(shù)據(jù)的復(fù)雜性,將使得其研究成果的可靠性及適用性等方面缺乏實(shí)證檢驗(yàn)[36].
為嘗試回答上述問題,本文利用大規(guī)模真實(shí)社交網(wǎng)絡(luò)數(shù)據(jù),在微觀層面上設(shè)計(jì)基于閾值模型和基于節(jié)點(diǎn)相關(guān)性的兩個(gè)實(shí)驗(yàn),在種子用戶的不同網(wǎng)絡(luò)分布及擴(kuò)散規(guī)則下,采用計(jì)算機(jī)仿真模擬得到結(jié)論.
社交應(yīng)用產(chǎn)品是指以交友為目的,以基于各種興趣組成的交友社區(qū)為組織形式的移動應(yīng)用.社交應(yīng)用產(chǎn)品相比其他工具類、生活實(shí)用類產(chǎn)品來說,具有網(wǎng)絡(luò)外部性,社交類產(chǎn)品有內(nèi)生的擴(kuò)張需求,用戶有主動傳播給好友的內(nèi)生動機(jī),從而增加自身的網(wǎng)絡(luò)價(jià)值.針對此類產(chǎn)品從網(wǎng)絡(luò)外部性角度考慮,內(nèi)生的傳播動機(jī)遠(yuǎn)遠(yuǎn)超過其他營銷因素,可以一定程度上排除其他因素的干擾.由于社交應(yīng)用的網(wǎng)絡(luò)外部性特性,之前關(guān)于其他類型新產(chǎn)品的推廣策略的研究,可能并不適用于社交產(chǎn)品.
本文專指在線社交網(wǎng)絡(luò),原因是當(dāng)前的在線社交網(wǎng)絡(luò)已經(jīng)覆蓋絕大多數(shù)人口,在網(wǎng)絡(luò)上的抽樣,可以充分表達(dá)總體特征.興趣社交網(wǎng)絡(luò)則是基于興趣發(fā)生用戶間連接的社交網(wǎng)絡(luò).基于興趣的社交網(wǎng)絡(luò)中,用戶主動進(jìn)行傳播擴(kuò)散也是一個(gè)相對比較自然的行為,可以在一定程度上排除其他營銷因素的干擾.另外就本課題的研究內(nèi)容而言,社交類應(yīng)用天然地在線上傳播,因而線下零星的口碑傳播可以不做考慮.
本文中的種子用戶是指產(chǎn)品自傳播之前,社交產(chǎn)品開發(fā)商通過各種方式在社交網(wǎng)絡(luò)中獲得的第一批用戶,也稱為初始感染節(jié)點(diǎn)集合(感染源).社交產(chǎn)品擴(kuò)散則指的是用戶發(fā)現(xiàn),下載安裝社交應(yīng)用類產(chǎn)品并向好友傳播.社交網(wǎng)絡(luò)中社交產(chǎn)品的擴(kuò)散并不完全等同于用戶采納與傳播,然而由于其社交屬性和應(yīng)用的特殊性,用戶傳播或轉(zhuǎn)發(fā)相關(guān)信息大多數(shù)情況下都是在用戶下載安裝使用之后,故研究忽略轉(zhuǎn)發(fā)卻不采納的情況.基于上述細(xì)微的不同,研究將在不同場合使用“傳播”、“采納”、“感染”和“擴(kuò)散”等術(shù)語.為簡化起見,論文認(rèn)為社交網(wǎng)絡(luò)中社交類產(chǎn)品的擴(kuò)散過程就是類似于病毒的傳播過程,即社交網(wǎng)絡(luò)中的節(jié)點(diǎn)(即用戶)存在已感染(已采納的用戶)和未感染(潛在采納用戶)兩種狀態(tài).
根據(jù)文獻(xiàn)[21,34,35]的分析,均發(fā)現(xiàn)擴(kuò)散效率與網(wǎng)絡(luò)結(jié)構(gòu)或種子顧客在社會網(wǎng)絡(luò)中分布的關(guān)系.現(xiàn)實(shí)中亦可觀察到,社交應(yīng)用產(chǎn)品本身可以滿足用戶需求前提下,同樣數(shù)量的種子用戶,在社交網(wǎng)絡(luò)中的分布越集聚,社交產(chǎn)品擴(kuò)散的速度越快.因此提出假設(shè)
H1: 社交網(wǎng)絡(luò)中,種子用戶的網(wǎng)絡(luò)緊密度與社交產(chǎn)品擴(kuò)散速度正相關(guān).
進(jìn)一步地,若假設(shè)H1 為真,那么種子用戶分布的集聚程度對創(chuàng)新擴(kuò)散速度的正向影響又是怎么樣? 文獻(xiàn)[13]研究了初始采納者比例(即數(shù)量)與創(chuàng)新擴(kuò)散之間的正相關(guān)關(guān)系,同時(shí)也在實(shí)際傳播限項(xiàng)中觀察到初始已采納用戶比例對于創(chuàng)新擴(kuò)散速度的影響迅速變小,即
H2: 社交網(wǎng)絡(luò)中,種子用戶的網(wǎng)絡(luò)緊密度對社交產(chǎn)品擴(kuò)散速度的正向影響加速遞減.
設(shè)社交網(wǎng)絡(luò)為G=(V,E),其中V 為節(jié)點(diǎn)集合,E 為邊的集合,初始種群所組成的網(wǎng)絡(luò)記為G0(V0,E0),那么有G0(V0,E0)?G(V,E),則G0的緊密度為
其中L 代表網(wǎng)絡(luò)中實(shí)際存在的邊的數(shù)量,N 代表網(wǎng)絡(luò)中種子用戶節(jié)點(diǎn)的數(shù)量.
網(wǎng)絡(luò)緊密度c 取值范圍在0 和1 之間,作為衡量種子用戶分布的集聚程度的指標(biāo),可以表征種子用戶的網(wǎng)絡(luò)緊密度越大,網(wǎng)絡(luò)分布越集聚.為表述方便,令
其中x,y 為正整數(shù),x 代表每個(gè)小團(tuán)體中節(jié)點(diǎn)的個(gè)數(shù),y 代表彼此不直接相連的小團(tuán)體個(gè)數(shù),易知N =xy(見圖1 各子圖).
在實(shí)驗(yàn)中考察社交產(chǎn)品擴(kuò)散速度,主要觀察從種子用戶群(時(shí)鐘0)至整個(gè)目標(biāo)用戶群的20%(時(shí)鐘t)所需要的時(shí)長作為擴(kuò)散快慢的標(biāo)志.假設(shè)H1可量化為,隨著種子用戶緊密度的增大,創(chuàng)新擴(kuò)散至整個(gè)目標(biāo)用戶群的20%左右所用的時(shí)間(達(dá)到創(chuàng)新累積采納百分比20%,即創(chuàng)新擴(kuò)散“起飛”所用的時(shí)間)越短.假設(shè)H2量化為,種子用戶的不同網(wǎng)絡(luò)緊密度下,社交產(chǎn)品擴(kuò)散至整個(gè)目標(biāo)用戶群的20%所用的時(shí)間間隔越來越短,呈加速遞減趨勢.
為了檢驗(yàn)本文假設(shè),使用典型社交網(wǎng)絡(luò)為基礎(chǔ)數(shù)據(jù),選取不同數(shù)量的種子用戶,并在種子用戶的不同分布下進(jìn)行基于閾值模型的仿真實(shí)驗(yàn)和基于節(jié)點(diǎn)相關(guān)性的仿真模擬實(shí)驗(yàn).基于閾值模型的仿真實(shí)驗(yàn)考慮初始種子用戶的網(wǎng)絡(luò)分布以及擴(kuò)散中信息的累積效應(yīng)對社交產(chǎn)品擴(kuò)散的影響,重復(fù)實(shí)驗(yàn),進(jìn)而從數(shù)據(jù)集中觀察平均值、中位數(shù)、方差和偏度等指標(biāo),從而得到高信度的結(jié)論.基于節(jié)點(diǎn)相關(guān)性的擴(kuò)散仿真實(shí)驗(yàn)與基于閾值模型的擴(kuò)散仿真實(shí)驗(yàn)的主要區(qū)別在于傳播規(guī)則需要更進(jìn)一步考慮已感染節(jié)點(diǎn)與未感染節(jié)點(diǎn)之間的相關(guān)性,進(jìn)而有傾向地選擇鄰居節(jié)點(diǎn)進(jìn)行感染.
本文選取豆瓣網(wǎng)作為仿真實(shí)驗(yàn)的樣本社交網(wǎng)絡(luò).原因是豆瓣網(wǎng)運(yùn)營多年,覆蓋人群非常廣泛并比較穩(wěn)定,可以排除高速增長期或衰弱期平臺帶來的影響;使用Python 語言編寫網(wǎng)頁抓取及解析程序,遞歸地獲取社交網(wǎng)絡(luò)數(shù)據(jù).具體步驟為,首先在網(wǎng)絡(luò)中隨機(jī)抽取一個(gè)用戶作為起始用戶,獲取起始用戶關(guān)注的對象,進(jìn)而迭代地對關(guān)注的對象進(jìn)行同樣的操作,直到獲得足夠的數(shù)據(jù)(代碼略).然后利用R 語言和程序包igraph 構(gòu)建一個(gè)無向無權(quán)的社交網(wǎng)絡(luò)圖(代碼略)并分析.
抓取到的豆瓣社交子網(wǎng)絡(luò)包含206 891 個(gè)節(jié)點(diǎn),544 748 條邊,網(wǎng)絡(luò)緊密度為1.27×105,各節(jié)點(diǎn)的度值及其關(guān)注的節(jié)點(diǎn)的度值表現(xiàn)出顯著的異質(zhì)性,且各用戶被其他人關(guān)注的差異較大.采用常規(guī)社會網(wǎng)絡(luò)分析方法可得該網(wǎng)絡(luò)的聚類系數(shù)為0.075,最大強(qiáng)連通圖的平均最短路徑為3.18,即具有一般社會網(wǎng)絡(luò)的短平均最短路徑長度和高內(nèi)聚的小世界特性,適合作為用于社交產(chǎn)品擴(kuò)散仿真的社交網(wǎng)絡(luò)[18].
為簡化工作,社交網(wǎng)絡(luò)中的節(jié)點(diǎn)(即用戶)只存在兩種狀態(tài)——已感染節(jié)點(diǎn)(代表已采納的用戶)和未感染節(jié)點(diǎn)(代表潛在采納用戶),種子用戶作為感染源,構(gòu)成初始感染節(jié)點(diǎn)集合;其余用戶構(gòu)成未感染節(jié)點(diǎn)集合,感染節(jié)點(diǎn)對未感染節(jié)點(diǎn)具有持續(xù)的傳染能力,直至該節(jié)點(diǎn)被感染.此外,由于社交類產(chǎn)品的社交屬性所蘊(yùn)含的內(nèi)生傳播動機(jī),用戶轉(zhuǎn)發(fā)或下載安裝試用的過程中均伴隨著信息再次傳播,因此可以認(rèn)為未感染節(jié)點(diǎn)被感染后會主動向其他未感染節(jié)點(diǎn)傳播相關(guān)信息,從而整個(gè)感染過程會主動進(jìn)行下去,直至網(wǎng)絡(luò)大部分節(jié)點(diǎn)被感染.
實(shí)驗(yàn)采用線性閾值模型,感染刺激是指未感染節(jié)點(diǎn)接收到一次已感染節(jié)點(diǎn)的感染信息.經(jīng)過初步試算,刺激閾值的大小不會影響實(shí)驗(yàn)的結(jié)果.因此設(shè)定如下感染規(guī)則:每個(gè)未感染節(jié)點(diǎn)累積受到來自相同或者不同易感染節(jié)點(diǎn)的感染刺激次數(shù)δ ≥10,則該節(jié)點(diǎn)被感染.為控制其他因素對創(chuàng)新擴(kuò)散過程的影響,隨機(jī)選取種子用戶,并大量重復(fù)實(shí)驗(yàn)過程,從而排除異質(zhì)性的干擾.算法流程如下:
步驟1初始化種子用戶群數(shù)量N, 每個(gè)子團(tuán)體的用戶數(shù)量x, 種子用戶群子團(tuán)體數(shù)量y, 迭代次數(shù)recursions(default=100);
步驟2加載網(wǎng)絡(luò),G0←network.seed-users(N,x,y)生成種子用戶群G0;
步驟3當(dāng)r 步驟4獲取v 的鄰居節(jié)點(diǎn)n ←neighbors(v); 步驟5對每個(gè)鄰居節(jié)點(diǎn)進(jìn)行感染,即n.infected ←n.infected+1; 步驟6若節(jié)點(diǎn)v 的受感染超過閾值,即v.infected ≥δ,則將v 加入子圖G0←G0+v; 步驟7重復(fù)步驟3~步驟6. 實(shí)驗(yàn)假定任意一個(gè)感染節(jié)點(diǎn)閾值都是相同的, 先考察N = 100, (y,x)元組分別為(100,1), (50,2),(25,4), (20,5), (10,10), (1,100), 即c100?100?1, c100?20?5, c100?10?10, c100?20?5, c100?1?100.為提高實(shí)驗(yàn)結(jié)果的信度, 考察初始種子用戶數(shù)量規(guī)模為N = 10 和N = 1 000 下, 種子用戶的網(wǎng)絡(luò)緊密度對初期擴(kuò)散速度的影響.鑒于N = 100 實(shí)驗(yàn)結(jié)果中N 是擴(kuò)散發(fā)生變化的臨界值, 當(dāng)N = 10 時(shí)只需分別考察c10?10?1, c10?5?2, c10?1?10三種情況, 當(dāng)N = 1 000 時(shí)只需分別考察c1000?1000?1, c1000?500?2,c1000?250?4,c1000?50?20,c1000?1?1000五種情況.其他創(chuàng)新擴(kuò)散仿真實(shí)驗(yàn)規(guī)則步驟和參數(shù)均與N =100 實(shí)驗(yàn)相同. 1)種子用戶的節(jié)點(diǎn)數(shù)量為10 個(gè)時(shí), 上述3 種網(wǎng)絡(luò)緊密度情況下, 基于閾值模型的創(chuàng)新擴(kuò)散仿真實(shí)驗(yàn)的20 次迭代,100 次重復(fù)實(shí)驗(yàn)結(jié)果如圖2 所示. 由于創(chuàng)新累積采納數(shù)量到達(dá)目標(biāo)用戶群的20%作為初期階段擴(kuò)散取得成功的標(biāo)志,因此實(shí)驗(yàn)結(jié)果重點(diǎn)分析初期階段創(chuàng)新擴(kuò)散情況.由標(biāo)準(zhǔn)差曲線可以看出,重復(fù)實(shí)驗(yàn)結(jié)果的總體上離差較小.隨著種子用戶的網(wǎng)絡(luò)分布緊密度的增大,擴(kuò)散至20%所用的時(shí)間越短,即擴(kuò)散速度越快,初步驗(yàn)證假設(shè)H1 為真(考慮到篇幅,僅給出較能反映數(shù)據(jù)特征的中位數(shù)和標(biāo)準(zhǔn)差指標(biāo)).由圖2 中100 次重復(fù)試驗(yàn)的平均值和中位數(shù)擴(kuò)散曲線可以看出,擴(kuò)散曲線c10?10?1和c10?5?2間距較大,而c10?5?2和c10?1?10間距突然變小,即當(dāng)種子用戶的網(wǎng)絡(luò)分布緊密度為0(即c10?10?1)的基礎(chǔ)上小幅度的提高,擴(kuò)散速度便有了極大的提高,隨著緊密度繼續(xù)增大,其對擴(kuò)散速度增長的影響變小,初步驗(yàn)證了假設(shè)H2 為真. 2)種子用戶數(shù)量為100 時(shí),其不同網(wǎng)絡(luò)分布緊密度下的20 次迭代,100 次重復(fù)試驗(yàn)的結(jié)果如圖3 所示.由圖3 可以看出,初始種子用戶數(shù)量為100 時(shí),其不同網(wǎng)絡(luò)分布緊密度下的100 次重復(fù)實(shí)驗(yàn)結(jié)果的標(biāo)準(zhǔn)差曲線和偏度曲線總體上離差較小.從整體趨勢上看,節(jié)點(diǎn)數(shù)量為100 的種子用戶的不同網(wǎng)絡(luò)緊密度下,100 次重復(fù)試驗(yàn)的平均值和中位數(shù)擴(kuò)散曲線陡峭程度大體一致.隨著種子用戶的網(wǎng)絡(luò)分布緊密度的增大,創(chuàng)新擴(kuò)散至20%所用的時(shí)間越短;從整個(gè)擴(kuò)散過程來看,種子用戶的網(wǎng)絡(luò)緊密度越大,創(chuàng)新擴(kuò)散到達(dá)峰值的時(shí)間也越早,同樣初步驗(yàn)證了假設(shè)H1 為真. 圖2 種子用戶的不同分布下基于閾值模型的仿真實(shí)驗(yàn)結(jié)果(N =10)Fig.2 The results of simulation experiments based on threshold model under different distribution of seed users(N =10) 由圖3 中100 次重復(fù)試驗(yàn)的中位數(shù)擴(kuò)散曲線可以看出,擴(kuò)散曲線c100?100?1的啟動時(shí)間遠(yuǎn)遠(yuǎn)滯后于介于c100?50?2和c100?1?100的之間時(shí)的擴(kuò)散啟動時(shí)間,而介于c100?50?2和c100?1?100之間的擴(kuò)散啟動時(shí)間差異驟然變小(擴(kuò)散曲線幾乎重合).可見,當(dāng)種子用戶的網(wǎng)絡(luò)分布緊密度在0 的基礎(chǔ)上小幅度提高,其擴(kuò)散速度便有了極大的提高,而隨著緊密度繼續(xù)增大,其對擴(kuò)散速度的增長的影響加速變小,初步驗(yàn)證了假設(shè)H2為真. 圖3 種子用戶的不同分布下基于閾值模型的仿真實(shí)驗(yàn)結(jié)果對比分析圖(N =100)Fig.3 Comparison and analysis diagram of simulation experiment results based on threshold model under different distribution of seed users(N =100) 3)種子用戶的節(jié)點(diǎn)數(shù)量為1 000 個(gè)時(shí),其5 種緊密度情況下的20 次迭代,100 次重復(fù)仿真實(shí)驗(yàn)結(jié)果對比分析圖如圖4 所示. 由圖4 可以看出,種子用戶節(jié)點(diǎn)數(shù)量為1 000 時(shí),其不同網(wǎng)絡(luò)緊密度分布下,感染節(jié)點(diǎn)數(shù)量的增長極其迅速.從開始感染到覆蓋整個(gè)網(wǎng)絡(luò),僅經(jīng)歷了15 次左右的迭代過程.從擴(kuò)散曲線的整體趨勢上看,節(jié)點(diǎn)數(shù)量為1 000 的種子用戶網(wǎng)絡(luò)緊密度越大,創(chuàng)新擴(kuò)散至目標(biāo)用戶網(wǎng)絡(luò)的20%所用的時(shí)間越短,或到達(dá)峰值的時(shí)間也越早.進(jìn)一步驗(yàn)證了假設(shè)H1 為真.同樣可以看出,當(dāng)種子用戶的網(wǎng)絡(luò)分布緊密度在0 的基礎(chǔ)上小幅度的提高,其擴(kuò)散速度便有了較大的提高,當(dāng)種子用戶的網(wǎng)絡(luò)分布緊密度繼續(xù)增大時(shí),其對擴(kuò)散速度的增長的影響驟然變小,驗(yàn)證了假設(shè)H2 為真. 圖4 種子用戶的不同分布下基于閾值模型的仿真實(shí)驗(yàn)結(jié)果對比分析圖(N =1 000)Fig.4 Comparison and analysis diagram of simulation experiment results based on threshold model under different distribution of seed users(N =1 000) 圖5 為不同時(shí)刻下,節(jié)點(diǎn)數(shù)量為10 的種子用戶的創(chuàng)新累積采納百分比隨其網(wǎng)絡(luò)緊密度的變化而變化的軌跡圖. 圖5 不同時(shí)刻下,累積采納百分比隨種子用戶緊密度變化而變化曲線(N =10,1 000)Fig.5 The change curve of cumulative adoption percentage with the change of seed user tightness at different times(N =10,N =1 000) 可以看出,初期擴(kuò)散取得成功時(shí)(擴(kuò)散至整個(gè)目標(biāo)網(wǎng)絡(luò)的20%用戶),即t=18 時(shí)刻下,軌跡曲線圖在臨界緊密度c10?5?2前后變化存在顯著差異.在臨界緊密度之前,曲線非常陡峭,在臨界緊密度后,曲線驟然變緩,幾乎呈水平線.節(jié)點(diǎn)數(shù)量N = 100 實(shí)驗(yàn)中在t = 7 時(shí)刻下,軌跡曲線圖在臨界緊密度c1000?500?2前后變化存在顯著差異.在節(jié)點(diǎn)數(shù)量N =10 實(shí)驗(yàn)中,類似情況出現(xiàn)在t=13 時(shí)刻臨界緊密度為c100?50?2時(shí). 因此,初始種群節(jié)點(diǎn)數(shù)量規(guī)模為10,100 和1 000 實(shí)驗(yàn)的共同結(jié)論是當(dāng)種子用戶的網(wǎng)絡(luò)緊密度在0的基礎(chǔ)上有小幅度提升時(shí),創(chuàng)新擴(kuò)散的速度迅速得到提升.然而,緊密度提升到1的過程中,種子用戶的網(wǎng)絡(luò)緊密度對創(chuàng)新擴(kuò)散速度的正向影響呈加速式遞減,假設(shè)H2 為真. 選取不同節(jié)點(diǎn)數(shù)量的種子用戶(10,100 和1 000)進(jìn)行仿真實(shí)驗(yàn)對比分析發(fā)現(xiàn),擴(kuò)散的初始階段,擴(kuò)散速度最慢的為c10?10?1,擴(kuò)散速度最快的為c1000?1?1000(與c1000?500?2幾乎重疊,如圖6).這一方面說明初始傳播階段,由于初始種群的數(shù)量規(guī)模相差較大(100 倍),種子用戶群的數(shù)量越大,擴(kuò)散的速度越快,這也比較符合現(xiàn)實(shí)情況. 另外一個(gè)有趣的現(xiàn)象是,c10?1?10擴(kuò)散至整個(gè)網(wǎng)絡(luò)的20%所用時(shí)間比c100?100?1要短,同樣c100?1?100擴(kuò)散至整個(gè)網(wǎng)絡(luò)的20%所用時(shí)間比c1000?1000?1的時(shí)間短.顯然在一定節(jié)點(diǎn)數(shù)量范圍內(nèi),種子用戶的較為集聚,能夠彌補(bǔ)其數(shù)量方面劣勢,種子用戶的網(wǎng)絡(luò)緊密度對擴(kuò)散速度的正向影響更為顯著. 基于閾值模型的仿真實(shí)驗(yàn)只考慮初始種子用戶的網(wǎng)絡(luò)分布以及擴(kuò)散中信息的累積效應(yīng)對社交產(chǎn)品擴(kuò)散的影響,沒有考慮社交網(wǎng)絡(luò)中用戶之間的相關(guān)性,即一個(gè)用戶對另一個(gè)用戶的創(chuàng)新采納決策影響力.在現(xiàn)實(shí)的社交網(wǎng)絡(luò)中,當(dāng)社會網(wǎng)絡(luò)結(jié)構(gòu)確定時(shí),社交產(chǎn)品是通過節(jié)點(diǎn)(用戶)間的相互連接來進(jìn)行擴(kuò)散的,不同節(jié)點(diǎn)之間相互影響力是不同的,而節(jié)點(diǎn)的影響力在一定程度上表現(xiàn)為節(jié)點(diǎn)vi的度數(shù)ki和與之相連的節(jié)點(diǎn)vj各自的度kj之間相關(guān)性,相關(guān)性越強(qiáng),節(jié)點(diǎn)vi對節(jié)點(diǎn)vj的行為影響力越大.因此,在這種情況下,潛在采用者個(gè)體(即未感染節(jié)點(diǎn))形成的網(wǎng)絡(luò)實(shí)際上是一個(gè)由節(jié)點(diǎn)之間的相關(guān)性形成的權(quán)重網(wǎng)絡(luò).因此,出于完備性的目的,本文進(jìn)一步設(shè)計(jì)了基于節(jié)點(diǎn)之間的相關(guān)性(影響力)的擴(kuò)散仿真實(shí)驗(yàn)來考察初始種子用戶的網(wǎng)絡(luò)分布對社交產(chǎn)品擴(kuò)散的影響. 基于節(jié)點(diǎn)相關(guān)性的仿真實(shí)驗(yàn)的種子用戶選取根據(jù)上述網(wǎng)絡(luò)緊密度模型構(gòu)建規(guī)則以及網(wǎng)絡(luò)分布模型圖的具體構(gòu)建思路,以及基于閾值模型的仿真實(shí)驗(yàn)結(jié)果,選取c100?100?1,c100?50?2,和c100?1?100各3 種不同網(wǎng)絡(luò)緊密度分布進(jìn)行實(shí)驗(yàn). 未感染節(jié)點(diǎn)在決策是否采納某項(xiàng)新產(chǎn)品時(shí),會優(yōu)先考慮它的鄰居中那些已感染的意見領(lǐng)袖或者“明星節(jié)點(diǎn)”的建議.但同時(shí),如果未感染節(jié)點(diǎn)的鄰居非常少,即使這些鄰居只是普通節(jié)點(diǎn)(即度值比較小),也會對未感染節(jié)點(diǎn)產(chǎn)生比較大的影響,因?yàn)橛捎卩従訑?shù)比較少增大了未感染節(jié)點(diǎn)看到已感染節(jié)點(diǎn)傳播的信息的概率,進(jìn)而也會使增大該節(jié)點(diǎn)被感染的概率. 設(shè)節(jié)點(diǎn)i 的度數(shù)為ki,節(jié)點(diǎn)j 的度數(shù)為kj,i,j 直接相連,則節(jié)點(diǎn)j 對i 的相關(guān)性為 基于節(jié)點(diǎn)相關(guān)性的擴(kuò)散仿真實(shí)驗(yàn)的感染規(guī)則:首先計(jì)算所有已感染節(jié)點(diǎn)和它的鄰居未感染節(jié)點(diǎn)之間的相關(guān)性,將該相關(guān)值作為刺激值,根據(jù)其數(shù)值從大到小排列,未感染節(jié)點(diǎn)受到相同或者不同節(jié)點(diǎn)的感染刺激閾值δ ≥10. 仿真實(shí)驗(yàn)結(jié)果分析100 次重復(fù)實(shí)驗(yàn)結(jié)果如圖6 所示, 種子用戶的網(wǎng)絡(luò)緊密度越大, 創(chuàng)新擴(kuò)散曲線越陡峭; 無論是平均值還是中位數(shù)的擴(kuò)散曲線都可以看出, c100?50?2和c100?1?100擴(kuò)散至整個(gè)網(wǎng)絡(luò)的20%(約40 000 個(gè)節(jié)點(diǎn))所用的時(shí)間均遠(yuǎn)小于c100?100?1時(shí)所用的時(shí)間,即種子用戶的網(wǎng)絡(luò)緊密度越大,創(chuàng)新擴(kuò)散的速度越快.其中c100?50?2和c100?1?100下速度雖然相差不大,但是c100?50?2的擴(kuò)散速度要大于c100?1?100的擴(kuò)散速度,說明基于節(jié)點(diǎn)之間相關(guān)性的擴(kuò)散規(guī)則下,種子用戶的網(wǎng)絡(luò)分布集聚狀態(tài)下的擴(kuò)散速度均比分散狀態(tài)下的要好,但是超過一定臨界值后敏感性減弱,因此,在實(shí)際的應(yīng)用中,需要根據(jù)節(jié)點(diǎn)的數(shù)量選擇適當(dāng)緊密度的種子用戶進(jìn)行社交產(chǎn)品的擴(kuò)散.由此驗(yàn)證假設(shè)H1 為真. 圖6 種子用戶的不同分布下基于閾值模型的仿真實(shí)驗(yàn)結(jié)果(N =10,100,1 000)Fig.6 Threshold model based simulation result on different seed user distribution(N =10,100,1 000) N =100 時(shí)的種子用戶的不同分布下基于節(jié)點(diǎn)相關(guān)性的仿真實(shí)驗(yàn)結(jié)果如圖7 所示.由圖7 的不同時(shí)刻的平均值和中位數(shù)擴(kuò)散曲線可以看出,初始種群的節(jié)點(diǎn)數(shù)量為100 時(shí),隨著其緊密度的增大,社交產(chǎn)品的擴(kuò)散速度的增大幅度先增大大過了臨界值后減慢,即初始種群緊密度對于擴(kuò)散速度正向影響是加速遞減的,驗(yàn)證了假設(shè)H2 為真. 圖7 種子用戶的不同分布下基于節(jié)點(diǎn)相關(guān)性的仿真實(shí)驗(yàn)結(jié)果(N =100)Fig.7 Node correlation based simulation result on different seed user distribution(N =100) 圖8 為不同時(shí)刻下,節(jié)點(diǎn)數(shù)量為100 的種子用戶群的創(chuàng)新累積采納百分比隨其網(wǎng)絡(luò)緊密度的變化軌跡.可以看出在t=13 時(shí)刻下,隨著種子用戶網(wǎng)絡(luò)緊密度的增大,創(chuàng)新累積采納百分比先加速爬升,然后驟然變緩,臨界緊密度均為c100?50?2,當(dāng)種子用戶的網(wǎng)絡(luò)緊密度由c100?100?1增大到c100?50?2時(shí),創(chuàng)新累積采納百分比有很大幅度的提升,而當(dāng)種子用戶的網(wǎng)絡(luò)緊密度由c100?50?2繼續(xù)增大到c100?1?100的過程中,創(chuàng)新累積采納百分比增大幅度差異極小.可見,種子用戶節(jié)點(diǎn)數(shù)量規(guī)模為100 情況下,種子用戶網(wǎng)絡(luò)分布緊密度對創(chuàng)新擴(kuò)散速度的提升作用并非都是顯著的,當(dāng)種子用戶的網(wǎng)絡(luò)緊密度在0 的基礎(chǔ)上有小幅度提升時(shí),創(chuàng)新擴(kuò)散的速度迅速得到提升,然而,當(dāng)種子用戶的網(wǎng)絡(luò)緊密度進(jìn)一步提升到1 的過程中,種子用戶緊密度對創(chuàng)新擴(kuò)散速度的影響幾乎很小,種子用戶的網(wǎng)絡(luò)緊密度對創(chuàng)新擴(kuò)散速度的正向影響加速遞減,進(jìn)一步驗(yàn)證了假設(shè)H2 為真. 圖8 基于閾值實(shí)驗(yàn),不同時(shí)刻下,累積采納百分比隨種子用戶緊密度變化曲線(N =100)Fig.8 Based on the threshold experiment,the change curve of cumulative adoption percentage with seed user tightness at different time points(N =100) 圖9 為基于節(jié)點(diǎn)相關(guān)度實(shí)驗(yàn), 也有同樣結(jié)論.與節(jié)點(diǎn)數(shù)量為100 的基于閾值實(shí)驗(yàn)相比, 不同在于時(shí)刻t = 9,臨界緊密度c100?5?2前后出現(xiàn)顯著差異.顯然,找感興趣的人進(jìn)行傳播,效率更高,這也與人們生活實(shí)踐中的思維習(xí)慣一致. 圖9 基于節(jié)點(diǎn)相關(guān)度實(shí)驗(yàn),不同時(shí)刻下,創(chuàng)新累積采納百分比隨種子用戶緊密度變化的曲線(N =100)Fig.9 Based on the node correlation experiment,the curve of cumulative adoption percentage of innovation as a function of seed user tightness at different time points(N =100) 本文基于大規(guī)模興趣社交網(wǎng)絡(luò),選取不同數(shù)量的種子用戶,利用基于不同的擴(kuò)散規(guī)則結(jié)合已有的步進(jìn)累積研究方法,驗(yàn)證了種子用戶緊密程度與擴(kuò)散效率的正相關(guān)關(guān)系.論文的貢獻(xiàn)在于從微觀角度出發(fā),研究擴(kuò)散過程的影響因素,同時(shí)利用大規(guī)模真實(shí)社會網(wǎng)絡(luò)數(shù)據(jù)進(jìn)行仿真,使研究在實(shí)際社交網(wǎng)絡(luò)中得到高信度的驗(yàn)證.論文同時(shí)還發(fā)現(xiàn)了緊密度的貢獻(xiàn)存在瓶頸,其現(xiàn)實(shí)解釋為,緊密度是推動初期擴(kuò)散的主要因素,但到了一定閾值之后作用被其他潛在因素替代,這也是未來需要進(jìn)一步探討的問題. 在營銷實(shí)踐中,選取的種子用戶符合集聚網(wǎng)絡(luò)的分布特征時(shí),反而會比分散“撒網(wǎng)”策略更有利于新產(chǎn)品的擴(kuò)散.論文的結(jié)論有助于企業(yè)在有限的營銷預(yù)算下,選取適合的種子用戶網(wǎng)絡(luò)分布策略,有效地投放營銷資源,提高產(chǎn)品傳播能力和采納率,帶來更大經(jīng)濟(jì)和社會效益.此外,鑒于種子用戶的網(wǎng)絡(luò)緊密度超過一定的臨界值后,其緊密度對創(chuàng)新擴(kuò)散速度的提升幅度呈加速減小趨勢,因此需要根據(jù)企業(yè)的實(shí)際情況以及預(yù)期擴(kuò)散效果和擴(kuò)散數(shù)量,選擇合適集聚程度的種子用戶分布進(jìn)行新產(chǎn)品的推廣.3.3 基于閾值模型的仿真實(shí)驗(yàn)結(jié)果對比分析
3.4 基于節(jié)點(diǎn)相關(guān)性的仿真實(shí)驗(yàn)
4 結(jié)束語