張丹
摘 要 在線社區(qū)把不同群體以及不同個(gè)人聚集起來形成了一個(gè)社交網(wǎng)絡(luò),冪律分布應(yīng)運(yùn)而生,本文將進(jìn)一步探討社交網(wǎng)絡(luò)中冪律分布的形成機(jī)理,提出四種機(jī)制,即“偏好依附”、“最小努力”、“直接互惠”、“間接互惠”。本文使用NetLogo軟件,對四種機(jī)制進(jìn)行了仿真,通過可視化界面得出了冪律分布。
關(guān)鍵詞 在線社區(qū) 冪律分布 NetLogo仿真
中圖分類號:TN915 文獻(xiàn)標(biāo)識碼:A
0前言
近些年,在線社區(qū)作為一種新穎的組織形式,不同于傳統(tǒng)的市場,通過不斷的互動,將具有共同興趣的個(gè)人聚集到一起。當(dāng)有共同愛好的人依靠社交媒體相互交流時(shí),在線社區(qū)應(yīng)運(yùn)而生。他們在很大程度上依靠IT基礎(chǔ)設(shè)施,現(xiàn)在更多更好的社會網(wǎng)絡(luò)平臺進(jìn)入了人們的生活。
隨著網(wǎng)絡(luò)科學(xué)的發(fā)展,研究者已經(jīng)通過研究表明許多復(fù)雜的物理、生物、信息以及社會系統(tǒng)都可以用冪律分布來刻畫。這些網(wǎng)絡(luò)通常滿足一個(gè)無標(biāo)度的分布,而不是正態(tài)分布,在這些網(wǎng)絡(luò)中,存在一些連接,很少一部分的參與人與其他參與人建立了很多的聯(lián)系,而其他大部分的參與人和別人建立較少的關(guān)系。盡管有許多不同冪律形成的理論,大部分的解釋都是“偏好依附”,本文還將考慮另外三種因素對冪律分布形成的影響,即:最小努力、直接互惠、間接互惠。
本文的目的是進(jìn)一步了解冪律分布在在線社區(qū)中是如何形成的。
1在線社區(qū)模型
1.1模型描述
在線社區(qū)中,參與人進(jìn)入系統(tǒng)建立帖子,并回復(fù)其他人發(fā)表的帖子,以下,我們先對參與人、帖子、以及回復(fù)一一進(jìn)行描述:
(1)參與人:進(jìn)入系統(tǒng);發(fā)表一條消息開始一個(gè)新的帖子或者主題;對以后的帖子進(jìn)行一條回復(fù);離開系統(tǒng)。所有的參與人都有一樣的行為:新的參與人可能隨時(shí)到來;任何一個(gè)活躍的參與人能發(fā)表一條消息開始一個(gè)帖子;任何一個(gè)活躍的參與人能對一個(gè)開放的帖子進(jìn)行回復(fù);活躍的參與人可能隨時(shí)離開系統(tǒng)。
為了促進(jìn)建模,我們假設(shè)參與人是按如下的規(guī)則行動的:一個(gè)參與人一到來就發(fā)表一條消息開始一個(gè)帖子;參與者一旦離開系統(tǒng)后,他們不能再重新進(jìn)入;當(dāng)仿真開始的時(shí)候,系統(tǒng)中沒有參與人;參與人將會有0到預(yù)設(shè)的最大值之間的機(jī)會對別人的帖子進(jìn)行回復(fù)。
(2)回復(fù):每條回復(fù)屬于并且僅屬于一個(gè)帖子;所有的回復(fù)被視為開始帖子的那條回復(fù)的。
(3)帖子:新的帖子是由處于系統(tǒng)中活躍的參與人或者新進(jìn)入的參與人在任何時(shí)間創(chuàng)建的;任何活躍的或者新進(jìn)入的參與人可能對開放的帖子進(jìn)行回復(fù)。一般而言,人們更希望看那些最近較新的帖子,我們?yōu)榱烁F(xiàn)實(shí)更近似,假設(shè):在帖子被創(chuàng)建8個(gè)時(shí)間單位以后,帖子變得不活躍。
參與者進(jìn)入到系統(tǒng)中,首先發(fā)一條新消息,從而開始一個(gè)新的帖子,當(dāng)他還是活躍的時(shí)候,可以按照四種回帖機(jī)制對其他參與者的帖子進(jìn)行回復(fù),其中,參與者按照一定的到來規(guī)律進(jìn)入系統(tǒng)不斷發(fā)帖或回帖,最后當(dāng)參與者變成不活躍的時(shí)候會離開系統(tǒng)。
2冪律分布產(chǎn)生機(jī)制
在“偏好依附”的機(jī)制中,各參與人更愿意選擇查看熱門、回復(fù)率高的帖子并回復(fù),選擇一個(gè)主體進(jìn)行回復(fù)的可能性與這些主體在之前得到的回復(fù)正相關(guān),這里把每個(gè)主體得到的總回復(fù)數(shù)量定義為入度,因此,選擇一個(gè)主體進(jìn)行回復(fù)的概率與這些主體的入度是成正比的。
在“最小努力”的機(jī)制中,每個(gè)活躍的主體在發(fā)表帖子上表現(xiàn)出不同的難易程度,因此,根據(jù)每個(gè)參與人的簡易性程度,給予每個(gè)參與人一個(gè)相對的權(quán)重。給每個(gè)參與人一個(gè)權(quán)重以后,這個(gè)值在整個(gè)網(wǎng)絡(luò)形成的仿真中保持不變。一個(gè)焦點(diǎn)主體在決定回復(fù)哪個(gè)參與人的帖子時(shí),他會根據(jù)前面所說的最小努力權(quán)重隨機(jī)地選擇參與人。如果這個(gè)被選擇的參與人有不止一個(gè)活躍的帖子時(shí),那么就回復(fù)他所創(chuàng)建的第一個(gè)帖子。
在“直接互惠”的機(jī)制中,選擇一個(gè)主體進(jìn)行回復(fù)的可能性是基于先前的交流歷史的。首先要估計(jì)每一個(gè)潛在主體的權(quán)重:rij表示焦點(diǎn)主體i對潛在主體j的回復(fù)數(shù)量,rji表示潛在主體對焦點(diǎn)主體的回復(fù)數(shù)量:
如果rij=0且rji>0,設(shè)潛在主體的權(quán)重為2
如果rij=0且rji=0,設(shè)潛在主體的權(quán)重為1
如果rij>0且rji>0,設(shè)潛在主體的權(quán)重為(1+(rij€Harji)/(rij+rji))
在“間接互惠”的機(jī)制中,一個(gè)主體創(chuàng)建新鏈接的可能性是由他之前發(fā)表回復(fù)以及收到回復(fù)的歷史決定的,所以,我們用主體的入度與出度的比例來表示。如果一個(gè)主體收到許多回復(fù),但是很少回復(fù)其他的主體,則他們的入度將會超過他們的出度,那么入度與出度的比例大于1,且主體會有更大創(chuàng)建新帖子的可能性;如果一個(gè)主體給其他主體很多回復(fù),而沒有收到很多回復(fù),則入度和出度的比例小于1,那么主體創(chuàng)建新帖子的可能性就會很小。開始時(shí),一個(gè)主體還沒有給別人回復(fù)時(shí),即出度為0時(shí),給他們一個(gè)平均傾向建立新的聯(lián)系。
3 NetLogo仿真及結(jié)果
3.1變量
首先定義了兩個(gè)主體——參與人和帖子,并給他們定義了一些局部變量,其中每個(gè)參與人有入度、出度、到來時(shí)間、最小努力權(quán)重、入度/出度比,每個(gè)帖子都應(yīng)該記錄創(chuàng)建時(shí)間,以及帖子收到的回復(fù)數(shù)量。
另外,還定義了一些有向連接和無向連接,用無向連接建立參與人與帖子的關(guān)系,用有向連接來建立參與人與參與人之間的關(guān)系。
3.2 程序模塊
程序模塊包括了參與者的到來、發(fā)帖、回帖、回帖機(jī)制、離開動作。
(1)參與者的到來。根據(jù)雅虎提供的數(shù)據(jù)參考,平均的參與人是165,因此到來間隔為165/365,所以到來的累積分布為:y = 0.452x,離開的累積分布為:y = 0.067lnx + 0.431。
參與者到來之后,用 ticks記錄到來的時(shí)間,隨機(jī)給參與者一個(gè)位置,設(shè)置一些屬性,包括大小、顏色等,并創(chuàng)建一個(gè)帖子。初始狀態(tài)下,出度和入度都為0。由于回帖機(jī)制“最小努力”中,需要給每個(gè)參與者一個(gè)最小努力的權(quán)重,因此在參與人到來時(shí)就給他產(chǎn)生一個(gè)隨機(jī)數(shù)來表示最小努力權(quán)重。
(2)發(fā)帖。創(chuàng)建一條新的帖子,首先記錄發(fā)帖的時(shí)間,其他參與人只能在8天(ticks)內(nèi)對該帖子進(jìn)行回復(fù),還能設(shè)置帖子的大小、顏色等。在創(chuàng)建帖子初始就生成了一條回復(fù),因此一條新的帖子的初始回復(fù)數(shù)量為1。創(chuàng)建帖子之后,還需要在參與者與帖子之間建立一個(gè)無向連接,才能保證帖子是屬于該創(chuàng)建者的。
(3)回帖。本文考慮的是一種混合的機(jī)制,因此將全部活躍的參與者隨機(jī)地均勻地分成4組,分別給予標(biāo)簽,按“偏好依附”、“最小努力”、“直接互惠”、“間接互惠”的機(jī)制選擇帖子回復(fù)。每個(gè)參與者可以有0到預(yù)設(shè)的最大值之間的機(jī)會進(jìn)行回帖,最大的回復(fù)數(shù)量可以在按鈕中進(jìn)行設(shè)置?;靥臄?shù)量也是個(gè)隨機(jī)變量,需要在0到最大值之間隨機(jī)選擇。
(4)回帖機(jī)制。在“偏好依附”機(jī)制中,每個(gè)參與人會根據(jù)參與人的入度來決定回復(fù)哪個(gè)參與人的帖子,在0到最大入度之間生成一個(gè)隨機(jī)數(shù),在入度大于這個(gè)隨機(jī)的參與人之間任意選擇一個(gè)進(jìn)行回復(fù)。另外,回帖的數(shù)量應(yīng)該由小于最大值的隨機(jī)數(shù)產(chǎn)生。在回復(fù)過程中,需要建立參與者與參與者之間的回復(fù)與被回復(fù)關(guān)系,本文規(guī)定每個(gè)參與者在選擇某個(gè)參與人之后,回復(fù)他的第一條帖子。當(dāng)回復(fù)成功,該參與者的出度加上1,而被回帖的參與者的入度加上1,且被回復(fù)的帖子的回復(fù)數(shù)也應(yīng)該加上1。在“最小努力”機(jī)制中,最小努力,參與人是根據(jù)其他每個(gè)參與者的“最小努力”權(quán)重來選擇回帖的,權(quán)重越大,表示參與者的帖子越容易被回復(fù),同樣引入一個(gè)隨機(jī)數(shù),在0到最大的權(quán)重之間隨機(jī)產(chǎn)生一個(gè)隨機(jī)數(shù)作為臨界點(diǎn),然后在權(quán)重大于這個(gè)臨界點(diǎn)的參與者之間任意選擇一個(gè)參與者回復(fù),另外,回帖的數(shù)量同前面一樣,應(yīng)該由小于最大值的隨機(jī)數(shù)產(chǎn)生。在“直接互惠”機(jī)制中,為每個(gè)潛在的參與人制定直接互惠的權(quán)重(在0到2之間)。在這種機(jī)制中,選擇哪個(gè)參與者的帖子進(jìn)行回復(fù)取決于權(quán)重的大小,同前面一樣,并不是一定選擇權(quán)重最大的參與人的帖子進(jìn)行回復(fù),而是權(quán)重越大,被回復(fù)的可能性越大。同樣的,在0到2之間隨機(jī)生成一個(gè)浮點(diǎn)數(shù)作為臨界值,在權(quán)重大于這個(gè)臨界值的參與人中選擇一個(gè)進(jìn)行回復(fù),且回復(fù)這個(gè)參與人創(chuàng)建的第一個(gè)帖子?;貜?fù)帖子的次數(shù)如前面一樣,應(yīng)該在0到最大值之間任意產(chǎn)生一個(gè)隨機(jī)數(shù),用一個(gè)循環(huán)實(shí)現(xiàn)多次回復(fù)。確定回復(fù)次數(shù),回復(fù)誰的帖子之后,被回復(fù)的參與者的和第一條帖子的回復(fù)分別應(yīng)該加1,而該參與者本身的也應(yīng)該加1。在“間接互惠”機(jī)制中,選擇回復(fù)的標(biāo)準(zhǔn)是入度與出度的比,當(dāng)參與者的這個(gè)比例越大,那么被回復(fù)的可能性越大。在活躍的參與者中找到該比例最大的參與者,在0到最大的比例之間產(chǎn)生一個(gè)隨機(jī)數(shù)作為臨界點(diǎn),在比例大于臨界點(diǎn)的參與者中任意選擇一個(gè)回復(fù),回復(fù)的次數(shù)跟前面一樣隨機(jī)產(chǎn)生。
(5)離開。當(dāng)參與者進(jìn)入系統(tǒng)一段時(shí)間,按照離開的累積分布使其變?yōu)椴换钴S狀態(tài),在NetLogo中,因?yàn)樾枰y(tǒng)計(jì)參與者的人數(shù),帖子數(shù)目以及回復(fù)數(shù)量。
3.3結(jié)果
通過各個(gè)模塊的實(shí)現(xiàn),可以得出結(jié)果如圖1:
從輸出的圖可以看出,入度較大的參與者較少,因?yàn)楦鱾€(gè)參與人在選擇帖子回復(fù)時(shí),會集中地選擇這類入度較大的參與者的帖子回復(fù),因此在365天之后,入度越大的參與者被回復(fù)越來越多,而絕大多數(shù)群體的這些入度較小的參與者收到的回復(fù)越來越小,這種在線的網(wǎng)絡(luò)社區(qū)就形成了冪律分布。
4結(jié)論
本文運(yùn)用NetLogo對在線社區(qū)進(jìn)行了仿真,模擬了網(wǎng)絡(luò)中的寫貼回帖交流平臺,根據(jù)提出的四種回帖機(jī)制——“偏好依附”、“最小努力”、“直接互惠”、“間接互惠”,對系統(tǒng)各個(gè)模塊進(jìn)行了構(gòu)建。最后通過可視化界面輸入結(jié)果,結(jié)果表明:這種在線的社區(qū)形成了冪律分布。
參考文獻(xiàn)
[1] 賀愛忠,李雪.在線品牌社區(qū)成員持續(xù)參與行為形成的動機(jī)演變機(jī)制研究[J].管理科學(xué), 2015,12(5):733-743.
[2] Ren,Y.,Kraut,R.,and Kiesler,S.Applying Common Identity and Bond Theory to Design of Online Communities[J].Organization Studies,2007,28(3):377-408.