魏建冬 覃錫忠 賈振紅 牛紅梅
關(guān)鍵詞: 用戶影響力; 非冗余信息; 用戶行為; 結(jié)構(gòu)洞; 網(wǎng)絡(luò)約束系數(shù); 覆蓋率
中圖分類號(hào): TN911?34; TP393 ? ? ? ? ? ? ? ? ? ?文獻(xiàn)標(biāo)識(shí)碼: A ? ? ? ? ? ? ? ? ? ? 文章編號(hào): 1004?373X(2019)05?0164?05
User influence comprehensive evaluation model based on user behavior
and structure hole principle
WEI Jiandong1, QIN Xizhong1, JIA Zhenhong1, NIU Hongmei2
(1. College of Information Science and Engineering, Xinjiang University, Urumqi 830046, China;
2. Department of Network Monitoring, China Mobile Communications Group Xinjiang Limited, Urumqi 830046, China)
Abstract: Since the non?redundant information is not fully considered in current most user influence measurement methods, the user influence comprehensive evaluation model based on user behavior and structure hole principle is constructed. The user behavior is quantified, and integrated into the edge weight of the network. On this basis, the network constraint coefficients are improved by means of structural hole method to consider the influence of user behavior on the edge weight of the network, and solve the problem of three?layer topological relationship among the node, adjacent node and subjacent node. The user influence comprehensive evaluation model is constructed, and verified with the data from Sina MicroBlog. The results of sequencing experiment and coverage ratio experiment show that the user influence measurement of the model is accurate and valid.
Keywords: user influence; non?redundant information; user behavior; structural hole; network constraint coefficient; coverage ratio
用戶影響力度量是在線社交影響力分析的核心問(wèn)題之一,用戶影響力指通過(guò)用戶等受其他用戶的影響而變化的現(xiàn)象[1],它可以應(yīng)用到推薦系統(tǒng)、網(wǎng)絡(luò)信息傳播的預(yù)測(cè)、鏈路預(yù)測(cè)、病毒式營(yíng)銷、突發(fā)事件預(yù)測(cè)等領(lǐng)域[2?3]。
目前用戶影響力的度量方法大多基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)、用戶交互行為(轉(zhuǎn)發(fā)、評(píng)論、提及)兩個(gè)角度[4]。這些方法各有側(cè)重點(diǎn),但對(duì)用戶間的非冗余信息考慮不全[5]。基于網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)的方法中,度中心性[6]、聚類系數(shù)[7]等方法從局部角度出發(fā),考慮了節(jié)點(diǎn)與鄰居節(jié)點(diǎn)的數(shù)量關(guān)系,對(duì)節(jié)點(diǎn)間拓?fù)浣Y(jié)構(gòu)欠缺考慮,對(duì)節(jié)點(diǎn)間的非冗余信息考慮不足[1];Closeness和Betweeness[8]等方法從全局角度出發(fā),以網(wǎng)絡(luò)平均路徑衡量用戶影響力,無(wú)法兼顧節(jié)點(diǎn)間的非冗余信息,且要求全連通網(wǎng)絡(luò)且計(jì)算復(fù)雜度高,不適用于大型社交網(wǎng)絡(luò)[4];基于用戶交互行為的方法基于用戶的評(píng)論、轉(zhuǎn)發(fā)、提及等行為,文獻(xiàn)[9]將用戶行為與PageRank算法[10]相結(jié)合,同時(shí)考慮用戶文本,對(duì)用戶影響力進(jìn)行度量;文獻(xiàn)[11]從消息的轉(zhuǎn)發(fā)和時(shí)間角度對(duì)用戶影響力度量,沒(méi)有考慮網(wǎng)絡(luò)拓?fù)涞挠绊憽_@類方法多考慮了鄰近節(jié)點(diǎn)間的用戶行為,對(duì)非冗余信息的考慮同樣不足。
針對(duì)用戶影響力度量中非冗余信息考慮不全的問(wèn)題,研究發(fā)現(xiàn)[12]:結(jié)構(gòu)洞節(jié)點(diǎn)可以從網(wǎng)絡(luò)中獲得更多的非冗余信息,更好地觀測(cè)信息的流向,評(píng)價(jià)用戶影響力。文獻(xiàn)[13]實(shí)驗(yàn)發(fā)現(xiàn),在線社交網(wǎng)絡(luò)Twitter上1%的結(jié)構(gòu)洞用戶決定了用戶之間25%的信息傳播。文獻(xiàn)[14]提出一種小范圍度量方法尋找目標(biāo)網(wǎng)絡(luò)中的結(jié)構(gòu)洞節(jié)點(diǎn)。文獻(xiàn)[15]提出識(shí)別Top?[k]結(jié)構(gòu)洞關(guān)鍵節(jié)點(diǎn)的HIS算法和MaxD算法,文獻(xiàn)[5]基于平均距離尋找結(jié)構(gòu)洞節(jié)點(diǎn),文獻(xiàn)[16]結(jié)合評(píng)價(jià)結(jié)構(gòu)洞的多個(gè)指標(biāo),利用排序?qū)W習(xí)算法對(duì)節(jié)點(diǎn)影響力進(jìn)行評(píng)價(jià)。這些方法都未考慮用戶行為對(duì)網(wǎng)絡(luò)邊權(quán)的影響,同時(shí)未考慮節(jié)點(diǎn)與鄰近節(jié)點(diǎn)、次鄰近節(jié)點(diǎn)的三層拓?fù)浣Y(jié)構(gòu)。文獻(xiàn)[17]研究發(fā)現(xiàn),在線社交網(wǎng)絡(luò)中91.6%的消息連續(xù)傳播在3次以內(nèi),考慮三層節(jié)點(diǎn)的拓?fù)浣Y(jié)構(gòu)能全面地評(píng)價(jià)用戶節(jié)點(diǎn)的影響力。
針對(duì)用戶影響力度量非冗信息考慮不全的問(wèn)題,本文引入結(jié)構(gòu)洞理論,同時(shí)針對(duì)結(jié)構(gòu)洞評(píng)價(jià)中存在的問(wèn)題,對(duì)結(jié)構(gòu)洞評(píng)價(jià)方法——網(wǎng)絡(luò)約束系數(shù)進(jìn)行改進(jìn),最后構(gòu)建基于用戶行為和結(jié)構(gòu)洞的用戶影響力評(píng)價(jià)模型。通過(guò)新浪微博對(duì)用戶影響力進(jìn)行度量實(shí)驗(yàn),說(shuō)明本文模型度量用戶影響力的有效性與準(zhǔn)確性。
1.1 ?結(jié)構(gòu)洞理論
假設(shè)存在用戶節(jié)點(diǎn)[A],[B],[C],[D],節(jié)點(diǎn)間連接情況如圖1所示。非冗余信息[5]指通過(guò)不同用戶的聯(lián)系獲得的非重疊信息,節(jié)點(diǎn)[A]和節(jié)點(diǎn)[D]沒(méi)有直接連接而存在非冗余信息。文獻(xiàn)[14]指出,結(jié)構(gòu)洞是連接兩個(gè)非冗余用戶的橋梁,用戶間的非冗余聯(lián)系即為結(jié)構(gòu)洞。節(jié)點(diǎn)[C]分別與[A]和[D],[B]和[D]構(gòu)成了結(jié)構(gòu)洞關(guān)系,[C]作為結(jié)構(gòu)洞節(jié)點(diǎn)。而由于[A]和[B]有連接,存在冗余聯(lián)系,則[C]與[A]和[B]不能構(gòu)成結(jié)構(gòu)洞關(guān)系。
1.2 ?結(jié)構(gòu)洞評(píng)價(jià)方法分析
為了描述節(jié)點(diǎn)間的閉合程度,文獻(xiàn)[14]提出網(wǎng)絡(luò)約束系數(shù)(CT),描述節(jié)點(diǎn)運(yùn)用結(jié)構(gòu)洞的程度:
[Cij=pij+qpiqpqj2] ?(1)
式中:[Cij]表征節(jié)點(diǎn)[j]與節(jié)點(diǎn)[i]的約束大小,[q≠i,j],節(jié)點(diǎn)[q]是節(jié)點(diǎn)[i]和[j]的共同相鄰節(jié)點(diǎn);[pij]為節(jié)點(diǎn)[i]花費(fèi)在節(jié)點(diǎn)[j]上的精力占[i]花費(fèi)總精力的比例,[pij=zijk∈Γ(i)zik],[zij]表示[i,j]兩節(jié)點(diǎn)的連接情況,有連接其值為1,反之為0,[Γi]表示節(jié)點(diǎn)[i]的鄰居集合。那么節(jié)點(diǎn)[i]的網(wǎng)絡(luò)約束系數(shù)[Ci]為:
[Constri=jcij] ?(2)
上述方法進(jìn)行節(jié)點(diǎn)重要性評(píng)價(jià)時(shí),存在兩個(gè)問(wèn)題:
1) 沒(méi)有考慮用戶行為(評(píng)論、轉(zhuǎn)發(fā)等)對(duì)網(wǎng)絡(luò)邊權(quán)的影響。如圖2所示,該方法依據(jù)節(jié)點(diǎn)的度進(jìn)行計(jì)算,對(duì)于節(jié)點(diǎn)[D]和[E],根據(jù)式(1),節(jié)點(diǎn)[i]與節(jié)點(diǎn)[E]、節(jié)點(diǎn)[D]的網(wǎng)絡(luò)約束系數(shù)表示為:[CiD=(piD+piBpBD)2=(16+16×13)2=0.049 4=CiE],兩者的網(wǎng)絡(luò)約束系數(shù)大小相同,但節(jié)點(diǎn)[i]與[E,D]以及[E]與[K,D]與[L]連接的邊的權(quán)值不同,兩節(jié)點(diǎn)重要性顯然有差異,同時(shí)節(jié)點(diǎn)間的用戶行為也沒(méi)有考慮,這一點(diǎn)結(jié)構(gòu)洞評(píng)價(jià)沒(méi)有兼顧到。
2) 節(jié)點(diǎn)與鄰居節(jié)點(diǎn)間的兩層拓?fù)浣Y(jié)構(gòu)無(wú)法反映部分節(jié)點(diǎn)的重要性差異。如圖2所示,對(duì)于節(jié)點(diǎn)[E]和[F],根據(jù)式(1),兩節(jié)點(diǎn)有共同的鄰居節(jié)點(diǎn)[A],計(jì)算得:
[CiE=(piE+piApAE)2=(16+16×14)2=0.043 ?4=CiF]
網(wǎng)絡(luò)約束系數(shù)只考慮了節(jié)點(diǎn)與其鄰居節(jié)點(diǎn)的兩層拓?fù)浣Y(jié)構(gòu),但節(jié)點(diǎn)[E]與節(jié)點(diǎn)[F]在本文網(wǎng)絡(luò)中的重要性是不同的,節(jié)點(diǎn)[F]由于與和多節(jié)點(diǎn)存在聯(lián)系的節(jié)點(diǎn)[G]有聯(lián)系,重要程度顯然強(qiáng)于節(jié)點(diǎn)[E]。換言之,節(jié)點(diǎn)[i]在與節(jié)點(diǎn)[F]保持聯(lián)系投入的精力較節(jié)點(diǎn)[E]要多,這一點(diǎn)在結(jié)構(gòu)洞的評(píng)價(jià)中沒(méi)有兼顧到。
本文在進(jìn)行用戶影響力度量時(shí)引入結(jié)構(gòu)洞理論,同時(shí)針對(duì)1.2節(jié)結(jié)構(gòu)洞評(píng)價(jià)方法的兩個(gè)問(wèn)題,做了相應(yīng)改進(jìn),本文算法流程如圖3所示。
2.1 ?融入用戶行為的網(wǎng)絡(luò)邊權(quán)
為考慮用戶行為對(duì)網(wǎng)絡(luò)邊權(quán)的影響,本節(jié)首先對(duì)用戶行為進(jìn)行量化,然后融入到網(wǎng)絡(luò)邊權(quán)計(jì)算中。以新浪微博網(wǎng)絡(luò)為例,在考慮用戶行為(轉(zhuǎn)發(fā)、評(píng)論等)的基礎(chǔ)上,定義網(wǎng)絡(luò)邊權(quán)值。通過(guò)收集微博用戶的三種用戶行為關(guān)系,定義網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)為[G{V,(E,D)}],[V]代表用戶節(jié)點(diǎn)集合,[E]代表邊集合,[D]代表邊權(quán)值集合,它由評(píng)論權(quán)值集合[C]、轉(zhuǎn)發(fā)權(quán)值集合[T]、提及權(quán)值集合[M]三部分構(gòu)成。其中,[C={cij}],[cij]代表評(píng)論權(quán)值,其大小為用戶[vj]對(duì)用戶[vi]所發(fā)微博的評(píng)論總數(shù)。
同理,可得轉(zhuǎn)發(fā)權(quán)值[tij]和提及權(quán)值[mij],且[T={tij}],[M={mij}]。融入用戶行為的邊權(quán)為:
[dij=w1cij+w2tij+w3mij] ? ?(3)
本文默認(rèn)三種用戶行為重要性是一樣的,定義[w1=w2=w3=1],最后得到網(wǎng)絡(luò)的邊權(quán)[dij]。
2.2 ?結(jié)構(gòu)洞評(píng)價(jià)方法的改進(jìn)
為更全面地體現(xiàn)用戶在網(wǎng)絡(luò)中的地位,本節(jié)考慮節(jié)點(diǎn)與鄰近節(jié)點(diǎn)、次鄰近節(jié)點(diǎn)的三層拓?fù)浣Y(jié)構(gòu)對(duì)網(wǎng)絡(luò)約束系數(shù)計(jì)算方法進(jìn)行改進(jìn),最后實(shí)現(xiàn)用戶影響力的度量。
在2.1節(jié)加權(quán)網(wǎng)絡(luò)[G{V,(E,D)}]的基礎(chǔ)上,定義網(wǎng)絡(luò)節(jié)點(diǎn)[i]的權(quán)值度為:
[wi=j∈Gdij] ? (4)
式中[dij]為網(wǎng)絡(luò)邊權(quán)值。節(jié)點(diǎn)[i]的權(quán)值度為與節(jié)點(diǎn)[i]連接的所有邊的邊權(quán)之和,改進(jìn)基于節(jié)點(diǎn)的度的計(jì)算方法為結(jié)合2.1節(jié)網(wǎng)絡(luò)邊權(quán)的計(jì)算方法。
定義節(jié)點(diǎn)[i]的總權(quán)值度為:
[Wi=j∈Γiwj] ?(5)
式中[Γi]表示節(jié)點(diǎn)[i]的鄰居集合。為反映節(jié)點(diǎn)間的三層拓?fù)浣Y(jié)構(gòu),定義節(jié)點(diǎn)的總權(quán)值度。節(jié)點(diǎn)[i]的總權(quán)值度為與節(jié)點(diǎn)[i]相連的所有節(jié)點(diǎn)的權(quán)值度之和。
定義節(jié)點(diǎn)[i]花費(fèi)在節(jié)點(diǎn)[j]上的精力比例[pij]的計(jì)算方法如下:
[pij=wjm∈ΓiWm] (6)
改進(jìn)之后用戶節(jié)點(diǎn)[j]與用戶節(jié)點(diǎn)[i]的網(wǎng)絡(luò)約束系數(shù)為:
[CTij=pij+q(piq×pqj)2] (7)
圖2中,根據(jù)式(7)得:對(duì)于節(jié)點(diǎn)[D]和[E],經(jīng)計(jì)算得:[CTiD=0.022 ?5],[CTiE=0.022 ?6],兩者的網(wǎng)絡(luò)約束系數(shù)存在差異,這是考慮用戶行為對(duì)網(wǎng)絡(luò)邊權(quán)影響的結(jié)果,符合實(shí)際情況。對(duì)于節(jié)點(diǎn)[E]和[F],有[CTiE=0.022 ?6],[CTiF=0.049 ?3],由結(jié)果可知,節(jié)點(diǎn)[i]向節(jié)點(diǎn)[F]投入的精力比向節(jié)點(diǎn)[E]投入的精力多,考慮了兩節(jié)點(diǎn)的三層拓?fù)浣Y(jié)構(gòu),符合實(shí)際情況。
最后,提出本文的用戶影響力評(píng)價(jià)模型:
[Si=j=1nCTij] (8)
3.1 ?數(shù)據(jù)抓取
通過(guò)新浪微博平臺(tái),以一部分用戶作為起點(diǎn),獲取其發(fā)表、轉(zhuǎn)發(fā)等微博內(nèi)容信息,輪流抓取用戶的關(guān)注用戶作為新起點(diǎn),重復(fù)以上操作。本文抓取了自2017?05?27—2017?07?01的微博數(shù)據(jù)。其中包括14 543個(gè)用戶和127 426條微博。
3.2 ?評(píng)價(jià)指標(biāo)
1) 為驗(yàn)證本文模型度量用戶影響力的準(zhǔn)確性,對(duì)比不同算法模型下,影響力排序后用戶中大V用戶所占比例,通過(guò)比較說(shuō)明本文模型的準(zhǔn)確性。
2) 為驗(yàn)證本文模型對(duì)用戶影響力度量的有效性,采用覆蓋率[18](Coverage Ratio,CR)對(duì)模型進(jìn)行評(píng)估。它表征用戶的傳播能力,覆蓋率越大,同時(shí)隨著用戶的傳播能力變強(qiáng),用戶的影響力也會(huì)變大。覆蓋率定義為:
[覆蓋率=傳播范圍總節(jié)點(diǎn)數(shù)×100%] ? ? ? ? (9)
總節(jié)點(diǎn)數(shù)表示用戶通過(guò)自身行為形成的網(wǎng)絡(luò)拓?fù)鋱D中的節(jié)點(diǎn)個(gè)數(shù);傳播范圍指網(wǎng)絡(luò)拓?fù)鋱D中受到用戶行為和結(jié)構(gòu)洞原理的影響,信息通過(guò)用戶行為傳遞,波及到的用戶節(jié)點(diǎn)數(shù)量。
3.3 ?實(shí)驗(yàn)及結(jié)果分析
3.3.1 ?用戶影響力度量準(zhǔn)確性實(shí)驗(yàn)
將本文模型[Si]、度中心性[6]、原始網(wǎng)絡(luò)約束系數(shù)CT、PageRank算法[10]、基于用戶?內(nèi)容分析的TURank模型[9]用在數(shù)據(jù)集上,對(duì)比影響力排序結(jié)果見(jiàn)表1。
表1中為各算法模型篩選的影響力排名前10的用戶(英文簡(jiǎn)寫(xiě))。 最后一行表示篩選用戶中的大V用戶數(shù),本文模型篩選的大V用戶有“雷軍”“王煜全”“盧健生”“王自如ZEALER”等8人,準(zhǔn)確性最好;網(wǎng)絡(luò)約束系數(shù)CT識(shí)別關(guān)注更多的是社團(tuán)間的連接用戶,而忽略了用戶行為因素與三層節(jié)點(diǎn)網(wǎng)絡(luò)拓?fù)湟蛩氐挠绊懀缗琶?0號(hào)的“小米王川”雖然與高影響力節(jié)點(diǎn)“雷軍”等用戶有聯(lián)系,但互動(dòng)頻率低,這點(diǎn)CT沒(méi)能兼顧;度中心性沒(méi)有考慮用戶之間的互動(dòng)行為和節(jié)點(diǎn)在網(wǎng)絡(luò)中的位置,對(duì)非冗余信息考慮不足,效果最差;PR值用戶的粉絲數(shù)相關(guān)過(guò)高,僅識(shí)別出“雷軍”“盧健生”大V用戶,而其他用戶“僵尸粉”用戶過(guò)多,實(shí)驗(yàn)結(jié)果不準(zhǔn)確;TURank綜合考慮用戶文本和用戶行為,效果較好,但缺乏對(duì)節(jié)點(diǎn)三層結(jié)構(gòu)的考慮,相較本文算法不能充分評(píng)價(jià)非冗余信息。
本文進(jìn)一步比較各模型影響力Top100用戶中的大V用戶數(shù),結(jié)果表明,本文模型識(shí)別大影響力用戶數(shù)最多,如圖4所示。
3.3.2 ?用戶影響力度量有效性實(shí)驗(yàn)
進(jìn)行下一步實(shí)驗(yàn)之前,首先進(jìn)行數(shù)據(jù)預(yù)處理,剔除“僵尸粉”用戶的干擾,這類用戶往往以增加目標(biāo)用戶人氣、廣告推銷為目的,基本沒(méi)有有效的用戶行為。本文篩選出已收集數(shù)據(jù)集中網(wǎng)絡(luò)邊權(quán)[dij]大于3的用戶,把它作為標(biāo)準(zhǔn)集。
把本文模型[Si]、PageRank算法、TURank模型用在此標(biāo)準(zhǔn)集上,對(duì)比覆蓋率,結(jié)果如圖5所示。
圖5中,各算法模型隨著用戶數(shù)量的增加,信息傳播的范圍逐漸增大,傳播范圍增長(zhǎng)率大于節(jié)點(diǎn)數(shù)的增長(zhǎng)率,覆蓋率逐漸增大,而隨著用戶數(shù)量的上升,會(huì)出現(xiàn)一些獨(dú)立的用戶節(jié)點(diǎn),覆蓋率增長(zhǎng)速度會(huì)變緩并穩(wěn)定在一定水平。PageRank算法關(guān)注粉絲數(shù)量,忽略了用戶行為和三層節(jié)點(diǎn)網(wǎng)絡(luò)拓?fù)涞挠绊?,覆蓋率總體較低。TURank模型缺乏對(duì)三層節(jié)點(diǎn)間拓?fù)潢P(guān)系的考慮,傳播能力較本文模型低。本文從多角度對(duì)用戶影響力進(jìn)行度量,覆蓋率指標(biāo)表現(xiàn)最優(yōu),說(shuō)明了本文模型的有效性。
本文基于用戶行為和結(jié)構(gòu)洞原理構(gòu)建用戶影響力綜合評(píng)價(jià)模型,以新浪微博為例,對(duì)用戶影響力進(jìn)行度量實(shí)驗(yàn)。針對(duì)目前用戶影響力度量中對(duì)非冗余信息考慮不全的問(wèn)題,本文模型將結(jié)構(gòu)洞原理運(yùn)用到用戶影響力評(píng)價(jià)中,同時(shí)改進(jìn)其評(píng)價(jià)方法——網(wǎng)絡(luò)約束系數(shù)未考慮用戶行為以及節(jié)點(diǎn)與鄰近節(jié)點(diǎn)、次鄰近節(jié)點(diǎn)的三層拓?fù)浣Y(jié)構(gòu)的問(wèn)題,最終實(shí)現(xiàn)對(duì)用戶影響力的度量。實(shí)驗(yàn)結(jié)果驗(yàn)證了本文模型度量用戶影響力的有效性和準(zhǔn)確性。在下一步的工作中,將在本文研究成果的基礎(chǔ)上,對(duì)用戶行為中的主題進(jìn)行識(shí)別,情感進(jìn)行分析,進(jìn)一步優(yōu)化對(duì)用戶影響力的評(píng)價(jià)。
注:本文通訊作者為覃錫忠。
參考文獻(xiàn)
[1] 吳信東,李毅,李磊.在線社交網(wǎng)絡(luò)影響力分析[J].計(jì)算機(jī)學(xué)報(bào),2014(4):735?752.
WU X D, LI Y, LI L. Influence analysis of online social networks [J]. Chinese journal of computers, 2014(4): 735?752.
[2] 王濤,覃錫忠,賈振紅,等.基于相似度和信任度的關(guān)聯(lián)規(guī)則微博好友推薦[J].計(jì)算機(jī)應(yīng)用,2016,36(8):2262?2267.
WANG T, QIN X Z, JIA Z H, et al. Association rules recommendation of MicroBlog friend based on similarity and trust [J]. Journal of computer applications, 2016, 36(8): 2262?2267.
[3] KANNA A F, YACINE A, AJITH A. Models of influence in online social networks [J]. International journal of intelligent systems, 2013, 29(2): 161?183.
[4] 王楠,孫欽東,周亞?wèn)|,等.基于區(qū)域交互模型的SNS網(wǎng)絡(luò)用戶影響力評(píng)估[J].通信學(xué)報(bào),2016,37(1):160?169.
WANG N, SUN Q D, ZHOU Y D, et al. Study on user influence analysis via regional user interaction model in online social networks [J]. Journal on communications, 2016, 37(1): 160?169.
[5] REZVANI M, LIANG W, XU W, et al. Identifying top? k, structural hole spanners in large?scale social networks [C]// 2015 ACM International on Conference on Information and Knowledge Management. Melbourne: ACM, 2015: 263?272.
[6] ALBERT R, BARABASI A L. Topology of evolving networks: local events and universality [J]. Physical review letters, 2000, 85(24): 5234?5237.
[7] CHEN D B, GAO H, L? L, et al. Identifying influential nodes in large?scale directed networks: the role of clustering [J]. Plos ONE, 2013, 8(10): 77455.
[8] LU L J, ZHANG M. Edge betweenness centrality [M]. New York: Springer, 2013.
[9] YAMAGUCHI Y, TAKAHASHI T, AMAGASA T, et al. TURank: twitter user ranking based on user?tweet graph analysis [C]// 2010 International Conference on Web Information Systems Engineering. Berlin: Springer, 2010: 240?253.
[10] WENG J, LIM E P, JIANG J, et al. TwitterRank: finding topic?sensitive influential twitterers [C]// Proceeding of the Third ACM International Conference on Web Search and Data Mining. New York: ACM, 2010: 261?270.
[11] TANG X, YANG C C. Ranking user influence in healthcare social media [J]. ACM transactions on intelligent systems & technology, 2012, 3(4): 1?21.
[12] GUPTA J P, MENON K, MUKKAMALA R R, et al. Identi?fying weak ties from publicly available social media data in an event [C]// 2016 International Academic Mindtrek Confe?rence. Tampere: ACM, 2016: 11?19.
[13] KONG H, LI X, WANG L, et al. Generalized 2D principal component analysis [C]// 2005 IEEE International Joint Conference on Neural Networks. Montreal: IEEE, 2005: 108?113.
[14] BURT R S. Structural holes: the social structure of competition [M]. Cambridge: Harvard University Press, 2010.
[15] LOU T, TANG J. Mining structural hole spanners through information diffusion in social networks [C]// Proceedings of the 22nd International Conference on World Wide Web. Rio de Janeiro: ACM, 2013: 825?836.
[16] 韓忠明,吳楊,譚旭升,等.面向結(jié)構(gòu)洞的復(fù)雜網(wǎng)絡(luò)關(guān)鍵節(jié)點(diǎn)排序[J].物理學(xué)報(bào),2015,64(5):421?429.
HAN Z M, WU Y, TAN X S, et al. Ranking key nodes in complex networks by considering structural holes [J]. Acta physica Sinica, 2015, 64(5): 421?429.
[17] YE S, WU S F. Measuring message propagation and social influence on Twitter.com [C]// Proceedings of the Second International Conference on Social Informatics. Laxenburg: Springer?Verlag, 2010: 216?231.
[18] HOU W, HUANG Y, ZHANG K. Research of micro?blog diffusion effect based on analysis of retweet behavior [C]// 2015 IEEE International Conference on Cognitive Informatics & Cognitive Computing. Beijing: IEEE, 2015: 255?261.