• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于多關系與屬性的主題層次影響力評估算法

      2015-01-04 06:28:08劉久云黃廷磊華綠綠
      桂林電子科技大學學報 2015年4期
      關鍵詞:博文影響力空間

      劉久云,黃廷磊,夏 威,華綠綠

      (桂林電子科技大學計算機科學與工程學院,廣西桂林 541004)

      基于多關系與屬性的主題層次影響力評估算法

      劉久云,黃廷磊,夏 威,華綠綠

      (桂林電子科技大學計算機科學與工程學院,廣西桂林 541004)

      為準確分析和度量微博用戶在主題層次的影響力,提出一種綜合考慮用戶多關系與個人屬性的影響力評估算法。該算法以主題為單位,對用戶交互行為進行分析,構建了包含轉(zhuǎn)發(fā)關系、評論關系、復制關系和提及關系的多關系網(wǎng)絡,并給出轉(zhuǎn)移概率計算模型;從用戶活躍度、用戶權威度、博文質(zhì)量、粉絲質(zhì)量4個角度考慮,構建了基于主題的用戶個人屬性影響力指標體系,并使用層次分析法給出各指標的權重;基于PageRank算法思想,提出了融合用戶關系與屬性特征的影響力計算方法。通過新浪微博數(shù)據(jù)集的對比實驗,證明了算法的準確性和有效性。

      主題影響力;多關系網(wǎng)絡;個人屬性;PageRank;微博

      近年來,微博因其即時性、靈活性、集成性和草根性等特征,成為網(wǎng)絡輿論的主要來源地和重要集散地。研究發(fā)現(xiàn),微博中存在小部分具有較高影響力的用戶,其發(fā)布的言論觀點往往能影響大批粉絲和輿論走向,對信息傳播、話題形成、輿論引導起著關鍵作用[]。

      微博輿情的主題極為寬泛,話題涉及政治、經(jīng)濟、文化等各個領域。同時,微博用戶覆蓋社會各個階層及領域,每個人在不同主題下的影響力均不相同。用戶有其擅長的領域,從而能夠成為這個領域的影響力用戶,在這個領域內(nèi)能得到更多用戶的認可[2]。因此,在大量的微博信息中識別每個主題空間下的影響力個體[3],對于準確把握社會輿情動態(tài)進而科學引導輿論導向具有重要的現(xiàn)實意義。

      微博影響力作為微博研究的一個熱點,吸引了眾多學者的目光,但針對主題層次的影響力個體挖掘探討相對較少。文獻[4]基于改進的PageRank提出Topic-sensitive PageRank算法,它優(yōu)于PageRank的地方是其隨機跳轉(zhuǎn)概率具有主題選擇性,但未考慮用戶之間交互概率的差異性。文獻[5]針對Twitter數(shù)據(jù)集提出了話題層次的影響力度量方法Twitter Rank,它綜合考慮了話題相識性和網(wǎng)絡結構,但忽略了提及、評論和轉(zhuǎn)發(fā)等影響因素。文獻[6]為識別每個話題的影響力用戶,考慮了Twitter用戶的發(fā)帖數(shù)、被轉(zhuǎn)發(fā)數(shù)和被提及數(shù)等多個屬性信息,但未考慮用戶間的多種關系網(wǎng)絡。文獻[7]綜合考慮了轉(zhuǎn)發(fā)關系、回復關系、復制關系和閱讀關系4種網(wǎng)絡關系,在一定程度上提高了度量準確度,但未考慮活躍度、博文質(zhì)量等用戶屬性特征。

      現(xiàn)有方法均未對個體影響力相關的多關系網(wǎng)絡和個體屬性進行有效結合,不能全面地度量微博用戶在主題級別的影響力。為此,利用PageRank算法思想,提出一種關系與屬性的主題層次用戶影響力評估(comprehensive influence rank,簡稱CIRank)算法。

      1 多關系網(wǎng)絡概率計算模型

      微博信息通過關注網(wǎng)絡進行傳播,用戶發(fā)布的任何信息都出現(xiàn)在其粉絲的主頁上,粉絲隨時從其關注者那里獲取隨機的新信息。用戶受關注者的影響,隨機產(chǎn)生閱讀、收藏、復制、轉(zhuǎn)發(fā)、評論和提及等行為。閱讀和收藏行為只是自我吸收的過程,并不會促進消息的對外傳播,無法對其他用戶產(chǎn)生影響力。復制和轉(zhuǎn)發(fā)行為會使微博內(nèi)容被更多的人分享和傳播,評論和提及行為則會吸引更多的人參與話題。后4種行為對信息傳播范圍和速度產(chǎn)生積極的影響,從而增強用戶的影響力?;谖墨I[7]的多關系網(wǎng)絡分析思想,引入促進影響力傳播的提及行為,改進分析閱讀行為的不足,構建主題空間下的包含轉(zhuǎn)發(fā)、評論、復制和提及4種網(wǎng)絡關系的多關系網(wǎng)絡,并給出不同網(wǎng)絡間跳轉(zhuǎn)概率的更合理的計算方法。

      1.1 問題定義

      用戶ui受到其關注者uj的影響,以一定的概率隨機產(chǎn)生4種明顯的交互行為:1)ui轉(zhuǎn)發(fā)uj的博文; 2)ui評論uj的博文;3)ui復制uj的博文;4)ui在其博文中提及uj。據(jù)此,用戶之間的關注網(wǎng)絡可分解為轉(zhuǎn)發(fā)、評論、復制和提及4種影響關系網(wǎng)絡。

      將主題t空間下的微博用戶與他們之間的多網(wǎng)絡關系抽象為一個有向加權圖

      其中:k=1,2,3,4分別為轉(zhuǎn)發(fā)、評論、復制和提及關系;Vtk為第k種關系網(wǎng)絡中的用戶集合;Etk為相應網(wǎng)絡中的所有關系邊集;Wtk( Etk)為關系邊Etk的權重。

      1.2 多關系網(wǎng)絡中的轉(zhuǎn)移概率計算模型

      由于用戶擅長的領域不同,同一主題空間下,不同用戶受到影響后,表現(xiàn)的交互行為習慣也不同,如部分用戶習慣轉(zhuǎn)發(fā),部分用戶習慣評論,即不同用戶由于受關注者的影響而停留在4種關系網(wǎng)絡的概率不同。同時,用戶在4種影響網(wǎng)絡內(nèi)部以一定轉(zhuǎn)移概率沿著網(wǎng)絡隨機游走。

      給定一個主題t,令用戶vti處于第k種關系網(wǎng)絡的概率用Qtk(vti)表示,且有∑Qtk(vti)=1,則主題t k=1空間下的多關系影響網(wǎng)絡中用戶間的轉(zhuǎn)移概率矩陣定義為Ptk。

      1.2.1 轉(zhuǎn)發(fā)網(wǎng)絡

      定義1 轉(zhuǎn)發(fā)概率矩陣Pt1的每個元素Pt1(vti, vtj),即用戶vti隨機轉(zhuǎn)發(fā)vtj微博的概率計算公式為:

      其中:wt1(vti,vt)為主題t空間下轉(zhuǎn)發(fā)網(wǎng)絡中用戶vtij轉(zhuǎn)發(fā)用戶vtj微博的次數(shù);∑wt1(vti,vt)為主題t vt∈(vt)iout空間下轉(zhuǎn)發(fā)網(wǎng)絡中用戶vti轉(zhuǎn)發(fā)其所有關注者的總次數(shù)。

      1.2.2 評論網(wǎng)絡定義2 評論概率矩陣Pt2的每個元素Pt2(vti, vtj),即用戶vti隨機評論vtj微博的概率計算公式為:

      其中:wt2(vti,vtj)為主題t空間下評論網(wǎng)絡中用戶vti評論用戶vtj微博的次數(shù);∑wt2(vti,vt)為主題t vt∈(vt)iout空間下評論網(wǎng)絡中用戶vti評論其所有關注者的總次數(shù)。

      1.2.3 復制網(wǎng)絡定義3 復制概率矩陣Pt3的每個元素Pt3(vti,vtj),即用戶vti隨機復制vtj微博的概率計算公式為:

      其中:wt3(vti,vt)為主題t空間下復制網(wǎng)絡中用戶vtij與vtj復制關系的權重;∑wt3(vti,vt)為主題t空vt∈(vt)iout間下復制網(wǎng)絡中用戶vti與其所有關注者復制關系的權重。

      由于不存在明確的“復制關系”,采用文獻[7]的方法進行推斷。首先,判斷2篇博文ctm、ctn的時間間隔Δtrange是否滿足Δtrange=0~1.08×105;若滿足,則判斷博文的相似度S(ctm,ctn)是否高于0.8,相似度計算使用KL距離(kullback-leibler divergence)方法;若2個條件均滿足,則認為博文ctm復制了博文ctn。式(3)的wt3(vti,vtj)計算方法為:

      其中:Uti,j為主題t空間下用戶vti與vtj存在復制關系的博文二元組集合。f(Δt)為其概率密度函數(shù):

      1.2.4 提及網(wǎng)絡

      定義4 提及概率矩陣Pt4的每個元素Pt4(vti, vtj),即用戶vti在微博中隨機提及vtj的概率計算公式為:v∈(v)iout

      其中:wt4(vti,vtj)為主題t空間下提及網(wǎng)絡中用戶vti提及用戶vtj的次數(shù);∑wt4(vti,vt)為主題t空間

      vt∈(vt)

      iout下提及網(wǎng)絡中用戶vti提及其所有關注者的總次數(shù)。

      1.3計算不同網(wǎng)絡間的跳轉(zhuǎn)概率

      由于同一主題空間下不同用戶的交互行為習慣不同,算法基于實測數(shù)據(jù)統(tǒng)計結果,計算用戶在4種關系網(wǎng)絡的停留概率。

      定義5 主題t空間下用戶vti停留在轉(zhuǎn)發(fā)網(wǎng)絡的概率定義為:iout

      其中:∑wt1(vti,vt)為主題t空間下用戶vti轉(zhuǎn)發(fā)vt∈(vt)iout 4其所有關注者的總次數(shù);∑∑wtk(vti,vt)為主k=1vt∈(vt)iout題t空間下用戶vti轉(zhuǎn)發(fā)、評論、復制和提及所有關注者的總次數(shù)。定義6 主題t空間下用戶vti停留在評論網(wǎng)絡的概率定義為:v∈(v)iout

      其中:∑wt2(vti,vt)為主題t空間下用戶vti評論vt∈(vt)iout其所有關注者的總次數(shù)。

      定義7 主題t空間下用戶vti停留在復制網(wǎng)絡的概率定義為:

      其中:∑wt2(vti,vt)為主題t空間下用戶vti復制vt∈(vt)iout其所有關注者的總次數(shù)。

      定義8 主題t空間下用戶vti停留在提及網(wǎng)絡的概率定義為:

      其中:∑wt2(vti,vt)為主題t空間下用戶vti提及vt∈(vt)iout其所有關注者的總次數(shù)。

      2 用戶個人屬性影響評估模型

      用戶的個人屬性特征,如活躍度、博文質(zhì)量、名人身份等,也在一定程度上決定其微博影響力大小。由于用戶擅長的領域不同,其在不同主題空間下的表現(xiàn)也不同,如經(jīng)濟專家在經(jīng)濟相關主題下的博文數(shù)量、原創(chuàng)比和質(zhì)量通常都比較高,相應的博文被轉(zhuǎn)發(fā)、評論次數(shù)也多,則其在主題下對其他用戶產(chǎn)生的影響力也比較大;相反,其在娛樂、體育等相關主題下的影響力則要弱很多。因此,算法引入個人屬性特征對影響力的作用,構建了主題空間下的用戶個人屬性影響指標體系,并使用層次分析法獲得各指標的權重。

      2.1 影響指標體系構建

      用戶個人屬性較多,包括發(fā)布、提及等行為屬性和關注數(shù)、是否認證等狀態(tài)屬性,這是個人屬性影響因素測量復雜的一個重要原因。由于用戶有一定的擅長領域,每個用戶在不同主題空間下的個體屬性特征也不同。算法以推動信息傳播為出發(fā)點,以主題為單位,從用戶活躍度、微博質(zhì)量、用戶權威度和粉絲質(zhì)量4方面考慮,分析大多數(shù)重要的影響指標。

      1)用戶活躍度?;钴S用戶經(jīng)常發(fā)布新微博或轉(zhuǎn)發(fā)一些高質(zhì)量的博文,從而更能引起關注;原創(chuàng)微博通常包含了用戶對新信息獨到的思想和見解,容易吸引用戶參與討論。所以,用戶越活躍,其對粉絲產(chǎn)生的影響力可能越大。用戶活躍度考慮平均發(fā)布微博數(shù)、平均轉(zhuǎn)發(fā)微博數(shù)及微博原創(chuàng)比。

      主題t空間下,用戶vts平均每天發(fā)布的微博數(shù)為:

      其中:d(vts)為用戶vts的微博使用天數(shù);ct1(vts)為用戶vts在主題t空間下發(fā)布的博文總數(shù)。主題t空間下,用戶vts平均每天轉(zhuǎn)發(fā)的微博數(shù)為:

      其中:ct2(vts)為用戶vts在主題t空間下轉(zhuǎn)發(fā)的博文總數(shù)。主題t空間下,用戶vts的微博原創(chuàng)比為:

      2)微博質(zhì)量。用戶微博被轉(zhuǎn)發(fā)的平均次數(shù)越多,表示博文價值越大,通過轉(zhuǎn)發(fā)的博文會以級聯(lián)的方式繼續(xù)傳播下去,對更多的用戶產(chǎn)生影響;用戶通常會評論認同有獨特視角的微博來表達自己的見解,平均微博被評論率越大,表示用戶的博文越容易引起互動;兩者分別代表了博文影響的廣度和深度。微博質(zhì)量考慮用戶微博被轉(zhuǎn)發(fā)及被評論的平均次數(shù)。

      主題t空間下,用戶vts的微博被轉(zhuǎn)發(fā)的平均次數(shù)為:ct(vt)1s

      其中:∑ct4k為用戶vts在主題t空間下的所有博文k=1被轉(zhuǎn)發(fā)的總次數(shù)。主題t空間下,用戶vts的微博被評論的平均次數(shù)為:ct(vt)1s

      其中:∑ct5k為用戶vts在主題t空間下的所有博文k=1被評論的總次數(shù)。3)用戶權威度。微博中帶有“V”的VIP實名認證用戶通常為領域?qū)<?、名人和媒介精英人?信任度很高,而名人效應在信息傳播中的影響力是普通用戶不能比擬的;用戶在主題空間下的被提及率反映了用戶在主題內(nèi)的影響力和被關注度,用戶被提及率越高,表示在主題內(nèi)的影響力越大。用戶權威度考慮是否認證和被提及率。主題t空間下,用戶vts的被提及率為:

      其中:ct6(vts)為用戶vts在主題t空間下的被提及次數(shù),∑ct6(vt)為主題t空間下提及的總?cè)舜螖?shù)。若vt∈Vt用戶vts為認證用戶,則認證指標At7(vts)值為1,否則為0。

      4)粉絲質(zhì)量。優(yōu)質(zhì)粉絲越多,則用戶博文的潛在二次傳播范圍越廣,其博文產(chǎn)生的影響力就越大。用戶的粉絲質(zhì)量體現(xiàn)為VIP實名粉絲比率。

      主題t空間下,用戶vts的粉絲認證比率為:

      其中:NtV,followers(vts)為用戶vts在主題t空間下的多關系網(wǎng)絡中的實名認證粉絲數(shù);Ntfollowers(vts)為用戶vts在主題t空間下的多關系網(wǎng)絡中的所有粉絲數(shù)。

      2.2 基于個人屬性特征的影響力計算

      定義用戶vts在主題t空間下的個人屬性特征影響力為:

      其中:Atj(vts)為用戶vts在主題t空間下的第j個影響指標值;ωj為第j個影響指標的權重。

      算法采用層次分析法[8]確定不同指標在反映用戶個人屬性特征影響力的權重。層次分析法可使不同指標的差異得到量化,綜合考慮時更能準確反映實際的影響情況。根據(jù)個人屬性特征影響指標體系,將各影響指標的權重表示為ω={ω1,ω2,ω3,ω4,ω5,ω6, ω7,ω8},并將各影響指標歸一化,然后用層次分析法確定各指標權重,并驗證一致性。

      3 融合多關系與個人屬性的影響力評估模型

      令主題t空間下用戶vts的綜合影響力為FtCIR(vts),根據(jù)PageRank思想,綜合考慮用戶在4種網(wǎng)絡中的跳轉(zhuǎn)概率和個人屬性特征影響因素, FtCIR(vts)的計算公式為: FtCIR(vts)=d×

      其中:k=1,2,3,4分別為主題t空間下的轉(zhuǎn)發(fā)網(wǎng)絡、評論網(wǎng)絡、復制網(wǎng)絡和提及網(wǎng)絡;FtPAI( vts)為用戶vts的個人屬性特征影響力;∑Ft( vt)為主題tPAIj(vt,vt)∈Etijk空間下的第k種影響網(wǎng)絡中,與用戶vti存在第k種關系的所有關注者的個人屬性特征影響力之和;Nt為主題t空間下的所有用戶數(shù);d為阻尼因子,取經(jīng)驗值0.85。

      由PageRank算法可知,式(19)是收斂的,經(jīng)過有限次迭代,計算結果將趨于穩(wěn)定,從而得出最終的個體影響力排名。由式(19)可知,用戶在主題空間下的影響力不僅由粉絲的影響力決定,用戶自己在主題空間下的個人屬性信息也起很大的作用,從而排除了垃圾粉絲的干擾。

      4 實驗分析

      4.1 實驗方案

      4.1.1 數(shù)據(jù)準備

      從新浪微博平臺獲取實驗數(shù)據(jù),收集了新浪微博2014年的50個熱點話題,然后分別選取了社會、體育、電影、科技和財經(jīng)領域參與人數(shù)最多的2個主題,采用分屬于5個不同領域的10個主題作為測試集。選定主題后,獲取主題下參與用戶的所有微博信息和個人屬性特征信息,包括轉(zhuǎn)發(fā)、評論等行為屬性和是否認證、轉(zhuǎn)發(fā)數(shù)、評論數(shù)等狀態(tài)屬性。

      數(shù)據(jù)經(jīng)處理后,首先運用層次分析法,計算得到用戶個人屬性特征影響力的各影響指標的權重,ω= {0.226,0.028,0.011,0.228,0.023,0.228,0.095, 0.161},通過了一致性檢驗。

      4.1.2 多種影響力分析算法對比驗證

      為驗證算法CIRank的準確性和有效性,將CIR-ank與多種相關算法進行對比驗證。主要考慮了以下5種算法:

      1)綜合考慮用戶多關系網(wǎng)絡與個人屬性特征的用戶影響力分析算法CIRank。

      2)僅考慮多關系網(wǎng)絡的影響力挖掘算法Multirelation Rank,計算公式為:

      3)文獻[7]提出的基于多關系網(wǎng)絡的微博話題層次的影響力分析算法MultiRank。

      4)文獻[5]提出的綜合考慮了話題相識性和網(wǎng)絡結構的主題級別的影響力個體挖掘算法Twitter Rank。

      5)根據(jù)粉絲數(shù)目衡量微博用戶的影響力的Follower Rank算法,Twitter和許多第三方服務均采用此算法對影響力進行排序。

      4.1.3 評價指標

      社交網(wǎng)絡上的用戶影響力分析的評測無統(tǒng)一的衡量標準,因此,采用文獻[7]的交叉驗證方法得到參考標準結果值,分別驗證每種算法的準確率、召回率和F值,以此來對比算法的性能。

      交叉驗證法為取多種(N種)算法都認為正確的結果作為參考的正確結果,研究發(fā)現(xiàn)N值為3時,效果最佳。令5種對比算法得到的前K名高影響力個體集合,分別表示為U1、U2、U3、U4和U5,則參考標準影響力個體集合U為5個結果集三三相交后取并集的結果集。

      準確率為預測正確的影響力個體數(shù)與預測出的影響力個體總數(shù)的比值,衡量算法的查準率;召回率為預測正確的影響力個體數(shù)與參考標準影響力個體總數(shù)的比值,衡量算法的查全率;F值則為準確率和召回率的調(diào)和平均值,反映算法的整體性能。

      4.2 實驗結果及分析

      4.2.1 算法準確率、召回率驗證

      分別采用CIRank算法與4種對比算法獲得所有主題下的個體影響力排名,針對每個主題,取每種算法排序結果中的前20、50、100、150、200、300名高影響力個體,使用交叉驗證方法分別計算算法的6項準確率、召回率,然后計算得出各算法在每個主題下的平均準確率和召回率,結果如圖1、2所示。

      圖1 各算法在每個主題下的平均準確率Fig.1 The average precision rate of each algorithm under each topic

      圖2 各算法在每個主題下的平均召回率Fig.2 The average recall rate of each algorithm under each topic

      從圖1、2可看出,在所有主題下,提出的影響力個體挖掘算法CIRank均可達到90%以上的準確率和召回率,在所有算法中表現(xiàn)最佳,證明了該算法的有效性;同時,僅考慮多關系網(wǎng)絡的影響力挖掘算法Multi-relation Rank相對MultiRank算法而言,其準確率和召回率均有明顯提升,證明算法對多關系網(wǎng)絡概率模型的改進,即將閱讀網(wǎng)絡替換為提及網(wǎng)絡及根據(jù)每個用戶在各主題下的實際交互行為習慣計算不同網(wǎng)絡間的停留概率,對挖掘結果起到很大改善作用。圖1、2的實驗結果表明,綜合考慮多關系網(wǎng)絡和個人屬性特征的CIRank算法的平均準確率和召回率相對于Multi-relation Rank算法,有非常顯著的提升,說明用戶在每個主題下的個人屬性特征起到很大的作用。

      4.2.2 算法F值驗證

      為從整體上驗證CIRank算法的性能,綜合考慮準確率和召回率,分別針對排序結果中的前20、50、100、150、200、300名高影響力個體計算各算法的F值,然后計算各算法在每個主題下的平均F值,實驗結果如圖3所示。

      圖3 各算法在每個主題下的平均F值Fig.3 The average F value of each algorithm under each topic

      從圖3可看出,在所有主題下,CIRank算法相比其他算法整體性能都是最優(yōu)的,Multi-relation Rank算法由于對多關系網(wǎng)絡概率模型的改進,其整體性能比MultiRank要高一些,Twitter Rank算法和Follower Rank算法的整體性能相對較差,而Follower-Rank由于僅根據(jù)粉絲數(shù)量進行排名,性能最差。

      5 結束語

      以主題為單位,分析了轉(zhuǎn)發(fā)、評論、復制和提及4種受影響交互行為,構建了用戶多關系網(wǎng)絡,并給出了基于多關系網(wǎng)絡的概率計算模型。同時,引進個人屬性特征對影響力的作用,分析了用戶活躍度、微博質(zhì)量、用戶權威度和粉絲質(zhì)量4個方面的相關影響因素,構建了主題空間下的個人屬性特征影響指標體系?!敖┦邸焙汀八姟钡牟┪脑瓌?chuàng)性、粉絲質(zhì)量和權威度等通常都很低,因此,引入個人屬性影響體系在一定程度上排除了“僵尸粉”和“水軍”對影響力個體挖掘結果的影響。多種對比算法的交叉驗證實驗結果表明,提出的綜合考慮用戶多關系網(wǎng)絡與個人屬性特征的影響力挖掘算法CIRank優(yōu)于其他相關算法。構建的個人屬性特征影響指標體系采用層次分析法確定各影響指標的權重,一定程度上會受到人為因素的干擾,研究更準確的影響指標權重計算方法將是下一個研究方向。同時,探究多關系網(wǎng)絡和個人屬性特征影響力的更加有效的結合方式將是下一步的工作重點。

      [1] 肖宇,許煒,商召璽.微博用戶區(qū)域影響力識別算法及分析[J].計算機科學,2012,39(9):38-42.

      [2] 尹衍騰,李學明,蔡孟松.基于用戶關系與屬性的微博意見領袖挖掘方法[J].計算機工程,2013,39(4):184-189.

      [3] Rogers E M.Diffusion of Innovations[M].New York: The Free Press,1962:102-120.

      [4] Haveliwala T H.Topic-sensitive PageRank[C]//Proceedings of the 11th International Conference on World Wide Web.New York:ACM Press,2002:517-526.

      [5] Weng Jianshu,Lim E P,Jiang Jing,et al.Twitterrank: finding topic-sensitive influential twitters[C]//Proceedings of the Third ACM International Conference on Web Search and Data Mining.ACM,2010:261-270.

      [6] Pal A,Counts S.Identifying topical authorities in microblogs[C]//Proceedings of the Fourth ACM International Conference on Web Search and Data Mining, 2011:45-54.

      [7] Ding Zhaoyun,Jia Yan,Zhou Bin,et al.Mining topical influencers based on the multi-relational network in micro-blogging sites[J].China Communications,2013,10 (1):93-104.

      [8] 王蓮芬,許樹柏.層次分析法引論[M].北京:中國人民大學出版社,1990:42-56.

      編輯:梁王歡

      Topical influence evaluation algorithm based on multi-relationship and personal attributes

      Liu Jiuyun,Huang Tinglei,Xia Wei,Hua Lülü
      (School of Computer Science and Engineering,Guilin University of Electronic Technology,Guilin 541004,China)

      To accurately analyze and measure the topical influence of micro-blog users,a new influence evaluation algorithm based on multi-relationship and personal attributes is presented.Taking topic as unit,the multi-relational influence network including repost,comment,copy and mention relations is constructed by analyzing user interaction behavior,and the transition probability calculation model is given.In consideration of user activity,user authority,micro-blog quality and follower quality,an index system of user’s personal attributes influence based on the topic is constructed,and the weight of each indicator is given by using the method of analytic hierarchy process(AHP).Finally,a calculation method of influence based on PageRank is designed by fusing user relations and attributes.A large number of experiments according to real data sets show that the proposed method is accurate and effective.

      topical influence;multi-relational network;personal attribute;PageRank;micro-blog

      TP393

      :A

      :1673-808X(2015)04-0329-07

      2015-03-26

      國家863計劃(2012AA011005)

      黃廷磊(1971―),男,安徽肥東人,教授,博士,研究方向為數(shù)據(jù)挖掘、無線Mesh網(wǎng)絡等。E-mail:tlhuang@guet.edu.cn

      劉久云,黃廷磊,夏威,等.基于多關系與屬性的主題層次影響力評估算法[J].桂林電子科技大學學報,2015,35(4):329-335.

      猜你喜歡
      博文影響力空間
      第一次掙錢
      空間是什么?
      創(chuàng)享空間
      天才影響力
      NBA特刊(2018年14期)2018-08-13 08:51:40
      誰和誰好
      黃艷:最深遠的影響力
      人大建設(2017年11期)2017-04-20 08:22:49
      Review on Tang Wenzhi’s The Gist of Chinese Writing Gamut
      3.15消協(xié)三十年十大影響力事件
      傳媒不可估量的影響力
      人間(2015年21期)2015-03-11 15:24:39
      打電話2
      普陀区| 蓝山县| 湖南省| 中超| 高雄县| 万源市| 轮台县| 绍兴县| 遵义市| 杂多县| 鄂温| 大埔区| 左权县| 额济纳旗| 泰顺县| 上蔡县| 天等县| 亚东县| 西贡区| 隆化县| 临汾市| 兴义市| 巴林左旗| 阳高县| 自治县| 邻水| 右玉县| 乌鲁木齐县| 丁青县| 正阳县| 垦利县| 图们市| 静海县| 西乡县| 珠海市| 大城县| 绵阳市| 五台县| 万宁市| 辰溪县| 右玉县|