趙雨華 鄧少靈
隨著微博的發(fā)展和意見領(lǐng)袖在網(wǎng)絡(luò)中作用的增大,發(fā)掘和利用微博意見領(lǐng)袖具有重要意義。本文從社會(huì)網(wǎng)絡(luò)分析角度出發(fā),根據(jù)用戶關(guān)注的網(wǎng)絡(luò)圖,選取中心性指標(biāo)和PageRank值作為評(píng)價(jià)指標(biāo),構(gòu)建微博意見領(lǐng)袖挖掘模型。運(yùn)用這一模型實(shí)證分析“無錫高架坍塌”事件的意見領(lǐng)袖,通過與其粉絲數(shù)進(jìn)行對(duì)比驗(yàn)證,來證明這一方法的可行性。
近年來,微博在眾多交互網(wǎng)絡(luò)平臺(tái)中已成長(zhǎng)為用戶數(shù)與使用率最高的社交平臺(tái)。新浪微博發(fā)布的2020年第三季度的財(cái)報(bào)顯示,微博第三季度月活躍用戶達(dá)5.11億,同比凈增長(zhǎng)約1400萬用戶。微博日活躍用戶達(dá)2.24億,同比凈增長(zhǎng)約800萬用戶。隨著微博的不斷發(fā)展,微博意見領(lǐng)袖的研究也逐漸得到了學(xué)術(shù)界的關(guān)注。
相關(guān)研究
“意見領(lǐng)袖”這一概念最早出現(xiàn)在1940年,由美國(guó)學(xué)者拉扎斯菲爾德在《人民的選擇》一書中提出,那些在人際傳播中經(jīng)常為他人提供信息或意見,并影響他人的“活躍分子”,被稱為意見領(lǐng)袖。微博意見領(lǐng)袖也就是能在微博網(wǎng)絡(luò)中能夠起到信息橋梁作用并能在微博網(wǎng)絡(luò)中產(chǎn)生一定影響力的網(wǎng)民。
從傳統(tǒng)的社會(huì)網(wǎng)絡(luò)分析角度,為了挖掘出微博意見領(lǐng)袖,就要確定用戶的中心性和影響力,F(xiàn)reeman等人提出通過中心性指標(biāo)來實(shí)現(xiàn)網(wǎng)絡(luò)節(jié)點(diǎn)中心性程度的量化,根據(jù)不同類型的網(wǎng)絡(luò)使用差異化的指標(biāo)來度量,度量用戶社會(huì)網(wǎng)絡(luò)中節(jié)點(diǎn)地位的指標(biāo)主要包括度指標(biāo)、接近中心度指標(biāo)和中介中心度指標(biāo)。
王娟等人利用社會(huì)網(wǎng)絡(luò)分析中的中心性指標(biāo):內(nèi)連接度,外連接度,接近度,中介度和核數(shù)對(duì)社交網(wǎng)站的意見領(lǐng)袖進(jìn)行識(shí)別,并通過運(yùn)用SPSS中的主成分分析法對(duì)各指標(biāo)的權(quán)重進(jìn)行確定,最終建立了新的意見領(lǐng)袖識(shí)別模型。
除了傳統(tǒng)的中心性度量指標(biāo),還有互聯(lián)網(wǎng)視角下的PageRank值度量用戶的網(wǎng)絡(luò)影響力。
根據(jù)現(xiàn)階段研究,微博社會(huì)網(wǎng)絡(luò)與互聯(lián)網(wǎng)在結(jié)構(gòu)上存在一定的相似性,不同的網(wǎng)頁(yè)相當(dāng)于微博網(wǎng)絡(luò)結(jié)構(gòu)中的節(jié)點(diǎn),PageRank作為當(dāng)前網(wǎng)頁(yè)評(píng)分排序的主要方法,是互聯(lián)網(wǎng)節(jié)點(diǎn)評(píng)價(jià)的重要手段,同樣適用于微博社會(huì)網(wǎng)絡(luò)中用戶的重要性及影響力評(píng)價(jià)。周飛和高茂庭從用戶自身影響力、用戶行為以及動(dòng)態(tài)行為對(duì)內(nèi)容的影響程度角度入手,提出一種基于用戶影響力和PageRank的意見領(lǐng)袖發(fā)現(xiàn)算法。王正成等利用LDA主題模型挖掘出特定話題中的各個(gè)主題,對(duì)不同主題的用戶分類,結(jié)合不同主題分類用戶的屬性以及PageRank算法識(shí)別意見領(lǐng)袖。
社會(huì)網(wǎng)絡(luò)中心性指標(biāo)是從網(wǎng)絡(luò)整體角度進(jìn)行測(cè)量,計(jì)算用戶的中心性,而以網(wǎng)絡(luò)鏈接為主的PageRank值是從局部進(jìn)行度量,容易忽略高權(quán)威點(diǎn)和整體網(wǎng)絡(luò)的刻畫,計(jì)算用戶的影響力,因此本文結(jié)合這兩種方法共同構(gòu)建意見領(lǐng)袖挖掘模型并結(jié)合具體實(shí)例,得到意見領(lǐng)袖。
意見領(lǐng)袖挖掘模型
指標(biāo)選取
社會(huì)網(wǎng)絡(luò)中心性指標(biāo)
點(diǎn)入度。點(diǎn)入度表示某節(jié)點(diǎn)受到網(wǎng)絡(luò)中其他節(jié)點(diǎn)關(guān)注的程度,點(diǎn)入度高的用戶在網(wǎng)絡(luò)中擁有很高的聲譽(yù),體現(xiàn)了此用戶的吸引力,在網(wǎng)絡(luò)中可能成為信息傳播的源頭。
點(diǎn)出度。點(diǎn)出度表示某節(jié)點(diǎn)關(guān)注網(wǎng)絡(luò)中其他節(jié)點(diǎn)的程度,點(diǎn)出度高的用戶在網(wǎng)絡(luò)中具有較強(qiáng)的社交性,體現(xiàn)了此用戶的積極性,在網(wǎng)絡(luò)中能夠從其他成員那里獲得豐富的信息。
入接近中心度。入接近中心度指的是某節(jié)點(diǎn)在網(wǎng)絡(luò)中傳播信息是不受其他節(jié)點(diǎn)控制的能力,入接近中心度高的的人,表明其在網(wǎng)絡(luò)中傳播信息的能力強(qiáng)。
出接近中心度。出接近中心度表示某節(jié)點(diǎn)在網(wǎng)絡(luò)中獲得其他節(jié)點(diǎn)信息的難易程度。外接近中心度高的人,表明其在網(wǎng)絡(luò)中獲取信息的能力強(qiáng)。
中間中心度。中間中心度表示一個(gè)節(jié)點(diǎn)擔(dān)任其他兩個(gè)節(jié)點(diǎn)之間最短的橋梁的次數(shù),即一個(gè)用戶在多大程度上位于網(wǎng)絡(luò)中其他任意兩用戶的“中間”。一個(gè)用戶處于“中間”的次數(shù)越多,這個(gè)用戶的中間中心度就越高,其控制相鄰兩個(gè)用戶交往的能力越強(qiáng),說明其在網(wǎng)絡(luò)中處于重要地位。中間中心度高的用戶能在一定程度上影響并控制該網(wǎng)絡(luò)中的信息傳播。
PageRank值
PageRank是Google創(chuàng)始人1998提出的,基于網(wǎng)絡(luò)結(jié)構(gòu)的排序算法,作為排名運(yùn)算法則主要是確定不同網(wǎng)頁(yè)的等級(jí),基本思想是:?jiǎn)我豁?yè)面所鏈接的其他頁(yè)面越多,該頁(yè)面的影響力越大,相應(yīng)的PageRank值越大。本文基于微博的關(guān)注及被關(guān)注關(guān)系網(wǎng)絡(luò),利用PageRank算法思想,計(jì)算不同用戶在網(wǎng)絡(luò)結(jié)構(gòu)中的PR值如
其中,表示用戶的PR值,表示用戶的PR值,表示所有關(guān)注用戶的用戶集合,表示用戶關(guān)注的所有用戶,表示網(wǎng)絡(luò)結(jié)構(gòu)中用戶的數(shù)量,為阻尼系數(shù),取0.85。
微博意見領(lǐng)袖挖掘模型的構(gòu)建
假設(shè)用戶社會(huì)關(guān)系網(wǎng)絡(luò)中共有個(gè)用戶,首先獲取用戶的點(diǎn)入度、點(diǎn)出度、內(nèi)接近中心度、外接近中心度、中間中心度和PageRank值指標(biāo),分別為?、 W2、 w3、w4、wg、wg其次將各個(gè)指標(biāo)值進(jìn)行歸一化處理,對(duì)6個(gè)度量指標(biāo)加權(quán)平均計(jì)算,其中指標(biāo)權(quán)重,最終得到意見領(lǐng)袖挖掘模型為
本文引用陳芬通過專家打分確定的指標(biāo)權(quán)重,如公式
實(shí)證分析
本文利用python爬取了新浪微博 “無錫高架坍塌”這一話題的相關(guān)數(shù)據(jù)。對(duì)從2019年10月10日18時(shí)到2019年10月11日23時(shí)這段時(shí)間“無錫高架坍塌”事件熱門微博以及每一條熱門微博的博主ID名稱進(jìn)行采集。采集到的這一時(shí)段中的“無錫高架坍塌”這一話題下的熱門微博共計(jì)273條,涉及博主有169位。本文將通過對(duì)這169位博主之間的關(guān)注關(guān)系進(jìn)行統(tǒng)計(jì),并建立各博主之間的關(guān)注關(guān)系網(wǎng)絡(luò),以便分析得到各博主的社會(huì)網(wǎng)絡(luò)中心性指標(biāo)值以及PageRank值。其中,社會(huì)網(wǎng)絡(luò)中心性指標(biāo)值運(yùn)用UCINET軟件得出,PageRank值運(yùn)用MATLAB軟件得出。
根據(jù)公式(3)對(duì)“無錫高架坍塌”微博話題中169名用戶的這6個(gè)指標(biāo)數(shù)據(jù)使用離差標(biāo)準(zhǔn)化方法進(jìn)行歸一化處理,對(duì)處理后的數(shù)據(jù)分析計(jì)算出群體內(nèi)每位用戶的意見領(lǐng)袖值,排名前10的用戶信息分布如表左邊所示,將他們認(rèn)定為“無錫高架坍塌”事件微博話題中的意見領(lǐng)袖。
基于粉絲數(shù)的排序方式是最原始的排序方式,也是新浪微博各類排行榜采用的排序方式。表右邊是微博話題意見領(lǐng)袖的粉絲數(shù)排名。通過對(duì)比表左右可以發(fā)現(xiàn)基于本模型的排序結(jié)果和基于粉絲數(shù)的排序結(jié)果整體上來看還是比較相近的,這在一定程度上驗(yàn)證了本文所建立的微博意見領(lǐng)袖挖掘模型的科學(xué)性。
本文從社會(huì)網(wǎng)絡(luò)分析角度出發(fā),根據(jù)用戶關(guān)注的網(wǎng)絡(luò)圖,選取中心性指標(biāo)和PageRank值作為評(píng)價(jià)指標(biāo),構(gòu)建微博意見領(lǐng)袖挖掘模型。運(yùn)用這一模型實(shí)證分析“無錫高架橋坍塌”事件,得到此話題的意見領(lǐng)袖。通過與粉絲數(shù)對(duì)比,驗(yàn)證這一模型的科學(xué)性。本文雖取得了一定的研究成果,但是僅從社會(huì)網(wǎng)絡(luò)分析角度出發(fā)來挖掘意見領(lǐng)袖,在未來的研究中,可以結(jié)合用戶的行為特征來全面地對(duì)微博意見領(lǐng)袖進(jìn)行挖掘。
(作者單位:上海海事大學(xué)經(jīng)濟(jì)管理學(xué)院)