楊 凱,張 寧
(上海理工大學(xué)管理學(xué)院,上海200093)
隨著互聯(lián)網(wǎng)2.0技術(shù)的發(fā)展和計(jì)算機(jī)網(wǎng)絡(luò)的普及,在線社會(huì)網(wǎng)絡(luò)已成為人們生活工作中不可或缺的工具。各種在線社交網(wǎng)站如雨后春筍般涌現(xiàn),一般交友網(wǎng)(如聚友網(wǎng)和臉譜網(wǎng))、在線圖片分享網(wǎng)(如Flickr)、朋友社交網(wǎng)(如校內(nèi)網(wǎng)和雅虎360)、商務(wù)人士關(guān)系網(wǎng)(如若鄰網(wǎng))和職業(yè)人士社交網(wǎng)(如天際網(wǎng))等等[1]。國(guó)內(nèi)外對(duì)在線社會(huì)網(wǎng)絡(luò)的研究更是如火如荼。如Ravi Kuma等[2]研究了Flickr和雅虎360兩個(gè)在線社會(huì)網(wǎng)絡(luò),按照節(jié)點(diǎn)的連通性分布將網(wǎng)絡(luò)分成了3個(gè)部分,提出了動(dòng)態(tài)屬性的概念和一個(gè)簡(jiǎn)單的網(wǎng)絡(luò)增長(zhǎng)模型,分別給出了兩個(gè)網(wǎng)絡(luò)的動(dòng)態(tài)屬性和網(wǎng)絡(luò)中3個(gè)部分的結(jié)構(gòu)演化。Alan Mislove等[3]對(duì)4個(gè)在線網(wǎng)絡(luò)進(jìn)行了拓?fù)涮匦匝芯浚?個(gè)在線網(wǎng)絡(luò)都滿足無標(biāo)度特性、小世界特性,用戶網(wǎng)絡(luò)節(jié)點(diǎn)的入度和出度相匹配。汪小帆等[4]對(duì)大型在線職業(yè)人士社交網(wǎng)——若鄰網(wǎng)進(jìn)行了研究,研究表明該網(wǎng)絡(luò)具有小世界特性、高群聚系數(shù),網(wǎng)絡(luò)結(jié)構(gòu)具有層次化和社團(tuán)性。同時(shí)研究了該在線網(wǎng)絡(luò)的結(jié)構(gòu)演化,網(wǎng)絡(luò)牽制控制等。
微博是近幾年繼博客之后新興的社交平臺(tái),基于復(fù)雜網(wǎng)絡(luò)理論,國(guó)內(nèi)外對(duì)微博用戶關(guān)系網(wǎng)絡(luò)的結(jié)構(gòu)已經(jīng)做出了一些成果。國(guó)外HaewoonKwak等[5]對(duì)Twitter進(jìn)行了實(shí)證研究,研究顯示用戶網(wǎng)絡(luò)的粉絲分布非冪律,網(wǎng)絡(luò)的有效直徑很短,并且互惠指數(shù)很小。用粉絲數(shù)和PageRank算法對(duì)具有影響力的用戶進(jìn)行了分析,兩個(gè)方法的結(jié)果很相似。AkshayJava等[6]給出了Twitter用戶的增長(zhǎng)率,研究了Twitter社會(huì)網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)和地理位置分布,用戶利用微博主要是談?wù)撊粘;顒?dòng)或者搜尋分享信息。尹書華[7]以新浪、騰訊、搜狐三大微博注冊(cè)用戶為研究對(duì)象,根據(jù)用戶之間的關(guān)注關(guān)系構(gòu)建了復(fù)雜網(wǎng)絡(luò),分別給出了該網(wǎng)絡(luò)的度分布、平均群聚系數(shù)以及平均路徑長(zhǎng)度等統(tǒng)計(jì)特征,得出微博用戶關(guān)系網(wǎng)絡(luò)具有無標(biāo)度特性以及小世界效應(yīng)。樊鵬翼等[8]對(duì)新浪微博也作了實(shí)證研究,結(jié)果顯示新浪微博用戶關(guān)系網(wǎng)絡(luò)有小世界、無標(biāo)度和同類混合模式等特點(diǎn),并且用戶關(guān)系網(wǎng)絡(luò)的出度和入度具有弱相關(guān)性,相關(guān)性僅為0.033。郭正彪等[9]研究了新浪微博用戶怎樣連接形成微博關(guān)系網(wǎng)絡(luò),將微博用戶分成兩類(普通用戶和認(rèn)證用戶),這兩類不同的用戶明顯有不同的網(wǎng)絡(luò)屬性。研究表明微博用戶關(guān)系網(wǎng)絡(luò)是個(gè)信息驅(qū)動(dòng)網(wǎng)絡(luò)而不是關(guān)系驅(qū)動(dòng)網(wǎng)絡(luò)。對(duì)于用戶興趣,張寧等[10-11]研究了用戶瀏覽網(wǎng)絡(luò)日志的興趣,找出群體興趣網(wǎng)絡(luò)的特殊性質(zhì)及其自身的演化規(guī)律。而微博用戶的興趣時(shí)刻影響著微博用戶關(guān)系網(wǎng)絡(luò)的結(jié)構(gòu)。
在線社會(huì)網(wǎng)絡(luò)最大的特點(diǎn)在于它的動(dòng)態(tài)性,網(wǎng)絡(luò)無時(shí)無刻不在變化,這給研究帶來了一定的困難。在研究在線社會(huì)網(wǎng)絡(luò)的一些屬性時(shí)不能局限于一個(gè)時(shí)間點(diǎn),而要看它整個(gè)過程,然后綜合研究網(wǎng)絡(luò)的特性。在這個(gè)過程中數(shù)據(jù)的獲取是最大的困難所在。本文主要研究了個(gè)人微博用戶關(guān)系網(wǎng)絡(luò)隨時(shí)間的變化,網(wǎng)絡(luò)結(jié)構(gòu)屬性的變化體現(xiàn)用戶行為的變化。在這一過程中對(duì)于信息獲取又有怎樣的影響?對(duì)于某一時(shí)間點(diǎn)個(gè)人微博用戶關(guān)系網(wǎng)絡(luò)是否也滿足無標(biāo)度特性和小世界特性?在個(gè)人微博用戶關(guān)系網(wǎng)絡(luò)中,都有哪些類型的用戶,用戶在網(wǎng)絡(luò)中扮演怎樣的角色?
本文利用復(fù)雜網(wǎng)絡(luò)的理論知識(shí),將微博用戶關(guān)系用網(wǎng)絡(luò)的形式描述出來,根據(jù)網(wǎng)絡(luò)結(jié)構(gòu)屬性的變化來刻畫用戶的行為和在網(wǎng)絡(luò)中的影響力。利用聚類分析的方法,將微博用戶進(jìn)行了分類,根據(jù)他們?cè)诰W(wǎng)絡(luò)中的結(jié)構(gòu)屬性,可以得出他們?cè)诰W(wǎng)絡(luò)中的目的和類型以及興趣愛好,從而有利于微博運(yùn)營(yíng)商對(duì)用戶有針對(duì)性的推薦。
對(duì)于微博關(guān)系網(wǎng)絡(luò)的研究如今也處于白熱化階段,微博網(wǎng)絡(luò)從各種不同角度進(jìn)行研究,本文主要是針對(duì)個(gè)人的微博用戶網(wǎng)絡(luò),對(duì)于普通用戶來說(除認(rèn)證用戶)都有一定的普遍性。能更加深入了解用戶的行為與興趣愛好,以及對(duì)信息傳播的影響,使微博平臺(tái)更好地服務(wù)于用戶。
微博用戶關(guān)系網(wǎng)絡(luò)是一個(gè)有向無權(quán)網(wǎng)絡(luò),描述復(fù)雜網(wǎng)絡(luò)的屬性有很多,比如網(wǎng)絡(luò)的度分布、密度、群聚系數(shù)及介數(shù)等等,這些基本理論不再詳述。社交網(wǎng)絡(luò)分析是基于相互作用單位或節(jié)點(diǎn)之間的關(guān)系或鏈接的重要性進(jìn)行的[12]。為便于理解,將本文用到的術(shù)語和理論作以下介紹。
關(guān)注率[13]:為節(jié)點(diǎn)的入度與出度的比值,即一用戶的粉絲數(shù)與該用戶關(guān)注的對(duì)象數(shù)的比值,刻畫的是個(gè)人在網(wǎng)絡(luò)中的影響力。
聚類分析法[14]:聚類分析又稱群分析,是研究分類問題的一種多元統(tǒng)計(jì)方法,即將待處理的對(duì)象分配到相應(yīng)的聚類中,使得同一聚類中的對(duì)象差別較小,而不同聚類之間的對(duì)象差別較大。K-means聚類算法[15]是挖掘技術(shù)中一個(gè)成熟的且認(rèn)可度很高的算法,是利用距離函數(shù)將不同對(duì)象進(jìn)行聚類的方法。選用歐式距離函數(shù),個(gè)案x和y的歐式距離是兩個(gè)個(gè)案的m個(gè)變量之差的平方和的平方根,距離函數(shù)公式為
本文在研究新浪微博中,抽取了一個(gè)普通活躍用戶(即新浪微博非認(rèn)證用戶,并且微博數(shù)和粉絲數(shù)不為零)——(記為用戶A),以這個(gè)用戶為節(jié)點(diǎn)出發(fā),搜集與該用戶有直接關(guān)聯(lián)的用戶(他的關(guān)注與粉絲),以用戶作為節(jié)點(diǎn),他們之間的“關(guān)注”與“被關(guān)注”關(guān)系作為邊所構(gòu)成的有向網(wǎng)絡(luò),凡是與用戶A沒有直接關(guān)聯(lián)的用戶都不在網(wǎng)絡(luò)范圍內(nèi)。因此,用戶A的興趣愛好對(duì)于網(wǎng)絡(luò)有很大影響。記錄了該用戶從2011年3月注冊(cè)開始到2012年9月期間3個(gè)時(shí)間點(diǎn)的數(shù)據(jù)。2011年4月27日為時(shí)間點(diǎn)1,該時(shí)間點(diǎn)為用戶剛注冊(cè)不久,顯示了微博用戶開始階段的興趣特征;2011年12月23日為時(shí)間點(diǎn)2,該時(shí)間點(diǎn)為用戶關(guān)系網(wǎng)絡(luò)出度急劇增加入度變化很小,顯示了用戶過渡時(shí)期的行為特征;2012年8月8日為時(shí)間點(diǎn)3,該時(shí)間點(diǎn)為用戶關(guān)系網(wǎng)絡(luò)入度變化較大,顯示了用戶長(zhǎng)期的變化特征,處于用戶穩(wěn)定階段。用戶A網(wǎng)絡(luò)的總節(jié)點(diǎn)數(shù)和邊數(shù)如表1所示。這3個(gè)時(shí)間點(diǎn)體現(xiàn)了微博用戶網(wǎng)絡(luò)的變化特征。對(duì)應(yīng)于這3個(gè)時(shí)間點(diǎn)的數(shù)據(jù)得到3個(gè)網(wǎng)絡(luò),將這3個(gè)網(wǎng)絡(luò)加以研究分析。用戶加入到微博網(wǎng)絡(luò)中一般經(jīng)歷這3個(gè)過程,將網(wǎng)絡(luò)的拓?fù)涮匦赃M(jìn)行了對(duì)比分析。還搜集到了網(wǎng)絡(luò)3的所有用戶的資料,包括每個(gè)用戶的粉絲數(shù)、關(guān)注數(shù)和微博數(shù)。
表1 微博用戶的網(wǎng)絡(luò)數(shù)據(jù)Tab.1 The data of networks on micro-blog users
對(duì)于微博用戶關(guān)系網(wǎng)絡(luò)的結(jié)構(gòu),首先分析網(wǎng)絡(luò)屬性。選取時(shí)間點(diǎn)3的網(wǎng)絡(luò),該時(shí)間點(diǎn)的數(shù)據(jù)處于用戶注冊(cè)時(shí)間后期,網(wǎng)絡(luò)出度入度較穩(wěn)定。從網(wǎng)絡(luò)的度分布,平均群聚系數(shù)和平均最短路徑分析了網(wǎng)絡(luò)的統(tǒng)計(jì)屬性。
3.1.1 微博用戶關(guān)系網(wǎng)絡(luò)的無標(biāo)度特性
微博用戶關(guān)系網(wǎng)絡(luò)為有向網(wǎng)絡(luò),其度分布分為入度分布和出度分布,本文利用度分布函數(shù)對(duì)網(wǎng)絡(luò)的度進(jìn)行刻畫。根據(jù)搜集到的數(shù)據(jù),得到微博用戶關(guān)系網(wǎng)絡(luò)的度分布,如圖1所示。
圖1 微博用戶關(guān)系網(wǎng)絡(luò)度分布Fig.1 The degree distribution of micro-blog user relations network
從圖1得出在雙對(duì)數(shù)坐標(biāo)下,微博個(gè)人用戶關(guān)系網(wǎng)絡(luò)的出度和入度分都近似服從冪律分布,P(k)~k-r,用最小二乘法進(jìn)行了擬合,分布的指數(shù)為0.977 88和0.888 54,說明個(gè)人微博用戶關(guān)系網(wǎng)絡(luò)具有無標(biāo)度特性。
3.1.2 微博用戶關(guān)系網(wǎng)絡(luò)的小世界特性
網(wǎng)絡(luò)的小世界特性體現(xiàn)在兩個(gè)方面,一是平均最短路徑,二是網(wǎng)絡(luò)的平均群聚系數(shù)。計(jì)算得出微博用戶關(guān)系網(wǎng)絡(luò)的平均最短路徑和平均群聚系數(shù)分別為3.798 76,0.328 3。與同等規(guī)模的隨機(jī)網(wǎng)絡(luò)作對(duì)比,計(jì)算出隨機(jī)網(wǎng)絡(luò)的平均最短路徑和平均群聚系數(shù)分別為4.672 57和0.080 98。微博用戶關(guān)系網(wǎng)絡(luò)與同等規(guī)模的隨機(jī)網(wǎng)絡(luò)相比較,有較小的平均最短路徑長(zhǎng)度和較大的群聚系數(shù),表明該微博用戶關(guān)系網(wǎng)絡(luò)具有明顯的小世界特性。由于該微博網(wǎng)絡(luò)是個(gè)人用戶的微博網(wǎng)絡(luò),用戶的興趣主導(dǎo)了整個(gè)網(wǎng)絡(luò),從網(wǎng)絡(luò)的節(jié)點(diǎn)數(shù)可知用戶關(guān)注數(shù)并不多,彼此之間的距離小,平均路徑不會(huì)太大,從而表現(xiàn)出小世界現(xiàn)象。另一方面也表明微博用戶關(guān)系網(wǎng)絡(luò)連接緊密,有利于信息在網(wǎng)絡(luò)中的傳播。
用戶網(wǎng)絡(luò)根據(jù)自己興趣愛好的變化和生活交際范圍的擴(kuò)大等因素不斷地變化著,而用戶興趣不會(huì)隨時(shí)改變,因此到一定階段微博用戶關(guān)系網(wǎng)絡(luò)變化就不會(huì)那么大。隨著微博用戶網(wǎng)絡(luò)的變化,節(jié)點(diǎn)(邊)的增加或減少,網(wǎng)絡(luò)的拓?fù)涮匦砸搽S著變化,從這些屬性的變化上分析用戶網(wǎng)絡(luò),得出用戶A的行為和網(wǎng)絡(luò)中信息傳播的變化。
首先統(tǒng)計(jì)出了用戶A的出度和入度變化,如表2所示,從表中可以看出用戶A的入度和出度都不斷地增加,即用戶的粉絲和關(guān)注數(shù)都在增加,總節(jié)點(diǎn)數(shù)也不斷增加,表明用戶網(wǎng)絡(luò)范圍不斷擴(kuò)大,用戶獲取信息不斷增加,信息傳播范圍相應(yīng)變大,用戶A的興趣變得更加廣泛。相比來看,時(shí)間點(diǎn)2比時(shí)間點(diǎn)1出度增加較大,時(shí)間點(diǎn)3相比時(shí)間點(diǎn)2入度增加較大。用戶A的關(guān)注率不斷增加,表明用戶在網(wǎng)絡(luò)中的影響力逐漸增強(qiáng),用戶A的信息傳播能力不斷增強(qiáng)。
對(duì)于微博用戶關(guān)系網(wǎng)絡(luò),隨著時(shí)間的變化網(wǎng)絡(luò)結(jié)構(gòu)也發(fā)生變化。網(wǎng)絡(luò)密度描述的是網(wǎng)絡(luò)的稠密程度;節(jié)點(diǎn)i的介數(shù)表示網(wǎng)絡(luò)中所有節(jié)點(diǎn)對(duì)的最短路徑中經(jīng)過節(jié)點(diǎn)i的路徑數(shù)目占所有最短路徑數(shù)目的比例,反映了節(jié)點(diǎn)i的影響力;群聚系數(shù)反映了你的朋友圈的緊密程度[16]。計(jì)算出了3個(gè)不同時(shí)間點(diǎn)的網(wǎng)絡(luò)的統(tǒng)計(jì)指標(biāo),如表3所示。
表2 用戶A的網(wǎng)絡(luò)屬性Tab.2 The network's properties of user A
表3 不同時(shí)間點(diǎn)的微博用戶關(guān)系網(wǎng)絡(luò)屬性Tab.3 The properties of micro-blog user relations network at different time points
從表1、表3中可以看出網(wǎng)絡(luò)總節(jié)點(diǎn)數(shù)不斷增加,網(wǎng)絡(luò)中節(jié)點(diǎn)的平均入度和出度不斷減小,說明網(wǎng)絡(luò)越來越稀疏。關(guān)注的用戶逐漸增多,并沒有引起其他用戶更多的關(guān)注,表明用戶A的興趣越來越廣,信息來源越來越廣,更有利于用戶A獲取自己想要的信息。
平均最短路徑一直減小,說明網(wǎng)絡(luò)節(jié)點(diǎn)間的平均距離不斷變小。雖然網(wǎng)絡(luò)范圍不斷擴(kuò)大即節(jié)點(diǎn)不斷增加,然而網(wǎng)絡(luò)中邊的連接數(shù)增加,用戶間能達(dá)到的距離減小,從而網(wǎng)絡(luò)的平均路徑減小。網(wǎng)絡(luò)中用戶間交流和溝通更加容易,這一變化過程微博用戶關(guān)系網(wǎng)絡(luò)一直都表現(xiàn)出小世界特性,即平均最短路徑比隨機(jī)網(wǎng)絡(luò)的小。
3個(gè)時(shí)間點(diǎn)的網(wǎng)絡(luò)直徑都較大說明網(wǎng)絡(luò)輻射范圍較大,用戶A關(guān)注的對(duì)象較廣,用戶有廣泛的信息獲取資源。3個(gè)時(shí)間點(diǎn)的網(wǎng)絡(luò)直徑基本穩(wěn)定,表明微博用戶關(guān)系網(wǎng)絡(luò)較為穩(wěn)定。
網(wǎng)絡(luò)介數(shù)的不斷增大表明網(wǎng)絡(luò)中用戶節(jié)點(diǎn)的整體影響力不斷增加,信息的傳播能力變大,更容易獲取及傳播信息。用戶A的關(guān)注不斷增加,關(guān)注越多,信息來源越廣泛,有共同興趣愛好的微博用戶關(guān)注同一人可能性就越高,從而用戶的介數(shù)就不斷變大。介數(shù)的不斷增加使得網(wǎng)絡(luò)中信息更容易傳播,有利于用戶獲取即時(shí)信息。
網(wǎng)絡(luò)密度逐漸變小,網(wǎng)絡(luò)節(jié)點(diǎn)的增加,雖然網(wǎng)絡(luò)中邊也增加,但兩者不是同比例變化的,對(duì)于整個(gè)網(wǎng)絡(luò)來說還是變得稀疏。雖然網(wǎng)絡(luò)變得稀疏,并不影響用戶與其他用戶交流和獲取信息的能力。
網(wǎng)絡(luò)的平均群聚系數(shù)變化很小,表明網(wǎng)絡(luò)節(jié)點(diǎn)在增加的同時(shí),整個(gè)網(wǎng)絡(luò)中用戶間彼此關(guān)注也增加。而平均群聚系數(shù)有所減小,說明用戶關(guān)注變廣,覆蓋的不同類別的用戶,不同類別之間的用戶一般是不會(huì)相互關(guān)注,導(dǎo)致了網(wǎng)絡(luò)的平均群聚系數(shù)減小。即用戶間形成了不同的社團(tuán)結(jié)構(gòu),在社團(tuán)內(nèi)關(guān)注更加密切,而社團(tuán)之間連接就稀疏了,不利于社團(tuán)間信息的傳播。
網(wǎng)絡(luò)的結(jié)構(gòu)屬性的變化上體現(xiàn)了用戶行為的變化,從整個(gè)網(wǎng)絡(luò)發(fā)展來看,用戶獲取信息的能力變強(qiáng),網(wǎng)絡(luò)中傳播信息的通道變多,這些又是根據(jù)用戶的興趣發(fā)展變化而變化的。而用戶網(wǎng)絡(luò)結(jié)構(gòu)的變化對(duì)用戶信息傳播的影響可以對(duì)信息模型的研究提供理論依據(jù)。
微博用戶關(guān)系網(wǎng)絡(luò)分析剖析了網(wǎng)絡(luò)的結(jié)構(gòu)特征,為進(jìn)一步分析微博用戶的特性,發(fā)掘用戶間的共同特性,本文用聚類算法對(duì)微博用戶關(guān)系網(wǎng)絡(luò)進(jìn)行了聚類分析。用K-means聚類算法來挖掘微博用戶類別和網(wǎng)絡(luò)節(jié)點(diǎn)的共性。將網(wǎng)絡(luò)3去除一些不活躍節(jié)點(diǎn)的影響,得到347個(gè)用戶節(jié)點(diǎn)。將每個(gè)用戶的關(guān)注數(shù)和所發(fā)的微博數(shù)作為網(wǎng)絡(luò)中節(jié)點(diǎn)的信息獲取量和活躍性的影響因素。選取用戶的在該微博用戶網(wǎng)絡(luò)中的介數(shù)、出度、入度以及每個(gè)用戶的關(guān)注數(shù)和微博數(shù)作為變量,將數(shù)據(jù)導(dǎo)入SPSS軟件,用K-means算法進(jìn)行聚類,最終聚為3類。聚類結(jié)果如表4、表5所示。
表4 最終聚類中心Tab.4 The final cluster centers
表5 每個(gè)聚類中的案例數(shù)Tab.5 The number of cases in each cluster
從表4和5可以得出類型1占了微博用戶的81.84%,這類用戶的關(guān)注數(shù)、微博數(shù)及在網(wǎng)絡(luò)中的出度入度都最小??梢娫谠撐⒉┯脩舻木W(wǎng)絡(luò)中,大多數(shù)用戶的關(guān)注數(shù)約為508,微博數(shù)均值為3 345。這類用戶關(guān)注他人較少,一般都是朋友或者認(rèn)識(shí)的人,微博數(shù)也較少,說明平常僅僅是和關(guān)注的人或者粉絲進(jìn)行交流,關(guān)注他們的動(dòng)態(tài),獲取自己感興趣的信息。介數(shù)適中,即能得到其他用戶的響應(yīng)和關(guān)注,屬于普通社交類型。該微博網(wǎng)絡(luò)包含了大量的明星節(jié)點(diǎn),他們粉絲雖然很多,但大部分發(fā)微博數(shù)很少,基本都是在與圈內(nèi)人士進(jìn)行交流與溝通,發(fā)布自己最新動(dòng)態(tài),所以大部分的明星節(jié)點(diǎn)也屬于普通社交型。
從表4和表5看出類型2占了微博用戶的13.83%,這類用戶的微博數(shù)及出度入度都適中,關(guān)注數(shù)最大??赡芤?yàn)閻酆?、信息傳播?nèi)容、職業(yè)性質(zhì)等因素,這類用戶關(guān)注了自己感興趣或者有相同興趣的用戶,因此比起“普通社交型”關(guān)注他人稍多一點(diǎn)。微博數(shù)較多能夠與其他微博用戶進(jìn)行交流,能夠讓用戶得到他們想得到的信息,然而出度和入度并不是很大,說明只有部分人關(guān)注了這類用戶,屬于“個(gè)人興趣型”。同時(shí)介數(shù)最小,說明在網(wǎng)絡(luò)中這類用戶的節(jié)點(diǎn)重要性不大。
從表4和表5得出類型3占了微博用戶的4.33%,這類用戶的微博數(shù)與出度入度、介數(shù)最大,關(guān)注數(shù)適中。這類用戶在網(wǎng)絡(luò)中出度入度都最大,說明他在積極關(guān)注其他人微博更新動(dòng)態(tài)和信息,瀏覽和了解網(wǎng)絡(luò)當(dāng)前最新、最熱門的資訊,然后進(jìn)行發(fā)布,讓更多用戶瀏覽信息,屬于信息散播型。同時(shí)從表中看到這類用戶的博文數(shù)最大,說明用戶比較活躍,能積極傳播當(dāng)前發(fā)生的信息。介數(shù)最大也說明了這類用戶在該微博網(wǎng)絡(luò)中信息傳播影響力很大。
綜上所述,81.84%的用戶能夠與微博用戶進(jìn)行社會(huì)和朋友的交流,同時(shí)獲取自己感興趣的消息。13.83%屬于“個(gè)人興趣型”,這類用戶關(guān)注數(shù)比較大,十分積極地參與微博,話題也能引起聽眾興趣,信息創(chuàng)造的價(jià)值較大。4.33%的用戶屬于“信息散播者”,出度入度最大,更多的是關(guān)注他人,尋找自己感興趣的話題和信息,也引起他人的關(guān)注給其他用戶帶來有用的信息。這些用戶在網(wǎng)絡(luò)中活躍度比較高,擁有大量的粉絲,稱為網(wǎng)絡(luò)節(jié)點(diǎn)的“權(quán)力中心”或“意見領(lǐng)袖”,當(dāng)他們發(fā)布一條信息后,該信息就會(huì)在網(wǎng)絡(luò)中迅速散播,將是主要的信息傳播者。
在聚類統(tǒng)計(jì)結(jié)果中還包括聚類成員,每個(gè)個(gè)案的聚類信息。由于數(shù)據(jù)量較大,論文中沒有列出。但這些分析結(jié)果對(duì)于微博服務(wù)商是有一定價(jià)值的。
本文主要研究了個(gè)人微博用戶關(guān)系網(wǎng)絡(luò)的拓?fù)涮匦?,研究表明個(gè)人微博用戶關(guān)系網(wǎng)絡(luò)也具有無標(biāo)度特性和小世界特性。分析了網(wǎng)絡(luò)的不同時(shí)間點(diǎn)的屬性,隨著時(shí)間的變化網(wǎng)絡(luò)結(jié)構(gòu)發(fā)展變化,通過網(wǎng)絡(luò)結(jié)構(gòu)變化體現(xiàn)用戶行為變化。根據(jù)網(wǎng)絡(luò)節(jié)點(diǎn)的不同屬性使用K-means聚類算法將微博用戶分成了3種類型。了解了網(wǎng)絡(luò)中的節(jié)點(diǎn)用戶主要的目的與用途。能更加清晰地認(rèn)識(shí)用戶的興趣和行為,可以考慮為用戶推薦應(yīng)用程序與其他用戶。
隨著在線社會(huì)網(wǎng)絡(luò)的發(fā)展和用戶的增加,微博網(wǎng)絡(luò)還面臨著很多的挑戰(zhàn),微博網(wǎng)絡(luò)還可以從以下一些方面做進(jìn)一步研究和改進(jìn)。本文多數(shù)指標(biāo)是無向網(wǎng)絡(luò)指標(biāo),這是最簡(jiǎn)單的情況,而實(shí)際網(wǎng)絡(luò)要比這復(fù)雜得多,所以對(duì)于有向加權(quán)網(wǎng)絡(luò)有待進(jìn)一步研究;本文只研究了一個(gè)用戶的網(wǎng)絡(luò),對(duì)于普通用戶結(jié)論具有普遍性,可對(duì)于一些認(rèn)證用戶不一定適用,還有待進(jìn)一步研究;對(duì)于微博用戶網(wǎng)絡(luò)的動(dòng)態(tài)演化、微博用戶的影響力和信息傳播的效率深入分析研究,有利于信息傳播的控制,微博用戶的行為特性對(duì)微博網(wǎng)絡(luò)結(jié)構(gòu)和信息傳播的影響及微群對(duì)信息傳播的影響,有待深入研究。
[1] 胡海波,王科,徐玲,等.基于復(fù)雜網(wǎng)絡(luò)理論的在線社會(huì)網(wǎng)絡(luò)分析[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2008,5(2):1-12.Hu Haibo,Wang Ke,Xu Ling,et al.Analysis of online social networks based on complex network theory[J].Complex Systems and Complexity Science,2008,5(2):1-12.
[2] Kumar R,Novak J,Tomkins A.Structure and evolution of online social networks[M]//Link Mining:Models,Algorithms,and Applications.New York:Springer,2010:337-357.
[3] Mislove A,Marcon M,Krishna P G,et al.Measurement and analysis of online social networks[C]//Proceedings of the 7th ACM SIGCOMM Conference on Internet Measurement,Ser.IMC’07.New York:ACM,2007:29-42.
[4] 汪小帆.在線社會(huì)網(wǎng)絡(luò)分析與網(wǎng)絡(luò)牽制控制[J].復(fù)雜系統(tǒng)與復(fù)雜性科學(xué),2010,9(2/3):29-31.Wang Xiaofan.Online social network analysis and network pinning control[J].Complex Systems and Complexity Science,2010,9(2/3):29-31.
[5] Kwak H,Lee C,Park H,et al.What is twitter,a social network or a news media?[C]//Proceedings of the 19th International Conference on World Wide Web.New York:ACM,2010:591-600.
[6]Java A,Song X,F(xiàn)inin T,et al.Why we twitter:understanding microblogging usage and communities[C]//Proceedings of the 9th WebKDD and 1st SNA-KDD 2007Workshop on Web Mining and Social Network Analysis.New York:ACM,2007:56-65.
[7] 尹書華.基于復(fù)雜網(wǎng)絡(luò)的微博用戶關(guān)系網(wǎng)絡(luò)特性研究[J].西南師范大學(xué)學(xué)報(bào),2011(12):57-60.Yin Shuhua.A research of user relations properties based on complex network of microblog[J].Journal of Southwest China Normal University,2011(12):57-60.
[8] Fan P Y,Li P,Jiang Z H,et al.Measurement and analysis of topology and information propagation on Sina micro-blog[C]//Proceeding of IEEE International Conference on:Intelligence and Security Informatics.New York:IEEE Press,2011:396-401.
[9] Guo Z,Li Z,Tu H.Sina microblog:an information-driven online social network[C]//Cyberworlds(CW),2011International Conference on Cyberworlds(CW).New York:IEEE Press,2011:160-167.
[10]張寧.群體興趣網(wǎng)的統(tǒng)計(jì)特性研究[J].上海理工大學(xué)學(xué)報(bào),2008,30(3):243-246.Zhang Ning.Statistical characteristics study on the group interest networks[J].Journal of University of Shanghai for Science and Technology,2008,30(3):243-246.
[11]曹易,張寧.挖掘用戶瀏覽網(wǎng)頁的興趣研究[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2012,21(7):65-68.Cao Yi,Zhang Ning.Study of the uses'interests based on the internet browsing history[J].Computer Systems & Applications,2012,21(7):65-68.
[12]Coulon F.The use of social network analysis in innovation research:a literature review [D].Lund:Lund University,2005.
[13]Teutle A R M.Twitter:network properties analysis[C]//Electronics,Communications and Computer(CONIELECOMP),2010 20th International Conference on Date of Conference.New York:IEEE Press,2010:180-186.
[14]王曉光,袁毅,滕思琦.微博社區(qū)交流網(wǎng)絡(luò)結(jié)構(gòu)的實(shí)證分析[J].情報(bào)雜志.2011(2):199-202.Wang Xiaoguang,Yuan Yi,Teng Siqi.Empirical analysis on communicating structure of micro-blog community[J].Journal of the China Society for Scientific and Technical Information,2011(2):199-202.
[15]楊小朋,何躍.騰訊微博用戶的特征分析[J].情報(bào)雜志.2012(3):84-87.Yang Xiaopeng,He Yue.Analysis on the user's data of tencent micro-blog[J].Journal of the China Society for Scientific and Technical Information,2012(3):84-87.
[16]汪小帆,李翔,陳關(guān)榮.網(wǎng)絡(luò)科學(xué)導(dǎo)論[M].北京:高等教育出版社,2012.