[摘要] 隨著互聯(lián)網(wǎng)規(guī)模的不斷擴大和信息形式的多樣化,互聯(lián)網(wǎng)上的海量信息為社會化網(wǎng)絡(luò)服務(wù)(SNS)的研究提供了廣闊的發(fā)展空間。在歸納總結(jié)近年來社會化網(wǎng)絡(luò)服務(wù)研究情況的基礎(chǔ)上,通過對相關(guān)文獻的梳理和總結(jié),闡述社會化網(wǎng)絡(luò)服務(wù)在社會化網(wǎng)絡(luò)分析、社會化網(wǎng)絡(luò)搜索等領(lǐng)域的研究成果及今后的發(fā)展方向。
[關(guān)鍵詞]社會化網(wǎng)絡(luò)服務(wù) 社會網(wǎng)絡(luò)分析 社會網(wǎng)絡(luò)搜索 六度分隔
社會化網(wǎng)絡(luò)服務(wù)(Social Networking Service ,SNS)是以真實社會人際關(guān)系為基礎(chǔ),結(jié)合網(wǎng)絡(luò)虛擬社區(qū)的特點,構(gòu)建的現(xiàn)實社會人際關(guān)系網(wǎng)絡(luò)。因此,SNS的核心是現(xiàn)實社會人際關(guān)系在網(wǎng)絡(luò)上的真實映射[1]。SNS已成為Web 2.0技術(shù)下最具發(fā)展?jié)摿Φ膽?yīng)用領(lǐng)域之一,蘊含著海量數(shù)據(jù)是SNS的最大優(yōu)勢,如何充分利用這些用戶數(shù)據(jù)挖掘出有用信息為人類社會服務(wù),成為當今社會化網(wǎng)絡(luò)服務(wù)研究領(lǐng)域中的一大熱點。本文通過歸納和總結(jié)近年來國內(nèi)外研究者的研究成果,闡述社會化網(wǎng)絡(luò)服務(wù)的主要研究領(lǐng)域及今后的發(fā)展方向。
1 社會化網(wǎng)絡(luò)服務(wù)的概念
SNS的理論基礎(chǔ)源自六度分隔理論[2]和150法則(Rule of 150)[3]。六度分隔理論由美國社會心理學家、哈佛大學教授Stanley Milgram于20世紀60年代提出:“最多通過6個人你就能夠認識任何一個陌生人”。150 法則最早是由歐洲發(fā)源的“赫特兄弟會”提出的——“把人群控制在150人以下是管理人群的一個最佳和最有效的方式”。 依據(jù)六度分隔理論和150法則,SNS以認識朋友的朋友為目標,擴展自己的社會資源。
社會化網(wǎng)絡(luò)的定義是Barry Wellman等于1988年提出的“社會化網(wǎng)絡(luò)是由某些特定群體(人、企業(yè)和組織)間的社會關(guān)系構(gòu)成的相對穩(wěn)定的關(guān)系網(wǎng)”[4]。目前社會化網(wǎng)絡(luò)服務(wù)的定義為:一種網(wǎng)絡(luò)服務(wù)或應(yīng)用,用于在互聯(lián)網(wǎng)上建立人與人的社交關(guān)系網(wǎng)絡(luò),并能夠基于這種社交關(guān)系為人與人、人與機器的溝通和互動提供支持,從而為網(wǎng)絡(luò)用戶在現(xiàn)實社會和虛擬社會的生活和工作提供方便有效的幫助。
社會化網(wǎng)絡(luò)是由個體與個體之間的關(guān)系構(gòu)成的滿足社會關(guān)系結(jié)構(gòu)特點的網(wǎng)絡(luò),從結(jié)構(gòu)上來說是一種以“節(jié)點”為頂點、以“關(guān)系”為邊構(gòu)成的加權(quán)有向圖。節(jié)點表示對象,一般是人或組織機構(gòu)等,而邊是對象間的某種特定關(guān)系。例如,兩人互相之間發(fā)送過郵件,共同發(fā)表過論文,注冊同一網(wǎng)絡(luò)社區(qū)等,都可以稱他們之間具有某種關(guān)系。使用G=(V,E,a)三元組來表示關(guān)系網(wǎng)絡(luò),其中V(G)是頂點集合,E(G)是邊的集合。a為邊集E(G)到(0,1]的映射,即 ,稱a(r)為邊r的權(quán),表示節(jié)點關(guān)系的緊密程度。社會化關(guān)系網(wǎng)絡(luò)結(jié)構(gòu)如圖1所示:
2 SNS的研究對象及分類
社會化網(wǎng)絡(luò)服務(wù)的研究對象主要有網(wǎng)絡(luò)信息資源(如電子郵件、博客、網(wǎng)絡(luò)論壇、Web頁面等),專用網(wǎng)絡(luò)數(shù)據(jù)庫資源(如中國知網(wǎng)數(shù)據(jù)庫、DBLP數(shù)據(jù)庫等)和專門提供網(wǎng)絡(luò)社交服務(wù)的社交網(wǎng)站(如Facebook、Myspace、人人網(wǎng)、開心網(wǎng)等)。根據(jù)這些網(wǎng)絡(luò)的不同特點,社會化網(wǎng)絡(luò)服務(wù)的研究對象可以分為4種:
?問答型的社會化網(wǎng)絡(luò):以電子郵件、博客、網(wǎng)絡(luò)論壇、即時通訊工具等為信息源構(gòu)建的社會化網(wǎng)絡(luò)屬于問答型的社會化網(wǎng)絡(luò)。這種社會網(wǎng)絡(luò)關(guān)系是通過人與人之間簡單的文字交流,即問答方式建立起來的社會關(guān)系。如人們通過互發(fā)電子郵件,在網(wǎng)絡(luò)論壇對共同感興趣的話題展開討論等。
?合作型的社會化網(wǎng)絡(luò):主要是通過專業(yè)的數(shù)據(jù)集合構(gòu)成。這種社會網(wǎng)絡(luò)通常包含兩種節(jié)點,即參與者和媒介,參與者通過媒介聯(lián)系在一起。例如,在專業(yè)期刊網(wǎng)絡(luò)中,論文作者是參與者,他們共同發(fā)表和引用的論文是媒介。在科研項目數(shù)據(jù)庫中,科研項目的參與者通過研究課題建立聯(lián)系。這種網(wǎng)絡(luò)的特點是具有規(guī)范的數(shù)據(jù)描述和高度的專業(yè)性。
?好友型的社會化網(wǎng)絡(luò):人們通過在專業(yè)社交網(wǎng)站注冊會員和添加好友的形式建立起來的社會化網(wǎng)絡(luò)。這種社會網(wǎng)絡(luò)成員交友的目的性更明確,并且可以有效地管理自己的好友列表。
?開放型的社會化網(wǎng)絡(luò):這種社會化網(wǎng)絡(luò)主要是通過互聯(lián)網(wǎng)上海量的Web頁面間的關(guān)系構(gòu)成的社會化關(guān)系網(wǎng)絡(luò)。開放型的社會化網(wǎng)絡(luò)需要發(fā)現(xiàn)Web頁面中的實體(人名、地名、機構(gòu)、鏈接等),并且定義、挖掘?qū)嶓w之間的關(guān)系。這種網(wǎng)絡(luò)的特點是信息量大、網(wǎng)絡(luò)龐雜,具有很大的不確定性。
3 SNS的主要研究方向
目前SNS的研究主要分為兩個方向,即社會化網(wǎng)絡(luò)分析和社會化網(wǎng)絡(luò)搜索。
3.1 社會化網(wǎng)絡(luò)分析
社會化網(wǎng)絡(luò)分析通過分析群體、組織、虛擬社區(qū)等其內(nèi)部成員之間的關(guān)系和交互,發(fā)現(xiàn)他們的組織特點、行為方式、個性特征等,從而更好地支持這些群體和組織成員間的信息共享、行為交互與協(xié)作[5]。
目前社會化網(wǎng)絡(luò)分析主要有兩個研究方向:①對社會網(wǎng)絡(luò)的參數(shù)進行測量,這些參數(shù)主要包括網(wǎng)絡(luò)規(guī)模、節(jié)點個數(shù)、節(jié)點之間的距離、節(jié)點可達性、中心度、聚類系數(shù)等[6]。通過分析比較社會網(wǎng)絡(luò)的各項參數(shù)來揭示網(wǎng)絡(luò)節(jié)點與節(jié)點之間的親密程度和相互作用關(guān)系。②通過分析社會化網(wǎng)絡(luò)結(jié)構(gòu)和內(nèi)容來發(fā)現(xiàn)網(wǎng)絡(luò)中具有特征的局部結(jié)構(gòu)和關(guān)鍵節(jié)點,例如網(wǎng)絡(luò)社區(qū)識別、社團結(jié)構(gòu)發(fā)現(xiàn)及核心成員挖掘、情報分析等。
3.2 社會化網(wǎng)絡(luò)搜索
基于社會化網(wǎng)絡(luò)和信息挖掘技術(shù)的社會化網(wǎng)絡(luò)搜索,是利用社會化網(wǎng)絡(luò)的概念和Web信息的內(nèi)部關(guān)系,以人物為中心的信息聚合的垂直搜索,搜索的目的是將人和人之間的關(guān)系抽取出來,針對要查找的目標人物給出圍繞該目標人物的信息,包括人物簡介、人物關(guān)系等內(nèi)容。
通常社會化網(wǎng)絡(luò)搜索服務(wù)由三大部分組成,即社會化網(wǎng)絡(luò)構(gòu)建、社會關(guān)系查找和社會化網(wǎng)絡(luò)可視化。目前已經(jīng)發(fā)布的社會化網(wǎng)絡(luò)搜索引擎有Spock人物搜索、微軟人立方、偶社、搜人網(wǎng)等。
當前社會化網(wǎng)絡(luò)搜索面臨的難點問題主要有:搜索算法的研究、最短路徑算法優(yōu)化問題、信息可視化問題以及信息識別判定等問題。如實體重名問題、實體關(guān)系確認問題、同一身份認定問題、外國人名的音譯問題、參考信息源的準確性判斷和隱私保護等問題。
4 社會化網(wǎng)絡(luò)服務(wù)的應(yīng)用領(lǐng)域
4.1 犯罪網(wǎng)絡(luò)分析及敏感社團挖掘
犯罪網(wǎng)絡(luò)分析作為社會化網(wǎng)絡(luò)分析的主要研究分支,近年來受到各國政府和相關(guān)機構(gòu)的廣泛關(guān)注。犯罪網(wǎng)絡(luò)分析及敏感社團挖掘系統(tǒng)可以預測犯罪網(wǎng)絡(luò)規(guī)模,確定成員關(guān)系,幫助執(zhí)法機關(guān)高效準確地發(fā)現(xiàn)犯罪組織成員,找出核心成員,并將其組織結(jié)構(gòu)可視化顯示,便于案件的偵破。
文獻[7-9]從不同方面和技術(shù)角度介紹了國外一些學者在犯罪網(wǎng)絡(luò)分析中的研究成果:①提出了基于層次貝葉斯推理模型構(gòu)建恐怖組織網(wǎng)絡(luò)的方法;②實體抽取技術(shù)可以用來從犯罪記錄中鑒別罪犯分子身份和地址;③聚類分析方法可以找出使用相同作案手段的犯罪嫌疑人或區(qū)分不同的犯罪組織;④偏差檢測技術(shù)用于發(fā)現(xiàn)欺詐犯罪行為,網(wǎng)絡(luò)入侵和其他的犯罪分析。
國內(nèi)一些學者也開始了對犯罪網(wǎng)絡(luò)的研究,文獻[10]依據(jù)犯罪分子之間的通信行為,采用SPLINE算法和中心度概念挖掘犯罪團伙的結(jié)構(gòu)、核心成員。文獻[11]介紹了基于三層過濾模型的郵件挖掘系統(tǒng)。通過對郵件的時間屬性、內(nèi)容信息和地址數(shù)據(jù)進行逐層分析和篩選過濾,在廣度上縮小偵察范圍,在深度上加大挖掘力度,從而找出敏感社團結(jié)構(gòu)及其成員組成。文獻[12]提出一種挖掘社會網(wǎng)絡(luò)核心層的方法MCCY,該方法首先刪除結(jié)點度小于一定閾值的結(jié)點,再運用社團結(jié)構(gòu)及中心度分析找出部分網(wǎng)絡(luò)核心成員,最后結(jié)合已刪除的結(jié)點得出完整的社會網(wǎng)絡(luò)核心層。
4.2 作者合作網(wǎng)絡(luò)分析
社會化網(wǎng)絡(luò)分析為論文、科研合作研究提供了有效的途徑。通過對科研機構(gòu)研究人員合作發(fā)表論文的網(wǎng)絡(luò)分析,可以發(fā)現(xiàn)研究人員合作的緊密程度、合作的基本模式;發(fā)現(xiàn)研究團隊結(jié)構(gòu)和團隊合作的穩(wěn)定性及變化;挖掘當前研究熱點問題及研究領(lǐng)域等。
文獻[13]通過對DBLP數(shù)據(jù)庫提供的XML數(shù)據(jù)文件的解析,得到協(xié)作者最多的作者和出版物最多的作者,并對協(xié)作者300人以上的作者建立作者協(xié)作網(wǎng)絡(luò)圖,在協(xié)作圖上挖掘出核心作者,通過研究核心作者近3年發(fā)表的論文,得出其研究領(lǐng)域。
文獻[14]借助領(lǐng)域?qū)<抑R導航平臺(FSKC),提出一種基于科技文獻的學科團隊成員挖掘與識別方法,該方法有助于識別科研團隊成員和學科帶頭人,建立合作關(guān)系網(wǎng)絡(luò),拓展科研機構(gòu)評估及分析方法。
4.3 基于Web的人物社會關(guān)系搜索
文獻[15-16]從中文Web頁中提取人名實體,定義3-6種人物關(guān)系,并以此為基礎(chǔ)構(gòu)建人物間的關(guān)系網(wǎng)絡(luò),這種人名實體是網(wǎng)頁中出現(xiàn)的名人,判斷名人之間是否存在關(guān)系的依據(jù)是判斷兩個人名是否存在于一個網(wǎng)頁、句子或是否由連詞連接,對于一些非名人,涉及他們的網(wǎng)頁較少,加之人物重名情況較多,所以通過這種方法提取人物關(guān)系的準確性還有待提高。
目前人物社會關(guān)系搜索較為成熟的是微軟人立方關(guān)系搜索引擎,它可以從超過10億的中文網(wǎng)頁中自動地抽取出人名、地名、機構(gòu)名以及中文短語,并且通過算法自動地計算出它們之間存在關(guān)系的可能性,但這種簡單通過人名、地名挖掘人與人之間關(guān)系的方法存在局限性和非真實性。
4.4 其他應(yīng)用研究
SNS在其他應(yīng)用領(lǐng)域的研究包括:企業(yè)商業(yè)情報分析、合作伙伴挖掘、企業(yè)營銷、客戶資源管理等方面[17-18]??蛻羧旱拇笮Q定一個企業(yè)的利潤和發(fā)展前景,任何企業(yè)都千方百計尋找新的客戶,來擴大其經(jīng)營規(guī)模。通過社會化網(wǎng)絡(luò)服務(wù)所提供的知識可以為企業(yè)提供新的潛在客戶,通過客戶之間的社會關(guān)系,由一個客戶找到一個大的客戶群,這樣無疑會為企業(yè)帶來巨大的商業(yè)利益。
5 結(jié) 語
當前,社會化網(wǎng)絡(luò)服務(wù)的研究還剛剛起步,其方法較簡單、可靠性差。人類在社會活動中的主觀能動性造成社會關(guān)系網(wǎng)絡(luò)的復雜多樣,有時無法用簡單數(shù)學模型來抽象表達復雜的社會關(guān)系,這是SNS研究者面對的最大難題。因此,研究基于多種信息元素、通過人工智能技術(shù)廣泛挖掘社會關(guān)系,并結(jié)合身份識別技術(shù)判斷社會關(guān)系的真實性,最終建立真實的社會化關(guān)系網(wǎng)絡(luò),并研究社會關(guān)系網(wǎng)絡(luò)的搜索及可視化成為SNS技術(shù)研究未來的發(fā)展方向。
參考文獻:
[1] Staab S, Domingos P, Mika P. Social networks applied[J]. IEEE Intelligent Systems, 2005, 20(1): 80-93.
[2] Milgram S. Behavioral study of obedience[J].Journal of Abnormal and Social Psychology,1992(67):371-378.
[3] Dunbar Robin. Grooming,Gossip,and the evolution of language[M]. Cambridge:Harvard University Press,1996.
[4] Barry Wellman, Berkowitz S D. Social structures: A network approach[M]. New York:Cambridge University Press, 1988:130.
[5] Michael H. Zack. Researching organizational systems using social network analysis[C]. Proceedings of the 33rd Hawaii International Conference on System Sciences. 2000:7043.
[6] Newman M E J. Who is the best connected scientist? A study of scientific co-authorship networks[J]. Phys Rev, 2001(E 64): 016131–016132.
[7] Valdis E.Krebs. Mapping networks of terrorist cells[J]. Connections,2002, 24(3): 43-52.
[8] Dombroski M J, Carley K M. NETEST: Estimating a terrorist network's structure[C]. CASOS 2002, Computational and Mathematical Organization Theory, 2002:235-241.
[9] Xu J J, Chen H C. CrimeNet explorer: A Framework for criminal network knowledge discovery[J]. ACM Transactions on Information Systems, 2005, 23(2):202-226.
[10] 唐常杰,劉威,溫粉蓮,等. 社會網(wǎng)絡(luò)分析和社團信息挖掘的三項探索——挖掘虛擬社團的結(jié)構(gòu)、核心和通信行為[J]. 計算機應(yīng)用, 2006,26(9):2020-2023.
[11] 段丹,郭紹忠,李志博,等. 基于郵件分類的敏感社團挖掘技術(shù)[J]. 計算機應(yīng)用,2007,27(12):3039-3041.
[12] 田宏,馬朝陽. 基于郵件挖掘社會網(wǎng)絡(luò)核心層的新方法[J]. 大連交通大學學報, 2010,31(3): 92-96.
[13] 趙彩虹,楊艷. 基于DBLP的作者協(xié)作關(guān)系挖掘[J]. 黑龍江大學自然科學學報, 2010,27(4):491-494.
[14] 王衍喜,周津慧,王永吉,等. 一種基于科技文獻的學科團隊識別方法研究[J]. 圖書情報工作, 2011,55(2):55-58.
[15] 姚從磊,邸楠. 一種基于Web的大規(guī)模人物社會關(guān)系提取方法[J]. 模式識別與人工智能,2007,20(6):740-744.
[16] 邸楠,姚從磊,李曉明. 基于中文Web社會網(wǎng)絡(luò)的提取、測量與分析[J]. 廣西師范大學學報(自然科學版),2007,25(2):169-172.
[17] 王云峰. 從SNS到ESN:社會化網(wǎng)絡(luò)及其在競爭情報中的作用[J]. 情報科學,2010,28(10):1480-1483.
[18] 丁遒勁,鞠英杰. 中小企業(yè)基于SNS人際競爭情報解決方案研究[J]. 圖書情報工作,2010,54(14):83-87.
[作者簡介] 趙 洋,男,1976年生,講師,碩士,發(fā)表論文15篇。張玉新,男,1979年生,講師,碩士,發(fā)表論文16篇。陳 晨,男,1983年生,助教,碩士,發(fā)表論文5篇。