邵鎣俠,馮是聰
北京明略軟件系統(tǒng)有限公司,北京 102218
社交網(wǎng)絡(luò)分析在公共安全領(lǐng)域的應(yīng)用
邵鎣俠,馮是聰
北京明略軟件系統(tǒng)有限公司,北京 102218
社交網(wǎng)絡(luò)分析技術(shù)是一種通用有效的研究社會(huì)人員之間復(fù)雜關(guān)系模式的方法。以公安領(lǐng)域?yàn)楸尘?,首先介紹了社交網(wǎng)絡(luò)分析理論,然后詳細(xì)闡述該技術(shù)在公安領(lǐng)域的3個(gè)應(yīng)用案例,包括犯罪團(tuán)伙挖掘、核心成員識(shí)別和串并案挖掘,以期為讀者了解社交網(wǎng)絡(luò)分析技術(shù)在公共安全領(lǐng)域的應(yīng)用提供幫助。
社交網(wǎng)絡(luò)分析;公共安全;犯罪團(tuán)伙
近幾年來,在線社交媒體(online social media)的迅速發(fā)展,微博、人人網(wǎng)、Facebook、Twitter等社交服務(wù)商的出現(xiàn),給社交網(wǎng)絡(luò)分析(social network analysis, SNA)技術(shù)的發(fā)展提供了充足的土壤。曾經(jīng)只能通過調(diào)查問卷的方式收集幾百到幾千人的社交網(wǎng)絡(luò)數(shù)據(jù),如今通過公司合作或者數(shù)據(jù)交換等方式,可輕易獲得千萬到百億級(jí)別的社交網(wǎng)絡(luò)數(shù)據(jù)。為了處理和分析大數(shù)據(jù)環(huán)境下的社交網(wǎng)絡(luò)數(shù)據(jù),工業(yè)界和學(xué)術(shù)界都給社交網(wǎng)絡(luò)分析技術(shù)注入了新鮮血液,提出了許許多多新的技術(shù)方案和指標(biāo)。
社交網(wǎng)絡(luò)分析主要研究人在社會(huì)網(wǎng)絡(luò)中的位置及其信息在整個(gè)社會(huì)網(wǎng)絡(luò)中傳播形式等內(nèi)容,通過關(guān)系分析,發(fā)現(xiàn)網(wǎng)絡(luò)系統(tǒng)背后潛在的信息及價(jià)值,輔助決策者進(jìn)行決策。如前文所述,隨著社交媒體的出現(xiàn),SNA技術(shù)變得越來越成熟,越來越完善。如今,它已經(jīng)被應(yīng)用到各個(gè)領(lǐng)域。比如,在社交媒體領(lǐng)域,服務(wù)提供商通過社交網(wǎng)絡(luò)分析技術(shù)分析用戶間好友或關(guān)注網(wǎng)絡(luò),可以發(fā)現(xiàn)網(wǎng)絡(luò)中具有影響力的用戶,進(jìn)行廣告投放,或者發(fā)現(xiàn)網(wǎng)絡(luò)中的群體進(jìn)行特定主題的內(nèi)容推薦。在電子商務(wù)領(lǐng)域,利用用戶的消費(fèi)信息,可以得到用戶與購(gòu)買物品間的購(gòu)物網(wǎng)絡(luò),進(jìn)而抽取用戶間的共同購(gòu)買網(wǎng)絡(luò)。在共同購(gòu)買網(wǎng)絡(luò)上,利用社交網(wǎng)絡(luò)分析方法可以發(fā)現(xiàn)特定用戶群體,從而推薦相應(yīng)的商品。
同樣地,社交網(wǎng)絡(luò)分析技術(shù)作為一種社會(huì)研究的科學(xué)方法也為公安執(zhí)法部門的智慧警務(wù)建設(shè)提供了一種有利手段。在實(shí)際的警務(wù)工作中,公安干警對(duì)案件的研判會(huì)利用犯罪嫌疑人既有的復(fù)雜社會(huì)關(guān)系,對(duì)犯罪嫌疑人的可能動(dòng)向、嫌疑性大小進(jìn)行分析。與社交網(wǎng)絡(luò)分析相同,整個(gè)研判過程可以使用網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行建模。網(wǎng)絡(luò)中的一個(gè)節(jié)點(diǎn)可以表示一個(gè)人、一個(gè)公司、一個(gè)組織,而邊則代表著二者之間不同的信息交互類型,例如買賣雙方的毒品交易、恐怖分子之間的通信聯(lián)系、歹徒與受害者之間的聯(lián)系等。由此構(gòu)建的社交網(wǎng)絡(luò)圖,首先通過可視化技術(shù),既可在視覺上直觀地體現(xiàn)出犯罪嫌疑人之間、犯罪嫌疑人與受害人之間、犯罪嫌疑人與其親人朋友之間的聯(lián)系,又將抽象的案件分析具體化、數(shù)據(jù)化;然后,利用社交網(wǎng)絡(luò)分析技術(shù)的定量分析,能夠刻畫出案件中的關(guān)鍵人物、團(tuán)伙間的協(xié)作流程,為警員的案件偵破或者復(fù)盤提供豐富多角度的信息。
然而,由于公安領(lǐng)域內(nèi)的信息化建設(shè)相對(duì)于互聯(lián)網(wǎng)起步較晚,許多成熟的分析技術(shù)還并未真正運(yùn)用到實(shí)戰(zhàn)之中,社交網(wǎng)絡(luò)分析技術(shù)就是一個(gè)實(shí)例。通過前面的簡(jiǎn)單分析可知,公安執(zhí)法部門日常工作的服務(wù)對(duì)象還是以人為主,通過人與人之間的關(guān)系偵察辦案,為社交網(wǎng)絡(luò)分析技術(shù)的應(yīng)用提供了充分的條件。下文筆者將討論社交網(wǎng)絡(luò)分析技術(shù)中的基本理論和方法,隨后通過幾個(gè)真實(shí)場(chǎng)景給出社交網(wǎng)絡(luò)分析在公安領(lǐng)域進(jìn)行實(shí)戰(zhàn)的可能性。
社交網(wǎng)絡(luò)分析理論是研究社會(huì)生活中人與人之間的網(wǎng)絡(luò)如何形成、網(wǎng)絡(luò)中的行為模式以及信息在網(wǎng)絡(luò)中如何傳遞的一門學(xué)科。它重點(diǎn)關(guān)注人在網(wǎng)絡(luò)中所處的位置和人的行為受整個(gè)網(wǎng)絡(luò)的影響。從方法論角度出發(fā),社交網(wǎng)絡(luò)分析提供了一套面向網(wǎng)絡(luò)的量化分析方法,能對(duì)網(wǎng)絡(luò)中的關(guān)系模式、節(jié)點(diǎn)影響力等內(nèi)容進(jìn)行定量討論。
一張社交網(wǎng)絡(luò)主要包括兩類基本元素,分別是節(jié)點(diǎn)和邊。其中節(jié)點(diǎn)可以為現(xiàn)實(shí)生活中的人、組織、地點(diǎn)、物品等各類實(shí)體,邊則為實(shí)體間的不同關(guān)系,比如人與人之間的好友、血緣關(guān)系,人和公司的從屬關(guān)系,人與物品的擁有關(guān)系等。面向社交網(wǎng)絡(luò)的分析輸出內(nèi)容主要有兩方面:定量分析結(jié)果和可視化展示。下面從這兩方面介紹相關(guān)的技術(shù)手段。
2.1 定量分析
定量分析的結(jié)果類型多種多樣,包括網(wǎng)絡(luò)中的頂點(diǎn)分析、鏈接分析、社區(qū)分析等內(nèi)容。
頂點(diǎn)分析主要研究節(jié)點(diǎn)在網(wǎng)絡(luò)中所處位置的重要性。通過量化的重要性反映該節(jié)點(diǎn)在網(wǎng)絡(luò)中信息傳播的影響力,影響越大的節(jié)點(diǎn)就越重要。在社交網(wǎng)絡(luò)分析中主要通過中心性(centrality)[1]對(duì)節(jié)點(diǎn)的重要性進(jìn)行測(cè)量。經(jīng)過多年的研究,已經(jīng)提出了多種不同的中心性定義,包括 PageRank、超文本敏感標(biāo)題搜索(hypertext-induced topic search,HITS)、中介(betweenness)中心性、緊密(closeness)中心性、基于度(degree)的中心性等。每一種中心性對(duì)網(wǎng)絡(luò)中信息流的傳播做了不同的假設(shè),從不同角度刻畫一個(gè)節(jié)點(diǎn)在網(wǎng)絡(luò)中的重要程度。以基于度的中心性為例,一個(gè)節(jié)點(diǎn)的度越大,即該節(jié)點(diǎn)直接聯(lián)系的人越多,則認(rèn)為其越重要。這個(gè)衡量指標(biāo)適用于對(duì)事件型信息的刻畫。以發(fā)表學(xué)術(shù)文章為例,兩個(gè)作者若發(fā)表同一個(gè)文章,則互相之間產(chǎn)生一條邊,那么在這樣的一個(gè)社交網(wǎng)絡(luò)下,一個(gè)人的合作者越多,即網(wǎng)絡(luò)中度越大,就說明該人在此學(xué)術(shù)界中影響力很大。另外,定量分析還包括對(duì)網(wǎng)絡(luò)中群體的刻畫,即期望發(fā)掘網(wǎng)絡(luò)中具有相似特征的群體,以便進(jìn)行定向深入分析。
鏈接分析的主要研究對(duì)象則是網(wǎng)絡(luò)中的邊。類似頂點(diǎn)的研究,關(guān)于邊的重要性的定量分析有邊中心性的概念。除此之外,一個(gè)重要的研究方向是網(wǎng)絡(luò)中的鏈接預(yù)測(cè),即根據(jù)網(wǎng)絡(luò)的全局拓?fù)浣Y(jié)構(gòu)及相關(guān)屬性,預(yù)測(cè)節(jié)點(diǎn)間邊存在的可能性。目前預(yù)測(cè)的方法主要分為兩類。第一類方法是基于內(nèi)容的特征工程,建立預(yù)測(cè)模型。它主要利用節(jié)點(diǎn)上的屬性構(gòu)造特征向量,比如年齡、性別、職業(yè)、興趣愛好標(biāo)簽等。第二類方法是考慮網(wǎng)絡(luò)結(jié)構(gòu)特征構(gòu)建預(yù)測(cè)模型。在生成特征向量時(shí),除了考慮基本屬性特征以外,還會(huì)引入共同好友數(shù)、ego-network信息等特征,增加預(yù)測(cè)模型的維度特征。
社區(qū)分析則是關(guān)注群體在網(wǎng)絡(luò)中的分布情況。此項(xiàng)技術(shù)在互聯(lián)網(wǎng)應(yīng)用中,經(jīng)常用于發(fā)現(xiàn)具有相同興趣愛好的人群,為互聯(lián)網(wǎng)上的定向廣告推薦提供重要的信息。針對(duì)此問題的方法同樣可以分為兩類:第一,基于特征工程的聚類算法,類似鏈接預(yù)測(cè)問題中的方法,對(duì)每個(gè)節(jié)點(diǎn)提取特征,利用聚類算法對(duì)頂點(diǎn)進(jìn)行聚類;第二,一般認(rèn)為屬于同一社區(qū)的成員之間都存在一定的聯(lián)系,于是有了如下的經(jīng)驗(yàn)總結(jié),社區(qū)成員間的邊要比社區(qū)間的邊更加稠密。基于上述經(jīng)驗(yàn)總結(jié),研究界提出了模塊化(modularity)的概念,即模塊內(nèi)的稠密度(density)比模塊間的高,具體定義可參考參考文獻(xiàn)[2]。
2.2 可視化展示
可視化展示直接把網(wǎng)絡(luò)的拓?fù)浣Y(jié)構(gòu)及不同屬性的關(guān)系以點(diǎn)和線的方式呈現(xiàn)給用戶,同時(shí),用戶可以通過交互式的方式探索和分析該網(wǎng)絡(luò)。目前,針對(duì)社交網(wǎng)絡(luò)的可視化研究同樣可以分為兩類。第一類是針對(duì)局部圖或者小規(guī)模圖的展示,便于用戶觀察全圖的局部,比如一個(gè)頂點(diǎn)的鄰居網(wǎng)絡(luò),抑或是某個(gè)感興趣的群體。關(guān)于此類小規(guī)模圖的可視化布局已經(jīng)有成熟的算法,比如Spring布局、Force-based布局等。第二類是針對(duì)大規(guī)模網(wǎng)絡(luò)可視化問題研究相關(guān)技術(shù)方案?,F(xiàn)實(shí)的社交網(wǎng)絡(luò)規(guī)模越來越大,像Facebook、新浪微博等社交網(wǎng)絡(luò)包含幾億個(gè)節(jié)點(diǎn)。傳統(tǒng)的圖布局算法無法處理新的大規(guī)模網(wǎng)絡(luò)。最新的研究嘗試?yán)脠D嵌入(graph embedding)方法,通過保留圖結(jié)構(gòu)中的鄰近性,把圖嵌入二維空間中[3]。而圖嵌入方法通過優(yōu)化,可以獲得高效性能,從而支持大規(guī)模網(wǎng)絡(luò)數(shù)據(jù)的可視化展示,為用戶處理和分析大規(guī)模網(wǎng)絡(luò)提供一種強(qiáng)有力的方法。
本節(jié)主要探討社交網(wǎng)絡(luò)分析技術(shù)在公安領(lǐng)域的具體應(yīng)用場(chǎng)景。
3.1 犯罪團(tuán)伙挖掘
隨著社會(huì)的發(fā)展,犯罪手段和技術(shù)也在不斷地演進(jìn),呈現(xiàn)出團(tuán)伙作案的趨勢(shì)。在一個(gè)犯罪團(tuán)伙內(nèi)部,成員們分工明確,通過相互協(xié)作實(shí)現(xiàn)隱蔽作案的目的。比如,電信網(wǎng)絡(luò)詐騙團(tuán)伙內(nèi)部,有人負(fù)責(zé)編撰故事,有人負(fù)責(zé)跟受騙者溝通,有人負(fù)責(zé)洗錢;在涉毒團(tuán)伙中,有人專門購(gòu)買原材料,有人專門制毒,有人負(fù)責(zé)販毒,還有人專門洗錢;在販嬰團(tuán)伙中,有人負(fù)責(zé)尋找嬰兒,有人運(yùn)輸,有人找買家,有人收賬。總之,團(tuán)伙往往分工明確,在辦案過程中僅僅打掉其中一個(gè)環(huán)節(jié)或某幾個(gè)環(huán)節(jié),效果都不盡如人意,團(tuán)伙仍有可能重新組織人手繼續(xù)犯罪。因此,明確團(tuán)伙成員、分析清楚團(tuán)伙內(nèi)部成員的地位等級(jí),將給執(zhí)法辦案提供極大的幫助,同時(shí)也是需要解決的一大難題。
社交網(wǎng)絡(luò)分析為上述這一難題的解決帶來了希望。前文提到,社區(qū)發(fā)現(xiàn)是社交網(wǎng)絡(luò)分析的一項(xiàng)基本內(nèi)容。而基于以往的經(jīng)驗(yàn)了解到,犯罪團(tuán)伙間都存在或多或少的聯(lián)系,團(tuán)伙內(nèi)部的關(guān)系與團(tuán)伙外部的關(guān)系有著顯著的差異,比如,團(tuán)伙的結(jié)構(gòu)相對(duì)稀疏,但外圍的人員與外界關(guān)系頻繁等。根據(jù)上述經(jīng)驗(yàn),設(shè)置合理的模塊優(yōu)化目標(biāo)[2],可以利用社區(qū)發(fā)現(xiàn)的思想得到一個(gè)粗略的群體,然后再利用精細(xì)的分類方法,比如基于圖核函數(shù)的聚類算法,從群體中分離出小團(tuán)體。
舉個(gè)具體的例子,在實(shí)際工作中,可以結(jié)合社會(huì)人員的出行軌跡、通信情況、住宿記錄等信息建立多種關(guān)系,并形成一張異構(gòu)網(wǎng)絡(luò)。針對(duì)得到的異構(gòu)網(wǎng)絡(luò),利用經(jīng)典的圖劃分算法得到一系列高內(nèi)聚性的群體。對(duì)于群體內(nèi)部有較多(如大于3人)犯罪前科的人,則可以初步判定此群體為嫌疑犯罪團(tuán)伙。針對(duì)感興趣的犯罪團(tuán)伙,再通過提取頂點(diǎn)特征,利用k-means算法對(duì)群體內(nèi)頂點(diǎn)進(jìn)行分類,形成精細(xì)的團(tuán)伙。其中,頂點(diǎn)特征可以包括最近軌跡行為時(shí)間、通信頻繁程度等。最后,根據(jù)團(tuán)伙最新的活躍軌跡篩選出活躍度較高的群體,供業(yè)務(wù)人員進(jìn)行研判分析。
綜上,通過SNA技術(shù),能有效地從海量數(shù)據(jù)中篩選出可疑度較高的團(tuán)伙,從而降低了警員挖掘潛在團(tuán)伙的人力成本。
3.2 犯罪團(tuán)伙中的核心成員識(shí)別
在分析出犯罪團(tuán)伙以后,需要進(jìn)一步識(shí)別團(tuán)伙中各個(gè)成員的角色和地位。比如處于聚簇邊緣、與外界聯(lián)系相對(duì)較緊密(與其他聚簇相連)的節(jié)點(diǎn),可能是聯(lián)絡(luò)人,也可能是新入伙的人;在聚簇中心的可能是組織中的核心人物。所謂“擒賊先擒王”,首先識(shí)別出網(wǎng)絡(luò)中的核心人員,警方再根據(jù)分析結(jié)果,選擇特定的突破口,對(duì)這一組織實(shí)施打擊粉碎行動(dòng)。這里利用節(jié)點(diǎn)重要指標(biāo)可以迅速定位挖掘犯罪團(tuán)伙中的核心成員。前文已經(jīng)提到過多個(gè)中心性衡量指標(biāo),這里具體介紹一下每類指標(biāo)的含義及其應(yīng)用條件。
首先,基于度定義的中心性Cdeg是最流行且最直接的一種定義。此中心性即相應(yīng)節(jié)點(diǎn)的度數(shù),一個(gè)節(jié)點(diǎn)關(guān)聯(lián)的邊越多就越重要。進(jìn)一步,度中心性可以解釋為統(tǒng)計(jì)了節(jié)點(diǎn)周圍路徑長(zhǎng)度為1的路徑數(shù)目。在此基礎(chǔ)上,一個(gè)直接的泛化就是利用節(jié)點(diǎn)周圍長(zhǎng)度為K的路徑數(shù)目表示節(jié)點(diǎn)的重要性,稱為K-path中心性。從路徑長(zhǎng)度定義類型的不同角度出發(fā),K-path中心性也產(chǎn)生了很多變種:基于距離的K-path中心性、邊獨(dú)立的K-path中心性和節(jié)點(diǎn)獨(dú)立的K-path中心性。從這類中心性指標(biāo)定義出發(fā),可以看出它們對(duì)信息傳播的一個(gè)假設(shè)是信息以K長(zhǎng)度的路徑進(jìn)行傳播。
相應(yīng)地,一種流行的假設(shè)是信息的傳播與節(jié)點(diǎn)間的最短路徑有關(guān)。一般認(rèn)為路徑越短,信息傳遞越快。基于最短路定義的中心性主要有緊密中心性和中介中心性。緊密中心性[4]可以描述為一個(gè)節(jié)點(diǎn)到網(wǎng)絡(luò)中各個(gè)節(jié)點(diǎn)的平均最短路距離的倒數(shù),則節(jié)點(diǎn)v的緊密中心c(v)可按式(1)計(jì)算:
其中,n表示網(wǎng)絡(luò)中節(jié)點(diǎn)數(shù)目,d(v,v')表示節(jié)點(diǎn)v和v'之間的最短路距離。緊密中心性是一個(gè)基于節(jié)點(diǎn)的單源最短路距離分布的衡量指標(biāo),形象地描述了節(jié)點(diǎn)在網(wǎng)絡(luò)中所處位置的重要程度。緊密中心性越大的節(jié)點(diǎn)到其他節(jié)點(diǎn)的平均最短路徑距離越小,處于網(wǎng)絡(luò)的越中央,越能迅速地將信息傳遞給其他節(jié)點(diǎn),同時(shí)也能更快速地接收其他節(jié)點(diǎn)的信息。
中介中心性的具體定義如下:
其中,Cb(u)表示節(jié)點(diǎn)u的中介中心性,δst表示節(jié)點(diǎn)s和t之間最短路的數(shù)目,δst(u)表示節(jié)點(diǎn)s和t之間經(jīng)過節(jié)點(diǎn)u的最短路的數(shù)目。由定義可知,中介中心性反映了一個(gè)點(diǎn)所在的最短路徑數(shù)目在全局所有最短路徑對(duì)之間的一個(gè)占比。中介中心性越大,全網(wǎng)中將有越多的信息通過該點(diǎn)進(jìn)行傳遞。
其次,以通路(walk)的概念為基礎(chǔ),也產(chǎn)生了多種相應(yīng)的中心性概念。其中,Katz中心性用節(jié)點(diǎn)出發(fā)的通路數(shù)目表示,形式化表示為,其中ei表示一個(gè)第i個(gè)位置為1、其他位置為0的列向量。β表示一個(gè)大于零的懲罰系數(shù),反映了路徑越長(zhǎng),其對(duì)中心性的貢獻(xiàn)越小。在Katz中心性基礎(chǔ)上,產(chǎn)生了Bonacich中心性,其形式化為,并允許β取負(fù)值。Katz中心性和Bonacich中心性都是Hubbell中心性的特殊形式。Hubbell中心性可以表示為,其中,X表示矩陣,y表示向量。
最后,為了從網(wǎng)絡(luò)的全局信息衡量一個(gè)點(diǎn)的重要性,提出了基于信息流的節(jié)點(diǎn)中心性定義。其中,PageRank、HITS等用來衡量一個(gè)網(wǎng)頁(yè)節(jié)點(diǎn)在整個(gè)網(wǎng)絡(luò)中的重要性的指標(biāo),就是經(jīng)典的基于信息流的中心性定義。
上述多種中心性定義,從不同角度對(duì)網(wǎng)絡(luò)中的節(jié)點(diǎn)重要性進(jìn)行了刻畫,根據(jù)實(shí)際網(wǎng)絡(luò)情況,選擇合理的指標(biāo)對(duì)網(wǎng)絡(luò)中的重要節(jié)點(diǎn)進(jìn)行識(shí)別。比如,在一個(gè)涉恐網(wǎng)絡(luò)中,領(lǐng)導(dǎo)人物的命令要以最快的速度傳播到整個(gè)網(wǎng)絡(luò)中,那么緊密中心性將很好地識(shí)別出這類信息發(fā)布角色的重要節(jié)點(diǎn)。以美國(guó)“9·11”恐怖襲擊的犯罪網(wǎng)絡(luò)[5]為例,作者以新聞報(bào)道資料為基礎(chǔ)構(gòu)建了“9·11”襲擊中的19個(gè)恐怖分子構(gòu)成的關(guān)系網(wǎng)絡(luò)。然后利用緊密中心性和中介中心性等中心性指標(biāo)識(shí)別出了網(wǎng)絡(luò)中的關(guān)鍵節(jié)點(diǎn)—— Mohamed Atta,而事后證實(shí)確認(rèn)該關(guān)鍵節(jié)點(diǎn)即該團(tuán)伙的領(lǐng)導(dǎo)者。此例子給社交網(wǎng)絡(luò)分析技術(shù)在公共安全中的應(yīng)用提供了強(qiáng)有力的證據(jù)。
3.3 串并案挖掘
串并案是公安機(jī)關(guān)提高辦案效率的一個(gè)有效途徑,它是指把多個(gè)可能相關(guān)的案件一起進(jìn)行研判分析。這里的相關(guān)包括同一伙犯罪成員或者是相似的作案手段等。通過對(duì)多個(gè)案件的串并分析,不僅能起到信息互補(bǔ)的作用,而且能解決不少冤假錯(cuò)案。社交網(wǎng)絡(luò)分析有利于將同一犯罪團(tuán)伙所為的案件進(jìn)行串并。若獨(dú)立地分析多個(gè)由同一犯罪團(tuán)伙所為的各個(gè)案件,警員無法有效洞察其背后千絲萬縷的聯(lián)系。結(jié)合社交網(wǎng)絡(luò)分析技術(shù)同樣能給案件偵破提供線索。
以美國(guó)某州的警局針對(duì)該地區(qū)一系列便利店的搶劫案為例,介紹如何利用社交網(wǎng)絡(luò)分析進(jìn)行并案,從而抓捕了多個(gè)之前未被發(fā)現(xiàn)的犯罪嫌疑[6]。他們首先把單獨(dú)的案件中涉及的人、事、物映射到一張網(wǎng)絡(luò)上,然后在調(diào)查中發(fā)現(xiàn)某個(gè)正在被調(diào)查的人A與其他轄區(qū)的有案底的人B存在聯(lián)系。于是,他們以這兩人(A和B)的姓名為種子,利用類似標(biāo)簽傳播的算法,構(gòu)造了一張未知網(wǎng)絡(luò),即網(wǎng)絡(luò)中出現(xiàn)了多個(gè)未被關(guān)注的人員。對(duì)這個(gè)未知網(wǎng)絡(luò)進(jìn)一步分析,發(fā)現(xiàn)該有案底人員A又與多個(gè)青少年有頻繁的聯(lián)系,于是就把之前未被人視為同一伙人作案的搶劫案給串聯(lián)起來了。最后,通過可視化展現(xiàn)的方式,對(duì)多張網(wǎng)絡(luò)進(jìn)行瀏覽和管理,為干警破案提供了快速有效的線索。
公安領(lǐng)域利用網(wǎng)絡(luò)分析進(jìn)行偵查辦案的歷史由來已久。傳統(tǒng)的方式是將涉案人員以圖釘和連線的方式在黑板上展示出來。近年來,社交網(wǎng)絡(luò)分析技術(shù)的發(fā)展,不僅將傳統(tǒng)的方式數(shù)字化,利用計(jì)算機(jī)就能快速分析案情,而且使得干警能夠處理和分析更大規(guī)模網(wǎng)絡(luò),從而提高辦案的效率和質(zhì)量。除了社交網(wǎng)絡(luò)分析技術(shù),時(shí)序分析、數(shù)據(jù)挖掘、機(jī)器學(xué)習(xí)等多種其他大數(shù)據(jù)分析技術(shù)同樣能夠提升公安的偵查能力,從而極力保證社會(huì)更加穩(wěn)定、和諧地發(fā)展。
[1]FREEMAN L C. Centrality in social networks conceptual clarification [J]. Social Networks, 1978, 1(3): 215-239.
[2]NEWMAN M E J. Fast algorithm for detecting community structure in networks[J]. Physical Review E Statistical Nonlinear & Soft Matter Physics, 2004, 69(6): 066133.
[3]TANG J, LIU J Z, ZHANG M, et al. Visualizing large-scale and highd i me n s i o n a l d at a[C]// T h e 2 5 t h International Conference on World Wide Web, April 11-15, 2016, Montréal, Québec, Canada. New York: ACM Press, 2016: 287-297.
[4]邵鎣俠, 崔斌, 馬林, 等. 一種基于 Sketch 的Top-k 緊密中心性快速搜索算法[J]. 計(jì)算機(jī)學(xué)報(bào), 2016, 39(10): 1965-1978.
SHAO Y X, CUI B, MA L, et al. A fast sketch-based approach of Top-k closeness centrality search on large networks[J]. Chinese Journal of Computers, 2016, 39(10): 1965-1978.
[5]KREBS V E. Mapping networks of terrorist cells[J]. Connections, 2002, 24(3): 43-52.
[6]JOHNSON J A, REITZEL J D, NORWOOD B F, et al. Social network analysis: a systematic approach for investigating[J]. FBI Law Enforcement Bulletin, 2013, 82(3): 1.
Applications of social network analysis in public security
SHAO Yingxia, FENG Shicong
MiningLamp Software System Co., Ltd., Beijing 102218, China
Social network analysis (SNA) is a general and effective approach of studying the complex relationship patterns among social members. Public security field was focused. Firstly, the theory of SNA was introduced, and then three applications of applying SNA in public security were described, including crime gang mining, core criminal member identification, and serial and joint cases analysis. It’s beneficial to readers to know about the capability of SNA in public security fields.
social network analysis, public security, criminal gang
TP311
A
10.11959/j.issn.2096-0271.2017018
邵鎣俠(1988-),男,博士,北京明略軟件系統(tǒng)有限公司技術(shù)經(jīng)理,主要研究方向?yàn)榇笠?guī)模圖計(jì)算優(yōu)化、圖挖掘應(yīng)用以及復(fù)雜網(wǎng)絡(luò)分析等。目前在SIGMOD、VLDB、TKDE等國(guó)際一流學(xué)術(shù)會(huì)議和期刊上發(fā)表10余篇相關(guān)學(xué)術(shù)論文。曾獲得2014年谷歌博士獎(jiǎng)學(xué)金和微軟學(xué)者等稱號(hào)。
馮是聰(1973-),男,博士,北京明略軟件系統(tǒng)有限公司聯(lián)合創(chuàng)始人兼CTO,中國(guó)中文信息學(xué)會(huì)(CIPS)理事,中國(guó)計(jì)算機(jī)學(xué)會(huì)(CCF)大數(shù)據(jù)專家委員會(huì)委員,上海市數(shù)據(jù)科學(xué)重點(diǎn)實(shí)驗(yàn)室(復(fù)旦大學(xué))數(shù)據(jù)科學(xué)家,中國(guó)人民大學(xué)信息學(xué)院企業(yè)碩士導(dǎo)師,上海交通大學(xué)大數(shù)據(jù)與商業(yè)創(chuàng)新實(shí)驗(yàn)室客座研究員。主要研究方向?yàn)榇髷?shù)據(jù)、云計(jì)算、計(jì)算廣告學(xué)、信息檢索等。
2017-01-09