楊開鵬+高冠東+王鵬+羅榮源+鄭俊峰+王昕源
摘要:隨著數(shù)據(jù)時(shí)代來臨,目前大數(shù)據(jù)與云計(jì)算技術(shù)已經(jīng)成為人們研究的熱點(diǎn)。醫(yī)療,經(jīng)濟(jì),政治,文化等領(lǐng)域已經(jīng)開始結(jié)合這些技術(shù)進(jìn)行革新,并應(yīng)用在各個(gè)行業(yè)。將大數(shù)據(jù)技術(shù)運(yùn)用至犯罪行為分析研究上,加速科技強(qiáng)警、精準(zhǔn)出警的實(shí)現(xiàn),是警力現(xiàn)代化的必要條件,但目前國(guó)內(nèi)在此方面的研究較少。文章從大數(shù)據(jù)系統(tǒng)的構(gòu)建概況、大數(shù)據(jù)犯罪分析系統(tǒng)的研究、數(shù)據(jù)挖掘和分析方法研究、GIS犯罪熱點(diǎn)技術(shù)介紹、犯罪行為模式分析介紹這幾個(gè)方面較為詳盡地對(duì)基于大數(shù)據(jù)技術(shù)的犯罪行為分析方法進(jìn)行介紹與綜述。
關(guān)鍵詞:大數(shù)據(jù);犯罪行為分析;數(shù)據(jù)挖掘;云計(jì)算平臺(tái);地理信息系統(tǒng)
隨著科學(xué)技術(shù)的進(jìn)步,如何應(yīng)用新興技術(shù)解決社會(huì)問題是人們一直思考的問題。根據(jù)司法部頒布的《全國(guó)監(jiān)獄信息化建設(shè)規(guī)劃》,制定了信息化建設(shè)總體目標(biāo)為構(gòu)建能夠覆蓋全國(guó),操作規(guī)范統(tǒng)一、信息資源共享、平臺(tái)功能完備的現(xiàn)代化信息化體系。而地方各項(xiàng)犯罪數(shù)據(jù)龐大、錯(cuò)綜復(fù)雜,本文力圖通過犯罪行為分析系統(tǒng),對(duì)該系統(tǒng)內(nèi)數(shù)據(jù)進(jìn)行分析、整理,力圖探索罪犯的犯罪規(guī)律,為社會(huì)治安總結(jié)規(guī)律并為提高出警效率提供有據(jù)參考。
基于大數(shù)據(jù)的犯罪行為分析,搭建云計(jì)算平臺(tái),采用帶有地理信息的半結(jié)構(gòu)化數(shù)據(jù)對(duì)犯罪行為進(jìn)行分析,對(duì)警力部署效率的提高有很大作用。Matthew a.teddy等人跟蹤每周的暴力犯罪事件,利用葉斯半?yún)?shù)模型用于建立標(biāo)記的泊松空間點(diǎn)的時(shí)間序列關(guān)系模型,從而實(shí)現(xiàn)犯罪熱點(diǎn)的檢測(cè),提前部署警力預(yù)防犯罪。張海文等人提出利用警用GIS平臺(tái),把地理信息系統(tǒng)(GIS)、遙感系統(tǒng)(RS)、全球定位系統(tǒng)(GPs),即3S有機(jī)地結(jié)合起來,為警力指揮調(diào)度提供了可視化的、便捷的輔助手段。中國(guó)地質(zhì)大學(xué)的陳葉一等人提出運(yùn)用關(guān)聯(lián)規(guī)則以及空間關(guān)聯(lián)規(guī)則的數(shù)據(jù)挖掘技術(shù),對(duì)大量而繁雜的警務(wù)人口、案件數(shù)據(jù)進(jìn)行挖掘;利用GIS地圖顯示機(jī)制與空間分析技術(shù)在現(xiàn)有的警務(wù)系統(tǒng)的基礎(chǔ)之上,建成網(wǎng)絡(luò)化分布和聯(lián)網(wǎng)運(yùn)行的警情研判分析系統(tǒng)。雖然國(guó)內(nèi)外的研究者在不同的時(shí)期對(duì)犯罪行為分析領(lǐng)域做了較多研究,但目前對(duì)犯罪行為的分析還存在不少難點(diǎn)。首先,犯罪行為的發(fā)生受較多外在不確定因素的影響,變量多而雜;其次,犯罪數(shù)據(jù)過于龐雜,主要為非結(jié)構(gòu)化數(shù)據(jù),為數(shù)據(jù)關(guān)聯(lián)分析和挖掘帶來很大的困難。本文通過研究犯罪行為分析方法及系統(tǒng)的發(fā)展現(xiàn)狀,介紹了基于大數(shù)據(jù)的犯罪行為分析方法和步驟,對(duì)數(shù)據(jù)挖掘和分析方法研究進(jìn)行了比較和分析,總結(jié)概括了不同的分析與研究方法,并對(duì)未來云計(jì)算平臺(tái)在司法行政領(lǐng)域的發(fā)展趨勢(shì)進(jìn)行了探索。
1基于大數(shù)據(jù)的犯罪行為分析綜述
1.1大數(shù)據(jù)系統(tǒng)構(gòu)架方案
如圖1所示分類表示了大數(shù)據(jù)分析處理框架,數(shù)據(jù)源板塊除了圖中所示的思路外,還可以分為近似實(shí)時(shí)數(shù)據(jù)離線數(shù)據(jù)、線數(shù)據(jù)和實(shí)時(shí)數(shù)據(jù)。圖中的分類其實(shí)就是說明了數(shù)據(jù)存儲(chǔ)的結(jié)構(gòu)。
在根據(jù)往年某區(qū)域內(nèi)犯罪時(shí)間的發(fā)生頻率來預(yù)測(cè)當(dāng)今或未來該區(qū)域犯罪發(fā)生熱點(diǎn)地區(qū)的時(shí)候,需要借助如圖2所示的犯罪概率預(yù)測(cè)平臺(tái)。該平臺(tái)的大致原理為在Linux系統(tǒng)上利用Hadoop軟件搭建云計(jì)算平臺(tái),然后將大量非結(jié)構(gòu)化數(shù)據(jù)進(jìn)行清理為半結(jié)構(gòu)化數(shù)據(jù),在將數(shù)據(jù)錄入GIS。最后將帶有GIS信息的往年犯罪數(shù)據(jù)錄入云計(jì)算平臺(tái),通過該平臺(tái)來預(yù)測(cè)與推斷某區(qū)域未來的犯罪事件發(fā)生熱點(diǎn)地。
1.3大數(shù)據(jù)系統(tǒng)及分析技術(shù)研究
在國(guó)內(nèi),2013年山東農(nóng)業(yè)大學(xué)農(nóng)業(yè)大數(shù)據(jù)研究中心的崔文斌等分析了Hadoop集群的構(gòu)造模塊和組件,搭建了Hadoop集群,并進(jìn)行了測(cè)試。2013年首都師范大學(xué)的王慧m重點(diǎn)研究了Hadoop軟件框架中的HDFS、MapReduce、HBase等組件的核心架構(gòu)及其運(yùn)行機(jī)制,并分析了框架的不足,如HDFS、MapRe—duce的單點(diǎn)故障及安全性等問題,提出了相應(yīng)的解決方案,并基于此搭建了高可靠安全的Hadoop環(huán)境。在高可靠安全的Hadoop平臺(tái)上,結(jié)合傳統(tǒng)分類聚類算法的特點(diǎn)給出了一種基于云計(jì)算的數(shù)據(jù)挖掘系統(tǒng)的設(shè)計(jì)方案,并對(duì)該系統(tǒng)的各層次的功能及該系統(tǒng)中的分類聚類模塊進(jìn)行了詳細(xì)的闡述。在國(guó)外的技術(shù)研究方面,2014年計(jì)算機(jī)科學(xué)部門的Dilpreet Singh等調(diào)查不同的硬件平臺(tái)可用于大數(shù)據(jù)分析和評(píng)估的優(yōu)點(diǎn)和缺點(diǎn),使用星評(píng)級(jí)表,嚴(yán)格的定性比較不同平臺(tái)的六大特點(diǎn),討論了對(duì)大數(shù)據(jù)分析的算法。為了提供更多的洞察每個(gè)平臺(tái)的有效性的大數(shù)據(jù)分析,具體的實(shí)現(xiàn)級(jí)別的細(xì)節(jié)在各種平臺(tái)上廣泛使用的k-means聚類算法也在偽代碼的形式描述。2016年Janez-Kranjc等提出了一個(gè)分布式計(jì)算平臺(tái)平臺(tái),稱為ClowdFlows,被實(shí)現(xiàn)為一個(gè)基于云的web應(yīng)用程序的圖形用戶界面支持?jǐn)?shù)據(jù)挖掘工作流程的建設(shè)和執(zhí)行,包括web服務(wù)作為工作流組件。
1.4大數(shù)據(jù)犯罪分析系統(tǒng)的應(yīng)用研究
在交通和智能城市領(lǐng)域,2016年廣東工業(yè)大學(xué)的樂柏成提出用Hadoop大數(shù)據(jù)平臺(tái)解決交通擁堵問題。2016年吉林大學(xué)的趙衛(wèi)丹針對(duì)上海交通大數(shù)據(jù),基于Hadoop大數(shù)據(jù)平臺(tái)對(duì)上海市民一卡通乘車數(shù)據(jù)進(jìn)行處理。
在公安司法領(lǐng)域,2013年天津大學(xué)的魏婧楠深入剖析大數(shù)據(jù)內(nèi)涵與特征的基礎(chǔ)上,以天津公安信息化建設(shè)為研究對(duì)象,使用文獻(xiàn)分析、案例分析等研究方法,基于大數(shù)據(jù)時(shí)代發(fā)展客觀需求對(duì)存在的問題進(jìn)行分析,進(jìn)而提出針對(duì)性的解決方案與對(duì)策。2014年廣東省中山市公安局的馮冠籌結(jié)合公安工作實(shí)際和發(fā)展前景,提出科學(xué)運(yùn)用大數(shù)據(jù)原理,著力推動(dòng)公安工作的科學(xué)持續(xù)發(fā)展,并認(rèn)為在實(shí)施預(yù)測(cè)警務(wù)中必須解決優(yōu)化技術(shù)架構(gòu)、全警采集信息、規(guī)范信息存儲(chǔ)、搭建運(yùn)用平臺(tái)等問題。在監(jiān)獄應(yīng)用這一板塊,2015年湖北省孝感監(jiān)獄信息化管理科的左運(yùn)國(guó)結(jié)合目前監(jiān)獄的安防現(xiàn)狀就目前熱門的大數(shù)據(jù)分析技術(shù)在監(jiān)獄的應(yīng)用,監(jiān)獄信息化建設(shè)現(xiàn)狀及存在問題等做一探討。
在實(shí)際應(yīng)用方面,2012年6月末,美國(guó)洛杉磯警察局宣布擴(kuò)大對(duì)犯罪預(yù)測(cè)軟件的使用,它的原理是根據(jù)某地區(qū)過去一段時(shí)間內(nèi)的犯罪活動(dòng)所產(chǎn)生的數(shù)據(jù),借助于特殊算法,計(jì)算出當(dāng)?shù)啬撤N犯罪行為再次發(fā)生的概率,以及最有可能發(fā)生犯罪的時(shí)間。它犯罪數(shù)據(jù)不僅僅能夠利用來預(yù)防犯罪,還能夠幫助從一個(gè)更高的角度理解犯罪發(fā)生的原因。
2GIS犯罪熱點(diǎn)技術(shù)介紹
2.1GIS熱點(diǎn)與犯罪制圖
犯罪制圖的過程主要包括尋找熱點(diǎn)、分析熱點(diǎn)穩(wěn)定性、進(jìn)行熱點(diǎn)場(chǎng)所的緩沖區(qū)制圖、基于制圖做犯罪空間分布統(tǒng)計(jì)和影響因子分析,正所謂“一圖勝千言”,一目了然。
第一步,制作熱點(diǎn)圖。犯罪熱點(diǎn)制圖的種類很多,有散點(diǎn)圖、密度圖、色溫圖、網(wǎng)格圖、路段色溫圖、克里金插值圖、局部Gi指數(shù)圖等。第二步,分析熱點(diǎn)穩(wěn)定性,即探索持續(xù)熱點(diǎn)區(qū)塊。隨著時(shí)間的流逝,犯罪熱點(diǎn)呈現(xiàn)出什么形態(tài)?第三步,評(píng)估熱點(diǎn)場(chǎng)所的緩沖區(qū)。
2.2犯罪熱點(diǎn)技術(shù)的應(yīng)用
犯罪熱點(diǎn)的分析結(jié)果相對(duì)精確地確定了犯罪的高發(fā)地區(qū)、高發(fā)時(shí)段或者高發(fā)類型等,為警方精確打擊犯罪提供了直接的決策支持。不僅如此在公安工作中,警方會(huì)依據(jù)歷史發(fā)案情況、當(dāng)前治安情況以及警力配備情況等進(jìn)行巡邏路線、卡口位置以及其他防范設(shè)施的規(guī)劃和調(diào)整,犯罪熱點(diǎn)分析結(jié)果則為這種防范控制提供了參考,并可以用來評(píng)價(jià)其實(shí)際效應(yīng)。
目前,各級(jí)公安機(jī)關(guān)陸續(xù)開通了網(wǎng)上公安局、網(wǎng)上警務(wù)室、警方論壇、警方微博等系列互聯(lián)網(wǎng)應(yīng)用,不僅發(fā)揮傳統(tǒng)的對(duì)外宣傳和公告等功能,更重要的是在公安機(jī)關(guān)和其他行業(yè)及群眾之間建立了良好的互動(dòng)關(guān)系,滿足了公眾網(wǎng)上辦事、網(wǎng)上議政、網(wǎng)上監(jiān)督、網(wǎng)上發(fā)布等實(shí)際應(yīng)用需求。
2.3犯罪行為模式分析介紹
犯罪模式分析是犯罪情報(bào)分析的一種主要類型,同時(shí)也是一種常用的犯罪情報(bào)分析方法;類似于我國(guó)并案?jìng)刹橹械拇讣?。在西方警?wù)執(zhí)法活動(dòng)中,常見的犯罪模式分析方法主要有初步分析法與犯罪地圖標(biāo)注法。
在西方警務(wù)執(zhí)法活動(dòng)中,犯罪模式分析是犯罪情報(bào)分析的一種主要類型。犯罪模式分析,就是指情報(bào)分析人員通過閱讀犯罪報(bào)告,查詢各種犯罪情報(bào)信息,以從大量犯罪案件中尋找那些具有共同特性的犯罪案件,并采取初步分析法、犯罪地圖標(biāo)識(shí)法等方法,以確定這些犯罪是否為同一犯罪主體所實(shí)施的。
2.3.1因果關(guān)系法
就是利用事物間所固有的因果關(guān)系,由原因推導(dǎo)結(jié)果,或由結(jié)果探究原因的情報(bào)研究方法。它是因果關(guān)系分析研究原理最直接的運(yùn)用。
2.3.2綜合分析研究法
所謂綜合分析,就是把眾多的豐富的犯罪情報(bào)進(jìn)行歸納、綜合,將犯罪情報(bào)或案件分解為部分,將構(gòu)成案件的各個(gè)要素進(jìn)行比較研究,了解案件的基本構(gòu)成、要素之間的內(nèi)在聯(lián)系。
2.3.3抽象與概括法
抽象,就是通過對(duì)構(gòu)成案件各個(gè)要素的分解從而抽象出案件的本質(zhì),而暫時(shí)不考慮這些因素。概括,就是把抽象出來的案件屬性,推廣到具有這些相同屬性的一切案件上,從而形成關(guān)于這一類案件的普遍概念。這種研究方法也常見于刑事偵查的專題研究和一般性研究,如對(duì)刑事犯罪活動(dòng)的規(guī)律、誘發(fā)刑事犯罪的原因及偵查工作的規(guī)律、機(jī)制、效益等的探究。
2.3.4歸納演繹法
歸納法是從個(gè)案人手經(jīng)過分析生、發(fā)展存在許多共性即具有相似性。演繹法是由偵查工作一般性的規(guī)律推廣認(rèn)識(shí)具體案件的方法。例如從系列案到個(gè)案。從性質(zhì)相同的類案到具體案件的分析研究,或是反過來從個(gè)案、類案到一般性案件的分析研究運(yùn)用的就是歸納演繹法。
3結(jié)束語
文章介紹了在當(dāng)代大數(shù)據(jù)技術(shù)下,將其運(yùn)用于犯罪行為分析研究中所用的技術(shù)。通過大數(shù)據(jù)分析技術(shù),可以獲得各個(gè)區(qū)域的犯罪率、犯罪高發(fā)區(qū)、犯罪類型等暴力犯罪數(shù)據(jù),利用時(shí)空序列分析法對(duì)數(shù)據(jù)進(jìn)行深度分析,從而對(duì)各個(gè)區(qū)域內(nèi)未來的犯罪情況進(jìn)行預(yù)測(cè)。再根據(jù)這些數(shù)據(jù)輔助公安、司法相關(guān)部門開展工作,使其在犯罪預(yù)測(cè)預(yù)防過程中能夠有的放矢,獲得更好的安全防范效果。