郭雅琦,陳鵬,朱冠宇,林艷
(中國人民公安大學(xué)信息網(wǎng)絡(luò)安全學(xué)院,北京 100038)
犯罪活動(dòng)在空間上的分布并不是均勻或隨機(jī)的,而是呈現(xiàn)出一種聚集性,這些犯罪活動(dòng)聚集的地方即被稱為犯罪熱點(diǎn)[1]。犯罪熱點(diǎn)可以直觀反映出犯罪在空間上的易聚集區(qū),通過對(duì)犯罪熱點(diǎn)進(jìn)行研究,能夠幫助警務(wù)部門深入了解犯罪發(fā)生的特征模式,進(jìn)而制定科學(xué)并具針對(duì)性的決策。長期以來,地理學(xué)、犯罪學(xué)和城市規(guī)劃等相關(guān)領(lǐng)域的研究人員對(duì)犯罪熱點(diǎn)展開了大量研究,利用核密度估計(jì)、掃描統(tǒng)計(jì)、最近鄰指標(biāo)等方法探討了犯罪熱點(diǎn)的空間分布模式和分布格局。例如,鄭滋椀等[2]以路段為分析單元,發(fā)現(xiàn)浙江省某地的犯罪熱點(diǎn)多分布于住宅區(qū)、大學(xué)、商業(yè)區(qū)等區(qū)域;柳林等[3]基于標(biāo)準(zhǔn)化犯罪強(qiáng)度指數(shù)和核密度估計(jì)的方法分析了某市DP半島搶劫犯罪的空間格局特征,發(fā)現(xiàn)該地存在有兩個(gè)相對(duì)穩(wěn)定的犯罪熱點(diǎn)。此外,還有一些研究人員從相關(guān)性探索的角度,利用線性回歸、空間回歸等方法對(duì)犯罪熱點(diǎn)與社會(huì)、環(huán)境、地理、城市等諸多要素的關(guān)聯(lián)性進(jìn)行分析,試圖解釋犯罪熱點(diǎn)在空間上的形成機(jī)制和原因,如Khalid等[4]認(rèn)為土地利用的功能性質(zhì)對(duì)犯罪熱點(diǎn)的分布具有潛在影響;張延吉等[5]則利用刑事案件、興趣點(diǎn)、道路網(wǎng)等數(shù)據(jù)分析了城市環(huán)境對(duì)犯罪發(fā)生數(shù)量、危害程度兩類熱點(diǎn)分布的影響等??偟膩砜?,現(xiàn)有關(guān)于犯罪熱點(diǎn)的研究主要關(guān)注于犯罪活動(dòng)的空間聚集性及形成的原因,但缺少從語義的角度挖掘犯罪熱點(diǎn)所蘊(yùn)含的特征。
從警務(wù)實(shí)踐的角度來看,犯罪熱點(diǎn)的存在體現(xiàn)的不僅是各類環(huán)境要素對(duì)區(qū)域內(nèi)犯罪機(jī)會(huì)的集中影響,也從一定程度上承載了犯罪人心理驅(qū)動(dòng)下犯罪活動(dòng)選擇偏好的多樣性。事實(shí)上,不同的犯罪熱點(diǎn)具有不同的語義特征,而這種語義特征又往往隱含著熱點(diǎn)內(nèi)的案件要素、環(huán)境要素等特征信息。語義挖掘常被運(yùn)用在地理學(xué)領(lǐng)域,已有研究通過語義挖掘?qū)崿F(xiàn)了對(duì)地理位置語義信息的挖掘和表達(dá)。類似地,融合多源信息,對(duì)犯罪熱點(diǎn)進(jìn)行語義挖掘,能夠發(fā)現(xiàn)犯罪熱點(diǎn)區(qū)域內(nèi)的案件要素特征、環(huán)境要素特征等[6]。其中,一些學(xué)者運(yùn)用自然語言處理等分析方法對(duì)文本數(shù)據(jù)進(jìn)行挖掘,為犯罪熱點(diǎn)的語義挖掘提供了技術(shù)支撐[7-9]。近年來,人們分別從環(huán)境要素、案件要素等角度對(duì)犯罪熱點(diǎn)的特征進(jìn)行了刻畫,在環(huán)境要素方面,研究人員通過研究犯罪熱點(diǎn)內(nèi)環(huán)境要素的分布,從環(huán)境構(gòu)型與犯罪熱點(diǎn)的邏輯關(guān)系層面揭示了區(qū)域內(nèi)案件高發(fā)的原因[10-11];而在案件要素方面,有學(xué)者則通過研究犯罪熱點(diǎn)內(nèi)部的案件特征分布分析熱點(diǎn)的特征結(jié)構(gòu),從案件構(gòu)成的角度了解熱點(diǎn)形成的內(nèi)在原因[12-13]。整體來看,這些研究是在犯罪熱點(diǎn)空間分布的基礎(chǔ)上,對(duì)犯罪熱點(diǎn)本身所蘊(yùn)含的案件信息、環(huán)境要素等結(jié)構(gòu)特征進(jìn)行挖掘與判斷,從而幫助警務(wù)人員理解不同犯罪熱點(diǎn)所隱藏的犯罪活動(dòng)規(guī)律。但是,現(xiàn)有的工作大部分仍是集中于從空間和地理的角度對(duì)犯罪熱點(diǎn)本身進(jìn)行解釋,缺少從語義的角度發(fā)現(xiàn)熱點(diǎn)潛藏的犯罪行為特征。
對(duì)此,現(xiàn)擬采用實(shí)證研究的方式,通過建立案件的多維語義標(biāo)簽體系,從不同維度分析犯罪熱點(diǎn)案件特征標(biāo)簽的分布,并對(duì)犯罪熱點(diǎn)的語義信息進(jìn)行表達(dá)和挖掘,進(jìn)而從語義結(jié)構(gòu)特征的角度發(fā)現(xiàn)熱點(diǎn)內(nèi)所潛藏的犯罪行為特征。
構(gòu)成案情事實(shí)的案件要素可以描述案件特征。偵查學(xué)的專家學(xué)者們提出“五要素說”“六要素說”“七要素說”“立體構(gòu)成要素說”等論說來定義案件要素,但通觀整個(gè)偵查理論學(xué)界及偵查實(shí)踐,學(xué)者們各執(zhí)己見,還未形成一個(gè)通說。在比較上述各個(gè)論說具體內(nèi)容的基礎(chǔ)上,有觀點(diǎn)認(rèn)為現(xiàn)有理論中的要素不是案件必然具備的因素,不能使案件區(qū)別于其他事件,并提出對(duì)案件要素進(jìn)行重構(gòu),包括主體要素中的作案人、時(shí)間要素中的作案時(shí)間、空間要素中的作案現(xiàn)場、行為要素中的犯罪行為和變化要素等。其中,時(shí)間要素包括犯罪活動(dòng)發(fā)生的時(shí)間點(diǎn)、犯罪活動(dòng)持續(xù)發(fā)生的時(shí)間段等,空間要素指犯罪活動(dòng)準(zhǔn)備、發(fā)生等一系列關(guān)聯(lián)的地點(diǎn)或場所,行為要素指犯罪人實(shí)施的犯罪行為,變化要素指犯罪對(duì)象的發(fā)生變化,如被害人、被盜物品等[14]。在公安數(shù)據(jù)“人、時(shí)、地、物、事”等要素的分析需求下[9],依據(jù)重構(gòu)的案件要素論說擇取了入室盜竊類警情中的發(fā)案時(shí)間、作案手段、發(fā)案處所、發(fā)案部位、被盜物品五類案件要素,并根據(jù)公安信息化系統(tǒng)中的數(shù)據(jù)字典,結(jié)合已有研究中的分類方法以及研究區(qū)域的案件情況[15],確定了案件多維特征標(biāo)簽體系的劃分準(zhǔn)則。
在構(gòu)建過程中,若直接以數(shù)據(jù)字段為標(biāo)簽名稱會(huì)導(dǎo)致標(biāo)簽類別過細(xì),不能很好表征要素特征,因此根據(jù)入室盜竊案件各類案件要素的特點(diǎn),將數(shù)據(jù)字段進(jìn)行歸并處理。最終構(gòu)建的入室盜竊類警情的案件要素特征標(biāo)簽如表1所示。其中發(fā)案時(shí)間包括了凌晨、早晨、上午等9類標(biāo)簽,作案手段包括了技術(shù)開鎖、攀爬、窗口進(jìn)門等9類標(biāo)簽,發(fā)案處所包括了普通樓房、平房、高層樓房等68類標(biāo)簽,發(fā)案部位包括了臥室、客廳、宿舍等30類標(biāo)簽,被盜物品包括了現(xiàn)金、電子產(chǎn)品、首飾等9類標(biāo)簽。
表1 案件特征標(biāo)簽樣例
針對(duì)不同的犯罪熱點(diǎn),引入案件多維語義特征標(biāo)簽,建立二者之間的匹配模型如圖1所示。通過分析熱點(diǎn)內(nèi)案件數(shù)據(jù)中的簡要案情文本信息,利用文本匹配的方法自動(dòng)匹配得到熱點(diǎn)對(duì)應(yīng)的案件多維特征標(biāo)簽。在對(duì)案情文本進(jìn)行挖掘獲取熱點(diǎn)的案件特征標(biāo)簽的過程中,主要涉及被盜物品、發(fā)案時(shí)間等要素的識(shí)別抽取及推理匹配[16]。
圖1 案件特征標(biāo)簽與犯罪熱點(diǎn)的匹配模型
1.2.1 被盜物品案件要素
對(duì)于被盜物品案件要素,通過調(diào)用構(gòu)建好的標(biāo)簽詞典,從案情文本中排歧、搜索識(shí)別出對(duì)應(yīng)標(biāo)簽子類,從而匹配出犯罪熱點(diǎn)的被盜物品等案件特征標(biāo)簽,這里的排歧是指排除識(shí)別過程中可能出現(xiàn)的詞義歧義,如“人民幣”一詞既可以表示被盜物品的類型,也可以表示被盜物品的價(jià)值。具體匹配步驟如下。
步驟1在預(yù)處理數(shù)據(jù)之前建立被盜物品案件語義特征標(biāo)簽庫,將標(biāo)簽庫中的所有特征標(biāo)簽分為預(yù)設(shè)個(gè)數(shù)的大類并標(biāo)注,根據(jù)對(duì)該案件特征標(biāo)簽的劃分準(zhǔn)則,在對(duì)特征標(biāo)簽的大類進(jìn)行分類處理時(shí),將其劃分為9個(gè)大類,并用字母對(duì)其進(jìn)行分類標(biāo)注。
步驟2通過自然語言處理中的分詞和詞性標(biāo)注,從案情文本數(shù)據(jù)中識(shí)別熱點(diǎn)的被盜物品案件特征標(biāo)簽,具體原理為:對(duì)于輸入句子s中的每個(gè)字wi,根據(jù)其前后2個(gè)字生成7個(gè)特征,這7個(gè)特征分別為wi-2wi-1、wi-1、wi-1wi、wi、wiwi+1、wi+1、wi+1wi+2,需要預(yù)測每個(gè)字屬于詞首、詞尾、詞中、單字詞的權(quán)重,因此對(duì)每個(gè)句子中的每個(gè)字實(shí)際會(huì)生成7×4=28個(gè)特征,先查找每個(gè)特征對(duì)應(yīng)的權(quán)重,通過解碼得到預(yù)測標(biāo)簽,再根據(jù)步驟1建立的被盜物品案件特征標(biāo)簽庫的詞性標(biāo)注識(shí)別抽取出標(biāo)簽。
步驟3對(duì)于因排岐不完全而用步驟2未能抽取識(shí)別出的物品,建立排岐標(biāo)簽庫,利用模式匹配的方法識(shí)別并抽取出無歧義的被盜物品。
1.2.2 發(fā)案時(shí)間案件要素
對(duì)于發(fā)案時(shí)間案件要素,考慮到基于報(bào)案時(shí)間的發(fā)案時(shí)間特征分析容易產(chǎn)生誤差[17],首先識(shí)別抽取出案情文本中的報(bào)案時(shí)間,并根據(jù)其上下文時(shí)間推理出可能發(fā)案的時(shí)間區(qū)間,再根據(jù)時(shí)間區(qū)間的分類關(guān)系匹配出該類案件特征標(biāo)簽。具體匹配步驟如下。
步驟1通過限制尋找年、月、日、時(shí)、分的方式,抽取出案情文本數(shù)據(jù)中所有的時(shí)間信息,包括報(bào)警時(shí)間、休息時(shí)間、離家時(shí)間等。
步驟2根據(jù)從數(shù)據(jù)中抽取出的不同時(shí)間點(diǎn)粗略判斷出可能發(fā)案的時(shí)間區(qū)間,再針對(duì)不同案情描述,對(duì)該時(shí)間區(qū)間進(jìn)行分類。共計(jì)分為以下7類:0:00—4:00為凌晨,5:00—8:00為早晨,8:00—12:00為上午,12:00—14:00為中午,14:00—18:00為下午,18:00—20:00為傍晚,20:00—24:00為晚上。
根據(jù)標(biāo)簽匹配后呈現(xiàn)出的犯罪熱點(diǎn)語義特征的基本結(jié)構(gòu),設(shè)計(jì)共現(xiàn)網(wǎng)絡(luò)以表達(dá)語義特征標(biāo)簽維度間的關(guān)系,進(jìn)而提煉犯罪熱點(diǎn)內(nèi)部的犯罪人行為信息。令發(fā)案時(shí)間標(biāo)簽集合為T={t1,t2,…,ta},作案手段標(biāo)簽集合為M={m1,m2,…,mb},發(fā)案處所標(biāo)簽集合為S={s1,s2,…,sc},發(fā)案部位標(biāo)簽集合為L={l1,l2,…,ld},被盜物品類型標(biāo)簽集合為P={p1,p2,…,pf},則可以以每一類標(biāo)簽集合中的每一個(gè)特征標(biāo)簽作為節(jié)點(diǎn),構(gòu)建語義特征標(biāo)簽共現(xiàn)網(wǎng)絡(luò)G=(V′,E′)。網(wǎng)絡(luò)中節(jié)點(diǎn)總數(shù)為ZG,ZG=|T|+|M|+|S|+|L|+|P|,|T|、|M|、|S|、|L|、|P|分別表示每一類標(biāo)簽集合中的標(biāo)簽類型數(shù)量,如T為發(fā)案時(shí)間標(biāo)簽集合,如果發(fā)案時(shí)間分為上午、中午、下午、傍晚、前夜、后夜、凌晨,則|T|=7。節(jié)點(diǎn)vi、vj∈{T||M||S||L||P},||表示邏輯運(yùn)算中的“或”,即vi、vj為發(fā)案時(shí)間、作案手段、發(fā)案處所、發(fā)案部位、被盜物品五大類標(biāo)簽中任意兩個(gè)不同的子標(biāo)簽,其關(guān)聯(lián)強(qiáng)度mi,j為任意兩類語義特征標(biāo)簽集合中的兩個(gè)特征標(biāo)簽在一個(gè)案件中共同出現(xiàn)的次數(shù)[18]。則該網(wǎng)絡(luò)對(duì)應(yīng)的鄰接矩陣可以表示為
ei,j=mi,j, 1≤i,j≤ZG,ZG≥3
(1)
例如,假設(shè)有A、B、C類語義特征標(biāo)簽集合,其中A={a1,a2},B={b1,b2},C={c1,c2},連線m、n、j、k為兩標(biāo)簽間的共現(xiàn)頻數(shù),則可構(gòu)建該網(wǎng)絡(luò)的模型和矩陣分別如圖2和表2所示。
圖2 特征標(biāo)簽共現(xiàn)網(wǎng)絡(luò)構(gòu)建模型
表2 特征標(biāo)簽共現(xiàn)網(wǎng)絡(luò)矩陣
研究區(qū)域?yàn)楸本┦?。北京市共?6個(gè)行政區(qū),依功能劃分為城市核心區(qū)、城市發(fā)展新區(qū)和生態(tài)涵養(yǎng)發(fā)展區(qū)三類。截至2018年,北京市土地面積為16 410.54 km2,常住人口為2 154.2萬人,其中城六區(qū)土地面積為1 368.32 km2,約占全市8.3%,常住人口為1 379.6萬人,約占全市常住人口的59.3%,常住人口密度約為9 327人/km2,約為其他城區(qū)常住人口平均密度的16倍。整體呈現(xiàn)城六區(qū)內(nèi)人口多、密度大,城六區(qū)外地廣人稀的特點(diǎn)。
所選研究數(shù)據(jù)為北京市公安局提供的2018年北京市入室盜竊案件報(bào)警數(shù)據(jù)。選擇此類案件的主要原因在于入室盜竊案件不僅對(duì)廣大人民群眾的財(cái)產(chǎn)造成損失,同時(shí)極易誘發(fā)搶劫、強(qiáng)奸、殺人等惡劣暴力犯罪,嚴(yán)重威脅著人民群眾的人身財(cái)產(chǎn)安全,影響其生活幸福感、穩(wěn)定感、平衡感[19],因此一直是困擾社會(huì)居民安全、引發(fā)公安機(jī)關(guān)持續(xù)關(guān)注的不安定因素。報(bào)警數(shù)據(jù)所包含的字段信息有案件編號(hào)、發(fā)案地址及簡要案情,其中,簡要案情是對(duì)案情的文字描述,包含了發(fā)案詳細(xì)地址、作案手段、發(fā)案處所、發(fā)案部位、發(fā)案時(shí)間、被盜物品等多個(gè)能夠用于描述案件的特征信息。經(jīng)過篩選、清洗和去重得到的最終有效數(shù)據(jù)為18 928條。
首先,利用核密度估計(jì)方法識(shí)別北京市入室盜竊案件的犯罪熱點(diǎn)如圖3所示,核密度估計(jì)帶寬為3 km。北京市的入室盜竊案件呈現(xiàn)出不均衡的態(tài)勢分布,案件高發(fā)地區(qū)主要集中于城六區(qū),且形成了5個(gè)主要的犯罪熱點(diǎn),分別以a、b、c、d、e進(jìn)行命名。通過查詢熱點(diǎn)區(qū)域內(nèi)部的案件地址屬性,并與熱點(diǎn)進(jìn)行屬性關(guān)聯(lián),確定5個(gè)熱點(diǎn)所在的地名分別為中關(guān)村、金頂街、北大地、大紅門、和平里。
圖3 2018年北京市入室盜竊案件的犯罪熱點(diǎn)分布
熱點(diǎn)a:位于北京市海淀區(qū)的中關(guān)村一帶,熱點(diǎn)內(nèi)共發(fā)生案件56起。在高新技術(shù)產(chǎn)業(yè)開發(fā)區(qū)的影響下,該區(qū)經(jīng)濟(jì)迅速發(fā)展,高新技術(shù)公司密集,建成了各類高層建筑。該地基礎(chǔ)設(shè)施健全,周邊配套設(shè)施完善。除學(xué)生外,大部分居民是知名互聯(lián)網(wǎng)企業(yè)的高收入員工,其主要住房類型是公寓和宿舍。
熱點(diǎn)b:位于北京市石景山區(qū)的金頂街一帶,熱點(diǎn)內(nèi)共發(fā)生案件323起。區(qū)域內(nèi)有20世紀(jì)50年代建造的老舊小區(qū),其房屋類型多為住宅樓,部分供職工家屬居住,部分用作低價(jià)出租。截至2018年,該地住房建筑、環(huán)境設(shè)施等大多較為老化,存在基礎(chǔ)設(shè)施不足、安防設(shè)施不夠健全、功能相對(duì)單一等問題。該熱點(diǎn)中心主要為老舊小區(qū),周邊多居民樓房。
熱點(diǎn)c:位于北京市豐臺(tái)區(qū)的北大地一帶,熱點(diǎn)內(nèi)共發(fā)生案件650起。區(qū)域內(nèi)部物業(yè)管理較為完善,各類商鋪應(yīng)有盡有,但缺少大型綜合娛樂型購物中心,居民經(jīng)濟(jì)、消費(fèi)水平普遍不高。居住人群相對(duì)穩(wěn)定,其文化素質(zhì)層次普遍較高。區(qū)域內(nèi)交通較為便利,多條公交線路縱橫,通達(dá)性較高。熱點(diǎn)內(nèi)部房屋類型多為居民住房。
熱點(diǎn)d:位于北京市豐臺(tái)區(qū)的大紅門一帶,熱點(diǎn)內(nèi)共發(fā)生案件1 418起。區(qū)域內(nèi)有著名的大紅門服裝商貿(mào)區(qū),是服裝生產(chǎn)、制造和批發(fā)的基地。至2018年,該地道路擁擠狹窄、市政基礎(chǔ)老化、衛(wèi)生條件臟亂、治安問題突出,存在較大安全隱患。此外,區(qū)域內(nèi)私搭亂建嚴(yán)重,外來人口聚集,特別是經(jīng)歷了一系列重大項(xiàng)目的拆遷切割,區(qū)域內(nèi)較為凌亂,居住環(huán)境亟待改善。
熱點(diǎn)e:位于北京市東城區(qū)的和平里一帶,熱點(diǎn)內(nèi)共發(fā)生案件124起。區(qū)域內(nèi)有標(biāo)志性的老舊小區(qū),在房屋改造回遷進(jìn)程中存在私搭亂建、車輛擁堵等問題,整體硬件設(shè)施設(shè)備落后,生活配套功能不全,內(nèi)部管理不完善。同時(shí),該區(qū)域內(nèi)還有新建成的小區(qū),其周邊基礎(chǔ)設(shè)施則較為健全,內(nèi)部管理也較為完善。
由以上分析可見,熱點(diǎn)a、熱點(diǎn)b、熱點(diǎn)c和熱點(diǎn)e區(qū)域內(nèi)具有潛在作案價(jià)值的目標(biāo)較多、交通便利,熱點(diǎn)d區(qū)域內(nèi)社會(huì)控制弱,這些環(huán)境條件都為犯罪人在區(qū)域內(nèi)作案提供了犯罪機(jī)會(huì)。
根據(jù)犯罪熱點(diǎn)的語義挖掘方法,利用THULAC、Flashtext、正則表達(dá)式等工具,分析熱點(diǎn)內(nèi)相關(guān)案件的案情文本數(shù)據(jù),并依據(jù)案件特征標(biāo)簽與犯罪熱點(diǎn)的匹配模型匹配5個(gè)熱點(diǎn)的案件特征標(biāo)簽。對(duì)5個(gè)犯罪熱點(diǎn)內(nèi)的案件案情進(jìn)行文本挖掘得到的案件特征標(biāo)簽特征分布如圖4所示,分別從發(fā)案時(shí)間、作案手段、發(fā)案處所、發(fā)案部位、被盜物品5個(gè)特征維度表征了熱點(diǎn)的案件語義結(jié)構(gòu)。
圖4 犯罪熱點(diǎn)的案件語義特征標(biāo)簽統(tǒng)計(jì)分布
綜合來看,除犯罪熱點(diǎn)b地區(qū)的入室盜竊案件多發(fā)生在平房外,5個(gè)熱點(diǎn)地區(qū)內(nèi)的案件都多發(fā)生在普通樓房、高層樓房等處所;5個(gè)熱點(diǎn)地區(qū)內(nèi)的入室盜竊案件高發(fā)部位多為臥室;在手段的選擇上,熱點(diǎn)a地區(qū)內(nèi)發(fā)生的入室盜竊案件的犯罪人主要采用窗口進(jìn)門的方式進(jìn)入現(xiàn)場,熱點(diǎn)b、熱點(diǎn)d地區(qū)內(nèi)發(fā)生的犯罪人則主要采用溜門的方式,熱點(diǎn)c、熱點(diǎn)e地區(qū)的犯罪人則主要采用撬門的方式;熱點(diǎn)c地區(qū)的發(fā)案時(shí)間主要集中在夜晚,其他熱點(diǎn)地區(qū)的犯罪人在作案時(shí)間的選擇偏好上相差不大,均以夜晚和白天為主;而對(duì)于被盜物品,5個(gè)熱點(diǎn)的易被盜物品均以現(xiàn)金、電子產(chǎn)品為主。
通過案件的多維語義特征標(biāo)簽的統(tǒng)計(jì)雖然獲得了熱點(diǎn)內(nèi)案件的語義特征結(jié)構(gòu),但這種特征結(jié)構(gòu)是相對(duì)簡單的,不同特征標(biāo)簽之間的關(guān)聯(lián)性尚不清晰。對(duì)此,根據(jù)犯罪熱點(diǎn)語義特征共現(xiàn)網(wǎng)絡(luò)構(gòu)建原理[式(1)],以發(fā)案時(shí)間、作案手段、發(fā)案部位、發(fā)案處所和被盜物品5類標(biāo)簽集合中的每一個(gè)特征標(biāo)簽作為節(jié)點(diǎn),任意不同標(biāo)簽集合中不同特征標(biāo)簽之間的共現(xiàn)次數(shù)作為連邊,建立犯罪熱點(diǎn)內(nèi)案件的多維語義特征共現(xiàn)網(wǎng)絡(luò)如圖5所示。
圖5 犯罪熱點(diǎn)的案件多維語義特征標(biāo)簽共現(xiàn)網(wǎng)絡(luò)
結(jié)果表明,在不同犯罪熱點(diǎn)內(nèi),犯罪人在作案處所、作案部位、作案手段、作案時(shí)間和被盜物品選擇上存在著不同的關(guān)聯(lián)性。為便于不同熱點(diǎn)之間的語義特征標(biāo)簽共現(xiàn)性進(jìn)行比較,定義共現(xiàn)度為某個(gè)熱點(diǎn)內(nèi)兩個(gè)不同語義特征標(biāo)簽的共現(xiàn)頻數(shù)與熱點(diǎn)內(nèi)案件數(shù)量之比。
對(duì)于熱點(diǎn)a地區(qū),普通樓房是犯罪人入室盜竊主要選擇的處所(76.3%的犯罪人選擇在該處所作案),而臥室是普通樓房內(nèi)被盜竊的關(guān)鍵部位,兩者共現(xiàn)度高達(dá)48.2%,表明進(jìn)入普通樓房盜竊的犯罪人約有一半會(huì)進(jìn)入臥室盜取財(cái)物。此外,窗口進(jìn)門、溜門、技術(shù)開鎖是犯罪人偏好的作案手段,其中窗口進(jìn)門與普通樓房的共現(xiàn)度最高,達(dá)到了37.5%,表明約有1/3的犯罪人是通過窗口進(jìn)入的方式進(jìn)入作案現(xiàn)場。電子產(chǎn)品、現(xiàn)金與普通樓房的共現(xiàn)度分別為37.5%和33.9%,表明進(jìn)入普通樓房盜竊的犯罪人約有1/3是以電子產(chǎn)品和現(xiàn)金為主要目標(biāo)。
對(duì)于熱點(diǎn)b地區(qū),平房和普通樓房是犯罪人入室盜竊主要選擇的處所,臥室是該熱點(diǎn)內(nèi)被盜竊的關(guān)鍵部位,其與平房的共現(xiàn)度為19.2%,與普通樓房的共現(xiàn)度為13.3%。在時(shí)間的選擇上,犯罪人更偏好在白天進(jìn)入平房(10.5%),在夜晚進(jìn)入普通樓房(10.2%)。溜門、撬門、窗口進(jìn)門等是犯罪人偏好的作案手段,但這些手段與處所的共現(xiàn)特征不明顯。電子產(chǎn)品、現(xiàn)金和首飾是犯罪人的主要目標(biāo),其中電子產(chǎn)品、現(xiàn)金和平房的共現(xiàn)度較高,分別為18.0%和17.0%,首飾和普通樓房的共現(xiàn)度較高(12.1%)。除此之外,客廳也是普通樓房內(nèi)被盜竊的關(guān)鍵部位(13.3%)。
對(duì)于熱點(diǎn)c地區(qū),普通樓房、高層樓房是犯罪人入室盜竊主要選擇的處所,臥室是該熱點(diǎn)內(nèi)被盜竊的關(guān)鍵部位,其與普通樓房的共現(xiàn)度為22%,與高層樓房的共現(xiàn)度為17.4%。在時(shí)間的選擇上,犯罪人更偏好在夜晚進(jìn)入普通樓房(17.2%)。撬門、溜門、窗口進(jìn)門等是犯罪人偏好的作案手段,其中窗口進(jìn)門與普通樓房的共現(xiàn)度最高,為12.8%。電子產(chǎn)品、現(xiàn)金和首飾是犯罪人的主要目標(biāo)。除此之外,客廳也是普通樓房內(nèi)被盜竊的關(guān)鍵部位(10%)。
對(duì)于熱點(diǎn)d地區(qū),普通樓房、高層樓房是犯罪人入室盜竊主要選擇的處所,臥室是該熱點(diǎn)內(nèi)被盜竊的關(guān)鍵部位,但兩者之間的共現(xiàn)度不明顯。在時(shí)間的選擇上,犯罪人更偏好在夜晚進(jìn)入普通樓房(11.3%)。溜門、撬門、窗口進(jìn)門等是犯罪人偏好的作案手段,但這些手段與處所的共現(xiàn)特征不明顯。電子產(chǎn)品、現(xiàn)金、首飾是犯罪人的主要目標(biāo),其中電子產(chǎn)品、現(xiàn)金、首飾和普通樓房的共現(xiàn)度分別為19.1%、18.7%和12.1%,電子產(chǎn)品、現(xiàn)金和高層樓房的共現(xiàn)度分別為20.7%和19.2%。
對(duì)于熱點(diǎn)e地區(qū),普通樓房、高層樓房是犯罪人入室盜竊主要選擇的處所,臥室、客廳是該熱點(diǎn)內(nèi)被盜竊的關(guān)鍵部位,但和普通樓房、高層樓房的共現(xiàn)度均不高。在時(shí)間的選擇上,犯罪人更偏好在夜晚進(jìn)入普通樓房,兩者共現(xiàn)度為22.6%。撬門、溜門、窗口進(jìn)門等是犯罪人偏好的作案手段,其中溜門與普通樓房的共現(xiàn)度最高,達(dá)12.9%。電子產(chǎn)品、現(xiàn)金、首飾是犯罪人的主要目標(biāo),其中電子產(chǎn)品和普通樓房的共現(xiàn)度最高,為33.1%。
通過以上分析可看出,犯罪熱點(diǎn)a地區(qū)內(nèi)發(fā)生的案件在發(fā)案時(shí)間、作案手段、發(fā)案處所、發(fā)案部位、被盜物品的語義特征上有著較高的共現(xiàn)度,反映該地區(qū)內(nèi)從事入室盜竊的犯罪人在目標(biāo)和物品類型選擇以及作案手段上存在著較高的集中性,呈現(xiàn)出犯罪人一定的“職業(yè)化”特征,且存在團(tuán)伙作案的傾向。而其他犯罪熱點(diǎn)雖然也呈現(xiàn)出了一定的語義特征共現(xiàn)度,但整體相對(duì)較低,反映出犯罪人在犯罪目標(biāo)、物品的選擇以及手段的使用上比較分散,呈現(xiàn)出多個(gè)不同類型犯罪人分別作案的傾向。
針對(duì)現(xiàn)有研究在犯罪熱點(diǎn)語義結(jié)構(gòu)挖掘的不足,設(shè)計(jì)了一種顧及案件多維語義特征的犯罪熱點(diǎn)語義挖掘方法,對(duì)犯罪熱點(diǎn)內(nèi)集中高發(fā)案件中的作案時(shí)間、作案手段、被盜物品、發(fā)案部位、發(fā)案場所等作為主要的語義特征標(biāo)簽進(jìn)行挖掘。通過以北京市2018年入室盜竊案件為例進(jìn)行實(shí)證分析,從結(jié)果來看,該方法對(duì)北京市的犯罪熱點(diǎn)分析能夠得到熱點(diǎn)內(nèi)犯罪活動(dòng)豐富的語義信息和語義特征,對(duì)于犯罪防控和熱點(diǎn)治理等工作具有一定的實(shí)用價(jià)值。一方面,它可以幫助警務(wù)部門挖掘犯罪熱點(diǎn)區(qū)域內(nèi)部犯罪活動(dòng)的情報(bào)信息;另一方面,它還能夠發(fā)現(xiàn)熱點(diǎn)內(nèi)潛藏的犯罪人行為特征,進(jìn)而探討制定具有針對(duì)性的防控措施。例如,從警務(wù)實(shí)踐上,可根據(jù)案件的語義特征共現(xiàn)性有針對(duì)性的開展熱點(diǎn)內(nèi)案件的串并研判分析,發(fā)現(xiàn)系列犯罪人或團(tuán)伙,并根據(jù)相關(guān)手段、處所等犯罪人行為特征做好防盜宣傳工作。