汪婕 邵軍 鄭滋椀 董齊芬
1.浙江警察學(xué)院 2.浙江省衢州市公安局柯城分局3.基于大數(shù)據(jù)架構(gòu)的公安信息化應(yīng)用公安部重點(diǎn)實(shí)驗(yàn)室
空間點(diǎn)模式分析是基于地理對(duì)象或事件的,將其位置記錄為地理空間上的點(diǎn)或路網(wǎng)上的點(diǎn)的空間分析方法。這種分析方法通常用于探討觀察到的點(diǎn)模式是否來自隨機(jī)模式,或遵循某種系統(tǒng)性的聚集特征。在空間點(diǎn)模式分析研究中,Ripley's K函數(shù)被認(rèn)為是最有效和綜合的方法之一[1,2]。這是因?yàn)樵摲椒ㄒ匝芯繀^(qū)域內(nèi)所有事件間的距離為基礎(chǔ),測(cè)試各種空間尺度上的點(diǎn)模式,而不將點(diǎn)聚集成區(qū)域。但現(xiàn)實(shí)生活中,任何基于街道地址或路標(biāo)進(jìn)行地理編碼的數(shù)據(jù)都固有地受到街道網(wǎng)絡(luò)的限制[4],如發(fā)生在街道、高速公路上的交通事故,分布在街道旁的商店、餐飲店、銀行等。Miller等[3]指出,當(dāng)傳統(tǒng)的點(diǎn)模式分析被應(yīng)用于受網(wǎng)絡(luò)約束的現(xiàn)象時(shí),基于連續(xù)平面上歐式距離假設(shè)將會(huì)導(dǎo)致聚類模式的過度檢測(cè)。對(duì)此,Okabe和Yamada[5]提出將平面K函數(shù)拓展到道路網(wǎng)絡(luò)空間的網(wǎng)絡(luò)K函數(shù)法,用路網(wǎng)最短路徑(網(wǎng)絡(luò)距離)代替歐幾里得距離度量?jī)蓚€(gè)受網(wǎng)絡(luò)約束事件之間的距離,并研發(fā)了SANET工具用于網(wǎng)絡(luò)結(jié)構(gòu)下的點(diǎn)模式分析。
目前,這種網(wǎng)絡(luò)空間點(diǎn)模式分析方法已被應(yīng)用到不同領(lǐng)域。例如,Sponner等[6]用網(wǎng)絡(luò)K函數(shù)法分析了沿道路分布的物種空間格局特征。王結(jié)臣等[7]基于Ripley's K函數(shù)從平面和空間兩種視角分析南京市ATM網(wǎng)點(diǎn)與地鐵站點(diǎn)的空間關(guān)聯(lián)情況。鄔倫等[8]應(yīng)用單變量K函數(shù)和雙變量交叉K函數(shù)分析香港餐飲店分布與交通站點(diǎn)、旅游景點(diǎn)的依賴關(guān)系。楊鈺婕等[9]運(yùn)用網(wǎng)絡(luò)K函數(shù)分析了道路網(wǎng)絡(luò)和西雙版納人工林空間格局分布的相互關(guān)系。
目前,基于道路網(wǎng)絡(luò)的犯罪空間分布模式及其影響因素研究仍然較少。例如,Ikuho Yamada等[4]采用網(wǎng)絡(luò)和平面K函數(shù)對(duì)1997年紐約布法羅地區(qū)的交通事故數(shù)據(jù)進(jìn)行了分析,發(fā)現(xiàn)平面K函數(shù)法存在過度檢測(cè)聚類模式的問題。Xie等[10,11]研究提出網(wǎng)絡(luò)核密度估計(jì)法,并分析了道路網(wǎng)絡(luò)上交通事故的分布特征。國(guó)內(nèi)學(xué)者鄭滋椀[12]對(duì)基于道路網(wǎng)絡(luò)的犯罪時(shí)空分布特征研究方法進(jìn)行探究。另外,對(duì)于犯罪成因的研究中,從微觀角度進(jìn)行量化比較少。聞磊等[13]從相對(duì)微觀的尺度比較出不同用地類型與財(cái)產(chǎn)犯罪案件分布密度具有不同程度的相關(guān)性。但是,該研究仍缺乏對(duì)出租屋、娛樂場(chǎng)所等特殊地點(diǎn)對(duì)犯罪分布影響機(jī)制的進(jìn)一步分析。聯(lián)系犯罪模式理論,犯罪者實(shí)施犯罪的決意過程受中心點(diǎn)、路徑以及邊緣地帶等空間因素的影響,不同中心點(diǎn)的犯罪發(fā)生風(fēng)險(xiǎn)具有差異[14]。首先,犯罪可能在某些特殊地點(diǎn)內(nèi)部發(fā)生,如VaniaCeccat等[15]研究發(fā)現(xiàn)青少年暴力犯罪與青少年日常行為因素,尤其與學(xué)校、青少年住所、零售業(yè)性質(zhì)場(chǎng)所等特殊地點(diǎn)密切相關(guān),同時(shí)周邊地區(qū)的犯罪風(fēng)險(xiǎn)也會(huì)受其影響。Bruce J.Doran等[16]基于傳統(tǒng)假設(shè)通過實(shí)證研究證實(shí),與房屋本身相比,公租房周圍具有更大的犯罪機(jī)會(huì),并且探討了不同犯罪在公租房?jī)?nèi)部及周圍的發(fā)生風(fēng)險(xiǎn)存在差異。但與國(guó)外相比,我國(guó)在犯罪空間分析方面起步較晚,現(xiàn)有的對(duì)犯罪成因的探究大多為基于日常行為理論及理性選擇理論的定性分析。例如,劉大千等[17]研究判定出長(zhǎng)春市財(cái)產(chǎn)犯罪的地區(qū)主要為商業(yè)區(qū)和客運(yùn)交通樞紐。
本文以Q市城區(qū)為研究區(qū)域,采用網(wǎng)絡(luò)核密度估計(jì)方法對(duì)其某年盜竊犯罪空間分布模式進(jìn)行分析,并運(yùn)用網(wǎng)絡(luò)K函數(shù)法探究大型商場(chǎng)、學(xué)校、醫(yī)院、歌舞娛樂場(chǎng)所對(duì)盜竊犯罪發(fā)生的影響,比較不同特殊地點(diǎn)的犯罪發(fā)生風(fēng)險(xiǎn)大小,為犯罪打擊與預(yù)防提供決策依據(jù)。
本文選擇的研究區(qū)域?yàn)镼市K區(qū)。K區(qū)作為Q市的政治、經(jīng)濟(jì)、文化、商業(yè)中心,人口密度大,治安情況復(fù)雜,且所選中心城區(qū)集中了該區(qū)約70%的警情案件數(shù)量。該區(qū)域內(nèi)分布有61家大型商場(chǎng)、72所學(xué)校、41家醫(yī)院和40個(gè)歌舞娛樂場(chǎng)所,各項(xiàng)基礎(chǔ)設(shè)施完備,因此,本文選取該區(qū)域作為研究區(qū)域,符合本文研究對(duì)象及研究方法的要求。
研究數(shù)據(jù)為該地區(qū)范圍內(nèi)某年5138起盜竊警情數(shù)據(jù),包括入室盜竊、扒竊、盜竊電瓶車等盜竊犯罪類型。研究中使用該區(qū)域內(nèi)一級(jí)和二級(jí)路網(wǎng)數(shù)據(jù)建立網(wǎng)狀結(jié)構(gòu)空間,采用的興趣點(diǎn)(Point of Interest, POI)數(shù)據(jù)包括上述大型商場(chǎng)、學(xué)校、醫(yī)院、歌舞娛樂場(chǎng)所四類地理對(duì)象。
核密度估計(jì)(Kernel density estimation)是概率論中用來估計(jì)未知的密度函數(shù),屬于非參數(shù)檢驗(yàn)方法之一。網(wǎng)絡(luò)核密度估計(jì)不同于平面核密度估計(jì),采用最短路徑距離進(jìn)行度量,更能準(zhǔn)確表達(dá)出沿道路網(wǎng)絡(luò)分布的地理對(duì)象在空間上的分布特征。假設(shè)點(diǎn)q是分布在一個(gè)非直接連接的有限網(wǎng)絡(luò)L上的任意點(diǎn)。在L的基礎(chǔ)上,構(gòu)造寬度為h的緩沖網(wǎng)絡(luò)Lp,使得q點(diǎn)到緩沖網(wǎng)絡(luò)Lp上任意點(diǎn)的距離小于h。對(duì)于給定的點(diǎn)q和L上的任意點(diǎn)p,定義以點(diǎn)q為核中心、帶寬為h、核支持度為L(zhǎng)q的 核密度估計(jì)值Kq(p)[18]為:
由此,對(duì)于給定的有限路網(wǎng)L上的點(diǎn)P1, …,Pn,其網(wǎng)絡(luò)核密度值K(p)[18]為:
作為平面K函數(shù)法的一種拓展,網(wǎng)絡(luò)K函數(shù)采用兩點(diǎn)之間的最短路徑度量距離。其中的雙變量K函數(shù)常用來研究某一類地理對(duì)象的分布是否依賴于另一類地理對(duì)象的分布模式,或是否會(huì)對(duì)另一點(diǎn)對(duì)象的分布產(chǎn)生影響。在給定的網(wǎng)絡(luò)結(jié)構(gòu)空間下,假設(shè)沿有限道路LT網(wǎng)絡(luò)分布的2類點(diǎn)對(duì)象的集合為A=(a1, a2, …,an) 和B=(b1, b2, …,bn),定義觀測(cè)值的交叉K函數(shù)[18]為:
在此基礎(chǔ)上,采用蒙特卡洛模擬方法對(duì)分布模式的顯著性進(jìn)行檢驗(yàn)。通過設(shè)置合理的置信區(qū)間,在有限道路網(wǎng)絡(luò)LT內(nèi)隨機(jī)模擬產(chǎn)生多次CSR假設(shè)下點(diǎn)模式分布,得到K函數(shù)的上界和下界,構(gòu)建包絡(luò)線[19]。如果觀測(cè)值在理論期望值曲線之上,且位于蒙特卡洛模擬置信區(qū)間上界之上,則說明點(diǎn)對(duì)象集的分布存在較高的依賴性,屬于顯著聚集性分布模式;如果觀測(cè)值低于理論期望值曲線,并且位于蒙特卡洛置信區(qū)間內(nèi),則說明兩者之間不具有空間意義上的顯著性。
基于Q市K區(qū)的中心城區(qū)內(nèi)盜竊犯罪警情數(shù)據(jù),利用SANET中的“kernel density estimation”工具進(jìn)行路網(wǎng)核密度估計(jì),設(shè)定路網(wǎng)搜索半徑為200米,子路段長(zhǎng)度為20米,如圖1所示。根據(jù)該可視化結(jié)果顯示,盜竊犯罪在路網(wǎng)尺度上的分布具有一定的聚集性,且有兩處較為明顯的高發(fā)路段,分別位于大潤(rùn)發(fā)超市附近及老城區(qū)。其中,老城區(qū)的中河沿街道是全市最繁忙的街道之一,聚集了大量商店、餐飲店、醫(yī)院、學(xué)校、娛樂場(chǎng)所等設(shè)施。
犯罪模式理論認(rèn)為人們每天活動(dòng)的起點(diǎn)和終點(diǎn),如家、學(xué)校、工作地點(diǎn)、娛樂場(chǎng)所等,為犯罪者提供了特定的犯罪機(jī)會(huì)。同時(shí),這些中心點(diǎn)也會(huì)為其周圍地區(qū)帶來一定的犯罪發(fā)生風(fēng)險(xiǎn)[14]。 根據(jù)核密度估計(jì)可視化結(jié)果,確定盜竊犯罪的可能興趣點(diǎn)為大型超市,且通過前期對(duì)不同類型興趣點(diǎn)數(shù)據(jù)的代入嘗試,最終確定本文以大型商場(chǎng)、學(xué)校、醫(yī)院及歌舞娛樂場(chǎng)所為POI數(shù)據(jù),基于該區(qū)域內(nèi)盜竊警情數(shù)據(jù),采用雙變量K函數(shù)法分析盜竊犯罪分布模式是否受到這些特殊地點(diǎn)、場(chǎng)所位置的影響。已知研究區(qū)域內(nèi)分布有61家大型商場(chǎng)、72所學(xué)校、41家醫(yī)院和40個(gè)歌舞娛樂場(chǎng)所。繪制這四類興趣點(diǎn)的地理分布情況如圖2所示。
考慮現(xiàn)實(shí)情形下盜竊犯罪不完全沿路網(wǎng)分布,故首先利用犯罪投影方法將盜竊犯罪投影到道路網(wǎng)絡(luò)上,然后運(yùn)用雙變量K函數(shù)法進(jìn)行分析。以投影后的盜竊犯罪點(diǎn)格局分布作為A點(diǎn)對(duì)象集,對(duì)B點(diǎn)對(duì)象集分別代入大型商場(chǎng)、學(xué)校、醫(yī)院、歌舞娛樂場(chǎng)所的地理位置,用LT表示該研究區(qū)域的道路網(wǎng)絡(luò)集。利用SANET工具中的“Global cross K function method”方法實(shí)現(xiàn),并應(yīng)用RStudio軟件對(duì)輸出結(jié)果進(jìn)行繪圖展示。如圖3所示,橫坐標(biāo)表示觀測(cè)距離(m),縱坐標(biāo)為交叉K函數(shù)值(累計(jì)點(diǎn)數(shù)),即在以中心點(diǎn)為圓心、一定距離范圍內(nèi)盜竊犯罪發(fā)生的頻數(shù),兩條虛曲線分別表示在5%置信水平下,通過蒙特卡洛模擬所得到的上界和下界。
由圖3(a)可知,在道路網(wǎng)絡(luò)結(jié)構(gòu)0~6000m范圍內(nèi),盜竊犯罪與大型商場(chǎng)的雙變量K函數(shù)觀測(cè)值曲線均位于“完全空間隨機(jī)”零假設(shè)條件(CSR模型)下的期望值曲線之上,且位于5%蒙特卡洛模擬置信區(qū)間的上包絡(luò)曲線之上。同時(shí),觀測(cè)值隨距離增長(zhǎng)而增大,最終維持在60左右。由此說明在研究區(qū)域的最大路徑距離內(nèi),大型商場(chǎng)與其周圍分布的盜竊犯罪之間存在顯著的相互聚集關(guān)系,并且始終維持在一定水平上的相關(guān)性。結(jié)合犯罪模式理論分析,該區(qū)域內(nèi)多家大型商場(chǎng)的聚集性分布在一定程度上提高了該地盜竊犯罪的風(fēng)險(xiǎn)。但由于商場(chǎng)內(nèi)人員較多且常安裝有不同位置的監(jiān)控,不利于犯罪的實(shí)施。而考慮到商場(chǎng)的人流量及車流量較大,其附近的街道往往更寬闊,交通更為便利,客觀上為犯罪者提供了隱匿、逃跑的機(jī)會(huì)。由于盜竊犯罪的特殊性,犯罪者在一次得手后,往往不會(huì)在短時(shí)間內(nèi)再次在同一位置作案。但當(dāng)犯罪者確信該地點(diǎn)較易實(shí)施犯罪,且在第一次犯罪時(shí)已對(duì)該地點(diǎn)周圍的環(huán)境有所了解,因此其再次犯罪往往會(huì)選擇與第一犯罪地點(diǎn)相近的位置。同時(shí),一次犯罪成功實(shí)施后,該地點(diǎn)較有利的犯罪機(jī)會(huì)也在一定程度上為其他犯罪者傳遞了犯罪信息,由此吸引其他犯罪者來此作案,從而使得盜竊犯罪的分布呈現(xiàn)出在某一地點(diǎn)多次重疊的現(xiàn)象。
聯(lián)系圖3(b)和(c)可知,在研究區(qū)域范圍內(nèi),醫(yī)院和歌舞娛樂場(chǎng)所與其附近的盜竊犯罪分布均呈現(xiàn)顯著的聚集關(guān)系。同時(shí),基于同一累計(jì)點(diǎn)數(shù)尺度下,盜竊犯罪更傾向于分布在歌舞娛樂場(chǎng)所附近,受其影響較大。此現(xiàn)象主要與醫(yī)院的特殊性質(zhì)有關(guān)。醫(yī)院苛刻的安保環(huán)境、實(shí)名制就診制度在一定程度上降低了該地的被害風(fēng)險(xiǎn),但它仍是一個(gè)半開放性的單位,人群的流動(dòng)性大,且出入較為自由,便于犯罪分子隨意進(jìn)出、逃逸。
圖4反映了幼兒園、中小學(xué)、職高技校及大中專院校與盜竊犯罪的交叉K函數(shù)曲線。在0~2000m尺度范圍內(nèi),觀測(cè)值曲線位于期望值曲線及置信區(qū)間上包絡(luò)線之上,表明學(xué)校周圍的盜竊犯罪分布呈現(xiàn)較為顯著的集聚分布模式。隨著距離的增加,盡管觀測(cè)值曲線位于置信區(qū)間的上界之上,但其與理論期望值曲線交織,說明在該尺度范圍內(nèi),學(xué)校周圍的盜竊犯罪分布并不密集,呈現(xiàn)出一種隨機(jī)的空間分布模式。
本文以Q市K區(qū)中心區(qū)域的盜竊犯罪作為研究對(duì)象,在道路網(wǎng)絡(luò)空間結(jié)構(gòu)下,采用網(wǎng)絡(luò)核密度估計(jì)法、雙變量K函數(shù)法,分析了盜竊犯罪在路網(wǎng)空間上的分布模式及其與研究區(qū)域內(nèi)分布的大型商場(chǎng)、學(xué)校、醫(yī)院及歌舞娛樂場(chǎng)所這四類興趣點(diǎn)地理位置之間的相互關(guān)系。研究發(fā)現(xiàn),盜竊犯罪在路網(wǎng)尺度上的空間分布具有一定的聚集性,并且主要高發(fā)于大潤(rùn)發(fā)超市附近及老城區(qū)的中河沿街道附近。在路徑距離0~6000m的范圍內(nèi),盜竊犯罪點(diǎn)的分布與大型商場(chǎng)、醫(yī)院和歌舞娛樂場(chǎng)所之間存在較為明顯的依賴關(guān)系。在相同累計(jì)點(diǎn)數(shù)水平下,盜竊犯罪更傾向于分布在歌舞娛樂場(chǎng)所附近,醫(yī)院對(duì)其影響較小。學(xué)校附近2000m范圍內(nèi),盜竊犯罪分布密集,呈現(xiàn)出顯著的相互吸引、聚集性分布;隨著距離的增加,犯罪點(diǎn)傾向于隨機(jī)分布。本研究充分說明,盜竊犯罪的發(fā)生與部分特殊地點(diǎn)的位置存在一定的相關(guān)性,同時(shí)也會(huì)在一定程度上對(duì)周邊區(qū)域的犯罪風(fēng)險(xiǎn)產(chǎn)生影響。因此,應(yīng)用網(wǎng)絡(luò)K函數(shù)對(duì)這種影響進(jìn)行量化,可以為警務(wù)巡邏防控提供準(zhǔn)確、直觀的有效信息,以實(shí)現(xiàn)對(duì)此類犯罪的精準(zhǔn)打擊與防控。