摘要:隨著社會(huì)的發(fā)展,信息技術(shù)的進(jìn)步,與大數(shù)據(jù)技術(shù)的廣泛應(yīng)用,公安系統(tǒng)的信息化建設(shè)也得到了長(zhǎng)足的發(fā)展,從各類案件卷宗信息、身份證信息、戶口信息、交通信息、住宿信息、通信信息、天網(wǎng)數(shù)據(jù)監(jiān)控?cái)?shù)據(jù)等各類信息的電子化,為我們從這些海量數(shù)據(jù)中分析出某類案件產(chǎn)生的各種背景因素、各類因素之間的關(guān)聯(lián)關(guān)系,提供了數(shù)據(jù)基礎(chǔ)。而通過分析這些關(guān)聯(lián)關(guān)系,能夠?yàn)樘囟ò讣膫善?,提供方向指?dǎo)的數(shù)據(jù)支持。
關(guān)鍵詞:JavaEE;apriori
中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A
文章編號(hào):1009-3044(2020)27-0097-03
開放科學(xué)(資源服務(wù))標(biāo)識(shí)碼(OSID):
1 背景
利用大數(shù)據(jù)技術(shù),開展公安情報(bào)分析,如今已經(jīng)成為公安系統(tǒng)信息化建設(shè)的核心。根據(jù)統(tǒng)計(jì)年鑒分享平臺(tái)的數(shù)據(jù)分析,從2016年到2017年公安機(jī)關(guān)刑事案件立案數(shù)據(jù)如下:2016年,公安機(jī)關(guān)刑事立案總數(shù)為642.75萬起,其中盜竊案430.43萬起,占比66.97%;2017年公安機(jī)關(guān)刑事案件立案總數(shù)548.26萬起,其中盜竊案345.97萬起,占比63.1%。2016年盜竊案中人室盜竊立案1184052起,占比18.42%;盜竊機(jī)動(dòng)車立案435221起,占比6.77%。如此之多的盜竊案,其中大部分都不能破案,因此,本系統(tǒng)試著通過運(yùn)用APRIORI算法,來分析盜竊案中各類字段之間的關(guān)聯(lián)性,為案件的偵破提供數(shù)據(jù)支持。
2 技術(shù)介紹
2.1 關(guān)聯(lián)規(guī)則
關(guān)聯(lián)規(guī)則是形如X—Y的蘊(yùn)涵表達(dá)式,在數(shù)據(jù)庫(kù)表中,可以將X與Y看成表中的字段,通過迭代算法,分析出各個(gè)字段出現(xiàn)的次數(shù),然后根據(jù)貝葉斯算法,計(jì)算字段值出現(xiàn)的關(guān)聯(lián)性概率,關(guān)聯(lián)規(guī)則的強(qiáng)度可以用它的支持度(support)和置信度(con-fidence)來度量,Support(支持度):表示同時(shí)包含A和B的事務(wù)占所有事務(wù)的比例。如果用P(A)表示使用A事務(wù)的比例,那么Support=P(A&B)。Confidence(可信度):表示使用包含A的事務(wù)中同時(shí)包含B事務(wù)的比例,即同時(shí)包含A和B的事務(wù)占包含A事務(wù)的比例。公式表達(dá):Confidence=P(A&B)/P(A),通過合理設(shè)置置信度,能為公安破案提供偵破方向的數(shù)據(jù)支持。
2.2 JavaEE技術(shù)
為便于民警進(jìn)行數(shù)據(jù)的實(shí)時(shí)查詢,本系統(tǒng)通過B/S架構(gòu)的JavaEE技術(shù)來實(shí)現(xiàn),JavaEE是一個(gè)開發(fā)分布式企業(yè)級(jí)應(yīng)用的規(guī)范和標(biāo)準(zhǔn)。通過JDBC技術(shù)實(shí)現(xiàn)平臺(tái)無關(guān)的與各類數(shù)據(jù)庫(kù)的連接,通過STRUTS技術(shù)實(shí)現(xiàn)前端頁(yè)面與后臺(tái)技術(shù)的分離。
3 數(shù)據(jù)字段設(shè)計(jì)
根據(jù)盜竊案結(jié)案錄入的內(nèi)容,審訊內(nèi)容,破案經(jīng)過,本系統(tǒng)著重分析盜竊案的如下字段數(shù)據(jù),盜竊物品:分類為A1現(xiàn)金,A2手機(jī),A3貴重物品,A4家電,A5古董字畫,A6含重大價(jià)值的文件(科技類,遺囑)。同理方式處理作案手段(Bl撬鎖,B2翻窗,B3冒充戶主開鎖,B4未關(guān)門,B5自己家),地點(diǎn)(C1小區(qū),C2普通民房,C3出租屋,C4店鋪),對(duì)象(D1獨(dú)居老人,D2單身女性,D3單身職員,D4家人外出的空屋),動(dòng)機(jī)(El購(gòu)買毒品,E2賭博,E3補(bǔ)貼家用,E4獲取重大遺產(chǎn),E5售賣獲利,E6還債,E7其他),團(tuán)伙人數(shù)(2人團(tuán)伙,3人團(tuán)伙,4人團(tuán)伙,其他),聯(lián)系方式(G1手機(jī)聯(lián)系,G2 QQ聯(lián)系,G3微信聯(lián)系,G4其他),案發(fā)前后去向(H1回住所,H2網(wǎng)吧,H3賓館,H4麻將館,H5 KTV),是否前科(I1是,12不是),時(shí)間(J1受害人上班,J2受害人睡著,J3受害者外出)學(xué)歷(KI小學(xué),K2初中,K3高中,K4中專,K5大專,K6本科,K7碩士,K8博士),作案者年齡(11 15-20.L221-25,L326-35.L4 36-45 L5 46-50)踩點(diǎn)時(shí)間(M1案發(fā)前一周內(nèi),M2,案發(fā)前一個(gè)月,M3案發(fā)前很久)。作案者職業(yè)(N1學(xué)生,N2無業(yè)人員,N3臨時(shí)工,N4薪水<3000,N5薪水<5000,N6個(gè)體戶)
具體數(shù)據(jù)如表1:
4 主要功能模塊
案件統(tǒng)計(jì)分析:通過當(dāng)前報(bào)案信息,選擇某個(gè)報(bào)案進(jìn)行數(shù)據(jù)分析。
關(guān)聯(lián)字段的篩選:根據(jù)案件已有的線索,選擇數(shù)據(jù)分析的字段內(nèi)容。
可信度與置信度的設(shè)置:根據(jù)同類案件的數(shù)量,設(shè)置可信度與置信度。
關(guān)聯(lián)規(guī)則顯示:顯示關(guān)聯(lián)分析結(jié)果數(shù)據(jù)。
5 案件統(tǒng)計(jì)分析
進(jìn)入情報(bào)分析系統(tǒng),首先根據(jù)不同查詢條件查詢報(bào)案案件類別,效果如下:
通過struts配置文件:
if (session.getAttribute(" daoqielist")!="nully*將統(tǒng)計(jì)查詢數(shù)據(jù),放到session中的daoqieList中,如果有刪除舊的。*/
session. removeAttribute("daoqieList"); session. setAttribute(”daoqieList",tj DAO.query2(tj Form》;
public List query2( tongjiForm tjForm)(
List daoqieList= new ArrayList0;
String sql= "select 8from tongji where”;
if(! tj Form.getAO.equals(”0"》
sql =sql+ "and A=”+”¨+tj Form.getAO+”¨;
if(! tj Form.getB O.equals(" 0"》
sql=sql+”and B=”+”¨+tj Form.getB0+”¨;
……….‘
ResultSet rs= conn.executeQuery(sql2);
try{
while (rs.next0){
tjForm= new tongjiForm0;
tjForm.setIDcard (rs.getString(l》;
tjForm.setA(rs.getString(2》;
tj Form.setB (rs.getString(3》;
……..
daoqieList.add(tjForm);
)
…...
return daoqieList;
7 可信度與置信度的設(shè)置
通過點(diǎn)擊統(tǒng)計(jì)分析:進(jìn)行字段篩選與置信度,支持度的選擇。
List tjlist = (List) session.getAttribute("daoqieList");
ArrayLisKString> dataList = new ArrayList ();
for (int i = 0; i < tjlist.size(); i++) {
tjForm = (tongjiForm) tjlist.get(i);
for(int j=O;j
if (str_cond[j].equals("A "》
condition = tjForm.getAO + ";";
if (str_cond[jl.equals("B "》
condition = condition + tjForm.getBO + ";";
dataList.add(condition);
//關(guān)聯(lián)分析代碼
Map relationRulesMap = apriori2.getRela-tionRules(frequentSetMap);
SeKString> rrKeySet = relationRulesMap.keySet0;
for (String rrKey : rrKeySet) {
String s = rrKey;
System.out.println(s.replaceAII(";", " ") + " : '1 +“概率為 :"+ relationRulesMap.get(rrKey》;
}
9 結(jié)束語(yǔ)
本系統(tǒng)通過分析盜竊案的各類字段之間的關(guān)聯(lián)關(guān)系,在收到的報(bào)案信息中,根據(jù)已有的線索信息,可以設(shè)置字段篩選內(nèi)容,從而分析出個(gè)字段之間的出現(xiàn)概率,為案件的偵破提供方向指導(dǎo)。
參考文獻(xiàn):
[1]陳鵬,瞿珂,胡嘯峰.犯罪情報(bào)分析中的數(shù)據(jù)挖掘應(yīng)用[J].計(jì)算機(jī)系統(tǒng)應(yīng)用,2017,26(2): 249-253.
[2]李樂亮,李桂峰.論盜竊案件的特點(diǎn)及偵查方法[J].市場(chǎng)周刊(理論研究),2008(12): 92,115-116.
[3]劉智明,廖藝.入室盜竊案外圍現(xiàn)場(chǎng)勘查的幾點(diǎn)啟示[J].法制博覽,2017(5): 152.
[4]梁凡,趙麗.基于中智模糊關(guān)聯(lián)規(guī)則生成的大數(shù)據(jù)挖掘分析算法[J].計(jì)算機(jī)應(yīng)用與軟件,2019,36(10): 285-292,298.
[5]雷宇.面向大數(shù)據(jù)的高維數(shù)據(jù)挖掘技術(shù)研究[J].企業(yè)科技與發(fā)展,2019(7): 166-167.
[6]羅樂,葛啟東,周永學(xué).基于Apriori算法的裝備數(shù)據(jù)關(guān)聯(lián)規(guī)則挖掘[J].指揮控制與仿真,2020,4(10):2.
[7]王彬.盜竊案件偵查的數(shù)據(jù)碰撞問題研究[J].遼寧警察學(xué)院學(xué)報(bào),2019,21(5): 34-40.
【通聯(lián)編輯:謝媛媛】
作者簡(jiǎn)介:徐雪飛(1977-),男,江西南昌人,講師,碩士,主要研究方向?yàn)檐浖こ獭?/p>