• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      偵查模式從信息孤島向結(jié)構(gòu)化數(shù)據(jù)庫的邏輯演進

      2016-03-15 00:20:37印大雙
      湖北警官學院學報 2016年6期
      關鍵詞:數(shù)據(jù)挖掘犯罪數(shù)據(jù)庫

      印大雙

      (南京森林警察學院,江蘇南京210023)

      偵查模式從信息孤島向結(jié)構(gòu)化數(shù)據(jù)庫的邏輯演進

      印大雙

      (南京森林警察學院,江蘇南京210023)

      互聯(lián)網(wǎng)、物聯(lián)網(wǎng)與云計算技術(shù)不斷發(fā)展,意味著大數(shù)據(jù)時代的到來,給偵破案件帶來前所未有的挑戰(zhàn)。偵查實踐中需要不斷更新各種技術(shù)手段與措施,使傳統(tǒng)與現(xiàn)代相結(jié)合。微信、微博等交互方式產(chǎn)生的海量數(shù)據(jù)使現(xiàn)代社會面臨越來越復雜的情形,大數(shù)據(jù)與小概率事件導致偵查方式發(fā)生顛覆性的變革,偵查中需要運用大數(shù)據(jù)思維方式,以人、物為中心的傳統(tǒng)偵查方式轉(zhuǎn)向以數(shù)據(jù)為中心的升級版的偵查思維模式。大數(shù)據(jù)視野下,偵查模式依托網(wǎng)絡數(shù)據(jù)存儲和查詢系統(tǒng)、大規(guī)模結(jié)構(gòu)化數(shù)據(jù)分析系統(tǒng)、大數(shù)據(jù)挖掘系統(tǒng),以特定時間、特定空間、特定數(shù)據(jù)為基準,形成犯罪控制、犯罪偵破與犯罪預測的新偵查模式,使辦案效率有效提升。

      偵查模式;大數(shù)據(jù);結(jié)構(gòu)化數(shù)據(jù)庫;數(shù)據(jù)挖掘;關聯(lián)規(guī)則

      在全球信息化進程中,信息數(shù)據(jù)已經(jīng)成為社會發(fā)展的重要戰(zhàn)略資源,涉及計算機科學、網(wǎng)絡技術(shù)、通信技術(shù)、密碼技術(shù)、信息處理技術(shù)、應用數(shù)學等學科知識。大數(shù)據(jù)挖掘通過情報檢索、貝葉斯定律、程序碰撞、在線分析處理等諸多方法搜索隱藏于海量信息中的有效數(shù)據(jù),最大限度地將原本分散于個案的犯罪痕跡和物證等信息集中起來,實現(xiàn)偵查資源的有效整合與偵查信息的動態(tài)勾連,使現(xiàn)有證據(jù)之間相互補充、相互印證、相互支撐,在宏觀上拓寬思路,微觀上捕捉特征,使因果性、假說、實驗觀察與推理方法得到清晰的展示,形成理性上的審慎和技術(shù)上的嚴格,有利于查明案件真相,提高偵查效率,有效打擊與遏制犯罪。

      一、偵查實踐中數(shù)據(jù)庫建構(gòu)策略

      在偵查實踐中,數(shù)據(jù)庫建構(gòu)由粗放型向集約化轉(zhuǎn)向,有助于情報信息分析、研判、推斷、預測、實戰(zhàn)指導。數(shù)據(jù)庫建構(gòu)重點涉及時間、空間、人物、事物、行為等相關信息,關聯(lián)犯罪現(xiàn)場形態(tài)分析與研判,對物證與相關環(huán)境進行甄別與技術(shù)檢測,形成對案件整體的合邏輯性表述與相關信息的系統(tǒng)性研究。在偵查實踐中,現(xiàn)場分析、物證獲取、犯罪嫌疑人鎖定均有賴于數(shù)據(jù)庫,從宏觀上獲取整體性、全面性的犯罪活動新情況、新動向,一定時期或區(qū)域的某類突出犯罪案件的發(fā)展趨勢等,從微觀上獲取具體犯罪線索、個案犯罪情況信息。

      (一)大數(shù)據(jù)庫建構(gòu)基本架構(gòu)

      1.系統(tǒng)框架

      數(shù)據(jù)庫系統(tǒng)框架通過數(shù)據(jù)通道輸送到數(shù)據(jù)處理中心,然后最終的處理結(jié)果會通過顯示終端進行顯示。整個過程主要通過三個部分實現(xiàn),元數(shù)據(jù)、數(shù)據(jù)倉庫、終端顯示。元數(shù)據(jù)通過通道運輸后在數(shù)據(jù)處理中心進行挖掘處理,將原有的所有數(shù)據(jù)進行篩選,將有效數(shù)據(jù)篩選出來,然后將潛在的有效數(shù)據(jù)挖掘出來,進行整理分析,最終呈現(xiàn)在終端上。

      基于全國公安局域網(wǎng),形成自上而下的五級偵查信息網(wǎng)絡體系。金盾工程發(fā)揮的作用巨大,可以追蹤逃犯資料、被盜搶車輛、指紋、DNA等信息。銜接刑偵、經(jīng)偵、緝毒等業(yè)務部門,橫向覆蓋派出所、交巡警、車管所、拘留所、戒毒所、治安管理服務站,拓寬信息渠道,實現(xiàn)不同部門、不同警種的協(xié)同,充分利用社會公共網(wǎng)絡資源,立體使用綜合網(wǎng)絡。

      2.數(shù)據(jù)倉庫

      注重案件資料(包括已破與未破案件的資料)、現(xiàn)場痕跡物品檔案、犯罪嫌疑人資料、犯罪手法資料、涉案財物檔案、指紋信息、足跡信息、DNA資料等刑事犯罪情報資的建設;對刑事犯罪高危人群、作案目標、作案手段方法等規(guī)律、特點,進行分層與分類的數(shù)據(jù)庫建設;同時,將常住人口、暫住人口、旅店住宿人員資料、出租房信息、金銀加工、典當、二手車、二手手機等資料納入系統(tǒng)數(shù)據(jù)庫;另外,將電信部門的通信資料(機主信息與通話資料)、金融部門的資金資料、影像資料(包括金融、賓館、公路入口、界面以及公共復雜場所的監(jiān)控)、社會保障資料、保險資料、用工招聘資料等重要資訊歸入數(shù)據(jù)庫。

      對大數(shù)據(jù)的態(tài)勢感知、質(zhì)量評估及融合表示均面臨新的挑戰(zhàn),數(shù)據(jù)庫的建設基本由ODS(操作數(shù)據(jù)存儲)和DW/DM(密集型光波復用)構(gòu)成,其中ODS需要以業(yè)務邏輯為基礎,而其具體的操作過程是通過E-R模型反應出來的,由事物數(shù)據(jù)(交易數(shù)據(jù))和主數(shù)據(jù)兩部分組成。原系統(tǒng)的結(jié)構(gòu)要與ODS層的結(jié)構(gòu)相一致,如果需要對二者的數(shù)據(jù)進行進一步的合并,則需要設計合理的一種表格[1]。DW/DM是一種多維度的數(shù)據(jù)庫的結(jié)構(gòu),根據(jù)對數(shù)據(jù)的不同要求,這種多維度可以不同的方式呈現(xiàn),所以DW/DM有多種構(gòu)型,這些維度都是根據(jù)數(shù)據(jù)間的包含關系進行設計的,方便檢索與應用。

      3.關聯(lián)規(guī)則

      算法的選擇與設計直接影響著數(shù)據(jù)挖掘的實現(xiàn),整個數(shù)據(jù)挖掘過程可分為兩個步驟,R.Agrawal提出了Apriori關于CD、DD和CAD三種并行算法①在CD、DD和CAD三種算法中,CD算法將候選集發(fā)送到每個計算節(jié)點,每個節(jié)點掃描局部數(shù)據(jù)集得到局部計數(shù)后,通過同步得到全局支持度計數(shù)。DD算法將候選集進行劃分后傳輸?shù)礁鱾€節(jié)點上,每個節(jié)點掃描全局數(shù)據(jù)庫而得到本地候選集的支持度計數(shù),然后通信得到全局所有候選集的支持度計數(shù)。CAD算法則嘗試將打破每次迭代后需要同步的約束,綜合了CD算法和DD算法。參見:陳立基?;贖adoop的關聯(lián)規(guī)則并行算法研究[D]。江蘇:南京大學,2012.05:1.,首先是從數(shù)據(jù)源到ODS層,然后是ODS層到DW/DM,這兩步都是通過ETL工具實現(xiàn)。系統(tǒng)地看,這兩個步驟是以數(shù)據(jù)源、數(shù)據(jù)目標以及映射關系這三個基本要素來實現(xiàn)的。數(shù)據(jù)目標最終計劃實現(xiàn)的分析處理后得到的數(shù)據(jù)表,可以對處理后的數(shù)據(jù)有規(guī)律的陳列,映射關系意味著具體的實現(xiàn)過程,包括實現(xiàn)的算法等[2]。

      (二)數(shù)據(jù)庫模式

      數(shù)據(jù)庫系統(tǒng)呈現(xiàn)三級模式結(jié)構(gòu),同一意義下的數(shù)據(jù)存在著許多抽象和轉(zhuǎn)換,DBMS(數(shù)據(jù)庫管理系統(tǒng))把數(shù)據(jù)庫從邏輯分為外模式、概念模式和內(nèi)模式三種,分別反映了數(shù)據(jù)庫的三個不同視角。

      1.數(shù)據(jù)庫外模式

      外部作為數(shù)據(jù)庫的用戶視圖,數(shù)據(jù)庫管理系統(tǒng)(DBMS)是數(shù)據(jù)庫的最高層。

      2.數(shù)據(jù)庫概念模式

      概念模式處于數(shù)據(jù)庫抽象層面,包含所有的數(shù)據(jù)庫實體和聯(lián)系,提供數(shù)據(jù)庫的總體視圖,描述數(shù)據(jù)庫中數(shù)據(jù)與數(shù)據(jù)之間的聯(lián)系。

      3.數(shù)據(jù)庫內(nèi)模式

      內(nèi)模式作為數(shù)據(jù)庫的最低抽象層,與存儲數(shù)據(jù)方式最貼近,表述數(shù)據(jù)庫內(nèi)部存儲結(jié)構(gòu),對數(shù)據(jù)庫進

      行描述[3]。

      數(shù)據(jù)庫涉及邏輯建模,對于邏輯模型,需要展開每個屬性的定義,側(cè)重關注諸如數(shù)據(jù)類型與長度、是否可以為空與可否進行索引。對于每個關系,需要精確地定義在主鍵值發(fā)生變化時約束數(shù)據(jù)行為的規(guī)則。數(shù)據(jù)庫邏輯模型涉及:

      (1)文本類型(包括固定長度和可變長度)

      (2)數(shù)字類型(帶符號整數(shù)、無符號整數(shù)、自動編號、浮點數(shù)、十進制數(shù)等)

      (3)原始數(shù)據(jù)類型(固定的、可變的、圖片和OLE對象)

      (4)臨時類型(時間戳、日期、時間和日期時間)

      (5)邏輯類型(真或假)

      (6)其他類型(行ID或?qū)ο驣D)

      (三)偵查實踐中的大數(shù)據(jù)庫建構(gòu)策略

      數(shù)據(jù)挖掘中關注提取隱藏在數(shù)據(jù)后的有用信息,提出優(yōu)化算法,通過這些分析用于決策,實踐過程中重點考量以下兩個問題,第一,序列模式:試圖在時間序列事務集合中,尋找會話集合之間有關時間序列關系的模式。第二,異類分析:側(cè)重于對不規(guī)則點進行研究,對明顯偏離常規(guī)數(shù)據(jù)的現(xiàn)象關注逃逸行為模式的背景,異類分析可發(fā)現(xiàn)比一般數(shù)據(jù)所包含的信息更有價值的數(shù)據(jù)。

      偵查實踐中的大數(shù)據(jù)庫建構(gòu)重心應關注對現(xiàn)場勘查中獲得的各種數(shù)據(jù)與資料,并進行分層與分類。現(xiàn)場勘查是一項策略性和技術(shù)性很強的偵查措施,必須制定妥當?shù)牟呗院瓦\用一定的技術(shù)。根據(jù)不同人員及其心理狀態(tài),有針對性地運用訪問策略和方法,包括現(xiàn)場搜查、采取緊急措施的策略方法;技術(shù)包括尋找、發(fā)現(xiàn)、顯現(xiàn)、提取、保管、檢驗與犯罪有關的痕跡、物證所使用的各種物理方法、化學方法;對尸體外表檢驗以及對被害人、犯罪嫌疑人進行人身檢查所使用的法醫(yī)技術(shù);記錄固定與犯罪有關的場所、物品、尸體的位置、狀態(tài)、特征、所使用的錄像、照相、繪圖等拍攝技術(shù)和圖像處理技術(shù);警犬技術(shù)、排爆技術(shù)、消防技術(shù)和其他一些用于解決復雜疑難問題的專門技術(shù)等,主要體現(xiàn)在以下兩個方面:

      第一,痕跡勘驗,此過程針對犯罪嫌疑人實施犯罪活動遺留在現(xiàn)場上的形象痕跡,主要包括:

      (1)身體特征痕跡:手印、腳印、牙痕、唇印等;

      (2)衣物痕跡:鞋印、襪印、手套印、坐痕、衣物痕跡等;

      (3)工具痕跡:犯罪所使用的各種兇器和破壞工具痕跡;

      (4)交通運輸工具:車輪痕、車身撞擊、碰痕、車支架痕;

      (5)反抗、搏斗痕跡。

      第二,通過對犯罪可疑痕跡勘驗可以構(gòu)建數(shù)據(jù)平臺,主要包括:

      (1)判定痕跡是否與犯罪有關;

      (2)確認犯罪案件性質(zhì);

      (3)研判案件要素:犯罪目的、犯罪行為、過程、手段、動機、時間、人數(shù)等;

      (4)判定犯罪嫌疑人的個人特質(zhì):性別、身高、年齡、體態(tài)、職業(yè)等;

      (5)研判犯罪嫌疑人的精神狀態(tài)、心理狀態(tài)、犯罪手法的熟練程度等。

      偵查實踐中數(shù)據(jù)庫建構(gòu)關乎從法律層面與技術(shù)層面的雙重考量,既要在法律框架內(nèi)從事偵查活動,又要從不斷發(fā)展的科技層面獲取線索。隨著數(shù)據(jù)庫應用要求的提升,空間數(shù)據(jù)庫和時態(tài)數(shù)據(jù)庫已經(jīng)成為現(xiàn)代數(shù)據(jù)庫的兩個重要分支。單獨的空間數(shù)據(jù)庫和時態(tài)數(shù)據(jù)庫已經(jīng)無法滿足需求,必然產(chǎn)生時空數(shù)據(jù)庫。時空數(shù)據(jù)庫提供包括時間和空間要素在內(nèi)的數(shù)據(jù)庫系統(tǒng),其時空模型是一種有效組織和管理時態(tài)數(shù)據(jù)、屬性、空間和時間語義更加完整的數(shù)據(jù)模型。在偵查實踐中,數(shù)據(jù)庫建構(gòu)所涉及的內(nèi)容越來越繁雜,牽涉各種技術(shù),包括痕跡檢驗技術(shù)、文件鑒定技術(shù)、微量物證分析、DNA技術(shù)、公安圖像技術(shù)、視頻跟蹤技術(shù)、GPS軌跡定位等,這些技術(shù)需要與無線電技術(shù)、航空偵查技術(shù)、衛(wèi)星偵查技術(shù)等專門技術(shù)手段相結(jié)合,通過對這些技術(shù)進行分析、提出優(yōu)化算法,在此基礎上進行決策。

      二、偵查實踐中的數(shù)據(jù)挖掘

      隨著信息技術(shù)的不斷發(fā)展,數(shù)據(jù)挖掘分類問題和算法研究成為熱點,對數(shù)據(jù)挖掘中存在的實際問題,主要通過分類(Classification)、估計(Estimation)、預測(Prediction)、關聯(lián)規(guī)則(Association rules)、聚類(Clustering)、復雜數(shù)據(jù)類型(Text、Web、Graphic images、Video、Audio)等,提出從屬性選擇、連續(xù)屬性離散化、抽樣方法,提高數(shù)據(jù)挖掘的效率和性能①數(shù)據(jù)挖掘利用一些分析工具從大量的、不完全的、模糊的、有噪音的、隨機的數(shù)據(jù)中,提取出隱藏在其中的、實現(xiàn)未知并具有價值信息的過程。數(shù)據(jù)挖掘需要實現(xiàn)建立數(shù)據(jù)關系模型,對數(shù)據(jù)進行分析預測,在實現(xiàn)自動的有效數(shù)據(jù)的篩選在數(shù)據(jù)庫的基礎上,將有效的信息篩選出來,利用該技術(shù)來挖掘一些隱藏的有價值的數(shù)據(jù)。。

      數(shù)據(jù)挖掘并不是自動化完成的,需要建立人工識別模式與處理系統(tǒng),涵蓋數(shù)據(jù)采集、數(shù)據(jù)處理、數(shù)據(jù)切換、數(shù)據(jù)研判、評價體系等步驟,常用模糊數(shù)學、運籌學、圖論等數(shù)學方法。大數(shù)據(jù)挖掘技術(shù)促進了偵查方式與方法的可靠性與有效性,結(jié)合DNA技術(shù)、微量物證的發(fā)現(xiàn)提取與檢驗鑒定技術(shù)、痕跡物證網(wǎng)上自動化比對技術(shù)等有效提升了偵查效率。

      (一)數(shù)據(jù)挖掘基本方法

      1.分類法

      根據(jù)應用需要確定分類的種類,通過對訓練數(shù)據(jù)的分類學習歸納出分類規(guī)則,利用測試數(shù)據(jù)對模型的準確率進行測試,再對數(shù)據(jù)進行分類操作。

      典型算法包括決策樹、K最近鄰法(K-Nearest Neighbor)、K平均法(K-Mean)、支持向量機(Support Vector Machine)、向量空間模型(Vector Space Model)、貝葉斯網(wǎng)絡算法(Bayesian Network)、神經(jīng)網(wǎng)絡算法(Neural Network)等。

      2.聚類法

      聚類法對數(shù)據(jù)進行分析并分類,將數(shù)據(jù)集劃分為由相似數(shù)據(jù)組成的多個類的過程,同一類中的數(shù)據(jù)彼此相似,不同類中的數(shù)據(jù)彼此相異。

      聚類的典型算法包括BIRCH算法、CURE算法、DBSCAN算法、K-pototypes算法、CLARANS算法、CLIQUE算法等。

      3.關聯(lián)分析

      關聯(lián)分析是發(fā)現(xiàn)數(shù)據(jù)集中數(shù)據(jù)之間聯(lián)系的一種方法,典型算法包括Apriori算法、FP-Tree算法、多層關聯(lián)規(guī)則挖掘算法、多維關聯(lián)規(guī)則挖掘算法等。

      4.時間序列

      時間序列挖掘關注不同交易之間的數(shù)據(jù)關聯(lián)。數(shù)據(jù)之間的聯(lián)系,可以表現(xiàn)為兩種形式,一種是同一交易內(nèi)的數(shù)據(jù)之間的聯(lián)系,另一種是不同交易間的數(shù)據(jù)的聯(lián)系,關聯(lián)分析主要針對前者,而序列模式分析則針對后者。

      典型算法包括ApioriAll算法、ApioriSome算法、SPADE算法、PrefixSpan算法、SPAM算法等。

      (二)通過數(shù)據(jù)庫實施TIA(全面信息感知)計劃

      偵查破案的過程就是一個搜集、分析、整合、傳遞、利用犯罪信息進行研判的過程,掌握的犯罪信息量越大、越及時,其有效性就越高。

      第一,排查空間。依托數(shù)字化偵查工作平臺,基于公安網(wǎng)信息系統(tǒng)與社會相關業(yè)務系統(tǒng),超越時空,對常駐人員資料、暫住人員資料、旅店登記資料、銀行卡、手機、座機、QQ、微信、陌陌、服務器IP等信息納入基礎系統(tǒng),可以有效打擊流竄犯罪、外來人員犯罪、跨區(qū)域犯罪甚至跨國犯罪。

      第二,排查手段。借助計算機技術(shù)與網(wǎng)絡技術(shù),應用各種信息系統(tǒng)的查詢、跟蹤功能,將檢索要求與檢索條件進行設置,選擇檢索通道,即可完成海量信息碰撞比對。

      第三,排查模式。利用大數(shù)據(jù)挖掘技術(shù),充分依托現(xiàn)有資料,形成以物找人、以人找案、以案找案的多種排查模式,重點查詢已經(jīng)發(fā)生案件的有關人、事、物。

      通過模擬、比對等手段,有效整合分散的信息,綜合研判隱性的關聯(lián)性信息尤為重要。采用TIA計劃,聯(lián)合相關技術(shù)部門,通過改進技術(shù)手段與方法,提升挖掘數(shù)據(jù)能力。

      一是自動快速的語言翻譯技術(shù)。能夠快速分析外語,包括口語和書面語,幫助分析員以更快的速度進行搜索、監(jiān)控各種語言文件和文件的傳輸。

      二是數(shù)據(jù)搜索、模式識別技術(shù)。偵查員能夠從大量數(shù)據(jù)集中搜索行為模式,重點偵測包括汽車租金、駕駛執(zhí)照、犯罪記錄等交易數(shù)據(jù),這種搜索和模式識別技術(shù)支持對交易數(shù)據(jù)進行更廣泛更徹底地挖掘。

      三是輔助推理決策支持技術(shù)。能夠協(xié)調(diào)來自不同機構(gòu)和部門的各級各類分析員共享數(shù)據(jù)庫,采用相關的推理方法,從相同的數(shù)據(jù)中發(fā)現(xiàn)不同的情況,并采取適當?shù)拇胧4]。

      (三)數(shù)據(jù)挖掘可靠性評價方案

      隨著經(jīng)濟全球化,信息普及化,人們的活動半徑不斷加大,跨國的政治、經(jīng)濟、文化活動等各種交往活動日趨頻繁?,F(xiàn)實世界與虛擬空間如影隨形,昭示著犯罪時空的復雜性與多樣性,時常產(chǎn)生偵查實踐中遇到的時空斷裂現(xiàn)象。面對數(shù)目眾多的大數(shù)據(jù)狀態(tài),制定相應的處理機制,從復雜技術(shù)中進行有效篩選,實施數(shù)據(jù)挖掘可靠性評價方案①在數(shù)據(jù)挖掘可靠性評價方案中,需要關注犯罪嫌疑人的通信工具;犯罪嫌疑人的真實身份;犯罪嫌疑人的同案人;犯罪嫌疑人的行蹤與落腳點。。

      第一,方法的有效性。根據(jù)不同的應用需要達到的準確率不同,在預處理或數(shù)據(jù)清洗階段,域的值被轉(zhuǎn)換為統(tǒng)一單位,通過合并現(xiàn)有的域產(chǎn)生新的域,數(shù)據(jù)被引入挖掘關系模式中。

      第二,方法的時間復雜度。算法的時間復雜度關注算法需要消耗的時間資源,算法是問題規(guī)模n的

      函數(shù)f(n),算法的時間復雜度為O(f(n)),若在數(shù)據(jù)量和挖掘維數(shù)增加的情況下,挖掘的時間呈線性增長,那么可以認為該挖掘方法的伸縮性較好。

      第三,方法空間的復雜度。算法的空間復雜度涉及算法需要消耗的空間資源,其計算方法與時間復雜度類似,一般用復雜度的漸近線表達,跟時間復雜度相比,空間復雜度的分析相對簡單。

      基于已經(jīng)掌握的事實,對某些犯罪瞬間狀態(tài)、犯罪情節(jié)枝節(jié)、犯罪情節(jié)整體發(fā)生過程與方式等情形作出初步的推測性解釋,依據(jù)重構(gòu)內(nèi)容的范疇,從邏輯機制上需要盡可能考慮到各種可能性,并逐步落實到每個環(huán)節(jié),避免導致偵查方向失誤,確保偵查方案不至于偏頗。首先,若原系統(tǒng)適用于現(xiàn)實系統(tǒng)的部分要求,那么,可以對原系統(tǒng)進行升級。其次,在大數(shù)據(jù)規(guī)范框架內(nèi),若原系統(tǒng)不適應現(xiàn)實系統(tǒng),則需要構(gòu)造一個新系統(tǒng)進行儲存于運算[5]。

      三、大數(shù)據(jù)驅(qū)動下的偵查模式

      大數(shù)據(jù)時代不僅有海量信息儲存①信息分析與研判有賴于偵查人員的經(jīng)驗,借助電子化記錄臺賬、公安信息網(wǎng)所累積的結(jié)構(gòu)化數(shù)據(jù)庫進行研判,此間,需要特別關注信息冗余與信息孤島現(xiàn)象,這已經(jīng)成為信息存在的基本形態(tài)。,更重要的是對數(shù)據(jù)進行有效的專業(yè)處理,此種情形下,偵查模式調(diào)整為案件受理、案件數(shù)據(jù)收集、現(xiàn)場勘驗確證、鎖定犯罪嫌疑人、結(jié)案等環(huán)節(jié)。確立由數(shù)據(jù)庫主導的模式,形成文字、圖像、音頻、視頻等不同形式的信息載體,突出數(shù)據(jù)的完整性與客觀性,使數(shù)據(jù)更加接近真相,籍此鎖定犯罪嫌疑人,確認犯罪證據(jù)。偵查活動需要從本體論、價值論、認識論、方法論與實踐論五個維度進行認知,從本體論視角看,偵查應著力于偵查原理、偵查方法、偵查制度等內(nèi)容;從價值論角度看,不僅為偵查實務提出一般性原則與專業(yè)技能,同時致力于為法治運行提供理論思考方案與制度設計原則;從認識論角度看,應當建立綜合性的偵查學原理框架;從方法論角度看,應當借鑒歷史經(jīng)驗,不應過度依賴高科技偵查,要注意高科技偵查的負面作用;從實踐論角度看,需要調(diào)整體制安排以及建設偵查學共同體等方面實現(xiàn)理論界與實務界的有效溝通[6]。

      偵查模式的變革與推進必須借助于刑事技術(shù)發(fā)展與大數(shù)據(jù)挖掘的雙輪驅(qū)動,有效應對社會現(xiàn)實狀態(tài)下日益復雜的犯罪態(tài)勢,建構(gòu)大數(shù)據(jù)驅(qū)動下的偵查模式。大數(shù)據(jù)驅(qū)動模式表現(xiàn)為對犯罪數(shù)據(jù)進行在線更新、從海量數(shù)據(jù)中對犯罪相關信息進行提取、分析、研判與預測。

      (一)線上與線下相結(jié)合的偵查模式演進方案

      1.在線、開放理念

      依托公安網(wǎng)絡數(shù)據(jù)的全面性與準確性,獲取即時性信息,爾后從海量數(shù)據(jù)中提取有價值的線索。

      2.數(shù)據(jù)主導偵查理念

      以數(shù)據(jù)儲存、數(shù)據(jù)獲取與數(shù)據(jù)分析為主導,實施大數(shù)據(jù)視野驅(qū)動下的偵查理念,以大數(shù)據(jù)庫作為偵查的基礎資源平臺,讓數(shù)據(jù)處于核心地位,支配偵查運行。

      3.關聯(lián)性理念

      使偵查人員全方位、多視角分析案情,確立數(shù)據(jù)結(jié)構(gòu)標準,理清犯罪原因,控制犯罪。

      4.在線偵查與線下確證相結(jié)合理念

      開展在線偵查與線下確認相結(jié)合的工作,使傳統(tǒng)偵查手段與大數(shù)據(jù)思維方式聯(lián)動,獲得真實案情,為訴訟提供有效、合法證據(jù)。

      (二)大數(shù)據(jù)視野下的時空一體化偵查模式

      1.時空一體化偵查

      以數(shù)據(jù)共享為機制,形成不同層級決策、指揮系統(tǒng),搭建多維度、跨區(qū)域的協(xié)同主體。數(shù)據(jù)庫的建立為偵查人員尋找到適宜的切入點,以特定時間、特定空間的系列數(shù)據(jù)為基準,整合數(shù)據(jù),認定犯罪嫌疑人。

      2.由點到面的立體式偵查

      確立從點到面的全景式偵查思維方式,對數(shù)據(jù)采集、分析、研判與預測進行關聯(lián)性分析。大數(shù)據(jù)視野下,可以整體上對案情的性質(zhì)進行把控,形成客觀、科學、有效的偵查認知模式,促成邏輯上的嚴謹、技術(shù)上的審慎。

      3.預測型偵查方案

      偵查行為從回溯型偵查轉(zhuǎn)向主動型偵查,實時感知犯罪,即時采取行動。大數(shù)據(jù)視野下,案件偵破需要對數(shù)據(jù)進行不斷跟蹤追查,掌握犯罪嫌疑人新動向,有效預防犯罪升級。

      4.基于大數(shù)據(jù)分析的偵查方案

      依托物聯(lián)網(wǎng)、云計算技術(shù),綜合諸學科最新成果,建立關聯(lián)規(guī)則,確立運算法則,獲取犯罪信息,找尋犯罪嫌疑人。大數(shù)據(jù)時代資源特別豐富,即使在這樣的情況下,仍然需要建立公安專業(yè)網(wǎng)絡平臺,形成專業(yè)、專門、快速通道,為案件偵破提供最佳平臺。

      (三)立體布控與跟蹤方案

      1.信息比對查控

      建立偵查例會制度定期交流案件情況,利用案

      件情報資料的定期整理制度發(fā)現(xiàn)并案線索。偵查部門應充分利用計算機技術(shù),對案件資料進行分析,發(fā)現(xiàn)并案線索,將偵查人員的主觀能動性與信息處理技術(shù)結(jié)合。通過警務綜合平臺、治安卡口查報系統(tǒng)、網(wǎng)吧實名登記系統(tǒng)進行研判,對旅館、網(wǎng)吧、二手市場、廢品收購行業(yè)實行不間斷控制,發(fā)現(xiàn)違法犯罪線索,抓獲犯罪嫌疑人。

      2.關聯(lián)人員軌跡查控

      通過并案偵查手段將判斷為同一犯罪主體的系列案件聯(lián)系起來,通過對犯罪嫌疑人關聯(lián)人員進行管控,關注其親屬、情人、朋友的活動軌跡。

      3.互聯(lián)網(wǎng)跟蹤

      跟蹤犯罪嫌疑人的IP地址,鎖定犯罪嫌疑人上網(wǎng)的時空軌跡。

      4.虛假信息查控

      根據(jù)逃犯冒用身份進行登記的規(guī)律,鎖定犯罪嫌疑人。重點關注冒用兄弟姐妹、同鄉(xiāng)同齡人、長相相似者,比對登記時間、職業(yè)習慣、口音、行為方式等。

      5.社會信息跟蹤

      公安機關的各個部門通過網(wǎng)絡檢索發(fā)現(xiàn)并案信息,廣泛收集社會人員信息,重點對駕駛證與行駛證信息、房產(chǎn)信息、銀行賬戶、證券賬戶、社保信息等進行比對。

      (四)大數(shù)據(jù)驅(qū)動下偵查模式運行機制

      1.犯罪監(jiān)控機制

      實現(xiàn)時間、空間、行為的全景式監(jiān)視與監(jiān)控,第一,建立數(shù)據(jù)記錄、存儲、提取、分析機制;第二,建立問題識別、定義、模型系統(tǒng)下的實時報警機制。

      2.犯罪偵破機制

      犯罪偵破機制主要由以下幾個方面構(gòu)成,第一,數(shù)據(jù)采集、清理、轉(zhuǎn)換與數(shù)據(jù)集成;第二,根據(jù)現(xiàn)有數(shù)據(jù),明確偵查要求,確立具體偵查方案;第三,依據(jù)問題導向,確立數(shù)據(jù)挖掘方案;第四,依據(jù)前期工作方案,縮小偵查范圍,鎖定犯罪目標。

      3.犯罪預測機制

      犯罪預測機制主要由以下兩個方面構(gòu)成,第一,梳理犯罪歷史檔案,建構(gòu)相關模型,在此基礎上結(jié)合現(xiàn)實場景實施優(yōu)化方案。第二,利用已有模型,將相關數(shù)據(jù)輸入系統(tǒng)進行比對與碰撞。第三,用貝葉斯網(wǎng)絡工具預測未來[7]。

      隨著互聯(lián)網(wǎng)技術(shù)的普及應用,信息化進入了新的發(fā)展階段,任何刑事案件都離不開特定時間和空間,并留下犯罪痕跡和證據(jù),以此為基準進行分類與篩選,從特有區(qū)域與眾多結(jié)合點處挖掘案情真相①數(shù)據(jù)挖掘通過對海量的數(shù)據(jù)信息進行有目的性的提取、分揀、歸類,挖掘隱含的有用信息,借助于多種數(shù)據(jù)分析工具在海量的數(shù)據(jù)信息中挖掘數(shù)據(jù)信息和模型之間關系。。根據(jù)不同的檢索形式設置不同的程序算法,根據(jù)數(shù)據(jù)挖掘的功能和目的來設置過濾的數(shù)據(jù)條件,對數(shù)據(jù)進行篩選。除了這些基礎的設置,還要采取一定的系統(tǒng)支持,主要采用ETL(數(shù)據(jù)倉庫技術(shù))系統(tǒng)支持,最終選用合適的展現(xiàn)的終端,終端可以根據(jù)對精度和可靠性的要求來自行選擇,整個系統(tǒng)就可以進行自動的運算與執(zhí)行②隨著信息技術(shù)的飛速發(fā)展,“金盾工程”建設規(guī)模不斷擴大,相互關聯(lián)度進一步加強,融合了各級各類信息平臺。刑事技術(shù)手段的不斷升級促進偵查方式的升級,減少了情報信息資源上的條塊分割,在情報互通、共享上建章立制,明確范圍、責任、權(quán)利,打破信息資源共享壁壘,有效整合各地區(qū)、各部門、各警種間的情報資源,注重吸收大量的社會資源,避免重復建設,使得資源實現(xiàn)最大的利用與共享。。

      [1]王曉東,趙煒,郝軍.以云技術(shù)為核心的智慧環(huán)保信息化系統(tǒng)在內(nèi)蒙環(huán)境管理中的應用[J].環(huán)境與發(fā)展,2015(1):97-100.

      [2]任爭,董莉麗,史澤,張海容,鄭敏.數(shù)據(jù)挖掘技術(shù)及其在過程監(jiān)控中的應用[J].黑龍江科技信息,2016(3):176.

      [3]劉軍,張景安,趙慧勤,付文博.數(shù)據(jù)庫應用系統(tǒng)開發(fā)技術(shù)[M].北京:機械工業(yè)出版社,2003:3.

      [4]劉暉,彭志勇.數(shù)據(jù)庫安全[M].武漢:武漢大學出版社,2007:277-279.

      [5]李貞強,陳康,武永衛(wèi),鄭緯民.大數(shù)據(jù)處理模式——系統(tǒng)結(jié)構(gòu),方法以及發(fā)展趨勢[J].小型微型計算機系統(tǒng),2015(4):646.

      [6]江涌.偵查學研究的哲理性反思[J].中國人民公安大學學報(社會科學版),2013(6):83.

      [7]何軍.大數(shù)據(jù)與偵查模式變革研究[J].中國人民公安大學學報(社會科學版),2015(1):75-78.

      【責任編校:曹曉寶】

      Logical Evolution of the Investigation Model from the Information Island to the Structured Database

      Yin Dashuang
      (Nanjing Forest Police College,Nanjing 210023,China)

      Thedevelopmentof internet,internetof thingsand cloud computing technology meansthatthebigdata times had arrived.Detection of cases faceunprecedented challenges.In the practiceof investigation,we need to constantly update a variety of technical means and measures of investigation practice,to combinate traditional and modern.Mass data generated by weChat,m icro-blog and other interactive means make the modern society more and more complex.Big data and small probability events lead to the investigation way of disruptive change.The way of thinking of big data should be used in investigation,and change the thinking model from the people and things as the center of the traditional mode of investigation to the data as the center of the upgraded version of the thinking mode of investigation.From the perspective of big data,investigation mode should rely on the network data storage and query system,large-scale structured data analysis system,datam ining system,in aspecific time,specific spaceand specific dataasabenchmark,and form the formationof crime control,crime detection and crime prediction of the new investigation model,to improve the efficiency of handling cases effectively.

      Investigation Pattern;Big Data;Structured Database;Data M ining;Association Rule

      D918.2

      A

      1673―2391(2016)06―0003―06

      2016-09-28

      印大雙(1963—),男,江蘇丹陽人,南京森林警察學院教授,研究方向為法哲學。

      猜你喜歡
      數(shù)據(jù)挖掘犯罪數(shù)據(jù)庫
      探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
      Televisions
      基于并行計算的大數(shù)據(jù)挖掘在電網(wǎng)中的應用
      電力與能源(2017年6期)2017-05-14 06:19:37
      數(shù)據(jù)庫
      財經(jīng)(2017年2期)2017-03-10 14:35:35
      數(shù)據(jù)庫
      財經(jīng)(2016年15期)2016-06-03 07:38:02
      什么是犯罪?
      數(shù)據(jù)庫
      財經(jīng)(2016年3期)2016-03-07 07:44:46
      數(shù)據(jù)庫
      財經(jīng)(2016年6期)2016-02-24 07:41:51
      一種基于Hadoop的大數(shù)據(jù)挖掘云服務及應用
      重新檢視犯罪中止
      新乡县| 玉溪市| 奉化市| 青州市| 綦江县| 乌什县| 新竹市| 鄂伦春自治旗| 新蔡县| 文化| 泰和县| 新宾| 乌兰察布市| 西充县| 娄烦县| 应城市| 攀枝花市| 安新县| 丰城市| 石棉县| 广南县| 广河县| 乌拉特后旗| 陇南市| 柳林县| 勃利县| 玉山县| 年辖:市辖区| 墨脱县| 会宁县| 佛坪县| 凤翔县| 大渡口区| 汉源县| 麦盖提县| 当雄县| 红河县| 连州市| 建瓯市| 辽阳县| 彰化县|