• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      淺析決策樹(shù)對(duì)犯罪風(fēng)險(xiǎn)程度的預(yù)測(cè)

      2019-10-21 17:25:11胡杰明
      科技風(fēng) 2019年2期
      關(guān)鍵詞:決策樹(shù)

      胡杰明

      摘 要:簡(jiǎn)單介紹利用決策樹(shù)對(duì)一個(gè)犯罪嫌疑人的犯罪行為程度進(jìn)行分析,挖掘相應(yīng)數(shù)據(jù),理出一個(gè)較可行的方式和模型,實(shí)現(xiàn)對(duì)犯罪風(fēng)險(xiǎn)程度的預(yù)測(cè)。

      關(guān)鍵詞:決策樹(shù);數(shù)據(jù)整合與挖掘;犯罪預(yù)測(cè)

      中圖分類號(hào):TP18

      1 緒論

      隨著信息化時(shí)代的到來(lái),大數(shù)據(jù)、云計(jì)算、機(jī)器學(xué)習(xí)等科學(xué)技術(shù)不斷得到發(fā)展與完善,各個(gè)行業(yè)的技術(shù)均離不開(kāi)信息化建設(shè)的支持。在信息化社會(huì)背景下,公安應(yīng)用也在不斷改革。這一新的趨勢(shì)促使公安工作在大數(shù)據(jù)的環(huán)境下不斷挖掘、不斷運(yùn)用。為提高公安情報(bào)工作,公安部門(mén)應(yīng)加強(qiáng)數(shù)據(jù)的整合與挖掘。傳統(tǒng)的警情研判、對(duì)犯罪人的預(yù)測(cè),是通過(guò)人力隊(duì)海量數(shù)據(jù)進(jìn)行整合分析,這樣耗費(fèi)了大量警力資源。所以,警務(wù)改革應(yīng)針對(duì)情報(bào)分析方向的技術(shù)加以深層次的研究,打造一個(gè)良好的、有效率的、適應(yīng)當(dāng)下環(huán)境的綜合運(yùn)用系統(tǒng)。目前在該領(lǐng)域,相關(guān)部門(mén)已經(jīng)建設(shè)相應(yīng)的信息數(shù)據(jù)平臺(tái),但對(duì)信息的處理僅僅還停留在查詢、統(tǒng)計(jì)、更新,對(duì)處理完的案件進(jìn)行更新儲(chǔ)存,便于以后查詢,分析層次極其欠缺。好比基層公安機(jī)關(guān)的警情分析系統(tǒng)都是基于C/S模式,得出的結(jié)果大多是復(fù)雜的報(bào)表數(shù)據(jù),警綜平臺(tái)就是一個(gè)鮮明的例子。但這些復(fù)雜的數(shù)據(jù)中,隱含著許多未被利用且被忽略的數(shù)據(jù)信息,所以需要結(jié)合公安多方面的應(yīng)用,將數(shù)據(jù)進(jìn)行整合和挖掘,基于決策樹(shù)進(jìn)行數(shù)據(jù)分析,建立數(shù)據(jù)倉(cāng)庫(kù),總和數(shù)據(jù)記錄,好比大量的犯罪行為記錄,發(fā)現(xiàn)其犯罪規(guī)律、趨勢(shì)、犯罪行為之間的聯(lián)系以及誘發(fā)狀態(tài),從而實(shí)現(xiàn)對(duì)犯罪程度的預(yù)測(cè)。

      2 犯罪行為

      決犯罪行為是犯罪人所實(shí)施的違反刑法規(guī)定構(gòu)成犯罪的行為。是刑法學(xué)中犯罪構(gòu)成的基礎(chǔ)和行為人承擔(dān)刑事責(zé)任的根據(jù)。它是一個(gè)犯罪心理演變的過(guò)程,最主要的就是犯罪嫌疑人的犯罪動(dòng)機(jī)。如果能提前準(zhǔn)確地對(duì)其進(jìn)行預(yù)測(cè),就能在犯罪嫌疑人將要進(jìn)行犯罪前阻止其一切行動(dòng)。

      3 決策樹(shù)

      決策樹(shù)(decision tree)是一類常見(jiàn)的機(jī)器學(xué)習(xí)方法,目的是為了產(chǎn)生一棵泛化能力強(qiáng),即處理未見(jiàn)示例能力強(qiáng)的決策樹(shù)。決策樹(shù)的生成是一個(gè)遞歸的過(guò)程。

      (1)決策樹(shù)算法。決策樹(shù)算法是數(shù)據(jù)挖掘技術(shù)中用來(lái)分類、預(yù)測(cè)的一種算法。在決策樹(shù)的基本算法中,有三種情況會(huì)導(dǎo)致遞歸返回:①當(dāng)前節(jié)點(diǎn)包含的樣本全屬于同一類別,無(wú)需劃分;②當(dāng)前屬性集為空,或是所有樣本在所有屬性上取值相同,無(wú)法劃分;③當(dāng)前節(jié)點(diǎn)包含的樣本集為空,不能劃分。它的樹(shù)形結(jié)構(gòu)模型,在分類問(wèn)題中,表示基于特征隊(duì)數(shù)據(jù)進(jìn)行分類的過(guò)程,可以認(rèn)為是if-then規(guī)則的集合,每個(gè)內(nèi)部節(jié)點(diǎn)表示在屬性上的一個(gè)測(cè)試,每個(gè)分支代表一個(gè)測(cè)試輸出,每個(gè)葉節(jié)點(diǎn)代表一種類別。

      4 決策樹(shù)下犯罪風(fēng)險(xiǎn)中的應(yīng)用

      (1)模擬信息表。為了有效說(shuō)明問(wèn)題,我們給出少許的虛擬數(shù)據(jù),進(jìn)行綜合處理得出一個(gè)數(shù)據(jù)表。首先進(jìn)行數(shù)據(jù)預(yù)處理:可將已知信息,按有年齡、文化程度、經(jīng)濟(jì)情況、有無(wú)固定職業(yè)、有無(wú)犯罪記錄、違法次數(shù)、犯罪程度等分類,進(jìn)行標(biāo)記,生成枝葉,將每個(gè)節(jié)點(diǎn)數(shù)據(jù)綜合整理,形成模擬信息表。

      (2)基于ID3的決策樹(shù)模型。由于虛擬數(shù)據(jù)內(nèi)容不夠詳細(xì),分析程度和分類知識(shí)的獲取仍然未達(dá)到理想狀態(tài)。如果項(xiàng)目和記錄次數(shù)較多,則決策樹(shù)的分枝和層次將非常龐大。當(dāng)然,在實(shí)際應(yīng)用中,分析的數(shù)據(jù)和項(xiàng)目越多,得出的挖掘知識(shí)就更可信,更具有價(jià)值。這只是一個(gè)簡(jiǎn)單的粗層次分類模型,想做到良好的、可靠的分析模型,我們應(yīng)在大數(shù)據(jù)基礎(chǔ)上,采集并挖掘更多的有效數(shù)據(jù),并結(jié)合犯罪分析的專業(yè)知識(shí),從作案對(duì)象、手段特點(diǎn)、作案工具、作案時(shí)間、作案場(chǎng)所、專長(zhǎng)等特征具體加以分析,這將會(huì)是一個(gè)很有意義的分析模型,采用的是ID3算法生成的決策樹(shù)模型,這個(gè)算法的特點(diǎn)是使用信息增益來(lái)選擇特征。

      (3)分支順序。我們依然可以采用一種遞歸生成算法,依據(jù)的是分支順序。算法基本流程是:創(chuàng)建一個(gè)新的節(jié)點(diǎn)N,如果虛擬數(shù)據(jù)樣本在其它的同類,就使算法中的N標(biāo)位葉節(jié)點(diǎn),如果樣本其他的分枝為空值,并標(biāo)位普通類,選擇樣本分枝中具有最高信息增益屬性,為其對(duì)應(yīng)已知的數(shù)值,再?gòu)墓?jié)點(diǎn)N選出其分枝,在幾何中進(jìn)行增加葉節(jié)點(diǎn)與節(jié)點(diǎn),最后得出最終值。在決策樹(shù)每個(gè)節(jié)點(diǎn)上用信息增益熵來(lái)進(jìn)行選擇,簡(jiǎn)稱分枝優(yōu)選。這一種遞歸算法可以通過(guò)在樣本中的,選擇最大熵的列作為當(dāng)前節(jié)點(diǎn)的決策,進(jìn)行層層篩選而得出最小屬性值。該屬性值就能判斷測(cè)犯罪嫌疑人的犯罪程度大小,從而預(yù)測(cè)犯罪風(fēng)險(xiǎn)程度,如此構(gòu)造了一個(gè)相對(duì)比較簡(jiǎn)單的樹(shù)和模型。

      5 結(jié)語(yǔ)

      利用決策樹(shù)算法的技術(shù)形成時(shí)間并不長(zhǎng)遠(yuǎn),在我國(guó)內(nèi)各方面領(lǐng)域上,能使用的并不占多數(shù),僅僅局限在商業(yè)服務(wù)中,而且能成功運(yùn)用的少之又少。如果放在犯罪風(fēng)險(xiǎn)預(yù)測(cè)上,那是一個(gè)非常有意義的應(yīng)用?;跊Q策樹(shù)的犯罪風(fēng)險(xiǎn)預(yù)測(cè)模型對(duì)于公安系統(tǒng)的運(yùn)用中,能夠以最快速度的、高效率的提前預(yù)測(cè)犯罪嫌疑人的犯罪行為以及犯罪風(fēng)險(xiǎn)程度,這樣能夠在警綜平臺(tái)上有效地減少人工成本,對(duì)于信息化作戰(zhàn)中提供了良好的作戰(zhàn)準(zhǔn)備及保護(hù)措施。無(wú)法預(yù)測(cè)到犯罪風(fēng)險(xiǎn)的大小,民警們就很難保護(hù)公民們的安全,更難處理意外之事。本文通過(guò)對(duì)虛擬數(shù)據(jù)的挖掘,提供了一個(gè)較為合理的決策模式,采取這種最低級(jí)別的模式,得出一些具有參考價(jià)值的的分析結(jié)論,能夠?qū)矘I(yè)務(wù)起到推進(jìn)作用,提供了一個(gè)良好的發(fā)展方向。

      參考文獻(xiàn):

      [1]劉美玲.基于數(shù)據(jù)挖掘的決策樹(shù)算法研究及應(yīng)用探討[D].上海:華東理工大學(xué),2009.

      [2]盧東標(biāo).基于決策樹(shù)挖掘算法研究與應(yīng)用[D].武漢:武漢理工大學(xué),2008.

      [3]莊卿卿.一種改進(jìn)的ID3算法[J].現(xiàn)代計(jì)算機(jī)(專業(yè)版),2009,32(3):37-41.

      [4]陸秋.基于決策樹(shù)ID3算法的數(shù)據(jù)挖掘技術(shù)研究與應(yīng)用.桂林:桂林工學(xué)院 桂林理工大學(xué),2007.

      [5]王珊.數(shù)據(jù)倉(cāng)庫(kù)技術(shù)與聯(lián)機(jī)分析處理.科學(xué)出版社,1998.

      [6]Han Jiawei,Kamber M.Data Mining Concepts and Techniques.Morgan Kaufmann Publishers,Inc.,2001.

      猜你喜歡
      決策樹(shù)
      基于決策樹(shù)和神經(jīng)網(wǎng)絡(luò)的高血壓病危險(xiǎn)因素研究
      一種針對(duì)不均衡數(shù)據(jù)集的SVM決策樹(shù)算法
      決策樹(shù)和隨機(jī)森林方法在管理決策中的應(yīng)用
      電子制作(2018年16期)2018-09-26 03:27:06
      基于改進(jìn)決策樹(shù)的故障診斷方法研究
      決策樹(shù)多元分類模型預(yù)測(cè)森林植被覆蓋
      電子制作(2017年24期)2017-02-02 07:14:23
      基于決策樹(shù)算法的數(shù)據(jù)挖掘應(yīng)用研究
      基于決策樹(shù)的出租車(chē)乘客出行目的識(shí)別
      基于決策樹(shù)的復(fù)雜電網(wǎng)多諧波源監(jiān)管
      基于模糊關(guān)聯(lián)規(guī)則和決策樹(shù)的圖像自動(dòng)標(biāo)注
      基于肺癌CT的決策樹(shù)模型在肺癌診斷中的應(yīng)用
      民丰县| 巴彦淖尔市| 淮阳县| 揭阳市| 黑山县| 景谷| 郴州市| 永丰县| 社会| 许昌市| 黄浦区| 南充市| 枞阳县| 建德市| 泰州市| 庆安县| 荔波县| 九龙县| 涞水县| 盖州市| 东安县| 姚安县| 康马县| 铜山县| 蓝田县| 金湖县| 景泰县| 体育| 财经| 青海省| 观塘区| 洪江市| 龙里县| 贵港市| 榆社县| 新营市| 甘洛县| 威宁| 弥勒县| 万安县| 荔波县|