• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Python的鐵路旅財數(shù)據(jù)挖掘與分析

      2020-08-04 09:50:33鄭涵之葉燊王曉凱
      關(guān)鍵詞:鐵路

      鄭涵之 葉燊 王曉凱

      摘要:鐵路旅財案件的現(xiàn)場痕跡易被破壞,嫌疑人作案時空具有一定選擇性,通過分析旅客乘車數(shù)據(jù),可以從大量乘客中找出有作案嫌疑的乘客。運用Python語言編寫算法,服務(wù)于一線鐵路民警,減少重復(fù)性人工操作,節(jié)約警力。

      關(guān)鍵詞:鐵路;旅財案件;Python

      中圖分類號:TP311.13 文獻(xiàn)標(biāo)識碼:A 文章編號:1007-9416(2020)05-0033-02

      0引言

      旅客運輸是鐵路運輸生產(chǎn)的重要方面,鐵路車站是一個將自四面八方的旅客高度聚集的、流動的公共場所。旅財案件,即旅客財物被盜案件,也是鐵路區(qū)域內(nèi)的多發(fā)性案件。所謂的鐵路旅財案件就是指在鐵路上實施的侵犯旅客財產(chǎn)的犯罪行為,即列車上行竊即可稱為旅財案件。犯罪主體具有多樣性,犯罪分子作案一般都有個對作案環(huán)境和目標(biāo)的熟悉情況有所了解。這不僅是犯罪分子作案的預(yù)備、對作案目標(biāo)的選擇問題,也是其犯罪心理安全的需要。所以,犯罪分子的作案活動要么選擇自己熟悉的環(huán)境,要么事先進(jìn)行踩點、預(yù)謀。鐵路站車是一個特殊的地域和社會環(huán)境,這里面的環(huán)境格局、設(shè)施設(shè)備、人員崗位、生產(chǎn)作業(yè)流程、旅客旅行過程以及警察的勤務(wù)活動等都有一定的規(guī)范性和特殊性。

      雖然火車票實名制的實施為破獲侵財案件提供了一些便利,公安機(jī)關(guān)可以根據(jù)購票人信息順藤摸瓜,查找作案人,但一些車站并未嚴(yán)格實行實名制檢票,從而為不法分子提供了可乘之機(jī),他們或用虛假身份證購票,或用他人身份證購票,為案件偵破帶來了重重障礙。

      Python是一種跨平臺的計算機(jī)程序設(shè)計語言,是一種面向?qū)ο蟮膭討B(tài)類型語言,提供了多個數(shù)據(jù)分析的模塊,如pandas庫numpy庫和openpyxl等,以及可以連接ftp的功能模塊如ftplib庫等,可以高效地實現(xiàn)對旅財案件嫌疑人乘車軌跡的數(shù)據(jù)進(jìn)行分析的任務(wù)。

      1嫌疑人作案規(guī)律研究

      鐵路旅財案件的作案人無論是慣犯、流竄犯,還是臨時起意的人員,大多都熟知客運規(guī)律和站車地形。不法分子會選擇自己熟悉的地方作案,這樣既容易得手,又便于及時銷贓和逃逸。鐵路客運規(guī)律和站車地形都有其特殊性,如列車的運行和站停有一定規(guī)律、人財物高度集中又流動性大、旅客之間多互不認(rèn)識、車站出口較多等,對此不熟悉的人會感到茫然而拘謹(jǐn),而熟悉站車地形和客運規(guī)律的人作起案來則是輕車熟路。

      在公安機(jī)關(guān)的打擊和宣傳下,旅客對侵財案件的傳統(tǒng)作案手法已經(jīng)有所警惕,作案人不得不采取更加多樣化、智能化的作案手段。如作案人事先踩點、預(yù)謀,趁旅客在售票廳購票時暗中觀察旅客的錢財數(shù)量和放置位置等情況信息,或趁旅客不注意時盜走其財物,或趁上車人多擁擠時下手,或跟隨目標(biāo)上車后伺機(jī)作案。失主往往短時間內(nèi)難以發(fā)現(xiàn)財物被盜。

      經(jīng)總結(jié)旅財案件嫌疑人存在以下作案規(guī)律:(1)為作案得手后及時逃脫,且不引起其他乘客注意力,—般不攜帶兒童。(部分以兒童為掩護(hù)實施盜竊的作案人例外)(2)作案人以男性為主,且年齡主要在16到50歲之間,年齡跨度較大。不能夠僅僅憑借年齡作為篩選的主要條件。(3)作案人購買的車票票價一般較低,且以普通座次為主,票價多在300元以下。以此來降低自己的作案成本,提高作案所得。(4)作案人的乘車軌跡較為復(fù)雜、繁瑣,存在短期內(nèi)的多次乘車,購買了與之前購票規(guī)律不符的車票(存在盜用身份證的嫌疑),乘車軌跡出現(xiàn)大量“斷點”(不連續(xù))等,且存在較高的“斷點比率”,根據(jù)之前的案件數(shù)據(jù)分析得出斷點比率在75%以上的乘客乘車數(shù)據(jù),大多存在一定的異?,F(xiàn)象。

      在旅財案件中,嫌疑人的旅客乘車數(shù)據(jù)中最為明顯就是“斷點”,所謂的“斷點”就是在一段時間內(nèi),一個人的乘車軌跡不連續(xù),如從一開始的乘車軌跡為南京到上海而下一次的乘車軌跡卻是從常州到無錫,這就是所謂的“斷點”。因為,大多數(shù)嫌疑人會在得手之后直接在就近的車站提前下車,然后通過車票提前出站,而下一次再購票乘車的出發(fā)站就與之前軌跡的到達(dá)站不一致,這就導(dǎo)致了乘車軌跡的不連續(xù)。所以,如果一個人在一段時間內(nèi)的乘車軌跡存在大量的“斷點”,這個人的乘車軌跡就存在問題,從一定角度上說就存在作案的嫌疑。

      2基于Python的鐵路旅財數(shù)據(jù)分析軟件設(shè)計

      處理數(shù)據(jù)的流程即先從發(fā)生盜竊的列車上的旅客數(shù)據(jù)進(jìn)行分析處理,從中去除一些作案嫌疑較小的乘客,如女性乘客(鐵路旅財案件的嫌疑人以男性為主);攜帶兒童的乘客;乘車距離較長票價較貴的乘客;年齡大于6噦的老人(根據(jù)大量案例的數(shù)據(jù)分析以及民警的辦案經(jīng)驗,鐵路旅財案件的作案人員年齡分布較廣,作案人年齡可跨越16歲到60歲不等)等。并且從中尋找是否有前科人員乘坐該次列車,若有則將其作為重點分析對象,單獨進(jìn)行分析;如果無,則考慮是否存在冒用身份等情況。通過種種條件來對于龐大的乘客個人信息數(shù)據(jù)進(jìn)行篩選,縮小偵查范圍。并且設(shè)置“斷點比率”,以75%為閾值,高于這個值的人員將被歸為重點嫌疑人員。

      本軟件用Python語言進(jìn)行編寫,以針對旅財案件的“斷點”模型自動化分析為主要功能,其中“斷點”模型以“斷點”和“斷點”比率為主要特征作為篩選條件,輔以年齡、性別、網(wǎng)絡(luò)購票等特征進(jìn)一步篩選,實現(xiàn)了整套流程的自動化分析以及信息推送。其它功能還包括:碰撞法尋找旅財人員和逃票人員的軌跡“斷點”、鐵路旅財案件自動篩選管轄前科人員、前科人員以及案情信息查詢、15位身份證轉(zhuǎn)換為18位身份證、提供豐富快捷的信息查詢篩選功能、從指定ftp下載數(shù)據(jù)、上傳數(shù)據(jù)至指定ftp等功能(軟件的每個數(shù)據(jù)處理模塊都默認(rèn)先將所有數(shù)據(jù)進(jìn)行數(shù)據(jù)清洗、去重以及按照身份證號排序)。

      2.1鐵路旅財案件“斷點”模型自動化分析

      軟件初始頁面有六個功能模塊可供選擇,輸入數(shù)字“1”選擇功能一,將需要分析的excel文件放入指定路徑下,軟件自動分析完畢后會利用pandas.DataFrame方法和pandas.setoption方法提供預(yù)覽,預(yù)覽結(jié)果中會運用sorted方法和operator.itemgetter方法將所有人根據(jù)出現(xiàn)“斷點”次數(shù)降序進(jìn)行排序和匯總。

      預(yù)覽“斷點”分析結(jié)果,可以看到軟件會將乘客每條軌跡數(shù)據(jù)標(biāo)記上是否為斷點,并將每個乘客按照斷點次數(shù)降序排列。軟件在指定路徑中自動生成名為“斷點結(jié)果”的文件夾,即可將多+excel~格中的所有乘車數(shù)據(jù)匯總結(jié)果到結(jié)果中,并且以時間來命名,解決了同一人的乘車數(shù)據(jù)出現(xiàn)在多個excel文件中的問題。

      處理后的數(shù)據(jù)格式新增了“性別”“年齡”“是否網(wǎng)絡(luò)購票”“車站是否有人臉識別”“此條軌跡是否為斷點”這,個新的字段。每個人的最后一條乘車數(shù)據(jù)示為“無效值”,因為在設(shè)計“斷點”算法時將每一個人的軌跡以時間先后順序從前向后進(jìn)行“斷點”比較計算的,最后一條軌跡數(shù)據(jù)沒有向后的比較值,所以作為“無效值”,不影響“斷點”比率的計算;若某個人只有一條軌跡數(shù)據(jù),則標(biāo)記為“無效值”。

      前期經(jīng)過數(shù)據(jù)清洗、去重以及按照身份證和時間排序后,先通過xlrd模塊和openpyxlN塊讀取整+exce墳件并記錄其所有數(shù)據(jù)條數(shù),再通過while循環(huán)將循環(huán)次數(shù)限制在與數(shù)據(jù)條數(shù)相同,并對比某一條數(shù)據(jù)的身份證列與下一條數(shù)據(jù)是否相同,若相同,則說明這兩條數(shù)據(jù)是同一個人,就可以將本條數(shù)據(jù)的到站與下一條數(shù)據(jù)的發(fā)站進(jìn)行比較,來得出本條數(shù)據(jù)是否為“斷點”;若本條數(shù)據(jù)的身份證列與下一條數(shù)據(jù)不相同,則說明該條數(shù)據(jù)是該人的軌跡中最后一條數(shù)據(jù),因而無法與下一條數(shù)據(jù)比較,即標(biāo)識“無效值”。

      在給每一條軌跡數(shù)據(jù)標(biāo)記了是否為“斷點”之后,再運用collections.counter方法計算每個人的軌跡數(shù)據(jù)總數(shù),再計算每個人的“斷點”軌跡數(shù)占個人軌跡數(shù)據(jù)總數(shù)的比重,即為“斷點”比率。

      2.2前科人員信息查詢

      本模塊主要利用python中的xlrd和xlwt模塊讀取excel文件中內(nèi)容進(jìn)行索引查找和數(shù)據(jù)的挖掘。根據(jù)命令提示在指定路徑下放入原始的案情表和人員信息表。軟件會通過0s.1istdir方法判斷指定路徑下是否放入文件,若沒有放入文件則會提示先放人文件在執(zhí)行關(guān)鍵詞查詢。放人文件后先輸入需要查找的關(guān)鍵字1,再輸入其它需要查找的關(guān)鍵字2,3,4……,若需要所有上述關(guān)鍵字搜索的結(jié)果,則輸入“并集”;若需要同時滿足上述所有關(guān)鍵字的搜索結(jié)果,則輸入“交集”。

      完成搜索的同時,軟件也會自動將部分舊版的15位身份證轉(zhuǎn)換為新版的18位身份證。對于在數(shù)據(jù)源中有港澳通行證的乘客,軟件也會將港澳通行證號放在身份證后面提供預(yù)覽。

      2.3自動定時爬取數(shù)據(jù)進(jìn)行分析并推送

      python~時任務(wù)框架Apscheduler提供了非常豐富而且方便易用的定時任務(wù)接口,主要運用其中用BlockingScheduler調(diào)度器和interval方法設(shè)置觸發(fā)器和定時自動觸發(fā)的時間間隔,實現(xiàn)了精細(xì)化的控制。在此大框架下編寫具體要執(zhí)行的定時任務(wù):利用ftplib.FTP方法登錄ftp取數(shù)據(jù),通過模擬菜單界面使用戶查看當(dāng)前路徑下的文件,確定需要選擇的文件,軟件會運用csv.reader方法預(yù)覽原文件,針對有最新乘車記錄的前科人員,確定其管轄范圍屬于管內(nèi)車站還是管內(nèi)車次,處理結(jié)果用open方法和write方法分別寫入所屬轄區(qū)各所以及乘警隊的txt文件中,將數(shù)據(jù)存儲在本地并且分析完畢后在自動定時上傳到指定ftp上完成推送,實現(xiàn)了動態(tài)防控。

      2.4碰撞法找“斷點”

      除了上文提到的分析“斷點”的方法,還有一種方法即碰撞法。這種尋找“斷點”的方法適用于從普通乘客中分離出鐵路逃票嫌疑人。

      例如一條鐵路沿線分別有A、B、c三站,將同一天(或若干天)內(nèi)從A到B和從C到B的乘客數(shù)據(jù)進(jìn)行碰撞,碰撞結(jié)果即為出現(xiàn)軌跡“斷點”的人員。這種方法更適合在已知固定乘車區(qū)間內(nèi)尋找經(jīng)常逃票的人員。

      將乘車區(qū)間互為反向的兩種乘車數(shù)據(jù)放人指定文件夾下的“正向”和“反向”目錄下(“正向”“反向”為相對的,自行定義某一方向為正向即可,另一方向就為反向)即可自動分析,分析結(jié)果文件以時間作為命名格式。

      3結(jié)語

      該分析過程可總結(jié)為通過一系列對于乘車軌跡特點的篩選得出一部分存在嫌疑的人員名單,再由民警通過所得的人員名單與前科人員數(shù)據(jù)庫進(jìn)行對比,分析其近期是否存在異常的消費記錄、住宿信息以及通話信息等等。通過對于這一系列的數(shù)據(jù)分析,從而縮小偵查范圍,排查出有嫌疑的人員。根據(jù)所得的嫌疑人名單進(jìn)行進(jìn)一步的偵查工作,以由“由人到案”為基本思想進(jìn)行鐵路旅財案件的偵破工作。綜上所述,根據(jù)旅客乘車數(shù)據(jù)進(jìn)行數(shù)據(jù)挖掘能夠真正挖掘出數(shù)據(jù)的潛在價值,為旅客侵財型案件的偵破提供指導(dǎo)方向。但是僅依靠鐵路旅客乘車數(shù)據(jù)的挖掘遠(yuǎn)遠(yuǎn)不夠用于應(yīng)對實際作戰(zhàn)中遇到的種種現(xiàn)象,還需要結(jié)合各項其他數(shù)據(jù)進(jìn)行綜合的分析,以此才能夠得出較為準(zhǔn)確的分析結(jié)論。

      在大數(shù)據(jù)、Python數(shù)據(jù)分析等技術(shù)支持手段的支持之下,重視鐵路公路大數(shù)據(jù)系統(tǒng)建設(shè),基于科學(xué)理念為支持,強(qiáng)化信息建設(shè)與完善,重視信息數(shù)據(jù)采集,提根本上提升鐵路信息化管理能力,為智慧鐵路公安系統(tǒng)建設(shè)奠定了基礎(chǔ)。以“智慧鐵路”為思想指導(dǎo),更加有效的利用收集到的鐵路數(shù)據(jù),改變以往傳統(tǒng)的辦案方式,從傳統(tǒng)的“由案到人”變?yōu)椤坝扇说桨浮保粍幼優(yōu)橹鲃?,主動分析乘客的乘車?shù)據(jù),找到有嫌疑的乘客數(shù)據(jù),并將數(shù)據(jù)及時反饋給一線鐵路民警,提高防范意識,預(yù)防制止違法犯罪。在信息數(shù)據(jù)的支持之下的凸顯鐵路公安信息系統(tǒng)的預(yù)警、分析作用,提前做好預(yù)警準(zhǔn)備,可以真正的做到精確打擊鐵路扒竊的違法犯罪行為。

      猜你喜歡
      鐵路
      沿著中老鐵路一路向南
      云南畫報(2021年12期)2021-03-08 00:50:54
      鐵路通信線路維護(hù)體制改革探索與實踐
      無人機(jī)在鐵路工程建設(shè)中的應(yīng)用與思考
      GSM-R在鐵路通信中的應(yīng)用
      夢想在鐵路人心中流淌
      中國火炬(2015年7期)2015-07-31 17:40:05
      丁羽心:成敗鐵路
      法人(2014年2期)2014-02-27 10:42:20
      大姚县| 左云县| 东方市| 望江县| 英山县| 彰武县| 荆门市| 民和| 合江县| 酒泉市| 怀柔区| 肇源县| 景东| 军事| 航空| 清徐县| 华亭县| 旬阳县| 文山县| 贵阳市| 精河县| 伊川县| 岫岩| 丰都县| 泰安市| 大丰市| 吴旗县| 准格尔旗| 威海市| 故城县| 民丰县| 肥乡县| 绥芬河市| 新乡市| 沁阳市| 高阳县| 临沧市| 丰原市| 同心县| 扎鲁特旗| 故城县|