文圖|朱濤 單光良
隨著道路交通的不斷發(fā)展,公安交管業(yè)務數(shù)據(jù)極速增多,包含機動車、駕駛證、駕駛人考試、交通違法、交通事故、信息安全、執(zhí)法設備等相關數(shù)據(jù)不斷存儲堆疊,系統(tǒng)安全與業(yè)務流程算法亟待優(yōu)化,以應對和解決日益凸顯的異地審車、套牌車、假牌車、報廢車上路、“黃?!辟I賣分、車輛盜搶和盜搶車輛轉移等社會問題。2017 年,公安部交通管理局出臺《公安交通管理信息安全監(jiān)管系統(tǒng)建設指導意見》(公交管〔2017〕588 號),提出“進一步提升公安交通管理信息系統(tǒng)安全監(jiān)管水平,全力消除信息系統(tǒng)安全隱患漏洞”的工作理念,對下一步完善交管業(yè)務流程的數(shù)據(jù)監(jiān)管、分析預警及杜絕違規(guī)業(yè)務辦理提出了全新的更高要求。在此背景下,基于大數(shù)據(jù)的分析研判,進而推進交管業(yè)務的監(jiān)管建模分析成為一個重要的研究方向。本文通過對交管數(shù)據(jù)的監(jiān)控、融合、分析、預警、關聯(lián)與應用,結合數(shù)據(jù)可視化技術的綜合運用,生成數(shù)據(jù)畫像與報表,對實現(xiàn)全天候、高效率、快響應、即整改的閉環(huán)業(yè)務分析監(jiān)管體系進行分析與論述。
當前,數(shù)據(jù)分析技術與交管行業(yè)深度融合,其應用領域涉及到公安交通管理綜合應用平臺、公安交通集成指揮平臺、公安交通管理大數(shù)據(jù)分析研判平臺和公安部交通安全綜合服務管理平臺(以下簡稱“交管四大平臺”),以及機動車查驗監(jiān)管系統(tǒng)、檔案影像系統(tǒng)和機動車安全技術檢驗監(jiān)管系統(tǒng)等數(shù)據(jù)業(yè)務系統(tǒng),極大改變著我國道路交通管理工作模式。通過對這些數(shù)據(jù)加工分析,能夠促進實現(xiàn)交管全業(yè)務智慧監(jiān)管,并推動交警執(zhí)法規(guī)范化的建設。為實現(xiàn)智慧化交管全業(yè)務監(jiān)管的完整性目標,可從以下幾個方面入手:
交管全業(yè)務智慧監(jiān)管指對公安交管工作中機動車、駕駛證、駕駛人考試、交通違法及事故處理等相關業(yè)務的監(jiān)管分析,涵蓋了交管業(yè)務中大部分的業(yè)務類型,與傳統(tǒng)業(yè)務監(jiān)管模式相比,無需人為耗時確認分析,可以直接利用數(shù)據(jù)邏輯與預警模型定義數(shù)據(jù)特征,且持續(xù)監(jiān)管,達到觸發(fā)條件即預警,做到快速及時反映現(xiàn)階段業(yè)務存在的問題,避免時空上因信息延遲帶來的工作隱患。
整體而言,交管全業(yè)務智慧監(jiān)管以“交管四大平臺”數(shù)據(jù)為核心,結合公安信息網(wǎng)、視頻專網(wǎng)、互聯(lián)網(wǎng)數(shù)據(jù)資源,分別針對各項業(yè)務構建科學合理的數(shù)據(jù)分析模型,從監(jiān)督層面進行綜合監(jiān)管,提供豐富的業(yè)務監(jiān)管點和完善的預警機制,幫助交管部門實時掌握業(yè)務辦理情況。
大數(shù)據(jù)分析可以為交管業(yè)務監(jiān)管預警提供技術支持,其作用程度取決于有效信息數(shù)據(jù)的可靠收集。一般來講,數(shù)據(jù)的收集難度與檢測對象的可控屬性存在著反相關系,檢測對象的可控性越強,從該對象群體收集到的信息越全,對態(tài)勢預測的角度采樣越豐富,所采集樣本數(shù)據(jù)的歸納覆蓋度也越高,基于該數(shù)據(jù)采集的研判和分析也就越準確。
大數(shù)據(jù)分析最核心的價值在于預測研判,通過分類、聚類等數(shù)據(jù)挖掘技術,發(fā)現(xiàn)事物之間的關系及發(fā)展規(guī)律,從而實現(xiàn)對特定領域的預測。例如,相比于正常數(shù)據(jù),異常業(yè)務數(shù)據(jù)在屬性方面往往呈現(xiàn)出某種固定模式,在操作日志、日期間隔及重要事件節(jié)點等方面都表現(xiàn)出一定的特征。因此,這些特征與異常監(jiān)管行為的認定之間存在著直接或間接的聯(lián)系。符合一定特征模式的數(shù)據(jù)格式,很可能就是需要關注的點位。理想狀態(tài)下,完整的業(yè)務數(shù)據(jù)包含數(shù)據(jù)挖掘、數(shù)據(jù)關聯(lián)、數(shù)據(jù)研判與分析、趨勢動態(tài)感知、信息處理等多個維度,能夠通過貝葉斯公式、邊緣概率分析、頻繁項集算法等方法,最大限度地將海量信息背后的人、時間、事故、地點、車輛等要素進行有效整合和動態(tài)勾連,實現(xiàn)對業(yè)務預警可能性的微觀捕捉和信息研判,從而有效防控違法違規(guī),將其遏制在萌芽狀態(tài)。
如今,全國多地的公安機關都構建了多樣化的信息處理平臺和數(shù)據(jù)查詢平臺,如貴陽的“數(shù)據(jù)鐵籠”、新疆的“反恐一體化平臺”等。隨著數(shù)據(jù)量不斷增加,如何做好“多源性收集”與“可靠性篩選”愈加關鍵。首先,通過數(shù)據(jù)分析,將相關人員的身份、行為特征、興趣愛好、人際關系等情況以數(shù)據(jù)形式呈現(xiàn),為業(yè)務流程提供預警指引。然后,針對不同數(shù)據(jù)進行選擇和分析,將其放入分布式數(shù)據(jù)庫,構建各種各樣的預警級別以及預警分類主題的總和。最后,借助數(shù)據(jù)倉庫來完成數(shù)據(jù)整合。通過邏輯模型層中的數(shù)據(jù)總線接口,還可以對參數(shù)進行深入的研究。
利用大數(shù)據(jù)進行交管全業(yè)務監(jiān)管的思路構架如下圖所示,其主要功能體現(xiàn)在幾大組成部分:駕駛艙、數(shù)據(jù)大屏中心、業(yè)務監(jiān)管中心、數(shù)據(jù)分析中心、全息檔案、警員中心與報表中心。這些部分在底層架構的基礎上構成了一個完善的全業(yè)務智慧監(jiān)管平臺。
圖 交管全業(yè)務智慧監(jiān)管思路構架
交管全業(yè)務智慧監(jiān)管平臺是為實現(xiàn)交管業(yè)務監(jiān)管、改善社會服務而構建的大數(shù)據(jù)綜合服務平臺,在預警方面承擔著重要角色。下面從業(yè)務監(jiān)管的統(tǒng)計分析、集成分類和聚類分析三個方向介紹其預警實際應用。
在統(tǒng)計分析模型中,依托大數(shù)據(jù)平臺和回歸分析算法對部分業(yè)務進行隨機抽樣檢驗,提取若干項預測因子,生成分析結果。以異地檢車為例,分析指標體系包括審車人地址、車輛注冊地、車輛注冊公司、人員地址、車檢地址等信息。根據(jù)Logistic 回歸,生成異地審車相似程度的相關結果,若分析結果相似或一致,且該車于短期內(nèi)在同一地點進行集中檢測,可以推斷出該車可能為異地無法年檢車輛,存在異常,需要進一步確認。適用統(tǒng)計分析模型的同類業(yè)務還有很多,比如駕駛證扣分一年內(nèi)達12 或者24 分、滿分學習、違法人員來自同一駕校的人數(shù)監(jiān)管等。
為使回歸分析結果更加穩(wěn)定,需要先分析上述預測因子和因變量之間的聯(lián)系,淘汰相關性強的預測因素。在統(tǒng)計分析的基礎上,建立對應的業(yè)務統(tǒng)計語句模型,通過不斷增加的數(shù)據(jù)輸入,能夠持續(xù)建模,做到對部分業(yè)務點長期有效的監(jiān)管。
在模式識別、數(shù)據(jù)挖掘當中,集成分類是非常重要的一部分,它可以根據(jù)數(shù)據(jù)集的情況來建立自身模型,將沒有分類的數(shù)據(jù)體現(xiàn)到其中一個類別內(nèi)。使用最多的分類方式有支持向量機、貝葉斯、決策樹、神經(jīng)網(wǎng)絡、馬爾可夫等。集成分類器需要建立一系列的計算方法,并投票劃分,使分類更加合理。最常用的集成分類器是隨機森林,其所有的枝丫都沒有相互聯(lián)系,需要對這些枝丫的數(shù)據(jù)進行結合,以得出結果。
集成分類模型可以應用到套牌車、假牌車、“黑車”、盜搶車等排查監(jiān)管中。以排查套牌車為例,首先將卡口監(jiān)控設備和數(shù)據(jù)系統(tǒng)的記錄進行對比,以車牌作為身份ID 識別標志,使用神經(jīng)網(wǎng)絡識別相似度判定是否為同一輛車,再利用年檢標志、車內(nèi)飾物等進行分類識別,同時結合時空軌跡出現(xiàn)的合理性,構建比對決策樹進行判定,由此構建多個基分類器,最后集成分類,得出判定結論。
所有數(shù)據(jù)中,離群點屬于顯著偏離一般水平的參數(shù),通過離群點的分布能夠發(fā)現(xiàn)數(shù)據(jù)中的異常情況。離群點可以分為三類,即情景離群點、全局離群點與集體離群點。以酒駕檢測為例,通過對酒駕者數(shù)據(jù)集中的離群點進行研究,可以快速了解酒駕者產(chǎn)生的異常行為,從而用于檢測酒駕人員;針對內(nèi)部人員濫用職權,離群點也能夠起到一定聚類作用,通過對非正常時間操作、進行敏感的撤銷更改等行為的離群分析確認,找出存在違規(guī)操作的行為,確保組織內(nèi)部監(jiān)管到位。此類算法還可以解決販毒區(qū)域劃分、人員集中區(qū)分析等多項業(yè)務監(jiān)管問題。
業(yè)務監(jiān)管分析在大數(shù)據(jù)時代的延續(xù)和發(fā)展,是貫徹創(chuàng)新立體化智能服務體系的關鍵且有效手段。一方面,通過大數(shù)據(jù)監(jiān)管的方式,促使“事后監(jiān)管”向“事前防范”轉變。在業(yè)務監(jiān)管上,從“事后消滅”轉為“事前扼殺”,從“應急與處置”轉為“預警與布控”,從“懲治為主”轉向“防控為重”,扭轉被動局面。另一方面,借助大數(shù)據(jù)處理的技術,能夠更加高效地引入業(yè)務辦理流程防范措施。網(wǎng)絡傳播之迅速,讓交管工作不再受異常信息地域和時間的限制,監(jiān)管信息的來源及其傳播途徑在幾秒鐘內(nèi)就可以看到,為及時采取防控措施提供了充足的信息支撐。同時,大數(shù)據(jù)的準確性使得監(jiān)管預警更加科學,基于對相關因素的客觀分析,使得監(jiān)管預警策略的制定更加科學有效。為了促進未來交管業(yè)務的良性發(fā)展,需要充分利用大數(shù)據(jù)技術,研究大數(shù)據(jù)的規(guī)律和特征,以確保公安交通管理部門能夠更準確地獲取數(shù)據(jù)信息,從而為民眾出行提供更加便捷的服務。