張健生 莫浩華 徐志輝 楊海軍
1. 廣東省東莞市公安局 2. 廣東冠網(wǎng)信息科技有限公司
隨著東莞市社會(huì)經(jīng)濟(jì)的快速發(fā)展,機(jī)動(dòng)車保有量與出行量逐年激增,城市人口數(shù)量日漸龐大,車輛交通管理現(xiàn)狀和需求的矛盾日漸加劇,各類交通事故及與車輛相關(guān)的刑事、治安案件逐年上升,警力嚴(yán)重不足與繁重的車輛管理任務(wù)之間的矛盾日益突出,給城市管理提出了新課題。東莞市公安局充分應(yīng)用人工智能、大數(shù)據(jù)等新技術(shù),加快對(duì)傳統(tǒng)偵查打擊手段的智能化改造,構(gòu)建以數(shù)據(jù)為關(guān)鍵要素的數(shù)字偵查打擊模式,以機(jī)器換人力、以智能增效能,實(shí)現(xiàn)對(duì)各類違法犯罪活動(dòng)的精準(zhǔn)打擊。本文結(jié)合已有的建設(shè)經(jīng)驗(yàn)、相關(guān)技術(shù)的研究理解和實(shí)戰(zhàn)實(shí)證,對(duì)車輛視頻圖像信息庫進(jìn)行介紹。
按照公安云計(jì)算的分層體系并結(jié)合公安信息化建設(shè)需求,東莞車輛視頻圖像信息庫的整體架構(gòu)如圖1所示。
車輛信息庫基于大數(shù)據(jù)架構(gòu)設(shè)計(jì),遵循公安部和廣東省公安廳相關(guān)標(biāo)準(zhǔn),以海量涉車數(shù)據(jù)的匯聚、融合、共享和分析挖掘能力開發(fā)為目標(biāo),支撐各警種車輛業(yè)務(wù)應(yīng)用,并支持各警種基于平臺(tái)服務(wù)接口開發(fā)二次應(yīng)用。在邏輯上,車輛信息庫可分為資源采集層、基礎(chǔ)設(shè)施層、數(shù)據(jù)服務(wù)層、平臺(tái)應(yīng)用層。
外部系統(tǒng)以多種形式記錄各種海量且異構(gòu)多源數(shù)據(jù),如何方便快捷地從多途徑實(shí)時(shí)獲取、處理這些外部數(shù)據(jù),并實(shí)時(shí)保存到多種數(shù)據(jù)庫中,是車輛信息庫設(shè)計(jì)的重點(diǎn)和難點(diǎn)。車輛信息庫采用統(tǒng)一的數(shù)據(jù)采集匯聚和解析處理,對(duì)接入數(shù)據(jù)格式統(tǒng)一維護(hù)和管理。資源采集層具體由級(jí)聯(lián)網(wǎng)關(guān)和匯聚接入網(wǎng)關(guān)組成,采用分布式消息總線Kafka實(shí)現(xiàn)結(jié)構(gòu)化數(shù)據(jù)和部分半結(jié)構(gòu)化數(shù)據(jù)的采集和接入,針對(duì)直接從前端各類抓拍攝像機(jī)采集圖片則采用基于C++開發(fā)的采集網(wǎng)關(guān)實(shí)現(xiàn)。所有數(shù)據(jù)采集網(wǎng)關(guān)和級(jí)聯(lián)網(wǎng)關(guān)均通過Zookeeper統(tǒng)一配置和管理,并周期性向Zookeeper上報(bào)自身服務(wù)狀態(tài)和業(yè)務(wù)數(shù)據(jù)狀態(tài)。其特點(diǎn)在于可以提供高可用、高可靠、分布式的海量數(shù)據(jù)采集、聚合和傳輸。目前,東莞市公安車輛信息庫匯聚了遍布東莞全市的5000多路治安卡口和電子警察數(shù)據(jù)、1000多個(gè)社會(huì)停車場數(shù)據(jù)、全市高速公路高清卡口等10多類車輛抓拍數(shù)據(jù),總數(shù)據(jù)量已經(jīng)超過十幾億。豐富的數(shù)據(jù)為下一步車輛大數(shù)據(jù)分析挖掘提供了必要的素材。
提供車輛視圖庫數(shù)據(jù)存儲(chǔ)、計(jì)算和系統(tǒng)運(yùn)行所需的基礎(chǔ)資源,包括可支持異構(gòu)資源的云計(jì)算資源、云存儲(chǔ)資源池和云網(wǎng)絡(luò)資源池,并通過云計(jì)算資源管理平臺(tái)實(shí)現(xiàn)統(tǒng)一的資源調(diào)度。
部署云計(jì)算服務(wù)和大數(shù)據(jù)存儲(chǔ)所需的支撐框架中間件,包括支撐大數(shù)據(jù)計(jì)算所需的Hadoop、HBase、MPP、Spark、ElasticSearch、HDFS、Redis等基礎(chǔ)支撐框架,提供海量結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的存儲(chǔ)和分析、挖掘等處理能力。在支撐框架中間件上部署車輛視圖庫,包括基礎(chǔ)資源庫、專題資源庫和元數(shù)據(jù)庫?;A(chǔ)資源庫包括視頻圖像數(shù)據(jù)、軌跡數(shù)據(jù)、特征數(shù)據(jù)、關(guān)系數(shù)據(jù)和檔案數(shù)據(jù);專題庫包括關(guān)注車輛專題庫、案件車輛專題庫、盜搶車輛專題庫和套牌車輛專題庫等;元數(shù)據(jù)庫主要規(guī)范、統(tǒng)一定義平臺(tái)中所有數(shù)據(jù)表的數(shù)據(jù)項(xiàng)的名稱、類型、長度、遵循規(guī)范等。
是車輛視圖庫的核心能力層。車輛二次識(shí)別服務(wù)面向各警種提供車輛車牌號(hào)碼識(shí)別、品牌型號(hào)識(shí)別和個(gè)體特征識(shí)別;車輛大數(shù)據(jù)服務(wù)面向各警種提供大數(shù)據(jù)檢索、處理、分析、挖掘服務(wù)。
多源異構(gòu)是大數(shù)據(jù)的特點(diǎn)之一,因此東莞車輛信息庫需要滿足安全、穩(wěn)定地接入治安卡口、電子警察、社會(huì)停車場、隨手拍和高速公路等多源數(shù)據(jù)的要求。車輛信息庫在整體規(guī)劃階段對(duì)不同來源的數(shù)據(jù)按照元數(shù)據(jù)定義進(jìn)行標(biāo)準(zhǔn)化管理,形成標(biāo)準(zhǔn)數(shù)據(jù)資源。系統(tǒng)在元數(shù)據(jù)管理模塊中對(duì)數(shù)據(jù)內(nèi)容、使用范圍、使用方式、質(zhì)量、更新方式、更新周期、數(shù)據(jù)來源、存儲(chǔ)位置、數(shù)據(jù)格式等內(nèi)容進(jìn)行統(tǒng)一管理,并按照配置規(guī)則對(duì)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化處理,如數(shù)據(jù)有效性判斷、去重、垃圾過濾、格式清洗等。因此東莞公安車輛信息庫僅僅通過少量開發(fā)和配置就可以接入新的數(shù)據(jù)源,支持包括數(shù)據(jù)庫(MySQL和Oracle)、Http服務(wù)接口和Kafka消息隊(duì)列三種方式的數(shù)據(jù)接入,可接入的標(biāo)準(zhǔn)數(shù)據(jù)信息包括車輛抓拍信息、車輛告警信息、車輛結(jié)構(gòu)化信息和終端GPS感知信息。
以O(shè)racle為代表的傳統(tǒng)關(guān)系型數(shù)據(jù)庫在處理海量結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)時(shí)難以勝任,因此車輛信息庫需要使用分布式文件存儲(chǔ)系統(tǒng)和分布式數(shù)據(jù)庫技術(shù)。東莞市公安車輛信息庫采用基于Hadoop的HDFS分布式文件系統(tǒng)存儲(chǔ)業(yè)務(wù)類結(jié)構(gòu)化數(shù)據(jù),采用分布式數(shù)據(jù)庫HBase存儲(chǔ)車輛結(jié)構(gòu)化信息和半結(jié)構(gòu)化信息,采用圖形數(shù)據(jù)庫存儲(chǔ)“車-車”等關(guān)系類數(shù)據(jù),采用關(guān)系型數(shù)據(jù)庫存儲(chǔ)車輛檔案和案事件信息。
數(shù)據(jù)處理主要體現(xiàn)為大數(shù)據(jù)實(shí)時(shí)分析挖掘服務(wù)和大數(shù)據(jù)離線分析挖掘服務(wù)。東莞市公安車輛信息庫的大數(shù)據(jù)實(shí)時(shí)分析挖掘服務(wù)使用Storm流式分布式計(jì)算框架,車輛結(jié)構(gòu)化數(shù)據(jù)和業(yè)務(wù)數(shù)據(jù)進(jìn)入Kafka分布式消息系統(tǒng)進(jìn)行數(shù)據(jù)緩存,Storm逐一對(duì)每條實(shí)時(shí)數(shù)據(jù)進(jìn)行分析,分析后的數(shù)據(jù)存入分布式數(shù)據(jù)庫等多種存儲(chǔ)容器中,同時(shí)將有價(jià)值的信息和車輛布控告警信息通過消息隊(duì)列實(shí)時(shí)推送給相關(guān)業(yè)務(wù)部分。東莞市公安車輛信息庫的大數(shù)據(jù)離線分析挖掘服務(wù)使用Spark分布式并行計(jì)算框架,系統(tǒng)周期性對(duì)海量存儲(chǔ)數(shù)據(jù)按照相關(guān)業(yè)務(wù)模型進(jìn)行分析挖掘,一旦發(fā)現(xiàn)有價(jià)值的信息,將根據(jù)具體策略推送給相關(guān)業(yè)務(wù)部門,比如全市車流量、汽車品牌分布、外地車占比等數(shù)據(jù)分析類。
公安知識(shí)圖譜運(yùn)用多源數(shù)據(jù)混合存儲(chǔ)、關(guān)聯(lián)算法、語義推理等技術(shù),基于實(shí)體的屬性關(guān)系、時(shí)空聯(lián)系、語義聯(lián)系、特征聯(lián)系等關(guān)系,即可構(gòu)建一張具有公安特性的多維多層的實(shí)體與實(shí)體、實(shí)體與事件的關(guān)系網(wǎng)絡(luò),實(shí)現(xiàn)公安多年積累的實(shí)戰(zhàn)經(jīng)驗(yàn)與技術(shù)算法的相互轉(zhuǎn)換。東莞公安車輛信息庫通過匯總車輛基本信息、車主信息、租賃信息、違法記錄、事故記錄、盜搶記錄和車輛軌跡等車輛相關(guān)信息,構(gòu)建“一車一檔”車輛檔案信息。系統(tǒng)使用預(yù)置的規(guī)則算法,通過大數(shù)據(jù)流式計(jì)算、定時(shí)離線批量計(jì)算等方式,挖掘海量車輛數(shù)據(jù)中隱藏的規(guī)律和關(guān)系,智能歸納車輛的行為習(xí)慣和相互的關(guān)聯(lián)關(guān)系,比如車輛出行規(guī)律等,形成車輛畫像,并實(shí)現(xiàn)智能研判結(jié)果標(biāo)簽化,將公安涉車業(yè)務(wù)多年的實(shí)戰(zhàn)經(jīng)驗(yàn)系統(tǒng)化、智能化。
傳統(tǒng)的卡口設(shè)備車輛一次識(shí)別僅能識(shí)別車牌號(hào)碼和大致的車輛類型,遠(yuǎn)遠(yuǎn)不能滿足公安機(jī)關(guān)車輛管理的實(shí)戰(zhàn)化需求。隨著人工智能技術(shù)的飛速發(fā)展,基于深度學(xué)習(xí)的車輛二次識(shí)別技術(shù)將車輛管控由單純的車牌或車標(biāo)擴(kuò)展到整個(gè)車臉,車輛的車燈、格柵、車窗、年檢標(biāo)識(shí)、裝飾品等均是車輛的重要特征。通過這些特征的引入,實(shí)現(xiàn)對(duì)卡口、電警視頻圖像的結(jié)構(gòu)化實(shí)時(shí)智能分析,包括識(shí)別車輛品牌(如大眾)、型號(hào)(如帕薩特)、年款(如2013款)、顏色、類別(轎車、商務(wù)車、越野車、皮卡車、大型貨車、小型貨車、大型客車、小型客車、三輪車、摩托車等)、異常特征(如遮擋面部、遮擋號(hào)牌)、唯一性局部特征(如年檢標(biāo)車、紙巾盒、遮陽板、天窗、貨架、掛件、危險(xiǎn)品車、出租車)等關(guān)鍵信息。在車型識(shí)別的基礎(chǔ)上,即使目標(biāo)車輛中途更換、篡改、遮擋、拆卸車牌,或使用假牌、套牌,系統(tǒng)也能夠基于車輛局部特征唯一性進(jìn)行分析、識(shí)別、提取,在短時(shí)間內(nèi)鎖定目標(biāo)車輛,將傳統(tǒng)的“以牌找車”升級(jí)為“以車找車”模式,解決了使用無牌、遮擋號(hào)牌、污損號(hào)牌、假牌、套牌等現(xiàn)階段廣泛存在于涉車案事件的問題,為車輛深度分析、智能檢索、大數(shù)據(jù)分析研判、以圖搜車等應(yīng)用提供結(jié)構(gòu)化多維數(shù)據(jù)基礎(chǔ)。東莞車輛信息庫二次識(shí)別子系統(tǒng)符合GA/T 1399-2017《公安視頻圖像分析系統(tǒng)》要求,具備每天6000萬過車數(shù)據(jù)的二次識(shí)別分析能力。
東莞公安車輛信息庫自2018年底啟動(dòng)建設(shè)以來,已經(jīng)接入全市主要治安卡口、電警、社會(huì)停車場、高速公路等數(shù)據(jù)資源,日均匯聚超過3000萬條過車數(shù)據(jù),協(xié)助破獲涉車案事件百余起,在涉車案事件偵查等方面起到了重要作用。
2019年10月21日9時(shí)許,東莞市企石分局接事主報(bào)稱被三名男子以掉錢分錢的方式詐騙了一臺(tái)手機(jī),案發(fā)后嫌疑人駕駛一輛車牌為粵LU***3的黑色大眾朗逸轎車逃離現(xiàn)場。同期相似案件發(fā)生多起,經(jīng)排查黑色大眾轎車為套牌車,東莞公安依托車輛信息庫的以圖搜車功能,研判出此黑色大眾轎車分別懸掛車牌粵LU***3、粵LW***5在東莞活動(dòng),均為套牌。同時(shí)通過車輛號(hào)牌查詢,一輛白色大眾寶來轎車也懸掛粵LU***3車牌在東莞活動(dòng),通過駕駛員面部信息初步判斷兩輛車為同一伙嫌疑人駕駛,將多起案件進(jìn)行串并案處理。東莞公安根據(jù)大數(shù)據(jù)挖掘出的黑色大眾朗逸和白色大眾寶來轎車出行規(guī)律,提前布控,將三名犯罪嫌疑人抓獲。
近年來,東莞市公安局按照公安部和廣東省公安廳智慧新警務(wù)改革的部署,安全保障水平顯著提高。公安信息化建設(shè)是一個(gè)隨著技術(shù)進(jìn)步、業(yè)務(wù)優(yōu)化,不斷發(fā)展的長期的、漸進(jìn)的工程,東莞市公安局將繼續(xù)全力推進(jìn)科技信息化建設(shè)和應(yīng)用,提升一線民警在實(shí)戰(zhàn)過程中的獲得感,提升公安工作效能,筑牢東莞市公共安全“科技護(hù)城墻”。