摘 ?要:2016年以來,人工智能得到長足的發(fā)展,國家也開始大力發(fā)展人工智能產(chǎn)業(yè)。人工智能算法日趨成熟并進入商用階段,智能硬件具備更高的算力足以支撐千億人臉大庫。與此同時,公安擁有海量的數(shù)據(jù)可供應(yīng)用開發(fā)。面對日趨復(fù)雜的公共安全治安形勢,對如何利用新興人工智能技術(shù)支撐實戰(zhàn)應(yīng)用提出了更高的要求,只有不斷對其探索和研究才能建立更主動、更智慧的平安城市立體化安全防御體系。
關(guān)鍵詞:人工智能;視頻監(jiān)控;人臉識別;算法;計算機視覺
中圖分類號:TP18;TN948.6 ? ? ?文獻標(biāo)識碼:A 文章編號:2096-4706(2019)13-0091-03
Application Research of Artificial Intelligence in the Field of
Public Security Video Surveillance
YU Dayong
(PCI-Suntek Technology Co.,Ltd.,Guangzhou ?510653,China)
Abstract:Since 2016,artificial intelligence has been greatly developed,and the country has begun to vigorously develop the artificial intelligence industry. The algorithm is maturing and entering the commercial stage,and the hardware has a higher computing power to support the 100 billion face database. At the same time,the public security has a huge amount of data for application development. In the face of the increasingly complex public security situation,how to use the new artificial intelligence technology to support practical applications puts forward higher requirements,in order to establish a more active and smarter three-dimensional security defense system for safe cities.
Keywords:artificial intelligence;video surveillance;face recognition;algorithms;computer vision
0 ?引 ?言
根據(jù)中國安全防范產(chǎn)品行業(yè)協(xié)會統(tǒng)計的數(shù)據(jù),至2017年底,全國安裝視頻監(jiān)控的公共區(qū)域攝像機數(shù)量超過2800萬臺,覆蓋了城市的重點區(qū)域、重點場所、主干道路、重點建筑,也涉及公安、應(yīng)急、交通、城管多個行業(yè),構(gòu)筑了視頻監(jiān)控的“天網(wǎng)工程”。大量的視頻監(jiān)控攝像機產(chǎn)生了海量的視頻錄像數(shù)據(jù),這些錄像數(shù)據(jù)就像“沉睡”的金礦,傳統(tǒng)方式下,單純依靠人工監(jiān)視和錄像回放已無法滿足公安業(yè)務(wù)的實戰(zhàn)要求,如何讓計算機能夠直接讀懂視頻監(jiān)控畫面中的信息,就依賴于計算機視覺識別技術(shù),依賴于人工智能技術(shù)的發(fā)展,人臉識別、車牌識別、特征識別、視頻結(jié)構(gòu)化、ReID、結(jié)構(gòu)光、TOF等技術(shù)成為有效化解制約瓶頸的有效途徑。AI技術(shù)與視頻監(jiān)控技術(shù)的結(jié)合,是視頻監(jiān)控系統(tǒng)智能化應(yīng)用研究的重要方向。
1 ?AI在公安視頻監(jiān)控領(lǐng)域的應(yīng)用
目前成熟應(yīng)用于公安視頻監(jiān)控領(lǐng)域的AI技術(shù)主要包括車輛識別、人臉識別和ReID三種技術(shù),結(jié)構(gòu)光、TOF(飛行時間測距法)也在研究當(dāng)中。
第一,車輛識別技術(shù)。車輛識別包括車牌識別和車輛特征二次識別兩大技術(shù)。車牌識別多應(yīng)用在卡口、電子警察和停車場的出入口。以車牌識別數(shù)據(jù)為基礎(chǔ),并通過與車輛信息庫關(guān)聯(lián),開展相應(yīng)的業(yè)務(wù)應(yīng)用。車牌識別屬于OCR文字識別的范疇;車輛特征二次識別可以識別車牌之外的特征信息,包括:車輛類型、車輛品牌、車輛子品牌、車牌類型、車身顏色、安全帶、遮陽板、打手機、車輛特征(包含年檢標(biāo)志、紙巾盒、遮陽板、擺件、掛件、車身噴字)等特征信息數(shù)據(jù),對無牌照或遮擋牌照車輛也可進行車型識別,還可識別部分拍攝殘缺照片(車頭缺失不超過1/2),可以說大大挖掘了視頻和圖像的潛力,而且車標(biāo)、顏色、標(biāo)志物相對來說屬于分類識別,也比較容易實現(xiàn),于是市場上出現(xiàn)了多種車輛大數(shù)據(jù)平臺,也出現(xiàn)了各種車輛技戰(zhàn)法和應(yīng)用,這都是AI賦能的結(jié)果。
第二,人臉識別技術(shù)。人臉識別技術(shù)是基于人的臉部特征信息進行身份識別的一種生物識別技術(shù)。在公安領(lǐng)域的實戰(zhàn)應(yīng)用更注重動態(tài)人臉識別技術(shù),安裝人臉抓拍機(人臉抓拍攝像機適合安裝在寬度2.5-3.5米的單一通道),人臉識別算法和相應(yīng)技術(shù)多用于人員防控、人員管控和身份認證。把視頻抓拍的照片送至人臉識別系統(tǒng)進行比對,記錄比對結(jié)果,對發(fā)現(xiàn)的高危人員和重點人員進行標(biāo)注后,產(chǎn)生實時告警并聯(lián)動相應(yīng)的業(yè)務(wù)流程。不同光照、角度下的人臉識別的效率和性能有所不同。
第三,ReID技術(shù)。ReID就是行人再識別(也叫跨鏡追蹤),全寫是Re-identification,從其字面意思可以理解出,就是對于監(jiān)控攝像機下的物體進行重新識別和辨認。如對人物的識別,能夠辨認出人的服裝穿著、體態(tài)和人體其他代表性特征。它可以通過跨攝像機鏡頭,來對行人進行識別、追蹤和檢索。用來作為對人臉識別技術(shù)的重要補充,對于無法捕捉到清晰人臉的行人,可以采用跨鏡頭持續(xù)進行跟蹤??珑R追蹤技術(shù)發(fā)揮空間大,有著很大的實用價值,在公安視頻監(jiān)控領(lǐng)域大有所為。
2 ?AI在近年來的突破
AI是2018年的熱點技術(shù),結(jié)合這一年以來AI的發(fā)展情況以及筆者對AI的理解,關(guān)于AI在公安領(lǐng)域的應(yīng)用研究如下。
2.1 ?自然語言處理(NLP)
自然語言處理(NLP)是指計算機擁有識別理解人類文本語言的能力,是計算機科學(xué)與人類語言學(xué)的交叉學(xué)科。自然語言是人與動物之間的最大區(qū)別,人類的思維建立在語言之上,所以自然語言處理也就代表了人工智能的最終目標(biāo)。機器若想實現(xiàn)真正的智能自然語言處理是必不可少的一環(huán)。[1]NLP在公安的最佳應(yīng)用是語音識別,通過聲音可以判定人的身份(聲紋),通過NLP獲取語音中的文字信息,為公安技偵應(yīng)用提供技術(shù)支撐,未來有望形成大面積落地應(yīng)用。
2.2 ?計算機視覺(CV)
計算機視覺(Computer Version,CV)是從圖像或者視頻中提出符號或者數(shù)值信息,分析計算該信息以進行目標(biāo)的識別、檢測和跟蹤等。更形象地說,計算機視覺就是讓計算機像人類一樣能看到圖像,并看懂理解圖像。到80、90年代,計算機視覺迅速發(fā)展,形成感知特征的新理論框架并逐漸應(yīng)用到工業(yè)環(huán)境中。到21世紀(jì),計算機視覺領(lǐng)域呈現(xiàn)許多新的趨勢,計算機視覺與計算機圖形學(xué)深度結(jié)合,基于計算機視覺的應(yīng)用也呈爆炸性增長,除了在手機、電腦上的應(yīng)用,計算機視覺技術(shù)在交通、安防、醫(yī)療、機器人上有各種各樣形態(tài)的應(yīng)用[2]。計算機視覺的四大基本任務(wù)包括:分類、定位、語義分割和實例分割,近期又引入3D結(jié)構(gòu)光和TOF技術(shù)做深度計算,以3D識別代替2D識別。CV技術(shù)在公安行業(yè)的典型應(yīng)用包括:人臉識別、車輛識別、行為識別和特征屬性識別。
2.3 ?工具和框架
2.3.1 ?TensorFlow
TensorFlow是谷歌開發(fā)的用于深度學(xué)習(xí)或人工神經(jīng)網(wǎng)絡(luò)的開源軟件庫。它由Google AI團隊內(nèi)的Google Brain團隊開發(fā),并于2015年11月9日在Apache 2.0開源許可下發(fā)布。TensorFlow使用數(shù)據(jù)流圖進行數(shù)值計算。它具有非常靈活的體系結(jié)構(gòu),可以輕松部署跨各種平臺(CPU,GPU,TPU)以及從臺式機到服務(wù)器群集到移動和邊緣設(shè)備的計算。
2.3.2 ?PyTorch
PyTorch,是2017年Facebook在GitHub上開源的深度學(xué)習(xí)框架,PyTorch發(fā)布的較晚,但是熱度強勁,PyTorch是一個設(shè)計極為先進的框架,遵循“Python優(yōu)先”的原則。PyTorch不是簡單的封裝Torch的接口,而是對Tensor之上的所有模塊進行改造,新增了最先進也是PyTorch最顯著的特點自動求導(dǎo),成為目前最流行的深度學(xué)習(xí)框架。
2.3.3 ?CNTK
微軟認知工具包(以前稱為CNTK)由微軟研究院開發(fā)。CNTK具高度的可定制性,因為它具有更快的訓(xùn)練時間和易于使用的體系結(jié)構(gòu)。無論是在只有CPU,單個GPU,多個GPU或具有多個GPU的多個機器上運行,它都擁有出色的性能。它允許你選擇自己的參數(shù)、算法和網(wǎng)絡(luò)。它是用Python和C++編寫的。雖然它在語音識別領(lǐng)域更受歡迎,但CNTK也可以用于文本、圖像和RNN訓(xùn)練(遞歸神經(jīng)網(wǎng)絡(luò):一種神經(jīng)網(wǎng)絡(luò))。
2.3.4 ?Theano
Theano是一個專為深度學(xué)習(xí)而設(shè)計的Python庫。它允許你定義、優(yōu)化和評估涉及高效率的多維數(shù)組的數(shù)學(xué)表達式。它可以使用GPU并執(zhí)行有效的符號區(qū)分。該工具具有與NumPy集成、動態(tài)C代碼生成和符號區(qū)分等功能。該工具支持Linux,Mac OS X和Windows等平臺。
2.3.5 ?Keras
Keras是一個用Python編寫的開放源碼庫,這種高水平的神經(jīng)網(wǎng)絡(luò)API旨在使用深度神經(jīng)網(wǎng)絡(luò)進行快速實驗。它側(cè)重于用戶友好、模塊化和可擴展性。該工具針對CPU和GPU進行了優(yōu)化。
2.4 ?強化學(xué)習(xí)
強化學(xué)習(xí)是人工智能中策略學(xué)習(xí)的一種,是一種重要的機器學(xué)習(xí)方法,在智能控制機器人及分析預(yù)測等領(lǐng)域有許多應(yīng)用。又稱再勵學(xué)習(xí)、評價學(xué)習(xí),是從動物學(xué)習(xí)、參數(shù)擾動自適應(yīng)控制等理論發(fā)展而來的。常用的強化學(xué)習(xí)算法包括TD(Temporal Difference)算法、Q-learning算法、Sarsa算法等。
3 ?算法和硬件
3.1 ?AI算法
在機器學(xué)習(xí)領(lǐng)域,有幾種主要的學(xué)習(xí)方式,即監(jiān)督式學(xué)習(xí)、非監(jiān)督式學(xué)習(xí)、半監(jiān)督式學(xué)習(xí)。有了算法,有了被訓(xùn)練的數(shù)據(jù)(清洗過的數(shù)據(jù)),經(jīng)過多次訓(xùn)練(算力)后,經(jīng)過模型評估和算法人員調(diào)試后,會獲得訓(xùn)練模型。當(dāng)新的數(shù)據(jù)輸入后,那么訓(xùn)練模型就會給出結(jié)果。業(yè)務(wù)要求的最基礎(chǔ)的功能就算實現(xiàn)了。
3.2 ?AI芯片
目前,主流的AI芯片基本以GPU、FPGA、ASIC以及類腦芯片為主,它們各自發(fā)揮優(yōu)勢,多種類型的芯片組合應(yīng)用,呈現(xiàn)多技術(shù)路徑并行發(fā)展態(tài)勢。深度學(xué)習(xí)引領(lǐng)了本輪AI發(fā)展熱潮。隨著深度學(xué)習(xí)模型算法對大規(guī)模并行計算能力的需求不斷激增,GPU、FPGA等通用芯片存在性能、功耗等方面的瓶頸,無法滿足AI巨大的算力需求。ASIC等專用芯片應(yīng)運而生,滿足不同應(yīng)用、不同算法和不同終端的需求。但目前AI算法仍處于快速演進階段,還不存在適應(yīng)所有應(yīng)用的通用AI算法,AI芯片也就沒有確定的架構(gòu)。這使得定制化的ASIC專用芯片開發(fā)周期長,迭代進化快,資金和技術(shù)風(fēng)險都很高。因此,AI芯片技術(shù)還存在著巨大的探索空間和創(chuàng)新空間,尤其是在算法基礎(chǔ)理論研究和芯片設(shè)計架構(gòu)創(chuàng)新方面[3]。
4 ?結(jié) ?論
人工智能的應(yīng)用研究迎來了轉(zhuǎn)折點,國家大力發(fā)展人工智能產(chǎn)業(yè),在人工智能領(lǐng)域我國擁有海量的可被計算、訓(xùn)練和挖掘的數(shù)據(jù),尤其是在更高的計算能力、深度學(xué)習(xí)模型的建立等因素的推動下,使得人工智能算法應(yīng)用領(lǐng)域取得了重大突破。人工智能未來發(fā)展的前景廣闊,充分利用深度學(xué)習(xí)技術(shù)挖掘可用數(shù)據(jù)潛力、改善決策的過程,產(chǎn)生更高階的智能,從而獲得更便捷的服務(wù),全方面改善我們的生活,不斷提高我們對世界的認知。
面對日趨復(fù)雜的公共安全形勢,對于新興人工智能的實戰(zhàn)支撐能力提出了更高的要求,單單針對單一維度、單一類型的大數(shù)據(jù)挖掘分析無法滿足公共安全領(lǐng)域業(yè)務(wù)發(fā)展的需要。只有立足實戰(zhàn),多種資源關(guān)聯(lián)疊加,構(gòu)建了資源服務(wù)體系和應(yīng)用體系,實現(xiàn)多維感知數(shù)據(jù)的匯聚、解析和存儲之后,才能實現(xiàn)AI、視頻大數(shù)據(jù)、公安業(yè)務(wù)的融合和應(yīng)用。
參考文獻:
[1] 崔雍浩,商聰,陳鍶奇,郝建業(yè).人工智能綜述:AI的發(fā)展 [J].無線電通信技術(shù),2019,45(3):225-231.
[2] 倪晨旭.計算機視覺研究綜述 [J].電子世界,2018(1):91+93.
[3] 李麗婷.人工智能芯片技術(shù)進展及產(chǎn)業(yè)發(fā)展研究報告 [J].廈門科技,2019(1):1-9.
作者簡介:于大勇(1982.12-),男,漢族,黑龍江肇東人,總經(jīng)理助理,本科,研究方向:AI算法在安防領(lǐng)域的賦能以及業(yè)務(wù)應(yīng)用支撐。