鄭東生 連珂
(河北省公安廳,河北石家莊050081)
【警務(wù)研究】
影響視頻資源應(yīng)用效能的技術(shù)原因和未來研究方向
鄭東生 連珂
(河北省公安廳,河北石家莊050081)
近年來,視頻監(jiān)控和分析技術(shù)在公安工作中得到了快速發(fā)展。視頻偵查已成為發(fā)展最為迅猛的公安基礎(chǔ)偵查手段。本文通過分析視頻監(jiān)控的技術(shù)和應(yīng)用現(xiàn)狀,指出當(dāng)前的核心問題是視頻應(yīng)用效能過低,并且找出影響視頻應(yīng)用效能的主要問題是技術(shù)原因:缺乏智能化的專業(yè)視頻分析工具、缺乏海量視頻管理和共享平臺以及缺乏整合視頻資源的綜合偵查系統(tǒng)。文章提出了提高視頻資源應(yīng)用效能的關(guān)鍵技術(shù)點:提高視頻分析的時效性、加強視頻偵查的關(guān)聯(lián)性以及規(guī)范視頻圖像的管理。本文還通過分析國外先進(jìn)的視頻分析系統(tǒng)研發(fā)現(xiàn)狀,提出了當(dāng)前國內(nèi)智能視頻分析技術(shù)的核心研究方向是視頻解析技術(shù),包括目標(biāo)整體的運動軌跡研究和目標(biāo)的局部“肢體語言”特征研究。
視頻監(jiān)控;智能應(yīng)用;應(yīng)用效能;視頻解析
我國的公安視頻監(jiān)控近幾年發(fā)展迅速,全國攝像頭總數(shù)超過1000萬個,公安機關(guān)直接控制在200萬以上,主要城市的第一期視頻監(jiān)控系統(tǒng)已經(jīng)完成,一個由專管區(qū)域視頻監(jiān)控點、智能卡口和社會化監(jiān)控點組成的視頻監(jiān)控網(wǎng)已經(jīng)覆蓋了大部分的城市和主要集鎮(zhèn),廣泛部署的視頻監(jiān)控設(shè)備和不斷提升的視頻技術(shù)為公安工作提供了強有力的科技支撐。視頻監(jiān)控系統(tǒng)的發(fā)展正在進(jìn)入后網(wǎng)絡(luò)化時代,高清、智能的監(jiān)控和應(yīng)用在經(jīng)歷了多年的技術(shù)積累之后,逐漸走向成熟;基于實戰(zhàn)的視頻綜合性應(yīng)用需求以及個性化應(yīng)用需求正在不斷地增強。但是隨著視頻監(jiān)控系統(tǒng)的廣泛應(yīng)用,視頻資源增長迅速,海量視頻資源的低應(yīng)用效能正在成為嚴(yán)重制約視頻警務(wù)工作的瓶頸問題。
目前公安機關(guān)應(yīng)用視頻資料時主要以人工為主輔以簡單的視頻分析技術(shù),通常一個簡單事件需要查看的視頻資料時長往往達(dá)到幾小時到十幾小時,而一些復(fù)雜事件所涉及的視頻可能會關(guān)聯(lián)到多個區(qū)域內(nèi)的幾個甚至成千上萬路攝像頭的采集,總時達(dá)到百萬小時并不十分罕見,例如,重慶哨兵案件和南京“1·6”案件中,都動用超過3000以上的警力分析研判超過100萬小時的視頻數(shù)據(jù)。在某市一起重大案件中,共安排一百余人在兩個星期時間內(nèi)查看總量達(dá)300T(1T的硬盤300個)監(jiān)控視頻,以尋找一切可能的線索和蹤跡,但最后僅僅發(fā)現(xiàn)了2處有效線索。由此可見,這種應(yīng)用方式存在著視頻查找難、采集難、傳輸慢、解碼難、分析難等問題。
綜合分析,影響視頻資源應(yīng)用效能的原因既有技術(shù)方面的,也有機制和管理方面的原因,但筆者認(rèn)為目前主要還是技術(shù)方面的原因。
(一)缺乏一套智能化程度高,滿足公安工作需求的專業(yè)視頻分析工具
目前公安機關(guān)使用的視頻分析技術(shù)是在民用安防基礎(chǔ)上稍加改造形成的,是為了適應(yīng)公安視頻監(jiān)控建設(shè)高速發(fā)展的應(yīng)急之作,針對公安工作特點開發(fā)的功能非常的少,完全不能適應(yīng)公安實戰(zhàn)的復(fù)雜要求。
一是現(xiàn)在的視頻分析技術(shù)從海量監(jiān)控視頻圖像資源中提取有用信息的技術(shù)不成熟,導(dǎo)致大量的案件偵破工作依然利用人工的方式,大量的警力用來觀看案發(fā)所相關(guān)的視頻資料,存在“視頻有,不可靠”的問題。
二是現(xiàn)在的技術(shù)手段僅僅實現(xiàn)了淺層的智能化分析能力(如違章自動檢測,車牌號自動識別,交通事件監(jiān)測),但是對于處理諸如“跨多攝像頭中的多個不連續(xù)圖像來確定是否是同一個觀測目標(biāo);將不同時間、不同地點發(fā)生的案件,通過視頻快速高效地進(jìn)行關(guān)聯(lián)”等具有公安特點的實際需求,還沒有實現(xiàn)智能化,幾乎還是依賴人工瀏覽和人為標(biāo)記對視頻圖像內(nèi)容進(jìn)行描述分析。
三是沒有一種方法能實現(xiàn)對海量視頻圖像資源進(jìn)行高效精準(zhǔn)的檢索。一旦發(fā)生案情,需要檢索相關(guān)的視頻圖像資料時,公安機關(guān)只能夠通過集中警力,施展人海戰(zhàn)術(shù)調(diào)閱成百上千GB的視頻圖像,一段段仔細(xì)排查。即使應(yīng)用視頻濃縮與摘要等技術(shù)可以在一定程度上減少工作量,但仍遠(yuǎn)遠(yuǎn)不能夠滿足視頻偵查的實際應(yīng)用需求。
(二)缺乏一個海量視頻資源組織管理與集中共享平臺
公安業(yè)務(wù)涉及面廣泛,但是面向不同警種獲取的有價值的監(jiān)控視頻圖像資源還沒實現(xiàn)統(tǒng)籌管理、沒有一個集中存儲和檢索的平臺,與其他業(yè)務(wù)平臺的資源整合、共享還沒開展。視頻監(jiān)控系統(tǒng)采集的信息具有海量特性,其中包含了許多潛在的違法犯罪信息,以及已發(fā)案件的相關(guān)信息,但由于海量視頻資源缺乏有效的管理與組織,資源分散、不集中,尋找相應(yīng)視頻資源困難,給資源共享造成了極大的難度。這些有用的資源只有得到充分的利用,才能提高視頻偵查的有效性與準(zhǔn)確性,否則就屬于無效信息。
(三)缺乏一個整合視頻資源的綜合偵查系統(tǒng)
雖然視頻監(jiān)控資源的數(shù)量不斷增長,但是仍然存在資源整合不足,無法發(fā)現(xiàn)深層次、關(guān)聯(lián)性的線索。目前,亟需開發(fā)一套綜合性的偵查系統(tǒng),有效結(jié)合其他偵查資源和技術(shù),對公安業(yè)務(wù)數(shù)據(jù)和隱含的情報線索關(guān)聯(lián)進(jìn)行可視化展現(xiàn),形成基于圖形的情報線索鏈、證據(jù)鏈,展現(xiàn)不同情報主題間甚至主題的內(nèi)部數(shù)據(jù)之間存在復(fù)雜的關(guān)聯(lián)關(guān)系等,幫助情報使用者從雜亂、海量的數(shù)據(jù)中及時發(fā)現(xiàn)苗頭、線索、關(guān)聯(lián)、規(guī)律和趨勢。
由于現(xiàn)實的需求,國內(nèi)各個專業(yè)廠家正在加緊研制適應(yīng)公安工作特點,滿足公安工作需要的專業(yè)視頻分析工具,筆者認(rèn)為在研發(fā)過程中,應(yīng)該抓住以下幾個關(guān)鍵點:
(一)提高視頻圖像分析內(nèi)容的時效性
案件發(fā)生具有時間、空間的不確定性,但需要在案發(fā)第一時間在最短時間內(nèi)對跨時間和區(qū)域的海量視頻進(jìn)行處理,這就需要對視頻分析設(shè)備分析處理能力、設(shè)備的部署方式進(jìn)行研究,能夠在最短的時間內(nèi)利用視頻圖像提供線索。
(二)加強視頻偵查的關(guān)聯(lián)性
一方面視頻資源和視頻資源之間具有關(guān)聯(lián)性。視頻監(jiān)控得到的線索不是靜態(tài)的,可以通過不同時間、不同地點發(fā)生的事件串聯(lián)在一起,從而分析事態(tài)發(fā)展情況。不同區(qū)域、不同攝像頭、不同視頻資源載體之間的視頻往往具有關(guān)聯(lián)性,這些關(guān)聯(lián)性便于案件的關(guān)聯(lián)分析與比對,以及提供大案要案的數(shù)據(jù)挖掘載體。另一方面視頻資源和其他數(shù)據(jù)信息具有關(guān)聯(lián)性。因此,視頻偵查需要一個統(tǒng)一、共享、跨平臺的視頻解析中心提供視頻資源共享、整合、管理的服務(wù)。因此,公安機關(guān)各個警種部門應(yīng)當(dāng)建設(shè)一個統(tǒng)一管理、充分共享視頻管理和共享平臺,滿足偵查員快速便捷檢索、分析視頻資源的需求。
(三)規(guī)范視頻圖像的管理
重要視頻資源在案件偵破之后依然需要保留,構(gòu)成相應(yīng)的案例庫與知識庫。構(gòu)建的案例庫與知識庫可以提高準(zhǔn)確性,降低虛警率。統(tǒng)一的案事件樣本庫和警務(wù)知識庫,需要進(jìn)行大量的樣本學(xué)習(xí)和訓(xùn)練,廣泛的案事件視頻信息的積累。在時間軸上,視頻信息的積累需要以案件為基礎(chǔ),將不同時間段的視頻信息按照案件為核心進(jìn)行聚集。
自美國“9·11”事件,英國倫敦地鐵爆炸案等重大恐怖襲擊事件發(fā)生以來,智能視頻監(jiān)控系統(tǒng)的建設(shè)成為了國際上重點工程建設(shè)項目。
美國政府向國內(nèi)重點實驗室、大學(xué)以及相關(guān)的著名研究機構(gòu)投入大量資金,進(jìn)行視頻分析系統(tǒng)的構(gòu)建,預(yù)防恐怖組織的襲擊,提高國家安全指數(shù)。其中,美國國土安全部委托美國太平洋國家實驗室構(gòu)建國家圖像和分析中心,用于提供全球化的視覺分析技術(shù)和工具,滿足國家戰(zhàn)略級視覺分析的研發(fā)與創(chuàng)新,主要用于反恐任務(wù)的需要,從2004年起已經(jīng)連續(xù)支撐10年以上,每年固定支持的經(jīng)費在250萬美元。目前已研究出了為未來城市和戰(zhàn)場監(jiān)控應(yīng)用開發(fā)一種自動視頻理解技術(shù),用于實現(xiàn)未來戰(zhàn)爭中人力監(jiān)控費用昂貴、非常危險或者人力無法實現(xiàn)等場合下的監(jiān)控并進(jìn)行實時的分析,對監(jiān)控地區(qū)進(jìn)行全方位的晝夜監(jiān)控,根據(jù)運動對象行為的危害性進(jìn)行自動提示和報警,而且通過建立外觀模型來實現(xiàn)多人的跟蹤,并可以檢測人是否攜帶物體等簡單行為,達(dá)到視頻監(jiān)控系統(tǒng)自動分析異常現(xiàn)象的能力,即是所謂的智能視頻分析系統(tǒng)。
美國國土安全部出資2.17億美元,在芝加哥警察局實行一虛盾行動,建立一個集中監(jiān)控系統(tǒng),連接3000部監(jiān)控攝像機,監(jiān)控范圍覆蓋1萬私有場所和1萬公共場所。監(jiān)控中心擁有強大的視頻解析能力,可以實時捕捉和處理網(wǎng)絡(luò)中的任何視頻,包括嫌疑人搜尋、危險行為檢測和目標(biāo)鎖定。通過大規(guī)模攝像頭和犯罪數(shù)據(jù)庫對犯罪行為進(jìn)行監(jiān)測。
烏拉圭政府基于烏拉圭公共安全的需求,建設(shè)了一個高科技的國家公共安全系統(tǒng),包含一個監(jiān)控中心,服務(wù)于公共場所監(jiān)視,移民管理,監(jiān)所管理等,這種綜合性的系統(tǒng)增強了烏拉圭國家安全級別并且提供快速反應(yīng)以及處理各種緊急情況。
加拿大國家自然科學(xué)基金從2000年起就連續(xù)支持視頻分析平臺與測試中心,目前已經(jīng)連續(xù)支持11年。主要用于視頻數(shù)據(jù)的計算分析,并從視頻中智能的獲取信息。
智能視頻分析技術(shù)源于計算機視覺技術(shù),作為人工智能研究的一個分支,綜合了多學(xué)科的研究成果,主要包括圖像處理、跟蹤技術(shù)、模式識別、軟件工程,數(shù)字信號處理(DSP)等領(lǐng)域。目前市場上的智能視頻分析系統(tǒng)通常都具有以下功能:圖像采集、運動物體檢測、多物體跟蹤、行為特征分析、設(shè)定報警條件、報警聯(lián)動。筆者認(rèn)為在智能視頻分析技術(shù)研究中,視頻解析技術(shù)應(yīng)該作為核心研究方向。
視頻解析技術(shù)指的是使用計算機從視頻中通過運算和分析,提取視頻中的有用信息的一項技術(shù),也就是對視頻的“內(nèi)容”的提取和理解。如果把攝像機看作人的眼睛,而智能視頻系統(tǒng)或設(shè)備則可以看作人的大腦。它是以視頻監(jiān)控與識別技術(shù)、電子信息顯示技術(shù)、計算機技術(shù)及其他信息捕捉技術(shù)和數(shù)據(jù)庫技術(shù)為依托,通過視頻理解的方法把視頻內(nèi)容表達(dá)為語義化的描述信息,通過關(guān)聯(lián)、分析、比對和碰撞,從中獲取偵查線索和犯罪證據(jù),查獲犯罪嫌疑人,實現(xiàn)預(yù)防、控制、揭露、證實犯罪目的的視頻分析方法。就好像人看到某一段視頻中“有一輛車”、“有一輛白色的車”、“有一輛白色的捷達(dá)車”、“有一輛白色的捷達(dá)車正在打著右轉(zhuǎn)向燈準(zhǔn)備向右轉(zhuǎn)”。對于人來說,這段視頻是有意義的,是包含了一定信息量的,并且人可以智能化地提取這些信息,獲取“有一輛白色的捷達(dá)車正在打著右轉(zhuǎn)向燈準(zhǔn)備向右轉(zhuǎn)”這一信息,而且這一信息包含了“車、白色、捷達(dá)、轉(zhuǎn)向燈、開燈、開右轉(zhuǎn)向燈、準(zhǔn)備右轉(zhuǎn)”這一系列的子信息。
當(dāng)前對于視頻解析技術(shù)的研究,一個研究方向是以目標(biāo)整體的運動軌跡作為研究目標(biāo),提取運動目標(biāo)的運動特征或其本身所具有的特性。這一研究目標(biāo)不一定是特指人,而是可以以任何運動物體作為研究對象,比如人、車輛、動物、飛機坦克等軍事目標(biāo)等等。而其行為指的也是研究對象的運動特征,例如該目標(biāo)是否朝特定的方向運動,是否以特定的軌跡運動,是否越過某一警戒線或者進(jìn)入某一警戒區(qū)域、是否排隊、是否產(chǎn)生了聚集或擁堵、是否有尾隨現(xiàn)象、是否有徘徊行為等等。這是一個重要的研究方向,其特點是將目標(biāo)物體作為一個整體來考察,提取其在大場景范圍內(nèi)的運動特征。
另一個研究方向則以目標(biāo)的局部部分的運動為研究目標(biāo),提取其局部“肢體語言”特征,如視頻的手語識別,步態(tài)識別,表情識別,或者判斷其是否在完成某種行為,如打電話,放下一個包,從某個地方取出或放下一件東西等等。此外,公共場所或文物古跡范圍是否有涂抹蹬踏行為,體育運動里的運動姿態(tài)或運動動作是否最佳,甚至于艦載火炮炮管的旋轉(zhuǎn)運動曲線的研究,所有這些都是屬于這一方向。這一研究方向通常針對的是小視野場景的近景視頻進(jìn)行研究,而且其研究對象只是屬于目標(biāo)物的局部部分,如分析人的手、腳、頭的動作,其最核心的實現(xiàn)步驟通常包括對研究對象的三維建模。
隨著視頻解析技術(shù)、云計算技術(shù)、海量數(shù)據(jù)分布式存儲技術(shù)的快速發(fā)展,將這些相關(guān)技術(shù)融合實現(xiàn)視頻解析系統(tǒng)的統(tǒng)一管理調(diào)度成為當(dāng)今視頻監(jiān)控系統(tǒng)的發(fā)展趨勢。為了使視頻監(jiān)控的“孤島”不再孤獨,使視頻監(jiān)控的被動“防范”變成主動的“防控”,也使應(yīng)用和管理融合更成為可能。融入智能分析技術(shù)使得監(jiān)控更具有針對性,由傳統(tǒng)的視頻監(jiān)控系統(tǒng)逐漸發(fā)展成為智能視頻分析系統(tǒng),使傳統(tǒng)的監(jiān)控系統(tǒng)中的攝像機不但成為人的眼睛,也使“智能視頻分析”成為人的“大腦”,將采集到的“異常圖像”早預(yù)警、早防范、早處理,避免傳統(tǒng)視頻監(jiān)控系統(tǒng)的被動性。
為此,公安部已組織行業(yè)專家開展了建設(shè)標(biāo)準(zhǔn)的編制工作,將有力地推進(jìn)和規(guī)范全國視頻解析系統(tǒng)的建設(shè),形成以視頻結(jié)構(gòu)化技術(shù)為核心的視頻圖像解析分析服務(wù)體系。為各個業(yè)務(wù)警種提供視頻調(diào)閱、分析、處理與應(yīng)用服務(wù)。通過基于視頻圖像資源的計算機的快速檢索、軌跡跟蹤、智能研判、預(yù)警布控、社會管理、隊伍管理等業(yè)務(wù)功能,將警力資源從調(diào)閱觀看視頻資源的簡單低效的勞動中解放出來,將警力資源充實到案件分析,從而大大提高視頻偵查的效率以緩解警力資源嚴(yán)重不足的現(xiàn)狀。
[編輯:李永新]
D918.2
:A
:1672-6405(2016)02-0061-03
鄭東生(1962-),男,河北保定人,河北省公安廳科技信息化處處長,主要從事信息化建設(shè)頂層設(shè)計研究。連珂(1962-),男,河北邯鄲人,博士,河北省公安廳科技信息化處正高級工程師,主要從事視頻監(jiān)控建設(shè)與應(yīng)用研究。
2016-03-22