□ 文/本刊記者 羅 超
圖像處理技術(shù)起源于20世紀(jì)20年代,當(dāng)時通過海底電纜從英國倫敦到美國紐約采用數(shù)字壓縮技術(shù)傳輸了第一幅數(shù)字照片。許多年過去,視頻圖像處理技術(shù)被安防行業(yè)大量應(yīng)用,技術(shù)更新日新月異。如果把圖像處理當(dāng)做一個細(xì)節(jié)的話,那么,細(xì)節(jié)將決定成敗,監(jiān)控行業(yè)亦如此。
隨著計算機(jī)軟件、硬件技術(shù)的日新月異的發(fā)展和普及,人類已經(jīng)進(jìn)入一個高速發(fā)展的信息化時代,人類大概有80%的信息來自圖像,科學(xué)研究、技術(shù)應(yīng)用中圖像處理技術(shù)越來越成為不可缺少的手段。安防行業(yè)已經(jīng)進(jìn)入一個嶄新的時代,高清、智能與大數(shù)據(jù)和云技術(shù)的廣泛結(jié)合應(yīng)用,成為時代新的話題。隨著而來的是,視頻圖像處理技術(shù)也逐漸成熟起來,只有這樣才能切合行業(yè)技術(shù)發(fā)展,為此,對于視頻圖像處理技術(shù)的研究成為安防行業(yè)值得重視的領(lǐng)域。
視頻圖像處理技術(shù)簡而言之就是用計算機(jī)對視頻數(shù)字圖像進(jìn)行處理,其本質(zhì)是一種信號處理過程,而且是離散信號處理。在視頻監(jiān)控行業(yè)為什么要進(jìn)行圖像處理呢?那我們就需要分析視頻圖像處理后所帶來的優(yōu)勢有哪些?
其一,提高圖像的視感質(zhì)量,如進(jìn)行圖像的亮度、彩色變換,增強(qiáng)、抑制某些成分,對圖像進(jìn)行幾何變換等,以改善視頻圖像的質(zhì)量。
其二,提取視頻圖像中所包含的某些特征或特殊信息,這些被提取的特征或信息往往為計算機(jī)分析圖像提供便利。提取特征或信息的過程是計算機(jī)或計算機(jī)視覺的預(yù)處理。提取的特征可以包括很多方面,如頻域特征、灰度或顏色特征、邊界特征、區(qū)域特征、紋理特征、形狀特征、拓?fù)涮卣骱完P(guān)系結(jié)構(gòu)等。
其三,視頻圖像增強(qiáng)與復(fù)原。圖像增強(qiáng)的目的是將圖像轉(zhuǎn)換為更適合人和機(jī)器的分析的形式。常用的增強(qiáng)方法有:灰度等級直方圖處理;干擾抵制;邊緣銳化;偽彩色處理。圖像復(fù)原的目的與圖像增強(qiáng)相同,其主要原則是為了消除或減少圖像獲取和傳輸過程中造成的圖像的損傷和退化,這包括圖像的模糊、圖像的干擾和噪聲等,盡可能的獲得原來的真實圖像。無論是圖像增強(qiáng)還是圖像的復(fù)原,都必須對整副圖像的所有像素進(jìn)行運算,出于圖像像素的大數(shù)量考慮,其運算也十分的巨大。編碼的目的是在不改變圖像的質(zhì)量基礎(chǔ)上壓縮圖像的信息量,以滿足傳輸與存儲的要求。編碼多采用數(shù)字編碼技術(shù)對圖像逐點的進(jìn)行加工。這一點在公安針對視頻圖像來還原細(xì)節(jié)中經(jīng)常遇到。
其四,圖像的分析。從圖像中抽取某些有用的度量、數(shù)據(jù)和信息,以的到某種數(shù)值結(jié)果。圖像分析用圖像分割方法抽取圖像的特征然后對圖像進(jìn)行符號化的描述,這種描述不僅能對圖像是否存在某一特定的對象進(jìn)行回答,還能對圖像內(nèi)容進(jìn)行詳細(xì)的描述。
其五,能使圖像再現(xiàn)性。數(shù)字圖像處理與模擬圖像處理的根本不同在于,它不會因圖像的存儲、傳輸或復(fù)制等一系列變換操作而導(dǎo)致圖像質(zhì)量的退化,只要圖像在數(shù)字化時準(zhǔn)確地表現(xiàn)了原稿,則數(shù)字圖像處理過程始終能保持圖像的再現(xiàn)。
其六,靈活多變的處理功能。針對模擬技術(shù)而言,我們現(xiàn)在的視頻監(jiān)控圖像處理技術(shù)可以把監(jiān)控畫面分割為任意大小的二維數(shù)組,這意味著圖像的數(shù)字化精度可以達(dá)到滿足任一應(yīng)用需求,符合行業(yè)高清化趨勢。
其七,適用面寬。視頻監(jiān)控圖像可以來自多種信息源,比如可以是銀行畫面,也可以是機(jī)場或者海事等遠(yuǎn)距離監(jiān)控,不論是來自哪個行業(yè)的信息源的圖像只要被變換為數(shù)字編碼形式后,均是用二維數(shù)組表示的灰度圖像組合而成,
其八,靈活性高。數(shù)字圖像處理不僅能完成線性運算,而且能實現(xiàn)非線性處理,即凡是可以用數(shù)學(xué)公式或邏輯關(guān)系來表達(dá)的一切運算均可用數(shù)字圖像處理實現(xiàn)。
不過,視頻圖像處理技術(shù)占用的頻帶較寬,,所以在成像、傳輸、存儲、處理、顯示等各個環(huán)節(jié)的實現(xiàn)上,技術(shù)難度較大,成本也高,這就需要我們了解制約視頻圖像處理技術(shù)的因素。
視頻圖像處理就技術(shù)而言涉及的知識面十分廣闊,具體方法種類繁多,應(yīng)用也極為普遍,但如果在安防行業(yè)角度分析,該技術(shù)的主要內(nèi)容包括三大部分:圖像壓縮;增強(qiáng)和復(fù)原;匹配、描述和識別。由于超高清的要求,在圖像壓縮方面H.265自然優(yōu)勢最大,由于關(guān)于H.265的技術(shù)專題已經(jīng)闡述了和視頻圖像處理的關(guān)系,本文就不在這方面做具體介紹。為此,在剩下的兩部分我們目前主要關(guān)注的視頻圖像處理技術(shù)有以下幾個方面:
智能分析處理技術(shù)是目前中國安防行業(yè)最為關(guān)注的圖像處理技術(shù),該技術(shù)簡而言之,就是發(fā)現(xiàn)圖像中運動的物體,并對其進(jìn)行跟蹤、分析,及時發(fā)現(xiàn)異常行為,觸發(fā)報警并采取其他措施進(jìn)行干預(yù)。智能分析處理技術(shù)是基于監(jiān)控圖像處理軟件包而開發(fā)的,主要有以下幾種圖像處理形式:
1、將(運動)目標(biāo)從視頻圖像中分離出來。2、對目標(biāo)進(jìn)行行為分析,判定其運動的方向、方式,并能發(fā)現(xiàn)和告警異常的行為;產(chǎn)生目標(biāo)的運動軌跡,并能進(jìn)行目標(biāo)的自動跟蹤。3、實現(xiàn)視頻語義的解析,圖像處理分析的最高層次。通過對一個圖像序列作出分析,得出其包含的真實信息,可以與話音的語義解析結(jié)合起來,逐步實現(xiàn)視頻語義的解析。4、在復(fù)雜環(huán)境下實現(xiàn)目標(biāo)的分離、行為分析和運動跟蹤,特別是實現(xiàn)多目標(biāo)的跟蹤。
上述幾點早已有實際應(yīng)用(比如,單絆線入侵檢測、多絆線、圍欄入侵、進(jìn)入/退出區(qū)域檢測、徘徊檢測、遺留物檢測、物體搬移檢測、物體出現(xiàn)檢測、物體消失檢測、人群密度、人群突變、奔跑檢測、逆向檢測、人流量、火焰檢測、煙霧檢測、場景變化、單球機(jī)PTZ自動跟蹤等),但基本上是在簡單環(huán)境下,針對少數(shù)目標(biāo)進(jìn)行智能化的圖像處理。在復(fù)雜環(huán)境視頻監(jiān)控環(huán)境(多人流、多移動、惡劣天氣)下實現(xiàn)這些功能,是圖像智能分析處理技術(shù)真正價值所在。要解決多個圖像的綜合分析,圖像間目標(biāo)的關(guān)聯(lián),目標(biāo)跟蹤的連續(xù)性,這都是市場應(yīng)用的迫切需要,也是我們亟待解決的問題。
寬動態(tài)技術(shù)是松下第一個在監(jiān)控行業(yè)嘗試,那是1977年它的寬動態(tài)范圍是40倍,引入國內(nèi)受到業(yè)界追捧是在2005年的深圳安博會。兩年后,美國PIXIM方案也在市場上廣為流行,成為寬動態(tài)的另一種選擇。
寬動態(tài)視頻圖像處理技術(shù)主要是用來解決攝像機(jī)在寬動態(tài)場景中采集的圖像出現(xiàn)亮區(qū)域過曝而暗區(qū)域曝光不夠的現(xiàn)象。簡而言之,寬動態(tài)技術(shù)可以使場景中特別亮的區(qū)域和特別暗的區(qū)域在最終成像中同時看清楚。這種技術(shù)是安防行業(yè)應(yīng)為最為普遍的視頻圖像處理技術(shù),經(jīng)過十多年的市場洗禮和技術(shù)提升,目前還是存在一些不足。一是源自它在高亮區(qū)域短曝特征,會導(dǎo)致在日光燈場景下亮區(qū)域出現(xiàn)橫條紋閃爍,這是常見的日光燈工頻引起的閃爍現(xiàn)象,因為在亮區(qū)域的曝光時間非常短,沒有達(dá)到抗閃所需的最低曝光時間;二是源自它在暗區(qū)域長曝特征,當(dāng)物體進(jìn)行高速運動時會因過長的曝光時間而產(chǎn)生拖影現(xiàn)象。
這個技術(shù)在2010年隨著高清的到來開始在國內(nèi)應(yīng)用,當(dāng)時日立推出的機(jī)芯產(chǎn)品就主打透霧功能。該技術(shù)是可實時處理各種霧霾天氣中的視頻圖像,去除由霧霾造成的景象朦朧、模糊、看不清或看不見的情況,能夠顯著增強(qiáng)視頻圖像的細(xì)節(jié)信息,使原來被遮隱的圖像細(xì)節(jié)得以充分展現(xiàn),并保持了原有的色彩色調(diào),使視頻圖像變得極其明亮、通透和清晰,因而獲得了良好的圖像質(zhì)量與視覺感受。
可實時對視頻圖像進(jìn)行各種倍率的放大,放大的視頻圖像沒有任何模糊和馬賽克,并能夠?qū)υ曨l圖像的細(xì)節(jié)部分予以充分的保留。
可實時對視頻圖像中的強(qiáng)光亮點或區(qū)域進(jìn)行抑制,使強(qiáng)光范圍和亮度減小,恢復(fù)被強(qiáng)光散射遮掩的目標(biāo)景物的輪廓和色彩,獲得清晰的視頻圖像。
可處理圖像中的散焦模糊和運動模糊等,使被觀察景物圖像變得清晰。
前三種可以說是目前安防行業(yè)最為關(guān)注的三種視頻圖像處理技術(shù),后三者的圖像處理由于各個廠家大多采用市面上幾個主流的產(chǎn)品方案,以至于在產(chǎn)品性能表現(xiàn)時都沒有多大優(yōu)劣區(qū)別。
由于計算機(jī)的處理速度極快,且數(shù)字信號具有失真小、易保存、易傳輸、抗干擾能力強(qiáng)等特點,因而計算機(jī)圖像處理的應(yīng)用十分廣泛,包括航空航天、遙測技術(shù)、醫(yī)療器械、工業(yè)自動化檢測、安全識別、安防監(jiān)控、娛樂媒體等各大領(lǐng)域。每一個應(yīng)用領(lǐng)域都有其領(lǐng)域的特殊性要求,安防監(jiān)控行業(yè)應(yīng)用也有其固有的特殊性。
對圖像清晰度要求較高。在治安監(jiān)控現(xiàn)場,公安機(jī)關(guān)往往需要通過監(jiān)控錄像來辨認(rèn)嫌疑人、證據(jù)等。一般清晰度不高的視頻都達(dá)不到這種要求。在交通監(jiān)控現(xiàn)場,交警需要通過監(jiān)控圖像來識別車牌、違章行為、駕駛?cè)说纫螅:膱D像在這種場合根本無法應(yīng)用。
不同的行業(yè)監(jiān)控,對圖像要求的差異性。比如醫(yī)療監(jiān)控,對圖像的色彩還原性要求比較高。智能交通監(jiān)控,對攝像機(jī)夜間照度和抓拍速度要求比較高,要求能清晰辨別車牌。在無人值守監(jiān)控,需要設(shè)備在無人看管的條件下能長期穩(wěn)定的工作。
戶外安裝,無人看守。在安防領(lǐng)域,大多情況設(shè)備需要安裝在室外,設(shè)備需要經(jīng)受常年的風(fēng)吹日曬。要經(jīng)歷常年溫度、濕度、鹽度、輻射等自然條件的影響。電子設(shè)備自身的老化的速度會比其他領(lǐng)域要相對快一些。攝像機(jī)鏡頭、電子設(shè)備、傳輸線路等設(shè)施的老化會導(dǎo)致圖像越來越模糊。
海量視頻路數(shù)的要求。在大型平安城市監(jiān)控項目中,視頻路數(shù)會達(dá)到上萬路,甚至更多路。如此海量的視頻路數(shù),對網(wǎng)絡(luò)帶寬、存儲設(shè)備都提出了很高的要求。所以在視頻監(jiān)控領(lǐng)域都期望視頻編碼的碼率壓縮比達(dá)到最高,從而降低對帶寬和容量的要求。這就導(dǎo)致在視頻編碼環(huán)節(jié)產(chǎn)生更多的信息丟失,從而導(dǎo)致圖像模糊。
安防的這些特殊應(yīng)用場所,都會導(dǎo)致圖像清晰度的下降,反過來又對圖像清晰度有很高的要求,勢必會導(dǎo)致模糊圖像處理技術(shù)在這里有廣闊的應(yīng)用前景。
之前也介紹了智能視頻分析和寬動態(tài)在技術(shù)應(yīng)用中還是存在一些不足或者說發(fā)展空間,比如在提高精度的同時著重解決處理速度的問題,巨大的信息量和數(shù)據(jù)量和處理速度仍然是一對主要矛盾。除此之外,視頻監(jiān)控圖像處理技術(shù)由于部分設(shè)備性能不足、客觀條件限制等因素,在實際的視頻監(jiān)控應(yīng)用中,仍會出現(xiàn)視頻圖像模糊不清、關(guān)鍵信息捕捉不到等問題。而在視頻圖像處理的過程中,由于操作技術(shù)問題或者客觀因素等,給視頻圖像處理技術(shù)的應(yīng)用帶來一些負(fù)面影響,降低了處理技術(shù)的水平和質(zhì)量。所以,我們在探究該技術(shù)的未來發(fā)展趨勢就便得十分有意義。有幾個趨勢如下:
其一,在大數(shù)據(jù)時代,未來數(shù)據(jù)圖像技術(shù)強(qiáng)調(diào)高清晰度、高速傳輸、實時圖像處理、三維成像或多維成像、智能化、自動化等方向發(fā)展。
其二,智能化方面,力爭使計算機(jī)識別和理解能夠按照人的認(rèn)識和思維方式工作,能夠考慮到主觀概率和非邏輯思維。這里有一點需要指出,AI在智能化方面可以做圖像數(shù)據(jù)與內(nèi)容的提取與分析,但是并不能在視頻圖像處理方面做文章。
其三,未來視頻圖像處理技術(shù)強(qiáng)調(diào)操作、運用的方便性,圖像處理功能的集中化趨勢是必然會存在的。所以,硬件芯片的開發(fā)研究十分重要,如Thomson公司采用Systolic結(jié)構(gòu)設(shè)計了把圖像處理的眾多功能固化在芯片上。
圖像處理技術(shù)起源于20世紀(jì)20年代,當(dāng)時通過海底電纜從英國倫敦到美國紐約采用數(shù)字壓縮技術(shù)傳輸了第一幅數(shù)字照片。許多年過去,視頻圖像處理技術(shù)被安防行業(yè)大量應(yīng)用,技術(shù)更新日新月異。如果把圖像處理當(dāng)做一個細(xì)節(jié)的話,那么,細(xì)節(jié)將決定成敗,監(jiān)控行業(yè)亦如此。