移動偵測,又稱運動物體檢測(motion object detection),是區(qū)分某種物體(可以是生命體也可是無生命體,可大,可?。┨幱陟o止或運動狀態(tài)(快速或慢速)的一種技術(shù)。該技術(shù)應(yīng)用廣泛,可廣泛應(yīng)用于各行各業(yè),各種場景。在智慧城市中,需自動偵測動態(tài)變化的場景,如人、動物、各式物料等。
如:(1)平安城市中視頻監(jiān)控,用于識別可疑人員或?qū)崟r記錄案發(fā)現(xiàn)場。
(2)家庭、企業(yè)、銀行、碼頭、倉庫等防盜,用于識別可疑人員。
(3)幼、小學(xué)生監(jiān)護(hù),用于識別學(xué)生離開活動區(qū)域。
(4)設(shè)備智能啟動、自動觸發(fā)門禁,減少人工操作,提高便利性。
(5)交通、鐵路,用于違規(guī)拍攝和記錄。
(6)教學(xué)取樣、實驗室數(shù)據(jù)無人值守采集,用于自動化,代替人工工作。
(7)保育、醫(yī)療、養(yǎng)老等護(hù)理機(jī)構(gòu)和場所的監(jiān)控報警,用于識別人體活動場所。
諸如此類,不勝枚舉??傊藗兊娜粘I罨蚬ぷ髦袔缀蹼x不開“移動偵測”技術(shù)。
移動偵測,常用于無人值守監(jiān)控錄像和自動報警。通過攝像頭按照不同幀率采集得到的圖像會被CPU等按照一定算法進(jìn)行計算和比較,當(dāng)畫面有變化時,如有人走過,鏡頭被移動,計算比較結(jié)果得出的數(shù)字會超過閾值并指示系統(tǒng)能自動作出相應(yīng)的處理。
背景減除法是運動檢測中最常用的一種方法,它是利用當(dāng)前圖像與背景圖像的差分來檢測出運動區(qū)域的一種技術(shù)。它一般能夠提供最完全的特征數(shù)據(jù)。本方法的主要難點是對于動態(tài)場景的變化,如光照和外來無關(guān)事件的干擾等特別敏感。
(1)背景減除法的基本思想
假設(shè)監(jiān)控場景沒有運動背景,也不受自然特性的影響,則檢測場景中的背景像素都是靜態(tài)的值,當(dāng)有運動物體經(jīng)過時,會引起運動物體遮擋的像素的值的變化。系統(tǒng)維護(hù)一幀圖像用來表示靜止場景,然后在實際運行時將采集到的實時圖像和靜止場景相減,便可得到包含了運動物體的差分圖像,進(jìn)而檢測到運動物體。
(2)背景減除法面臨的問題
采用背景減除法首先要解決兩個問題:① 背景模型的獲得,實際場景中通常是存在運動物體的,沒有辦法直接獲得背景;② 背景模型的更新,實際場景會受到自然干擾,不可能一成不變。
有多種方法可以用來提取背景模型,其中最常用一種方法為平均法,該方法直接平均歷史圖像,得到背景模型。但是該方法需要保存大量歷史數(shù)掘,而且運動物體會在估計背景上留下虛影。
時間差分方法是在連續(xù)的圖像序列中兩個或三個相鄰幀間采用基于像素的時間差分并且閾值化來提取出圖像中的運動區(qū)域。時間差分運動檢測方法對于動態(tài)環(huán)境具有較強(qiáng)的自適應(yīng)性,本方法的難點在于不能完全提取出所有相關(guān)的特征。
方法一中的背景模型提取方法,需要存儲大量歷史數(shù)據(jù),并且運動物體會影響估計背景。為了避免這兩個缺點,時間差分法則是將背景減除法和幀間差分法結(jié)合起來,采用背景減除法來檢測運動物體,采用幀間差分法處理場景突變,采用選擇性更新來適應(yīng)場景的緩慢變化。
(1)幀間差分法
幀間差分是采集時間軸上連續(xù)的兩幀或是三幀圖像,直接進(jìn)行減除的方法。這類算法的主要優(yōu)點是計算簡單、且能夠迅速檢測出場景中的運動像素,缺點是對噪聲敏感、且不能精確地提取運動邊界,其檢測性能嚴(yán)重依賴于視頻圖像中物體的相對移動速度。
(2)運動物體檢測
采用背景差分法檢測運動物體,系統(tǒng)將采集到的實時圖像與背景估計圖像進(jìn)行差分,通過差值與閾值的比較來判斷相應(yīng)的像素點是否屬于運動區(qū)域,并產(chǎn)生相應(yīng)的二值圖像,采用這種方法更新背景的優(yōu)點在于能夠自適應(yīng)場景光照變化,且計算量小、運行速度快,適用于背景不復(fù)雜場景。
基于光流方法的運動檢測采用了運動目標(biāo)隨時間變化的光流特性,通過計算位移向量光流場來初始化基于輪廓的跟蹤算法,從而有效地提取和跟蹤運動目標(biāo)。該方法的優(yōu)點是在攝像機(jī)運動存在的前提下也能檢測出獨立的運動目標(biāo)。然而,大多數(shù)的光流計算方法相當(dāng)復(fù)雜,且抗噪性能差,如果沒有特別的硬件裝置則不能被應(yīng)用于全幀視頻流的實時處理。
此外,在運動檢測中還有一些其他的方法,運動向量檢測法,適合于多維變化的環(huán)境,能消除背景中的振動像素,使某一方向的運動對象更加突出的顯示出來。
人工智能是機(jī)器通過使用模擬人類大腦的多層神經(jīng)網(wǎng)絡(luò)來學(xué)習(xí)經(jīng)驗的能力,以便識別物體與模式,并在沒有人為干預(yù)的情況下做出決策。根據(jù)所需的復(fù)雜程度、詳細(xì)程度、可接受的誤差范圍和學(xué)習(xí)數(shù)據(jù)質(zhì)量,人工智能可以使用脈沖神經(jīng)網(wǎng)絡(luò)(SNN)在幾秒內(nèi)快速學(xué)習(xí)新物體,而使用卷積神經(jīng)網(wǎng)絡(luò)(CNN)則需要好幾周的時間。盡管它們各自都有優(yōu)缺點,但無論是SNN還是CNN,在效率與準(zhǔn)確性方面它們都優(yōu)于傳統(tǒng)的安防系統(tǒng)。
生物(人體)會發(fā)出特定的紅外波長信號,利用這一特點,可能利用紅外熱釋傳感器識別移動的生(人)物體。
圖1 熱釋紅外檢測移動人體電路
圖1PIR為紅外熱釋傳感器,檢測人體發(fā)出的紅外波長,對移動的人體比較靈敏。BISS0001為專用雙運算放大器及雙限幅器,專為PIR應(yīng)用研發(fā)。本電路的優(yōu)點是成本低,應(yīng)用成熟。不足之處是不能在強(qiáng)光下工作,另外,易被其它生物體干擾,存在誤報漏報現(xiàn)象。
上述移動偵測方法小結(jié)。
① 方法1-3:算法難度中等,成本高。識別準(zhǔn)確率較高。
② 方法4:算法復(fù)雜,難度高,成本高。識別準(zhǔn)確率最高。
③ 方法5:純硬件實現(xiàn),可無需軟件,采用專用IC實現(xiàn),成本低。識別行動人體較為準(zhǔn)確,識別其它生物體誤報率高,工作環(huán)境要求高。
圖2 移動偵測系統(tǒng)架構(gòu)圖
移動檢測系統(tǒng)構(gòu)成:通常,移動偵測系統(tǒng)由攝像頭,圖像傳感器(CMOS或CCD),高速數(shù)字信號處理機(jī)DSP或微處理器,存儲單元(RAM,EPROM,E2PROM)及接口處理單元,供電單元等組成。
攝像頭:視頻監(jiān)控的攝像頭大部分采用短定焦鏡頭。
CMOS傳感器:成像傳感器現(xiàn)在大部分采用CMOS,基本淘汰了CCD。隨著傳感器技術(shù)發(fā)展,用于視頻監(jiān)控的傳感器亦由標(biāo)清向高清(2K),超高清(4K,甚至8K)演進(jìn)。像素的增加意味著需要處理的數(shù)據(jù)量成指數(shù)增長。
DSP/MCU處理單元:傳感器輸出信號通常為YUV(亮度信號,及色差信號)。DSP需要對這種信號進(jìn)行還原成原始圖像,需要進(jìn)行大量的運算。上述所提到的方法,運算量都巨大。需要高性的DSP或MCU才能勝任。編解碼器主要用于圖像的壓縮,如MP4,H.264,H.265,便于節(jié)省存儲空間,節(jié)省傳送帶寬。
存諸單元:包括RAM,EPROM,E2PROM等。其中RAM隨機(jī)存儲器,用于計算結(jié)果中間緩存。EPROM用于存儲程序代碼。E2PROM用于存儲非易失性數(shù)據(jù),通常用于存儲配置參數(shù)。
接口單元:本系統(tǒng)通過接口單元與上位機(jī)或網(wǎng)絡(luò)相連。
供電單元:通常包括AC/DC開關(guān)電源進(jìn)行交直流轉(zhuǎn)換,此外,還會有電池充放電管理電路。
3.2.1 步驟(1)設(shè)置偵測區(qū)域等參數(shù)
根據(jù)需要,設(shè)置若干個有效的矩形,還可以設(shè)置快速和慢速兩種運動檢測狀態(tài)??焖贆z測是對每隔兩幀的兩幀數(shù)據(jù)進(jìn)行差分運算,慢速檢測是指對相隔12幀以上的兩幀數(shù)據(jù)進(jìn)行差分運算。
3.2.2 步驟(2)啟動運動偵測算法
A/D轉(zhuǎn)換后的數(shù)據(jù)是標(biāo)準(zhǔn)的ITU 656 YUV 4:2:2格式,為了簡化算法,直接對亮度(Y)值進(jìn)行處理。對于某個檢測區(qū)域內(nèi)每個象素點(x,y),T時刻與T1時刻亮度(Y)的差值為 Mx,y(T)=ABS(Yx,y(T)-Yx,y(T1)),IF ABS(Mx,y(T)-Mx,y(T1))≥ Ta THEN L=TRUE,得到區(qū)域差分系數(shù)IMsum=ΣL。實際決定是否報警,可由整個設(shè)置檢測區(qū)域的IMsum值來判斷。
3.3.3 步驟(3)輸出處理
如果整個區(qū)域的差分系數(shù)IMsum大于設(shè)定的閥值,置報警狀態(tài)并實時將每個檢測區(qū)域的宏塊差分系數(shù)都返回。如果整個區(qū)域的差分系數(shù)小于設(shè)定的閥值,復(fù)位報警狀態(tài)。
綜上所述,方法1~4由于涉及動態(tài)圖像的分析,計算量很大,需要消耗較多的計算資源及存儲資源,成本較高,功耗也較大。優(yōu)點是根據(jù)需要,可以不斷優(yōu)化軟件算法,提高移動偵測的準(zhǔn)確率。隨著芯片技術(shù)發(fā)展,未成芯片成本可以進(jìn)一步降低。在大規(guī)模量產(chǎn)的情況下,仍有著廣闊的應(yīng)用前景。
針對前述介紹的方法1~3存在的缺點,本文提出方案5。
特點:① 實現(xiàn)目標(biāo):方案簡單,成本低廉,極高響應(yīng)速度。在特殊情形下,可以與其它方法1~3聯(lián)合使用。② 自適應(yīng):自適應(yīng)亮度化,自動偵測目標(biāo)移動速度變化,移動方向不受限,預(yù)置偵測策略等。
實現(xiàn)方法:傳統(tǒng)單反相機(jī)(數(shù)碼相機(jī))+光敏材料,如圖3所示。
圖3 單反相機(jī)結(jié)構(gòu)圖
在圖3中標(biāo)示紅色區(qū)域為五棱鏡。被攝體經(jīng)過鏡頭焦光后通過反光板、五棱鏡、取景器,從而到達(dá)拍攝者的眼晴。本方案的方法將光敏材料置于五棱鏡的下表面,檢測光線的變化。為了滿足區(qū)域檢測要求,將光敏材料制成4*4單元。每條邊可視為兩個光敏電阻。如圖4所示。
方法5硬件系統(tǒng)如圖5所示。
圖4 光敏電阻矩陣
圖5 硬件系統(tǒng)圖
從圖5可以看出,方法5硬件系統(tǒng)主要由光敏單元、模擬矩陣開關(guān)、減法放大器、自動增益控制、AD轉(zhuǎn)換器、單片機(jī)、電源管理芯片、觸控屏等組成。由于采用4*4光敏單元,其計算量相較于2k到8K的幀圖像而言,需要計算的數(shù)據(jù)量減少至0.1%,而且響應(yīng)速度不受幀頻限制,可以比方法1~3快100倍以上。因此,采用非常經(jīng)濟(jì)的MCU即可完成移動偵測任務(wù)。成本低,功耗低。限于篇幅,本文不再給出軟件算法。
本文回顧了移動偵測領(lǐng)域主流的3種技術(shù):背景減除法,時間差法及光流法,分析了它們的工作原理,并指出了優(yōu)缺點。并針對上述三者存在的算法復(fù)雜,實現(xiàn)成本高,功耗大等問題提出了一種新的移動偵測方法,具有算法簡單,速度快,價格低廉,功耗低等優(yōu)勢,相信會在未來智慧城市建設(shè)中發(fā)揮重要作用。