于春和,杜夢麒
(沈陽航空航天大學 電子信息工程學院,遼寧 沈陽 110136)
近年來,人口和車輛龐大的數(shù)量給交通管制系統(tǒng)帶來了巨大的挑戰(zhàn),因此視頻監(jiān)測作為一個重要輔助手段備受工作人員的青睞。而在海量的監(jiān)測數(shù)據(jù)面前,人工處理難免會出現(xiàn)漏判或誤判??梢詫⑾冗M計算機技術與交通系統(tǒng)融合,實現(xiàn)機器視覺下的視頻識別、數(shù)據(jù)采集和挖掘并給出判決,極大地減輕人工處理的負擔[1-2]。智能交通系統(tǒng)下的視頻監(jiān)測,利用先進計算機技術完成目標識別、目標跟蹤以及目標行為判別等工作,將在各地廣大交通網(wǎng)絡發(fā)揮實時且高效的作用。
視頻中目標的識別和檢測是智能交通系統(tǒng)中重要的技術之一。區(qū)別于傳統(tǒng)交通系統(tǒng)的人工檢測技術,智能交通系統(tǒng)的視頻檢測利用先進圖像處理技術和人工智能機器視覺技術極大地提高了檢測的速度與效率。同時,云平臺的海量空間為交通信息存儲提供了巨大的便利,也為有效數(shù)據(jù)的挖掘提供了足夠的資源。
機器視覺存在低中高3個層次,每個層次都有不同的用途和特點。低級層次主要作用為突出圖像中的有用信息,對圖像進行視覺處理,為自動識別做準備。中級層次等價突出圖像中的感興趣區(qū)域,并對其進行分割和檢測,從而得到圖像的客觀信息。高級層次是對圖像進行理解,能夠像人一樣看圖說話。移動目標檢測則屬于中間層次的研究。視頻識別與檢測的基本原理是建立在對視頻序列每一幀圖像的分析和處理的基礎上,從而將移動目標從圖像背景中篩選出來。機器視覺分為靜態(tài)視覺和動態(tài)視覺兩種,靜態(tài)視覺即監(jiān)控不動目標動,而動態(tài)視覺是監(jiān)控也動。在目前智能交通系統(tǒng)中,大多數(shù)屬于靜態(tài)視覺。
攝像機負責采集視頻原始的圖像信息,即將鏡頭范圍內的光學信號轉化成電信號再進行傳輸。算法對靜態(tài)視覺采集的視頻圖像進行處理,通常對于移動目標的提取常用如下方法。
1.2.1 背景差分法
背景差分法是基于特定背景下的移動目標檢測方法,需選一幀初始背景圖像,再將目標圖像和背景圖像進行差分運算,從而將目標提取。在智能交通系統(tǒng)中,背景差分法的應用難點在于背景圖像的時變性,每一時刻的背景都有可能不同,因此移動目標檢測系統(tǒng)里的背景圖像需要不斷更新,更新與維護將帶來極大的不便。
對于背景的選取,一般可以考慮第一幀沒有目標的圖像。在檢測交通的視頻中通常選取沒有車輛的路面作為背景,但是由于交通背景圖像具有時變性,單一背景并不符合車輛檢測的實際需求。為了從視頻里提取一個精確和高效的背景可考慮在視頻的基礎上做一個背景的建模。例如,均值法背景建模、中值法背景建模以及單高斯分布背景建模。每一種建模都存在一定的局限性,特別是較為復雜背景的建模。
1.2.2 光流法
流光法基于像素點和速度矢量的一一對應的關系,構畫出一個有關運動場的圖像。該運動場是由圖像的亮度變化形成的,因此反映著每一個像素點灰度的變化情況。一旦目標在圖像中與背景出現(xiàn)相對運動時,移動目標所在的像素點會有速度矢量的變化,從而可以很快地從圖像中篩選出來。其中,二維速度矢量是景物中可見點的三維速度矢量在成像表面的投影,所以光流法不僅包含運動目標的信息,還包含周圍景物的豐富信息。
光流法對于場景的變化適應性很好,無需了解場景信息就可以識別運動目標的位置。但是,由于光流法對于光線變化太過敏感和依賴,現(xiàn)實場景的光照不能滿足恒定不變,所以現(xiàn)實場景中識別誤差大精度低。同時,由于現(xiàn)實中車輛行駛過快、距離過長,導致計算量大耗時長,傳統(tǒng)的光流法計算速度又過慢,導致時效性和精確性難以同時兼得,對于要求苛刻的實時場景來說并不適用。
1.2.3 幀間差分法
幀間差分法是基于視頻序列相鄰幀圖像的灰度值差值對比,經(jīng)過計算兩張圖片的灰度值的差值,從而檢測到移動目標。通常為讀取視頻序列的相鄰兩幀圖像,利用對應的像素點的灰度值差分相減的算法得到差分圖,再把差分圖進行二值化處理,然后需要計算并選擇一個合理的閾值,將這個閾值作為前景點和背景點的判別機制。
比較3個方法,幀間差分法相對適合于智能交通系統(tǒng)下視頻識別與檢測。在實際應用中,為了提高視頻識別和檢測的精度,幀間差分法處理后還需要利用分割技術和形態(tài)學處理技術。
圖像分割技術是利用從圖像大致分離出檢測目標進行加工和處理。圖像分割技術包含閾值分割算法、邊緣檢測算法以及區(qū)域生長算法。
1.3.1 閾值分割算法
閾值分割適用于前景和背景灰度值差別較大的圖像。由于其實現(xiàn)方便、計算量小、性能穩(wěn)定,通常用來做圖像的預處理。具體是根據(jù)灰度級設定不同的閾值將圖像分成若干區(qū)域,保證各區(qū)域內部具有相同的屬性,同時不同于相鄰區(qū)域的屬性。但是,算法對噪聲敏感,而且對于灰度值對比不明顯的圖像處理效果不好,所以常與其他算法配合使用。
1.3.2 邊緣檢測算法
邊緣檢測主要識別數(shù)字圖像中變化明顯像素點,然后把這些像素點連接在一起得到圖像的邊緣,從而定位目標圖像邊緣的過程。邊緣增強算法用以增強圖像前景邊緣和背景的對比度,一般與邊緣檢測算法連用,突出邊緣輪廓。
1.3.3 區(qū)域生長算法
區(qū)域生長法和分裂合并法是兩種典型的串行區(qū)域技術。區(qū)域生長法利用圖像中像素點的灰度值、紋理特性、強度等相似屬性,由種子點為起點將所有相似屬性的像素點集合起來發(fā)展成一個區(qū)域。
形態(tài)學處理技術[3]是基于形態(tài)結構元素去衡量移動目標的形狀,通過分析和處理將其進一步提取。常用的運算方法有膨脹、腐蝕、形態(tài)學梯度、開運算、閉運算、頂帽運算及黑帽運算等。
在復雜背景下,目標差分二值圖像完成閾值分割后,難免會出現(xiàn)一些空洞和少量噪聲的問題。這時需要對圖像進行腐蝕去除干擾點,然后再利用膨脹擴展感興趣區(qū)域。利用形態(tài)學處理技術處理閾值分割后的圖像,可以使目標檢測的準確性相對提高。
測速是交通系統(tǒng)重要的監(jiān)管指標。交通系統(tǒng)中移動目標速度的檢測有3種手段:感應線圈測速、雷達測速以及視頻測速。
感應線圈測速需在測速區(qū)間的合理位置鋪設感應線圈,利用電磁感應的原理探測移動目標的位置。此手段對移動目標測量的局限性較高,其只能對區(qū)間類金屬移動目標進行檢測,同時對目標的識別依然需依賴監(jiān)控系統(tǒng),不適用于智能交通系統(tǒng)。
雷達測速是傳統(tǒng)交通系統(tǒng)使用較多的手段,其測速精準且高速。但是,雷達測速在多移動目標的復雜環(huán)境下檢測的準確性大大降低,因為其抗干擾性差且成本高,地域和環(huán)境存在局限在性,不適合智能交通系統(tǒng)廣泛應用。
視頻測速是智能交通系統(tǒng)下重要技術之一,也是實現(xiàn)目標跟蹤的重要目的之一。其原理是利用某些參數(shù)結合每一幀圖中車輛的二維位置從而得到車輛在視頻中的三維位置,推算出視頻時間段的位移,得到車輛的速度。其安裝方便,抗干擾能力強,具有實時性,結合人工智能等先進技術可實現(xiàn)復雜環(huán)境下的檢測。
運動目標檢測基本思路就是利用計算機視覺以及圖像處理技術,分析攝像頭獲取的交通視頻序列得到相關的參數(shù)。在智能交通體系網(wǎng)中,目標跟蹤不僅是車輛測速的方法,也是治安保障的關鍵,如疫情防控或者犯人追捕等。運動目標跟蹤方法大致可從如下3種思路入手。
2.2.1 移動目標特征的抓取
此方法的特點是不需要知道移動目標的全貌,只需要部分特征即可以做跟蹤觀測。但是,局限于運動目標的特征集合的穩(wěn)定和權重,沒有足夠權重的固定特征作為目標判斷依據(jù)很容易造成錯誤跟蹤而導致效率低下,同時若運動目標發(fā)生人為的特征點遮擋很容易造成逃逸?;谝陨暇窒扌?,在未來智能交通系統(tǒng)中,目標特征的抓取法很難得到進一步的發(fā)展。
2.2.2 移動目標的建模
此方法基于對目標進行3D、2D或者線圖模型的建立,或者基于更高層次的模型空間的建立,如三維和二維空間。模型的建立對目標的追蹤可靠性強,但是建立的工作量和難度大,對個例開展實施有效,不具有應用普遍性。
2.2.3 區(qū)域跟蹤法
區(qū)域跟蹤法建立在目標區(qū)域背景模板上,通過對比每一幀領近圖像的紋理、梯度、色彩等特征,將移動目標給篩選出來,然后選擇出最清晰的特征用于識別和跟蹤,從而構畫出目標在視頻中的移動軌跡,很適合當今智能交通系統(tǒng)。區(qū)域跟蹤法對目標的定位可參考如下兩種方法。
(1)灰度重心定位法。由于移動目標在視頻序列相鄰兩幀不會出現(xiàn)速度和方法的突變,目標在圖像中的灰度重心因此不會有很大的位置變化。將灰度重心最為特征定位參數(shù),每一幀的灰度重心點能夠建立移動目標的運動軌跡。
(2)亞像素定位法。這是一項十分典型的圖像特征篩選技術,對特征目標的定位精度高,受到了計算機領域相關學者的關注。其對目標的選取基于一定的形狀分布和特定的形狀分布,對面積大小以及灰度變化程度上也有一定要求。不同于灰度重心法的單個像素特征點,亞像素定位法對目標篩選出了一個矩特性,而矩特性在視頻的成像是不變的,因此可以用矩形框將移動的目標在視頻中定位。人工智能的移動人臉識別也是基于該原理。
智能交通系統(tǒng)下視頻監(jiān)控技術具有很大的發(fā)展空間和發(fā)展?jié)摿4],特別是在當今的大數(shù)據(jù)時代,交通系統(tǒng)下視頻信息處理將被要求更快更準,因此本文研究具有重要意義。