王金洋
基于混合高斯模型的運動目標跟蹤算法
王金洋
王金洋 余紅英 樊永生
中北大學(xué)計算機與控制工程學(xué)院
視頻幀序列中實時運動目標分割的一般方法是背景差分或者是對于背景圖與當(dāng)前幀的閾值公差。不同的方法之間的區(qū)別在于對于背景圖的建模和模型的更新策略。本文討論對每個像素進行混合高斯模型建模和使用在線近似的方法更新模型。自適應(yīng)混合高斯模型的分布用來評估決定哪些像素點最有可能來自背景處理過程。每個像素點根據(jù)最有效代表它的高斯分布是否為背景模型的一部分進行分類。本文最后得到一個穩(wěn)定、實時并且對于輕微變化不敏感和長時間的場景變化的跟蹤器,滿足24h×7的基本工業(yè)要求。
過去較低的計算能力限制了復(fù)雜的、實時性的視頻處理應(yīng)用,導(dǎo)致許多機器視覺系統(tǒng)實時性太差難以投入實用或者對于實際的工況過多的限制條件。近年來隨著硬件計算能力的提升,研發(fā)人員越來越多的考慮采用更加復(fù)雜、健壯的數(shù)學(xué)模型完成流數(shù)據(jù)的實時分析。在安防領(lǐng)域,一個健壯的系統(tǒng)不能過度依賴攝像機安裝位置,而應(yīng)該對出現(xiàn)在場景中的目標具有自適應(yīng)性并且對于光照效果不能要求苛刻。它應(yīng)該有能力處理來自于工作區(qū)域、視場目標重疊、陰影、光線變化條件下的各種目標運動信息。
一般方法中對于某個高斯分布中的像素數(shù)值全部進行建模,而本文僅對作為混合高斯模型的特定像素點進行建模。基于混合高斯分布中每個高斯函數(shù)的持續(xù)性和變化性,我們獲取某個對于背景模型顏色反應(yīng)最強的分布。不符合背景高斯模型的像素值被劃歸為前景,直至存在某個分布對于該像素點具有充分的和持續(xù)性的概率判斷才將其劃歸為背景模型點。
在線混合模型中,我們稱在一定時間段上的特定像素為一個像素過程,所以像素過程是對應(yīng)于一串時間序列的像素值,例如灰度圖像的梯度和彩色圖像的向量。在任何時間點,t對應(yīng)于一個特定的像素點{x0,y0},有下式,其中I代表視頻幀序列:
每個像素點的值代表它自身與其沿光流通路所接觸的第一個目標的一種度量,假如背景和光照是靜態(tài)的則其值是相對常量。而采樣過程中存在的獨立的高斯噪音,其密度函數(shù)可以由均值的高斯分布來描述。一般來說對于背景模型的支持要有大量的數(shù)據(jù),但是不同目標的顏色值往往是不同的。針對每個像素點的前幾幀數(shù)值{X1,…Xt},我們采用K個高斯分布進行建模,可以得到當(dāng)前像素點的概率值為:
其中,K為高斯分布的數(shù)量,Wi,t為第i個高斯分布在時間t的權(quán)重系數(shù)估計值,Ui,t為第i個高斯分布在時刻t的均值,sum(i,t)是第i個高斯分布在時刻t的方差,u為高斯概率密度函數(shù):
其中K由計算機可用的內(nèi)存量和計算能力決定,取值范圍3~5。另外由于計算的原因,協(xié)方差矩陣采用如下的形式:
這樣存在一個前提是RGB三色具有獨立的數(shù)值并且具有相同的方差,但是這個前提在實際中不一定總存在,這樣就使得我們做一個相當(dāng)耗費CPU的矩陣求反從而喪失了精度。
當(dāng)每個像素點對應(yīng)的混合高斯模型參數(shù)變化時,我們想要得知哪個高斯分布最優(yōu)可能是背景過程產(chǎn)生的,這個問題轉(zhuǎn)化為尋找一個可能性最大而且方差最小的高斯分布。當(dāng)一個新的目標出現(xiàn)在視場中時,一般來說它與當(dāng)前的分布是不匹配的,而解決辦法有兩種,其一是建立一個新的分布,其二是增大現(xiàn)有分布的方差值,并且運動目標的方差值要比背景模型的方差值大,直至運動目標停止。為了對此過程建模,首先對高斯分布進行編碼,在對混合高斯模型的參數(shù)進行重新近似之后,就很容易將最大可能分布從背景模型分布中分離出來,因為只有匹配到的數(shù)值發(fā)生了改變。這樣的對分布進行排序是一種有效的,端部開放的列表,其中最大可能的背景模型分布在頂部,這樣背景模型的近似就可以用下式表達:
其中,T為背景模型中符合匹配規(guī)則的像素點數(shù)目。如果T值選擇的較小,背景模型的高斯分布往往是單峰的,也即一般頂部的分布為最大近似分布;如果T的值選擇的比較大,則算法對于微小且長時間的視場變化會敏感,例如旗幟的飄動,水波等等,會形成背景混合高斯模型的多峰分布。
在一臺SGI O2配置為R10000的計算機上,算法可以處理的幀速為11-13FPS(幀尺寸為160*120),另外幀速與前景中運動目標數(shù)量也有關(guān)系。我們的跟蹤算法系統(tǒng)可以可靠地存儲5路視場信息,而隨著計算機性能的提升和并行性技術(shù)的研究,該系統(tǒng)算法可以在大尺寸圖像、采用大量高斯函數(shù)的背景模型條件下進一步提升幀速率和精確度。而對全相關(guān)矩陣的計算和每個高斯分布的近似可以提升算法的健壯性和精確度。
10.3969/j.issn.1001-8972.2015.02.031