馬曉麗
摘要:該文中我們針對視頻中提取乒乓球設(shè)計了三種方案,第一種是基于圖像處理的差影法的方案,該方案受陰影、雨滴等自然環(huán)境影響較大,而且精度不高,但此方案運算速度較快,不涉及求取均值等耗費時間的運算。第二種是基于稀疏低秩矩陣的前景和背景分離方案,該方案主要是矩陣分離的思想,采用魯棒的主成分分析算法,可以直接進(jìn)行視頻處理,有效的處理光線等自然因素的干擾;同時也可以有效處理乒乓球運動速度的變化;得到的結(jié)果具有魯棒性。第三種方案是基于雙特征的模式識別思想,主要利用的是乒乓球的顏色和形狀的特征,易受外界因素的影響。
關(guān)鍵詞:圖像差影;魯棒主成分分析;雙特征的模式識別
中圖分類號:TP302 文獻(xiàn)標(biāo)識碼:A 文章編號:1009-3044(2015)17-0158-02
本課題的研究背景是機(jī)器人足球,即:讓機(jī)器人去踢足球。機(jī)器人踢足球的前提就是需要找到足球,然后才能進(jìn)行踢球、防守、進(jìn)攻等?;谶@個問題我進(jìn)行視頻中提取乒乓球的課題,在此課題中難點就是如何在一張圖像中找到乒乓球,然后才能進(jìn)行視頻中提取。
1 方案一:差影法思想
1.1 原理
拍攝要識別的背景圖,背景圖最好沒有其他移動物體的存在,這樣可以排除其他因素的干擾取得較好的效果。將獲得的含有乒乓球圖像和背景圖像作差得到差值圖像。通過對差值圖像進(jìn)行二值化等處理可以得到當(dāng)前輸入圖像中乒乓球的基本輪廓。這種算法能夠檢測運動乒乓球以及靜止乒乓球,因為拍攝圖像與背景圖的相差部分都能被檢測。即:利用差影法提取圖像中的乒乓球。
1.2 流程圖
1.3 步驟
(1)拍攝一個背景圖,然后放入乒乓球后再拍一張照片,得到前景和背景圖
(2)首先將兩張圖像進(jìn)行預(yù)處理:去噪處理、灰度處理等;
(3)將處理后的圖像進(jìn)行差影計算,從而將乒乓球提取出來;
(4)為了便于觀察和計算,將差影后的圖像進(jìn)行二值化處理;
(5)為了使乒乓球檢測更為可靠,我們對二值化處理后的圖像進(jìn)行了邊緣檢測(采用Canny算子);
(6)對提取的邊緣進(jìn)行膨脹處理,使得邊緣更為明顯,易于觀察;
(7)對膨脹邊緣后的圖像進(jìn)行填充處理,然后進(jìn)行開閉運算,圓滑乒乓球的輪廓,便于檢測。
1.4 評價
此方案的局限性在于只能對背景已知的圖片進(jìn)行處理,隨著時間的變化,背景在不斷地更新,所以應(yīng)該考慮背景的更新機(jī)制。且假設(shè)背景圖片與將要處理的圖片除了乒乓球外,其他區(qū)域均相同,沒有光,陰影,雨滴等自然因素的干擾。同時經(jīng)過試驗,發(fā)現(xiàn)在現(xiàn)實環(huán)境中該方案受干擾因素非常明顯,識別乒乓球的結(jié)果相當(dāng)不好。優(yōu)點是此方案運算速度較快,不涉及求取均值等耗費時間的運算。
2 方案二:基于稀疏低秩矩陣的前景和背景分離思想
2.1 原理
將一段視頻分解為以幀為單位的圖像,共n幀圖像。將n幀視頻圖像序列的每一幀圖像像素值組成一個列向量,那么這n個列向量就組成了一個觀測矩M(m*n)。由于背景比較穩(wěn)定,圖像序列幀與幀之間具有極大的相關(guān)性,所以僅由背景像素組成的矩陣具有低秩特性,對應(yīng)于矩陣L;而運動前景在圖像上的分布范圍比較小,故前景像素組成的矩陣具有稀疏特性,對應(yīng)于矩陣S。視頻觀測矩陣就是這兩種特性矩陣的疊加,即M=L+S。通過非精確增光拉格朗日乘子算法求解穩(wěn)健 PCA 問題就可恢復(fù)出表示背景的低秩成分和表示前景的稀疏成分,從而將乒乓球進(jìn)行識別。
2.2 流程圖
步驟流程圖
算法流程圖
2.3 步驟
尋求觀測數(shù)據(jù)中主成分L的最小秩,且矩陣S是稀疏的,即非零元素個數(shù)比較少。于是形成了如下優(yōu)化問題:
[minl.Srank(L)+λ||S||0s.t.L+S=M] (1)
[||S||0]表示[l0]范數(shù),即矩陣非零元素的個數(shù)。
上式是非凸優(yōu)化問題屬于NP-Hard。通過松弛變換能夠得到已于解決的凸優(yōu)化問題:用[l1]替換[l0]范數(shù),用[L]的范數(shù)[||L||*=iδi(L)]代替[L]的秩。
[minl.S||L||*+λ||S||1s.t.L+S=M] (2)
拉格朗日乘子法一般解決如下式的優(yōu)化問題:
[minf(X),s.t.h(X)=0]
則(2)式魯棒PCA問題能夠用ALM求解,如下式所示:
[minl.Sf(X)=||L||*+λ||S||1s.t.h(X)=M-L-S=0]
上式的增廣拉格朗日函數(shù)如下:
[Γ(L,S,Y,μ)=||L||*+λ||S||1+Y,M-L-S+μ2||M-L-S||2F]
其中,Y 為線性約束乘子,u為懲罰參數(shù),是一個標(biāo)量,<>表示標(biāo)準(zhǔn)內(nèi)積,F(xiàn)表示 Frobenius范數(shù)。
迭代上式最小化求解如下式:
[(Lk+1,Sk+1)=argminL,SΓ(L,S,Yk,μk)]
可以利用交替更新的方式,即首先固定S和Y求一個使[Γ]最小化的L,再固定L和Y,求一個使[Γ]最小的S,這樣迭代數(shù)次就可以收斂到這個子問題的最優(yōu)解。
2.4 評價
此方案較方案一和方案二來說具有很大的優(yōu)越性,其可以進(jìn)行視頻的處理;可以有效的處理光線等自然因素的干擾;同時也可以有效處理乒乓球運動速度的變化;得到的結(jié)果具有魯棒性。此外該算法有個缺點就是因為處理矩陣過程中要進(jìn)行奇異值的分解以及解決凸優(yōu)化的問題,所以該方案算法處理時間較長,效率不高。
3 方案三:基于雙特征的模式識別思想
3.1 原理
乒乓球的顏色是固定的,不會隨著環(huán)境以及球的運動而發(fā)生變化,同時乒乓球是個圓球,對于所有的拍攝角度來說,所拍攝的乒乓球圖像都是圓,所以我們可以利用模式識別的方法進(jìn)行識別圓。綜上利用乒乓球的外形以及顏色兩個特征值進(jìn)行乒乓球的模式識別。
3.2 流程圖
3.3 評價
該方案具有運算速度快的優(yōu)勢,且不需要和方案一一樣需要有背景的更新機(jī)制,重要的是選取了乒乓球的兩個因素作為模式識別的特征值,即:顏色和形狀,得到較好的識別結(jié)果。由于該方案對乒乓球顏色很敏感,因此該方案的缺點就是乒乓球周圍不能有與乒乓球顏色和外形類似的物體,即:此方案必須顏色分明,否則識別乒乓球的結(jié)果會不準(zhǔn)確。