金雪松,張廣元,孫華東,劉 陽,趙志杰
(哈爾濱商業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,哈爾濱 150028)
?
一種基于極值尋優(yōu)的步態(tài)識別拒識算法
金雪松,張廣元,孫華東,劉 陽,趙志杰
(哈爾濱商業(yè)大學(xué) 計(jì)算機(jī)與信息學(xué)院,哈爾濱 150028)
針對步態(tài)識別在實(shí)際生活中的應(yīng)用,通過極值尋優(yōu),提出了一種在門禁系統(tǒng)中使用的拒識算法.在拒識算法中,尋找使得訓(xùn)練樣本投影后離散程度最小的3個投影方向,并確定投影方向上的識別區(qū)間,再采用一定的投票規(guī)則實(shí)現(xiàn)拒識.實(shí)驗(yàn)結(jié)果表明,本算法能達(dá)到較高的拒識率.
步態(tài)識別;拒識算法;離散程度
圖像識別是數(shù)字圖像處理領(lǐng)域的研究熱點(diǎn),尤其是近幾年隨著計(jì)算機(jī)技術(shù)的快速發(fā)展,圖像識別的應(yīng)用越來越廣泛.而圖像識別中拒識算法一直都是其中的難點(diǎn).目前拒識算法的研究主要集中在語音識別、筆跡識別等,而針對步態(tài)識別中拒識算法的研究較少.
Zhao[1]等通過提取輪廓兩個完整周期的較低維數(shù)的靜態(tài)特征和動態(tài)特征,使得最終的特征更能反映不同個體之間的步態(tài)差異;同時動態(tài)特征也避免了輪廓不 完整造成的影響.為進(jìn)一步提高識別率,采用改進(jìn)的K近鄰法進(jìn)行分類識別.Zhang[2]等針對模式分類任務(wù)中測試樣本存在未知類別輸入的問題,在稀疏表示分類技術(shù)的基礎(chǔ)上提出一種在字典學(xué)習(xí)的目標(biāo)函數(shù)中加入Fisher判別約束,使樣本在該字典下分解的系數(shù)具有較大的類間散度和較小的類內(nèi)散度,將訓(xùn)練樣本在已學(xué)習(xí)字典下進(jìn)行分解,并把分解后的系數(shù)構(gòu)建多個局部線性塊,為已構(gòu)建的線性塊建立超球覆蓋模型,用于描述訓(xùn)練類樣本系數(shù)的分布狀況.對于測試樣本,根據(jù)在已學(xué)字典下的分解系數(shù)是否在訓(xùn)練樣本系數(shù)的覆蓋模型范圍內(nèi),做出拒識或接受分類處理的判決.He[3]等提出嵌入拒識的極限學(xué)習(xí)機(jī),不僅充分利用了極限學(xué)習(xí)機(jī)快速的學(xué)習(xí)能力、良好的泛化性能,而且通過嵌入拒識選項(xiàng),“拒識”可靠性較低的樣本來克服分類正確率較低的問題,使得自動分類過程更加可靠.Robert B·Fisher[4]等提出了一種新的balance-enforced可拒絕優(yōu)化的樹(beotr)活魚的識別.beotr是基于自動構(gòu)建類間相似性.事后,使用軌跡投票為了消除分層分類過程中的累積誤差,最后應(yīng)用高斯混合模型和貝葉斯規(guī)則作為一種拒絕選項(xiàng)后層次分類評價作為一個特定物種的概率過濾器不太自信決定.Liu[5]等提出一種帶有拒識功能的誤差編碼分類方法.利用糾錯編碼把多類分類問題轉(zhuǎn)換成多個兩類分類,再將拒識的方法應(yīng)用到每個分類器中,最后結(jié)合編碼矩陣投票表決得到分類結(jié)果,從而提高分類可靠性.Xu[6]提出基于K近鄰(KNN)和支持向量域描述(SVDD)的分類器KNN-SVDD(KSVDD).該分類器對單類內(nèi)部的樣本采用SVDD 的判別準(zhǔn)則,對類交叉區(qū)域及描述邊界外的樣本采用KNN的判別準(zhǔn)則.通過拒絕描述邊界外的樣本,應(yīng)用于拒識判別.
在以上的算法中,文獻(xiàn)[1]能實(shí)現(xiàn)較高的步態(tài)識別率,但是沒有進(jìn)一步研究拒識算法.而其他文獻(xiàn)中的拒識算法都必須預(yù)先知道識別樣本和拒識樣本的兩類數(shù)據(jù)才能實(shí)現(xiàn).而實(shí)際應(yīng)用中往往只能獲得識別樣本,而無法事先獲得拒識樣本.因此本文提出一種基于極值尋優(yōu)的拒識算法,該算法僅僅利用識別樣本就能獲得較好的拒識率,實(shí)驗(yàn)驗(yàn)證了算法的有效性.
本文采用文獻(xiàn)[1]的步態(tài)識別流程:首先將圖片預(yù)處理、周期檢測,然后特征提取,為后期的拒識提供數(shù)據(jù)支持.數(shù)據(jù)采集的主要流程如圖1所示.
圖1 數(shù)據(jù)采集流程圖
預(yù)處理過程:首先將樣本序列的連續(xù)幀提取出來,單獨(dú)處理一幀圖片.將彩色圖片轉(zhuǎn)換成灰度圖,通過中值算法進(jìn)行濾波,得到背景圖片.然后將每幀灰度圖片與背景圖片幀差處理,確定合適的閾值,得到連續(xù)的二值圖像.再用邊緣檢測sobel算子,提取出人的步態(tài)輪廓信息.其中閾值處理后的二值圖像圖示可能不太理想,通過形態(tài)學(xué)處理,得到輪廓精確的二值圖像.
周期檢測:檢測每幀輪廓的最大寬度,并記錄連續(xù)多幀圖片的最大寬度,相鄰的3個最大寬度之間的連續(xù)幀是一個步態(tài)周期.將檢測到的步態(tài)周期存儲下來,為后期的特征提取做準(zhǔn)備.
角度距離特征:本文提取的特征是角度距離,屬于靜態(tài)特征,維數(shù)大,能較好的區(qū)分不同的樣本.提取一個周期每幀圖片的角度距離,從垂直方向開始,每6°一個區(qū)間,計(jì)算邊緣輪廓的像素點(diǎn)與質(zhì)心的平均距離,再將周期內(nèi)每幀圖片的相同區(qū)間的平均距離求平均值作為該樣本在這個角度區(qū)間里的特征值,最終得到60維的特征向量,如圖2所示.
圖2 角度距離特征
2.1 極值尋優(yōu)
要僅僅通過識別樣本來實(shí)現(xiàn)拒識,就必須使識別樣本在某些投影方向上的離散程度最小,盡可能的使拒識類的測試樣本在投影之后落在識別區(qū)間之外.
設(shè)識別樣本集是X={x1,x2,…,xN},其中每個樣本是60維的列向量.
投影前的均值:
(1)
離散度矩陣定義為:
s=∑(xi-m)(xi-m)T
(2)
設(shè)投影方向?yàn)閣(w也是60維列向量),樣本xi投影后為yi.
投影后的均值和離散度為:
(3)
(4)
(5)
采用拉格朗日尋優(yōu)求極值,計(jì)算如下:
L(w)=wTsw-λ(wTw-1)
(6)
(7)
(8)
2.2 拒識規(guī)則
利用公式(8)找到了60個投影方向,并且識別樣本在這60個向量投影后的離散度依次增大.
設(shè)步態(tài)的樣本集是x={x1,x2,…,xN},每個樣本是60維的列向量.選取投影后離散度最小的投影方向w(w是也是60維的列向量),投影的樣本從60維的特征向量降到一維,即投影向量為坐標(biāo)軸上的一個點(diǎn):
wTxi=yi(i=1,2,…,N)
(9)
樣本集x中的所有樣本投影后,得到點(diǎn)集y={y1,y2,…,yN},并組成識別區(qū)間[ymin,ymax](其中ymin和ymax分別是y={y1,y2,…,yN}中的小值和最大值).當(dāng)測試樣本z在投影方向w投影后:
wTz=z′
(10)
得到投影后的點(diǎn)z′如果落在識別區(qū)間外部,則判定測試樣本在該方向拒識;如果落在識別區(qū)間內(nèi)部,則判定測試樣本在該方向識別.
選取60個投影方向中測試樣本投影后離散度最小的3個投影方向,采用不同投票規(guī)則是實(shí)現(xiàn)拒識.投票規(guī)則一:當(dāng)3個方向中有一個投影方向能拒識測試樣本,則判定該樣本能拒識成功;投票規(guī)則二:當(dāng)3個投影方向有兩個方向同時能拒識測試樣本,則判定該樣本能拒識成功;投票規(guī)則三:當(dāng)3個投影方向同時能拒識測試樣本時,則判定該測試樣本能拒識成功.
本次實(shí)驗(yàn)選取中科院步態(tài)識別數(shù)據(jù)庫中100個不同人的數(shù)據(jù)樣本,其中每個人在90°方向上有6個不同的序列,每個序列至少有45幀連續(xù)的圖片.前20個人為訓(xùn)練樣本,后80個人為測試樣本.
公式(8)中找到60個投影方向的離散程度不同,實(shí)驗(yàn)選取測試樣本投影后離散程度最小的前三個投影方向在Matlab上仿真.表1為實(shí)驗(yàn)結(jié)果.
表1 分別在前3個投影方向的拒識率
投影方向(w)識別區(qū)間拒識率/%w1[(+0 0057)-(+0 0075)]61 88w2[(-0 0059)-(+0 0036)]68 76w3[(+0 0060)-(+0 0032)]30 63
60個投影方向上訓(xùn)練樣本投影后的離散程度不同,并且離散程度由特征向量對應(yīng)的特征值決定.將前42個特征值分成3個不同的數(shù)量級,尋找離散程度與拒識率之間的關(guān)系.實(shí)驗(yàn)結(jié)果如表2所示.可見特征值越小,特征向量(投影方向)上的識別樣本離散程度越小,拒識率越高.
表2 離散度相差較大的投影方向的拒識率
投影方向離散度(特征值數(shù)量級)平均拒識率/%w1-w91.00E-0550.90w10-w231.00E-0432.62w24-w421.00E-0329.17
前兩次實(shí)驗(yàn)都是單個投影方向上的拒識效果,最高的拒識率也不夠理想,所以在前3個投影方向上,實(shí)驗(yàn)不同的投票規(guī)則,盡可能提高拒識率.例如:規(guī)則一:當(dāng)3個方向中有一個投影方向能拒識測試樣本,則判定該樣本能夠成功拒識;規(guī)則二:當(dāng)3個投影方向有兩個方向能拒識測試樣本,則判定該樣本能成功拒識;規(guī)則三:當(dāng)3個投影方向都能拒識測試樣本時,則判定該測試樣本能成功拒識.實(shí)驗(yàn)結(jié)果如表3所示.可見規(guī)則三在實(shí)際應(yīng)用中的安全性太低,即拒識的成功率太低,導(dǎo)致門禁系統(tǒng)的安全性降低.所以實(shí)驗(yàn)結(jié)論是采用第一個拒識規(guī)則較好,拒識率理想,安全性高.
表3 前3個投影方向不同投票規(guī)則的拒識率
拒識規(guī)則拒識率/%一相方向拒識90 63兩個方向拒識75 47三個方向同時拒識18 94
本文提出一種基于極值尋優(yōu)的拒識算法,區(qū)別于傳統(tǒng)的拒識算法,僅僅通過識別樣本,找到投影后的離散程度最小的若干投影方向,并確定投影方向上的識別區(qū)間,采用不同的投票規(guī)則,實(shí)現(xiàn)算法的拒識.實(shí)驗(yàn)結(jié)果驗(yàn)證了該算法的有效性.進(jìn)一步的工作是減少計(jì)算復(fù)雜度以期達(dá)到更好的實(shí)時處理效果.
[1] 趙志杰, 孫小英, 金雪松, 等. 多重圖像輪廓特征結(jié)合的步態(tài)識別算法[J]. 哈爾濱工業(yè)大學(xué)學(xué)報(bào), 2016, 28(4): 182-189.
[2] 廖重陽, 張 洋, 屈光中. 基于Fisher判別字典學(xué)習(xí)的可拒識模式分類模型[J]. 計(jì)算機(jī)工程, 2016, 42(4): 202-208.
[3] 何 穎. 嵌入拒識的極限學(xué)習(xí)機(jī)在基因表達(dá)數(shù)據(jù)分類中的應(yīng)用[J]. 計(jì)算機(jī)應(yīng)用與軟件, 2015, 32(7): 1846-1851.
[4] HUANG P X, BOOM B J, FISHER R B. Fisher hierarchical classification with reject option for live fish recognition [J]. Machine Vision and Applications, 2015, 26: 89-102.
[5] 劉小和, 潘 皓. 基于拒識的誤差編碼車輛分類[J]. 科學(xué)技術(shù)與工程, 2013, 13(30): 8955-8961.
[6] 徐引玲. KSVDD及其在拒識判別中的應(yīng)用[J]. 計(jì)算機(jī)工程, 2010, 36(19): 195-198.
Study on reject algorithm in gait recognition based on extremum optimization
JIN Xue-song, ZHANG Guang-yuan, SUN Hua-dong, LIU Yang, ZHAO Zhi-jie
(School of Computer and Information, Harbin University of Commerce, Harbin 150028, China)
Aiming at the application of gait recognition in real life, a reject algorithm of gait recognition used in access control system was proposed through the extremal optimization. In the reject algorithm, three projection directions with the smallest degree of dispersion after the projection and the recognition interval were determined, and then the algorithm was realized by using certain voting rules of reject. The experimental results showed that the algorithm could achieve high reject rate.
gait recognition; reject algorithm; discrete degree
2016-10-21.
金雪松(1975-),男,博士,副教授,研究方向:信號與信息處理.
TP319
A
1672-0946(2017)03-0301-03