99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看

?

一種快速的基于稀疏表示的人臉識別算法

2014-03-17 05:53:17龍法寧楊夏妮

圖學(xué)學(xué)報 2014年6期

關(guān)鍵詞：范數(shù)識別率字典

龍法寧，楊夏妮

（玉林師范學(xué)院計算機(jī)科學(xué)與工程學(xué)院，廣西玉林 537000）

一種快速的基于稀疏表示的人臉識別算法

龍法寧，楊夏妮

（玉林師范學(xué)院計算機(jī)科學(xué)與工程學(xué)院，廣西玉林 537000）

基于稀疏表示的人臉識別算法(SRC)識別率相當(dāng)高，但是當(dāng)使用l1范數(shù)求最優(yōu)的稀疏表示時，大大增加了算法的計算復(fù)雜度，矩陣隨著維度的增加，計算時間呈幾何級別上升，該文提出利用拉格朗日算法求解矩陣的逆的推導(dǎo)思路，用一種簡化的偽逆求解方法來代替l1范數(shù)的計算，可將運(yùn)算量較高的矩陣求逆運(yùn)算轉(zhuǎn)變?yōu)檩p量級向量矩陣運(yùn)算，基于AR人臉庫的實驗證明，維度高的時候識別率高達(dá)97%，同時，計算復(fù)雜度和開銷比SRC算法大幅度降低95%。

稀疏編碼；分類方法；人臉識別；小波變換；快速算法

模式識別領(lǐng)域，人臉識別的研究相當(dāng)廣泛，各種算法層出不窮。特別在近兩三年對壓縮感知技術(shù)研究浪潮下，Wright等[1]把稀疏表示和人臉識別算法結(jié)合起來，獲得了相當(dāng)高的識別率，基本方法是把所有人臉樣本的集合看作訓(xùn)練集并構(gòu)造為一個超完備字典，而測試的人臉樣本則可通過該超完備字典進(jìn)行稀疏表示。這個表示不但是稀疏的，而且僅包括所有訓(xùn)練樣本的小部分，對應(yīng)其他樣本的稀疏解理想狀態(tài)下應(yīng)該都為零，對于這個超完備字典而言，它是測試樣本最佳的稀疏表示。并且它可以通過l1范數(shù)最小化求得。因此尋找最佳的稀疏表示就能相對完美地區(qū)分出不同類別的訓(xùn)練樣本，但是隨之而來的就是計算機(jī)的運(yùn)算時間大幅度增加。

基于稀疏表示的 SRC人臉識別算法[2]通過構(gòu)造一個用作訓(xùn)練的超完備字典其中 Ai是第i類人臉數(shù)據(jù)的集合，由同類的n幅人臉圖像形成訓(xùn)練字典，每幅圖像有m個像素點(diǎn)作為矩陣 Ai的一列，n是訓(xùn)練數(shù)據(jù)的類別個數(shù)。假設(shè)b為第i類的一個測試樣本，則b可由A線性表示為：

其中λ是一個很小的常數(shù)，那么對測試樣本b的分類方法如下所示：

1 SRC算法時間開銷分析

通過SRC算法的介紹和分析，發(fā)現(xiàn)除了對字典A的降維以外，時間開銷主要集中在求解欠定方程組 y=Ax的最優(yōu)稀疏解。通常情況下，欠定線性方程是沒有唯一解的，由于最優(yōu)重構(gòu)信號的求解計算復(fù)雜度很高，所以大多數(shù)研究聚焦在尋找可接受復(fù)雜度下的近似解（次優(yōu)解）。求次優(yōu)解是把l0范數(shù)放寬到l1范數(shù)通過線性規(guī)劃求解的，但是l1范數(shù)求解的計算復(fù)雜度仍然很高。經(jīng)證明可知道l2范數(shù)是用來度量重構(gòu)誤差的，需通過l2范數(shù)最小化問題找近似解，用l2范數(shù)代替l0范數(shù)，雖然有一定的誤差，但是可以解決l0范數(shù)可能無解的問題，同時在識別率有小幅下降的情況下，計算時間有很大的下降?，F(xiàn)在的算法是求得的解更加精確，但是計算復(fù)雜度更高，為了克服這一缺點(diǎn)越來越多的快速l1-min算法被提出。例如同倫算法、迭代收縮閾值、近端梯度、增廣拉格朗日乘子和梯度投影算法等[3]。

快速l1-min算法各有優(yōu)點(diǎn)，在運(yùn)算速度和正確率兩方面，無論是那一種算法在任何條件下都不可能達(dá)到最好。實際的應(yīng)用當(dāng)中，必須充分考慮人臉數(shù)據(jù)的特點(diǎn)以及應(yīng)用環(huán)境，在運(yùn)算速度和正確率之間找到平衡點(diǎn)，以達(dá)到最好地使用效果。因此在對識別響應(yīng)速度比較高的情況下，即使損失很小的識別率，也需要解決求解l1-min時間代價過大的問題。

2 基于Gabor小波的表情特征提取

文獻(xiàn)[4]通過分析Gabor小波和稀疏表示的生物學(xué)背景和數(shù)學(xué)特性，提出一種基于Gabor小波和稀疏表示的人臉表情識別方法。采用Gabor小波變換對表情圖像進(jìn)行特征提取，建立訓(xùn)練樣本Gabor特征的超完備字典，通過稀疏表示模型優(yōu)化人臉表情圖像的特征向量，利用融合識別方法進(jìn)行多分類器融合識別分類。但是該方法的綜合識別率只有82.3%，并不是很理想。文獻(xiàn)[5]提出了一種結(jié)合Gabor小波特征和SRC算法的人臉識別方法，AR人臉庫的識別率在圖像降維到300維的時候是95%比SRC的87%提高了8%，而維度超過500維時，最高識別率達(dá)到了97.14%，依然比SRC的91.19%提高了6%，但是對Gabor特征降維后圖像數(shù)字字典的時間開銷O(n2)是通過列向量從8781降到917維，維數(shù)依然很高，同時求解欠定線性方程采用的方法和SRC算法一致，運(yùn)算量一致。

因此，本文依舊采用Gabor小波變換來提取表情圖像的初始特征，然后采用別的方法來降低求解線性方程組的計算時間，文獻(xiàn)[6]給出了第j個二維Gabor小波濾波器的公式定義：

式(4)中，σ是與小波頻率帶寬有關(guān)的常數(shù)，z= (x ,y)為空間位置坐標(biāo)，κ確定了Gabor內(nèi)核的方向和尺度。例如，在采用8個方向和5個尺度的采樣時，某人方向和尺度上的κ可以寫為其中為采樣尺度，為尺度標(biāo)號；為采樣方向，為方向標(biāo)號。Kmax為最大頻率，f是頻域中的內(nèi)核間隔因子。令參數(shù)可以獲得較好的小波表征和辨別效果。

對人臉圖像進(jìn)行Gabor小波變換，就是將人臉圖像和Gabor小波的核函數(shù)進(jìn)行卷積。人臉表情圖像像素點(diǎn)z=(x, y)處的Gabor小波特征值是通過式(4)的濾波器與圖像的灰度值ψ ( κ ,z)卷積計算得到：

設(shè) Jk(z)的幅值和相位分別為 Ak和 φkφk，則組合不同尺度和方向的 J(z)，構(gòu)成

k圖像在z位置處的Gabor特征矢量，因此每幅人臉圖像可以通過式(4)獲得小波處理后的新圖像，構(gòu)為新的訓(xùn)練字典。

由于Gabor特征具有良好的空間局部性和方向選擇性，而且對光照、姿態(tài)具有一定的魯棒性，因此在人臉識別中獲得了成功地應(yīng)用。設(shè)圖像的大小為m×n，通過40個濾波器得到Gabor特征的維數(shù)高達(dá)40×m×n，計算量很大，且由于Gabor特征在相鄰像素間是高度相關(guān)和冗余的，所以通常只需要稀疏的提取部分節(jié)點(diǎn)上的Gabor特征，因此可以把Gabor的特征提取和SRC算法結(jié)合起來。

3 快速稀疏分類算法

一般來說人臉數(shù)據(jù)都是可以使用稀疏的信號來表示。那么如果給定測試人臉b是稀疏的或者是可壓縮的，可以通過解如下形式的優(yōu)化問題而獲得稀疏解：

由于SRC算法要獲得良好的人臉識別率，希望求得的解是盡可能的稀疏，而求解l1范數(shù)的常用方法有貪婪算法、凸優(yōu)化算法等，無一例外，都是通過不斷的迭代計算來獲得最優(yōu)的稀疏解，花費(fèi)的時間代價相當(dāng)大。

既然測試人臉b可由A線性表示為 b= Ax，則如果求得 A-1則公式可以轉(zhuǎn)換為： x = A-1b ，令于是有：

由于 xTATb是一個數(shù)，而這個數(shù)的轉(zhuǎn)置是它的本身，因此有：

故式(7)可化為：

由式(9)得：

若x*是 s( x)的極小點(diǎn)，則必有 ▽ s( x )=0，則：ATAx = ATb 即 x =(ATA)-1ATb。

上述方程組的解法需要 ATA正定才能求得ATA的逆，實際問題并不能保證 ATA正定，因此遇到這種情況，修正方法是現(xiàn)在矩陣A對角線k

上的元素都加上同一個數(shù) μ ＞0，則上述方程變?yōu)椋?/p>

這樣做的目的是：即使 ATA是奇異的，μ是一個很小的數(shù)，但是只要將μ取得充分大，總能使(ATA+ μI)正定，從而 (ATA+μI )x=ATb 肯定是有解的。因此，式(11)的目的是通過最小化誤差的平方和尋找數(shù)據(jù)的最佳函數(shù)匹配。從而可以簡便地求得未知的數(shù)據(jù)，并使得所求數(shù)據(jù)與實際數(shù)據(jù)之間誤差的平方和最小，從而可以粗略模擬l2范數(shù)的計算。

綜合上述討論，快速稀疏分類的算法描述的具體步驟如下：

假設(shè)在給定的訓(xùn)練集 B =[B1,B2,…,Bn]中有k類已經(jīng)標(biāo)記好的樣本，其中第i類中含有ni個樣本。每個人臉樣本對應(yīng)于矩陣中的一個列向量 Bi, m為人臉圖像的維數(shù)。

Step 1. 對人臉庫構(gòu)造訓(xùn)練樣本集B，然后對B進(jìn)行小波變換得到新的字典 A= Gabor(B)，同理對測試集也進(jìn)行小波變換。

Step 2.對訓(xùn)練樣本集A中的每一個列向量進(jìn)行PCA降維，同理也對測試集進(jìn)行PCA降維，以確保矩陣是正定的，并且每張人臉的維數(shù)需要比人臉的個數(shù)要小，即構(gòu)成欠定矩陣。

Step 3.對訓(xùn)練集和測試集的每一個列向量 b利用式(11)進(jìn)行不太精確的稀疏編碼，得到稀疏表示其中求逆 A-1并不采用求解l1范數(shù)的最小化算法，而采用向量矩陣的輕量級運(yùn)算其中I是單位矩陣，μ是一個很小的值， (ATA+ μI )-1可以通過求解矩陣偽逆獲得。

Step 4.對稀疏表示后的訓(xùn)練集和測試集采用SVM或SRC分類器進(jìn)行分類決策。

4 實驗結(jié)果及分析

4.1 AR人臉庫識別率

在實驗中，采用AR人臉數(shù)據(jù)庫[7]，從數(shù)據(jù)庫中選出50個男性對象和50個女性對象組成數(shù)據(jù)庫子集。其中，每個對象選擇 14幅僅有光照、表情變化的圖像，其中來自第一時間拍攝的7幅人臉圖像作為訓(xùn)練集，另外的7幅人臉圖像作為測試集，那么，訓(xùn)練集和測試集各有700幅人臉圖像，一共是1400幅人臉圖像，如圖1所示。

圖1 AR無遮擋人臉庫

對 Gabor核函數(shù)中相關(guān)參數(shù)的取值為v=5,u =8，對一幅人臉圖像進(jìn)行5個尺度8個方向上的Gabor小波變換。SVM分類器采用LIBSVM工具包的多類別SVM分類器，分類函數(shù)的參數(shù)是(′-s 1 -t 3 -c 1.2 -g 1.2′)，分別對測試集和訓(xùn)練集的 1400幅圖片進(jìn)行小波變換以后通過PCA分別降維為54、120、300維后進(jìn)行訓(xùn)練學(xué)習(xí)和測試，實驗結(jié)果如表1所示，本文的方法(簡稱Gabor+FastSparse+SVM)。本文方法的識別率在維度超過300以后，就接近甚至超過了結(jié)合小波變換的SRC算法。從表2可以看到，當(dāng)維度到達(dá)500的時候，識別率最高可以達(dá)到97.14%以上，和文獻(xiàn)[5]所采用Gabor+SRC的最佳識別率基本一致，因此可以看到本文方法擁有相當(dāng)高的識別率。

表1 各種人臉識別算法對比(%)

表2 快速稀疏識別算法高維識別率和計算時間

4.2 算法時間開銷

在CPU為Intel Core2 Duo E 7300 ，頻率為2.66 GHz，內(nèi)存為4 G的臺式機(jī)電腦上，對以上算法進(jìn)行了時間統(tǒng)計，為了獲得高識別率，不管是SRC算法還是本文的方法，都需要對人臉庫進(jìn)行小波變換，其所花費(fèi)的時間需96.818965 s，因此下面只對排除小波變換所需的運(yùn)算時間以外的識別時間進(jìn)行統(tǒng)計對比，其中SRC算法采用L1_magic工具包求解稀疏信號重構(gòu)的凸優(yōu)化方法[8]。實驗結(jié)果如表3所示，本文的方法所耗費(fèi)的時間比SRC的算法減少了95%以上。

表3 運(yùn)算時間對比(s)

5 結(jié) 束語

本文方法在保留小波變換特征提取的 SRC算法的高識別率的基礎(chǔ)上，大幅度地降低了識別時間。其原因是基于稀疏表示的SRC算法，為了保留高識別率，必須求解l1范數(shù)的最小最優(yōu)解，使稀疏解盡可能的最小化，因此迭代時間過長，而本文采用了輕量級固定公式運(yùn)算來代替求解l1范數(shù)，從而減少了大量的時間，在稀疏解不夠稀疏的情況下，選擇了采用 SVM分類方法而不是 SRC的分類方法，從而保留了較高的識別率，實驗證明，在沒有優(yōu)化SVM的核函數(shù)的基礎(chǔ)上，當(dāng)圖像降維后大于500維的時候，最大達(dá)到了97%的識別率，如果排除小波轉(zhuǎn)換訓(xùn)練字典和測試字典的時間，識別分類所減少的運(yùn)算時間達(dá)到95%以上，因此有較強(qiáng)的實用價值，下一步工作，如果采用類似圖片分塊的識別方法，相信還可以獲得更佳的識別率。

[1] Wright J, Ma Yi, Mairal J, Sapiro G, Huang T, Yan Shuicheng. Sparse representation for computer vision and pattern recognition [J]. Proceedings of the IEEE, 2010, 98(6): 1031-1044.

[2] Wright J, Yang A Y, Ganesh A, Sastry S S, Ma Y. Robust face recognition via sparse representation [J]. IEEE PAMI, 2009, 31(2): 210-227.

[3] 劉杰, 李昆侖. 快速 L1范數(shù)最小化算法的性能分析和比較[J]. 電腦知識與技術(shù), 2011, 7(19): 4641-4643.

[4] 張娟, 詹永照, 毛啟容, 鄒翔. 基于 Gabor小波和稀疏表示的人臉表情識別[J]. 計算機(jī)工程, 2012, 38(6): 207-208.

[5] Yang Meng, Zhang Lei. Gabor feature based sparse representation for face recognition with Gabor occlusion dictionary [J]. Proc. European Conf. Computer Vision, 2010, 6(5-11): 448-461.

[6] Liu Chengjun, Wechsler H. Gabor feature based classification using the enhanced fisher linear discriminant model for face recognition [J]. IEEE IP, 2002, 11(4): 467-476.

[7] Martinez A, Benavente R. The AR face database [R]. CVC Tech. Report, 24. 1998.

[8] Kim S J, Koh K, Lustig M, Boyd S, Gorinevsky D. A interior-point method for large-scale l1-regularized least squares [J]. IEEE Journal on Selected Topics in Signal Processing, 2007, 1(4): 606-617.

A Fast Face Recognition Algorithm Based on Sparse Representation

Long Faning, Yang Xiani
(Computer Science Department, Yulin Normal University, Yulin Guangxi 537000, China)

As a recently proposed technique, sparse representation based classification (SRC) has been widely used for face recognition (FR). Sparse representation based SRC algorithm has a high recognition rate. While l1-minimization (l1-min) has recently been studied extensively in optimization, the high computational cost associated with the traditional algorithms has largely hindered their application to high-dimensional, large-scale problems. This paper devotes to analyze the working mechanism of SRC and discusses accelerated l1-min techniques using augmented Lagrangian methods, consequently, we propose a very simple yet much more efficient face classification scheme. The performance of the new algorithms is demonstrated in a robust face recognition of AR database. The experimental results verify that these methods can greatly improve the face recognition speed rate (97% decrease), and maintain a high recognition rate (95%). These methods are of practical values.

sparse representation; classification method; face recognition algorithm; gabor wavelet; fast algorithm

TP 311

A

2095-302X(2014)06-0889-04

2014-05-29；定稿日期：2014-07-16

廣西教育廳科研立項項目桂教科研〔2011〕14號文件資助項目(201106LX512)；玉林師范學(xué)院青年科研資助項目(2010YJQN19)

龍法寧(1978-)，男，廣西玉林人，講師，碩士研究生。主要研究方向為圖像處理、模式識別。E-mail：longfaning@163.com

猜你喜歡

范數(shù)識別率字典

家教世界(2023年28期)2023-11-14 10:13:50

家教世界(2023年25期)2023-10-09 02:11:56

基于類圖像處理與向量化的大數(shù)據(jù)腳本攻擊智能檢測

計算機(jī)工程(2020年3期)2020-03-19 12:24:50

基于真耳分析的助聽器配戴者言語可懂度指數(shù)與言語識別率的關(guān)系

中國聽力語言康復(fù)科學(xué)雜志(2019年3期)2019-06-24 09:51:20

提升高速公路MTC二次抓拍車牌識別率方案研究

中國交通信息化(2018年3期)2018-06-13 03:27:58

基于加權(quán)核范數(shù)與范數(shù)的魯棒主成分分析

中國校外教育(下旬)(2017年8期)2017-10-30 17:32:36

矩陣酉不變范數(shù)H?lder不等式及其應(yīng)用

數(shù)學(xué)物理學(xué)報(2017年3期)2017-07-01 16:18:48

我是小字典

創(chuàng)新作文(小學(xué)版)(2016年19期)2016-08-22 05:54:08

讀者(2016年14期)2016-06-29 17:25:50

高速公路機(jī)電日常維護(hù)中車牌識別率分析系統(tǒng)的應(yīng)用

中國交通信息化(2016年2期)2016-06-06 07:28:02

圖學(xué)學(xué)報2014年6期

圖學(xué)學(xué)報的其它文章: 熔融沉積快速成型零件成型方向的多目標(biāo)優(yōu)化; 基于幾何法立體圖像校正的研究; 刀具輪廓亞像素精度閾值分割算法研究; 合成孔徑聚焦超聲成像在混凝土探傷中的應(yīng)用研究; 吊管機(jī)翻車保護(hù)結(jié)構(gòu)的有限元分析與試驗研究; 以工程意識教育為導(dǎo)向的工程圖學(xué)能力培養(yǎng)方法探析

莱阳市| 沧州市| 江孜县| 滕州市| 伽师县| 潼南县| 商丘市| 南澳县| 开阳县| 中卫市| 沈阳市| 扎囊县| 桑日县| 左贡县| 乌拉特中旗| 定州市| 平舆县| 青铜峡市| 登封市| 儋州市| 监利县| 古交市| 中宁县| 彭阳县| 酉阳| 塘沽区| 夏河县| 民和| 陆丰市| 鞍山市| 元阳县| 多伦县| 文山县| 夏津县| 盘锦市| 莫力| 西城区| 武隆县| 绥芬河市| 汝南县| 保德县|

<tfoot id="mmmmm"><noscript id="mmmmm"></noscript></tfoot>

<nav id="mmmmm"><sup id="mmmmm"></sup></nav>