• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于PCA和SVM的人臉識(shí)別研究

      2019-05-24 14:12:12付康陳中舉杜友福
      電腦知識(shí)與技術(shù) 2019年7期
      關(guān)鍵詞:機(jī)器學(xué)習(xí)人臉識(shí)別

      付康 陳中舉 杜友福

      摘要:針對(duì)人臉圖像的像素維度太高,不利于機(jī)器識(shí)別的問題,提出了基于PCA和SVM的人臉識(shí)別系統(tǒng)。以LFW數(shù)據(jù)集為數(shù)據(jù)源,使用Python編程語(yǔ)言進(jìn)行測(cè)試。對(duì)數(shù)據(jù)進(jìn)行預(yù)處理后,使用PCA算法對(duì)圖像數(shù)據(jù)降維,最后利用SVM進(jìn)行模型的訓(xùn)練與測(cè)試,獲得實(shí)驗(yàn)結(jié)果。采用網(wǎng)格搜索的方法獲取SVM的最優(yōu)參數(shù),保證了實(shí)驗(yàn)結(jié)果的準(zhǔn)確性。

      關(guān)鍵詞:PCA;SVM;人臉識(shí)別;Python;機(jī)器學(xué)習(xí)

      中圖分類號(hào):TP393 文獻(xiàn)標(biāo)識(shí)碼:A

      文章編號(hào):1009-3044(2019)07-0209-03

      Abstract: Aiming at the problem that the pixel dimension of the face image is too high, which is not conducive to machine recognition, a face recognition system based on PCA and SVM is proposed. The LFW data set is used as the data source and the Python programming language is used to test. After preprocessing the data, the PCA algorithm is used to reduce the dimensionality of the image data. Finally, the SVM is used to train and test the model, and the experimental results are obtained. The grid search method is used to obtain the optimal parameters of the SVM, which ensures the accuracy of the experimental results.

      Key words:PCA;SVM;face recognition;Python;machine learning

      人臉識(shí)別是圖像模式識(shí)別與計(jì)算機(jī)視覺領(lǐng)域的一個(gè)重要研究?jī)?nèi)容,它根據(jù)人類的面部特征(幾何或統(tǒng)計(jì)特征等)來(lái)進(jìn)行身份鑒別。1965年,Bledsoe等人在PanoramicResearchInc上發(fā)表了第一篇人臉識(shí)別的報(bào)告[1],他們用臉部器官間的間距等參數(shù)作為特征,構(gòu)建了一個(gè)半自動(dòng)人臉識(shí)別系統(tǒng),開始了真正意義上的人臉識(shí)別研究。1965年至1990年,基于幾何結(jié)構(gòu)特征的方法和基于模板匹配的方法是人臉識(shí)別的主要方法。1991年,麻省理工學(xué)院的Turk等人提出了特征臉Eigenface[2],該方法是后來(lái)其他大多數(shù)算法的基準(zhǔn)。1992年,Brunelli等通過實(shí)驗(yàn)得出基于模板匹配的方法優(yōu)于基于幾何結(jié)構(gòu)特征的方法[3]的結(jié)論。1997年,Belhumeur等人提出了基于子空間分析的人臉識(shí)別算法Fisherface[4],它先通過主成份分析方法將人臉降維,然后采用線性判別分析LDA期望獲得類間差異大且類內(nèi)差異小的線性子空間,所以它無(wú)法對(duì)復(fù)雜的非線性模型進(jìn)行建模。到了21世紀(jì),出現(xiàn)了許多對(duì)局部領(lǐng)域像素亮度或顏色值進(jìn)行手工特征提取的方法,例如對(duì)人臉比較有效的基于無(wú)監(jiān)督學(xué)習(xí)的特征LearningDescriptors[5]與GaborFace、LBPFace[6]等。

      目前,大多數(shù)情況下計(jì)算機(jī)讀取的是一張靜態(tài)二維圖片,這些圖片本質(zhì)上是由多維數(shù)字矩陣組成,如一張256×256的RGB彩色圖片就有196608個(gè)數(shù)字。針對(duì)這種情況,計(jì)算機(jī)可以使用人類設(shè)計(jì)的算法從圖像中提取特征或者學(xué)習(xí)到特征。

      以LFW數(shù)據(jù)集為數(shù)據(jù)源,首先將數(shù)據(jù)分為訓(xùn)練集與測(cè)試集,使用PCA(主成分分析)對(duì)訓(xùn)練集的數(shù)據(jù)進(jìn)行降維,獲得人臉特征向量(特征臉)。然后將訓(xùn)練數(shù)據(jù)放入SVM(支持向量機(jī))中,利用網(wǎng)格搜索的方法獲取最優(yōu)參數(shù),得到一個(gè)支持向量分類器。最后使用支持向量分類器對(duì)測(cè)試集數(shù)據(jù)進(jìn)行預(yù)測(cè),得到準(zhǔn)確率。

      1 相關(guān)技術(shù)

      1.1 PCA降維

      降維的過程實(shí)質(zhì)是一個(gè)線性變換的過程,它的核心思想是將數(shù)據(jù)沿方差最大方向投影,使它們更易于區(qū)分。PCA(主成分分析)在減少數(shù)據(jù)集維數(shù)的同時(shí),保持著數(shù)據(jù)集中對(duì)方差貢獻(xiàn)最大的特征[7]。

      圖片的本質(zhì)是多維數(shù)據(jù)矩陣,在Python程序中讀取下載完畢的數(shù)據(jù),將其保存為特征向量矩陣[X],其中,矩陣的每一行是一個(gè)圖像實(shí)例,每一列是一個(gè)特征值。使用PCA算法首先將每一行的數(shù)據(jù)進(jìn)行零均值化處理并且計(jì)算協(xié)方差矩陣[Cov=1mXXT]。然后,計(jì)算協(xié)方差矩陣[Cov]的特征值以及它們對(duì)應(yīng)的特征向量。假設(shè)需要將數(shù)據(jù)降維到k維,那么根據(jù)特征值的大小將特征向量從上到下進(jìn)行排列,取前k行組成新的矩陣Q,最后將矩陣Q與矩陣X相乘之后,便獲得人臉圖像數(shù)據(jù)降維到k維的數(shù)據(jù)。

      1.2支持向量分類器

      SVM(支持向量機(jī))是一種常用的機(jī)器學(xué)習(xí)分類方法,它通過構(gòu)造最優(yōu)超平面,使分類誤差達(dá)到最小。針對(duì)非線性分類問題,SVM通過核函數(shù)的非線性變換將輸入空間變換到一個(gè)高維空間,然后在這個(gè)新空間求得最優(yōu)分類面[8]。實(shí)際上,SVM就是找到一個(gè)距離分類樣本點(diǎn)間隔最大的分類超平面[wx+b=0]。針對(duì)多分類問題,也可以將其分解為多個(gè)二分類問題。人臉識(shí)別是典型的非線性支持向量機(jī)分類問題,分類流程如下:

      使用Python中sklearn包的SVM方法實(shí)現(xiàn)分類的過程。其中,kernel的值設(shè)為rbf,表示核函數(shù)的類型為高斯核函數(shù);class_weight的值設(shè)為balanced,表示每個(gè)類的權(quán)重是它出現(xiàn)頻數(shù)的倒數(shù)。

      1.3網(wǎng)格搜索

      在人臉識(shí)別問題中,選擇高斯核函數(shù)來(lái)構(gòu)造支持向量分類器時(shí),參數(shù)[σ]的選擇十分重要。在高維特征空間中,參數(shù)[σ]的大小會(huì)決定數(shù)據(jù)分布的復(fù)雜程度。同樣地,懲罰參數(shù)C的選擇也會(huì)對(duì)分類器的性能產(chǎn)生影響。遍歷多種參數(shù)組合,選擇其中表現(xiàn)最好的組合,是參數(shù)選擇中常用的一種方法。因?yàn)檫@種方法像網(wǎng)格一樣交叉,所以被形象地稱為網(wǎng)格搜索。

      使用Python的GridSearchCV方法可以實(shí)現(xiàn)網(wǎng)格搜索,其中的參數(shù)C表示對(duì)分類錯(cuò)誤的懲罰程度,C越高越不能容忍誤差,易過擬合;C越低,分類器對(duì)誤差的容忍度越高,易欠擬合。GridSearchCV參數(shù)中的gamma=[-12σ2],gamma越大,[σ]越小,對(duì)應(yīng)的支持向量也就越少,gamma值越小則支持向量越多。

      2 基于PCA和SVM的人臉識(shí)別實(shí)驗(yàn)

      2.1實(shí)驗(yàn)數(shù)據(jù)來(lái)源

      實(shí)驗(yàn)數(shù)據(jù)來(lái)自LFW數(shù)據(jù)集,它是2010~2015年知名領(lǐng)導(dǎo)人的一系列照片。在編寫Python程序時(shí),使用sklearn.dataset中的fetch_lfw_people進(jìn)行數(shù)據(jù)的加載,選擇最少擁有80張照片的類別。圖片總張數(shù)為1140張,特征數(shù)為1850個(gè),類的個(gè)數(shù)為5,數(shù)據(jù)以數(shù)組的形式被加載之后,將數(shù)據(jù)維度降為150。通過調(diào)用train_test_split方法將數(shù)據(jù)分為訓(xùn)練數(shù)據(jù)集與測(cè)試數(shù)據(jù)集兩個(gè)部分,訓(xùn)練數(shù)據(jù)集占80%,測(cè)試數(shù)據(jù)集占20%。

      2.2實(shí)現(xiàn)流程

      使用Python語(yǔ)言來(lái)完成基于PCA和SVM的人臉識(shí)別系統(tǒng)設(shè)計(jì),具體實(shí)現(xiàn)流程如圖1所示:

      3 實(shí)驗(yàn)結(jié)果

      3.1測(cè)試結(jié)果

      在完成支持向量分類器的訓(xùn)練之后,使用測(cè)試集數(shù)據(jù)對(duì)分類器的準(zhǔn)確率進(jìn)行測(cè)試,結(jié)果如表1所示:

      其中,查準(zhǔn)率(P)表示所有預(yù)測(cè)為此人的樣本中,實(shí)際上為此人的百分比,越高越好;查全率(R)表示所有實(shí)際上為此人的樣本中,成功預(yù)測(cè)為此人的百分比,越高越好。F1分?jǐn)?shù)=[2PR(P+R)],當(dāng)F1分?jǐn)?shù)較高時(shí),分類器的表現(xiàn)更好。由表1可知F1分?jǐn)?shù)最后為0.90,所以此分類器具有較好的表現(xiàn)。

      3.2效果展示

      4 總結(jié)

      本文利用PCA技術(shù)對(duì)人臉圖像進(jìn)行降維,并提取重要特征;使用SVM技術(shù)訓(xùn)練機(jī)器識(shí)別不同的人臉圖片,將它們進(jìn)行分類。實(shí)驗(yàn)結(jié)果表明,基于PCA與SVM的人臉識(shí)別系統(tǒng)在特定的人臉庫(kù)中進(jìn)行人臉識(shí)別是可行的。通過網(wǎng)格搜索進(jìn)行參數(shù)選擇,提高了分類器的準(zhǔn)確率,要進(jìn)一步提高準(zhǔn)確率,還可以通過選取更具區(qū)分力的特征來(lái)實(shí)現(xiàn)。所以,可以圍繞不同特征維數(shù)對(duì)識(shí)別準(zhǔn)確率的影響來(lái)展開后續(xù)研究。

      參考文獻(xiàn):

      [1] BledsoeW W.Man-machinefacialrecognition[J].Rep.PRI,1966,22.

      [2] Turk M,Pentland A.Eigenfacesforrecognition[J].Journalofcognitiveneuroscience,1991,3(1):71-86.

      [3] Brunelli R,PoggioT.Facerecognition:Featuresvel usternplates[J].IEEEtransactionsonpatternanalysisandmachineintelligence,1993,15(10):1042-1052.

      [4] Belhumeur P N,Hespanha J P,Kriegman D J.Eigenfacesvs.fisherfaces:Recognitionusingclassspecificlinearprojection[J].IEEETransactionsonpatternanalysisandmachineintelligence,1997,19(7):711-720.

      [5] Winder S A J,Brown M,Learninglocalimagedescriptors[C]//ComputerVisionandPatternRecognition,2007.CVPR07.IEEEConferenceon.IEEE.2007:1-8.

      [6] Chen D,Cao X,Wen F,et al.Blessingofdimensionality:High—dimensionalfeatureanditsefficientcompressionforfaceverification[C]//ProceedingsoftheIEEEConferenceonComputerVisionandPattern Recognition,2013:3025-3032.

      [7] 李德福,黃新.基于二維PCA和SVM算法的人臉識(shí)別系統(tǒng)[J].桂林電子科技大學(xué)學(xué)報(bào),2017(5):391-395.

      [8] 楊梅芳,石義龍.基于2DPCA+PCA與SVM的人臉識(shí)別[J].信息技術(shù),2018(2):32-36.

      【通聯(lián)編輯:唐一東】

      猜你喜歡
      機(jī)器學(xué)習(xí)人臉識(shí)別
      人臉識(shí)別 等
      揭開人臉識(shí)別的神秘面紗
      基于機(jī)器學(xué)習(xí)的圖像特征提取技術(shù)在圖像版權(quán)保護(hù)中的應(yīng)用
      基于網(wǎng)絡(luò)搜索數(shù)據(jù)的平遙旅游客流量預(yù)測(cè)分析
      前綴字母為特征在維吾爾語(yǔ)文本情感分類中的研究
      基于支持向量機(jī)的金融數(shù)據(jù)分析研究
      基于類獨(dú)立核稀疏表示的魯棒人臉識(shí)別
      基于K-L變換和平均近鄰法的人臉識(shí)別
      股票| 阳朔县| 东海县| 都江堰市| 达孜县| 南投市| 林芝县| 长子县| 嫩江县| 宁津县| 马关县| 扬州市| 滨州市| 庆阳市| 西宁市| 洛川县| 马龙县| 锦屏县| 河源市| 八宿县| 博白县| 绥江县| 大渡口区| 安徽省| 兴和县| 伊通| 灵川县| 山西省| 富宁县| 阳曲县| 光泽县| 积石山| 娄烦县| 敖汉旗| 永吉县| 建阳市| 南溪县| 襄汾县| 浑源县| 祁门县| 诸暨市|