安陽工學(xué)院計(jì)算機(jī)學(xué)院 吳朝霞 郭 強(qiáng)
邊界Fisher分析的一種改進(jìn)
安陽工學(xué)院計(jì)算機(jī)學(xué)院 吳朝霞 郭 強(qiáng)
邊界Fisher分析(MFA)是一種典型的監(jiān)督子空間嵌入特征提取方法。該算法解決了由于線性判別分析高斯假設(shè)所引起的不足,通過最大化類內(nèi)緊湊度和類間區(qū)分度來獲取映射矩陣。該算法雖然相對(duì)與線性判別分析已經(jīng)有了很大的提高,但是在算法執(zhí)行過程中一個(gè)關(guān)鍵的部分,求取每一個(gè)樣本點(diǎn)的近鄰,MFA處理方法簡(jiǎn)單,求得結(jié)果并不能很好的表征近鄰關(guān)系,所以針對(duì)此點(diǎn)進(jìn)行改進(jìn),用一種比較好的方法代替該過程.通過在ORL,耶魯樣本上的人臉識(shí)別實(shí)驗(yàn),驗(yàn)證了該方法非常有效,相對(duì)于原始的MFA算法又有了明顯的提高。
邊界Fisher分析;人臉識(shí)別;特征提取
在現(xiàn)實(shí)條件下,人臉識(shí)別原始數(shù)據(jù)都是高維樣本,而高維樣本并不適應(yīng)于人臉識(shí)別,因?yàn)楦呔S數(shù)據(jù)魯棒性差、計(jì)算復(fù)雜度高,因而在人臉識(shí)別中,降維也就是特征提取是必不可免的。二十多年來,對(duì)于特征提取,國(guó)內(nèi)外學(xué)者提出了各種各樣的方法。最經(jīng)典最基本的特征提取算法是主成份分析(PCA)[1]和線性判別分析(LDA)[2]。針對(duì)于以上經(jīng)典的算法進(jìn)行了大量的改進(jìn),例如MPCA[4],2D-LPP[5],DATER[6]改善了小樣本問題。邊界判別分析(MFA)考慮到LDA的不符合實(shí)際的高斯假設(shè)問題,應(yīng)用邊界樣本進(jìn)行分類。鄰接保留嵌入(NPE),無監(jiān)督判別映射(UDP),,局部判別嵌入(LDE)[10]等都對(duì)鄰接矩陣應(yīng)用的一些改進(jìn)。
以上提高的區(qū)分分析方法,都可以表示做圖嵌入[的形式,通過顏等人提出的圖模型我們發(fā)現(xiàn)以上這些算法降維后的特征應(yīng)用到人臉識(shí)別上效果的不同,完全在于表示各點(diǎn)近鄰關(guān)系的圖的構(gòu)建方法的不同,所以基于這一點(diǎn)我們對(duì)MFA算法做了大量的實(shí)驗(yàn),并找出了一種更好的查找近鄰的方法,應(yīng)用到MFA的圖構(gòu)建過程,實(shí)驗(yàn)證明該方法是有效并且可行的。
利用圖嵌入框架,提出了邊界Fisher分析。此后,MFA算法得到進(jìn)一步的研究和不斷的改進(jìn),下面我們簡(jiǎn)單介紹邊界Fisher分析。
MFA應(yīng)用了圖嵌入框架的思想,它構(gòu)建了兩個(gè)關(guān)鍵性的表示近鄰關(guān)系的圖:一個(gè)叫做本質(zhì)圖,用來表征類內(nèi)緊湊度,記為Gc。另一個(gè)叫做懲罰圖,用來表征類間區(qū)分度,記為Gp。Gc描述了同類數(shù)據(jù)點(diǎn)的近鄰關(guān)系,每個(gè)數(shù)據(jù)點(diǎn)連接了k1個(gè)同類中與之最近的點(diǎn)。Gp描述了類和類之間的邊界關(guān)系,每個(gè)數(shù)據(jù)點(diǎn)連接了k2個(gè)其他類別中與之最近的點(diǎn)。
類內(nèi)散度表示為:
類間散度表示為:
其中:
MFA算法的最佳投影軸w通過如下邊界Fisher判別準(zhǔn)則求出:
。
在求取近鄰過程改為先判斷兩個(gè)樣本臉的每一對(duì)相對(duì)應(yīng)的列是否近鄰,并構(gòu)建兩個(gè)人臉的每一個(gè)相應(yīng)列的近鄰圖,然后查看近鄰圖判斷兩個(gè)臉是否有足夠的列為K近鄰,從而確定兩個(gè)人臉是否為近鄰,通過該方法求取近鄰并應(yīng)用到該算法中,進(jìn)行特征提取。
具體實(shí)施過程如下:
(1)利用主成成份分析降維:首先把樣本投影到PCA子空間,用WPCA表示PCA的投影矩陣。
(2)構(gòu)造類內(nèi)散布矩陣W、類間散布矩陣Wp:
其中p為大于1小于m的值。
(3)將上過程求得的構(gòu)造類內(nèi)散布矩陣W、類間散布矩陣W p代入到原始的邊界Fisher判定準(zhǔn)則中,解下邊最小化問題。
為了上面提出的RMFA算法的分類性能,基于ORL和yale兩個(gè)標(biāo)準(zhǔn)人臉數(shù)據(jù)庫(kù), 本論文對(duì)LDA和MFA算法實(shí)施了系統(tǒng)的對(duì)比實(shí)驗(yàn)。在整個(gè)實(shí)驗(yàn)過程中,所有的人臉圖像樣本被標(biāo)準(zhǔn)化到32×32維。除此之外,在后續(xù)的實(shí)驗(yàn)中我們利用表示隨機(jī)抽取的每個(gè)人的m個(gè)人臉圖像進(jìn)行訓(xùn)練并且使用剩下的n個(gè)人臉圖像用來測(cè)試。對(duì)于三種降維算法,隨著參與學(xué)習(xí)樣本數(shù)的增加識(shí)別率也不斷的提高。在同等條件下MFA識(shí)別率高于LDA是由于LDA算法本身的缺陷,LDA假設(shè)每個(gè)類的觀測(cè)數(shù)據(jù)點(diǎn)都服從高斯分布,現(xiàn)實(shí)中確并非如此。
安陽工學(xué)院青年基金項(xiàng)目群體行為識(shí)別研究(QJJ2015019);河南省教育廳重點(diǎn)研究項(xiàng)目(15A430012)。