朱大云,洪維先,孫 麗,陶玉寶,彭 勃
(安徽三聯(lián)學(xué)院 安徽 合肥 230000)
圖像識(shí)別技術(shù)是現(xiàn)代文本信號(hào)識(shí)別處理技術(shù)的初始基礎(chǔ)科學(xué),是關(guān)于圖像信號(hào)處理與文本識(shí)別的基礎(chǔ)研究,對(duì)圖像的特征抽取技術(shù)展開研究有益于文字識(shí)別技術(shù)的多元化發(fā)展。
PCA 技術(shù)是目前線性圖像降維識(shí)別方法最重要的基礎(chǔ)技術(shù)之一,在人臉識(shí)別等模式識(shí)別技術(shù)領(lǐng)域中都有著廣泛的研究應(yīng)用。PCA 應(yīng)用的主要意義在于能夠使軟件重建程序過(guò)程執(zhí)行中的時(shí)間誤差達(dá)到最小。由TuturkM 和Pipentlanda 等所提出的對(duì)Eigenfaces 的最著名的識(shí)別方法也就是通過(guò)利用PCA 來(lái)進(jìn)行人臉識(shí)別。Yang 等方法針對(duì)成分特征性剖面法的主要弱點(diǎn),提出了一種三維圖像立體投影成分特征分析方法。在新的yale 和ynnust603 人臉識(shí)別數(shù)據(jù)庫(kù)上的多項(xiàng)實(shí)驗(yàn)分析結(jié)果表明,所提供的方法在人臉識(shí)別率和性能上明顯地要優(yōu)于目前經(jīng)典版的PCA 方法,識(shí)別率平均可分別大幅提高6.7 個(gè)和4 個(gè)百分點(diǎn)[1]。
線性判別分析(LDA)基本思想上就是選擇fisher 這個(gè)準(zhǔn)則中的函數(shù)投射達(dá)到極值的一個(gè)向量投射作為最佳值的投影投射方向,使得一個(gè)樣本被向量投射并達(dá)到這個(gè)投影方向后,類間的向量差異最大,而且在類內(nèi)的向量離散最小。在此基礎(chǔ)上,wilksl 和Duda 分別重新提出了本次判別樣本向量集的基本概念,就是通過(guò)尋找一組樣本判別的子向量空間組成子類型空間,并通過(guò)使用原始樣本判別在子向量空間區(qū)域中的一個(gè)投影向量函數(shù)作為本次判別的基本特征并對(duì)其進(jìn)行樣本識(shí)別。與具有foley-sammon 向量判別值的向量集不同,具有統(tǒng)計(jì)非相關(guān)性的最優(yōu)向量判別值的向量集,必須滿足共軛正交向量條件[2]。
由于它的PCA 和LDA 都用的是基于某些樣本某個(gè)整體局部特征的提取算法,它們往往忽略了每個(gè)樣本的一些局部整體特征。無(wú)圖像監(jiān)督自動(dòng)判別圖像投影(UDP)檢測(cè)技術(shù)主要用于檢測(cè)高維圖像數(shù)據(jù)的高和降維。大部分發(fā)散差函數(shù)準(zhǔn)則主要是對(duì)舊的fisher 散差準(zhǔn)則的一個(gè)改進(jìn),消除了這一問(wèn)題。但該分析方法其實(shí)是一種基于圖像整體圖形特征的圖像識(shí)別分析方法,沒(méi)有考慮這些樣本的其他局部結(jié)構(gòu)特征。
比如aPCA、LDA 和Fisherfaces 等,在直接處理圖像識(shí)別時(shí)也都存在一定的缺點(diǎn)。以進(jìn)行人臉識(shí)別成像為題舉例,將進(jìn)行人臉識(shí)別成像后的一張圖片轉(zhuǎn)換成圖像向量后,其圖像維度往往高達(dá)數(shù)萬(wàn)個(gè)不同維度,這將對(duì)我們后續(xù)的數(shù)據(jù)計(jì)算工作造成很大的困難。當(dāng)樣本數(shù)量較少時(shí),可以使用奇異值分解(SVD)理論,矩陣R 的特征值向量問(wèn)題可以轉(zhuǎn)化為求解矩陣R 的問(wèn)題,以減少計(jì)算量,但在實(shí)際中,訓(xùn)練樣本數(shù)量也可能較大,并且使用SVD 理論不能減少計(jì)算量。對(duì)于識(shí)別圖像,近年來(lái)一種新的更直觀的二維計(jì)算方法,計(jì)算的變量更小,特征提取的處理效率和計(jì)算速度更高。針對(duì)一維計(jì)算方法研究遇到的難點(diǎn)問(wèn)題,楊靖宇小組領(lǐng)導(dǎo)的相關(guān)研究工作人員積極開展了卓有成效的研究工作[3]。
非線性特征提取方法的Fisher 準(zhǔn)則在實(shí)際中的使用中經(jīng)常都會(huì)遇到小問(wèn)題,即使類內(nèi)散點(diǎn)特征矩陣通常被認(rèn)為是一個(gè)奇異矩陣,目前,工作人員已經(jīng)提出了許多特征提取的新方法應(yīng)用來(lái)幫助解決這一奇異矩陣問(wèn)題。現(xiàn)實(shí)中,很多技術(shù)問(wèn)題通常是非線性的、可以被分離的,如使用人臉識(shí)別,所以一些經(jīng)典的案例FDA 在執(zhí)行處理使用人臉識(shí)別等圖像識(shí)別技術(shù)任務(wù)時(shí)并不能完全取得一個(gè)令所有人非常滿意的實(shí)驗(yàn)結(jié)果。支持核的向量計(jì)算機(jī)必須在模式識(shí)別技術(shù)領(lǐng)域廣泛使用這種核技術(shù),其基本設(shè)計(jì)思想是非線性的、可以被分割的原始樣本的輸入空間映射變換定義成一個(gè)可通過(guò)適當(dāng)?shù)姆蔷€性空間映射變?yōu)榭梢员环指畹母呔S特征集的空間映射ф,然而,這類非線性空間映射的ф 分割是通過(guò)直接定義適當(dāng)?shù)膬?nèi)積分和函數(shù)空間來(lái)實(shí)現(xiàn)的。
本文提出了基于樣本特征提取加權(quán)的一種Gabor 特征提取加權(quán)算法,該加權(quán)算法根據(jù)圖中Gabor 兩個(gè)特征向量及其相鄰兩個(gè)分量的特征解導(dǎo)度對(duì)這些特征向量相鄰分量進(jìn)行特征加權(quán),有效地增強(qiáng)這些離散度相對(duì)較小的樣本特征圖像成分在樣本分類分析中的重要作用,同時(shí),它還能充分利用各類樣本特征圖像的海量統(tǒng)計(jì)分析信息,具有較強(qiáng)的魯棒性和高度類別化的刻畫分析能力。圖像識(shí)別技術(shù)是立體數(shù)據(jù)信息和立體視覺(jué)效應(yīng)、運(yùn)動(dòng)信息分析融匯等實(shí)用技術(shù)的基礎(chǔ),其前途是不可被預(yù)計(jì)和無(wú)法限量的。