• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)

      2023-08-04 05:52:04祖婷余興國(guó)
      電腦知識(shí)與技術(shù) 2023年18期
      關(guān)鍵詞:圖像增強(qiáng)魯棒性人臉識(shí)別

      祖婷,余興國(guó)

      (安徽機(jī)電職業(yè)技術(shù)學(xué)院互聯(lián)網(wǎng)與通信學(xué)院,安徽 蕪湖 241002)

      0 引言

      數(shù)字圖像處理技術(shù)在人臉識(shí)別領(lǐng)域的應(yīng)用越來(lái)越廣泛,其中圖像增強(qiáng)技術(shù)能夠顯著提高人臉識(shí)別系統(tǒng)的性能和準(zhǔn)確性[1]。人臉識(shí)別技術(shù)在安全監(jiān)控、金融交易、身份驗(yàn)證等領(lǐng)域發(fā)揮著重要的作用,但仍面臨著面部表情、光照條件、遮擋等因素的干擾,導(dǎo)致識(shí)別準(zhǔn)確性和魯棒性不夠理想的問(wèn)題[2]。經(jīng)過(guò)廣泛調(diào)研,圖像增強(qiáng)技術(shù)可以有效地克服這些挑戰(zhàn),并且可以提高人臉識(shí)別系統(tǒng)的性能和準(zhǔn)確性,能夠更好地服務(wù)于人們的生活和工作。因此,本文提出了一種基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng),旨在通過(guò)圖像增強(qiáng)技術(shù)提高人臉圖像的質(zhì)量,進(jìn)而提高人臉識(shí)別系統(tǒng)的性能和準(zhǔn)確性。具體地說(shuō),首先對(duì)圖像中值濾波器的中值函數(shù)進(jìn)行優(yōu)化,提出了一種效率更高的中值函數(shù),同時(shí)通過(guò)分析函數(shù)的導(dǎo)數(shù)和偏導(dǎo)數(shù),提出了一種新的邊緣處理算法。然后,利用直方圖處理進(jìn)一步增強(qiáng)圖像的質(zhì)量。最后,采用深度學(xué)習(xí)技術(shù)設(shè)計(jì)了人臉識(shí)別模型,并將增強(qiáng)后的圖像輸入模型進(jìn)行訓(xùn)練和測(cè)試,以驗(yàn)證基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng)的有效性和可行性。

      1 相關(guān)工作

      近年來(lái),人臉識(shí)別技術(shù)在智能安防、高校、教育等領(lǐng)域中應(yīng)用廣泛,同時(shí)圖像增強(qiáng)技術(shù)也在圖像處理領(lǐng)域得到廣泛應(yīng)用。圖像增強(qiáng)是一種特殊的處理方法,它根據(jù)需要突出圖像的細(xì)節(jié),忽略或清除不需要的信息,使處理結(jié)果更適合人類視覺(jué)特性或機(jī)器識(shí)別系統(tǒng)。圖像增強(qiáng)技術(shù)在國(guó)內(nèi)也得到了廣泛的應(yīng)用[3]。

      在國(guó)內(nèi),人臉識(shí)別技術(shù)的研究起步較早,研究成果較為豐富。其中,深度學(xué)習(xí)是當(dāng)前人臉識(shí)別領(lǐng)域研究的熱點(diǎn),其應(yīng)用廣泛,識(shí)別精度較高。國(guó)內(nèi)的研究者們將圖像增強(qiáng)技術(shù)應(yīng)用于醫(yī)學(xué)圖像、遙感圖像等領(lǐng)域。北京大學(xué)的研究人員提出了一種基于深度學(xué)習(xí)的超分辨率重建算法,它可以將低分辨率的醫(yī)學(xué)圖像重建為高分辨率,從而提高了醫(yī)學(xué)圖像的質(zhì)量和可視化效果[4]。此外,還有一些研究者將圖像增強(qiáng)技術(shù)應(yīng)用于文化遺產(chǎn)保護(hù)、視頻監(jiān)控等領(lǐng)域,并取得了一些令人矚目的研究成果。中國(guó)科學(xué)院計(jì)算技術(shù)研究所的研究人員提出了一種基于人臉識(shí)別技術(shù)的智能門(mén)禁系統(tǒng),利用深度學(xué)習(xí)算法對(duì)人臉進(jìn)行檢測(cè)和識(shí)別,同時(shí)結(jié)合語(yǔ)音識(shí)別技術(shù)實(shí)現(xiàn)門(mén)禁的開(kāi)啟和關(guān)閉[5]。此外,一些研究者還將人臉識(shí)別技術(shù)應(yīng)用于在線教育、電子政務(wù)等領(lǐng)域,取得了良好的效果。在國(guó)外,人臉識(shí)別技術(shù)的研究也取得了較大進(jìn)展。當(dāng)前,以深度學(xué)習(xí)為主的人臉識(shí)別技術(shù)在國(guó)外也被廣泛應(yīng)用于安防、金融、交通等領(lǐng)域[6]。例如,美國(guó)IBM公司研究人員提出了一種基于深度學(xué)習(xí)的人臉識(shí)別技術(shù),能夠?qū)崿F(xiàn)對(duì)遮擋、姿態(tài)變化等情況下的人臉進(jìn)行準(zhǔn)確識(shí)別[7]。

      本文通過(guò)研究基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng),來(lái)提高人臉識(shí)別系統(tǒng)的準(zhǔn)確率和魯棒性。首先,提出了一種高效的圖像增強(qiáng)方法,該方法能夠提高圖像的質(zhì)量并突出人臉圖像的細(xì)節(jié)。其次,通過(guò)采用深度學(xué)習(xí)技術(shù)設(shè)計(jì)了一種高效的人臉識(shí)別模型,并將增強(qiáng)后的圖像輸入模型進(jìn)行訓(xùn)練和測(cè)試。最后,通過(guò)實(shí)驗(yàn)結(jié)果驗(yàn)證了本文提出的方法在人臉識(shí)別領(lǐng)域的有效性和可行性,證明了該方法在實(shí)際應(yīng)用中的潛力。

      2 基于圖像增強(qiáng)的人臉識(shí)別的算法

      2.1 相關(guān)理論

      2.1.1 邊緣處理的分析方法

      2.1.2 直方圖處理

      灰度等級(jí)[0,L-1]為數(shù)字圖像的直方圖范圍為離散函數(shù)h(rk)=nk其中rk是第k級(jí)灰度,nk是圖像中灰度級(jí)為rk的像素個(gè)數(shù)。經(jīng)常以圖像中像素的總數(shù)(用n表示)來(lái)除以它的每個(gè)值,以得到歸一化的直方圖。因此,一個(gè)歸一化的直方圖由P(rk)=nk/n給出,其中k=0,1,...,L-1。

      2.2 算法設(shè)計(jì)

      中值濾波器的基本原理是將一個(gè)點(diǎn)的鄰域中的每個(gè)點(diǎn)的值的中值替換為數(shù)字圖像或數(shù)列中的一個(gè)點(diǎn)的值。設(shè)有一個(gè)一維序列f1,f2,...,fn,取窗口長(zhǎng)度為m,對(duì)此序列進(jìn)行中值濾波,就是從輸入序列中相繼抽出m個(gè)數(shù),fi-v,...,fi,...,fi+v,其中i為窗口的中心位置,再將這m個(gè)點(diǎn)按其數(shù)值大小排列,取其序號(hào)為正中間的那作為輸出。用數(shù)學(xué)公式表示為:

      算法:

      輸入:原始數(shù)據(jù)Data

      輸出:新數(shù)據(jù)

      2.3 實(shí)驗(yàn)分析

      實(shí)驗(yàn)環(huán)境:Inter(R) Core?i5-8250U @ 1.6GHz(8 CPUs),16G,64 位Windows 操作系統(tǒng),使用Matlab 實(shí)現(xiàn)。本實(shí)驗(yàn)中使用的數(shù)據(jù)集LFW,LFW是一種常用的人臉識(shí)別測(cè)試數(shù)據(jù)集,其中包含了生活場(chǎng)景中的人臉圖像,涵蓋了多種難度因素,例如多姿態(tài)、光照、表情、年齡、遮擋等,這些因素可能導(dǎo)致同一人的照片差別很大。此外,數(shù)據(jù)集中還包含了一些多人臉圖像,本文的實(shí)驗(yàn)只選擇其中心坐標(biāo)的人臉作為目標(biāo),其他區(qū)域的視為背景干擾。

      在本實(shí)驗(yàn)中,從LFW數(shù)據(jù)集中選取了所有人物照片大于兩張的數(shù)據(jù)集,共有1 681 個(gè)數(shù)據(jù)集滿足此條件。采用隨機(jī)形式從這1 681個(gè)數(shù)據(jù)集中選取一對(duì)人臉,其中一張輸入到人臉識(shí)別系統(tǒng)中,另一張用于測(cè)試匹配準(zhǔn)確率和測(cè)試時(shí)間。實(shí)驗(yàn)中對(duì)于每個(gè)n,n∈{10,20,30,40,50,60,70},進(jìn)行了50次實(shí)驗(yàn)并記錄了準(zhǔn)確率和時(shí)間。最終的實(shí)驗(yàn)結(jié)果是取50次實(shí)驗(yàn)的平均值。實(shí)驗(yàn)結(jié)果如圖1所示。

      圖1 不同特征向量下人臉識(shí)別的準(zhǔn)確率

      根據(jù)實(shí)驗(yàn)結(jié)果,從圖1 中可以發(fā)現(xiàn)隨著n數(shù)值的增加,平均準(zhǔn)確率基本保持下降的趨勢(shì),而在n=20時(shí)準(zhǔn)確率最高,n=70時(shí)準(zhǔn)確率最低。由此可以推測(cè)出現(xiàn)這種現(xiàn)象的原因是,當(dāng)特征空間的維度過(guò)高時(shí),即使存在少許偏差,也會(huì)導(dǎo)致測(cè)試圖像的特征向量與其匹配向量產(chǎn)生較大的偏移,使其接近于其他圖像的特征向量。隨著n的增加,偏差后與其他點(diǎn)接近的可能性變得更大,因此測(cè)試準(zhǔn)確率會(huì)隨著n的增加而下降。

      由此可以得出,當(dāng)特征空間的維度過(guò)高時(shí),特征向量之間的距離會(huì)變得更加稀疏,這會(huì)導(dǎo)致在匹配過(guò)程中產(chǎn)生更多的錯(cuò)誤匹配。同時(shí),由于特征空間維度的增加,需要更多的計(jì)算和存儲(chǔ)資源,因此計(jì)算時(shí)間也會(huì)隨之增加。因此,在進(jìn)行人臉識(shí)別任務(wù)時(shí),需要綜合考慮特征空間的維度和計(jì)算時(shí)間,以找到最優(yōu)的平衡點(diǎn)。

      同時(shí)在MATLAB 中完成圖像平滑和銳化的效率驗(yàn)證。首先將一個(gè)圖像讀入內(nèi)存,在內(nèi)存中存儲(chǔ)。圖像經(jīng)過(guò)噪聲去噪處理后。通過(guò)新函數(shù)的系數(shù)變化,觀察隨著系數(shù)的變化圖像的處理效果,達(dá)到實(shí)現(xiàn)程序的目的。

      由于快速排序需要調(diào)用遞歸函數(shù)所以花費(fèi)的時(shí)間較長(zhǎng),通過(guò)計(jì)算也證實(shí)如此,它處理一幅椒鹽噪聲的圖像需要7.146 000 s。

      經(jīng)過(guò)綜合分析,快速排序是經(jīng)過(guò)冒泡排序得到,通過(guò)冒泡排序最基本的排序上進(jìn)行改進(jìn),由于傳統(tǒng)的冒泡排序只需要找到中間值,所以在冒泡的過(guò)程中,當(dāng)找到中間那個(gè)值就停止冒泡,處理同樣一幅椒鹽噪聲的圖像需要1.205 000 s。

      3 基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng)設(shè)計(jì)

      基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng)設(shè)計(jì)在總體上分為五個(gè)階段:采集人臉圖像數(shù)據(jù)、對(duì)圖像進(jìn)行人臉檢測(cè)、對(duì)檢測(cè)到的圖像進(jìn)行圖像平滑銳化去噪處理、建立人臉識(shí)別的模型、進(jìn)行人臉識(shí)別,其中后四個(gè)階段是系統(tǒng)設(shè)計(jì)的重點(diǎn)。算法模型的建立采用Python 程序設(shè)計(jì)語(yǔ)言,以TensorFlow 作為數(shù)學(xué)運(yùn)算框架,模型的測(cè)試和運(yùn)行環(huán)境使用當(dāng)前主流的Python IDE,即PyCharm。具體設(shè)計(jì)思路如圖2所示。

      圖2 基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng)設(shè)計(jì)過(guò)程和原理

      3.1 人臉圖像采集

      使用OpenCV作為計(jì)算機(jī)視覺(jué)函數(shù)庫(kù)來(lái)采集人臉圖像。首先,在Python 環(huán)境中導(dǎo)入cv2 庫(kù),通過(guò)cv2 庫(kù)來(lái)管理攝像頭并捕捉人臉圖像。為了便于后續(xù)的數(shù)據(jù)處理,采用resize()函數(shù)將圖像壓縮至統(tǒng)一尺寸。此外,需要定義一個(gè)用于存放人臉彩色圖片的文件夾和一個(gè)用于存放人臉灰度圖像的文件夾。通過(guò)這些步驟,實(shí)現(xiàn)了輕量級(jí)且運(yùn)行高效的人臉圖像采集。

      3.2 人臉檢測(cè)

      首先,進(jìn)行重采樣操作,得到一系列尺寸不同的待檢測(cè)圖像,將其輸入到P-Net網(wǎng)絡(luò)中,得到一系列矩形邊框。然后,使用R-Net對(duì)這些矩形邊框進(jìn)行進(jìn)一步篩選,篩選結(jié)果是回歸框,同時(shí)以回歸框的坐標(biāo)更新原先矩形框的坐標(biāo)。這個(gè)過(guò)程類似于迭代優(yōu)化的過(guò)程,經(jīng)過(guò)多次迭代可以提高人臉檢測(cè)的精度。Onet的處理過(guò)程與R-Net相似。在該階段,最終的目標(biāo)是實(shí)現(xiàn)對(duì)人臉和人臉關(guān)鍵點(diǎn)的檢測(cè)。為了獲得數(shù)量充足的樣本,在人臉檢測(cè)過(guò)程中,針對(duì)每張人臉圖片,采集多個(gè)樣本,同時(shí)設(shè)置攝像頭采集的時(shí)間間隔為100毫秒。同一個(gè)人的人臉圖片狀態(tài)在采集過(guò)程中是可以發(fā)生變化的,如面部的輕微轉(zhuǎn)動(dòng)以及由此而造成的光線強(qiáng)弱的變化等,從而保證了樣本的多樣性,便于系統(tǒng)在訓(xùn)練過(guò)程中提取足夠的人臉特征信息,最終提高了系統(tǒng)的魯棒性。

      3.3 模型建立與訓(xùn)練

      該模型包含三個(gè)卷積層、兩個(gè)池化層、兩個(gè)全連接層和一個(gè)輸出層,采用softmax 函數(shù)傳遞輸出結(jié)果,并使用AdamOptimizer 作為優(yōu)化器,采用交叉熵函數(shù)作為損失函數(shù)進(jìn)行模型訓(xùn)練。為了防止過(guò)擬合,對(duì)于參數(shù)更新策略,每次卷積過(guò)程中都設(shè)置了一個(gè)固定比例,以確保參數(shù)不會(huì)全部更新。卷積層用于提取圖像特征,池化層用于降低圖像維度,全連接層用于將卷積層和池化層提取的特征進(jìn)行分類。采用交叉熵函數(shù)作為損失函數(shù),通過(guò)梯度下降法傳遞誤差可以逐步調(diào)整模型參數(shù)以提高模型性能。同時(shí),在訓(xùn)練過(guò)程中也采取了一些措施來(lái)防止過(guò)擬合,比如設(shè)置參數(shù)更新比例和隨機(jī)選擇樣本進(jìn)行訓(xùn)練等。通過(guò)模型的訓(xùn)練和測(cè)試,可以得到一個(gè)在人臉識(shí)別領(lǐng)域表現(xiàn)良好的模型,該模型可以用于后續(xù)的人臉識(shí)別應(yīng)用中。

      3.4 人臉識(shí)別

      基于訓(xùn)練好的模型,對(duì)新的人臉數(shù)據(jù)進(jìn)行識(shí)別。具體地說(shuō),將經(jīng)過(guò)預(yù)處理后的人臉圖像輸入到模型中,模型通過(guò)一系列的卷積、池化、全連接等操作提取人臉特征,最終輸出對(duì)應(yīng)的分類結(jié)果。在本系統(tǒng)中,分類結(jié)果采用獨(dú)熱編碼方式表示,每個(gè)狀態(tài)值對(duì)應(yīng)一個(gè)具體的人臉。如果輸出結(jié)果不在已有的狀態(tài)值集合中,系統(tǒng)將會(huì)給出相應(yīng)的提示。同時(shí),為了驗(yàn)證模型的魯棒性和抗干擾性,可以進(jìn)行多次測(cè)試,并人為改變照片的拍攝光線、角度等條件,以檢驗(yàn)?zāi)P偷男阅堋?/p>

      4 基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng)實(shí)現(xiàn)

      4.1 系統(tǒng)結(jié)構(gòu)

      這是一個(gè)人臉識(shí)別系統(tǒng),接受一個(gè)經(jīng)過(guò)MTCNN檢測(cè)和灰度處理后的圖像作為輸入,可能包含一張或多張人臉。該系統(tǒng)的核心處理結(jié)構(gòu)包括三個(gè)卷積層、三個(gè)池化層和兩個(gè)全連接層。具體來(lái)說(shuō),它首先進(jìn)行第一次卷積,然后進(jìn)行第一次池化,接著進(jìn)行第二次卷積和第二次池化,再進(jìn)行第三次卷積和第三次池化,最后經(jīng)過(guò)兩個(gè)全連接層處理。輸出是一個(gè)離散變量,表示每張人臉對(duì)應(yīng)的標(biāo)識(shí)(姓名首字母)。

      4.2 模型主要參數(shù)

      人臉識(shí)別系統(tǒng)輸入的人臉圖像經(jīng)過(guò)灰度處理后的大小為64x64像素。在該系統(tǒng)的卷積層中,每個(gè)卷積核的大小為3×3 像素,每個(gè)池化區(qū)域的大小為2×2像素。在訓(xùn)練過(guò)程中,該系統(tǒng)最大迭代次數(shù)為1 000,閾值為1,每輪訓(xùn)練使用的樣本數(shù)為100。在預(yù)測(cè)時(shí),該系統(tǒng)使用的置信度閾值為0.98,以保證識(shí)別的準(zhǔn)確性。

      4.3 運(yùn)行結(jié)果

      該人臉識(shí)別系統(tǒng)使用每個(gè)人的姓名首字母作為文件名,將處理后的人臉灰度圖像保存到對(duì)應(yīng)的文件夾中作為訓(xùn)練樣本。在訓(xùn)練過(guò)程中,系統(tǒng)形成了模型參數(shù)和計(jì)算圖等中間結(jié)果。在使用攝像頭捕捉含有多張人臉的圖片進(jìn)行識(shí)別時(shí),系統(tǒng)能夠較好地標(biāo)識(shí)出每張人臉,并將其對(duì)應(yīng)的標(biāo)識(shí)以不同顏色加以區(qū)分,并通過(guò)系統(tǒng)自動(dòng)標(biāo)注出人臉邊界回歸框。采用多任務(wù)卷積神經(jīng)網(wǎng)絡(luò)模型的人臉識(shí)別系統(tǒng)表現(xiàn)出較強(qiáng)的魯棒性,即使圖片中的人臉有一定的旋轉(zhuǎn)角度,系統(tǒng)也能準(zhǔn)確識(shí)別。

      5 結(jié)束語(yǔ)

      為了提高圖像質(zhì)量以適應(yīng)特定應(yīng)用,設(shè)計(jì)了一種高效的中值濾波器,并開(kāi)發(fā)了一種新的邊緣處理算法,利用差分圖像特征來(lái)突出圖像中的細(xì)節(jié)。此外,采用了直方圖處理技術(shù)來(lái)進(jìn)一步增強(qiáng)圖像。經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證,這種改進(jìn)的圖像增強(qiáng)算法能夠顯著提高人臉識(shí)別系統(tǒng)的準(zhǔn)確性和魯棒性。為了應(yīng)用這種增強(qiáng)算法,使用深度學(xué)習(xí)技術(shù)設(shè)計(jì)了一個(gè)人臉識(shí)別模型,并將增強(qiáng)后的圖像作為輸入進(jìn)行訓(xùn)練和測(cè)試。實(shí)驗(yàn)結(jié)果表明,與傳統(tǒng)的人臉識(shí)別系統(tǒng)相比,基于圖像增強(qiáng)的人臉識(shí)別系統(tǒng)在準(zhǔn)確性和魯棒性方面都取得了顯著的提升。

      猜你喜歡
      圖像增強(qiáng)魯棒性人臉識(shí)別
      人臉識(shí)別 等
      圖像增強(qiáng)技術(shù)在超跨聲葉柵紋影試驗(yàn)中的應(yīng)用
      水下視覺(jué)SLAM圖像增強(qiáng)研究
      揭開(kāi)人臉識(shí)別的神秘面紗
      荒漠綠洲區(qū)潛在生態(tài)網(wǎng)絡(luò)增邊優(yōu)化魯棒性分析
      基于確定性指標(biāo)的弦支結(jié)構(gòu)魯棒性評(píng)價(jià)
      虛擬內(nèi)窺鏡圖像增強(qiáng)膝關(guān)節(jié)鏡手術(shù)導(dǎo)航系統(tǒng)
      基于圖像增強(qiáng)的無(wú)人機(jī)偵察圖像去霧方法
      基于非支配解集的多模式裝備項(xiàng)目群調(diào)度魯棒性優(yōu)化
      西南交通大學(xué)學(xué)報(bào)(2016年6期)2016-05-04 04:13:11
      随州市| 保定市| 枞阳县| 东海县| 河池市| 邳州市| 宝丰县| 柞水县| 囊谦县| 平陆县| 伊金霍洛旗| 隆安县| 海原县| 塘沽区| 旅游| 西宁市| 安塞县| 阿拉善左旗| 曲麻莱县| 诸城市| 阿拉尔市| 博兴县| 尖扎县| 黔西县| 尉犁县| 宝鸡市| 武陟县| 牡丹江市| 墨玉县| 离岛区| 甘南县| 即墨市| 马山县| 雷州市| 威宁| 新民市| 肥乡县| 旬阳县| 施甸县| 南阳市| 双辽市|