武曉勇 王鵬 亢衡 崔家禮
摘要:人眼作為面部的主要特征,對(duì)其形狀分類可以為身份識(shí)別(如虹膜識(shí)別和人臉識(shí)別)等應(yīng)用提供非常重要的信息,而聚類為分類提供依據(jù)。本文提出了一種眼睛形狀聚類算法,該算法分為以下幾大部分:第一部分確定眼睛輪廓,對(duì)輸入人眼圖片進(jìn)行關(guān)鍵點(diǎn)檢測(cè);第二部分根據(jù)輪廓點(diǎn)對(duì)能夠描述人眼形狀的相關(guān)特征進(jìn)行提取;最后,通過K-means聚類算法對(duì)提取的特征進(jìn)行聚類。算法共得到7個(gè)眼睛形狀聚類。
關(guān)鍵詞:虹膜識(shí)別,關(guān)鍵點(diǎn)檢測(cè),特征提取,眼睛形狀聚類
1 引言
隨著機(jī)器視覺、人工智能等領(lǐng)域技術(shù)的飛躍,IT行業(yè)進(jìn)入了認(rèn)知時(shí)代[1],虹膜識(shí)別、刷臉支付等生物特征識(shí)別技術(shù)出現(xiàn)在日常生活中。與傳統(tǒng)的身份驗(yàn)證方法(身份證件、銀行卡、口令等)相比,生物特征有不易復(fù)制,不易丟失等顯著優(yōu)點(diǎn)[2]。
眼睛作為具有高度辨識(shí)性的面部器官之一,在虹膜識(shí)別和人臉識(shí)別等領(lǐng)域起著關(guān)鍵的作用。在虹膜識(shí)別中,眼睛檢測(cè)是預(yù)處理的第一步,也是至關(guān)重要的一步。大型的面部特征數(shù)據(jù)庫能夠根據(jù)人眼形狀劃分為多個(gè)子面部特征數(shù)據(jù)庫,從而為縮小身份搜尋范圍提供極其有效的信息,在此基礎(chǔ)上進(jìn)行人臉識(shí)別將會(huì)大幅提高識(shí)別速度[3-5]。在此背景下,基于關(guān)鍵點(diǎn)的眼睛形狀聚類算法實(shí)現(xiàn)有著深遠(yuǎn)的應(yīng)用前景和研究價(jià)值。
2 算法流程
在通過神經(jīng)網(wǎng)絡(luò)等方法進(jìn)行人眼檢測(cè)后,基于關(guān)鍵點(diǎn)的眼睛形狀聚類算法總流程包括輪廓點(diǎn)檢測(cè)、特征提取與眼形聚類幾個(gè)主要步驟。人眼輪廓點(diǎn)的位置信息為后續(xù)特征提取及眼形聚類提供了數(shù)據(jù)支持。
2.1確定眼睛輪廓
本文采用AlexNet模型,AlexNet具備5個(gè)卷積層和3個(gè)全連接層[14]。
(1)卷積層
卷積層共有5層。在后續(xù)參數(shù)優(yōu)化過程中,一個(gè)卷積核與一個(gè)差值相映射,即本卷積層里每個(gè)卷積核與上層輸入的每個(gè)偏差值相映射。
(2)全連接層
全連接層共有3層,上一層輸出的特征圖與本層全連接,本文采用tf.reshape()將特征圖轉(zhuǎn)換為一維尺度,輸出值遵循dropout規(guī)則[6-13]。
3 實(shí)驗(yàn)結(jié)果
實(shí)驗(yàn)數(shù)據(jù)集來自劍橋大學(xué)Rainbow Group,該數(shù)據(jù)集包含11382個(gè)眼睛特寫圖像[12]。本算法利用了眼周12個(gè)坐標(biāo)點(diǎn),左眼角關(guān)鍵點(diǎn)序號(hào)為0,其他關(guān)鍵點(diǎn)按照順時(shí)針依次排列,分別記為p0,p1,…,p11。人眼樣本及輪廓點(diǎn)如圖1所示。
人眼圖像共聚成7類,其特征數(shù)據(jù)如表1所示。根據(jù)數(shù)據(jù)和直觀認(rèn)識(shí),7類眼形分別命名為細(xì)長眼、梭形眼、上斜眼、標(biāo)準(zhǔn)眼、杏眼、半月眼、瞇縫眼。
4 結(jié)論
本文提出一種基于關(guān)鍵點(diǎn)的眼睛形狀聚類算法。該算法基于關(guān)鍵點(diǎn)檢測(cè)技術(shù),提取眼周相關(guān)數(shù)據(jù),對(duì)目標(biāo)眼形進(jìn)行聚類。
基于關(guān)鍵點(diǎn)的眼睛形狀聚類算法不足之處在于:人眼關(guān)鍵點(diǎn)檢測(cè)環(huán)節(jié),受圖片中眼周陰影、睫毛等因素影響,關(guān)鍵點(diǎn)定位精確度不高,影響聚類效果。
本文受北京市教委面上(KM201510009005)等資助。
參考文獻(xiàn)
[1]沈曉衛(wèi).IT行業(yè)已進(jìn)入認(rèn)知時(shí)代,掌握這5點(diǎn)很關(guān)鍵.[EB/OL].http://www.sohu.com /a/ 133469 919_38932 7,2017.
[2]王濤.基于臉部生物特征及人眼定位的身份識(shí)別系統(tǒng)[D].蘭州:蘭州大學(xué),2010.
[3]孫勁光,榮文釗.曲線相似度眼型分類[J].計(jì)算機(jī)科學(xué)與探索,2017,11(8):1305-1313.
[4]劉歡喜.人體生物特征的綜合分析與應(yīng)用[D].上海:上海交通大學(xué),2010.
[5]RainbowGroup.RenderingofEyes for Eye-Shape Registration andGazeEstimation.[EB/OL].http://www.cl.cam.ac.uk/research/rainbow/projects/syntheseyes/,2015.
[6]賈瑞鳳,馬曾,侯春龍.以Python為工具培養(yǎng)學(xué)生計(jì)算思維[J].電腦知識(shí)與技術(shù),2018,14(02):117-118.
[7]Tensorflow官方網(wǎng)站.Tensorflow簡介.[EB/OL]. https://www.tensorflow.org/,2016.
[8]張立毅.神經(jīng)網(wǎng)絡(luò)盲均衡理論、算法與應(yīng)用[M].北京:清華大學(xué)出版社,2013,43-44.
[9]Wikipedia.Convolutional neural network.[EB/OL]. https://en.wikipedia .org /wiki/ Convolutional_ neural_ network,2018.
[10]SVL.Module 2:Convolutional Neural Networks.[EB/OL]. http://cs231n.github.io/ convol- utional-networks/#conv,2018.
[11]ujjwalkarn.An Intuitive Explanation of Convolutional Neural Networks.[EB/OL].https:// ujjwalkarn.me /20 16/08/11/intuitive-explanation-convnets/,2016-8-11.
[12]Fredrik Lundh.An Introduction To Tkinter[EB/OL].http://effbot.org/tkinterbook /tkinter -whats-tkinter.ht - m,1999.
[13]朱威,屈景怡,吳仁彪.結(jié)合批歸一化的直通卷積神經(jīng)網(wǎng)絡(luò)圖像分類算法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2017,29(9):1650-1657.
[14]Alex Krizhevsky,,Ilya Sutskever,,and Geoffrey E. Hinton. ImageNet Classification with Deep Convo lutional Neural Networks[J].COMMUNICATIONS OF THE ACM,2017,60(6):84-90.
[15]Wikipedia.Cross entropy.[EB/OL]. https://en.wikipedia.org/wiki/Cross_entropy,2018- 1-13.
[16]索紅光,王玉偉.一種用于文本聚類的改進(jìn)k-means算法[J].山東大學(xué)學(xué)報(bào)(理學(xué)版),2008,43(1):60-64.
(作者單位:北方工業(yè)大學(xué)信息學(xué)院)