熙熙攘攘的車站里,一位風(fēng)衣男子疾步逆人流而上,左右環(huán)顧。在外人看來(lái),他與一般旅客無(wú)異,實(shí)際上,他的隱形眼鏡上不斷出現(xiàn)迎面而來(lái)的每位旅客的個(gè)人信息。這是《碟中諜4》中的一幕特工采用面部識(shí)別隱形眼鏡追捕目標(biāo)的情節(jié)。經(jīng)典科幻大片《終結(jié)者》中,開啟保險(xiǎn)庫(kù)大門的密碼都是人臉——由攝像頭對(duì)臉部特征進(jìn)行掃描,如果符合則大門自動(dòng)開啟,否則警鈴大作。在許多電影中,類似的場(chǎng)景無(wú)處不在,令人炫目。你可能要問(wèn)了:這是真的嗎?人臉識(shí)別技術(shù)看著挺高大上,事實(shí)上,目前這項(xiàng)技術(shù)突飛猛進(jìn)地向前發(fā)展,已經(jīng)讓科幻變成了現(xiàn)實(shí)。
陌生而熟悉的識(shí)別技術(shù)
人臉識(shí)別技術(shù)誕生于20世紀(jì)60年代,在計(jì)算機(jī)科學(xué)領(lǐng)域,一直都是持久熱門的課題,是繼指紋識(shí)別、語(yǔ)音識(shí)別之后,人類最近幾年內(nèi)在人工智能的另一領(lǐng)域——圖像識(shí)別方面取得的重大進(jìn)展,它是通過(guò)使用攝像機(jī)或攝像頭采集含有人臉的圖像或視頻流,并自動(dòng)在圖像中檢測(cè)和跟蹤人臉,進(jìn)而對(duì)檢測(cè)到的人臉進(jìn)行一系列技術(shù)處理,以達(dá)到識(shí)別不同人身份的目的。人臉識(shí)別技術(shù)屬于生物特征識(shí)別技術(shù)的一個(gè)子集,生物特征識(shí)別的研究對(duì)象包括臉、指紋、掌紋、視網(wǎng)膜、語(yǔ)音等方面的識(shí)別技術(shù)。
人臉識(shí)別這個(gè)詞兒看似很高科技,但實(shí)際上它對(duì)我們來(lái)說(shuō)一點(diǎn)兒也不神秘,說(shuō)不定你每天都會(huì)“被識(shí)別”很多次,因?yàn)楝F(xiàn)在很多安防監(jiān)控的攝像頭就有人臉追蹤和身份識(shí)別的功能。還有一個(gè)常見應(yīng)用就是大家平時(shí)使用的數(shù)碼相機(jī),很多都帶有人臉識(shí)別功能,能抓住拍攝畫面中人的臉部位置,用方框提示出來(lái),使得拍照的人更容易抓住對(duì)焦點(diǎn)。這些普普通通的應(yīng)用,都是基于各種復(fù)雜的或者簡(jiǎn)單的面部識(shí)別算法來(lái)實(shí)現(xiàn)的,隨著現(xiàn)代計(jì)算機(jī)技術(shù)和光學(xué)成像技術(shù)的蓬勃發(fā)展,需要進(jìn)行大數(shù)據(jù)量計(jì)算的識(shí)別算法逐漸被研究和開發(fā)出來(lái)。
那么一部不會(huì)思考的機(jī)器究竟是如何識(shí)別出人臉的呢?
第一個(gè)重要環(huán)節(jié)是“人臉定位”,也就是先找出圖片或視頻中的人臉。眼睛、鼻子、嘴、下巴、顴骨等部件構(gòu)成了一張臉,雖說(shuō)每張臉都不一樣,但又都是相似的。早期的研究人員就是通過(guò)研究大量人臉的共同特性,通過(guò)各個(gè)重要器官的形狀、大小以及結(jié)構(gòu)的關(guān)系來(lái)總結(jié)出一個(gè)經(jīng)驗(yàn)值,由此來(lái)定位出畫面中具體哪部分是人臉。
第二個(gè)重要環(huán)節(jié)是人臉特征值提取,這是計(jì)算機(jī)“認(rèn)識(shí)”臉的核心過(guò)程。世界上沒有兩片—模一樣的葉子,當(dāng)然也沒有兩副完全相同的面孔。面部重要器官的形狀、大小和結(jié)構(gòu)上的各種差異使得每個(gè)人的臉都不一樣,由此可以通過(guò)提取眼、口、鼻等重要特征點(diǎn)的位置以及重要器官的幾何形狀來(lái)做分類,去識(shí)別人臉的身份。不過(guò)這種分類識(shí)別的效果有些不盡如人意。后來(lái)有人改進(jìn)了這個(gè)方法,設(shè)計(jì)了一個(gè)器官模型,并定義了一個(gè)復(fù)雜的特征函數(shù)來(lái)描述這個(gè)模板,通過(guò)調(diào)節(jié)特征函數(shù)的參數(shù)使得這個(gè)模型能夠?qū)?yīng)上每一張臉,而這些參數(shù)就成了描述這張臉的特征值。這個(gè)算法其實(shí)也不太實(shí)際,它需要匹配每個(gè)人的臉得到大量不同的特征值去確定龐大的參數(shù)值。
在實(shí)際使用的產(chǎn)品中,人們往往采用較為簡(jiǎn)便的算法,先用數(shù)據(jù)庫(kù)存儲(chǔ)多張標(biāo)準(zhǔn)人臉照片,并事先計(jì)算出這些照片中每張臉的獨(dú)一無(wú)二的特征,讓每一張臉跟一個(gè)身份信息對(duì)應(yīng)。然后依靠攝像頭捕捉待識(shí)別的人臉,實(shí)時(shí)生成特征值,在識(shí)別階段,用這個(gè)特征值去數(shù)據(jù)庫(kù)檢索匹配,以確認(rèn)到底是誰(shuí)。
人臉識(shí)別應(yīng)用前景
如今,人臉識(shí)別已經(jīng)廣泛應(yīng)用到各個(gè)不同的領(lǐng)域。
1.公共安全和管理。比如銀行、機(jī)場(chǎng)、體育場(chǎng),甚至是大型超市的攝像頭,很多都連接著人臉識(shí)別系統(tǒng),用于安全監(jiān)控。早在2008年北京奧運(yùn)會(huì),在所有比賽場(chǎng)館中,已經(jīng)實(shí)現(xiàn)了全方位無(wú)縫式攝像頭監(jiān)控。在場(chǎng)館的入口處,監(jiān)控?cái)z像頭都與面部識(shí)別系統(tǒng)相連,以每秒鐘五十萬(wàn)張的速度將通過(guò)入口的觀眾與數(shù)據(jù)庫(kù)中的資料照片進(jìn)行對(duì)比。許多企業(yè)也安裝了人臉識(shí)別門禁考勤系統(tǒng)、人臉識(shí)別防盜門等。一些學(xué)校也都安裝有人臉識(shí)別系統(tǒng)來(lái)為學(xué)生進(jìn)行每天出勤點(diǎn)名記錄。
2.信息安全和金融服務(wù)。比如銀行的自動(dòng)提款機(jī),如果用戶銀行卡和密碼被盜就會(huì)被他人冒取現(xiàn)金,如果同時(shí)應(yīng)用人臉識(shí)別就會(huì)避免這種情況的發(fā)生。2015年3月,馬云在德國(guó)cebit大會(huì)開幕式上演示了螞蟻金服的smile to pay掃臉技術(shù),并刷自己的臉為嘉賓從淘寶網(wǎng)上購(gòu)買了一枚20歐元的1948年漢諾威紀(jì)念郵票。人臉識(shí)別技術(shù)2015年7月已開始逐步在支付寶實(shí)名認(rèn)證、重置密碼、換綁手機(jī)等功能中應(yīng)用,數(shù)據(jù)顯示刷臉驗(yàn)證的識(shí)別成功率已經(jīng)達(dá)到90%以上。相比其他驗(yàn)證方式,人臉識(shí)別更為便捷。用戶可能不記得銀行卡信息、密碼、身份證號(hào)碼等,也可能因?yàn)楦鞣N原因收不到校驗(yàn)碼等驗(yàn)證信息,而人臉識(shí)別只需對(duì)著手機(jī)攝像頭刷一下臉就可以了。個(gè)人信息的盜用在網(wǎng)絡(luò)上時(shí)有發(fā)生,而人臉屬于生物特征,盜用難度很高。所以,生物識(shí)別在提供便捷的同時(shí),也能有效增加安全性。
3.互聯(lián)網(wǎng)娛樂。隨著移動(dòng)互聯(lián)網(wǎng)的崛起,一些人臉識(shí)別技術(shù)的開發(fā)者將該項(xiàng)技術(shù)應(yīng)用到娛樂領(lǐng)域中,比如GoogIe搜索引擎的圖片搜索功能,找一張人像照片進(jìn)行搜索,就可以看到很多與搜索圖片相似或者同一個(gè)人的很多不同照片。全球最大的社交網(wǎng)站Facebook花了幾千萬(wàn)美元收購(gòu)了一個(gè)專門進(jìn)行人臉識(shí)別的網(wǎng)站face.com,更是掀起了一股與人臉識(shí)別相關(guān)的創(chuàng)業(yè)潮,很多有才華的年輕人把智慧和精力投入到其中,創(chuàng)造出了很多有意思有價(jià)值的產(chǎn)品。APP“開心明星臉”,可以根據(jù)人臉的輪廓、膚色、紋理、質(zhì)地、色彩、光照等特征來(lái)計(jì)算照片中主人公與明星的相似度。風(fēng)靡全球的How-Old.net,很巧妙地將人臉辨認(rèn)與社交網(wǎng)絡(luò)中的人際交往結(jié)合在一起,年齡、性別、顏值測(cè)測(cè)就知道。
刷臉也沒那么靠譜
人臉識(shí)別看起來(lái)這么好,它就一定萬(wàn)無(wú)一失嗎?答案當(dāng)然是否定的,一切技術(shù)都有它自己的bug,人臉識(shí)別目前還在不斷的完善之中。
關(guān)于人臉識(shí)別技術(shù)準(zhǔn)確率究竟能達(dá)到多少,可以說(shuō)經(jīng)過(guò)多年的發(fā)展,人臉識(shí)別技術(shù)已經(jīng)取得了長(zhǎng)足的進(jìn)步。然而,這并不意味著人臉識(shí)別技術(shù)已經(jīng)非常成熟。首先,人臉識(shí)別相關(guān)系統(tǒng)都基于可見光或紅外光,不可能識(shí)別人體骨骼;此外,所謂識(shí)別的準(zhǔn)確率可高達(dá)99%也是不可能的。人臉的外形很不穩(wěn)定,人們可以通過(guò)臉部肌肉的變化產(chǎn)生很多不同的表情,而在不同的角度進(jìn)行觀察,人臉的視覺圖像也相差很大,這對(duì)于人臉識(shí)別效果的穩(wěn)定性和準(zhǔn)確性也帶來(lái)了一定的挑戰(zhàn);另外,人臉識(shí)別還受光照條件影響,比如白天和黑夜,室內(nèi)和室外等,人臉的遮蓋物,比如頭發(fā)、胡須等;當(dāng)然還有年齡以及整容行為等多方面因素的影響。所以目前最好的人臉識(shí)別系統(tǒng)在識(shí)別時(shí)的正確率只能達(dá)到75%以下,驗(yàn)證系統(tǒng)等錯(cuò)誤率達(dá)到10%以上。
還有一些由這項(xiàng)“刷臉”技術(shù)引發(fā)的疑問(wèn):如果有人拿我的照片和視頻來(lái)冒充怎么辦?用3D打印等技術(shù)復(fù)制人臉能騙過(guò)攝像頭嗎?搶劫犯是不是再也不用逼問(wèn)密碼了等問(wèn)題。如何規(guī)避以上種種問(wèn)題對(duì)于人臉識(shí)別的影響,依舊是人們將來(lái)研究的重點(diǎn)方向。