□ 文/丁立新
人臉識(shí)別,隨著技術(shù)的應(yīng)用和普及,已經(jīng)走入了每一個(gè)人的生活中,從最常見的手機(jī)人臉解鎖,到酒店刷臉、金融刷臉、火車站刷臉等等,一時(shí)間,似乎人臉識(shí)別已經(jīng)到了無所不能的地步。實(shí)際上,對(duì)于人臉識(shí)別的應(yīng)用,因?yàn)檎J(rèn)識(shí)深度的不同,不同的人有著不同的態(tài)度,有些人將人臉識(shí)別神話,有些人對(duì)人臉識(shí)別的不準(zhǔn)確性存在巨大的恐懼。在人工智能發(fā)展的如火如荼的今天,需要以客觀的態(tài)度看待人臉識(shí)別,就必然需要認(rèn)清人臉識(shí)別在應(yīng)用中的技術(shù)難點(diǎn),并從產(chǎn)品、工程、解決方案等多角度理解人臉識(shí)別的應(yīng)用。
一般來說,人臉識(shí)別被分為主動(dòng)識(shí)別和被動(dòng)識(shí)別。
張張嘴、搖搖頭,這是金融核驗(yàn)最典型的方式,也是最成熟的主動(dòng)識(shí)別方式。通過在線的智能分析,完成1:1的高精度核驗(yàn),同時(shí)完成了配合式的真人核驗(yàn),能夠節(jié)省大量人工核驗(yàn)的工作,節(jié)約柜臺(tái)排隊(duì)辦理業(yè)務(wù)的時(shí)間。
但是,這樣的核驗(yàn)方式的體驗(yàn)較差,對(duì)于所處場(chǎng)合的環(huán)境要求高,要求的配合度較高,效率較低;考慮金融核驗(yàn)應(yīng)用的頻度不高,這種方式仍然有較長的生命力。
金融核驗(yàn)的本質(zhì)在于證明“鏡頭前你是不是真的你”,這一類的1:1的人員核驗(yàn),結(jié)合配合式的活體檢驗(yàn),以及嚴(yán)格的場(chǎng)景要求,是人臉識(shí)別的最佳場(chǎng)景。除此以外的一些應(yīng)用,往往會(huì)面臨更大的困難。
通俗的分解一下人臉的屬性,人臉是可見的、有表情變化的、有年齡變化的、有可能被遮擋的、有光線影響的。由于其核心的屬性是視覺可見的,所以,人臉識(shí)別需要光,同時(shí)也懼怕光。
早期普遍采用的近紅外人臉識(shí)別技術(shù),利用高強(qiáng)度的近紅外補(bǔ)光將鏡頭前的人臉打亮,由于人眼對(duì)紅外光的不可見特性,在提升識(shí)別效果的同時(shí),不會(huì)對(duì)人眼造成任何影響。近紅外人臉識(shí)別,逐漸成為室內(nèi)小庫容人臉識(shí)別的主要方式。
但是,由于紅外識(shí)別太依賴于近紅外補(bǔ)光技術(shù),在室外的太陽光下,由于太陽全光譜的影響,近紅外對(duì)于人臉的補(bǔ)光無法對(duì)人臉的紅外成像向室內(nèi)那樣清晰穩(wěn)定。所以,面臨室外的應(yīng)用和大庫容的應(yīng)用,開始廣泛使用可見光識(shí)別方法。
可見光人臉識(shí)別,基于可見光下的彩色成像,圖像效果好,像素高,特征點(diǎn)足夠多,采用可見光算法的識(shí)別,往往可以達(dá)到萬級(jí)別的庫容,并且支持高達(dá)95%以上的識(shí)別率。
可見光識(shí)別優(yōu)勢(shì)非常明顯,但是,對(duì)于圖像采集系統(tǒng)的依賴也更強(qiáng),需要更高感光的圖像傳感器,夜間黑暗場(chǎng)景下過高的白光補(bǔ)光也可能引起人眼的不適;相比依賴近紅外補(bǔ)光的紅外識(shí)別,可見光的識(shí)別基本上沒有距離的要求(只要光線足夠,可以通過鏡頭的焦距彌補(bǔ)),對(duì)于室外的應(yīng)用,要比紅外識(shí)別具有更好的適應(yīng)性,但是,仍然無法避免太陽本身進(jìn)入畫面所產(chǎn)生的超高寬動(dòng)態(tài)場(chǎng)景。 但是,仍然是最佳的識(shí)別方式。
通過大光圈鏡頭、高感光sensor、高性能芯片等硬件的綜合作用,同時(shí),用于室外,需要考慮防水、防塵、高濕、高溫、極低溫的多種場(chǎng)景適應(yīng)性,同時(shí),有需要保證精準(zhǔn)的人臉識(shí)別。綜合性的產(chǎn)品化能力,是考驗(yàn)室外人臉門禁的核心命題。甚至用于速通門場(chǎng)景的全露天門禁,將產(chǎn)品化的要求推到了新的高度。
門禁是主動(dòng)、配合式的核驗(yàn),為了通過核驗(yàn)而進(jìn)門,人們可以摘下墨鏡、湊近、正臉配合。被動(dòng)式核驗(yàn),由于各類安全管控的需要,逐漸成為新的人臉識(shí)別熱點(diǎn)方向,由于其非配合性,甚至是故意躲避的特點(diǎn),被動(dòng)式人臉識(shí)別的高準(zhǔn)確率和低誤報(bào)率,一直是各大安防廠家的追逐的制高點(diǎn)。
非配合式核驗(yàn),除了高精度的算法外,更講究的是相機(jī)的架設(shè)位置、角度、鏡頭焦段、補(bǔ)光等。
安防行業(yè)流傳這一句話,三分產(chǎn)品七分安裝,雖然聽上去有些夸張,但從工程上讓每一個(gè)被動(dòng)式人臉抓拍相機(jī)發(fā)揮最大的效用是一門學(xué)問。
宇視科技首創(chuàng)的3D工程仿真技術(shù),精確模擬桿高、角度、焦距、鏡頭等,減少在實(shí)際場(chǎng)景勘點(diǎn)的工作量,提升工作效率。自應(yīng)用以來,讓城市每一個(gè)角落的相機(jī)更清晰準(zhǔn)確的工作,這就是工程性帶來的好處。
▲圖1 工程化仿真設(shè)計(jì)圖
2018年9月28日晚,張學(xué)友經(jīng)典巡回演唱會(huì)在河北奧體中心舉行,宇視科技人臉識(shí)別系統(tǒng)部署在場(chǎng)館及周邊重點(diǎn)區(qū)域,秒級(jí)識(shí)別布控系統(tǒng)中的黑名單人員并觸發(fā)報(bào)警,協(xié)助警方快速抓獲3名網(wǎng)上在逃人員,實(shí)現(xiàn)了演唱會(huì)追逃的“十連殺”!安防廠家在這場(chǎng)戰(zhàn)役中取得了最大的曝光度,體現(xiàn)了安防行業(yè)的算法水平和產(chǎn)品方案能力。
在中國,對(duì)于作奸犯科者,自古以來流傳的老話是“寧可錯(cuò)殺一千,不可放過一個(gè)”,安排大量的侍衛(wèi)挨個(gè)仔細(xì)盤查,必然可以將每一個(gè)罪犯繩之以法。但是,在現(xiàn)今的社會(huì),如何在不經(jīng)意間,利用高科技手段完成高精度預(yù)警,安保人員進(jìn)行針對(duì)性盤查,這才是文明社會(huì)的主流,也是其中的難點(diǎn)。
人臉本身并不是天然具備將其數(shù)字化的方法,當(dāng)代的深度學(xué)習(xí)通過建立模型和訓(xùn)練,模擬了人類記憶和識(shí)別人臉的方法。
約克大學(xué)的Rob Jenkins博士曾經(jīng)做過一個(gè)專門的研究,第一次確定了人類可以記住的面孔數(shù)量——平均達(dá)到驚人的5000張臉,不同的人記錄的人臉數(shù)量分布在1000到10000之間。對(duì)于人類而已,上萬張人臉的記憶,已經(jīng)是絕大多數(shù)人類的極限了。
計(jì)算機(jī)科學(xué),把所有事物轉(zhuǎn)化為二進(jìn)制進(jìn)行記錄,對(duì)于人臉通過建模,也是針對(duì)每一張人臉進(jìn)行記錄,經(jīng)歷模型的升級(jí)、樣本的訓(xùn)練,可以逐步提升計(jì)算機(jī)認(rèn)識(shí)人臉的水平,但是,受著模型、芯片和樣本的限制,從幾百張人臉的識(shí)別到幾萬張人臉的準(zhǔn)確識(shí)別,基于目前的水平,很難持續(xù)快速的發(fā)展。
與之矛盾的是,在人臉識(shí)別的持續(xù)熱度下,更多大庫容、高精度要求的領(lǐng)域開始呼喚人臉識(shí)別技術(shù)的融入。
地鐵刷臉乘車就是一個(gè)典型的案例。
深圳地鐵,通過本地APP的注冊(cè)人數(shù)約661萬人,其中每天約有100萬人次的使用量。假定目前頂級(jí)的人臉識(shí)別算法,對(duì)于萬人臉庫的識(shí)別準(zhǔn)確率有99.5%,那么,如果采用人臉識(shí)別來實(shí)現(xiàn)扣費(fèi)乘車,那每天都有數(shù)萬人被識(shí)別錯(cuò)誤,是一場(chǎng)災(zāi)難。如果解決這個(gè)問題?
先來認(rèn)清刷臉乘車的核心需求,是希望采用人臉識(shí)別技術(shù),提高效率,提升安全性,減少高峰期的擁堵。
如果直接面對(duì)661萬注冊(cè)人員,那么,任何人都會(huì)覺得茫然。需要分解。
第一,地鐵內(nèi)會(huì)出現(xiàn)哪幾類人?
首先是工作人員,每個(gè)站內(nèi)少量的本地工作人員,加上總公司的輪崗人員,總?cè)藬?shù)不搞錯(cuò)千人;
然后是65歲以上人群,不需要買票,只需要通過刷身份證和人臉,完成年齡核驗(yàn)和本人核驗(yàn);
接著對(duì)普通乘客,可分為通勤乘客和單次乘客。
對(duì)于單次乘客,可提前通過身份證與支付寶的綁定,采用人證比對(duì)核驗(yàn)過閘,信用支付;
對(duì)于通勤乘客,通過設(shè)定特定的通勤時(shí)間和通勤站點(diǎn),完成通勤人員刷臉過閘。
綜上,如果提高通勤乘客的使用體驗(yàn)和效率是目前可以處理的重點(diǎn)。
第二,通勤乘客的人臉識(shí)別如何控制識(shí)別精度;
由于地鐵不同站點(diǎn)的特點(diǎn),其客流量差異較大。我們假定一個(gè)兩個(gè)地鐵中轉(zhuǎn)站,進(jìn)站客流和出站客流日均在5萬人次。
有幾種方法進(jìn)行進(jìn)一步的分流:
有效時(shí)段預(yù)約法;
通勤人員一般具有規(guī)律的上下班時(shí)間,通過限定有效的通行時(shí)間,可大幅度減少同一時(shí)段內(nèi)的人員底庫數(shù)量;
入口編號(hào)通行法;
對(duì)于大型站點(diǎn),人流量極大的,可以在一排閘機(jī)上編號(hào),對(duì)于預(yù)約通道區(qū)分單號(hào)和雙號(hào),進(jìn)一步把人員庫數(shù)量減半;
進(jìn)出站點(diǎn)匹配法;
不管如何,如果做單次識(shí)別就確認(rèn)信用支付,那么一次誤識(shí)就會(huì)導(dǎo)致支付異常;然而,通過進(jìn)、出站點(diǎn)的匹配,做雙重校驗(yàn),原本1‰的誤識(shí),就變成了百萬分之一,可極大幅度減少支付異常;單次識(shí)別錯(cuò)誤導(dǎo)致的收費(fèi)損失,需要不斷的算法優(yōu)化提升;
預(yù)約名額限定法;
最后一招,根據(jù)運(yùn)營的情況,結(jié)合實(shí)際的預(yù)約人數(shù),為了將錯(cuò)誤識(shí)別控制在一定比例之下,可通過名額限制預(yù)約人數(shù),確保識(shí)別率。
第三, 刷臉記錄留存3個(gè)月,可確保異常支付數(shù)據(jù)隨時(shí)可查詢和回溯。
本文只是通過問題分解,描述了一種地鐵刷臉應(yīng)用的可行性。不代表任何已運(yùn)行的地鐵應(yīng)用方式。通過行業(yè)理解,把大批量人員分解為小批量,把大庫容分解為小庫容,用綜合解決方案把不可能變?yōu)榭赡堋?/p>
▲圖2 地鐵業(yè)務(wù)模型分解圖
人臉識(shí)別技術(shù)本身,還需要更多的時(shí)間發(fā)展和完善,更優(yōu)的模型、海量的樣本訓(xùn)練、更出色的處理芯片,將人臉的年齡變化、喜怒的變化都更精準(zhǔn)的識(shí)別。與此同時(shí),在未來很長一段時(shí)間內(nèi),優(yōu)秀的產(chǎn)品化能力,工程能力和綜合性的解決方案,都是決定人工智能成敗的核心因素。每一個(gè)都不可或缺。