張 倩/南京藝術(shù)學(xué)院
生物特征識(shí)別技術(shù)指提取人體固有的、唯一的先天生理特征(如指紋、掌紋、面像、虹膜等)或后天形成的行為特征(如步態(tài)、聲音、筆跡等),并將這些生物特征數(shù)字化,以用于個(gè)人身份鑒定的一種智能技術(shù),一般分為生理特征識(shí)別技術(shù)和行為特征識(shí)別技術(shù)?!案咝n案云”服務(wù)平臺(tái)是一種云計(jì)算平臺(tái),它通過(guò)搭建統(tǒng)一的IT基礎(chǔ)架構(gòu),將各高校檔案館(室)連接成互聯(lián)互通的信息共享平臺(tái),并提供標(biāo)準(zhǔn)規(guī)范、靈活便捷的檔案信息管理“協(xié)同運(yùn)作服務(wù)”。將生物特征識(shí)別技術(shù)應(yīng)用到“高校檔案云”服務(wù)平臺(tái),有利于提升“高校檔案云”服務(wù)平臺(tái)的集成和協(xié)同水平。本文通過(guò)考察生物特征識(shí)別技術(shù)的應(yīng)用場(chǎng)景及其實(shí)用價(jià)值,探究將其引入“高校檔案云”服務(wù)平臺(tái)的可行性,并指出應(yīng)用中需要注意的問(wèn)題。
世界上沒(méi)有兩個(gè)相同特征的指紋,高校檔案館(室)可通過(guò)在“高校檔案云”服務(wù)平臺(tái)建立指紋識(shí)別引擎,配置“采集、存儲(chǔ)、比對(duì)”等一系列指紋數(shù)據(jù)集成圖像的算法功能,實(shí)現(xiàn)用戶指紋特征分析識(shí)別之目的。其主要應(yīng)用價(jià)值如下:
首先,指紋識(shí)別技術(shù)可用于檔案庫(kù)房等需要高度安全防護(hù)的地方,對(duì)來(lái)訪人員進(jìn)行身份驗(yàn)證。高校檔案館(室)安裝指紋門(mén)禁系統(tǒng),使用時(shí)只需將手指平放在指紋采集器的采集窗口上即可完成開(kāi)鎖任務(wù),且可避免機(jī)械鎖、密碼鎖、芯片卡等其他門(mén)禁系統(tǒng)易被遺忘、盜用、偽造、破譯的弊端。其次,指紋識(shí)別技術(shù)可用于涉密檔案信息系統(tǒng)的用戶身份驗(yàn)證和鑒定。目前服務(wù)平臺(tái)主要靠“用戶名+密碼”等傳統(tǒng)身份識(shí)別手段來(lái)進(jìn)行登錄,不僅操作繁瑣,而且密碼易忘。采用指紋識(shí)別技術(shù),用戶可實(shí)現(xiàn)“一觸即發(fā)”,即刻登錄“高校檔案云”服務(wù)平臺(tái)。再次,創(chuàng)建用戶指紋“一卡通”信息服務(wù)窗口,可有效提升便民服務(wù)水平。高校檔案管理機(jī)構(gòu)可在師生辦理“校園卡”時(shí),將其指紋采集錄入指紋檔案數(shù)據(jù)庫(kù)平臺(tái)中,師生無(wú)需重復(fù)注冊(cè)或擔(dān)心密碼遺忘。
高校檔案館(室)不能忽視指紋識(shí)別技術(shù)的局限性。當(dāng)用戶的手指有疤痕,或手指是濕的、有油污時(shí),指紋解鎖的成功率易受影響。此外,指紋識(shí)別技術(shù)會(huì)受指紋傳感器面積的限制難以完整采集用戶的指紋數(shù)據(jù),并且存在被“萬(wàn)能指紋”等模擬器破解的可能性。因此高校檔案館(室)應(yīng)關(guān)注并應(yīng)用超聲波指紋識(shí)別技術(shù)、指紋靜脈傳感器等更為先進(jìn)的指紋識(shí)別技術(shù),確保指紋驗(yàn)證具有更強(qiáng)的安全性。
作為2017年10大全球突破性技術(shù)之一的人臉識(shí)別技術(shù)[1],是指通過(guò)攝像頭采集人臉信息并借助各種智能算法,對(duì)數(shù)以億計(jì)的用戶臉部關(guān)鍵點(diǎn)進(jìn)行學(xué)習(xí)、訓(xùn)練、總結(jié),再將“三維建模”數(shù)據(jù)庫(kù)中的原始數(shù)據(jù)與需驗(yàn)證的人臉數(shù)據(jù)進(jìn)行比對(duì)的一種生物安全驗(yàn)證手段。其主要應(yīng)用價(jià)值如下:
首先,高校檔案館(室)可將采集到的師生人臉圖像數(shù)據(jù)錄入歸檔系統(tǒng),并利用該系統(tǒng)保存的人臉圖像數(shù)據(jù)創(chuàng)建師生人臉檔案數(shù)據(jù)庫(kù)。如“高校檔案云”服務(wù)平臺(tái)集成人臉識(shí)別功能,師生只需對(duì)著攝像頭“刷臉”,即能迅速而準(zhǔn)確地完成身份鑒驗(yàn)。其次,人臉識(shí)別技術(shù)還可用于檔案館(室)的門(mén)禁安防等領(lǐng)域。人臉識(shí)別技術(shù)具有不被被測(cè)個(gè)體察覺(jué)、能夠進(jìn)行遠(yuǎn)距離身份識(shí)別的特點(diǎn)。利用這項(xiàng)技術(shù)不僅可從監(jiān)控視頻畫(huà)面中實(shí)時(shí)查尋人臉,而且可與人臉檔案數(shù)據(jù)庫(kù)中存儲(chǔ)的人臉數(shù)據(jù)進(jìn)行實(shí)時(shí)比對(duì),實(shí)現(xiàn)遠(yuǎn)距離快速鑒驗(yàn)人員身份。再次,人臉識(shí)別技術(shù)還可提升高校檔案館(室)所開(kāi)發(fā)手機(jī)APP的智能化水平。作為“數(shù)字原住民”一族的大學(xué)生[2],在使用APP時(shí)直接用臉部對(duì)著手機(jī)就能解鎖并查閱利用檔案,能獲得較好的使用體驗(yàn)。
需要指出的是,高校檔案館(室)可采用更為先進(jìn)的技術(shù)來(lái)提高人臉識(shí)別系統(tǒng)在實(shí)際使用中的安全性,比如讓用戶根據(jù)系統(tǒng)指令做出動(dòng)作或表情,作為系統(tǒng)智能驗(yàn)證碼,如眨眼、左右搖頭、唇語(yǔ)等,通過(guò)這樣的方式強(qiáng)化人臉識(shí)別技術(shù)的防偽鑒驗(yàn)?zāi)芰Α?/p>
虹膜是位于人眼黑色瞳孔和白色鞏膜之間的圓環(huán)狀部分,具有高度的獨(dú)特性、穩(wěn)定性和不可更改性等生物特點(diǎn),可作為檔案用戶身份識(shí)別的物質(zhì)基礎(chǔ)。虹膜識(shí)別技術(shù)的主要應(yīng)用價(jià)值如下。
首先,可用于檔案安防設(shè)備或有高度保密需求的場(chǎng)所。檔案庫(kù)房作為有高度保密需求的場(chǎng)所,以虹膜信息作為密碼不僅無(wú)法復(fù)制,而且每一次活動(dòng)都會(huì)留下“痕跡”(日志記錄),便于追溯與查詢,如遇非法操作還可自動(dòng)報(bào)警。其次,高校檔案館(室)根據(jù)安防需要,既可在特定區(qū)位安裝虹膜識(shí)別裝置實(shí)施安全監(jiān)控,也可靈活授權(quán)并調(diào)整用戶權(quán)限,隨時(shí)了解用戶動(dòng)態(tài)和活動(dòng)范圍,實(shí)現(xiàn)實(shí)時(shí)智能管理。
值得注意的是,虹膜識(shí)別技術(shù)成本高昂,短時(shí)間內(nèi)無(wú)法大范圍推廣;虹膜識(shí)別設(shè)備會(huì)發(fā)生鏡頭捕獲圖像畸變的問(wèn)題,使可靠性降低;將虹膜作為“密碼”雖然具有更好的“長(zhǎng)期安全性”,但被檢測(cè)用戶必須是活著的狀態(tài)才能正常識(shí)別。
2017年,美國(guó)Synaptics公司推出了全新的多因素生物特征融合引擎,該引擎將傳統(tǒng)的指紋識(shí)別與面部識(shí)別技術(shù)融為一體,為移動(dòng)設(shè)備提供更為安全的驗(yàn)證方式。其主要應(yīng)用價(jià)值如下。
首先,鑒于多數(shù)高校檔案館(室)不具備強(qiáng)大的開(kāi)發(fā)實(shí)力和后期維護(hù)、升級(jí)的能力,因此使用第三方專業(yè)廠家提供的技術(shù)不失為一種明智之舉。引入多重生物特征融合引擎,即可有效彌補(bǔ)應(yīng)用單一生物識(shí)別技術(shù)的缺陷,又可大大增強(qiáng)安防鑒驗(yàn)功能。其次,應(yīng)用多重融合引擎可讓用戶根據(jù)自己的偏好或環(huán)境因素,隨意選用任何一種生物認(rèn)證方式。再次,當(dāng)用戶使用敏感應(yīng)用時(shí),擁有多種生物驗(yàn)證功能的多重生物特征融合引擎可確保更高的安全性。例如,Pure Print防欺騙算法的Quantum Matcher技術(shù)以及具有防欺騙功能的面部識(shí)別技術(shù)、指紋認(rèn)證與安全面部生物特征技術(shù),可無(wú)縫集成于“高校檔案云”服務(wù)平臺(tái)之中,使平臺(tái)具有更高的安全性。
語(yǔ)音識(shí)別技術(shù)于20世紀(jì)90年代末面世,隨著移動(dòng)互聯(lián)網(wǎng)時(shí)代的到來(lái)其優(yōu)勢(shì)日益明顯。其主要應(yīng)用價(jià)值如下。
首先,將其直接嵌入檔案語(yǔ)音識(shí)別模塊,不僅可讓“高校檔案云”服務(wù)平臺(tái)擁有生動(dòng)的對(duì)話接口來(lái)支持語(yǔ)音檢索,而且人機(jī)互動(dòng)性強(qiáng)(凡需打字的地方,都可用語(yǔ)音來(lái)代替)。語(yǔ)音識(shí)別模塊具有不斷學(xué)習(xí)新的聲音和語(yǔ)調(diào)的功能,可提供對(duì)話式的“應(yīng)答”,并能通過(guò)“用戶知識(shí)庫(kù)”來(lái)判斷和過(guò)濾搜尋的結(jié)果。如,檔案管理員可邊看檔案邊對(duì)著手里的麥克風(fēng)說(shuō)話,麥克風(fēng)中的聲音不僅能夠?qū)崟r(shí)轉(zhuǎn)化成文字,還能自動(dòng)錄入檔案網(wǎng)絡(luò)系統(tǒng)的數(shù)據(jù)庫(kù)。其次,嵌入語(yǔ)音識(shí)別模塊的“高校檔案云”服務(wù)平臺(tái)借助隱藏其后的強(qiáng)大“后端”,包括人工神經(jīng)網(wǎng)絡(luò)技術(shù)、深度神經(jīng)網(wǎng)絡(luò)技術(shù)、網(wǎng)頁(yè)檢索技術(shù)、知識(shí)檢索技術(shù)、知識(shí)庫(kù)技術(shù)、問(wèn)答以及推薦技術(shù)等,不僅能結(jié)合用戶提出的上下文結(jié)構(gòu)進(jìn)行智能研判,而且能在一定程度上理解用戶所發(fā)布的命令并直接做出反應(yīng),或者用自然語(yǔ)音進(jìn)行檢索并獲得精準(zhǔn)答案。再次,嵌入語(yǔ)音識(shí)別模塊的“高校檔案云”操作流程十分簡(jiǎn)捷。如,用戶只需對(duì)著移動(dòng)設(shè)備的麥克風(fēng)說(shuō)話,這些語(yǔ)音數(shù)據(jù)就會(huì)被“高校檔案云”的語(yǔ)音識(shí)別系統(tǒng)進(jìn)行自動(dòng)錄制、壓縮、解析,并即刻將最匹配的服務(wù)反饋給用戶。
應(yīng)用這項(xiàng)技術(shù)需要注意三個(gè)問(wèn)題:一是由于目前計(jì)算機(jī)技術(shù)還不能直接識(shí)別用戶說(shuō)話發(fā)出的聲波,需要“語(yǔ)音到文本分析器”將其轉(zhuǎn)化為計(jì)算機(jī)可識(shí)別的二進(jìn)制編碼、字符序列等,實(shí)現(xiàn)所謂的Speech-Text;二是由于“語(yǔ)法分析器”技術(shù)不夠成熟,需要通過(guò)“字符串”查找關(guān)鍵“短語(yǔ)”并建立簡(jiǎn)單模型來(lái)理解用戶想要的目標(biāo);三是語(yǔ)音識(shí)別精準(zhǔn)率不高,如在嘈雜環(huán)境中,引擎捕獲用戶語(yǔ)音并進(jìn)行識(shí)別的時(shí)間較長(zhǎng)、語(yǔ)音識(shí)別錯(cuò)誤率較高。
首先,利用語(yǔ)音合成技術(shù),高校檔案館(室)可將文本信息轉(zhuǎn)化成語(yǔ)音信息,“讓計(jì)算機(jī)像人一樣開(kāi)口說(shuō)話”。如,內(nèi)置語(yǔ)音合成模塊的“高校檔案云”服務(wù)平臺(tái)可以實(shí)現(xiàn)“無(wú)人值守”,用戶撥打檔案服務(wù)熱線電話,系統(tǒng)可與其進(jìn)行“對(duì)話”;用戶坐在檔案接待大廳,就可與系統(tǒng)的某臺(tái)智能服務(wù)器進(jìn)行交流。其次,高校檔案館(室)通過(guò)不斷優(yōu)化語(yǔ)音合成技術(shù),可提供更優(yōu)質(zhì)的語(yǔ)音服務(wù),使計(jì)算機(jī)智能合成的“說(shuō)話”聲音更自然和有個(gè)性。
聲紋識(shí)別是根據(jù)說(shuō)話人的發(fā)音生理和行為特征自動(dòng)識(shí)別說(shuō)話人身份的一種生物識(shí)別方法,它與語(yǔ)音識(shí)別的系統(tǒng)構(gòu)成較為相似,都具有“特征提取”與“模式匹配”的功能,但是語(yǔ)音識(shí)別的技術(shù)核心在于從語(yǔ)音波形中提取反映語(yǔ)音特征的相關(guān)信息,目的是讓機(jī)器“聽(tīng)懂”人說(shuō)的話并能將其轉(zhuǎn)換成文本,因此需要關(guān)注“語(yǔ)言內(nèi)容的精準(zhǔn)性”;而聲紋識(shí)別則是要提取語(yǔ)音信號(hào)中說(shuō)話人的聲紋特征,因此這項(xiàng)技術(shù)更注重“說(shuō)話人聲音的基本特征”。聲紋識(shí)別在特征提取和模式匹配(模式識(shí)別)的過(guò)程中,最關(guān)鍵的是語(yǔ)音特征參數(shù)的求取。聲紋識(shí)別技術(shù)主要應(yīng)用價(jià)值如下。
“高校檔案云”服務(wù)平臺(tái)設(shè)置聲紋識(shí)別模塊,首先通過(guò)提取說(shuō)話人的語(yǔ)音信號(hào),能自動(dòng)認(rèn)證用戶身份,大大提高系統(tǒng)運(yùn)行的安全性。其次能便捷地獲取蘊(yùn)含聲紋特征的語(yǔ)音,有助于提高使用者的接受度。再次可為用戶提供友好的個(gè)性化服務(wù),如,為注冊(cè)用戶構(gòu)建聲紋模型,利用從注冊(cè)語(yǔ)音中提取的聲紋特征序列,提高檢索服務(wù)的準(zhǔn)確率。
目前聲紋識(shí)別技術(shù)的應(yīng)用存在背景噪音、信道差異、語(yǔ)音過(guò)短等問(wèn)題[3],尚待解決。
語(yǔ)音是人工智能時(shí)代人機(jī)交互最好最方便的形式[4],隨著語(yǔ)音識(shí)別、自然語(yǔ)言理解和語(yǔ)音合成等應(yīng)用技術(shù)的成熟,能夠融合這些功能的語(yǔ)音交互技術(shù)也迅猛發(fā)展。其主要應(yīng)用價(jià)值如下。
首先,應(yīng)用語(yǔ)音助手可提升個(gè)性化服務(wù)能力。如,借助Bing、Cortana、Google Assistant、Deep Speech、DeepVoice等,不僅可讓用戶從多種信息來(lái)源中廣泛采集碎片化信息,而且能夠享受略讀和掃讀各類檔案信息的服務(wù)。其次,應(yīng)用語(yǔ)音交互技術(shù)可增強(qiáng)文化休閑功能。如,Siri、Echo、DingDong等,都是可供“高校檔案云”服務(wù)平臺(tái)構(gòu)建文化休閑功能的上乘產(chǎn)品和服務(wù)模式。高校檔案館(室)還需要通過(guò)建立一個(gè)新的循環(huán),即數(shù)據(jù)—知識(shí)—用戶體驗(yàn)—新的數(shù)據(jù)[5],尋找到合適的智能語(yǔ)音設(shè)備作為生態(tài)入口,改變傳統(tǒng)檔案“生態(tài)行業(yè)閉環(huán)”,提高檔案館(室)構(gòu)建的多生態(tài)圈跨平臺(tái)語(yǔ)音交互服務(wù)水平。
本文為2016年度江蘇省檔案局科技項(xiàng)目“電子檔案“云災(zāi)備”數(shù)據(jù)安全策略及其實(shí)現(xiàn)研究”(項(xiàng)目編號(hào):2016-12)研究成果之一。
參考文獻(xiàn):
[1]科技之巔2:《麻省理工科技評(píng)論》2017年10大全球突破性技術(shù)深度剖析[M].北京:人民郵電出版社,2017:156.
[2]中央電視臺(tái)大型紀(jì)錄片《互聯(lián)網(wǎng)時(shí)代》主創(chuàng)團(tuán)隊(duì).互聯(lián)網(wǎng)時(shí)代[M].北京:北京聯(lián)合出版公司,2015:163.
[3]郭浩婷.基于聲紋識(shí)別的應(yīng)用難點(diǎn)研究[C].第十四屆全國(guó)青年通訊學(xué)術(shù)會(huì)議論文集.2009:169-171.
[4]喻彩華等.智能音箱大躍進(jìn)[N].電腦報(bào),2017-7-24:03.
[5]李彥宏:智能革命[M].北京:中信出版社,2017:67.