王洪艷
(大連財經(jīng)學院工商管理學院,大連 116622)
生物識別技術(shù)包含面部識別技術(shù)、聲音識別技術(shù)及指紋識別技術(shù),在AIoT+5G城市智慧社區(qū)加快布局的現(xiàn)實情況下,通過大數(shù)據(jù)及云計算技術(shù)、物聯(lián)網(wǎng)技術(shù)、移動通訊技術(shù)等的結(jié)合,為廣大社區(qū)群眾提供更加安全的身份信息識別、財產(chǎn)保護、遠程管理服務,為后續(xù)智慧社區(qū)購物、醫(yī)療、養(yǎng)老等智能場景的搭建賦能。因而從普通社區(qū)居民的智能化生活環(huán)境出發(fā),探討智慧社區(qū)存在的一系列智能硬件、軟件服務生態(tài)體系,有利于智慧城市公共基礎(chǔ)設施、公共服務的規(guī)劃與完善,以滿足不同社區(qū)用戶多元化的公共服務與管理需求。
當前城市社區(qū)內(nèi)的生物識別技術(shù),并非接觸式的生物傳感技術(shù),而是在短時間內(nèi),就能完成用戶身份識別的生物特征比對技術(shù)。人臉識別、環(huán)境聲音識別、虹膜識別、指紋識別等都屬于這種即時性身份識別與鑒定技術(shù)。首先,人臉識別技術(shù),是基于“大數(shù)據(jù)+深度學習算法(CNN&DBN)”的識別技術(shù),通常被用于城市社區(qū)內(nèi)門禁系統(tǒng)的身份識別。通過門禁攝像頭或圖像傳感器,拍攝取景視域中的人臉信息,然后與后臺服務器/客戶端存儲的人臉圖片進行比對,或者檢索與該張照片最為相近的人臉圖像,并檢測與認證人臉身份信息是否屬實,一般涵蓋用戶交互、人臉檢測與認證、安全校驗等模塊[1]。其次,環(huán)境聲音識別技術(shù),包括前端、后端處理兩方面內(nèi)容,其中前端處理是指對環(huán)境中的聲音信號,進行搜集、特征提取,其可以去除原始音頻內(nèi)的雜音、冗余信息,獲得較為穩(wěn)定的音頻頻域信號;后端處理是在卷積神經(jīng)網(wǎng)絡(CNN)中,按照誤差反向傳播算法,對已提取好的音頻信號進行無監(jiān)督訓練,得到該音頻信號在全局網(wǎng)絡中的最優(yōu)解。最后,人眼虹膜識別、指紋識別等技術(shù),則被應用于高等級社區(qū)環(huán)境的用戶身份識別,該識別技術(shù)在個體生物特征采集中,會對生物圖像信息作出裁剪、切割、降噪、灰度化與二值化處理,將生物圖像轉(zhuǎn)換為可被讀取的模板代碼,并存儲至生物識別數(shù)據(jù)庫中,從而準確完成人眼虹膜錄入、指紋信息的匹配與識別。
在我國新型智慧社區(qū)的建設過程中,以AIoT+5G物聯(lián)網(wǎng)信息技術(shù)、大數(shù)據(jù)及云計算技術(shù)為主的軟硬件設施,成為社區(qū)內(nèi)不同區(qū)域生物識別模塊的接入端口。雖然我國很多大城市已經(jīng)加緊5G網(wǎng)絡的鋪設與覆蓋,但從全國5G移動通訊技術(shù)建設情況來看,城市智慧化社區(qū)的5G網(wǎng)絡、AIoT網(wǎng)絡服務設備接入仍然處于智能化公共服務場景改造的初級階段,且往往著重于社區(qū)門禁、單元門禁、地下車庫門禁等門禁系統(tǒng),只能滿足基本的人員出入、車輛出入、家政服務等管理需求。
對于常用的智慧社區(qū)門禁系統(tǒng)而言,人臉識別系統(tǒng)在其中發(fā)揮著重要作用,通常社區(qū)管理人員會將居民的身份證數(shù)據(jù)、人臉信息,運用電子掃描儀進行上傳與錄入,再利用深度學習的人像識別算法,根據(jù)權(quán)重衰減(Weight Decay)正則化定律,對正在學習的圖像模型作出擬合訓練,不斷提升大數(shù)據(jù)人像識別算法的運算精度。這樣城市智慧社區(qū)出現(xiàn)人員、車輛進入時,門禁系統(tǒng)就會將采集到的人臉數(shù)據(jù)信息、車輛數(shù)據(jù)信息,與后臺數(shù)據(jù)庫中存儲的圖像進行主動識別、比對,整個流程無需任何硬件設備的接觸,真正實現(xiàn)非接觸性、并發(fā)性的圖像采集、識別與判斷,相比于傳統(tǒng)人工信息,識別、錄入的效率更高。而在城市新型智慧社區(qū)的公共家政服務、醫(yī)療服務與行政管理方面,往往會使用更加安全的人眼虹膜識別技術(shù)、指紋識別技術(shù),如社區(qū)內(nèi)部物業(yè)管理、超市購物、圖書借閱等服務,主要通過保密等級更高、成本更低的指紋識別技術(shù),或者可注冊的臨時虹膜權(quán)限,對社區(qū)居民各項日常生活,以及外部工作人員的臨時訪問進行服務與管理,在加快推動智慧生活場景不斷發(fā)展完善的同時,也為居民提供更加安全的出入管理、公共服務保障[2]。
圖1新型智慧社區(qū)人臉識別系統(tǒng)功能架構(gòu)
人臉識別智能技術(shù)引入到城市社區(qū)建設中,需要通過多種大數(shù)據(jù)及云計算技術(shù)、物聯(lián)網(wǎng)軟硬件的接入與結(jié)合,才能有效達成不同網(wǎng)絡設備互聯(lián)、遠程控制的目標。以智能人臉識別系統(tǒng)的功能架構(gòu)建設為例,該系統(tǒng)架構(gòu)為服務器/客戶端(C/S),通常包含前端/后端等功能實現(xiàn)模塊,其中前端模塊為網(wǎng)絡操控面板,負責為社區(qū)用戶提供良好的交互頁面、信息處理結(jié)果展示。而后端功能模塊則被安置于服務器端,包括安全校驗、人臉檢測與錄入、人臉認證等功能模塊,用于接受用戶的人臉識別請求,其中網(wǎng)絡服務器、后臺數(shù)據(jù)庫負責人臉圖片的比對工作,從數(shù)據(jù)庫內(nèi)檢索出與該圖像相似的人臉照片,以對其真實身份作出分析辨別,具體系統(tǒng)功能架構(gòu)如圖1所示[3]。
從圖1可以得出,用戶前端在輸入人臉照片后,后端服務器需要從本地后臺數(shù)據(jù)庫中,檢索出大量與之相類似的圖片進行比對,整個系統(tǒng)功能的實現(xiàn)應由多種不同模塊互相協(xié)同配合。這一系統(tǒng)中用戶交互界面、結(jié)果展示模塊,通常被用于人臉圖像上傳、信息查詢,以及得到并顯示后臺服務器的人臉分析結(jié)果。而后端安全校驗模塊則以網(wǎng)絡爬蟲的方式,采集網(wǎng)頁中結(jié)構(gòu)化、非結(jié)構(gòu)化的圖像數(shù)據(jù),判定人臉圖像來源、圖像信息內(nèi)容是否安全,然后將其存儲于擴充數(shù)據(jù)庫之中。之后人臉檢測、人臉認證模塊會利用深度學習算法展開人臉檢索、分析,判定該圖像是否包含人臉信息,若包含人臉信息則開始人臉生物特征分析、關(guān)聯(lián)性分析等,并給出數(shù)據(jù)庫中與輸入圖像相近的處理結(jié)果。最后在Python語言的用戶交互實現(xiàn)界面,通過HTML代碼+邏輯控制代碼完成模板語言的轉(zhuǎn)換,將最終人臉識別結(jié)果返回至用戶界面。
為完成系統(tǒng)城市智慧社區(qū)中出入人員的人臉識別,要借助于深度卷積神經(jīng)網(wǎng)絡(CNN)以及深度學習人臉識別算法,建立涵蓋卷積層、池化層、函數(shù)層等層級的網(wǎng)絡算法訓練模型。
2.2.1 卷積層 深度神經(jīng)網(wǎng)絡(CNN)中的卷積層,通常由不同的圖像信息存儲單元組成,每個卷積單元內(nèi)包含圖像的特征邊緣、線條等信息,利用卷積運算展開人臉圖像信號的計算,計算輸入人臉圖像區(qū)域像素,與卷積核函數(shù)輸出圖像像素的對應程度,運算方法如下所示:
X為人臉識別圖像的輸入信號,W為卷積核函數(shù),在卷積核運算過程中每次人臉圖像像素移動,會得出與之相對應的S矩陣。因此每個卷積層內(nèi)不同的卷積核運算,將得出多個不同的人臉圖像對應特征輸出,最終將得到的人臉圖像N個對應特征,輸入到下一層級的神經(jīng)網(wǎng)絡進行再次迭代運算,人臉圖像檢索、識別與比對的結(jié)果如圖2所示。
圖2從臉圖像檢索識別與比對結(jié)果
2.2.2 池化層 池化層將輸入圖像劃分為若干矩形區(qū)域,每個區(qū)域輸出最大值進行數(shù)據(jù)迭代,也被稱為形式降采樣。通常在深度神經(jīng)網(wǎng)絡的卷積層之間,會周期性地插入池化層,開展不重疊圖像特征的并入與減小,使S矩陣相鄰像素的聚合運算量逐漸下降。在人臉圖像池化中常用的聚合方法,為區(qū)塊模型的最大值或平均值法,具體運算方法如下:
2.2.3 函數(shù)層 在經(jīng)過多層深度神經(jīng)網(wǎng)絡(CNN)算法的迭代與傳遞后,所得到的人臉識別圖像函數(shù),存在著分布特性的差異性,要運用S型激活函數(shù)(Sigmoid)、T型函數(shù)(Tauh)對其作出歸一化處理,運算函數(shù)為:y=f(∑ωixi+b)。
基于深度置信網(wǎng)絡(DBN)算法的環(huán)境聲音識別,通常包含環(huán)境音頻輸入、聲音信息處理、深度置信網(wǎng)絡(DBN)分類與運算等流程,具體系統(tǒng)實現(xiàn)架構(gòu)如圖3所示。
圖3系統(tǒng)實現(xiàn)架構(gòu)
前端聲音信息處理:城市社區(qū)環(huán)境聲音信號的處理,主要是提取音頻信號中的聲波基頻、幅值、諧波等特征信息,從音頻時域、頻域兩方面著手,去掉原始環(huán)境聲音內(nèi)的干擾性、冗余性數(shù)據(jù)信息,這里以前端音頻較為穩(wěn)定的頻域信號,作為環(huán)境中人聲識別的重要特征信號[4]。
深度置信網(wǎng)絡(DBN)分類與運算:在實際環(huán)境人聲識別過程中,通常只保留梅爾倒譜系數(shù)(MFCC)變換的低頻聲音特征,音頻特征提取流程為語音預加重、重疊分幀、加窗、頻域轉(zhuǎn)換、梅爾刻度濾波器過濾、對數(shù)能量、離散余弦(DCT)變換,最終得到環(huán)境聲音低頻特征的數(shù)據(jù)信息。之后利用深度置信網(wǎng)絡模型,對引入的環(huán)境人聲低頻提取特征進行訓練,通過DBN網(wǎng)絡訓練、BP深度神經(jīng)網(wǎng)絡訓練等展開特征權(quán)值調(diào)整,不斷迭代實現(xiàn)深度置信網(wǎng)絡內(nèi)的全局最優(yōu)解[5]。
新型城市智慧社區(qū)人工智能技術(shù),包含多種人臉識別、環(huán)境人聲識別、指紋識別、虹膜識別等生物技術(shù)。在現(xiàn)有的寬帶網(wǎng)絡、5G移動通信網(wǎng)絡環(huán)境中,可以安裝出入門禁系統(tǒng)、智能路燈系統(tǒng)、可視化對講系統(tǒng),對以上智慧社區(qū)人工智能技術(shù)進行應用,由AIoT設備形成公共安全、公共服務、公共管理之間的互聯(lián)互通。而物業(yè)管理人員、社區(qū)居民用戶等主體,則能夠借助于網(wǎng)絡云平臺,在遠程后臺云服務器中操控城市服務系統(tǒng),以滿足智慧社區(qū)內(nèi)部多元化的應用服務需求、管理要求。
當前部分城市社區(qū),已經(jīng)將AIoT+5G物聯(lián)網(wǎng)絡與普通居民的移動手機終端、智能穿戴設備形成綁定,用戶通過登錄網(wǎng)絡客戶端或瀏覽器,就可以對自身的人臉、人聲、指紋、虹膜等生物信息作出識別,享受多樣化的智慧城市信息查詢、業(yè)務辦理與遠程醫(yī)護服務。物業(yè)服務項目查詢、城市業(yè)務繳費,以及家政服務預約、遠程醫(yī)療咨詢等活動,都能夠在網(wǎng)絡云服務平臺中一站化完成[6]。
同時部分城市社區(qū)居民用戶,還將人臉識別、人聲識別或指紋識別等技術(shù),與自家的AIoT+5G物聯(lián)網(wǎng)平臺進行對接,通過人工智能深度學習算法,不斷訓練智能設備的自動化程度,以便于網(wǎng)絡智能家居設備的多向互動、智能作業(yè)。如城市社區(qū)居民進門時,安裝人臉識別、指紋識別智能門鎖,判定用戶是否為家庭成員,這樣有效保證居民出入的安全性、方便快捷性。而后在進入家庭后,借助于AIoT+5G物聯(lián)神經(jīng)網(wǎng)絡,設置智能WiFi上網(wǎng)控制、智能家居窗簾、智能開/關(guān)燈、智能電器操控等居家服務,利用環(huán)境中人聲識別技術(shù),實現(xiàn)對海量AIoT終端設備的網(wǎng)絡云服務控制,并在網(wǎng)絡面板中做到智能家居設備的動態(tài)記錄、實時更新。
人臉識別技術(shù)、環(huán)境聲音識別技術(shù)、虹膜識別技術(shù)、指紋識別技術(shù)等前端科技,與大數(shù)據(jù)及云計算技術(shù)、AIoT物聯(lián)網(wǎng)技術(shù)形成有效結(jié)合,將真正解決城市社區(qū)外部人員、內(nèi)部人員信息屬性難以獲取,以及社區(qū)人員或車輛出入、公共服務管理不成體系的問題。在AIoT+5G物聯(lián)網(wǎng)絡快速發(fā)展的形勢下,通過人臉、人聲、指紋、虹膜等外部生物信息,展開非接觸性、即時性的身份信息獲取和識別,并與網(wǎng)絡云平臺存儲的數(shù)據(jù)信息作出生物特征比對,不僅能夠有效促進社區(qū)公共安全、公共服務、智能生活等活動的互通互聯(lián),而且大大降低智慧社區(qū)內(nèi)各項事務的監(jiān)管復雜度,以便于完成社區(qū)流動人員、行政服務的動態(tài)監(jiān)控管理。