戴 濤,袁樹林,歐云波
(1.福能鴻山熱電有限公司,福州 362700;2.廈門世紀(jì)華安科技有限公司,福建 廈門 361000;3.深圳華威世紀(jì)科技有限公司,深圳 518000)
智能視頻技術(shù)源自計算機視覺與人工智能的研究,是基于深度學(xué)習(xí)中計算機視覺的應(yīng)用,其發(fā)展目標(biāo)是在動態(tài)圖像與事件描述之間建立一種映射關(guān)系,使計算機從紛繁的視頻圖像中過濾掉“噪聲”,獲取數(shù)據(jù)并搭建出數(shù)據(jù)模型,再分辯、識別出關(guān)鍵目標(biāo)物體,并對此結(jié)果進行存取與分析。從2010年開始,智能視頻技術(shù)已經(jīng)在工業(yè)技術(shù)、智能交通、公共安全和企業(yè)安全等領(lǐng)域開始應(yīng)用,并取得了驚人的效果。
在工礦企業(yè)中,隨著工礦設(shè)備越來越先進、復(fù)雜,以往以人工或單純視頻監(jiān)控對設(shè)備以及人員生產(chǎn)等安全進行排查的方式,缺點也慢慢地凸顯出來。視頻圖像設(shè)點多,監(jiān)管人員壓力大,監(jiān)管難度高,當(dāng)遇到異常情況時,往往無法及時進行報警并迅速處理異常,造成難以估計的損失。而智能視頻分析技術(shù)恰好可以在一定程度上緩解這類問題。此技術(shù)可以從實時視頻圖像中監(jiān)控分析,提取關(guān)鍵信息,可對事故進行預(yù)警與處理取證,大大減小了安全監(jiān)管人員的工作壓力與企業(yè)的用人壓力。再配合傳感器與跨平臺技術(shù),可實現(xiàn)集安保、人員生產(chǎn)安全、人員管理、材料管理的企業(yè)安全綜合管理網(wǎng)絡(luò)。
在福能鴻山電廠進行試驗應(yīng)用,已開發(fā)的應(yīng)用功能有:人員在規(guī)定區(qū)域佩戴安全帽的識別、人員越界的識別、人員單獨在規(guī)定區(qū)域徘徊的識別、基于紅外攝像的明暗火識別、在規(guī)定區(qū)域物品遺留的識別等。在鴻山電廠內(nèi)的各個主干道均設(shè)置了配置安全帽檢測算法的攝像頭,用于檢測員工安全帽佩戴情況,若發(fā)現(xiàn)有員工未佩戴安全帽在劃定區(qū)域內(nèi)走動,即時報警并對員工進行抓拍,并將圖片傳給客戶端,錄入報警日志,配合人臉識別系統(tǒng)還可以將其捕捉到的人臉與名單樣本對比,相似率達到一定閾值后,記錄人員詳細(xì)數(shù)據(jù)。在電廠內(nèi)幾個危險源區(qū)域也設(shè)置了配置越界檢測算法的攝像頭,當(dāng)有人形穿越區(qū)域內(nèi)提前畫出的警戒線時,即時報警抓拍并嘗試捕捉人臉進行比對。
在應(yīng)用實踐中遇到了一些現(xiàn)場問題。諸如:電廠網(wǎng)絡(luò)負(fù)載高,交換機容量小,導(dǎo)致在客戶端大屏幕上獲取4路以上視頻時卡頓嚴(yán)重,影響監(jiān)視人員的判斷,也導(dǎo)致報警的實時性降低;電廠提供的攝像頭過舊,而電廠部分地區(qū)的環(huán)境光照弱,減弱了報警系統(tǒng)的判斷能力及其可使用性。對此給出了增加交換機進行網(wǎng)絡(luò)擴容,攝像頭換新且部分監(jiān)控地區(qū)適度補光的建議。建議被電廠采納并實施后,安全帽檢測的正確率達到70.4%,而越界檢測正確率達到81.3%。電廠監(jiān)管人員的壓力也大大減少,管理成本降低,效率大幅提升。
3.1.1算法流程
安全帽檢測算法是先通過前景檢測將工人和背景分離,再根據(jù)人體膚色與其他顏色有很大的區(qū)別,通過膚色定位出人臉部位。定位出人臉后向上掃描,根據(jù)提前訓(xùn)練好的卷積神經(jīng)網(wǎng)絡(luò),判別頭部是否是安全帽的顏色。如果不是,可以報警提示, 記錄此人沒有佩戴安全帽。對于佩戴安全帽以外的帽子等同未帶安全帽的情況:由于安全帽常用的顏色包括紅、黃、藍 3 種顏色,根據(jù)不同色彩的安全帽建立閾值選取范圍。然后逐點統(tǒng)計安全帽估測區(qū)域的像素點,若像素點的RGB值滿足安全帽顏色閾值表中某種安全帽的顏色閾值范圍,則說明該點屬于安全帽,將該點記錄下來。最后對統(tǒng)計點進行分類,判斷記錄的安全帽顏色點的數(shù)量占整個統(tǒng)計區(qū)域像素點數(shù)量的比例,若超過某一比例則判定其佩戴相應(yīng)顏色的安全帽,若均達不到要求,則判定其未佩戴安全帽,觸發(fā)報警,并將當(dāng)時的圖像抓拍保存。
3.1.2算法核心
檢測算法核心為深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò),用于判斷定位出來的人臉部位是否佩戴安全帽,其分為輸入層、卷積層、池化層、全連接層與輸出層,主要公式如下。
卷積運算:
激活函數(shù)采用ReLU(Rectified Linear Units)函數(shù):
f(x)=max(0,x)
反向傳輸調(diào)整權(quán)重:
使用平方誤差函數(shù),對與一個C個類和N個訓(xùn)練樣本的例子,總誤差如下:
通過誤差反向傳輸,根據(jù)梯度最速下降法,找到各個神經(jīng)元的權(quán)值w與偏置b的最快下降方向,并將w與b分別乘以學(xué)習(xí)率,得到調(diào)整后的權(quán)值w′與偏置b′。
3.2.1算法流程
越界檢測算法的核心是背景差分法,它是一種對靜止場景進行運動分割的通用方法,它將當(dāng)前獲取的圖像幀與背景圖像做差分運算,得到目標(biāo)運動區(qū)域的灰度圖,對灰度圖進行閾值化提取運動區(qū)域,而且為避免環(huán)境光照變化影響,背景圖像根據(jù)當(dāng)前獲取圖像幀進行更新。
3.2.2算法核心
根據(jù)前景檢測,背景維持和后處理方法,存在幾種不同的背景差方法。若設(shè)It,Bt分別為當(dāng)前幀與背景幀圖像,T為前景灰度閾值,則其中一種方法流程如下:
首先取前幾幀圖像的平均值,將其作為初始的背景圖像Bt,再用當(dāng)前幀圖像與背景圖像作灰度減運算,并取絕對值,公式如下:
|It(x,y)-Bt(x,y)|
若對當(dāng)前幀的像素(x,y),有:
|It(x,y)-Bt(x,y)|>T
則該像素點為前景點,接著對前景像素圖進行形態(tài)學(xué)操作(腐蝕、膨脹、開閉操作等),最后用當(dāng)前幀圖像對背景圖像進行更新。
今后將在反向傳輸方向提高樣本的輸入,精確參數(shù),降低誤報,爭取近期將各項正確率都提高到90%以上。同時也將對電廠安全帶高空作業(yè),蒸汽泄漏等智能功能利用深度學(xué)習(xí)進行研究,將大大提高電廠的技防能力。