劉喜文,何 崗,楊賢文,張永杰,吳昳霏,郭晨光
(1.中國(guó)石油天然氣管道通信電力工程有限公司 衛(wèi)星通信事業(yè)部,河北 廊坊 065000;2.武漢倍特威視系統(tǒng)有限公司 技術(shù)部,湖北 武漢 430070;3.北京航天愛(ài)威電子技術(shù)有限公司 工程部,北京 100039)
在石化、電力、煤礦及建筑生產(chǎn)企業(yè)施工過(guò)程中,容易引發(fā)各種安全事故,事故涉及的原因多種多樣,包括管理、人員素質(zhì)、設(shè)備工具、以及其它各種問(wèn)題。統(tǒng)計(jì)某石化企業(yè)事故原因,分析其中由于違章違紀(jì)作業(yè)導(dǎo)致事故的占46.5%,管理不善導(dǎo)致的事故占25.7%,人員素質(zhì)與安全意識(shí)導(dǎo)致的事故占21.8%,其它原因?qū)е碌氖鹿收?%。由此可見(jiàn),由于違規(guī)操作或違反規(guī)定引起事故占比達(dá)68.3%,成為引發(fā)事故的主要原因。在石化、電力、煤礦、及建筑生產(chǎn)施工現(xiàn)場(chǎng)等危險(xiǎn)場(chǎng)所作業(yè)時(shí),均有佩戴安全帽的要求。不按規(guī)范佩戴安全帽將有非常重大安全的隱患。安全帽對(duì)人體頭部受外力傷害起保護(hù)作用,主要保護(hù)頭部,防高空物體墜落,防物體打擊、碰撞。
目前在視頻監(jiān)控系統(tǒng)普遍使用的情況下,網(wǎng)絡(luò)和高清監(jiān)控已經(jīng)具備通過(guò)攝像機(jī)來(lái)采集作業(yè)現(xiàn)場(chǎng)視頻圖像的條件,通過(guò)視頻分析安全帽的顏色、輪廓、佩戴者的身形和各類(lèi)觀察視角的變化因素,發(fā)現(xiàn)在戶(hù)外真實(shí)場(chǎng)景下,安全帽識(shí)別的準(zhǔn)確性、普適性還是個(gè)難點(diǎn)[1]。
石油工地一般具有舊的模擬監(jiān)控系統(tǒng),為節(jié)約成本,開(kāi)發(fā)一套基于GB28181協(xié)議的安全視頻監(jiān)控平臺(tái),其將私有協(xié)議的視頻監(jiān)控?cái)z像頭的實(shí)時(shí)視頻流轉(zhuǎn)成滿(mǎn)足國(guó)標(biāo)協(xié)議的流,平臺(tái)兼容市場(chǎng)絕大主流品牌攝像機(jī)。整個(gè)系統(tǒng)的架構(gòu)包括3個(gè)主要部分:①監(jiān)控設(shè)備上采集的視頻源與智能分析引擎;②服務(wù)端上的策略管理與智能報(bào)警服務(wù)器;③客戶(hù)端上的智能報(bào)警瀏覽系統(tǒng)(包含處理單路視頻的單個(gè)瀏覽系統(tǒng),或是包含大量攝像機(jī)的大型網(wǎng)絡(luò)瀏覽系統(tǒng))。這些模塊可以在單臺(tái)計(jì)算機(jī)上,也可分布在不同計(jì)算機(jī)上。
智能分析引擎是系統(tǒng)的核心,對(duì)視頻源進(jìn)行底層次的處理。策略管理與智能報(bào)警服務(wù)器主要通過(guò)預(yù)設(shè)的報(bào)警管理?xiàng)l件對(duì)處理過(guò)的視頻流進(jìn)行高層次的分析,判斷是否符合報(bào)警條件。結(jié)合視頻行為分析技術(shù)和現(xiàn)場(chǎng)實(shí)際情況的研究,提出了活動(dòng)目標(biāo)提取+安全帽輪廓匹配+顏色提取+多層神經(jīng)網(wǎng)絡(luò)分類(lèi)+統(tǒng)計(jì)學(xué)模型的多層組合邏輯解決方法。圖1所示為系統(tǒng)整體軟件架構(gòu)圖。
在安全帽識(shí)別系統(tǒng)的設(shè)計(jì)過(guò)程中,發(fā)現(xiàn)以下幾個(gè)因素對(duì)安全帽識(shí)別在室外環(huán)境下的識(shí)別率影響較大。
攝像機(jī)安裝需滿(mǎn)足以下條件[2]:
圖1 系統(tǒng)軟件架構(gòu)
針對(duì)可變焦的球機(jī),安裝位置角度較為寬泛。選用多預(yù)置位模塊,鏡頭變焦倍率在x23倍,可以觀察到更遠(yuǎn)的如200 m~300 m遠(yuǎn)的人,固定好攝像機(jī)、穩(wěn)定成像的情況下通過(guò)多預(yù)置位切換分析視角和方位,最多可以支持4個(gè)~25個(gè)預(yù)置位。
針對(duì)槍機(jī)的安裝角度建議:攝像機(jī)光軸與地平面夾角至少15°,確保投影場(chǎng)景形成一定景深效果,攝像機(jī)與地面平行的軸盡量保持平行,不要傾斜安裝。
針對(duì)槍機(jī)安裝高度建議:在能看清目標(biāo)的情況下盡可能高,室內(nèi)建議2.5 m以上,室外建議至少5 m以上。表1列出了幾種常見(jiàn)的場(chǎng)景安裝參數(shù)(以下參數(shù)僅作參考建議)。
表1 攝像機(jī)安裝高度角度參數(shù)
攝像機(jī)在光照過(guò)亮或過(guò)暗的情況下,對(duì)成像質(zhì)量都有較嚴(yán)重的影響,穩(wěn)定的光源能顯著提高成像質(zhì)量,提升檢測(cè)結(jié)果的準(zhǔn)確率。為保證24小時(shí)的監(jiān)控需求,攝像機(jī)需根據(jù)現(xiàn)場(chǎng)環(huán)境光照情況,布設(shè)光源或特定攝像機(jī),以及確定合適安裝位置。
對(duì)于光照條件較強(qiáng)的環(huán)境,盡量選擇超低照度攝像機(jī)(如日夜型攝像機(jī));攝像機(jī)安裝位置盡量不要選在容易出現(xiàn)逆光的位置,容易使光照影響分析結(jié)果。若攝像機(jī)有固定強(qiáng)光源干擾,可安裝照明燈進(jìn)行補(bǔ)償。如果是室外環(huán)境及背光環(huán)境,為了防止光線(xiàn)的影響,建議選用寬動(dòng)態(tài)攝像機(jī),具體環(huán)境及情況請(qǐng)參見(jiàn)文獻(xiàn)[3]。
對(duì)于光照條件差的環(huán)境,需在攝像機(jī)周?chē)惭b配備紅外燈或照明燈,由于夜晚燈光會(huì)吸引昆蟲(chóng)等動(dòng)物,需要避免光源與攝像機(jī)相距過(guò)近,否則昆蟲(chóng)飛舞遮擋可能會(huì)影響攝像機(jī)檢測(cè)結(jié)果及鏡頭成像質(zhì)量。正確安裝如圖2所示,紅外燈或照明燈須與攝像機(jī)間隔超過(guò)1 m。
圖2 攝像機(jī)安裝光源
在設(shè)計(jì)完整無(wú)縫覆蓋監(jiān)控區(qū)域時(shí),多個(gè)攝像機(jī)的位置選擇有一定要求:
例如無(wú)論哪一款攝像機(jī),身高為H的人在視野邊緣處無(wú)法覆蓋顯示全身,只有看到全身完整影像的區(qū)域才算是分析有效區(qū)域。當(dāng)在視野邊緣處布設(shè)下一個(gè)攝像時(shí),如果前一個(gè)攝像機(jī)只能顯示人的頭部,而下一攝像機(jī)只能顯示人的腳部,這對(duì)分析結(jié)果將造成影響。正確的設(shè)計(jì)方法是使兩臺(tái)攝像機(jī)有部分重疊,從而使任意時(shí)刻至少有一臺(tái)攝像機(jī)能看到身高H的人物的完整影像,從而能對(duì)當(dāng)前人的特征進(jìn)行完整分析。
適用于智能視頻分析的場(chǎng)景與傳統(tǒng)監(jiān)控的場(chǎng)景有一定區(qū)別。傳統(tǒng)監(jiān)控場(chǎng)景是為監(jiān)控人員觀看的視角而設(shè)計(jì),其主要特點(diǎn)是以方便看清目標(biāo)細(xì)節(jié)的方式進(jìn)行監(jiān)控,較多使用中短焦鏡頭,場(chǎng)景也較窄。但如果在智能視頻分析的場(chǎng)景下,上述監(jiān)控環(huán)境易造成目標(biāo)抖動(dòng)嚴(yán)重且易遮擋整個(gè)視頻圖像區(qū)域,造成人和場(chǎng)景特征的分類(lèi)以及對(duì)人的尺度特征影響較大,此類(lèi)場(chǎng)景應(yīng)用的分析效果不理想。因此對(duì)于智能視頻分析,要求在保證能提取到目標(biāo)特征的情況下,盡量安裝廣角攝像機(jī)增大視野,增加攝像機(jī)高度,增大俯角,以自上而下的方式監(jiān)控分析活動(dòng)目標(biāo),特別是針對(duì)室內(nèi)空間較小的環(huán)境[4]。
表2舉例展示了不同場(chǎng)景下攝像機(jī)安裝的實(shí)際視頻素材。分別包含了幾個(gè)經(jīng)典的應(yīng)用場(chǎng)景(室內(nèi),周界,道路,鐵路)的合適與不合適的攝像機(jī)安裝素材。左列為不合適的安裝方式。右側(cè)為正確的安裝方式。
表2 攝像機(jī)安裝場(chǎng)景對(duì)照
安全帽是一種紋理比較少,輪廓較為明顯,顏色相對(duì)單一的物體,在實(shí)際應(yīng)用的監(jiān)控視頻里,即使使用目前檢測(cè)效果非常好的SIFT(scale invariant feature transform)特征[5],或SURF(speeded up robust features)特征[6],也很難對(duì)安全帽這一紋理材質(zhì)較少的物體的識(shí)別產(chǎn)生較好的效果。因此,提出了一系列識(shí)別安全帽的方法,包括使用輪廓,顏色以及邊緣特征對(duì)這一物體來(lái)做描述與識(shí)別。
基于知識(shí)的安全帽檢測(cè)方法,對(duì)比傳統(tǒng)的HOG/HAAR等方法[7],將輪廓匹配用于安全帽識(shí)別,實(shí)驗(yàn)結(jié)果表明會(huì)有較好的魯棒性。
(1)輪廓提取。針對(duì)待檢測(cè)的視頻幀,首先利用Sobel算子提取待檢測(cè)區(qū)域的輪廓,并進(jìn)行濾波,高斯平滑等處理,使線(xiàn)條平滑。然后對(duì)輪廓以固定值offset進(jìn)行均勻采樣獲取采樣點(diǎn),對(duì)每個(gè)輪廓采樣點(diǎn)按如下方式計(jì)算其輪廓描述子
其中,si表示每個(gè)輪廓采樣點(diǎn),F(xiàn)i表示所有采樣點(diǎn),|·| 表示計(jì)算其個(gè)數(shù)。
分別統(tǒng)計(jì)每個(gè)采樣點(diǎn)的局部尺度S,根據(jù)采樣點(diǎn)的局部尺度,進(jìn)行內(nèi)插法獲得所有點(diǎn)的尺度,對(duì)所有點(diǎn)按尺度正比進(jìn)行重采樣。重新計(jì)算采用點(diǎn)的各輪廓描述子。最終計(jì)算的輪廓描述子是一個(gè)順序排列的 |Fi| 維特征向量[8]。
(2)輪廓匹配。采用DTW(動(dòng)態(tài)時(shí)間規(guī)劃算法)[9]來(lái)進(jìn)行輪廓匹配。通過(guò)比較與其它算法,DTW時(shí)間效率是最優(yōu)的。已知模版開(kāi)輪廓s與待檢測(cè)閉合輪廓t,首先計(jì)算兩輪廓各個(gè)采樣點(diǎn)之間的特征矢量距離,得到距離矩陣D。 定義兩輪廓上任意兩采樣點(diǎn)的矢量距離為
從而將輪廓匹配問(wèn)題轉(zhuǎn)換為求解出一條最佳匹配路徑問(wèn)題。D值在0-1之間,值越接近1 表示匹配越好。
根據(jù)一個(gè)安全帽輪廓,來(lái)對(duì)比其它輪廓和當(dāng)前輪廓的匹配值,值越大相似度越大。在實(shí)驗(yàn)中將此值根據(jù)經(jīng)驗(yàn)進(jìn)行調(diào)整。用戶(hù)對(duì)檢測(cè)的靈敏度提高時(shí),此值往小方向調(diào)整0.2,反之向接近1的方向調(diào)整0.6,精度變高,但漏檢測(cè)率會(huì)提升。
傳統(tǒng)技術(shù)方案遇到的問(wèn)題會(huì)有以下情形,目標(biāo)提取偏差,由于近似色塊、外形目標(biāo)、燈光、環(huán)境光反射干擾,導(dǎo)致目標(biāo)提取錯(cuò)誤,造成漏檢和誤檢[10]。
圖3中,這是個(gè)典型的應(yīng)用于無(wú)人值守開(kāi)閉所的場(chǎng)景。人員在進(jìn)入房間內(nèi)時(shí),畫(huà)面中會(huì)伴隨一系列環(huán)境光的急劇變化,當(dāng)開(kāi)、關(guān)門(mén),開(kāi)、關(guān)燈時(shí),環(huán)境光與室內(nèi)照明光線(xiàn)、攝像機(jī)的紅外輔助燈光交替出現(xiàn)、消失。看似單一的一個(gè)通道場(chǎng)景,在實(shí)踐中發(fā)現(xiàn),各類(lèi)背景的顏色、形狀、類(lèi)似色塊,墻面和衣物漫反射的光線(xiàn),會(huì)對(duì)安全帽目標(biāo)部分準(zhǔn)確提取、顏色分析、邊緣提取動(dòng)作造成干擾。針對(duì)此情形,對(duì)比不同顏色空間RGB、HSI、LAB這3種模型。
圖3 各種場(chǎng)景環(huán)境下光線(xiàn)顏色變化
RGB(紅綠藍(lán))顏色模型應(yīng)用較為廣泛,適合于在數(shù)字圖像處理顯示領(lǐng)域,比如常用的顯示器屏幕顯示使用的就是RGB三通道模式。RGB模型也稱(chēng)為加色法混色模型。它是以紅綠藍(lán)三色為原色光,通過(guò)三色互相疊加來(lái)實(shí)現(xiàn)混色的方法,由于其實(shí)現(xiàn)的簡(jiǎn)單,因而廣泛用于各種顯示器及手機(jī)屏幕等各種發(fā)光體的顯示。其混色規(guī)律是:以等量的紅、綠、藍(lán)基色光混合。但是由于采集的目標(biāo)是反射光,用RGB模型并不能很好反映色調(diào)的變化。
HSI(hue-saturation-intensity)顏色模型是美國(guó)色彩學(xué)家孟塞爾(H.A.Munseu)于1915年提出的,它反映了人的視覺(jué)系統(tǒng)感知彩色的方式,以色調(diào)(H)、飽和度(S)和強(qiáng)度(I)這3種基本特征量來(lái)感知顏色,詳細(xì)說(shuō)明可參考文獻(xiàn)[11]。在HSI顏色模型的雙六棱錐表示,I是強(qiáng)度軸,色調(diào)H的角度范圍為[0,2π],其中,純紅色的角度為0,純綠色的角度為2π/3,純藍(lán)色的角度為4π/3。
Lab模式起源于國(guó)際照明委員會(huì)(CIE)在1931年所制定的一種測(cè)定顏色的國(guó)際標(biāo)準(zhǔn)。這項(xiàng)標(biāo)準(zhǔn)于1976年被改進(jìn),并且命名為L(zhǎng)ab顏色模型。Lab顏色模型彌補(bǔ)了RGB和CMYK兩種色彩模式的不足。它是一種設(shè)備無(wú)關(guān)的顏色模型,也是一種基于生理特征的顏色模型,詳細(xì)說(shuō)明可參考文獻(xiàn)[12]。Lab顏色空間比計(jì)算機(jī)顯示器甚至比人類(lèi)視覺(jué)的色域都要大。a/b色域的表達(dá)方式,與要識(shí)別的紅黃藍(lán)黑等顏色對(duì)應(yīng),這為算法判斷安全帽的顏色提供了較好的依據(jù),對(duì)于L值域的范圍要求弱,正好與現(xiàn)實(shí)中環(huán)境光照度多變的特性對(duì)應(yīng)。
常用的顏色檢測(cè)模型有基于閾值的顏色范圍的檢測(cè),參數(shù)化的高斯密度函數(shù)統(tǒng)計(jì)檢測(cè)以及非參數(shù)化的直方圖統(tǒng)計(jì)檢測(cè)等。
簡(jiǎn)單的通過(guò)Lab顏色范圍來(lái)檢測(cè)安全帽顏色區(qū)域來(lái)判斷安全帽顏色區(qū)域,相當(dāng)快速高效,在實(shí)時(shí)系統(tǒng)中具有一定的實(shí)際意義。例如,采用YCaCr顏色空間的CbCr平面,如果輸入的像素顏色落入給定的矩形閾值,就認(rèn)定膚色區(qū)域,安全帽顏色區(qū)域同樣可以依據(jù)這種方式進(jìn)行判斷檢測(cè)。采用的Lab顏色空間同樣取得了一定的效果。雖然這種方式比較快捷,但要取得更好的效果則需要考慮如何劃定這種顏色矩形區(qū)域,以及安全帽顏色的聚集程度。因此,提出了一種貝葉斯分類(lèi)的方法,來(lái)檢測(cè)安全帽區(qū)域,實(shí)際應(yīng)用中達(dá)到了很好的效果。這一方法包含了手工標(biāo)注統(tǒng)計(jì)以及檢測(cè)兩個(gè)階段。
首先通過(guò)實(shí)時(shí)采集獲取到的圖像進(jìn)行標(biāo)注,獲取安全帽區(qū)域。對(duì)于不同種類(lèi)的安全帽需要進(jìn)行分類(lèi)標(biāo)注。然后對(duì)安全帽區(qū)域進(jìn)行分塊統(tǒng)計(jì)。利用統(tǒng)計(jì)的結(jié)果再對(duì)待檢測(cè)圖像進(jìn)行安全帽區(qū)域的提取。
在手工標(biāo)注統(tǒng)計(jì)階段,對(duì)每一張圖片安全帽區(qū)域塊按Lab顏色空間進(jìn)行統(tǒng)計(jì),但是只用到了a,b兩個(gè)顏色通道而沒(méi)有統(tǒng)計(jì)L通道,L代表亮度,實(shí)際的監(jiān)控視頻中光照變化范圍大比較敏感,L通道的值無(wú)法反應(yīng)安全帽的區(qū)域。
對(duì)于每一個(gè)圖像點(diǎn)I(x,y),其顏色為c=c(x,y),則分別計(jì)算以下幾個(gè)統(tǒng)計(jì)特征:
(1)安全帽顏色在圖像中的概率P(s);
(2)每個(gè)顏色c在訓(xùn)練集中的概率P(c);
(3)顏色c是安全帽顏色的概率P(c/s)。
基于以上的計(jì)算,利用貝葉斯公式,可以得到顏色c為安全帽顏色的概率
P(s/c)=P(c/s)P(s)/P(c)
針對(duì)每個(gè)安全帽區(qū)域塊,定義了一個(gè)高低閾值Tmax和Tmin,每一個(gè)P(s/c)>Tmax的圖像塊為安全帽區(qū)域,每一個(gè)P(s/c)>Tmin并且P(s/c) 由于受光線(xiàn),圖像分辨率以及安全帽被部分遮擋等影響,SIFT一類(lèi)的描述子在安全帽的識(shí)別上并不穩(wěn)定,能穩(wěn)定檢測(cè)安全帽紋理特性的特征描述子非常少。因此,提出了一種能夠適應(yīng)光照,尺度以及遮擋等特性的描述這種紋理細(xì)節(jié)較少的物體的方法,圖4為安全帽模型建立步驟。 圖4 安全帽模型建立步驟 首先,針對(duì)安全帽原始模型,提取邊緣線(xiàn)段。直線(xiàn)提取算法(LSD)最初是由Von Gioi等提出的[14]。由于需要提取一個(gè)穩(wěn)定的安全帽描述子,原始的直線(xiàn)提取算法對(duì)直線(xiàn)長(zhǎng)度沒(méi)有限制,容易造成匹配不穩(wěn)定。因此需在此基礎(chǔ)上做一些改進(jìn),使生成的線(xiàn)段長(zhǎng)度相等。具體是通過(guò)設(shè)定一個(gè)線(xiàn)段長(zhǎng)度閾值w,確保所有線(xiàn)段長(zhǎng)度都至少能達(dá)到w閾值所達(dá)到的像素值。對(duì)原始LSD算法與改進(jìn)后的算法結(jié)果對(duì)比,改進(jìn)后的算法的線(xiàn)段提取方法更加穩(wěn)定。 然后對(duì)安全帽模型圖建立遮罩區(qū)域并提取其矩形區(qū)域。 實(shí)際采集場(chǎng)景,頭戴安全帽在相機(jī)視角姿態(tài)方向尺度等各異,甚至存在手拿安全帽的情況,因此對(duì)安全帽的描述需要其適應(yīng)旋轉(zhuǎn)與尺度的變化。確定起始點(diǎn)后,通過(guò)對(duì)提取的矩形區(qū)域做旋轉(zhuǎn)采樣,進(jìn)行正反nr=8個(gè)方向的采樣。其中ml點(diǎn)為描述子起始點(diǎn),為旋轉(zhuǎn)中心。每一個(gè)大的矩形包含4×4個(gè)塊。每個(gè)塊由一定量的像素組成。對(duì)于每個(gè)塊,統(tǒng)計(jì)其采樣值和角度信息,其中采樣值ns為 ns=σγRminn(lB) 其中,σ為當(dāng)前的尺度,γ表示當(dāng)前塊的線(xiàn)段像素的數(shù)據(jù)量復(fù)雜度信息,是歸一化的值,范圍在[0,1]之間。為0時(shí)表示當(dāng)前塊沒(méi)有任何線(xiàn)段信息。Rmin表示最小的線(xiàn)段尺寸信息。n(lB) 表示線(xiàn)段數(shù)。 針對(duì)塊中的每個(gè)線(xiàn)段,其角度信息ai 式中:si表示線(xiàn)段的單位向量,gi表示梯度方向,tij表示描述子起始點(diǎn)lj與當(dāng)前點(diǎn)的向量。下圖所示即為其中一個(gè)描述子的定義。對(duì)4×4的塊進(jìn)行編碼,如圖5所示為邊緣特征描述子編碼方式,其中14號(hào)塊存在3條線(xiàn)段,a0,a1,a2分別為其角度信息。 圖5 邊緣特征描述子編碼方式 在完成場(chǎng)景以及模型的特征描述子構(gòu)建后,對(duì)場(chǎng)景與模型進(jìn)行特征匹配,匹配方式主要為尋找顯示候選起始點(diǎn),對(duì)每個(gè)起始點(diǎn)與模型進(jìn)行比對(duì),即對(duì)比4×4個(gè)塊的編碼值,獲取歐式距離最小的描述子。然后通過(guò)kdtree搜索臨近點(diǎn),對(duì)各線(xiàn)段搜索定位,進(jìn)行精確匹配。 實(shí)際應(yīng)用中,由于安全帽可能被不正確的佩戴,基于邊緣特征匹配方法由于能夠檢測(cè)到安全帽的佩戴方向,同時(shí)結(jié)合人體區(qū)域的檢測(cè),判斷安全帽是否在頭部區(qū)域,綜合來(lái)判斷是否為不正確佩戴方式。提高準(zhǔn)確率,減少誤報(bào)。 常見(jiàn)監(jiān)控場(chǎng)景下,經(jīng)常存在著樹(shù)枝隨風(fēng)擺動(dòng),背景中物體的微小移動(dòng)以及天空中的雨點(diǎn)或雪花,這些情況都會(huì)影響系統(tǒng)對(duì)安全帽目標(biāo)的檢測(cè)和識(shí)別,需要對(duì)這些干擾目標(biāo)進(jìn)行濾波處理。 對(duì)安全帽目標(biāo)檢測(cè)識(shí)別中可采用的方法有主成分分析、神經(jīng)網(wǎng)絡(luò)方法、支持向量機(jī)、隱馬爾可夫模型、Adaboost算法等,類(lèi)HAAR分類(lèi)器作為機(jī)器視覺(jué)的基本算法,也被工業(yè)界廣泛的采用。本節(jié)主要針對(duì)濾除非人體的目標(biāo)造成的誤檢進(jìn)行眼鏡,為識(shí)別出安全帽,使用多層神經(jīng)網(wǎng)絡(luò),并運(yùn)用CUDA加速算法,對(duì)系統(tǒng)進(jìn)行分類(lèi)優(yōu)化[15]。 濾除目標(biāo)干擾的分類(lèi)器采用32層的神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)。由卷積層,池化層,route(路由)層,reorg(重構(gòu))層等網(wǎng)絡(luò)層構(gòu)成。其網(wǎng)絡(luò)參數(shù)如圖6所示。由最后的檢測(cè)層輸出預(yù)測(cè)的類(lèi)別概率值與檢測(cè)框坐標(biāo)。其中,概率值可表示為 式中:Pr(Object) 表示檢測(cè)框包含目標(biāo)的概率,BBgt表示基于訓(xùn)練標(biāo)簽的參考標(biāo)準(zhǔn)框(groud truth box),BBdt表示檢測(cè)到的邊界框。符號(hào)area(·) 表示框的面積。 圖6 多層神經(jīng)網(wǎng)絡(luò)模型 每個(gè)檢測(cè)框包含5個(gè)參數(shù),分別是stx,sty,tw,th以及Pr(Object)。 (stx,sty)表示檢測(cè)框的中心坐標(biāo),(tw,th) 表示檢測(cè)框的寬高。所采用的方法還預(yù)測(cè)了兩個(gè)類(lèi)別的概率,即Pr(Class:人/Object) 和Pr(Class:安全帽/Object) 分別表示人和安全帽落入該檢測(cè)框的概率值,所以最后的輸出層共有13×13×125維的張量。 第25層和28層為route層。route層的作用是進(jìn)行層的合并。30層輸出的大小是13×13,是指把圖片通過(guò)卷積或池化,最后縮小到一個(gè)13×13大小的格。每一個(gè)格的output數(shù)量是125(5×25),5是指對(duì)每一個(gè)13×13的小格配有5個(gè)邊框,25則是指每一個(gè)邊框輸出了25個(gè)浮點(diǎn)數(shù)。25個(gè)是YOLO 2對(duì)VOC的結(jié)構(gòu)。 (1)數(shù)據(jù)集 準(zhǔn)備安全帽識(shí)別數(shù)據(jù)。在訓(xùn)練時(shí)為減少運(yùn)算量,提高檢出的速度,將原來(lái)VOC訓(xùn)練集進(jìn)行重新采樣。采樣中分別對(duì)常規(guī)的紅黃藍(lán)白安全帽進(jìn)行采樣,數(shù)量約為彩色 15 000 張,再轉(zhuǎn)換灰度為15 000張。圖7為部分樣例數(shù)據(jù)及處理結(jié)果示例。 圖7 安全帽訓(xùn)練樣例與結(jié)果 (2)訓(xùn)練平臺(tái) 訓(xùn)練平臺(tái)是在PC機(jī)完成的,其主要配置為i7 6700k處理器主頻:4GHz,32G內(nèi)存,以及一塊GTX1080 6GB顯卡。系統(tǒng)運(yùn)行平臺(tái)是Windows 10??蚣転镈arknet。檢測(cè)器的檢測(cè)速度達(dá)到25幀/s,滿(mǎn)足實(shí)時(shí)性要求。 (3)訓(xùn)練結(jié)果 將學(xué)習(xí)率設(shè)定在10E-5,在大約訓(xùn)練迭代到4000次時(shí),模型已經(jīng)有一定效果。通過(guò)目標(biāo)分類(lèi)識(shí)別,可以進(jìn)一步降低非人員誤報(bào)的機(jī)率,大約降低10%以上的誤報(bào)率。最后統(tǒng)計(jì)其在數(shù)據(jù)集上的查準(zhǔn)率,查全率以及每秒識(shí)別幀數(shù)。結(jié)果見(jiàn)表3。 表3 測(cè)試集實(shí)驗(yàn)結(jié)果 針對(duì)不同的使用場(chǎng)景,需要使用不同的優(yōu)化算法。目前支持兩種典型場(chǎng)景:通道模式和場(chǎng)地模式。 通道模式,適用于進(jìn)門(mén)場(chǎng)景。一般場(chǎng)景是結(jié)合門(mén)禁和人行閘機(jī)使用,如果沒(méi)有佩戴安全帽,則不會(huì)打開(kāi)閘機(jī),同時(shí)還能聯(lián)動(dòng)音箱,發(fā)出友情提示“請(qǐng)佩戴安全帽進(jìn)入!”或正確佩戴了安全帽,則直接打開(kāi)閘機(jī),允許用戶(hù)順利通過(guò)。 場(chǎng)地模式,是指在進(jìn)入工作區(qū)內(nèi)后,人員由于活動(dòng),會(huì)被全程跟蹤,當(dāng)目標(biāo)足夠清晰,頭部達(dá)到40×40個(gè)像素時(shí),分析系統(tǒng)就會(huì)對(duì)是否佩戴安全帽做出持續(xù)分析判斷。如果被觀察者此時(shí)沒(méi)有佩戴安全帽,則會(huì)告警,抓拍圖片,同時(shí)將此信息和圖片發(fā)送給訂閱此服務(wù)的管理人員手機(jī)和電腦上。 系統(tǒng)在實(shí)際運(yùn)行當(dāng)中,統(tǒng)計(jì)誤報(bào)率為7%~11%,已經(jīng)完全可以滿(mǎn)足無(wú)人值守的要求,同時(shí)隨著對(duì)現(xiàn)場(chǎng)環(huán)境的不斷自我學(xué)習(xí),更新數(shù)據(jù)庫(kù),調(diào)整算法參數(shù),誤報(bào)率將會(huì)越來(lái)越低。2.3 安全帽邊緣特征識(shí)別
2.4 濾除目標(biāo)干擾算法
2.5 算法驗(yàn)證
3 結(jié)束語(yǔ)