朱婷婷
摘要:目標(biāo)檢測(cè)是電子計(jì)算機(jī)所涉及的一個(gè)課題之一,且具有一定的挑戰(zhàn)性。本文基于深度學(xué)習(xí)的單步目標(biāo)檢器特征增強(qiáng)算法展開了討論和實(shí)驗(yàn),希望能夠有效的促進(jìn)我國電子計(jì)算機(jī)應(yīng)用技術(shù)的進(jìn)一步發(fā)展。
關(guān)鍵詞:?jiǎn)尾侥繕?biāo)檢測(cè)技術(shù);特征增強(qiáng)算法;深度學(xué)習(xí)
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2019)06-0132-01
0 引言
眾所周知,主觀判斷是與所接受的視覺信息相互聯(lián)系的,而對(duì)于人類來說,圖像以及動(dòng)態(tài)視頻能夠清晰的將信息進(jìn)行有效的表達(dá)和傳遞。因此,在新的形勢(shì)之下,對(duì)目標(biāo)檢測(cè)技術(shù)進(jìn)行更深層次的研究具有一定積極的意義,能夠促使我國進(jìn)一步有效的實(shí)現(xiàn)城市交通智能化、工業(yè)檢測(cè)智能化、航空航天智能化。在目標(biāo)檢測(cè)技術(shù)的研究基礎(chǔ)上,能夠?qū)D像進(jìn)行有效的處理,從而將出現(xiàn)在圖像動(dòng)態(tài)視頻中的目標(biāo)物以最短的時(shí)間檢測(cè)出來。根據(jù)相關(guān)研究表明,在目標(biāo)檢測(cè)系統(tǒng)中,要想進(jìn)一步有效的實(shí)現(xiàn)實(shí)時(shí)性和魯棒性,是具有一定困難。對(duì)于魯棒性來說,無法對(duì)目標(biāo)人群的行為軌跡進(jìn)行有效的預(yù)判,需要將環(huán)境中的不確定因素進(jìn)行考慮;而實(shí)時(shí)性是系統(tǒng)所必須具備的基礎(chǔ)性能,鑒于該系統(tǒng)的圖像處理方法不能過于復(fù)雜,本文在傳統(tǒng)的行人特征基礎(chǔ)上,對(duì)單步目標(biāo)檢測(cè)技術(shù)展開了課題性研究。
1 單步目標(biāo)檢測(cè)器特征增強(qiáng)算法的相關(guān)概述
行人單步目標(biāo)檢測(cè)算法是電子計(jì)算機(jī)進(jìn)行視覺領(lǐng)域中的研究課題之一,為進(jìn)一步有效的實(shí)現(xiàn)該項(xiàng)計(jì)算,需要在原有的計(jì)算體系基礎(chǔ)上將圖像處理、模式識(shí)別、機(jī)器學(xué)習(xí)等相關(guān)專業(yè)技術(shù)進(jìn)行添加。就目前來說,進(jìn)行單步目標(biāo)檢測(cè)便是通過特征加強(qiáng)機(jī)器學(xué)習(xí)的方式來展開研究,并將機(jī)器學(xué)習(xí)的算法進(jìn)行有效的創(chuàng)新和優(yōu)化,以達(dá)到課題研究目標(biāo)。但是對(duì)于單步目標(biāo)檢測(cè)算法來說,仍舊存在許多不足和可改進(jìn)之處[1]。(1)行人外形特征無法確定,圖像中的目標(biāo)人群會(huì)因?yàn)榇┲母淖兌谛蜗笊习l(fā)生改變,當(dāng)目標(biāo)行人與行人之間的距離發(fā)生改變后其大小特征同樣會(huì)隨之發(fā)生改變。(2)行人所處的環(huán)境發(fā)生改變也會(huì)影響檢測(cè)算法的準(zhǔn)確性和穩(wěn)定性,一般來說,影響因素為客觀環(huán)境、自然環(huán)境等等。(3)單步目標(biāo)檢測(cè)算法一般都是應(yīng)用到視頻監(jiān)控中,這也就意味著目標(biāo)點(diǎn)會(huì)隨時(shí)處于動(dòng)態(tài)化,需要在實(shí)際應(yīng)用過程中具有實(shí)時(shí)性。
2 單步目標(biāo)檢測(cè)器特征算法
2.1 傳統(tǒng)目標(biāo)檢測(cè)算法
目標(biāo)檢測(cè)是電子計(jì)算機(jī)進(jìn)行視覺領(lǐng)域研究的重要課題之一,也是最為基礎(chǔ)的項(xiàng)目,其主要研究目標(biāo)在于能夠?qū)D像或動(dòng)態(tài)視頻中的目標(biāo)進(jìn)行精確的定位或分類。就傳統(tǒng)目標(biāo)檢測(cè)算法來說,在較長(zhǎng)的一段時(shí)間段,都是以可變形組件模型算法為基礎(chǔ)算法。隨著信息技術(shù)的不斷創(chuàng)新與發(fā)展,在傳統(tǒng)目標(biāo)檢測(cè)算法基礎(chǔ)上進(jìn)行了計(jì)算法的研究和應(yīng)用,逐漸形成了更多具有優(yōu)勢(shì)的計(jì)算方法。
2.2 基于卷積神經(jīng)網(wǎng)絡(luò)的單步檢測(cè)算法
為進(jìn)一步有效的提高現(xiàn)代化網(wǎng)絡(luò)效率,相關(guān)研究學(xué)者提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)的檢測(cè)計(jì)算方法,即YOLO網(wǎng)絡(luò)。在新的網(wǎng)絡(luò)環(huán)境中,能夠以更快的速度來對(duì)所鎖定的目標(biāo)人群進(jìn)行精準(zhǔn)定位和分類。該網(wǎng)絡(luò)更進(jìn)一步在所有卷積層中加入批標(biāo)準(zhǔn)化概念,并應(yīng)用卷積網(wǎng)絡(luò)取代傳統(tǒng)意義上的全連接層,支持邊框預(yù)測(cè)功能的實(shí)現(xiàn)。除此以外,SSD網(wǎng)絡(luò)以Anchor Box為基礎(chǔ),支持多個(gè)特征層的同步性預(yù)測(cè)。同時(shí),為進(jìn)一步有效保證單步檢測(cè)計(jì)算正確率,該項(xiàng)網(wǎng)絡(luò)要對(duì)損失函數(shù)進(jìn)行有效的規(guī)劃和設(shè)計(jì),從而將極端樣本所存在的種種問題進(jìn)行及時(shí)的解決和優(yōu)化,盡可能的將其所有優(yōu)勢(shì)都展現(xiàn)出來[2]。
3 網(wǎng)絡(luò)架構(gòu)
3.1 單步目標(biāo)檢測(cè)器SSD
在卷積層基礎(chǔ)上進(jìn)行SSD網(wǎng)絡(luò)構(gòu)建。SSD網(wǎng)絡(luò)系統(tǒng)中進(jìn)行了采樣卷積層的添加,被添加的卷積層、基礎(chǔ)網(wǎng)絡(luò)層都被應(yīng)用到邊框預(yù)測(cè)中,用于確定置信度和目標(biāo)實(shí)際偏移量。所有預(yù)測(cè)出來的數(shù)值都將由兩個(gè)獨(dú)立的卷積層所產(chǎn)生,對(duì)于每一個(gè)卷積層來說在其邊框回歸上會(huì)產(chǎn)生四個(gè)數(shù)值,并產(chǎn)生不同類別的置信度,最后采用相關(guān)的計(jì)算法對(duì)所有數(shù)據(jù)進(jìn)行準(zhǔn)確的計(jì)算。
3.2 具有方向性的特征提取塊
在對(duì)網(wǎng)絡(luò)結(jié)構(gòu)進(jìn)行特征提取時(shí),常常采用的是級(jí)聯(lián)的方式來輔助網(wǎng)絡(luò)的計(jì)算與檢測(cè),并對(duì)加深層網(wǎng)絡(luò)展開采樣活動(dòng)。因此,對(duì)于這一類結(jié)構(gòu)來說,為準(zhǔn)確獲取到目標(biāo)圖片的基礎(chǔ)信息或語義信息,需要在網(wǎng)絡(luò)深度的基礎(chǔ)上進(jìn)行有效的提取,才能夠?yàn)槟繕?biāo)群體的信息分類提供一定的幫助。但是,隨著網(wǎng)絡(luò)深度的不斷加深,很有可能會(huì)將目標(biāo)信息所要獲取的信息弄丟,且在準(zhǔn)確性上也無法保證。但是,對(duì)于多尺度的預(yù)測(cè)來說,整個(gè)信息數(shù)據(jù)預(yù)測(cè)過程中都沒有將尺度特征進(jìn)行有效的關(guān)聯(lián)。特征層的卷積將特征提取的方式進(jìn)行了統(tǒng)一,因此,所提取到的信息及圖片特征在各個(gè)方向上不具備差異性[3]。
3.3 多尺度預(yù)測(cè)
將特征提取模塊與多尺度特征進(jìn)行有效的融合,仍然需要進(jìn)行特征圖金字塔的建立,從而有效的實(shí)現(xiàn)對(duì)于數(shù)據(jù)進(jìn)行多尺度的預(yù)測(cè)。因此,在進(jìn)行研究過程中,將特征金字塔加入到其中,并對(duì)大小不同的每層特征圖進(jìn)行多尺度預(yù)測(cè)。
3.4 網(wǎng)絡(luò)訓(xùn)練
為了構(gòu)建魯棒性強(qiáng)的模型,在數(shù)據(jù)擴(kuò)增方面,與經(jīng)典SSD的方法基本一致,通過對(duì)原始數(shù)據(jù)進(jìn)行隨機(jī)裁切、翻轉(zhuǎn)操作,來擴(kuò)充訓(xùn)練數(shù)據(jù)集。為了檢測(cè)具有不同寬高比的各類物體,本文設(shè)置了具有5種不同寬高比的默認(rèn)檢測(cè)框,與經(jīng)典SSD的一致,分別是1、2、3、1/2、1/3。實(shí)際中,以默認(rèn)檢測(cè)框?yàn)橹虚g變量,來實(shí)現(xiàn)檢測(cè)框與預(yù)測(cè)檢測(cè)框之間的轉(zhuǎn)換。在準(zhǔn)備訓(xùn)練數(shù)據(jù)時(shí),需要將實(shí)際檢測(cè)框與最符合的對(duì)應(yīng)起來,形成從實(shí)際檢測(cè)框與默認(rèn)檢測(cè)框的對(duì)應(yīng)[4]。
實(shí)際訓(xùn)練中我們發(fā)現(xiàn)預(yù)選框與真實(shí)框經(jīng)過匹配后產(chǎn)生的負(fù)樣本(沒有匹配到真實(shí)框的預(yù)選框)數(shù)量一般要遠(yuǎn)大于正樣本(匹配到真實(shí)框的預(yù)選框)數(shù)量,這種正負(fù)樣本不平衡會(huì)導(dǎo)致網(wǎng)絡(luò)預(yù)測(cè)值向負(fù)樣本靠近以及網(wǎng)絡(luò)難以收斂等問題。因此算法訓(xùn)練時(shí)將負(fù)樣本按照置信損失進(jìn)行排序,選擇排名靠前的負(fù)樣本作為訓(xùn)練,使得正負(fù)樣本數(shù)量平衡(一般指定正樣本和負(fù)樣本的比例達(dá)到1:3),提升網(wǎng)絡(luò)分類性能。
4 結(jié)語
綜上所述,隨著深度卷積神經(jīng)網(wǎng)絡(luò)的不斷發(fā)展與應(yīng)用,人們對(duì)于目標(biāo)檢測(cè)算法的準(zhǔn)確率有著越來越高的要求,作為電子計(jì)算機(jī)視覺領(lǐng)域的研究課題之一目標(biāo)檢測(cè)技術(shù)面臨著巨大的挑戰(zhàn)與全新的機(jī)遇。本文提出了一種基于深度學(xué)習(xí)的單步目標(biāo)檢測(cè)器特增強(qiáng)算法,能夠在保證數(shù)據(jù)計(jì)算準(zhǔn)確率的同時(shí)保證系統(tǒng)的及時(shí)性。
參考文獻(xiàn)
[1] 寇大磊,權(quán)冀川,張仲偉.基于深度學(xué)習(xí)的目標(biāo)檢測(cè)框架進(jìn)展研究[J].計(jì)算機(jī)工程與應(yīng)用,2019(11):25-34.
[2] 路雪,劉坤,程永翔.一種深度學(xué)習(xí)的非機(jī)動(dòng)車輛目標(biāo)檢測(cè)算法[J].計(jì)算機(jī)工程與應(yīng)用,2019(8):182-188+214.
[3] 師燕妮.基于深度學(xué)習(xí)目標(biāo)檢測(cè)與跟蹤技術(shù)的研究[J].電子設(shè)計(jì)工程,2019,27(6):59-63.
[4] 袁明新,張麗民,朱友帥,等.基于深度學(xué)習(xí)方法的海上艦船目標(biāo)檢測(cè)[J].艦船科學(xué)技術(shù),2019(1):111-115+124.
Feature Enhancement Algorithm of Single-step Target Detector Based on Deep Learning
ZHU Ting-ting
(Gaoxinxing Science and Technology Group Co., Ltd. , Guangzhou Guangdong? 510530)
Abstract:Target detection is one of the topics involved in computer, and it is challenging to some extent. In this paper a one-step target detector feature enhancement algorithm based on in-depth learning is discussed and experimented, hoping to effectively promote the further development of computer application technology in China.
Key words:single-step target detection technology; feature enhancement algorithm; in-depth learning