田潤(rùn) 魏志剛 劉明錚
摘要:交通標(biāo)志在日常生活中起著重要作用,如何利用視覺輔助技術(shù)識(shí)別交通標(biāo)志已經(jīng)成為當(dāng)前智能交通領(lǐng)域的熱點(diǎn)問題。本文將深度學(xué)習(xí)技術(shù)中的卷積神經(jīng)網(wǎng)絡(luò)算法應(yīng)用于斑馬線的識(shí)別研究。基于ResNet34結(jié)構(gòu)[1]構(gòu)建卷積神經(jīng)網(wǎng)絡(luò),并在此基礎(chǔ)上設(shè)計(jì)了用于識(shí)別斑馬線的二分類器。通過實(shí)驗(yàn)驗(yàn)證,本文方法的識(shí)別精度可達(dá)到93%,平均識(shí)別速度在0.1s以下。
關(guān)鍵詞:卷積神經(jīng)網(wǎng)絡(luò);智能交通;深度學(xué)習(xí)
中圖分類號(hào):TP391.41 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1007-9416(2019)02-0081-02
0 引言
隨著公路交通的發(fā)展,路況更加復(fù)雜,交通事故發(fā)生的頻率也在不斷上升,視覺輔助技術(shù)在交通安全領(lǐng)域中得到了廣泛關(guān)注。作為重要的交通標(biāo)志之一,斑馬線的識(shí)別是交通視覺輔助設(shè)備研究的重中之重。識(shí)別斑馬線的方法有很多種,目前應(yīng)用最多的是雙極系數(shù)法,即對(duì)道路圖像進(jìn)行分塊,再根據(jù)斑馬線的灰度特征進(jìn)行識(shí)別。然而,這種方法受制于其分塊方式,分塊的大小將直接影響識(shí)別的準(zhǔn)確度。本文提出了一種基于卷積神經(jīng)網(wǎng)絡(luò)檢測(cè)斑馬線的新方法,能夠快速識(shí)別斑馬線所在的區(qū)域,從而避免了分塊方式問題。在識(shí)別出斑馬線的范圍后,再利用卷積神經(jīng)網(wǎng)絡(luò)不斷提取,縮小圖像特征,從而實(shí)現(xiàn)對(duì)斑馬線的準(zhǔn)確識(shí)別。
1 卷積神經(jīng)網(wǎng)絡(luò)的基本理論
卷積網(wǎng)絡(luò)[2]是是深度學(xué)習(xí)模型中的一種,具有稀疏連接、參數(shù)共享、等變表示等特點(diǎn),這使參數(shù)更少,存儲(chǔ)空間更小,計(jì)算效率更高,同時(shí)能夠?qū)D像的平移翻轉(zhuǎn)保持不變性。卷積網(wǎng)絡(luò)的權(quán)值共享結(jié)構(gòu),可以大幅度減少神經(jīng)網(wǎng)絡(luò)的參數(shù)量,防止過擬合的同時(shí),又降低了網(wǎng)絡(luò)模型的復(fù)雜程度,在較深的網(wǎng)絡(luò)模型中,能夠達(dá)到很好的泛化能力。
卷積神經(jīng)網(wǎng)絡(luò)是一個(gè)多層前饋神經(jīng)網(wǎng)絡(luò),它的基本結(jié)構(gòu)是輸入層、激勵(lì)層、卷積層、池化層、全鏈接層以及輸出層。卷積神經(jīng)網(wǎng)絡(luò)能夠構(gòu)建多個(gè)提取特征的濾波器,通過對(duì)輸入的數(shù)據(jù)進(jìn)行逐層的卷積和池化來提取數(shù)據(jù)的結(jié)構(gòu)特征,最后將這些特征輸入全鏈接層進(jìn)行整合,并且通過某種激活函數(shù)來解決分類和回歸問題。
2 卷積神經(jīng)網(wǎng)絡(luò)的構(gòu)建
本文采用卷積神經(jīng)網(wǎng)絡(luò)中的ResNet34結(jié)構(gòu)來檢測(cè)圖片中是否含有斑馬線,如圖1所示,包括33個(gè)卷積層,1個(gè)全連接層。其中,除第一個(gè)卷積層中卷積核的尺寸為7×7之外,其余32個(gè)卷積層中卷積核的尺寸均為3×3。在每?jī)蓚€(gè)卷積層中插入了一個(gè)快捷鏈接,每一層卷積后的圖像參數(shù)通過快捷鏈接后,再與殘差求和即可得到輸入到下一卷積層的參數(shù)。將所有的卷積層分成四組,每經(jīng)過一組,特征矩陣的尺寸就會(huì)縮小一倍,同時(shí)下一組的每個(gè)卷積層中的卷積核的個(gè)數(shù)加倍。全連接層中的每一個(gè)結(jié)點(diǎn)都與最后一個(gè)卷積層的所有結(jié)點(diǎn)相連,將之前提取到的特征綜合起來,其具有1000個(gè)輸出參數(shù)。為達(dá)到圖像中斑馬線識(shí)別的2分類目的,在全連接層后接入一個(gè)具有2個(gè)輸出的softmax分類器。
3 卷積神經(jīng)網(wǎng)絡(luò)的訓(xùn)練及實(shí)驗(yàn)驗(yàn)證
3.1 數(shù)據(jù)集準(zhǔn)備及預(yù)處理
在訓(xùn)練及測(cè)試網(wǎng)絡(luò)模型過程中,樣本集來源于浙江大學(xué)江凱巍課題組,樣本總量為4100。訓(xùn)練模型過程中將樣本集分為訓(xùn)練集、驗(yàn)證集和測(cè)試集,分別占樣本總量的60%、20%和20%。為了增強(qiáng)模型的健壯性,需要對(duì)訓(xùn)練集和驗(yàn)證集中的數(shù)據(jù)進(jìn)行數(shù)據(jù)擴(kuò)充[3]。本文采用的方法為:(1)圖像的豎直翻轉(zhuǎn);(2)按照寬度對(duì)圖像伸縮;(3)對(duì)圖像進(jìn)行顏色增強(qiáng)。
在開始訓(xùn)練之前,在訓(xùn)練集中選取一小部分圖片計(jì)算每個(gè)像素點(diǎn)的平均值和標(biāo)準(zhǔn)差,并對(duì)所有的輸入圖片進(jìn)行標(biāo)準(zhǔn)化處理。另外,ResNet34網(wǎng)絡(luò)輸入的圖像尺寸為224×224,因此在訓(xùn)練過程中,輸入網(wǎng)絡(luò)的樣本均為從原圖片中隨機(jī)切割的224×224的區(qū)域。
3.2 模型訓(xùn)練及實(shí)驗(yàn)
訓(xùn)練過程中采用批量梯度下降算法進(jìn)行參數(shù)更新,批量大小為256。為避免出現(xiàn)損失函數(shù)無(wú)法收斂的情況,在梯度下降的基礎(chǔ)上增加了沖量Momentum,取經(jīng)驗(yàn)值0.9。另外,為防止模型過擬合,在計(jì)算損失函數(shù)時(shí)依據(jù)權(quán)重值添加了一個(gè)懲罰項(xiàng),即權(quán)重衰減,經(jīng)多次實(shí)驗(yàn),取值為0.3。模型訓(xùn)練后,通過測(cè)試集對(duì)本文方法進(jìn)行實(shí)驗(yàn),由實(shí)驗(yàn)結(jié)果可知,本文方法對(duì)于圖像中斑馬線識(shí)別的準(zhǔn)確率達(dá)到93.2%,平均檢測(cè)速度在0.1s以內(nèi)。部分實(shí)驗(yàn)結(jié)果如圖2所示,其中Predicted:1代表識(shí)別圖像中含有斑馬線,Predicted:0代表識(shí)別圖像中不含斑馬線。
4 結(jié)語(yǔ)
本文基于深度學(xué)習(xí)算法對(duì)斑馬線的識(shí)別方法進(jìn)行研究,采用ResNet34結(jié)構(gòu)卷積神經(jīng)網(wǎng)絡(luò)構(gòu)建了用于識(shí)別斑馬線的二分類器。通過實(shí)驗(yàn)驗(yàn)證,本文方法的識(shí)別準(zhǔn)確率可達(dá)93.2%。與傳統(tǒng)的機(jī)器學(xué)習(xí)方法相比,由于卷積神經(jīng)網(wǎng)絡(luò)能夠自動(dòng)生成檢測(cè)區(qū)域,省去了圖像預(yù)處理過程,大大減少了計(jì)算量,使圖像處理的速度較之傳統(tǒng)算法有了明顯的提升。
參考文獻(xiàn)
[1] 徐培超,陳雯柏,陳祥鳳,韓琥.多任務(wù)及Resnet網(wǎng)絡(luò)在人臉多屬性識(shí)別中的應(yīng)用[J].小型微型計(jì)算機(jī)系統(tǒng).2018(12):2720-2724.
[2] 孫旭,李曉光,李嘉鋒,卓力.基于深度學(xué)習(xí)的圖像超分辨率復(fù)原研究進(jìn)展[J].自動(dòng)化學(xué)報(bào),2017(05):697-709.
Traffic Sign Recognition Method Based on Deep Learning
TIAN Run,Wei Zhi-gang,LIU Min-zheng
(Civil Aviation University of China,Tianjin? 300300)
Abstract:Traffic signs are vital to our daily life, and how to discriminate them with the help of Visual Aided Technology has came to an hot topic. Thus, in this paper, well use convolutional neural network based on deep learning to recognize the zebra crossing. Weve constructed an convolutional neural network based on the ResNet34 structrue, and designed a binary classifier which relys on this network. After being tested, the accuracy of this paper can reach in 93 percent, and the average speed of recognition is below 0.1 second.
Key words:convolutional neural network;intelligent transportation;deep Learning