于碩
摘? 要:交通標示含有豐富的指引和限制信息,對車輛駕駛員具有非常重要的意義。在快節(jié)奏的社會發(fā)展中,智能駕駛和輔助駕駛有著非比尋常的研究和應(yīng)用價值。該文介紹了交通標示識別技術(shù)的研究背景、交通標示相關(guān)數(shù)據(jù)集的特點和組成及交通標示識別技術(shù)的評價指標。并歸納了已有的交通標示識別技術(shù),包括了傳統(tǒng)的圖像處理技術(shù)和基于學習的算法。最后總結(jié)了交通標示識別技術(shù)的前景和發(fā)展趨勢。
關(guān)鍵詞:交通標示? 圖像處理? 機器學習? 計算機視覺
中圖分類號:TP391? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ?文獻標識碼:A? ? ? ? ? ? ? ? ? ? ? ? 文章編號:1672-3791(2019)02(c)-0015-02
隨著科技的發(fā)展,傳統(tǒng)的工業(yè)生產(chǎn)、人民的日常生活都向著無人化、智能化轉(zhuǎn)型。車輛行駛已經(jīng)成為絕大多數(shù)人每天都會接觸到甚至使用的。正在研發(fā)當中的無人駕駛技術(shù)或者輔助駕駛技術(shù)有著比人類更為廣闊的感知范圍和靈敏的反應(yīng)時間,將會給人們帶來了巨大的便捷和安全保障。智能車的駕駛技術(shù)包含了感知層、決策層和控制層[1]。識別車輛所處的交通場景和環(huán)境信息是感知層的重要任務(wù)[2],主要使用攝像頭、雷達、傳感器來對環(huán)境中的障礙物、路況、標示信息進行采集和分析,就相當于駕駛員的眼睛。交通標示識別技術(shù)應(yīng)用于感知層。交通標示含有豐富的信息,對車輛行駛起到指示和限制作用,對的實現(xiàn)智能化感知在無人車技術(shù)的研究中有著重要作用。
1? 數(shù)據(jù)集和評價指標
交通標示的識別與檢測是計算機視覺領(lǐng)域內(nèi)富有挑戰(zhàn)的任務(wù),因此舉辦多次挑戰(zhàn)賽鼓勵眾多科研人員進行研究。隨著挑戰(zhàn)賽公開的數(shù)據(jù)集有德國交通標示識別數(shù)據(jù)集(German Traffic Sign Recognition Benchmark,GTSRB)和德國交通標示檢測數(shù)據(jù)集(German Traffic Sign Detection Benchmark,GTSDB)[3]。GTSRB和GTSDB作為該領(lǐng)域的常用數(shù)據(jù)集,研發(fā)的算法都需要在這兩個數(shù)據(jù)集上進行驗證,方可得到認可。這兩個數(shù)據(jù)集都是取自于德國街景,因此,交通標示皆是德國標準制式。該數(shù)據(jù)集中的德國交通標志主要分為3個大類,分別為——禁止標志:紅色圓形的外形,內(nèi)部是黑色字體表示限速或者圖形表示車型禁行;警告標志:紅色三角形的外形,通常表示危險,道路曲折等;指示標志:藍色圓形,內(nèi)部白色箭頭指示,左轉(zhuǎn)、右轉(zhuǎn)等信息。
GTSRB是交通標示的識別任務(wù),也就是圖像分類。該數(shù)據(jù)集共包含51840幅圖像,每幅圖像包含一個交通標志,共包含43類。GTSDB是交通標示檢測任務(wù),檢測任務(wù)包含了圖像分類和目標定位,檢測任務(wù)更為復(fù)雜一些。該數(shù)據(jù)集共900幅圖像,共包含1206個交通標志。一張圖像上包含多個目標,并包括了光照不均、圖示破損等情況,是比較有挑戰(zhàn)性的一個數(shù)據(jù)集。
交通標示識別的評價指標是準確率。即分類的正確率。
如公式(1)所示,正確率越高代表著算法越為可靠。
交通標示的檢測使用平均精度作為評價指標。主要考慮,其一,檢測目標的位置,檢測的標準結(jié)果用矩形框標注,當找到的標志與矩形框重合超過50%時,即為召回;其二,分類的正確性,即上文的準確率。綜合二者指標得到平均精度,即召回率和準確率同樣高時,會得到比較高的平均精度。
2? 現(xiàn)有技術(shù)
計算機視覺的任務(wù)目前分為兩個流派,一是傳統(tǒng)的圖像處理技術(shù),主要運用圖像本身的信息,如對灰度、色彩、邊緣等進行識別和分類。在機器學習技術(shù)出現(xiàn)之前,眾多挑戰(zhàn)賽都是應(yīng)用傳統(tǒng)圖像處理技術(shù),并且已經(jīng)處于瓶頸當中。二是基于學習的技術(shù),近10年興起的機器學習和深度學習技術(shù)徹底改變了交通標示識別的局面,取得了許多傲人成績。以下就分別從這兩個方面介紹最新的交通標示識別的方法。
2.1 基于圖像處理的方法
彩色圖像分別為RGB三通道,每個通道分布為0~255之間,圖像處理技術(shù)對矩陣直接操作。交通標示不同類之間的外形差距很大,而類間差距很小。大連理工大學的蔡俊杰[4]使用圖像預(yù)處理技術(shù)設(shè)定閾值應(yīng)用于交通標示圖像的RGB顏色空間,形成以交通標示為主的顯著圖,然后使用Sobel算子進行邊緣檢測,進一步使用霍夫變換完成了目標圖像的提取,并設(shè)計了交通標識檢測和識別系統(tǒng)實現(xiàn)了仿真。
彩色圖像能夠提供豐富的語義信息,但是同樣會受到光照的影響。許華榮等[5]為了克服光照變化對交通標示檢測產(chǎn)生的影響,應(yīng)用基于RGB顏色空間的先驗知識設(shè)計了的顏色概率模型,生成交通標示的顯著性圖譜以進行分割,并實驗證明了其魯棒性。劉芳[6]設(shè)計了基于注意力機制的交通標志識別算法,在顏色顯著圖的基礎(chǔ)上,使用形狀語義信息和模板匹配的方法來確定區(qū)域是否為交通標識。
2.2 基于學習的算法
機器學習的思想顛覆了交通標示識別的方法,其后在此基礎(chǔ)上發(fā)展的深度學習的方法,具有更好的泛化性。天津大學的徐巖等[7]對主成分分析法和極限學習機進行改進,首先提取交通標志數(shù)據(jù)庫中每個交通標志的梯度方向直方圖特征,利用改進的主成分分析法進行降維,之后進行訓(xùn)練,訓(xùn)練好的模型在數(shù)據(jù)集上可達到97.69%的正確率。
深度學習應(yīng)用卷積神經(jīng)網(wǎng)絡(luò)對圖像進行提取特征進行訓(xùn)練。其優(yōu)點是自動提取特征,隨著網(wǎng)絡(luò)層數(shù)的增加,提取到更加高級的特征;缺點是訓(xùn)練依賴于數(shù)據(jù)的選擇。楊心[8]設(shè)計了一種快速卷積神經(jīng)網(wǎng)絡(luò)算法,能夠?qū)⒌玫降母信d趣的區(qū)域進行交通標示分類。在GTSRB數(shù)據(jù)集上該算法對交通標示分類準確率高達98.03%,并且可以達到實時識別的速度。
混合使用傳統(tǒng)圖像處理和深度學習網(wǎng)絡(luò)成為交通標示檢測算法的發(fā)展趨勢。黃娜君[9]先使用MSER算法對圖像進行分割,得到交通標志所在的感興趣區(qū)域,然后把分割的感興趣區(qū)域輸入深度卷積神經(jīng)網(wǎng)絡(luò)提取特征和分類,該算法在GTSDB數(shù)據(jù)集上的平均識別率達到了98.54%。
3? 結(jié)語
交通標識識別技術(shù)是智能交通系統(tǒng)的重要組成部分,有著重要的理論意義和實用價值。交通標示識別技術(shù)已經(jīng)不局限使用傳統(tǒng)方法還是深度學習的方法,更多地是混合使用,從而展現(xiàn)了兩種算法的優(yōu)點。目前交通標示檢測算法在數(shù)據(jù)集上已經(jīng)取得了不錯的成果,真實場景中運行才是真正的考驗。交通標示識別技術(shù)的發(fā)展將大大推動無人車技術(shù)的落地,必將成為惠及群眾的重要科技手段。
參考文獻
[1] 王建強,王昕.智能網(wǎng)聯(lián)汽車體系結(jié)構(gòu)與關(guān)鍵技術(shù)[J].長安大學學報:社會科學版,2017(19):18-25.
[2] 韓昕輝.基于深度學習的無人駕駛場景識別[D].中山大學,2017.
[3] 楊怡.交通場景中的交通標志和行人檢測方法研究[D].中國科學院自動化研究所,2015.
[4] 蔡俊杰.復(fù)雜條件下交通標識的檢測和識別算法[D].大連理工大學,2016.
[5] 許華榮,楊怡,洪朝群.基于顏色概率模型的交通標志識別算法研究[J].閩南師范大學學報:自然版,2012(4):19-23.
[6] 劉芳.基于注意機制的交通標識的檢測[D].北京交通大學,2012.
[7] 徐巖,韋鎮(zhèn)余.一種改進的交通標志圖像識別算法[J].激光與光電子學進展,2017(2):124-131.
[8] 楊心.基于卷積神經(jīng)網(wǎng)絡(luò)的交通標識識別研究與應(yīng)用[D].大連理工大學,2014.
[9] 黃娜君,汪慧蘭,朱強軍,等.基于ROI和CNN的交通標志識別研究[J].無線電通信技術(shù),2018,44(2):160-164.