朱瑤
基于決策樹模型的車牌數(shù)字識(shí)別
朱瑤
(長安大學(xué)汽車學(xué)院,陜西 西安 710064)
隨著汽車普及的廣泛化,車輛在為我們帶來便捷和舒適的同時(shí)也帶來了極大的挑戰(zhàn)。城市的交通問題、交通壓力、交通風(fēng)險(xiǎn),都迫使著智能交通系統(tǒng)(Intelligent Transportation System, ITS)的提出,以此緩解汽車普及化帶來的交通問題、壓力及風(fēng)險(xiǎn)。智能交通系統(tǒng)中,最核心的內(nèi)容便是車牌識(shí)別系統(tǒng)。為使智能交通系統(tǒng)更好的發(fā)揮作用,增強(qiáng)車牌識(shí)別系統(tǒng)是目前研究設(shè)計(jì)優(yōu)化的重點(diǎn),且具有極大的現(xiàn)實(shí)意義。文章車牌識(shí)別軟件識(shí)別對(duì)象僅為車牌中的數(shù)字字符,識(shí)別過程采用了決策樹模型,并使用MATLAB進(jìn)行圖像預(yù)處理操作及車牌數(shù)字的識(shí)別。
決策樹;ID3算法;車牌識(shí)別;MATLAB
據(jù)中華人民共和國公安部的統(tǒng)計(jì),截止至2021年5月,我國的機(jī)動(dòng)車保有量突破了3.8億輛。我國經(jīng)濟(jì)社會(huì)的持續(xù)發(fā)展不單單意味著我國社會(huì)經(jīng)濟(jì)水平的高速提升,還象征著我國人民生活水平的快速提高,因此,機(jī)動(dòng)車保有量的持續(xù)快速增長似乎成為必然。但事實(shí)上,如果按我國人口數(shù)為14億,機(jī)動(dòng)車保有量3.8億輛計(jì)算,我國的千人汽車保有量僅有271輛,遠(yuǎn)不及美國千人汽車保有量758輛(人口3.3億,機(jī)動(dòng)車保有量2.5億輛)和日本千人汽車保有量584輛(人口1.268億,機(jī)動(dòng)車保有量0.74億輛)[1]。盡管如此,由于我國交通基礎(chǔ)設(shè)施的建設(shè)速度遠(yuǎn)不及交通工具的增長速度,導(dǎo)致與別國相比,我國所面臨的城市交通壓力更大,道路交通風(fēng)險(xiǎn)更高,道路安全隱患更多。
為了在道路等硬件設(shè)施條件的約束下,短時(shí)間內(nèi)有效緩解城市交通壓力、降低道路交通風(fēng)險(xiǎn)、避免道路交通安全隱患;保證人、車輛、道路三者間的和諧關(guān)系,并以道路為對(duì)象,實(shí)現(xiàn)人、非機(jī)動(dòng)車輛、機(jī)動(dòng)車輛的統(tǒng)一管理;盡可能降低人工成本,最終實(shí)現(xiàn)交通運(yùn)輸系統(tǒng)安全、節(jié)能、準(zhǔn)確、高效的美麗愿景,智能交通系統(tǒng)(Intelligent Transportation System, ITS)的概念被提出了[2]。
截至目前,我國ITS發(fā)展已經(jīng)實(shí)現(xiàn)了大幅飛躍。智能交通系統(tǒng)作為一種綜合性系統(tǒng),具有一定的復(fù)雜性,從該系統(tǒng)的系統(tǒng)組成方面看,可以將其分為七個(gè)子系統(tǒng)[3]。能夠?qū)崿F(xiàn)對(duì)指定監(jiān)控路面上的過往車輛進(jìn)行包括中英文字符和阿拉伯?dāng)?shù)字的字符識(shí)別的技術(shù),被稱為車牌識(shí)別技術(shù)(VLPR)。該項(xiàng)技術(shù)在ITS的多個(gè)子系統(tǒng)中均得到了運(yùn)用,是ITS中的一個(gè)基本且關(guān)鍵的組成。車牌識(shí)別系統(tǒng)的應(yīng)用極為廣泛,開展車牌識(shí)別的研究,逐步提高車牌識(shí)別的準(zhǔn)確性和高效性,具有極高的應(yīng)用價(jià)值。
早期,車牌識(shí)別技術(shù)受到了基礎(chǔ)理論知識(shí)和技術(shù)設(shè)備條件的限制,研究水平只能夠停留在簡單的圖像處理技術(shù)層面,車牌識(shí)別的結(jié)果離不開人力操作進(jìn)行干預(yù)處理,并未形成完整的體系。當(dāng)數(shù)學(xué)形態(tài)學(xué)越來越多地運(yùn)用于圖像處理應(yīng)用中,J.C.H.Poon和M.Ghadiali等人提出了一種基于灰度形態(tài)學(xué)運(yùn)算的算法用于檢測(cè)圖像中的車牌位置,雖然圖像復(fù)雜度高且噪聲大,但該算法對(duì)輸入圖像沒有限制。T.Sirithinaphong和K.Chamnongthai[4]提出利用機(jī)動(dòng)車調(diào)節(jié)和字符模式識(shí)別進(jìn)行車牌提取,該方法進(jìn)行實(shí)測(cè)后的結(jié)果顯示,車牌提取率為84.29%,識(shí)別率為80.81%。Kaushik Deb和Kang-Hyun Jo[5]提出了一種基于HSI顏色的車牌檢測(cè)方法,該方法在應(yīng)對(duì)如照明不良或天氣變化等不良條件時(shí)非常有效。Hitesh Rajput和Tanmoy Som[6]等人提出基于單級(jí)小波變換的方法在不同照明條件和距離下對(duì)40種不同型號(hào)的汽車進(jìn)行試驗(yàn),字符識(shí)別率達(dá)95.6%。
經(jīng)過世界各國科研人員數(shù)十年的努力,車牌識(shí)別系統(tǒng)已取得重大進(jìn)展,其準(zhǔn)確性和高效性日益增強(qiáng)。如果將車牌識(shí)別系統(tǒng)的運(yùn)行概括為圖像捕捉、車牌定位、車牌分割和字符識(shí)別的依次進(jìn)行[7]。車牌定位的方法可以高達(dá)七種[8],車牌分割的方法有五種,字符識(shí)別的方法也不止一種。
由于各個(gè)國家的汽車牌照各不相同,國外的汽車識(shí)別系統(tǒng)并不能直接適用于我國的車輛牌照識(shí)別。根據(jù)我國車牌的不用分類、規(guī)格、構(gòu)成等,我國必須研發(fā)出適用于識(shí)別本國汽車牌照的識(shí)別系統(tǒng)。雖然中國的車牌識(shí)別系統(tǒng)相比于國外起步稍晚,但取得的研究成果相當(dāng)可觀。
早在1988年,西安交通大學(xué)人工智能與機(jī)器人研究所的研究人員就已經(jīng)提出了一種利用漢字投影直方圖對(duì)中國省名進(jìn)行識(shí)別的系統(tǒng),該方法具有較強(qiáng)的抗噪性和較高的處理速度,對(duì)模糊字符的識(shí)別率超過90%,且識(shí)別時(shí)間不到1秒。而后,大連海事大學(xué)信息工程學(xué)院的研究人員提出了一種基于改進(jìn)反向傳播神經(jīng)網(wǎng)絡(luò)的中國車牌識(shí)別算法,為嚴(yán)重退化的車牌識(shí)別提供了解決方案,且取得了不錯(cuò)的效果[9]。王偉華提出了一種基于徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)的車牌識(shí)別算法,與反向傳播神經(jīng)網(wǎng)絡(luò)相比,徑向基函數(shù)神經(jīng)網(wǎng)絡(luò)可以降低6%以上的誤差識(shí)別率,縮短識(shí)別時(shí)間約0.5秒[10]。邢建軍、李俊[11]等人采用模板匹配處理車牌圖像并用Radon變換進(jìn)行校正,識(shí)別率可達(dá)95%以上。
決策樹又稱為判定樹,是一種基本的分類與回歸方法,顧名思義其結(jié)構(gòu)呈樹狀。決策樹模型作為一種用以描述對(duì)實(shí)際例子進(jìn)行分類判別的樹狀結(jié)構(gòu),其組成包含了結(jié)點(diǎn)和有向邊。其中,結(jié)點(diǎn)又有內(nèi)部結(jié)點(diǎn)和葉結(jié)點(diǎn)兩種類型。如果將決策樹從根節(jié)點(diǎn)到葉節(jié)點(diǎn)的每一條路徑都建立一種規(guī)則,讓每個(gè)內(nèi)部結(jié)點(diǎn)都一一與規(guī)則條件相對(duì)應(yīng),并讓葉節(jié)點(diǎn)分別代表對(duì)應(yīng)規(guī)則的結(jié)果,那么此時(shí)的決策樹可以視為?規(guī)則的集合[12]。在?集合中,每一個(gè)實(shí)際例子都可以找到唯一一條與之相對(duì)應(yīng)的路徑,即?集合中的規(guī)則具有互斥且完備的性質(zhì)。
特征選擇是對(duì)給定的訓(xùn)練集進(jìn)行數(shù)據(jù)分類特征的選取過程,正確的特征選取可提高決策樹的學(xué)習(xí)效率并增加決策樹預(yù)測(cè)的準(zhǔn)確性。當(dāng)選擇特征后的數(shù)據(jù)無法與隨機(jī)分類時(shí)的數(shù)據(jù)結(jié)果產(chǎn)生較大差別時(shí),可以知道該特征不具備足夠的分類能力,選取該特征的意義不大,在決策樹學(xué)習(xí)中,可以選擇忽略這樣的特征,此時(shí),對(duì)決策樹的精度影響并不大。在進(jìn)行決策樹的特征選擇時(shí),通常以信息增益來作為衡量標(biāo)準(zhǔn),一般會(huì)選擇具有最高信息增益的特征作為該結(jié)點(diǎn)特征,這樣會(huì)使得分類所需的信息量最小,即使此時(shí)的決策樹不一定為最簡單的決策樹。
ID3算法的核心是對(duì)決策樹所有結(jié)點(diǎn)選擇合適的特征以構(gòu)建決策樹。在構(gòu)建決策樹時(shí),應(yīng)以根節(jié)點(diǎn)作為起點(diǎn)開始計(jì)算所有結(jié)點(diǎn)的所有可能特征的信息增益,并加以比較,根據(jù)比較的結(jié)果,從中選取信息增益增大的特征作為結(jié)點(diǎn)特征,而后,通過對(duì)該結(jié)點(diǎn)特征的不同取值進(jìn)行子節(jié)點(diǎn)構(gòu)建,再對(duì)子節(jié)點(diǎn)遞歸進(jìn)行上述方法來構(gòu)建決策樹,當(dāng)所有特征信息增益均為一定標(biāo)準(zhǔn)之下,或者已經(jīng)不再存在可選的特征,則決策樹的構(gòu)建至此結(jié)束。因此,決策樹構(gòu)建的關(guān)鍵在于選擇合適的特征來構(gòu)建決策樹的分支。一般地,我們希望得到的理想決策樹標(biāo)準(zhǔn)有三個(gè),分別是葉子結(jié)點(diǎn)數(shù)量最少、葉子結(jié)點(diǎn)深度最小或同時(shí)滿足上述兩個(gè)標(biāo)準(zhǔn)。從這三個(gè)標(biāo)準(zhǔn)中選擇一個(gè)作為決策樹構(gòu)建的標(biāo)準(zhǔn),會(huì)更加便于得到理想的簡單決策樹。
3.1.1軟件平臺(tái)
在車牌識(shí)別系統(tǒng)的設(shè)計(jì)過程中,常選用的編程語言有C語言、Java等,而在本次設(shè)計(jì)中,采用了MATLAB r2019b進(jìn)行車牌數(shù)字識(shí)別軟件的設(shè)計(jì)。MATLAB的優(yōu)勢(shì)在于其強(qiáng)大的數(shù)學(xué)計(jì)算功能,對(duì)大規(guī)模的數(shù)據(jù)計(jì)算可以保證其高效性。MATLAB集眾多數(shù)學(xué)函數(shù)于一體,是一個(gè)專業(yè)且高效的工具。
3.1.2硬件平臺(tái)
本次軟件設(shè)計(jì)中所使用的硬件平臺(tái)參數(shù)如表1所示。
表1 硬件平臺(tái)參數(shù)
硬件參數(shù)信息 操作系統(tǒng)macOS High Sierra 處理器1.6 GHz Intel Core i5 內(nèi)存4 GB 1600 MHz DDR3 顯卡Intel HD Graphics 6000 1536 MB
3.2.1決策樹構(gòu)建
本設(shè)計(jì)將決策樹的ID3算法應(yīng)用于車牌數(shù)字識(shí)別軟件的設(shè)計(jì)過程中,為實(shí)現(xiàn)車牌數(shù)字的成功識(shí)別,需構(gòu)建一個(gè)決策樹。為了保護(hù)車牌信息的隱私性,本設(shè)計(jì)中采用手寫數(shù)字圖片替代真實(shí)汽車牌照?qǐng)D片進(jìn)行決策樹訓(xùn)練集的建立及軟件測(cè)試。
圖1 圖像預(yù)處理過程效果圖像
為獲得數(shù)字圖片,首先使用MATLAB軟件進(jìn)行編程得到可以實(shí)現(xiàn)手寫板功能的程序,手寫輸入數(shù)字0—9各10個(gè)并分別儲(chǔ)存為.jpg形式的圖片,共計(jì)圖片100幅,并以此作為決策樹的訓(xùn)練集。通過對(duì)樣例圖像進(jìn)行二值化、圖像網(wǎng)格化、灰度值統(tǒng)計(jì)等一系列預(yù)處理過程后,將每幅圖像的各子圖像作為不同屬性進(jìn)行特征提取,由此,可以得到100行、16列的原始訓(xùn)練集數(shù)據(jù)。
因?yàn)楸驹O(shè)計(jì)中選用的手寫板為白底黑字,故圖像二值化過程并不能直觀觀察出圖像的變化,而是改變了表示圖像的矩陣數(shù)值。本設(shè)計(jì)中圖像二值化的實(shí)現(xiàn)是用MATLAB的graythresh函數(shù),使用最大類間方差法計(jì)算得到該圖像的合適閾值,并利用該閾值將原始圖像轉(zhuǎn)換為二值圖像。而后找到二值圖像中包含該數(shù)字的最小矩形區(qū)域進(jìn)行分割。本設(shè)計(jì)將圖像分為面積相等的4×4區(qū)域,并對(duì)每一區(qū)域進(jìn)行灰度值統(tǒng)計(jì),將每個(gè)區(qū)域中的圖像占該矩形面積的比值作為該區(qū)域的特征值。該圖像進(jìn)行計(jì)算后得到16個(gè)特征值如表2所示。
圖2 決策樹
為了方便決策樹建立過程中的計(jì)算,根據(jù)過往經(jīng)驗(yàn),選取值為0.10的閾值對(duì)原始訓(xùn)練集進(jìn)行簡化,可以得到特征值僅存在0和1的新訓(xùn)練集數(shù)據(jù),且其大小為100×16。該樣例圖像特征值進(jìn)行簡化后得到新特征值如表3所示。
根據(jù)新訓(xùn)練集及決策樹的期望信息量、熵及信息增益的定義公式,可以計(jì)算得到所有屬性的信息增益,從中選取信息增益最大的屬性作為本設(shè)計(jì)中決策樹的根節(jié)點(diǎn)。經(jīng)過計(jì)算比較可以得出,該訓(xùn)練集中信息增益最大的屬性為屬性10,信息增益值為3.265 2。因此將屬性10作為決策樹的根節(jié)點(diǎn),同時(shí),可以理解為每幅圖像的第10塊子圖像對(duì)數(shù)字識(shí)別至關(guān)重要。而后,根據(jù)決策樹構(gòu)建方法進(jìn)一步計(jì)算得到?jīng)Q策樹的各子節(jié)點(diǎn),直至訓(xùn)練集為空或者所有樣本屬于同一類為止。最后完成決策樹的構(gòu)建。根據(jù)該訓(xùn)練集,本設(shè)計(jì)所建決策樹如圖2所示。
表2 樣例圖像特征值
特征值 0.142 90.281 10.161 30.153 60.129 50.245 50.157 80.117 60000.268 80.164 40.164 40.188 70.227 3
表3 樣例圖像新特征值
新特征值 1111111100011111
在建立的決策樹中,未注明的分支均默認(rèn)左側(cè)為特征值為0時(shí)的路徑,右側(cè)為特征值為1時(shí)的路徑。
3.2.2軟件測(cè)試
通過MATLAB中的手寫板程序進(jìn)行測(cè)試數(shù)字圖像的輸入,對(duì)測(cè)試圖像進(jìn)行預(yù)處理、特征提取,將提取到的特征根據(jù)所建決策樹進(jìn)行分類,并輸出識(shí)別的數(shù)字結(jié)果。
在軟件測(cè)試中,輸入了數(shù)字0—9的數(shù)字圖像各一個(gè),測(cè)試結(jié)果顯示,準(zhǔn)確率為90%,正確識(shí)別的數(shù)字有:0、1、2、4、5、6、7、8、9;未能正確識(shí)別的數(shù)字為:3,且識(shí)別結(jié)果為數(shù)字8。
根據(jù)本設(shè)計(jì)建立的決策樹對(duì)該測(cè)試圖像進(jìn)行分類,得到錯(cuò)誤地識(shí)別結(jié)果:數(shù)字8。
本次軟件測(cè)試的結(jié)果如表4所示。
表4 軟件測(cè)試結(jié)果
測(cè)試數(shù)字特征值識(shí)別結(jié)果 011111001100111110 100110111111011001 211100010011011112 311110111011111118 401101110111101004 511101000111111115 601001000111111116 711110001001000107 811111110110111118 911111111001001009
本設(shè)計(jì)將決策樹的ID3算法應(yīng)用于車牌數(shù)字識(shí)別軟件的設(shè)計(jì)過程中,為實(shí)現(xiàn)車牌數(shù)字的成功識(shí)別,需構(gòu)建一個(gè)決策樹。為了保護(hù)車牌信息的隱私性,本設(shè)計(jì)中采用手寫數(shù)字圖片替代真實(shí)汽車牌照?qǐng)D片進(jìn)行決策樹訓(xùn)練集的建立及本設(shè)計(jì)使用手寫數(shù)字圖像模擬車牌數(shù)字圖像,并利用MATLAB軟件對(duì)數(shù)字圖像進(jìn)行預(yù)處理,依次完成圖像二值化、最小矩形確定、圖像網(wǎng)格化、灰度值統(tǒng)計(jì)幾個(gè)過程,每幅圖像可得到16個(gè)特征值。為方便后續(xù)工作的進(jìn)行,保證決策樹的成功建立,根據(jù)經(jīng)驗(yàn)選取一閾值,將圖像的特征值二值化。本設(shè)計(jì)中建立的決策樹,其訓(xùn)練集包含100幅圖片,故訓(xùn)練集矩陣大小為100×16對(duì)這16個(gè)屬性進(jìn)行信息增益的計(jì)算,得到該決策樹根節(jié)點(diǎn)為屬性10,而后繼續(xù)進(jìn)行遞歸計(jì)算,可得到一個(gè)完整的決策樹。
以該決策樹作為車牌數(shù)字識(shí)別的分類依據(jù),進(jìn)行10次測(cè)試,識(shí)別準(zhǔn)確率為90%,正確識(shí)別出數(shù)字:0、1、2、4、5、6、7、8、9;未能正確識(shí)別出數(shù)字:3。
[1] 鄧明陽.道路交通事故背景因素?cái)?shù)據(jù)統(tǒng)計(jì)分析系統(tǒng)研究[D].西安:長安大學(xué),2010.
[2] 石峻.智能公交調(diào)度系統(tǒng)的優(yōu)化研究與實(shí)現(xiàn)[D].濟(jì)南:山東大學(xué), 2005.
[3] 李偉杰.基于機(jī)器視覺的車道偏離系統(tǒng)的研究[D].北京:北京交通大學(xué),2010.
[4] Microelectronics and Integrating Systems. Proceedings (Cat.No.98 EX242), Chiangmai,Thailand,1998:559-562.
[5] K. Deb and K. Jo, "HSI color based vehicle license plate detection," 2008 International Conference on Control, Automation and Systems, Seoul, 2008:687-691.
[6] H. Rajput, T. Som and S. Kar, "An Automated Vehicle License Plate Recognition System,"in Computer, vol.48,no.8,pp.56-61,Aug. 2015.
[7] 葛二壯.車牌識(shí)別系統(tǒng)中車牌定位與字符分割方法的研究[J].科技風(fēng),2011,(23):31-31+33.
[8] 黃曉蘭.基于改進(jìn)極限學(xué)習(xí)機(jī)的車牌字符識(shí)別方法[D].杭州:中國計(jì)量學(xué)院,2014.
[9] 謝嘉樂.基于改進(jìn)的Lm-BP神經(jīng)網(wǎng)絡(luò)的車牌識(shí)別算法研究與應(yīng)用[D].廣州:廣東工業(yè)大學(xué),2016.
[10] 裴加強(qiáng).車牌識(shí)別系統(tǒng)中車牌定位方法的研究[J].可編程控制器與工廠自動(dòng)化,2009(09):72-74.
[11]何兆成,佘錫偉,余文進(jìn),等. 字符多特征提取方法及其在車牌識(shí)別中的應(yīng)用[J].計(jì)算機(jī)工程與應(yīng)用,2011, 47(023):228-231.
[12] 李世奇.面向文景轉(zhuǎn)換的中文淺層語義分析方法研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2012.
Design of License Plate Number Recognition Based on Decision Tree
ZHU Yao
( School of Automobile, Chang'an University, Shaanxi Xi'an 710064 )
With the continuous development and progress of the economy and society, China's automobile industry is becoming increasingly prosperous, and the popularity of automobiles is becoming more and more profound, which brings us convenience and comfort as well as great challenges. In order to solve urban traffic problems, relieve urban traffic pressure and reduce urban traffic risks, Intelligent Transportation System (ITS) has been put forward. In the intelligent transportation system, the license plate recognition system's core status is beyond doubt. Therefore, the research on license plate recognition system is of great practical significance.The license plate recognition software designed in this paper only recognizes the number characters in the license plate. In the recognition process, a decision tree model is adopted, and MATLAB is used for image preprocessing and license plate number recognition.
Decision Tree; Iterative Dichotomiser 3 Algorithm; Vehicle License Plate Recognition; MATLAB
A
1671-7988(2021)22-222-04
U495;TP391.4
A
1671-7988(2021)22-222-04
CLC NO.: U495;TP391.4
朱瑤(1997—),女,碩士,就讀于長安大學(xué)汽車學(xué)院,研究方向:圖像識(shí)別。
10.16638/j.cnki.1671-7988.2021.022.057