陳虹宇,李鐵軍
(1.集美大學(xué)輪機(jī)工程學(xué)院,福建 廈門 361021;2.集美大學(xué)信息工程學(xué)院,福建 廈門 361021)
智能儀表讀數(shù)數(shù)字分割與自動識別的準(zhǔn)確性和時效性是國內(nèi)外圖像處理領(lǐng)域的研究熱點(diǎn),而智能儀表的數(shù)字字符識別是關(guān)鍵核心技術(shù),隨著光學(xué)字符識別OCR(optical character recognition)技術(shù)的深入,智能儀表識別技術(shù)也得到了發(fā)展。王榕峰[1]定義特定向量與字符相交的次數(shù)作為數(shù)字特征;崔文成等[2]通過填充區(qū)域、字符穿越數(shù)和鏤空區(qū)域構(gòu)成數(shù)字特征向量,實(shí)現(xiàn)票據(jù)數(shù)字識別;周勝明等[3]結(jié)合數(shù)字筆畫特征與主分量重建模型的誤差分析,進(jìn)行數(shù)字識別;Zhang[4]利用數(shù)字輪廓拓?fù)浣Y(jié)構(gòu)進(jìn)行電子儀表數(shù)字識別;Jabba[5]利用神經(jīng)網(wǎng)絡(luò)識別法識別儀表數(shù)字;Shamim等[6]采用多層感知器識別數(shù)字字符,Laroca[7]用全卷積序列進(jìn)行水表數(shù)字字符識別;Wang[8]等用深度學(xué)習(xí)的方法識表電表。數(shù)字字符識別方法大致分為兩類:深度學(xué)習(xí)和機(jī)器學(xué)習(xí)。深度學(xué)習(xí)是目前大數(shù)據(jù)背景下的主流方向,在硬件計算力的支持下,對處理大樣本下的復(fù)雜問題具有普遍優(yōu)越性。機(jī)器學(xué)習(xí)在小樣本和快速性方面具有一定的優(yōu)勢,計算量少,對硬件要求低,不足是特征依賴人工提取,準(zhǔn)確性得不到保證。但計算量少、硬件成本低、是普通儀表推廣使用中最大的優(yōu)勢[9]。
儀表字符圖像通過安裝圖像采集設(shè)備得到,在特定表盤的背景下既有多個字符,還有整字和半字、角度傾斜等不確定因素,常規(guī)整字的特征和算法對于傾斜和非整字的字符難以適應(yīng)[10]。本文用一種簡單易行的基于灰色關(guān)聯(lián)度的儀表數(shù)字字符識別方法,將受不確定因素影響的信息當(dāng)作灰度信息,構(gòu)建數(shù)字硬度特征序列,對待測樣本與目標(biāo)樣本的硬度特征進(jìn)行關(guān)聯(lián)度分析,依據(jù)關(guān)聯(lián)度大小對待測樣本進(jìn)行分類,將具有最大關(guān)聯(lián)度對應(yīng)的樣本作為識別結(jié)果,從而完成數(shù)字的識別與分類。
灰色關(guān)聯(lián)分析是灰色系統(tǒng)理論[11]的重要分支,灰色關(guān)聯(lián)分析的基本思想是通過計算參考序列曲線與比較數(shù)據(jù)序列曲線的灰色關(guān)聯(lián)度來判斷序列的聯(lián)系緊密度。
(1)
對于ξ∈(0,1),ξ為分辨系數(shù),ξ越小,關(guān)聯(lián)系數(shù)間的差異越大,區(qū)分能力越強(qiáng),通常ξ取0.5。灰色關(guān)聯(lián)度計算的思路是利用最大和最小位移差來計量兩數(shù)列之間的相似性。根據(jù)關(guān)聯(lián)度的定義,可計算各帶識別樣本與模板樣本的關(guān)聯(lián)度,依據(jù)從大到小的順序,得出識別結(jié)果。關(guān)聯(lián)度越大,表明識別對象與模板樣本平均距離越接近。
廣義的灰色關(guān)聯(lián)度分為灰色絕對關(guān)聯(lián)度、灰色相對關(guān)聯(lián)度以及灰色綜合關(guān)聯(lián)度。
定義2 設(shè)X0=(x0(1),x0(2),…,x0(n)),…,Xi=(xi(1),xi(2),…,xi(n)),
ε0i(k)=(1+|s0|+|si|)/(1+|s0|+|si|+|si-s0|)。
(2)
為X0與Xi的灰色絕對關(guān)聯(lián)度,簡稱絕對關(guān)聯(lián)度。
記
則
(3)
為X0與Xi的灰色相對關(guān)聯(lián)度,簡稱相對關(guān)聯(lián)度。
灰色相對關(guān)聯(lián)度,表征了序列曲線相對于始點(diǎn)的變化速率之間的關(guān)系,ri(k)越大,反映帶識別樣本與模板樣本變化率越接近。
定義4 綜合考慮絕對關(guān)聯(lián)度和相對關(guān)聯(lián)度的影響,共同決定的關(guān)聯(lián)度叫綜合關(guān)聯(lián)度。設(shè)ε0i和γ0i分別為X0與Xi的灰色絕對關(guān)聯(lián)度和相對關(guān)聯(lián)度,則灰色綜合關(guān)聯(lián)度為:
ρ0i=αε0i+(1-α)γ0i。
(4)
其中:α∈[0,1],若考慮兩種關(guān)聯(lián)度作用平等,則α=0.5。
灰色綜合關(guān)聯(lián)度既體現(xiàn)了序列曲線X0與Xi的相似程度,又反映了X0與Xi相對于始點(diǎn)的變化速率的接近程度,是較為全面的表征序列之間聯(lián)系是否緊密的一個數(shù)量指標(biāo)。因此本文以綜合灰色關(guān)聯(lián)度為主要分析指標(biāo)。
2.1儀表數(shù)字字符檢測
采集到的儀表圖像如圖1a)所示。根據(jù)特殊背景下的圖像,可以看出表盤數(shù)字區(qū)域在矩形框內(nèi),且顏色與周邊區(qū)域相差很大。通過灰度化和二值化處理后,儀表圖像如圖1b)所示。為防止數(shù)字噪音引起的干擾,將二值化后的圖像進(jìn)行形態(tài)學(xué)處理,即對二值化圖像進(jìn)行膨脹、腐蝕操作,使數(shù)字上下部分連通。通過分析連通域的位置關(guān)系和連通的性質(zhì),對字輪進(jìn)行分割,得到字輪圖像,將矩形連通區(qū)域劃分出來,定位字輪邊框圖像。對連通域外輪廓矩形輪廓,確定中心點(diǎn)位置并標(biāo)定矩形框,利用垂直投影將每個字符按單字分割開來,分割出字符區(qū)域如圖2所示。
特征提取和分類技術(shù)是圖像識別的關(guān)鍵。機(jī)器學(xué)習(xí)的方法中特征更具直觀性,分為統(tǒng)計特征和結(jié)構(gòu)特征。統(tǒng)計特征指利用統(tǒng)計方法獲得的特征,包括特征區(qū)域、矩及密度等特征;結(jié)構(gòu)特征是對字符的筆畫進(jìn)行研究分析,包括筆畫和輪廓,如凹陷、梯度、曲率、穿越、鏤空等特征。這些方法直觀地描述字符結(jié)構(gòu)特征,在字符定位準(zhǔn)確且無任何角度傾斜的整字識別上,可以獲得穩(wěn)定性較好的識別結(jié)果[1~3]。
字符硬度特征[11]的思想源于統(tǒng)計特征和結(jié)構(gòu)特征的綜合。單一統(tǒng)計特征比如圖像矩特征很難區(qū)分比如數(shù)字5與6、8、9、0,1與4。在表盤原始圖預(yù)處理后,經(jīng)分割,得到儀表表盤數(shù)字,如圖3所示。從圖3上可以看出,數(shù)字1和4垂直投影曲線接近,數(shù)字5、6、8、9、0的垂直投影也極為接近。但結(jié)合字符結(jié)構(gòu)特征發(fā)現(xiàn),每一個字符在不同字符高度的密度區(qū)別很大,通過大量實(shí)驗(yàn)數(shù)據(jù)分析得出,1與4在自下而上1/5處的字符高度里區(qū)分度最高,8、9與0在自下而上1/5、2/5、3/5處區(qū)分度都十分明顯。故本文采用把字符五分切割,通過統(tǒng)計目標(biāo)字符在目標(biāo)區(qū)域里的像素密度,即單位面積下目標(biāo)像素的充滿度,定義硬度特征,它能體現(xiàn)數(shù)字圖像目標(biāo)區(qū)域在某方向上的抵抗變形的能力。定義根據(jù)數(shù)字圖像投影方向不同,可分為水平投影和垂直投影。硬度特征也分為水平硬度特征和垂直硬度特征。圖4分別給出了整字傾斜角度為0°和15°的數(shù)字水平投影,數(shù)字的水平投影對傾斜不敏感,傾斜15°仍變化不大,且不同高度處特征仍然明顯。字符在不同比例高度下硬度差距甚大,且對傾斜不敏感,故對圖像采集裝置安裝所導(dǎo)致的小范圍角度傾斜不需要作傾斜校正。本文選用水平硬度作為硬度特征。
將從儀表表盤獲得的0~9的數(shù)字進(jìn)行歸一,結(jié)合數(shù)字自上而下及自下而上不同的筆劃結(jié)構(gòu)和統(tǒng)計特性,分別采取自上而下和自下而上1/5、2/5、 3/5、 4/5、5/5處10個不同比例高度下硬度值作為圖像特征進(jìn)行分類,從而完成硬度特征提取。水平硬度特征序列見表1。
表1 數(shù)字0~9對應(yīng)的水平硬度特征序列
灰色關(guān)聯(lián)分析[11]通過確定參考序列和若干個比較序列的幾何形狀相似程度來比較其聯(lián)系程度?;疑P(guān)聯(lián)度表明了兩種序列的平均距離;絕對灰色關(guān)聯(lián)度反映兩種序列的相似程度;灰色綜合關(guān)聯(lián)度既體現(xiàn)了序列間的相似程度,又反映了序列變化速率的接近程度。采用灰色關(guān)聯(lián)分析方法對一個灰色系統(tǒng)進(jìn)行分析,首先得選準(zhǔn)反映各特征的數(shù)據(jù)序列。
本文利用綜合灰色關(guān)聯(lián)度進(jìn)行數(shù)字字符識別,選擇字符統(tǒng)計特征硬度指標(biāo)作為分析序列,利用待測字符與樣本訓(xùn)練集中的字符硬度特征關(guān)聯(lián)度進(jìn)行識別。提取測試樣本特征序列,建立灰色關(guān)聯(lián)矩陣,根據(jù)灰色關(guān)聯(lián)度、相對關(guān)聯(lián)度量化模型,利用Matlab程序計算系統(tǒng)特征變量數(shù)據(jù)序列之間的灰色關(guān)聯(lián)度?;疑P(guān)聯(lián)度表明了待測樣本與模板樣本的平均距離;相對灰色關(guān)聯(lián)度反映待測樣本與模板樣本的相似程度。根據(jù)優(yōu)勢分析原則,得出關(guān)聯(lián)順序,完成對數(shù)字的識別和分類,具體有如下6個識別步驟。
1)讀入歸一的待測儀表字符圖象。
2)統(tǒng)計連通域高度H,判斷各字符是否為整字,HT為樣本字符高度,若|H-HT|/HT≤3%,則為整字,反之為非整字。
3)對各個數(shù)字字符進(jìn)行特征提取,構(gòu)成待識別樣本序列,整字的特征采取自上而下Hi=[1/5HT,2/5HT,3/5HT,4/5HT,HT],i=1~5和自下而上Hj=[1/5HT,2/5HT,3/5HT,4/5HT,HT],j=5~10的兩個方向的10個特征,組合成待識別字符圖像特征集X0=(x0(1),x0(2),…,x0(10))。
4)非整字由字符重心位置高度決定“灰數(shù)”和“白數(shù)”特征。若字符重心位置在1/2HT以上時,把自下而上方向的特征值看作“白數(shù)”,將自上而下的特征值看作“灰數(shù)”;反之對于重心位置低于1/2HT的非整字,把自下而上方向的特征值看作“灰數(shù)”,將自上而下的特征值看作“白數(shù)”。對各個數(shù)字字符進(jìn)行特征提取,用*表示灰數(shù)值,將上下兩部分特征保存到Xu0=(x0(1),x0(2),…,x0(10))和Xd0=(x0(1),x0(2),…,x0((10))中。
5)計算待識別字符圖像的特征集與訓(xùn)練樣本集中第i個數(shù)字字符特征的灰色綜合關(guān)聯(lián)度,比較得出最大的ρmax=ρoi,判斷待測數(shù)字即為第i個數(shù)字字符。
6)半字得出的上下連通域的關(guān)聯(lián)度最大的字符,且滿足上下兩個半字具有數(shù)字相鄰的性質(zhì),得出兩半字識別結(jié)果,最后根據(jù)讀數(shù)需要,選擇字符高度大的半字作為最后識別結(jié)果。
在MATLAB環(huán)境下,讀入圖像,成功分割后,提取一字符硬度特征為:X0=(3.20,1.20,0.80,0.55,0.50,3.50,1.30,0.76,0.50),關(guān)聯(lián)度對比見表2所示。由表2可知,絕對關(guān)聯(lián)度:ε05>ε02>ε03>ε08>ε00>ε09>ε06>ε07>ε01>ε04;相對關(guān)聯(lián)度:γ05>γ03>γ02>γ08>γ00>γ09>γ06>γ07>γ01>γ04;綜合關(guān)聯(lián)度:ρ05>ρ03>ρ02>ρ08>ρ00>ρ09>ρ07>ρ06>ρ01>ρ04。本文考慮綜合關(guān)聯(lián)度為分析指標(biāo),待測序列與樣本5序列綜合關(guān)聯(lián)度最大,故可判斷待測數(shù)字字符為“5”。
表2 關(guān)聯(lián)度對比
對于提取的一組非整字序列Xuo=(* * * * * *1.5 0.7 0.45 0.3)和Xdo=(2.95 1.25 * * * * * * * *),*表示未確定信息值,綜合關(guān)聯(lián)度計算結(jié)果,上連通域ρu07=0.9929最大,下連通域ρd08=0.9942最大,根據(jù)表盤刻度特點(diǎn)和連通域的高度,最后識讀數(shù)字字符為“7”。對2 500張來自實(shí)際電表表盤圖像的數(shù)字進(jìn)行測試,數(shù)字樣本字符包括整字、整字符有15°傾斜、整字符有30°傾斜、半字。發(fā)現(xiàn)即使整字符傾斜30°,此識別算法對整字和半字的識別都在98%以上,此算法對傾斜度不敏感,對整字和半字都有較好的適應(yīng)性。表3給出了字符識別結(jié)果。
表3 字符識別結(jié)果
基于以上實(shí)驗(yàn)分析,將500張電表表盤圖像包括有不同傾斜角度的圖片進(jìn)行識讀,表4給出了參考文獻(xiàn)[12]中加權(quán)硬度特征匹配的方法和本文灰色關(guān)聯(lián)分析兩種識別方法的結(jié)果對比。
表4 不同識別算法結(jié)果比較
測試結(jié)果顯示,基于灰色關(guān)聯(lián)分析的方法對旋轉(zhuǎn)畸變表現(xiàn)出較強(qiáng)的容錯能力,正確識別率在98.4%以上,比加權(quán)硬度特征匹配的方法更優(yōu)。通過對未能正確識別的數(shù)字圖像進(jìn)行分析,發(fā)現(xiàn)受采樣時受鏡面反光導(dǎo)致過度光照強(qiáng)度影響而產(chǎn)生了噪聲,出現(xiàn)表盤字輪區(qū)域與數(shù)字連通的情況,影響了字符的分割。經(jīng)調(diào)整光照后,該算法都能正確識別。實(shí)驗(yàn)結(jié)果表明本文方法的有效性。
本文考慮灰色關(guān)聯(lián)分析具有標(biāo)準(zhǔn)樣本量小,不需要規(guī)律的特點(diǎn),通過字符自上而下和自下而上兩個方向的不同高度范圍內(nèi)的像素統(tǒng)計值,構(gòu)建字符硬度特征序列,將受不確定因素影響的信息當(dāng)作灰度信息,具有最大灰色綜合關(guān)聯(lián)度的樣本作為識別結(jié)果,從而完成對儀表數(shù)字字符的識別。該算法計算簡單,硬件容易實(shí)現(xiàn)。