摘 要 隨著生活水平的提高,機(jī)頂盒已成為每個(gè)家庭必備的設(shè)備,因此,機(jī)頂盒的質(zhì)量就顯得尤為重要。但如果機(jī)頂盒寫(xiě)入的信息有誤,將導(dǎo)致機(jī)頂盒無(wú)法正常運(yùn)行,會(huì)極大地影響用戶的觀看體驗(yàn)?,F(xiàn)有技術(shù)對(duì)機(jī)頂盒等視頻盒子的信息檢測(cè)還停留在傳統(tǒng)的人工測(cè)試判定,即通過(guò)人工的方式對(duì)視頻圖像上的信息進(jìn)行比對(duì)來(lái)檢驗(yàn)正誤,但是人工檢測(cè)的方式帶有很多個(gè)人主觀觀點(diǎn),無(wú)法快速準(zhǔn)確地發(fā)現(xiàn)機(jī)頂盒中信息有誤的問(wèn)題。
關(guān)鍵詞 OCR;圖像預(yù)處理;文字識(shí)別
引言
本文提出的圖像OCR識(shí)別的機(jī)頂盒信息檢測(cè)方法及系統(tǒng),技術(shù)方案概括為:獲取機(jī)頂盒的圖像,所述圖像中包含機(jī)頂盒的待檢測(cè)信息;確定所述待檢測(cè)信息對(duì)應(yīng)的待檢測(cè)區(qū)域的位置坐標(biāo),根據(jù)所述位置坐標(biāo)對(duì)獲取的圖像進(jìn)行裁剪得到待檢測(cè)圖像;對(duì)所述待檢測(cè)圖像進(jìn)行圖像處理,使得待檢測(cè)圖像中的文字圖像和背景圖像分離,所述圖像處理至少包括:灰度處理、二值化處理和膨脹腐蝕處理;基于OCR識(shí)別處理后的待檢測(cè)圖像中的文字信息,根據(jù)所述文字信息判斷機(jī)頂盒的信息是否有誤。
圖像OCR識(shí)別的機(jī)頂盒信息檢測(cè)方法的處理流程如圖1所示。
1圖像采集處理
1.1 圖像采集
機(jī)頂盒的圖像可以通過(guò)HDMI設(shè)備獲取,機(jī)頂盒的待檢測(cè)信息可以是機(jī)頂盒生產(chǎn)序列號(hào)、機(jī)頂盒加密序列號(hào)、鎖定模式序列號(hào)、機(jī)頂盒加密卡序列號(hào)等。采集出來(lái)的圖像如圖2所示。
1.2 定位檢測(cè)區(qū)域
根據(jù)所述位置坐標(biāo)對(duì)獲取的圖像進(jìn)行裁剪得到待檢測(cè)圖像;具體而言,可以根據(jù)待檢測(cè)信息在圖像中的位置確定出裁剪區(qū)域的位置坐標(biāo),然后根據(jù)裁剪區(qū)域的位置坐標(biāo)對(duì)獲取的圖像進(jìn)行裁剪得到待檢測(cè)圖像,待檢測(cè)圖像中包含了機(jī)頂盒的待檢測(cè)信息。如圖3所示。
1.3 圖像預(yù)處理
待檢測(cè)圖像進(jìn)行圖像處理,使得待檢測(cè)圖像中的文字圖像和背景圖像分離,所述圖像處理至少包括:灰度處理、二值化處理和膨脹腐蝕處理;
可以理解,灰度處理、二值化處理和膨脹腐蝕處理是依次進(jìn)行的,其中,灰度處理包括:
對(duì)待檢測(cè)圖像進(jìn)行灰化處理,得到只包含一種灰度值的灰度圖像,灰化公式如下:
式中,表示灰度圖像中像素的灰度值,R表示紅色分量值,G表示綠分量值,B表示藍(lán)色分量值。
二值化處理包括:確定灰度閾值,根據(jù)所述灰度閾值對(duì)灰度圖像進(jìn)行二值化處理得到二值圖像,二值圖像就是只有黑白兩種顏色表示的圖像,在數(shù)字上用0 表示黑色(0),1表示白色(255) 。圖像中屬于同一物體的像素在灰度值上存在極大相似性,相反,不同物體在灰度值上通常表現(xiàn)為較大差異。因而,本實(shí)施例通過(guò)自動(dòng)閾值化技術(shù),選取能夠充分體現(xiàn)前景和背景差異的分割灰度值,使待識(shí)別的文字大致分離出來(lái)。
根據(jù)自動(dòng)閾值化技術(shù)確定灰度閾值的方法包括:設(shè)定初始灰度閾值,對(duì)于灰度圖像的每個(gè)像素,計(jì)算其Kirsh算子,根據(jù)初始灰度閾值與Kirsh算子的大小對(duì)初始灰度閾值進(jìn)行動(dòng)態(tài)調(diào)整得到灰度閾值。
膨脹處理包括:遍歷所述二值圖像的每一個(gè)像素,用結(jié)構(gòu)元素的中心點(diǎn)對(duì)準(zhǔn)當(dāng)前正在遍歷的像素,獲取當(dāng)前結(jié)構(gòu)元素所覆蓋下的二值圖像對(duì)應(yīng)區(qū)域內(nèi)的所有像素的最大值,用該最大值替換當(dāng)前像素值[1];由于二值圖像最大值就是1,所以就是用1替換,即變成了白色前景物體。如果當(dāng)前結(jié)構(gòu)元素覆蓋下,全部都是背景,那么就不會(huì)對(duì)原圖做出改動(dòng),因?yàn)槎际?;如果全部都是前景像素,也不會(huì)對(duì)原圖做出改動(dòng),因?yàn)槎际?;只有結(jié)構(gòu)元素位于前景物體邊緣的時(shí)候,它覆蓋的區(qū)域內(nèi)才會(huì)出現(xiàn)0和1兩種不同的像素值,這個(gè)時(shí)候把當(dāng)前像素替換成1就有變化了。膨脹后的圖像的整體亮度會(huì)有提高,圖形中較亮物體的尺寸變大,而較暗物體的尺寸會(huì)減小甚至消失。
腐蝕處理包括:遍歷所述二值圖像的每一個(gè)像素,用結(jié)構(gòu)元素的中心點(diǎn)對(duì)準(zhǔn)當(dāng)前正在遍歷的像素,獲取當(dāng)前結(jié)構(gòu)元素所覆蓋下的二值圖像對(duì)應(yīng)區(qū)域內(nèi)的所有像素的最小值,用該最小值替換當(dāng)前像素值;由于二值圖像最小值就是0,所以就是用0替換,即變成了黑色背景。如果當(dāng)前結(jié)構(gòu)元素覆蓋下,全部都是背景,那么就不會(huì)對(duì)原圖做出改動(dòng),因?yàn)槎际?;如果全部都是前景像素,也不會(huì)對(duì)原圖做出改動(dòng),因?yàn)槎际?,只有結(jié)構(gòu)元素位于前景物體邊緣的時(shí)候,它覆蓋的區(qū)域內(nèi)才會(huì)出現(xiàn)0和1兩種不同的像素值,這個(gè)時(shí)候把當(dāng)前像素替換成0就有變化了。腐蝕后的圖像整體會(huì)變暗,圖像中比較亮的區(qū)域的面積會(huì)變小甚至消失,而比較暗的區(qū)域會(huì)增大一些。
2OCR識(shí)別
通過(guò)對(duì)待檢測(cè)圖像進(jìn)行處理后,能夠得到更加易于文字識(shí)別的圖像,本實(shí)施例中,將處理后的待檢測(cè)圖像輸入至Tesseract-OCR引擎中,Tesseract-OCR引擎對(duì)待檢測(cè)圖像進(jìn)行文字識(shí)別得到待檢測(cè)圖像的文字信息。
Tesseract-OCR引擎使用到的靜態(tài)字符分類器,包含一種特別的設(shè)計(jì)思想,即分類器訓(xùn)練與分類識(shí)別過(guò)程的分離。大多數(shù)分類器,其訓(xùn)練樣本和識(shí)別字符具有同樣的處理方式,因而,只有當(dāng)待識(shí)別字符與訓(xùn)練樣本接近時(shí),識(shí)別成功率才能夠到保證。Tesseract-OCR引擎使用了一種突破性的解決方式,在訓(xùn)練樣本集時(shí),系統(tǒng)選取字符的近似多邊形段作為特征;而在識(shí)別過(guò)程中,系統(tǒng)選取屬于字符邊界的固定長(zhǎng)度的短線段作為特征,并使用多對(duì)一方式對(duì)應(yīng)于系統(tǒng)的標(biāo)準(zhǔn)特征。
其文字識(shí)別的具體步驟如下[2]:
精選出可能與待檢測(cè)特征匹配的類別,未知字符每一個(gè)待識(shí)別特征通過(guò)查表可以得到一組可能與其匹配類別的向量,系統(tǒng)將這些匹配向量相加,選取出得分最高的幾個(gè)類別作為最有可能未知字符匹配的名單;
通過(guò)計(jì)算相似度確定最終類別,每一個(gè)標(biāo)準(zhǔn)字符都由一個(gè)邏輯合式代表,由此待識(shí)別特征與標(biāo)準(zhǔn)字符的“距離”可以被計(jì)算出來(lái)。最后,綜合得到的具有最短距離的類別,就是與未知字符相似度最高的類別。
Tesseract-OCR引擎的分類設(shè)計(jì)能夠識(shí)別受損字符,具有較強(qiáng)的魯棒性,所以在選取分類器的訓(xùn)練樣本時(shí)就不需要引入損傷字符,并且其識(shí)別的速度和準(zhǔn)確率較高。
識(shí)別出文字信息后,比較所述文字信息與預(yù)設(shè)文字信息是否一致,若一致,則表示機(jī)頂盒的信息正確,否則,表示機(jī)頂盒的信息有誤。
3結(jié)束語(yǔ)
經(jīng)過(guò)實(shí)際實(shí)驗(yàn)及實(shí)用,該方法在機(jī)頂盒自動(dòng)檢測(cè)上具有非常好的效果。達(dá)到了預(yù)期設(shè)計(jì)目標(biāo)。
參考文獻(xiàn)
[1] 章專,仲林國(guó),朱志剛.基于圖像采集與處理的自動(dòng)抄表系統(tǒng)[J].電測(cè)與儀表,2004,(1):19.
[2] 昝元寶,靳國(guó)榮.機(jī)械式水表讀數(shù)識(shí)別圖像預(yù)處理研究[J].信息化技術(shù)應(yīng)用,2019(7):26-27.