【摘 要】目前,隨著社會經(jīng)濟(jì)以及科學(xué)技術(shù)的不斷發(fā)展和進(jìn)步,對數(shù)字圖書資料的修復(fù)工作也有了新的變化,其中,圖像模式識別技術(shù)就是一項新的數(shù)字修復(fù)方法。由于其具有修復(fù)方法簡便、修復(fù)效果好等特點,因此被廣泛的應(yīng)用于當(dāng)前數(shù)字圖書資料的修復(fù)工作當(dāng)中。本文就圖像模式識別方法的相關(guān)情況進(jìn)行簡單的分析和介紹,并就如何在數(shù)字圖書資料的修復(fù)工作中應(yīng)用圖像模式識別方法進(jìn)行研究和探討,從而不斷提高數(shù)字圖書資料修復(fù)的效果和水平。
【關(guān)鍵詞】數(shù)字圖書資料 圖像模式識別 修復(fù)應(yīng)用
目前,隨著信息化時代的不斷發(fā)展,越來越多的紙質(zhì)圖書資料實現(xiàn)了數(shù)字化轉(zhuǎn)變。然而在轉(zhuǎn)變、處理、存儲、傳輸?shù)冗^程中,受到多方面因素的影響,常常會導(dǎo)致數(shù)字圖書資料出現(xiàn)缺失、損壞等問題,這時就必須要對其進(jìn)行相應(yīng)的修復(fù)處理。圖像模式識別技術(shù)是當(dāng)前圖書修復(fù)領(lǐng)域中的一種新興的數(shù)字圖書修復(fù)技術(shù),它的操作方法簡單、修復(fù)時間短、修復(fù)內(nèi)容全面,具有非常好的圖書修復(fù)效果,能夠有效的保障修復(fù)后數(shù)字圖書資料的完整性、準(zhǔn)確性和清晰性,因此,必須要加強(qiáng)圖像模式識別方法在數(shù)字圖書資料修復(fù)中的應(yīng)用,從而有效的確保數(shù)字圖書保存的完整性和良好性。
一、圖像模式識別的概述
(一)圖像模式識別的含義
所謂圖像模式識別,主要指的是利用計算機(jī)技術(shù)對社會生活中的人、物、事等圖像進(jìn)行描述、分析、識別、判斷的過程。圖像模式識別主要是通過對人體功能的模擬來識別相應(yīng)圖像信息的,它是一個智能化的活動過程,主要分為分析過程和判斷過程兩部分內(nèi)容。
(二)圖像模式識別的原理
圖像模式識別的工作原理主要是局部二值化原理。即在識別時,要首先將較大的圖像模塊切割劃分成若干的較小圖像,然后再利用二值化對每一個小圖像進(jìn)行處理,并測繪出整個圖像的二值化完整圖像。簡單來說,圖像模式識別的工作原理即為:分割圖像——二值化圖像——合并二值化圖像。
(三)圖像模式識別的方法
目前,圖像模式識別的常用方法主要包括四種,即:模板匹配識別法、句法模式識別法、統(tǒng)計模式識別法以及神經(jīng)網(wǎng)絡(luò)識別法。在實際運用過程中,應(yīng)用人員要根據(jù)需要識別的具體內(nèi)容恰當(dāng)?shù)倪x擇相應(yīng)的方法。
二、數(shù)字圖書資料修復(fù)中應(yīng)用圖像模式識別的措施
(一)數(shù)字圖書資料修復(fù)的存在問題
在傳統(tǒng)的數(shù)字圖書資料修改過程中,常常出現(xiàn)一些諸如圖像模糊、字符暗淡、識別不準(zhǔn)、筆畫不均等問題,導(dǎo)致數(shù)字圖書資料在修復(fù)后不能被清晰、準(zhǔn)確、有效的識別,從而無法達(dá)到數(shù)字化檢索、處理圖書資料的目的。
(二)圖像模式識別修復(fù)數(shù)字圖書資料的應(yīng)用
采用圖像模式識別方法進(jìn)行數(shù)字圖書資料的修復(fù),其操作流程和技術(shù)主要包括以下幾個方面的內(nèi)容,具體體現(xiàn)為:
1.對圖像進(jìn)行預(yù)處理操作
在對識別圖像進(jìn)行二值化前,首先要進(jìn)行預(yù)處理操作。這是由于圖書資料在進(jìn)行數(shù)字化期間,光電敏感元件載荷電子會出現(xiàn)隨機(jī)性的運動,使之引起噪聲問題。同時,數(shù)字傳輸通道出現(xiàn)干擾等原因也會導(dǎo)致灰度圖像在數(shù)字化處理后存在程度不一的噪聲。因此,必須進(jìn)行科學(xué)、正確的圖像預(yù)處理操作。目前,對圖像的預(yù)處理操作方法主要包括兩種,即平滑濾波和灰度變換。平滑濾波,即是指圖像在預(yù)處理的過程中,將加性噪聲接入到平滑圖像當(dāng)中的處理方法?;叶茸儞Q,即是指修正圖像的像素灰度值過程中,確保圖像對比度的飽和以及成像均勻性的處理方法。
2.提取圖像相關(guān)字符信息
利用攝像裝置對圖像進(jìn)行采集后,其計算機(jī)系統(tǒng)中的存儲圖像灰度是24位,即圖像的灰度等級為224個,這就導(dǎo)致當(dāng)二值化圖像時,其分解出的二值圖像為白、黑兩個等級。基于圖像相似區(qū)域以及不連續(xù)性區(qū)域狀況,圖像二值化的方程式為:P(x,y)={1,f(x,y)≤N;0,f(x,y)jN}
其中,P(x,y)——二值化的數(shù)值;f(x,y)——圖像的灰度值;1——圖像中較小亮度的點;0——圖像中較大亮度的點;N——閾值。
3.再處理二值化圖像
當(dāng)識別圖像在完成二值化分析后,常常會出現(xiàn)圖像噪音的問題,導(dǎo)致圖像的數(shù)字化處理不準(zhǔn)確、不清晰。因此,必須要對這類的圖像進(jìn)行二次的優(yōu)化處理。通常情況下,我們是采用濾波平滑化處理方法對二值化圖像中的噪音進(jìn)行去除。具體措施表現(xiàn)為:(1)重新對圖像進(jìn)行構(gòu)造。在得到原始的數(shù)字圖書資料的完整二值化圖像后,要首先對圖像資料中的相關(guān)字符信息進(jìn)行重新的構(gòu)造,使之形成新的增強(qiáng)性圖像資料,從而提高原始圖像資料還原后的效果,增強(qiáng)數(shù)字圖書資料的完整度、清晰度和準(zhǔn)確度。(2)實施二次模式識別處理。數(shù)字圖書資料在完成二值化后,可以對其按照一定時間方面的需求實施模式識別的后繼處理措施。即對二值化圖像的相應(yīng)字符進(jìn)行歸類、分割、修正等處理操作,并重新輸出原有數(shù)字圖書資料中的相關(guān)內(nèi)容,而后重新建構(gòu)圖像,并正確的識別圖像中的相關(guān)字符信息。
三、結(jié)語
目前,隨著網(wǎng)絡(luò)信息技術(shù)的不斷普及,使得數(shù)字圖書資料的社會存有數(shù)量越來越多,這就不可避免的造成愈來愈多的資料損壞、缺少等問題的出現(xiàn)。因此,必須要重視和加強(qiáng)對數(shù)字圖書資料的修復(fù)工作。通過運用圖像模式識別方法,進(jìn)一步加強(qiáng)和提高數(shù)字圖書資料的修復(fù)效果和水平,并根據(jù)當(dāng)前日益更新發(fā)展的科學(xué)技術(shù),不斷改進(jìn)和優(yōu)化圖像模式識別方法的技術(shù)水平,從而更好的保障數(shù)字圖書資料的完好無損,滿足人們對數(shù)字圖書的檢索、閱讀需求。
參考文獻(xiàn):
[1] 代小紅.基于圖像模式識別的數(shù)字圖書資料修復(fù)及應(yīng)用[J].圖書情報工作,2009(03)
[2] 王行榮.模式識別技術(shù)在圖書資料修復(fù)中的應(yīng)用[J].重慶工商大學(xué)學(xué)報(自然科學(xué)版),2008(04)
[3] 賈昔玲.基于圖像模式識別的數(shù)字圖書資料修復(fù)及應(yīng)用研究[J].數(shù)字技術(shù)與應(yīng)用,2010(10)
[4] 高齊.一種有效的文本圖像二值化方法[J].北方交通大學(xué)出版社,2009(01)
作者簡介:林春梅 女 永定 1981年2月 龍巖市上杭縣圖書館 助理館員。