張鴻鋒++李婉琪++曾昭君++麥志杰
摘 要:Hu不變矩是圖像的一種統(tǒng)計(jì)特征,因其具有平移、旋轉(zhuǎn)與比例不變性而被廣泛應(yīng)用于圖像識別領(lǐng)域。該文以MATLAB作為技術(shù)實(shí)現(xiàn)平臺,以Hu不變矩作為判斷依據(jù),配合數(shù)字形態(tài)學(xué)、歐氏判據(jù)等數(shù)學(xué)方法,通過基于MATLAB的算法進(jìn)行程序設(shè)計(jì),實(shí)現(xiàn)區(qū)域圖像特征數(shù)據(jù)獲取,并與庫內(nèi)圖像特征數(shù)據(jù)進(jìn)行對比,選出與最接近的一組數(shù)據(jù),實(shí)現(xiàn)圖像識別的目的。計(jì)算機(jī)模擬結(jié)果表明該方法的有效性和可行性。
關(guān)鍵詞:Hu不變矩 圖像特征 模式識別 應(yīng)用
中圖分類號:TP391 文獻(xiàn)標(biāo)識碼:A 文章編號:1672-3791(2014)10(c)-0005-04
模式識別,指使用計(jì)算機(jī)利用數(shù)學(xué)技術(shù)方法,對表征事物或現(xiàn)象的各種形式的(數(shù)值的、文字的和邏輯關(guān)系的)信息進(jìn)行處理和分析,以對事物或現(xiàn)象進(jìn)行描述、辨認(rèn)、分類和解釋的過程。其中,我們把環(huán)境與客體統(tǒng)稱為“模式”。該文討論對數(shù)字圖像進(jìn)行模式識別,包含對圖像進(jìn)行特征提取與匹配的過程。
圖像特征有兩類表示方法,一類是輪廓特征,另一類是區(qū)域特征。圖像的輪廓特征主要針對物體的外邊界,常使用鏈碼,傅里葉描述子、Hough變換進(jìn)行描述;圖像的區(qū)域特征則關(guān)系到整個(gè)形狀區(qū)域,常用邊界特征法、傅里葉形狀描述符法、幾何參數(shù)法、形狀不變矩法和小波描述符(Wavelet Deor)等方法描述。而圖像特征匹配是指將待檢測圖像的圖像特征與給定圖像的數(shù)據(jù)進(jìn)行比對,使用如互相關(guān)性、歐氏判據(jù)等方法,判斷兩者是否使用同一類型圖像的操作。
Hu不變矩作為形狀不變矩的其中一種計(jì)算方式,具有平移、比例和旋轉(zhuǎn)不變性,這使其在在圖像識別的過程中,能減少如待測圖像的大小歸一化與位置居中等預(yù)處理步驟,降低運(yùn)算成本,提高運(yùn)算速率。本文將使用Matlab平臺,應(yīng)用Hu不變矩作為特征提取技術(shù),結(jié)合數(shù)學(xué)形態(tài)學(xué)、歐氏判據(jù)等運(yùn)算方法,實(shí)現(xiàn)圖像識別功能。
1 Hu不變矩的定義與計(jì)算方式
M.K.Hu在1962年提出了Hu不變矩。Hu不變矩是指以圖像的低階(二階和三階)歸一化中心矩的非線性組合構(gòu)成的七個(gè)量值。Hu不變矩自提出至今,已被廣泛應(yīng)用到圖像、字符識別以及工業(yè)質(zhì)量檢測等領(lǐng)域。下面敘述Hu不變矩的計(jì)算方式。
設(shè)二維數(shù)字圖像用表示,則其階矩定義為:
(1)
階中心矩定義為:
(2)
其中。對于二維數(shù)字圖像,為其質(zhì)心坐標(biāo),表示圖像灰度在水平方向上的灰度質(zhì)心,表示圖像灰度在水平方向上的灰度質(zhì)心。
階歸一化中心矩定義為:
,其中
M.K.Hu將以上代數(shù)不變量理論應(yīng)用于尺度規(guī)范化矩,最終構(gòu)造出下列所示的7個(gè)矩不變量,稱為Hu不變矩,并驗(yàn)證其對圖像的平移、選擇和比例具有不變性[1]。以下是7個(gè)不變矩的計(jì)算公式:
(3)
(4)
(5)
(6)
(7)
(8)
(9)
綜上所述,Hu不變矩可以應(yīng)用以上(3)~(9)所示公式得出結(jié)果[2]。
2 統(tǒng)設(shè)計(jì)與實(shí)現(xiàn)
該文應(yīng)用基于上文公式(3)~(9)編寫的Hu不變矩特征提取程序?qū)?jīng)過預(yù)處理后的圖像進(jìn)行特征提取,使用歐氏判據(jù)作為判斷依據(jù),將輸入圖所得矩值與數(shù)據(jù)庫內(nèi)模板進(jìn)行比對,實(shí)現(xiàn)圖像匹配,最后輸出判斷結(jié)果并計(jì)數(shù)。圖1是系統(tǒng)流程圖,下面分別敘述系統(tǒng)處理過程。
2.1 預(yù)處理
圖像分割,是指將圖像中相連的區(qū)域進(jìn)行劃分并將兩個(gè)不同區(qū)域進(jìn)行分離。而標(biāo)記是指把圖像矩陣中各個(gè)不相連的區(qū)域通過賦予不同的數(shù)值,便于對各區(qū)域進(jìn)行提取、計(jì)數(shù)等操作。為實(shí)現(xiàn)以上目的,需要使用數(shù)學(xué)形態(tài)學(xué)方法對目標(biāo)圖像進(jìn)行操作。由于該文中使用二值數(shù)字形態(tài)學(xué),必須對輸入的圖像進(jìn)行灰度化處理。已知彩色圖片由三個(gè)數(shù)值矩陣合成所得,則應(yīng)有彩色圖像變換為灰度圖像有固定公式如下:
(10)
此后對灰度圖像進(jìn)行灰度二值化處理,為實(shí)現(xiàn)自動獲取合適的二值化閾值,實(shí)現(xiàn)圖像背景與目標(biāo)圖像的分離,降低誤判率,該文使用調(diào)用garythresh函數(shù),應(yīng)用最大類間方差法進(jìn)行閾值獲取。
對于完成以上預(yù)處理操作的圖像,開始進(jìn)行二值數(shù)學(xué)形態(tài)學(xué)操作。數(shù)學(xué)形態(tài)學(xué)中二值圖像的形態(tài)變換是一種針對集合的處理過程。其形態(tài)算子的實(shí)質(zhì)是表達(dá)物體或形狀的集合與結(jié)構(gòu)元素間的相互作用,結(jié)構(gòu)元素的形狀就決定了這種運(yùn)算所提取的信號的形狀信息。形態(tài)學(xué)圖像處理是在圖像中移動一個(gè)結(jié)構(gòu)元素,然后將結(jié)構(gòu)元素與下面的二值圖像進(jìn)行交、并等集合運(yùn)算。例如,如圖2所示,假設(shè)B(x)代表了結(jié)構(gòu)元素,X代表工作空間,就是用B(x)對E進(jìn)行腐蝕的結(jié)果就是把結(jié)構(gòu)元素B平移后使B包含于X的所有點(diǎn)構(gòu)成的集合。此時(shí),就是把二值圖像各1像素連接成分的邊界點(diǎn)去掉從而縮小一層,實(shí)現(xiàn)提取骨干信息,去掉毛刺,去掉孤立的0像素的目的,并實(shí)現(xiàn)相連區(qū)域的分割[3]。該文調(diào)用strel函數(shù),用于創(chuàng)建膨脹腐蝕及開閉運(yùn)算等操作的結(jié)構(gòu)元素對象,且結(jié)構(gòu)元素可根據(jù)系統(tǒng)需要修改大小、形狀等參數(shù)。
在完成了腐蝕后,系統(tǒng)需要對所得圖像進(jìn)行膨脹操作。因?yàn)楦g操作在運(yùn)行時(shí),會引起一定的圖像邊緣信息缺失,為了減少此類信息丟失的影響,系統(tǒng)需要進(jìn)行膨脹操作。如圖3所示,膨脹是數(shù)學(xué)形態(tài)學(xué)上面的一個(gè)概念,屬于腐蝕的逆操作,可認(rèn)為是把二值圖像各1像素連接成分的邊界擴(kuò)大一層,常用于填充邊緣或0像素內(nèi)部的孔。此處應(yīng)該注意,所用的結(jié)構(gòu)元素必須要與上一步的復(fù)式操作相同,使目標(biāo)圖像的信息丟失量降低。
該文先進(jìn)行了數(shù)學(xué)形態(tài)學(xué)的腐蝕操作,而后再進(jìn)行了數(shù)學(xué)形態(tài)學(xué)的膨脹操作,可實(shí)現(xiàn)去除圖像中孤立點(diǎn)、去除圖像毛刺、分割粘連區(qū)域的目的。
2.2 特征提取
在上文已經(jīng)對Hu不變矩的歷史與相關(guān)公式進(jìn)行了詳細(xì)的介紹,此處則不再贅述。本文根據(jù)公式(3)~(9)編寫不變矩計(jì)算程序,并對所得不變矩矩值進(jìn)行取對數(shù)操作。
2.3 特征匹配
該文使用歐氏距離作為判定依據(jù),根據(jù)最近鄰分類器的方法對待測圖像Hu不變矩信息與數(shù)據(jù)庫中Hu不變矩信息進(jìn)行運(yùn)算,實(shí)現(xiàn)模式識別的功能。以下對歐氏距離與最近鄰分類器進(jìn)行介紹。
歐氏距離(Euclidean distance)也稱歐幾里得距離,它是一個(gè)通常采用的距離定義,它是在m維空間中兩個(gè)點(diǎn)之間的真實(shí)距離。歐氏距離可看作信號的相似程度。
歐氏距離的公式如下所示:
(11)
表示第一個(gè)點(diǎn)的第維坐標(biāo),表示第二個(gè)點(diǎn)的第維坐標(biāo);
維歐氏空間是一個(gè)點(diǎn)集,它的每個(gè)點(diǎn)可以表示,其中是實(shí)數(shù),稱為的第個(gè)坐標(biāo),兩個(gè)點(diǎn)和之間的距離定義為上面的公式。
通過計(jì)算各個(gè)圖像不變矩與給定圖像模板的不變矩之間的歐式距離,可以判斷圖像與各個(gè)模板間的相似程度。對輸入的數(shù)字圖像與給定的數(shù)字圖像模板進(jìn)行對比,可實(shí)現(xiàn)自動分辨輸入圖像是否輸入給定模板的同類圖像,并選出其最可能的形狀類型。
根據(jù)以上的計(jì)算公式與判斷依據(jù),編寫了本系統(tǒng)的模式識別操作模塊。通過循環(huán)結(jié)構(gòu),使輸入數(shù)據(jù)與數(shù)據(jù)庫里的數(shù)據(jù)進(jìn)行比對,實(shí)現(xiàn)模塊功能,并實(shí)現(xiàn)計(jì)數(shù)功能。
綜上所述,該文所用測試程序可實(shí)現(xiàn)圖像識別的功能,下面將進(jìn)行程序測試與功能驗(yàn)證。
3 系統(tǒng)測試與驗(yàn)證
為驗(yàn)證Hu不變矩在圖像識別中的應(yīng)用優(yōu)勢,下面以一實(shí)驗(yàn)圖像作輸入,并輸出各步操作后的結(jié)果圖像與數(shù)據(jù)。
圖4為帶有椒鹽噪聲,各區(qū)域有黏連的彩色實(shí)驗(yàn)圖像。以圖四作為程序的輸入,經(jīng)濾波、去噪與灰度化操作后,獲得圖5。
調(diào)用基于最大類間方差法的函數(shù)garythresh獲取合適的閾值,對圖五進(jìn)行灰度二值化,獲得圖6。應(yīng)用數(shù)字形態(tài)學(xué)開運(yùn)算,把黏連區(qū)域進(jìn)行分割獲得圖7。
最后引入bwlabel函數(shù),對二維二值圖像中各個(gè)分離部分進(jìn)行標(biāo)注,并獲得最佳圖像截取圖8。圖8中由左往右分別為待測圖像A、B、C、D。
此時(shí),調(diào)用圖像特征提取程序,獲得各待測圖像的Hu不變矩?cái)?shù)值,結(jié)果如表1所示,并將各圖像矩值與數(shù)據(jù)庫內(nèi)模板數(shù)值進(jìn)行歐氏距離計(jì)算,結(jié)果如表2所示。通過將所得歐氏距離進(jìn)行排序,獲得結(jié)論如下:圖A、B、C、D分別是星型、圓形、矩形、三角形,結(jié)果與實(shí)際相符。程序運(yùn)行總時(shí)間為0.8 s。
4 結(jié)論
該文以Hu不變矩為判斷依據(jù),配合數(shù)字形態(tài)學(xué)、歐式判據(jù)等數(shù)學(xué)方法,以Matlab為平臺實(shí)現(xiàn)了圖像識別的功能。通過實(shí)驗(yàn)可看出,基于Hu不變矩的圖像識別程序具有準(zhǔn)確率高,運(yùn)算速度快的特點(diǎn),說明Hu不變矩在圖像識別應(yīng)用中的優(yōu)勢。
參考文獻(xiàn)
[1] M.K.Hu.Visual Pattern Recognition by Moment Invariant[J].IRE Transactions on Information Theory,1962(8):179-187.
[2] 甘俊英.基于不變矩特征和神經(jīng)網(wǎng)絡(luò)的人臉識別模型[J].計(jì)算機(jī)工程與應(yīng)用, 2002(7):53-56.
[3] 吳丹,劉修國,尚建嘎.數(shù)學(xué)形態(tài)學(xué)在圖像處理與分析中的應(yīng)用及展望[J].工程圖學(xué)學(xué)報(bào),2003(2):120-125.