唐萍,李春燕朱志鵬
(智達電力自動控制有限公司,四川成都 610062)
圖像識別技術(shù)已經(jīng)廣泛應(yīng)用于各種領(lǐng)域,它與其他技術(shù)領(lǐng)域進行相互滲透,使得該領(lǐng)域的研究具有綜合性,至今還沒有形成統(tǒng)一有效、廣泛應(yīng)用于所有圖像識別的理論[1]。因此,各種思維方式都可以融入其中進行探索式研究,雖然不能做到“放之四海皆準”,卻也能在某些方面某些領(lǐng)域綻放光彩。
假如需要檢測運輸車輛的貨物裝載情況,如圖1所示,需要一套智能設(shè)備自動定位到停放車輛的正上方。這就可以運用圖像識別技術(shù)識別出車框的具體位置,為智能系統(tǒng)提供定位依據(jù)。
圖1 待測車輛原始圖像
圖2 圖像識別的目標
圖像識別技術(shù)一般都是基于位圖進行處理的,這里所說的位圖是指具有設(shè)備無關(guān)位圖(device-independent bitmap,DIB)結(jié)構(gòu)的 WINDOWS 標準格式位圖[2]。
在裝載位圖后,圖像識別一般按照格式修正、預(yù)處理、輪廓定位和識別輸出的步驟進行。圖像識別的宏觀流程雖然比較一致,但由于具體的識別對象不同,應(yīng)用的識別方法也不盡相同。
從攝像頭捕捉的視頻圖像生成的位圖通常是24位真彩色位圖,真彩色位圖沒有調(diào)色板,1個像素占3個字節(jié),處理起來非常不方便,而8位灰度圖1個像素占1個字節(jié),數(shù)據(jù)量小,單字節(jié)處理非常靈活。對于圖像識別技術(shù)來說,各種處理算法一般是針對8位灰度圖而言的,因此位圖處理的先行步驟往往是灰度圖變換。
該問題的難度在于如何在214種顏色中選出28種顏色作為轉(zhuǎn)換后的位圖顏色,并且使得圖像不失真。當前經(jīng)典的一些算法有合并法和分裂法等,還有最大概率法和八叉樹法[3]。一般先得到8位偽彩色圖,再轉(zhuǎn)換成8位灰度。這些算法實現(xiàn)起來非常復(fù)雜,因此考慮其他簡易辦法實現(xiàn)24位真彩色圖直接轉(zhuǎn)8位灰度圖。
灰度變化沒有統(tǒng)一的標準,比較常用的變換依據(jù)是按照三原色對亮度影響的比值來確定的,即:
將24位真彩色位圖的各個像素對應(yīng)的3個分量數(shù)據(jù)轉(zhuǎn)換成調(diào)色盤中對應(yīng)的亮度索引,位圖數(shù)據(jù)量縮小至1/3。
灰度的強化處理是為了增強圖像的對比度,增強特征,在此以線性變換法來實現(xiàn)灰度的強化[4]。令原圖的f(i,j)的灰度范圍為[a,b],線性變換后的圖像 g(i,j)的灰度范圍為[c,d],如圖3所示,g與f之間的關(guān)系式為:
圖3 線形變換原理
將原灰度圖的灰度域從[MIN,MAX]映射到[0,255]空間,核心算法如下:
圖像的平滑處理是一種實用的數(shù)字圖像處理技術(shù),主要目的是為了減少圖像的噪聲。一般情況下,在空間域可以采用鄰域平均法來減少噪聲。
平滑處理基于平滑模板的思想通過一個點與周圍幾個點的運算來去除突然變化的點,從而濾掉一定的噪聲,但圖像一定程度上會模糊化,而減少圖像的模糊代價是圖像平滑研究的主要問題之一。新像素灰度g(x,y)與原像素灰度f(i,j)之間的關(guān)系滿足關(guān)系式:
其中:k(i,j)表示該像素的權(quán)重,一般情況下M=∑k(i,j),S表示以(x,y)為中心的鄰域內(nèi)的像素坐標集合。
若取各權(quán)值為常數(shù)k(i,j)=1/M,S半徑為T,取M=(2T+1)2,則式3可寫為:
為了減少這種效應(yīng),采用閾值法對平滑算法進行改進:
T是一個規(guī)定的非負閾值,當平滑后的灰度沒有超過T,則保留原來的灰度。經(jīng)過這種處理后,減小了圖像的模糊程度,平滑效果仍然很好。
一般情況下通過選擇不同的模板來消除不同的噪聲。常用的模板有:
各模板中帶黑點的元素表示是中心元素,即該元素是需要進行處理的像素。其他元素表示與該像素相鄰的像素,數(shù)值表示權(quán)重。
經(jīng)過實際驗證比對,待測車輛圖像在第三個模板的平滑下,取閾值T=15效果比較理想。對于邊界像素,它的臨域沒有8個像素的時候,不改變原來的灰度值。
圖4給出了平滑處理前后的灰度直方圖,橫坐標表示灰度級,縱坐標表示該灰度的出現(xiàn)頻率(像素個數(shù))。
從圖4(a),(b)可以看出,平滑處理后的灰度變化更平穩(wěn),灰度的覆蓋面擴大,因此說明平滑處理達到了去除噪聲的效果。
經(jīng)過平滑處理后的車輛圖像如圖5,背景特征仍然存在,但注意到頂層貨物圖像呈現(xiàn)出特征黑點區(qū)域。下一步就可以考慮提取黑點區(qū)域。
圖5 平滑后的車輛圖像
圖像銳化處理的目的是使模糊的圖像變的清晰起來。模糊的實質(zhì)是圖像受到了平均或積分運算造成的,因此可以對圖像進行逆運算如微分運算來使圖像清晰化。
一種實用的微分銳化方法:梯度銳化法。
設(shè)圖像為 f(x,y),定義 f(x,y)在點(x,y)處的梯度向矢量=f(x,y[ ])為:
梯度的兩個重要性質(zhì):
1)梯度的方向在函數(shù)f(x,y)最大變化率方向上;
2)梯度的幅度用G[f(x,y)]表示,其值為:
由式(8)得出結(jié)論:梯度的數(shù)值就是f(x,y)在其最大變化率方向上的單位距離所增加的量。
對于離散圖像,式(8)可寫為:
如果直接采用梯度值 G[f(x,y)]來表示圖像,即g(x,y)=G[f(x,y)],則由上面的公式可見:在圖像變化緩慢的地方其值很小(對應(yīng)于圖像較暗),而在線條輪廓等變化較快的地方的值很大。圖像在經(jīng)過梯度運算后使輪廓清晰從而達到銳化目的。
但是,由于在圖像變化緩慢的地方梯度很小,所以圖像會很暗,通常的做法是給定一個閾值Δ,由梯度與Δ的大小關(guān)系再決定新圖像。在此列舉四種常見的Δ處理關(guān)系式:
即大于Δ的采用梯度值,否則保留原值。Δ值取適當,則圖像明暗效果較好。
即大于Δ的采用固定灰度值,否則保留原值。La是一個非負固定灰度值。這樣的結(jié)果是輪廓邊緣是相同級別的灰度。
即大于Δ的采用梯度值,否則統(tǒng)一采用固定灰度值。Lb是一個非負固定灰度值。這樣的結(jié)果是背景成為相同級別的灰度。
即大于Δ的采用統(tǒng)一的輪廓邊緣灰度級別,小于Δ的采用統(tǒng)一的背景灰度級別。如果Δ適當,這樣的結(jié)果是直接呈現(xiàn)輪廓,方便邊緣研究[6]。
本文研究的待測車輛的圖像非常復(fù)雜,圖1中可以看到它的背景不具有單一性。如果提取圖像輪廓,則所有具有邊緣變化的輪廓都會呈現(xiàn)出來,但這些圖像的輪廓對最終確定“中心點”的目標并沒有什么實質(zhì)意義。
經(jīng)過實際操作,利用式(13),取適當?shù)摩ら撝?,目的不是為了提取輪廓,而是為了屏蔽背景和車輛的無關(guān)圖像,從而提取頂層貨物的單一圖像,如圖6。
圖6 銳化圖像及中心點提取
銳化處理核心算法如下:
在實際成像過程中當Δ>75后,成像不再有明顯的變化。
如果能夠用一個類似矩形的邊框來鎖定圖像的邊界,那么該邊框的對角線連線的交點就是目標任務(wù)的中心點。
確定這個邊框的問題又可以進一步轉(zhuǎn)化為尋找四個邊界點。然而四個邊界點并不能單純的查找如“最靠左的黑像素,最靠上方的黑像素”等等,因為從銳化后的圖像可以看出仍然有一些孤立的點存在,使得最靠左的黑像素并不是圖像真正的左邊界點,最靠上的黑像素也不一定是真正的圖像上邊界點等等。
對于這個問題,并不能從某個理論中找到處理依據(jù),因此具體問題具體分析。以找左頂點為例:
1)從左到右,從下往上查找。設(shè)置默認左頂點LP為(1 600,0),如果某點為黑像素,則以該點為基準進行后續(xù)步驟;
2)統(tǒng)計該點所在行且位于該點之右的黑像素個數(shù)TotalCount,統(tǒng)計該點所在行且在20個右像素鄰域內(nèi)的黑像素個數(shù)DomainCount;
3)如果同時滿足TotalCount>30,DomainCount>5則認為左邊界點可能已經(jīng)找到,比較該點的與LP的x坐標,如果本次找到點的x坐標更小,則設(shè)置該點為LP。結(jié)束本行的搜索,進入下一行搜索。
該思路可以屏蔽掉那些孤立點對邊界點查找的影響。最后將滿足這些條件的所有點中x值最小的作為左頂點。其他邊界點同理。
假設(shè)上下左右四個邊界點(分別為TP,BP,LP,RP)已經(jīng)找到,則上下邊界點連線的方程為Y=k1X+b1,左右邊界點連線的方程為:Y=k2X+b2其中:
則兩直線的交點為:
Mid.x為中心點的像素橫坐標,Mid.y為中心點的像素縱坐標,實際取值時候需要圓整。
為方便顯示特征,最終圖像見圖6,用線條將對角線連接起來,以便突出中心點。
為識別車框中心位置,本文設(shè)計了位圖裝載,灰度圖生成,灰度增強,平滑處理,梯度銳化和中心點提取六個步驟來實現(xiàn)。
對于本文提出的車框定位問題,梯度銳化步驟走輪廓成像的路線并無多大意義。因此本文提出了一種梯度銳化的特殊用法,得到了更有用的圖像信息。
其次也提出了一種基于鄰域像素統(tǒng)計的邊界點查找算法,針對本文的研究對象行之有效。
該項車框定位技術(shù)已經(jīng)運用到運輸車輛貨物檢測領(lǐng)域中,如果適當改進還能運用到自動裝填貨物的智能設(shè)備中,以及其他類似的車輛定位技術(shù)領(lǐng)域中。
[1]羅亞玲,鄧韌,周紹騎.圖像識別關(guān)鍵技術(shù)[J].后勤工程學院學報,2001(3):52-56.
[2] David J.Kruglinski,Scro Wingo,George Shepherd.Programming Visual C++6.0[M].北京:北京希望電子出版社,1999.
[3]張士杰,潘國榮.真彩色位圖轉(zhuǎn)換為一般位圖的兩種方法[J].鐵路航測,2001(4):9-11.
[4]邸慧,于起峰,張小虎.一種基于灰度變換的紅外圖像增強算法[J].應(yīng)用光學,2006(1):12-14.
[5]李俊生.一種圖像平滑處理方法的空域算法和頻域分析[J].常州工學院學報,2004(2):30-33,40.
[6]沈庭芝,方子文.數(shù)字圖像處理及模式識別[M].北京:北京理工大學出版社,1998.