吳晴
(江西農(nóng)業(yè)大學(xué)計算機與信息工程學(xué)院 330045)
基于matlab圖像預(yù)處理方法研究綜述
吳晴
(江西農(nóng)業(yè)大學(xué)計算機與信息工程學(xué)院 330045)
人機交互技術(shù)越來越深入人們的日常生活,而手勢作為一個自然、直觀的交互通道,在人機交互過程中起著非常重要的作用。本文主要研究手勢識別過程中的利用matlab對圖像進行預(yù)處理。主要處理手勢圖像在生成等過程中受到噪聲的影響。為之后手勢識別過程中手勢分割和特征提取提供了非常有效的數(shù)據(jù)樣本。圖像預(yù)處理主要包括:圖像平滑和圖像二值化。
手勢識別;圖像處理;matlab;圖像平滑;圖像二值化
手勢作為一個自然、直觀的交互通道,在很多領(lǐng)域都得到了廣泛的應(yīng)用。尤其是在人機交互方面,成為了仿人機器人融入人類社會的關(guān)鍵。因此手勢識別技術(shù)是其中的一項非常關(guān)鍵的技術(shù)。
在手勢識別過程中,要能準(zhǔn)確的進行手勢識別,第一步的圖像處理就尤為的重要。目的就是改善圖像的質(zhì)量。當(dāng)在獲取手勢信息轉(zhuǎn)換成能夠用計算機處理的數(shù)字圖像時,手勢圖像在生成、變換的過程中會因受到不同噪聲的干擾而出現(xiàn)不同程度的畸變。所以本文就是使用matlab對圖像進行預(yù)處理,針對采用何種濾波方法去除不同噪聲(主要為椒鹽噪聲和高斯噪聲),加強圖像的有用信息,過濾掉不需要的信息。本文手勢圖像的預(yù)處理包括圖像平滑和圖像二值化。
在手勢識別的過程之中,當(dāng)獲取到的手勢信息可以轉(zhuǎn)化成為可供計算機處理的數(shù)字圖像的時候,手勢圖像的質(zhì)量會受到生成、傳輸、變換過程中很多因素的影響與干擾,使得手勢圖像的畫質(zhì)因為噪聲而產(chǎn)生不同程度上的變形,因此,需要對手勢圖像進行圖像處理。圖像處理的目的是為了將手勢圖像中的噪聲去除掉,從而加強圖像中的有用信息[1]。圖像處理過程是對手勢圖像的一個過濾過程,將會對其產(chǎn)生干擾的因素排除掉,保留需要處理的部分,并過濾掉不需要的部分。圖像處理具有高效的矩陣運行機制、多樣化的操作途徑、功能強大的工具箱、良好的擴展能力以及完善的幫助系統(tǒng)五個優(yōu)點。
在本文中主要致力于去除圖像在生成過程中產(chǎn)生的噪聲影響。把圖像平滑技術(shù)分為兩大類:①對噪聲圖像的整體或大的部分進行校正從而來得到平滑的圖像。本文要介紹的是Wiener濾波器。②對圖像局部小鄰域的一些像素加以運算。本文介紹的是頻域平滑技術(shù)、空域平滑技術(shù)和中值濾波法。從而得出針對何種噪聲應(yīng)該采用何種濾波方法,得出更好的平滑效果。
3.1 Wiener濾波技術(shù)
Wiener濾波是一種線性濾波,它是使原始圖像和其恢復(fù)圖像之間的均方誤差最小的復(fù)原方法,是一種自適應(yīng)濾波器,根據(jù)局部方差來調(diào)整濾波器效果。對于去除高斯噪聲效果明顯[2]。本文用matlab中的wiener2來分別對高斯噪聲和椒鹽噪聲進行處理和原圖像進行對比。
3.2 頻域平滑技術(shù)
頻域平滑技術(shù)是通過一個低通濾波器來對圖像進行處理的頻域平滑方法。在分析圖像時,一幅圖像的邊緣、跳躍部分以及噪聲代表圖像的高頻分量,而大面積的背景區(qū)則代表圖像信號的低頻分量。用頻域低通濾波器除去其高頻部分就能去掉噪聲,使圖像得到平滑[3]。本文用matlab建立一個二階巴特沃斯(Butterworth)低通濾波器來分別對高斯噪聲和椒鹽噪聲處理后得到的平滑圖像。觀察可得處理后的效果差異不大。
3.3 空域平滑技術(shù)
空域平滑技術(shù)是一種線性濾波常用到的是領(lǐng)域平均法,即用幾個像素灰度的平均值來代替每個像素的灰度。有效抑制加性噪聲,但容易引起圖像模糊,可以對其進行改進,主要避開對景物邊緣的平滑處理。本文用matlab中的filter2用法中的fspecial函數(shù)來分別對高斯噪聲和椒鹽噪聲處理后得到的平滑圖像。
3.4 中值濾波法
中值濾波法是一種非線性濾波,因為不管是直接得到的灰度圖像,還是通過彩色圖像轉(zhuǎn)換得到的灰度圖像,它都會有噪聲的存在,噪聲非常影響圖像的質(zhì)量。它的優(yōu)點在于采用中值濾波不僅可以去除噪聲,而且還可以保持圖像的邊緣特性,不會使圖像產(chǎn)生顯著的模糊。本文用matlab中的medfilt2來分別對高斯噪聲和椒鹽噪聲處理后得到的平滑圖像。觀察可得對椒鹽噪聲的處理效果更佳。
4.1 圖像二值化概述
圖像二值化是指將圖像上像素點的灰度值設(shè)置為0或255,或是讓整個圖像呈現(xiàn)出只有明顯黑白兩個灰度級圖像的效果。將整體圖像中感興趣的目標(biāo)像素作為前景像素,其余作為背景像素。如果圖像f(x,y)的灰度值在[a,b]范圍之內(nèi),二值化的閾值設(shè)為t(a≤t≤b),則圖像二值化的一般表達式為:
即通過適當(dāng)?shù)拈撝颠x取而獲得仍然可以反映圖像整體和局部特征的二值化圖像。本文用matlab中的graythresh來自動確定閾值進行二值化圖像和用matlab中的imhist來編寫設(shè)計直方圖。
4.2 圖像二值化的方法
圖像二值化的方法大致可以分為整體閾值二值化、局部閾值二值化以及動態(tài)閾值二值化三種。整體閾值二值化,指僅僅通過像素點(i,j)的灰度值f(i,j)來確定閾值的方法被稱為整體閾值選擇法。局部閾值二值化,指通過像素點(i,j)的灰度值f(i,j)和像素周圍點局部灰度的特性來確定閾值的方法被稱之為局部閾值選擇法。動態(tài)閾值二值化,是指當(dāng)閾值的選擇不僅取決于該像素閾值以及周圍各像素的灰度值,還與該像素的坐標(biāo)位置有關(guān)系時被稱為為動態(tài)閾值選擇法[4]。
在手勢識別過程中,圖像處理是第一步,也是尤為重要的一步。圖像質(zhì)量的高低直接影響了手勢識別過程中的手勢分割和特征提取。本文在matlab軟件上對圖像進行不同濾波器和二值化的方法研究并進行了對比,取得了顯著的實驗成果,Wiener濾波對高斯噪聲效果更佳,中值濾波對椒鹽噪聲效果更佳,為下一步的手勢分割做好了樣本數(shù)據(jù)的提供。
[1]胡友樹.手勢識別技術(shù)綜述[J].中國科技信息,2005(02):42~41.
[2]梁娜.手勢識別中的圖像預(yù)處理技術(shù)研究[J].無線互聯(lián)科技,2015(01):161~162.
[3]顧立忠.基于表觀的手勢識別及人機交互研究[D].上海交通大學(xué),2008.
[4]吳彩芳,謝鈞,周開店.基于手勢識別的人機交互技術(shù)研究[J].計算機時代,2016(02):29~32.
TP391.4
A
1004-7344(2016)23-0275-01
2016-7-19