祁國平,吳朝潤
(中北大學,山西太原 030051)
近年來國內(nèi)外對人臉識別、指紋識別方面的技術(shù)研究取得了一定的進展,然而在人體行為識別與理解方面進展不大,使得人體行為識別算法的研究仍然是當前國內(nèi)外研究的熱點之一。研究人體行為識別的重點是特征提取和理解。人體行為識別要對人的某一行為進行特征提取,然后根據(jù)肢體的位置以及其之間的角度等與模板進行匹配。
本文采用傅里葉變換及其逆變換實現(xiàn)特征提取和選擇;sobel算子來實現(xiàn)圖像的處理——圖像銳化;最大最小距離算法實現(xiàn)分類識別。并用Matlab7.0編寫程序來實現(xiàn)。在Matlab7.0中實現(xiàn)對彎腰這一動作的識別,主要用到傅里葉變換及逆變換,sobel算子,對從彩色圖像的十字和矩陣以及最大最小距離算法實現(xiàn)分類識別[1]。
本文采用傅里葉變換及其逆變換實現(xiàn)特征提取和選擇,sobel算子來實現(xiàn)圖像的處理——圖像銳化,最大最小距離算法實現(xiàn)分類識別。具體原理如圖1:
圖1 分類識別原理
圖像去噪就是抑制圖像的噪音部分,圖像增強是增強圖像的邊緣,以獲得更好的顯示效果,這就需要增加圖像的高頻分量[2]。常見的圖像增強方法有對比度拉伸,直方圖均衡化,圖像銳化等。本文采用sobel算子進行圖像銳化。
Sobel算子是濾波算子的形式,用于提取邊緣,可以利用快速卷積函數(shù),圖像的每一個像素的橫向及縱向梯度近似值可用以下的公式結(jié)合,來計算梯度的大小。
特征提取與選擇是對原始數(shù)據(jù)進行變換,得到最能反映分類本質(zhì)的特征,是由維數(shù)較高的測量空間到維數(shù)較低的特征空間[3]。本文中采用的是二維到一維的傅里葉變換以及三維到一維的傅里葉變換。二維到一維傅里葉計算Matlab實現(xiàn)如下:
把彩色十字:從圖像中提取RGB水平線條和垂直線的部分疊加到圖像的RGB彩色十字區(qū)Matlab中的函數(shù)及解釋:
chWidth:十字寬;
chHeight:十字高度;
lineWidth:十字的線條寬度;
chWidth,chHeight和lineWidth必須是單數(shù)!
chColor:3元向量[RGB]定義的十字線顏色的R,G和B分量;
R,G&B元素可以有任何值范圍[0,255];輸出圖像的類型是RGB。
把彩色矩陣:繪制頂線,左線,底線,右線。matlab函數(shù)及解釋如下:
rgbImg=putColorRectangle(img,TLi,TLj,BRi,BRj,lineWidth,color)
IMG:給定的圖像
lineWidth:十字的線條寬度
chColor:3元向量[RGB]定義的R,G和B組成部分
矩形的R,G,&B元素的顏色可以有任何值范圍[0,255];輸出圖像的類型是RGB。
本文采用最大最小距離算法來實現(xiàn)分類判別,具體算法步驟:(1)選任意一個模式樣本作為第一個聚類中心 Z1;(2)選距離Z1最遠的樣本作為第二個聚類中心Z2;(3)逐個計算各模式樣本{xi,i=1,2,…,N}與{Z1,Z2}之間的距離,并選出其中的最小距離min(Di1,Di2);(4)在所有模式樣本的最小值中選出最大距離,若該值達到‖Z1-Z2‖的一定比例以上,則相應的樣本點取為第三聚類中心 Z3;(5)重復以上步驟直到所有模式樣本都分類[4]。
本文中的一些關(guān)于視頻操作的函數(shù)及其用法如下:aviinfo函數(shù)返回有關(guān)音頻/視頻交錯(AVI)文件的信息。file info=aviinfo(filename);Aviread函數(shù)讀取音頻/視頻交錯(AVI)文件。mov=aviread(filename,index);
Avifile函數(shù)創(chuàng)建一個新的音頻/視頻交錯(AVI)文件。
avifile(filename,'PropertyName',value,'PropertyName',value,...);
Imwrite函數(shù)寫入圖像圖形文件。imwrite(A,filename,fmt)
本文僅就彎腰這一動作進行視頻采集以及識別,并用matlab7.0實現(xiàn)。
圖2 行為采取結(jié)果
圖3 骨架提取結(jié)果
圖4 行為匹配結(jié)果
matlab7.0在圖像銳化,特征提取分類匹配上基本實現(xiàn)了對彎腰這一動作的識別。
本文對視頻中的行為圖像進行特征提取,sobel算子圖像銳化,并對視頻進行了行為提取和骨架提取及匹配,基本實現(xiàn)了行為的識別,Matlab在智能的實現(xiàn)上不太理想,以后在這方面進行改進,希望能實現(xiàn)模式識別、Matlab、人工智能的良好結(jié)合。對人體的行為識別可以應用于智能游戲機,玩家可以站在屏幕前,機器對玩家的動作進行識別,從而讓玩家身臨其境進入游戲場景。還可以對存在安全隱患的地方通過對攝像頭里人物行為識別提前提出警報。
[1]許志影,李晉平.MATLAB及其在圖像處理中的應用[J].計算機與現(xiàn)代化,2003(4):32-36.
[2]仇成群.MATLAB在汽車牌照圖像處理識別系統(tǒng)中的應用[J].儀器儀表用戶,2008(6):57-59.
[3]張艷群,孟凡榮.MATLAB在圖像邊緣檢測中的應用[J].計算機應用研究,2004(6):23-26.
[4]潘仲明.MATLAB環(huán)境下目標圖像的實時辨識方法[J].國防科技大學學報,2002(1):102-106.