孟金龍++丁超洋++周慧++呂爽
摘要:互聯(lián)網(wǎng)技術(shù)的飛速發(fā)展,使我們通過電子產(chǎn)品接觸到大量的圖像信息,開闊了我們的眼界,然而對于層出不窮的各種各樣的圖像,帶給我們的不僅是豐富多彩的世界,還有對未知事物的疑惑,因此需要計算機具有理解圖像的能力并且能自動把圖像正確地分類。針對以上問題,本文提出了一個基于支持向量機(SVM)算法的圖片分類方法,此方法結(jié)合圖片的梯度直方圖(HOG)特征,經(jīng)過計算機學習訓練,生成可以用來分類圖像的分類器。
關(guān)鍵詞:機器學習;圖像分類;支持向量機
中圖分類號:TP319 文獻標識碼:A 文章編號:1007-9416(2017)10-0123-02
1 支持向量機
支持向量機(support vector machine)是將一堆數(shù)據(jù)分成兩個不同類別樣本的二類分類模型,用其將訓練樣本分類后,與分類面平行并且離分類面最近的樣本面上的訓練樣本就叫做支持向量(Support Vector)。分類是數(shù)據(jù)挖掘中及其重要的一步,而支持向量機就是基于學習理論的一種機器學習方法,對于每一個單一的數(shù)據(jù)svm根據(jù)它的特征向量去判斷它的標簽以此來確定樣本的類別,并在此過程中提高學習機泛化能力,獲得良好的分類結(jié)果。
2 SVM的基本思想
(1)最優(yōu)分類面。要使支持向量機有良好的分類效果就需要找到一個最優(yōu)分類面,使其在兩類樣本之間并且兩類樣本中離它最近的點都盡可能的離它遠。因為測試集上我們觀測到的數(shù)據(jù)與真實分布式有一定誤差的,如果誤差過大,分割面就會將訓練樣本類別分割錯誤,而最優(yōu)分類面的誤差容忍力士最強的。如圖1所示,通過算法找到了最優(yōu)的H1和H2,這就是我們訓練出來的SVM。(2)核函數(shù)。在實際中,我們可以通過將空間映射到高維度來分類非線性數(shù)據(jù),然而這種映射會出現(xiàn)很多新的維度從而帶來大量的工作,而核函數(shù)可以用它們的點積來進行分類,內(nèi)核通常是線性的,而如果使用非線性內(nèi)核,我們只需要改變點積就可以得到一個非線性分類器,避免資源的消耗的同時能使分類操作更具靈活性和可操作性。
3 方向梯度直方圖特征
方向梯度直方圖(Histogram of Oriented Gradient),縮寫為HOG,它先計算圖像局部區(qū)域不同方向上梯度的值,并累積,得到直方圖從而構(gòu)成在計算機圖像處理中用來進行物體檢測的特征描述子。是目前計算機識別領(lǐng)域常用的描述圖像局部紋理的方法。
HOG的中心思路:所檢測的局部物體外形能夠被光強梯度或邊緣方向的分布描述。
具體實現(xiàn):
(1)先將圖像劃分為小的細胞單元,并采集個像素點的梯度或邊緣的方向直方圖,組合構(gòu)成特征描述器。(2)確定一個更大范圍,計算各個直方圖在該范圍區(qū)間的密度a,然后根據(jù)a來對該范圍內(nèi)的細胞單元做歸一化從而獲得更好的效果。
由于HOG操作的是細胞單元,空間領(lǐng)域較小,因此不會對圖像幾何和光學的形變有太大的影響,而且得到的直方圖就可以作為特征輸入到分類器中。
4 圖像分類
圖像分類算法流程圖如圖2所示。
首先收集足夠多的樣本,讓程序讀取正、負樣本圖片并計算正負樣本圖像的HOG描述子,對正負樣本賦予樣本標簽,將HOG特征、樣本標簽均輸入到SVM中進行訓練,最后生成分類器。將包含待分類圖片輸入到訓練好的SVM分類器中,分類器通過比對Hog將圖片分為A、B兩類,達到圖像分類的算法。
5 結(jié)語
豐富多彩的圖像已經(jīng)成為人們信息交流的一種必要方式,同時圖像所傳達的信息也會根據(jù)識別人的理解不同而發(fā)生改變,使得檢索十分困難。利用機器學習的有關(guān)知識結(jié)合SVM和HOG特征完成圖像的分類,有效的解決了該問題。它能夠快速地從多種特征中找到對分類最有效的那一項,幫助用戶識別并分類圖像,給用戶以方便。
參考文獻
[1]張瑜慧,胡學龍,陳琳.基于支持向量機的圖像分類[J].揚州大學學報(自然科學版),2007,(02):46-49.
[2]茍博,黃賢武.支持向量機多類分類方法[J].數(shù)據(jù)采集與處理,2006,(03):334-339.
[3]汪慧蘭,趙海峰,羅斌.基于局部顏色空間特征的圖像檢索[J].計算機技術(shù)與發(fā)展,2006,(01):76-79.endprint