刁琦
摘 要:針對傳統(tǒng)稀疏編碼方法對圖像分類,本文采用SIFT算法提取的圖像特征,分類器主要通過構造多尺度小波核極限學習機進行圖像分類。采用該方法對wine數(shù)據(jù)集與微軟Corel1K圖像庫進行測試,實驗表明,較單尺度小波核,多尺度小波核具有更好的分類效果。同時,多尺度小波核極限學習機的分類性能優(yōu)于多尺度支持向量機、支持向量機與極限學習機的分類性能。
關鍵詞: 稀疏編碼;圖像分類;極限學習機;支持向量機
【Abstract】 According to the traditional sparse coding method for image classification, the image features extracted by SIFT algorithm are used in this paper. The classifier mainly constructs multi-scale wavelet kernel limit learning machine for image classification. This method is used to test the wine dataset and the Microsoft Corel1K image library. Experiments show that the multi-scale wavelet kernel has better classification effect than the single-scale wavelet kernel. At the same time, the classification performance of multi-scale wavelet kernel limit learning machine is better than that of multi-scale support vector machine, support vector machine and extreme learning machine.
【Key words】 ?sparse coding; image classification; extreme learning machine; support vector machine
0 引 言
稀疏編碼(Sparse Coding,SC)算法作為無監(jiān)督的學習方法之一,其使用基向量的線性組合方式(完備基)來描述圖像的輸入信息,且能夠提取較好的數(shù)據(jù)集特征,廣泛應用于圖像分類、圖像檢索、數(shù)據(jù)預測等問題。張立和等人[1]提出核拉普拉斯稀疏編碼,在分類效果上優(yōu)于拉普拉斯稀疏編碼;謝成軍等人[2]采用稀疏編碼金字塔模型對農田害蟲圖像進行識別,較傳統(tǒng)方法識別精度提高14.1%;張勇等人[3]提出一種非負彈性網稀疏編碼算法,較傳統(tǒng)的稀疏編碼算法的有效性更高,分類的效果更好;徐佳慶等人[4]提出基于二階矩空譜聯(lián)合稀疏編碼的遙感圖像分類方法,與支持向量機(Support Vector Machine,SVM)方法相比有較高的準確性。在分類方法上,SVM是一種常用的分類器[5]。滿瑞君等人[6]將多尺度小波支持向量機(Multi-scale wavelet SVM)應用于交通流數(shù)據(jù)的預測,指出該方法的預測準確性高于BP神經網絡和高斯SVM。隨著極限學習機(Extreme Learning Machine,ELM)的提出,也被研究者廣泛應用于圖像分類問題[7]。王杰等人[8]將小波核極限學習機(Wavelet ELM)應用于UCI圖像集分離,并指出WELM的分類性能優(yōu)于ELM。為此,本文將多尺度小波核函數(shù)(Multi-scale wavelet kernel)作為ELM的核函數(shù),以在測試集中獲得更好的分類效果。對此擬展開研究論述如下。
1 稀疏編碼描述
3 實驗結果與分析
首先,本文對Wine數(shù)據(jù)集進行測試。Wine數(shù)據(jù)集包含了3類葡萄酒數(shù)據(jù),共計178個樣本,每類葡萄酒有13個屬性特征。第一類訓練樣本為1~30,第二類訓練樣本為60~95,第三類訓練樣本為131~153,其余為測試樣本。分別對比單尺度、二尺度以及三尺度的分類性能。采用不同尺度小波核的分類結果見表1,采用文獻[6]獲得的分類精度為93.09%,這也表明采用多尺度小波核ELM分類性能優(yōu)于小波核ELM和小波核SVM。分類的具體情況如圖1所示。
其次,采用微軟Corelk圖像庫進行測試。其中,Corel圖像庫包含10類圖像,每類圖像為100張,共計1 000張圖像。方法實現(xiàn)中主要包括2部分,分別是:對圖像進行sift特征提取,圖像分類。每類圖像的分類精度見表2。
采用不同分類器方法的對比情況如圖2所示。從圖2中可看出,本文的分類精度要高于文獻[6]方法、SVM和ELM。對于buses與dinosaurs兩個類別,4種分類器的分類精度相同,主要由于這2類圖片背景較為簡單,對于復雜圖像的分類,多尺度小波核ELM具有較好的分類效果。
4 結束語
本次研究及實驗表明,多尺度小波核極限學習機具有較高的分類性能。由于核函數(shù)在分類問題方面具有較強的映射能力和非線性分類能力,但對于解決實際復雜背景及大規(guī)模圖像分類問題效果不佳,在實際應用中可采用多個核函數(shù)由組合形式來獲得更好的結果。
參考文獻
[1]張立和,潘磊,劉濤,等.基于核拉普拉斯稀疏編碼的圖像分類[J].大連理工大學學報,2015,55(2):192-197.
[2]謝成軍,李瑞,董偉,等.基于稀疏編碼金字塔模型的農田害蟲圖像識別[J].農業(yè)工程學報,2016,32(17):144-151.
[3]張勇,張陽陽,程洪,等.基于非負彈性網稀疏編碼算法的圖像分類方法[J].計算機工程,2017,43(7):239-243,249.
[4]徐佳慶,萬文,呂啟.基于二階矩稀疏編碼的高光譜遙感圖像分類[J].計算機科學,2018,45(9):288-293.
[5]吳園園,申立勇.基于類重疊度欠采樣的不平衡模糊多類支持向量機[J].中國科學院大學學報,2018,35(4):536-543.
[6]滿瑞君,梁雪春.基于多尺度小波支持向量機的交通流預測[J].計算機仿真,2013,30(11):156-159.
[7]HUANG Guangbin, ZHU Qinyu, SIEW C K. Extreme learning machine: Theory and applications[J].Neurocomputing,2006,70(1/3):489-501.
[8]王杰,郭晨龍.小波核極限學習機分類器[J].微電子學與計算機,2013,30(10):73-76,80.
[9]李兵,劉磊,魏志強.一種具有強實時性、強魯棒性的圖像匹配算法[J].軟件學報,2014,25(7):1583-1592.