黃金國
摘 要: 針對(duì)單節(jié)點(diǎn)的圖像分類算法效率低,實(shí)時(shí)性差的難題,提出基于云計(jì)算的圖像分類算法。首先提取圖像數(shù)據(jù)庫中的圖像分類特征;然后將待分類圖像通過云計(jì)算模式與圖像庫中的特征進(jìn)行匹配,并根據(jù)匹配結(jié)果將其劃分到相應(yīng)的類別中;最后采用UPenn和Caltech?101數(shù)據(jù)庫測試算法的可行性。結(jié)果表明,該算法降低了圖像分類的時(shí)間復(fù)雜度,取得了不錯(cuò)的圖像分類結(jié)果,且分類效率要明顯優(yōu)于對(duì)比算法,具有良好的實(shí)際應(yīng)用價(jià)值。
關(guān)鍵詞: 云計(jì)算; 海量圖像數(shù)據(jù)庫; 圖像分類器; 圖像特征
中圖分類號(hào): TN911.73?34; TP181 文獻(xiàn)標(biāo)識(shí)碼: A 文章編號(hào): 1004?373X(2017)05?0063?03
Abstract: Since the image classification algorithm for the single node has low efficiency and poor real?time performance, an image classification algorithm based on cloud computing is proposed. With the algorithm, the classification features of the images in the image database are extracted, and then the images under classification are matched with the feature in the image library by means of the cloud computing mode and divided into the corresponding classes according to the matching results. The databases of UPenn and Caltech?101 are used to test the feasibility of the algorithm. The results show that the algorithm has reduced the time complexity of image classification, obtained a good image classification result, its classification efficiency is obviously superior to the comparing algorithm, and has a certain practical application value.
Keywords: cloud computing; massive image database; image classifier; image feature
0 引 言
隨著數(shù)字圖像處理技術(shù)的不斷成熟,每天會(huì)產(chǎn)生大量的圖像,如何對(duì)這些海量圖像進(jìn)行準(zhǔn)確分類,從中找到對(duì)用戶有用的圖像至關(guān)重要,而且圖像分類是圖像檢索的基礎(chǔ),因此設(shè)計(jì)性能優(yōu)異的圖像分類算法具有十分重要的應(yīng)用價(jià)值[1?3]。
圖像分類實(shí)際是一個(gè)模式識(shí)別問題,根據(jù)相應(yīng)的特征和分類器將圖像歸屬到相應(yīng)的類別中,因此要獲得較高的圖像分類正確率,首先要提取能夠描述圖像類別信息的特征,當(dāng)前圖像分類的特征很多,如顏色、紋理、形狀等,這些特征均有各自的優(yōu)勢(shì)[4?5]。圖像分類中的第二個(gè)關(guān)鍵問題是圖像分類器的設(shè)計(jì),目前主要基于K近鄰、貝葉斯網(wǎng)絡(luò)、神經(jīng)網(wǎng)絡(luò)等。K近鄰分類的速度快[6?8],但分類精度低;貝葉斯網(wǎng)絡(luò)無法準(zhǔn)確描述圖像類別與特征之間的映射關(guān)系,分類結(jié)果的可信度低;神經(jīng)網(wǎng)絡(luò)的學(xué)習(xí)速度快,分類效果優(yōu)于其他方法,但最優(yōu)網(wǎng)絡(luò)結(jié)構(gòu)如何確定目前還沒有統(tǒng)一理論指導(dǎo),分類結(jié)果不穩(wěn)定[9]。隨著圖像數(shù)據(jù)庫規(guī)模不斷增加,圖像分類速度成為分類結(jié)果優(yōu)劣的一個(gè)重要評(píng)價(jià)指標(biāo),而目前主要采用單節(jié)點(diǎn)方式進(jìn)行圖像分類,當(dāng)樣本規(guī)模大時(shí),圖像分類的速度慢、效率低,無法滿足現(xiàn)代圖像分類的實(shí)際應(yīng)用要求[10]。
云計(jì)算技術(shù)包括分布式和網(wǎng)格計(jì)算優(yōu)點(diǎn),可以將許多節(jié)點(diǎn)組合在一起,產(chǎn)生一個(gè)功能強(qiáng)大的計(jì)算機(jī)系統(tǒng),為了加快規(guī)模圖像的分類速度,提出云計(jì)算的圖像分類算法,結(jié)果表明,本文算法降低了圖像分類的時(shí)間復(fù)雜度,分類效率高,具有一定的優(yōu)越性。
1 單節(jié)點(diǎn)的圖像分類原理
單節(jié)點(diǎn)的圖像分類算法的工作原理為:首先提取圖像數(shù)據(jù)庫中的圖像分類特征;然后將待分類圖像通過與圖像庫中的特征進(jìn)行匹配,并根據(jù)匹配結(jié)果將其劃分到相應(yīng)的類別中,具體如圖1所示。
2 基于云計(jì)算的圖像分類算法
2.1 提取圖像的顏色特征
2.3 云計(jì)算的圖像分類算法工作步驟
Step1:收集大量各種類型的圖像,提取每一種圖像的顏色特征,并采用式(10)進(jìn)行歸一化處理,然后將特征保存到圖像數(shù)據(jù)庫中。
[x′ik=xik-minximaxxi-minxi] (10)
Step2:對(duì)待分類的圖像進(jìn)行特征提取和歸一化處理。
Step3:在單點(diǎn)上將待分類圖像特征與圖像數(shù)據(jù)庫中的特征進(jìn)行匹配,得到相應(yīng)的分類結(jié)果。
Step4:將每一個(gè)單點(diǎn)的分類結(jié)果輸入到reducer進(jìn)行融合。
Step5:根據(jù)融合結(jié)果得到最終的圖像類別。
3 仿真測試
3.1 實(shí)驗(yàn)環(huán)境
在Linux平臺(tái)下,采用1個(gè)主節(jié)點(diǎn)和20個(gè)工作節(jié)點(diǎn)組成一個(gè)云計(jì)算,其中20個(gè)工作節(jié)點(diǎn)的配置相同,選擇文獻(xiàn)[10]的圖像分類算法進(jìn)行對(duì)比實(shí)驗(yàn),采用正確率和分類時(shí)間對(duì)分類結(jié)果進(jìn)行衡量。實(shí)驗(yàn)環(huán)境的參數(shù)設(shè)置見表1。
選擇UPenn圖像庫和Caltech?101圖像庫作為仿真實(shí)驗(yàn)對(duì)象,將全部圖像歸一化為256×256個(gè)像素,UPenn和Caltech?101圖像庫中的部分圖像如圖4所示。
3.2 結(jié)果與分析
采用本文的圖像分類算法和對(duì)比算法對(duì)UPenn圖像庫和Caltech?101圖像庫進(jìn)行仿真測試,統(tǒng)計(jì)它們的分類結(jié)果,得到分類正確率和分類時(shí)間如圖5和圖6所示,對(duì)圖5和圖6的實(shí)驗(yàn)結(jié)果進(jìn)行分析,可以得到如下結(jié)論:
(1) 本文算法的平均分類正確率要高于對(duì)比算法,這是因?yàn)楸疚乃惴ㄒ肓俗钚《酥С窒蛄繖C(jī)建立圖像分類器,可以更好地反映圖像類別與特征之間的聯(lián)系,得到十分理想的圖像分類結(jié)果。
(2) 與對(duì)比的圖像分類算法相比,本文算法的平均分類時(shí)間相對(duì)更少,大幅度加快了圖像的分類速度,這主要是因?yàn)楸疚牟捎肕ap/Reduce工作模式,使各個(gè)節(jié)點(diǎn)可以并行運(yùn)行圖像分類算法,降低了圖像分類的計(jì)算時(shí)間復(fù)雜度,應(yīng)用范圍更廣。
4 結(jié) 語
當(dāng)前圖像庫具有海量等特點(diǎn),而單一節(jié)點(diǎn)的性能提高有限,導(dǎo)致圖像分類速度慢,為了加快圖像的分類速度,提出了云計(jì)算的圖像分類算法。該算法首先設(shè)計(jì)單個(gè)節(jié)點(diǎn)的圖像分類算法;然后將圖像分類任務(wù)劃分為多個(gè)子任務(wù),每一個(gè)子任務(wù)在單節(jié)點(diǎn)并行執(zhí)行圖像分類,減少圖像分類時(shí)間;再將全部單節(jié)點(diǎn)的圖像分類結(jié)果進(jìn)行融合,在UPenn圖像庫和Caltech?101圖像庫上的實(shí)驗(yàn)結(jié)果表明,本文算法不僅獲得了理想的圖像分類結(jié)果,分類的效率也明顯得到改善,而且可以滿足圖像的在線、實(shí)時(shí)性要求,具有廣泛的應(yīng)用前景。
參考文獻(xiàn)
[1] LU D, WENG Q. A survey of image classification methods and techniques for improving classification performance [J]. International journal of remote sensing, 2007, 28(5): 823?870.
[2] 邢曉芬,徐向民,黃曉泓,等.基于內(nèi)容的醫(yī)學(xué)圖像分類研究[J].科學(xué)技術(shù)與工程,2007,7(1):85?90.
[3] 董立巖,苑森森,劉光遠(yuǎn),等.基于貝葉斯分類器的圖像分類[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2007,45(2):249?253.
[4] 韓冰,楊辰,高新波.融合顯著信息的LDA極光圖像分類[J].軟件學(xué)報(bào),2013,24(11):2758?2766.
[5] 劉越,彭宏京,錢素靜,等.基于核拉普拉斯稀疏編碼模型的圖像分類[J].模式識(shí)別與人工智能,2014,27(10):915?920.
[6] 余萍,趙繼生.基于線性疊加特征和CNNS的圖像分類方法[J].微電子學(xué)與計(jì)算機(jī),2015,32(10):36?40.
[7] 朱志賓,丁世飛.基于TWSVM的圖像分類[J].南京師大學(xué)報(bào)(自然科學(xué)版),2014,37(3):8?14.
[8] 劉尚旺,李名,胡劍蘭,等.基于視覺顯著性檢測的圖像分類方法[J].計(jì)算機(jī)應(yīng)用,2015,35(9):2629?2635.
[9] 祝軍,趙杰煜,董振宇.融合顯著信息的層次特征學(xué)習(xí)圖像分類[J].計(jì)算機(jī)研究與發(fā)展,2014,51(9):1919?1928.
[10] 倪鵬,黃蔚,呂巍,等.基于Zernike矩特征的FCM?RBF神經(jīng)網(wǎng)絡(luò)圖像分類器[J].吉林大學(xué)學(xué)報(bào)(理學(xué)版),2014,52(6):1284?1288.