梁俊花,孫興華,葉永飛,劉乃迪,張 曉
(河北北方學(xué)院信息科學(xué)與工程學(xué)院,河北 張家口 075000)
基于雙尺度分解和模糊熵測量的特征選擇算法
梁俊花,孫興華,葉永飛,劉乃迪,張 曉
(河北北方學(xué)院信息科學(xué)與工程學(xué)院,河北 張家口 075000)
針對當(dāng)前樹葉識別算法缺乏足夠的魯棒性和可區(qū)分度,提出一種雙尺度分解和模糊熵測量的特征選擇算法。首先采用自適應(yīng)提升小波(ALW)和不同尺度高斯濾波的雙尺度算法,然后根據(jù)中心對稱的局部二進制描述算子(CS-LBP)提取形狀和紋理特征,最后由模糊熵測量法(FESM)重新分配各個尺度的比例。實驗結(jié)果說明算法具有較高的識別率和噪聲容忍度。
自適應(yīng)提升小波;CS-LBP;模糊熵
樹葉識別在農(nóng)業(yè)信息化、生態(tài)保護和自動樹葉識別系統(tǒng)中發(fā)揮著重要的作用。目前常見的分類算法主要結(jié)合形態(tài)解剖學(xué)、細(xì)胞生物學(xué)、分子生物學(xué)和植物化學(xué)法,這些基于樹葉生物特征性質(zhì)的方法需要復(fù)雜的處理過程,不適用于在線的應(yīng)用。近年,基于樹葉圖像的植物識別吸引了學(xué)者們的目光[1]。它可以從生物中直接提取植物特征,適合在線的識別應(yīng)用。
早期的樹葉識別方法聚焦于樹葉圖像的形狀特征[2],這些方法使用邊緣檢測算子或現(xiàn)有的邊緣檢測方法來提取樹葉的輪廓,對具有明顯不同輪廓的樹葉圖像取得了較好的識別性能,但是對噪聲非常敏感。事實上,有很多不同的植物品種具有相似的樹葉輪廓,而且同種植物也會有不同的樹葉形狀。因此,這類方法對樹葉識別應(yīng)用的辨別率不是很高。
為了改進上述方法,部分學(xué)者提出將樹葉輪廓的形態(tài)特征和區(qū)域特征結(jié)合的方法[3]。類似的方法還有流形算法、改進的最大平面準(zhǔn)則算法等,這些方法在分類識別率上有明顯的提高,但是魯棒性和可區(qū)分性不是很強。
實際上,除了樹葉輪廓,紋理在樹葉圖像中也是一個非常重要的特征。受此啟發(fā),本文將植物樹葉圖像中的紋理與輪廓結(jié)合應(yīng)用于特征選擇中。Sweldens設(shè)計的提升格式小波變換繼承了經(jīng)典小波變換的多分辨分析特性,又具有原位計算、低計算成本和易于硬件實現(xiàn)的性質(zhì)。提升方案將小波變換分為預(yù)測和更新階段,為不同應(yīng)用的自適應(yīng)小波變換提供了靈活的設(shè)計空間,出現(xiàn)了很多關(guān)注不同信號特征的自適應(yīng)提升小波變換[4]。
本文提出了雙尺度分解和模糊熵相似性測量的特征選擇算法。該方法將預(yù)處理的樹葉圖像由自適應(yīng)提升小波分解為一系列子帶,每個子帶與不同尺度的高斯濾波卷積,在子帶域中提取樹葉圖像的形狀和紋理特征,最后由模糊熵相似性測量法重新分布每個尺度對整體特征的貢獻度。實驗結(jié)果表明,這種特征選擇方法明顯優(yōu)于近期的樹葉識別方法。
2.1 雙尺度圖像分解
圖1 自適應(yīng)提升小波方案
雙尺度圖像分解包含兩個階段:第一由自適應(yīng)提升小波將樹葉圖像分解成一系列子帶,該階段主要考慮攜帶重要紋理與輪廓信息的間斷點;第二將每一個子帶與不同尺度的高斯濾波卷積,進一步提高噪聲容忍度。
結(jié)合樹葉圖像的局部特征,本文選用的自適應(yīng)提升小波對圖像紋理的間斷點作了特殊處理[5],如圖1所示:
x′(n,m)=x(n,m)?PnmUPnm(yh(n,m),yv(n,m),yd(n,m))
(1)
其中Pnm是二值映象判決器D的判決結(jié)果,對應(yīng)二進值數(shù)0和1。更新操作UPnm和加操作?Pnm的運算法則如下:
(2)
(3)
其中,σ(n,m)為x(n,m)的八個鄰域像素與其均值的梯度,T為選定的閾值。
(4)
(5)
由于樹葉圖像的間斷點在識別中起非常重要的作用,該方案對平滑區(qū)域與非光滑區(qū)域作不同的處理。噪聲和其它干擾引起的孤立點會影響樹葉識別的效果,自適應(yīng)提升小波方案可通過設(shè)定不同的閾值來平滑濾除這些奇異點。
為了將樹葉圖像中的主紋、微小細(xì)紋分裂成不同的結(jié)果,本文將小波分解的子圖由一系列不同尺度的高斯濾波進行第二階段的分解:
(6)
其中μ是均值,σ代表標(biāo)準(zhǔn)差,本文分別選取μ=0和σ=15,σ=1,σ=0.05。
2.2 中心對稱的局部二進制描述符
局部二進制模式(LBP)最初應(yīng)用于紋理分類,由于具有較強的魯棒性、計算簡單和較高的分辨度,成功擴展到機器視覺問題中[6]。但是傳統(tǒng)的LBP描述符容易產(chǎn)生較多的維數(shù),例如對于8像素的鄰域,LBP的維數(shù)為256(28)。并且隨著像素值的增大,維數(shù)成指數(shù)增長。為了克服這一缺點,更有效地描述圖像感興趣區(qū)域的紋理特征,本文采用中心對稱的局部二進制模式(CS-LBP),數(shù)學(xué)表述如下:
(7)
其中,ni和ni+n/2是在半徑為R的圓環(huán)上關(guān)于中心對稱的N個像素灰度值。明顯看出,應(yīng)用CS-LBP后特征維數(shù)減半,降低到16(24)。
2.3 模糊熵相似性測量
由于不同尺度空間對特征識別的貢獻度不同,本文引用模糊熵相似性測量的方法分析不同尺度空間的權(quán)重[7]。模糊集的特殊性在于引用了隸屬度的概念,將模糊集與香農(nóng)的概率熵結(jié)合,得到模糊熵定義:
(8)
其中,uA(xi)是模糊值,并且0 應(yīng)用模糊熵算法的具體步驟為: (1)計算標(biāo)準(zhǔn)矢量vj=(-vj(f1),…,vj(ft)),其中j代表樣本種類,f代表樣本種類j的特征,t代表這些特征的數(shù)目。vj可以通過廣義平均值進行求解: (9) 其中,#Xj是屬于j的總樣本數(shù),m=1。 (2)計算未知集合與前一步建立的標(biāo)準(zhǔn)矢量之間的相似程度S (10) 其中,x,v∈[0,1]t,p是廣義Lukasiewicz結(jié)構(gòu)中的參數(shù),wr為權(quán)值,不同的權(quán)值重要性不同,此處wr=1。 (3)將相似值代入公式(8),得到對應(yīng)的模糊熵H。本文將熵值分為3部分,即雙尺度分解算法得到的特征。 (4)計算每一部分在總體中占的比例系數(shù)Cm。Cm由下面公式求解: (11) 這里N為所有特征的數(shù)目,Km為第m層分解的特征個數(shù)。由模糊熵定義可看出,熵值越接近0.5,所包含的信息量越小。由此,本文將熵值大的特征賦予較小的比例系數(shù),熵值小的特征賦予較大的比例系數(shù)。即強調(diào)重要特征,弱化次要特征。 (5)將每個尺度特征乘以對應(yīng)的比重系數(shù)C,得到最終選擇的分類識別特征。 3.1 算法流程 算法流程如圖2。首先將預(yù)處理的樹葉圖像由雙尺度法分解為一系列的不同級數(shù)S不同尺度σ的子圖,根據(jù)模糊熵相似性測量方法計算雙尺度域中不同尺度的權(quán)重,得到新的樹葉圖像特征,最后由對應(yīng)的相似性分類器完成識別。 圖2 本文算法流程 3.2 參數(shù)選擇 在雙尺度算法中,高斯濾波器的標(biāo)準(zhǔn)差σ以及CS-LBP模式中閾值的選擇如表1所示。 表1 雙尺度參數(shù) 采用相似性分類器,延續(xù)模糊熵相似性測量的算法思想,公式中P與M由不同的實驗背景決定。 3.3 實驗分析 算法仿真實驗采用ICL植物樹葉數(shù)據(jù)庫。該庫來源于中國科學(xué)院智能機器研究所,共包含221種植物近20 000幅樹葉圖像。這些樣本圖是在不同時期采集的,具有不同的方向、尺寸和自然光照。 為了驗證本文算法的正確率,本次實驗從ICL植物樹葉圖像中隨機選取每個植物的20幅圖像,形成4 420幅樹葉圖片。每幅圖像的前5幅作為訓(xùn)練樣本,其余為測試。本文算法與模糊整形算法[8]、基于形狀的算法[9]、形態(tài)學(xué)方法[10]和最大平面法則算法[11]的分類率列于表2。從表中可明顯看出本文算法優(yōu)于其他方法。 本文算法的噪聲容忍度在兩種常見的噪聲圖像上進行,將第一次實驗中的圖像分別感染均值為零、方差σ=0.01的高斯噪聲和密度為0.05的椒鹽噪聲,對應(yīng)數(shù)據(jù)集A和數(shù)據(jù)集B。在每個數(shù)據(jù)集上的分類識別率對比列于表3。表3可以看出,所有算法的識別率在感染噪聲之后都有所下降。但是本文算法的下降率是最小的,最大平面準(zhǔn)則算法下降幅度最大。 表2 相關(guān)方法正確識別率比較(%) 表3 在數(shù)據(jù)集A與B上的正確識別率對比 本文提出一種雙尺度與相似性測量的樹葉識別算法,工作的亮點是:第一,提出了一種新的聯(lián)合目標(biāo)紋理與形狀的特征提取算法;第二,提出了一種基于模糊相似的特征優(yōu)化方法。通過在ICL植物樹葉庫上的對比實驗,說明本文算法具有較高的分類識別率和噪聲容忍度。 [1]CopeJS,CorneyD,ClarkJY,etal.Plantspeciesidentificationusingdigitalmorphometrics:Areview[J].ExpertSystAppl,2012,39:7562-7573. [2]AbbasiS,MokhtarianF,KittlerJ,Reliableclassificationofchrysanthemumleavesthroughcurvaturescalespace[A].in:InternationalConferenceonScale-SpaceTheoryinComputerVision[C].Netherlands,1997:284-295. [3]王曉峰,黃德雙.葉片圖像特征提取與識別技術(shù)的研究[J].計算機工程與應(yīng)用,2006,(03):190-193. [4]SweldensW.TheLiftingScheme:Acustom-designconstructionofbiorthogonalwavelets[J].ApplCompHarmAnal,1996,3(15):186-200. [5]WangX,LiangJH,WangMZ.On-linefastpalmprintidentificationbasedonadaptiveliftingwaveletscheme[J].KnowlBasedSyst,2013,42:68-73. [6]OjalaT,PietikinenM,HarwoodD.Acomparativestudyoftexturemeasureswithclassificationbasedonfeatureddistribution[J].PatternRecogn.1996,29(01):51-9. [7]DeLucaA,TerminiS.Adefinitionofnon-probabilisticentropyinsettingoffuzzysettheory[J].InformControl,1971,20:301-312. [8]WangZ,ChiZ,FengD,Fuzzyintegralforleafimageretrieval[J].ProcFuzzySyst,2002,1:372-377. [9]LingH,JacobsDW.Shapeclassificationusingtheinnerdistance[J].IEEETransPatternAnalMachIntell,2007,20:286-299. [10]ZhangSW,LeiYK.Modifiedlocallylineardiscriminantembeddingforplantleafrecognition[J].Neurocomp,2011,74:2284-2290. [11]LiHF,JiangT,ZhangKS.Efficientandrobustfeatureextractionbymaximummargincriterion[J].IEEETransactNeuralNetworks,2006,17(01):157-165. [責(zé)任編輯:王榮榮 英文編輯:劉彥哲] Feature Extraction Based on Dual-Scale Decomposition and Fuzzy Entropy Measurement LIANG Jun-hua,SUN Xing-hua,YE Yong-fei,LIU Nai-di,ZHANG Xiao (School of Information Science and Engineering,Hebei North University,Zhangjiakou,Hebei 075000,China) To improve the poor robustness and distinguishment for leaf recognition,a novel dual-scale decomposition and fuzzy entropy measurement algorithm is proposed.Firstly,the input leaf images are decomposed by adaptive lifting wavelet into several subbands,then each subband is filtered by a group of variable-scale Guassian filtered.Then CS-LBP is applied to extract shape and textural features.Lastly,the fuzzy entropy measurement is utilized to redistribute the proportion of each scale.The experimental results demonstrate that the algorithm has higher recognition rate and noise tolerance. adaptive lifting wavelet;CS-LBP;fuzzy entropy 河北省教育廳重大項目(ZD20131085);河北北方學(xué)院重大課題(ZD201301) 梁俊花(1985-),女,山西文化人,助教,碩士。 張曉,教授,碩士。 TP 311 A 10.3969/j.issn.1673-1492.2015.04.008 來稿日期:2015-04-033 算法仿真
4 結(jié) 論