郭文靜 田星
摘 要 為了獲得較高的分類準(zhǔn)確率,建立支持向量機(jī)模型,并采用遺傳算法自動選擇最優(yōu)核函數(shù)參數(shù),提出基于遺傳算法優(yōu)化支持向量機(jī)的圖像識別方法。結(jié)果表明,該方法具有較優(yōu)的識別率,整體性能優(yōu)良。
【關(guān)鍵詞】遺傳算法 支持向量機(jī) 圖像識別
1 引言
在醫(yī)學(xué)中,獲得合格的X射線圖像的前提是獲得合適的曝光值,曝光不足或過度都會影響圖像質(zhì)量。X射線成像依賴于穿透人體的部分射線,由于個體組織結(jié)構(gòu)復(fù)雜性以及外在因素,導(dǎo)致選取合適的曝光值并不是容易的事,這樣就會影響X射線圖像的可用性。因此,準(zhǔn)確有效地識別曝光量有問題的圖片具有一定的研究意義,并對之后進(jìn)行圖像增強(qiáng)處理打好基礎(chǔ)。
2 相關(guān)概念
2.1 支持向量機(jī)
由于X射線圖像具有較強(qiáng)的非線性特性,維度較高,同時(shí)屬于小樣本學(xué)習(xí)問題,與傳統(tǒng)分類方法容易出現(xiàn)過學(xué)習(xí)現(xiàn)象相比,支持向量機(jī)在有限的樣本情況下具有很大優(yōu)勢,同時(shí)能在不增加計(jì)算量程度的基礎(chǔ)上通過選取合適的核函數(shù),將非線性問題反映到高維空間中,最終找到一個實(shí)現(xiàn)分類的最優(yōu)分類超平面,得到高維線性決策函數(shù),從而取代原函數(shù),因此具有較強(qiáng)的推廣能力。
2.2 基于遺傳算法優(yōu)化SVM模型參數(shù)
將遺傳算法應(yīng)用到優(yōu)化SVM參數(shù)是,算法過程如下:
(1)對其所輸入的圖像X射線,進(jìn)行分析處理,建立測試樣本與學(xué)習(xí)樣本。
(2)定義進(jìn)化最大代數(shù)MAXGEN=100,生成種群最大數(shù)量為SIZEPOP=20,SVM CV參數(shù)為10,代溝GGAP=0.9,指父代中有90%的個體被復(fù)制到子代,參數(shù)C和g的變化范圍為[0,100]。
(3)所生成的染色體即為初始種群。
(4)解碼每個染色體計(jì)算適應(yīng)度值。
(5)根據(jù)適應(yīng)度值選擇并復(fù)制個體進(jìn)而產(chǎn)生新種群。
(6)進(jìn)行遺傳操作。
(7)判斷結(jié)果,滿足需求則進(jìn)行下一步(8);判斷結(jié)果,不滿足需求返回步驟(4)。
(8)利用優(yōu)化的參數(shù)C和g建造新的SVM。
3 實(shí)驗(yàn)結(jié)果
3.1 圖像預(yù)處理
消除與算法無關(guān)的信息,并把源圖像二值化,設(shè)定閾值為0.4,如圖2所示。
截取最小區(qū)域圖像,并將其轉(zhuǎn)化成16x16標(biāo)準(zhǔn)化圖像。最后把這些16×16標(biāo)準(zhǔn)化圖像排成一個列向量,讓后轉(zhuǎn)置生成100個256的訓(xùn)練樣本矩陣。本文選取X射線圖像為測試樣本與訓(xùn)練樣本,其中,100幅訓(xùn)練樣本,分為曝光正確和曝光不正確的兩類,每類均有50幅,令另外的40幅作為測試樣本,每類分別20幅。
3.2 不同參數(shù)選擇方法的對比
本實(shí)驗(yàn)預(yù)先定義“曝光正確”圖像的標(biāo)簽是“1”。
“曝光不正確”圖像的標(biāo)簽是“2”進(jìn)行訓(xùn)練和測試。
圖3、4分別為參數(shù)粗略選擇結(jié)果圖和參數(shù)精確選擇結(jié)果圖;
圖3粗略得出圖格尋優(yōu)的選擇結(jié)果,C=0.082,g=0.027時(shí)對應(yīng)最佳準(zhǔn)確率,為99%;
圖4是在粗略選擇結(jié)果的基礎(chǔ)上將變化間隔縮小了一倍,進(jìn)一步得到精確化形象化的準(zhǔn)確率變化,得出取C=0.025,g=0.0625時(shí)對應(yīng)最佳準(zhǔn)確率,為99%。
圖5為測試集中時(shí)一個樣本的識別結(jié)果出現(xiàn)的偏差,將“2”預(yù)測成了“1”,測試集準(zhǔn)確率為97.5%。原因是實(shí)際圖像預(yù)測識別中,曝光不正確的圖像曝光程度,接近于曝光正確的圖像,所以混淆了SVM的識別,導(dǎo)致準(zhǔn)確率下降。
4 結(jié)束語
在網(wǎng)格尋優(yōu)法與遺傳算法對比之后,進(jìn)而提出基于遺傳算法優(yōu)化支持向量機(jī)的X射線圖像識別的方法,自動的選擇SVM參數(shù),解決了對性能有非常重要影響的核函數(shù)的參數(shù)確定問題,取得了較好效果,具有一定的實(shí)用價(jià)值。
參考文獻(xiàn)
[1]張建華,朱春華.基于遺傳算法和支持向量機(jī)的儲糧害蟲圖像識別[J],2010,38(17):8833-8834.
[2]VAPNIK V. The nature of statistical learning[M].New York:Springer,1995.
[3]吳琳琳.基于SVM技術(shù)的手寫數(shù)字識別的研究[D].山東師范大學(xué),2006.
作者簡介
郭文靜(1989-),女,山西省太原市人。碩士研究生學(xué)歷。助教。主要研究方向?yàn)槟J阶R別、超聲無損檢測。
作者單位
太原工業(yè)學(xué)院電子工程系 山西省太原市 030003