左亞靈
三、訓(xùn)練及結(jié)果分析
本課題中選用的醫(yī)學(xué)圖像數(shù)據(jù)為乳腺X線圖像,全部示例圖像均來自MIAS圖像庫,該圖像庫中包含322張乳腺X線圖像,并分為三大類:正常、良性和惡性(異常),其中正常的208例,良性63例,惡性51例,后兩類都劃分為不正常。本課題中只分為“正常”和“異?!眱深?,良性和惡性都?xì)w為“異?!鳖愔?。
本文采用10重交叉驗(yàn)證的方法,將數(shù)據(jù)庫中的全體圖像隨機(jī)分為十份,其中一份用作測試集,另外九份用作訓(xùn)練集,依次輪換,直到每份樣本都做了一次測試集,即進(jìn)行了十次訓(xùn)練和預(yù)測。實(shí)驗(yàn)結(jié)果如右圖所示,最終平均分類精度為79.2%。本實(shí)驗(yàn)中的支持向量機(jī)雖然證明了其可行性,但從結(jié)果來看,不僅準(zhǔn)確度不夠高,實(shí)驗(yàn)過程中最高精確度與最低精度相差也比較大,表明分類器的穩(wěn)定性還不夠,猜測可能與隨機(jī)分類中圖片分類分組也有一定關(guān)系,在進(jìn)一步研究中可對(duì)其分組分類進(jìn)行記錄,來研究其中的關(guān)系。
四、結(jié)束語
基于本文中的實(shí)驗(yàn)方法,還可以在此基礎(chǔ)上從以下方面進(jìn)行改進(jìn),以提高精確度。
(1)本課題是在考慮SVM適用于小樣本訓(xùn)練的前提下進(jìn)行的,但如果用于大量樣本的實(shí)驗(yàn)訓(xùn)練,則空間復(fù)雜度和時(shí)間復(fù)雜度也會(huì)大大增加。
(2)現(xiàn)已有多種基于提高識(shí)別率的優(yōu)化算法,但如果要進(jìn)一步優(yōu)化分類算法,還應(yīng)考慮提高訓(xùn)練速度。
此外,以上兩點(diǎn)的結(jié)合以及最終問題就是增量學(xué)習(xí)和在線學(xué)習(xí)。無論什么樣的算法,都不能直接保證其在任何時(shí)間地點(diǎn)都能進(jìn)行百分之百準(zhǔn)確的運(yùn)算,但是如果用于應(yīng)用中不斷學(xué)習(xí)的在線學(xué)習(xí),則可以使準(zhǔn)確率無限接近于百分之一百,這是比現(xiàn)有算法都要更加實(shí)用的小樣本分類算法。
參考文獻(xiàn):
[1]田 捷,包尚聯(lián),周明全.醫(yī)學(xué)影像處理與分析[M].北京:電子工業(yè)出版社,2003.
[2]Ma J,Theiler J,Perkins S.Accurate online support vector regression[J].Neural Computation,2003(11).
[3]汪 輝.增量型支持向量機(jī)回歸訓(xùn)練算法及在控制中的應(yīng)用[D].杭州:浙江大學(xué),2006.