• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于粗糙集和支持向量機(jī)的腫瘤圖像識(shí)別

      2014-08-18 01:41:11張海燕藍(lán)集明
      關(guān)鍵詞:特征值共生灰度

      張海燕, 藍(lán)集明

      (四川理工學(xué)院a.理學(xué)院; b.計(jì)算機(jī)學(xué)院, 四川自貢643000)

      基于粗糙集和支持向量機(jī)的腫瘤圖像識(shí)別

      張海燕a, 藍(lán)集明b

      (四川理工學(xué)院a.理學(xué)院; b.計(jì)算機(jī)學(xué)院, 四川自貢643000)

      設(shè)計(jì)了一種基于粗糙集與支持向量基的乳腺腫瘤圖像識(shí)別方法。其基本思想是首先對(duì)圖片進(jìn)行降噪預(yù)處理,接著提取紋理和形狀特征構(gòu)成表征醫(yī)學(xué)圖像的特征矢量,然后將特征離散歸一化處理,再用粗集方法進(jìn)行特征屬性約簡(jiǎn),最后利用支持向量基進(jìn)行識(shí)別。結(jié)果表明,該方法取得了比較理想的識(shí)別效果。

      醫(yī)學(xué)圖像;腫瘤識(shí)別;粗糙集;支持向量機(jī);特征提取;屬性約簡(jiǎn)

      引言

      隨著計(jì)算機(jī)可視化技術(shù)和醫(yī)學(xué)影像學(xué)的不斷發(fā)展,現(xiàn)在已經(jīng)能夠?yàn)榧膊〉臋z驗(yàn)提供多種醫(yī)學(xué)影像,包括計(jì)算機(jī)斷層掃描(CT)、正電子放射層析成像技術(shù)(PET)、單光子輻射斷層攝像(SPECT)、磁共振成像(MR)、超聲(Ultrasound)及其它醫(yī)學(xué)影像設(shè)備所獲得的圖像。這些圖像雖然能夠提供大量有用的信息,但是由于圖像生成機(jī)理的原因,圖像中往往包含了許多噪聲,使得圖像的質(zhì)量不高,再加上診斷醫(yī)師的視覺疲勞等因素,可能會(huì)造成誤診。因此,如何充分利用上述圖像中所包含的有用信息,降低誤診率,仍然是醫(yī)學(xué)界的一個(gè)難題。

      本文借助現(xiàn)代圖像處理技術(shù),并結(jié)合人工智能、模式分類等算法,提出了基于粗集(Rough Sets)理論與支持向量機(jī)(SVMs)的醫(yī)學(xué)影像識(shí)別方法,可用來識(shí)別某一乳腺圖像里的腫瘤是否為惡性腫瘤。該方法依次采用了中值濾波、模糊圖像增強(qiáng)法和區(qū)域生長法將圖像中感興趣的區(qū)域提取出來,然后使用粗集理論對(duì)提取出的13個(gè)圖像特征值做了簡(jiǎn)化,最后將簡(jiǎn)化后的特征值作為支撐向量機(jī)的輸入,識(shí)別乳腺腫瘤的良性與惡性。其基本流程如圖1所示[1]。

      圖1 基于粗集理論和SVMs的乳腺圖像識(shí)別流程

      1 乳腺腫瘤圖片的預(yù)處理

      本文處理的圖片來自Mammographic Image Analysis Society(MIAS)數(shù)據(jù)集。MiniMIAS數(shù)據(jù)庫中的乳腺圖像是由X線所得到的圖像。由于X線的成像機(jī)理,其不可避免地使得圖像中帶有一定的噪聲。圖像去噪是醫(yī)學(xué)圖像識(shí)別中不可缺少的一步。先后采用了中值濾波、模糊圖像增強(qiáng)法和區(qū)域生長法對(duì)乳腺腫瘤圖片進(jìn)行了預(yù)處理[2]。

      圖2是中值濾波之前和之后的乳腺部分圖像對(duì)比。從圖2可見,通過中值濾波后,圖像中的腫瘤邊界依舊保持良好。圖3是將模糊增強(qiáng)算法應(yīng)用到乳腺圖像增強(qiáng)之前和之后的效果,可以看出,模糊圖像算法增強(qiáng)了乳腺腫塊與背景的對(duì)比度,其對(duì)邊界的處理也較為理想,未出現(xiàn)邊界模糊不清的現(xiàn)象。圖4是使用區(qū)域生長法進(jìn)行圖像分割之前和之后的圖像,可以看到對(duì)于病灶部位的提取是較為良好的。

      圖2 中值濾波之前和之后的乳腺部分圖像

      圖3 模糊增強(qiáng)之前和之后的乳腺部分圖像

      圖4 使用區(qū)域生長法之前和之后的乳腺部分圖像

      2 特征值的提取

      在本文設(shè)計(jì)的乳腺腫瘤識(shí)別系統(tǒng)中,首先根據(jù)MIAS數(shù)據(jù)庫中由專家指定的圖像中乳腺腫瘤的中心位置為基準(zhǔn),人工切割包含乳腺腫塊的一個(gè)大區(qū)域,經(jīng)過圖像去噪、圖像增強(qiáng)后,利用計(jì)算機(jī)找出乳腺腫塊的實(shí)際邊界,然后在此基礎(chǔ)上進(jìn)行特征值的提取。

      張紅新等研究了乳腺腫瘤細(xì)胞核的形態(tài),提出了用分形來提取乳腺腫瘤的特征[3]。本文主要從乳腺腫瘤的形狀特征和紋理特征來提取乳腺腫瘤的特征[4]。

      2.1形狀特征

      乳腺腫瘤分為良性和惡性,對(duì)于良性腫瘤其通常是成橢圓狀或圓形,而惡性腫瘤則通常表現(xiàn)為毛刺狀或不規(guī)則狀。乳腺圖形的形狀特征可以從乳腺腫瘤的邊緣輪廓周長、腫瘤的面積、腫瘤的圓形度和橢圓緊致度等方面來概括乳腺腫瘤的特征。

      其中,乳腺腫瘤的輪廓周長p和面積s可以直接統(tǒng)計(jì)分割好的圖像上的像素點(diǎn)得到[5]。乳腺的圓形度c定義為:

      c=4πs/p2

      乳腺腫瘤的圓形度取值范圍為0到1,腫瘤越接近于圓形,圓形度越接近于1。橢圓的緊致度EC定義為

      EC=(m+n)π/p

      其中,m,n分別為對(duì)乳腺腫瘤擬合橢圓的長軸和短軸。橢圓緊致度表示的是擬合周長與原始邊界周長的比,該值越小代表了乳腺腫瘤的毛刺程度越大,越有可能是惡性腫瘤。

      2.2紋理特征

      紋理特征是一種區(qū)域描述方法,可以反映像素在空間上的分布屬性。本文用灰度共生矩陣來提取圖像的紋理特征?;叶裙采仃囀且环N基于統(tǒng)計(jì)的分析紋理特征的方法,它根據(jù)在紋理中某一個(gè)灰度結(jié)構(gòu)重復(fù)出現(xiàn)的情況而提取出來,不僅反映了圖像的亮度分布特征,也反映了具有同樣亮度或者接近亮度的像素點(diǎn)之間的位置分布特征[3]。

      任何圖像灰度表面都可以看成是三維空間中的一個(gè)曲面,在三維空間中相隔某一個(gè)距離的兩個(gè)像素可能具有相同的灰度值?;叶裙采仃嚲褪且页鲞@樣兩個(gè)像素的聯(lián)合分布的統(tǒng)計(jì)形式。灰度共生矩陣G的每一個(gè)元素Gij表示一對(duì)灰度級(jí)(i,j)被給定的距離d分開的共生概率分布。它的計(jì)算就是從一個(gè)灰度值為i的像素點(diǎn)(x,y)出發(fā),統(tǒng)計(jì)與其距離為d,方向?yàn)棣?,灰度值為j的像素點(diǎn)(x+a,y+b)同時(shí)出現(xiàn)的概率p(i,j,d,θ)。

      p(i,j,d,θ)=Ψ{[(x,y),(x+a,y+b)|f(x,y)=i,f(x+a,y+b)=j]}

      其中,f(·)表示該像素點(diǎn)的灰度值,Ψ(·)表示該種情況出現(xiàn)的次數(shù)。一般地,可以有0 °、45 °、90 °、135 °四個(gè)方向來生成共生矩陣。即一個(gè)圖像可以生成四個(gè)共生矩陣。

      由生成的灰度共生矩陣,便可以得到圖像的灰度特征。本文在四個(gè)方向各選取9個(gè)灰度特征,然后將其求平均值,得到本文的最終用于分類乳腺腫瘤的灰度特征。本文所選取的灰度特征有能量(T1)、灰度平均(T2)、梯度均值(T3)、相關(guān)(T4)、慣性(T5)、相異性(T6)、熵(T7)、方差(T8)和遞差矩(T9)。

      其中,m=|i-j|。

      對(duì)圖像預(yù)處理后,生成四個(gè)方向的灰度共生矩陣,依次提取各個(gè)灰度共生矩陣的上述9個(gè)特征。為避免由于圖像旋轉(zhuǎn)、移動(dòng)等因素對(duì)特征值的影響,取四個(gè)共生矩陣各自生成特征值的平均值,得到最終的灰度特征值。

      由此,本文共選取了4個(gè)形狀特征和9個(gè)紋理特征共13個(gè)特征值作為識(shí)別乳腺腫瘤良性惡性的標(biāo)準(zhǔn)。由于特征值規(guī)模較大,為避免維數(shù)災(zāi)難,在進(jìn)行識(shí)別之前有必要對(duì)特征值進(jìn)行一定的簡(jiǎn)化。

      3 基于粗集理論的腫瘤圖片特征屬性的優(yōu)化

      對(duì)于一個(gè)系統(tǒng)S=(U,C,D,V,f),這里U是對(duì)象的非空有限集合,C∪D=R是屬性集合,不相關(guān)的子集C和D分別稱為條件屬性集和決策屬性集??紤]條件屬性相對(duì)于決策屬性的約簡(jiǎn),條件屬性集C中有些屬性對(duì)分類規(guī)則的確定不起作用,是多余的,這些冗余屬性要去掉,以達(dá)到屬性的簡(jiǎn)化[6]。

      根據(jù)粗集理論,定義系統(tǒng)中的條件屬性集C和結(jié)果屬性集D之間的關(guān)系依賴性。

      (1)

      式(1)中,card(POSc(D))表示基于條件屬性集C的結(jié)果正域子集數(shù)目,card(U)=|U| 表示對(duì)象論域數(shù)目。若k=1,則表明這個(gè)系統(tǒng)是協(xié)調(diào)的;若kR-r=1,則表明去除條件屬性r后系統(tǒng)仍是協(xié)調(diào)的。

      根據(jù)粗集理論,定義系統(tǒng)中條件屬性集C和結(jié)果屬性集D等價(jià)關(guān)系之間的一致性。

      ( 2)

      式中,card(U|C)表示基于條件屬性集C的等價(jià)類數(shù)目,card(U)=|U|表示對(duì)象論域數(shù)目。若Qc=1,則表明這個(gè)系統(tǒng)中條件屬性集C和結(jié)果屬性集D等價(jià)關(guān)系是一致的;若Qc-r=1,則表明去除條件屬性r后,該系統(tǒng)中條件屬性集C和結(jié)果屬性集D等價(jià)關(guān)系仍是一致的。

      因此,利用粗集算法減少輸入信息的表達(dá)特征數(shù)量,降低網(wǎng)絡(luò)結(jié)構(gòu)的復(fù)雜性,去掉冗余信息,將使網(wǎng)絡(luò)的訓(xùn)練集合簡(jiǎn)化,減少了網(wǎng)絡(luò)的訓(xùn)練時(shí)間,提高了網(wǎng)絡(luò)的實(shí)時(shí)性[7]。

      rosetta軟件提供了多種屬性簡(jiǎn)約方法,包括遺傳算法、Johnson方法、Holte’s 1R等方法。本文采用rosetta遺傳算法,它是一種自適應(yīng)隨機(jī)搜索方法,是基于達(dá)爾文生化進(jìn)化論的自然選擇學(xué)說和孟德爾的基因遺傳學(xué)原理而建立的,具體步驟:

      (1) 輸入決策表s。

      (2) 求條件屬性C相對(duì)于決策屬性D的核core(C)。令core(C)=φ,逐個(gè)去掉一個(gè)屬性r∈C,若posC-{r}(D)≠posc(D),則core(C)=core(C)∪{r}。

      (3) 隨機(jī)產(chǎn)生M個(gè)長度為n(原來決策表s中條件屬性的個(gè)數(shù))的二進(jìn)制串組成初始種群,對(duì)于核core(C)的屬性,其對(duì)應(yīng)位置取1,其他位置隨機(jī)取0或1。

      (5) 選擇父代個(gè)體分別采用單點(diǎn)交叉、簡(jiǎn)單變異,自適應(yīng)

      其中,favg為群體的平均適應(yīng)值,f′為預(yù)交叉的兩個(gè)個(gè)體中較大的適應(yīng)度值,f為欲變異的個(gè)體的適應(yīng)度值,β為(0,1)區(qū)間上的一個(gè)常數(shù)。

      (6) 修剪相似個(gè)體,并動(dòng)態(tài)補(bǔ)充新個(gè)體,得到下一代種群。

      (7) 若連續(xù)若干代的最優(yōu)個(gè)體的適應(yīng)值不再提高,則終止算法,并輸出最優(yōu)個(gè)體,否則轉(zhuǎn)到第4步。

      (8) 輸出屬性的簡(jiǎn)約表。

      所提取出的13個(gè)特征屬性簡(jiǎn)化為了9個(gè)。它們分別是腫瘤的周長、圓形度、橢圓緊致度、灰度共生矩陣的能量、灰度平均、相關(guān)性、慣性、熵、方差。

      4 基于SVMs的乳腺腫瘤識(shí)別

      支持向量機(jī)是基于結(jié)構(gòu)性風(fēng)險(xiǎn)最小化原則的理論,能夠克服傳統(tǒng)學(xué)習(xí)方法中經(jīng)驗(yàn)最小化的局限,使得其在小樣本的情況下也具有良好的泛化能力。從MIAS數(shù)據(jù)庫中得到的乳腺圖像,通過圖像的預(yù)處理、特征值的提取以及粗集對(duì)于特征值的簡(jiǎn)化以后,便可以將其輸入到支持向量機(jī)中進(jìn)行訓(xùn)練[8-9]。這一過程的流程如圖5所示。

      圖5 基于SVM的乳腺圖像識(shí)別流程圖

      mini-MIAS庫提供的乳腺圖片是200 μm×200 μm的分辨率。庫中有322個(gè)圖片,分別來自161位病人。圖片分三類:正常無腫塊、正常腫塊、異常。對(duì)于有腫塊的乳腺,數(shù)據(jù)庫中給出了由專家指定的乳腺腫塊的位置和類別。數(shù)據(jù)庫中的乳腺腫瘤又分為三類:圓形或橢圓形、不規(guī)則型、毛刺型。本文選取圓型乳腺腫瘤共14個(gè),其中良性10個(gè)、惡性4個(gè);不規(guī)則乳腺腫瘤共15個(gè),其中良性8個(gè)、惡性7個(gè);毛刺型乳腺腫瘤共15個(gè),其中良性7個(gè)、惡性8個(gè)。選取的規(guī)則是要盡量考慮正負(fù)樣本的比例,又要在數(shù)據(jù)庫能夠得到這個(gè)比例。

      對(duì)所選取的44個(gè)訓(xùn)練樣本按照流程圖依次處理。對(duì)提取出的腫瘤區(qū)域提取其紋理特征和形狀特征共13個(gè)。它們分別為腫瘤的周長、面積、圓形度、橢圓緊致度、灰度共生矩陣的能量、灰度平均、梯度平均、相關(guān)性、慣性、相異性、熵、方差和逆差距。經(jīng)過離散化和粗集簡(jiǎn)化以后的特征值共9個(gè),分別為腫瘤的周長、圓形度、橢圓緊致度、灰度共生矩陣的能量、灰度平均、相關(guān)性、慣性、熵和方差。

      采用交叉訓(xùn)練的方式進(jìn)行訓(xùn)練。將所有的訓(xùn)練樣本隨機(jī)均分為4個(gè)部分,依次使用其中三部分樣本作為訓(xùn)練集,剩下的部分作為測(cè)試集進(jìn)行訓(xùn)練。構(gòu)造一個(gè)4分類的支持向量機(jī)模型,模型中的核函數(shù)采用高斯徑向基核函數(shù),模型中的參數(shù)經(jīng)過試驗(yàn)選取為:c=100,δ=4。

      將交叉訓(xùn)練的四個(gè)模型得到的預(yù)測(cè)結(jié)果加總,得到最終的預(yù)測(cè)結(jié)果。本文所得到的預(yù)測(cè)精度見表1。表1中數(shù)據(jù)顯示對(duì)于惡性腫瘤的識(shí)別的識(shí)別率較高,但需要指出的是,為了包含各種形狀的惡性腫瘤,已經(jīng)將MIAS數(shù)據(jù)庫中所有的樣本都納入了訓(xùn)練樣本中。盡管如此,樣本的數(shù)量還是偏少。下一步工作,可以考慮擴(kuò)充數(shù)據(jù)庫中各樣本的數(shù)目,進(jìn)一步驗(yàn)證預(yù)測(cè)精度。

      表1 模型預(yù)測(cè)識(shí)別率

      5 結(jié)束語

      從醫(yī)學(xué)透片中挖掘出腫瘤的特征,是一個(gè)從不準(zhǔn)確、不完整、不確定的大量數(shù)據(jù)中發(fā)現(xiàn)知識(shí)的過程。在這方面粗糙集和支持向量機(jī)顯示出了無窮的魅力。支持向量機(jī)可以實(shí)現(xiàn)有導(dǎo)師和無導(dǎo)師的學(xué)習(xí),并且解決傳統(tǒng)機(jī)器學(xué)習(xí)算法存在的一 些問題,如神經(jīng)網(wǎng)絡(luò)的過學(xué)習(xí)問題和局部最小問題,但不能確定哪些知識(shí)是冗余的,哪些屬性是有用的;粗集理論方法可以描繪知識(shí)表達(dá)中不同屬性的重要性,進(jìn)行知識(shí)表達(dá)中不同屬性的重要性,但粗糙集對(duì)適應(yīng)變化的環(huán)境和系統(tǒng)本身的容錯(cuò)性都不如支持向量機(jī)。本文將兩者結(jié)合起來,將粗糙集作為支持向量機(jī)的前置系統(tǒng),對(duì)輸入支持向量機(jī)的數(shù)據(jù)進(jìn)行預(yù)處理,使用粗糙集對(duì)輸入支持向量機(jī)的數(shù)據(jù)進(jìn)行簡(jiǎn)約,減少了支持向量機(jī)的輸入空間維數(shù),去掉了訓(xùn)練集中的冗余信息,使訓(xùn)練集得到簡(jiǎn)化,訓(xùn)練時(shí)間更快,識(shí)別精度更高,模型驗(yàn)證的精度能夠滿足輔助醫(yī)學(xué)診斷的目的。

      [1] Agrawal P,Vatsa M,Singh R.Saliency based mass detection from screening mammograms[J].Signal Processing,2014,99:29-47.

      [2] Maitra I K,Nag S,Bandyopadhyay S K.Technique for preprocessing of digital mammogram[J].Computer Methods and Programs in Biomedicine.2012,107(2):175-188.

      [3] 張紅新,趙培榮,高冬玲,等.乳腺腫瘤細(xì)胞核形態(tài)的分形分析[J].鄭州大學(xué)學(xué)報(bào):醫(yī)學(xué)版,2002(4):431-433.

      [4] Wang X,Yang J,Teng X,et al.Feature selection based on rough sets and particle swarm optimization[J].Pattern Recognition Letters,2007,28(4):459-471.

      [5] 華 翔,孫 蕾.基于SVM的醫(yī)學(xué)圖像分類器的設(shè)計(jì)[J].微電子學(xué)與計(jì)算機(jī),2011(6):171-175.

      [6] 蔡樂才,姚行艷.基于粗集理論的屬性約簡(jiǎn)算法[J].四川理工學(xué)院學(xué)報(bào):自然科學(xué)版,2009(1):34-37.

      [7] 閻成棟.基于粗糙集的醫(yī)學(xué)圖像增強(qiáng)系統(tǒng)研究[D].太原:太原理工大學(xué),2010.

      [8] Eddaoudi F,Regragui F,Mahmoudi A,et al.Masses detection using SVM classifier based on textures analysis[J].Applied Mathematical Sciences,2011,5(8):367-379.

      [9] Mohamed H,Mabrouk M S,Sharawy A.Computer aided detection system for micro calcifications in digital mammograms[J].Computer Methods and Programs in Biomedicine,2012,92:357-362.

      A New Method for Tumor Images Recognition Based on Rough Sets and SVMs

      ZHANGHaiyana,LANJimingb

      (a.School of Science; b.School of Computer Science, Sichuan University of Science &
      Engineering, Zigong 643000, China)

      In this research, a novel method is proposed which is used for breast tumor images recognition based on rough sets and support vector machines (SVMs). The basic idea is: firstly, the image is pre-processed for noise reduction. Secondly, the texture and shape features are extracted to constitute the feature vector that can represent the mammogram accurately. Next, the features are discrete normalized. Finally, attribute reduction by rough sets and classification recognition by SVMs are completed. The experimental results show that this method can achieve a satisfactory effect for mammographic recognition.

      medical image; tumor recognition; rough sets; SVMs; feature extraction; attribute reduction

      2014-06-06

      四川省教育廳科研項(xiàng)目(14ZB0214);自貢市科技局科研項(xiàng)目(2013ZC11);企業(yè)信息化與物聯(lián)網(wǎng)測(cè)控技術(shù)四川省高校重點(diǎn)實(shí)驗(yàn)室項(xiàng)目(2014WYJ03);橋梁無損檢測(cè)與工程計(jì)算四川省重點(diǎn)實(shí)驗(yàn)室科研項(xiàng)目(2014QZY01)

      張海燕(1977-),女,四川樂至人,講師,碩士,主要從事應(yīng)用數(shù)學(xué)和人工智能方面的研究,(E-mail)zhang_petrel@qq.com

      1673-1549(2014)06-0038-05

      10.11863/j.suse.2014.06.10

      TP31

      A

      猜你喜歡
      特征值共生灰度
      采用改進(jìn)導(dǎo)重法的拓?fù)浣Y(jié)構(gòu)灰度單元過濾技術(shù)
      一類帶強(qiáng)制位勢(shì)的p-Laplace特征值問題
      基于灰度拉伸的圖像水位識(shí)別方法研究
      單圈圖關(guān)聯(lián)矩陣的特征值
      人與熊貓 和諧共生
      共生
      優(yōu)生共生圈培養(yǎng)模式探索
      優(yōu)生共生圈培養(yǎng)模式探索
      基于最大加權(quán)投影求解的彩色圖像灰度化對(duì)比度保留算法
      基于灰度線性建模的亞像素圖像抖動(dòng)量計(jì)算
      龙州县| 哈密市| 正镶白旗| 汉源县| 江阴市| 柳河县| 卓尼县| 南澳县| 黑河市| 图木舒克市| 儋州市| 吴桥县| 吕梁市| 全州县| 崇文区| 揭东县| 和顺县| 卢湾区| 嘉荫县| 汪清县| 南安市| 建湖县| 乌拉特中旗| 垣曲县| 安岳县| 贵定县| 青海省| 辽宁省| 彭州市| 遂宁市| 顺昌县| 安国市| 绿春县| 玉溪市| 资中县| 那坡县| 台山市| 梁平县| 阳信县| 开化县| 望谟县|