夏劍峰
(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)
?
基于數(shù)學(xué)形態(tài)學(xué)的癌細(xì)胞的分割與識別
夏劍峰
(上海理工大學(xué) 光電信息與計(jì)算機(jī)工程學(xué)院,上海 200093)
要判斷一幅測得的細(xì)胞圖像中是否存在癌細(xì)胞,如果僅憑經(jīng)驗(yàn)去判斷,不僅工作量大,而且準(zhǔn)確率相對較低。文中介紹了一種基于形態(tài)學(xué)的對一幅細(xì)胞圖像進(jìn)行分割和識別的算法。即先對圖像進(jìn)行膨脹或腐蝕預(yù)處理,然后通過設(shè)置圓度閾值,計(jì)算出每一個(gè)細(xì)胞的圓度來與閾值進(jìn)行比較,并提取出可疑的癌細(xì)胞。實(shí)驗(yàn)表明,該算法不僅大幅降低了醫(yī)務(wù)人員的工作量,而且顯著提高了癌細(xì)胞識別的準(zhǔn)確率。最終檢測結(jié)果的正確率達(dá)到了95%以上。
形態(tài)學(xué);分割;識別;圓度;細(xì)胞
XIA Jianfeng
(School of Optical-Electrical and Computer Engineering, University of Shanghai for Science and Technology,Shanghai 200093, China)
目前的圖像診斷系統(tǒng),多是采用數(shù)學(xué)形態(tài)學(xué)、灰度特征和色度學(xué),并結(jié)合專家系統(tǒng),對癌細(xì)胞進(jìn)行分析和診斷。[1-4]
本文介紹了一種基于數(shù)學(xué)形態(tài)學(xué)的癌細(xì)胞的檢測與識別系統(tǒng)。在形態(tài)學(xué)上識別癌細(xì)胞的主要依據(jù)是:與正常細(xì)胞相比細(xì)胞核發(fā)生改變、核體積增大、癌細(xì)胞核常呈不規(guī)則的葉狀。在分割后的二值圖像中,細(xì)胞核的邊緣更加光滑,規(guī)則形狀近似于圓,因此應(yīng)用形態(tài)特征學(xué)特征可以更好的來識別癌細(xì)胞。基于癌細(xì)胞相對于正常細(xì)胞更接近于圓,因此該系統(tǒng)通過檢查一幅圖像中細(xì)胞的圓度,來判別其中是否有癌細(xì)胞并將其提取出來。
1.1 閾值分割
為了能有效地檢測出癌細(xì)胞,先對圖像進(jìn)行二值化處理。為消除或減少圖像中噪聲對灰度門限值的影響,本文采用迭代算法來求得圖像分割的最佳閾值。
設(shè)有一幅圖像g(x,y)由原始圖像f(x,y)和混入其中的噪聲e(x,y)疊加而成,即
g(x,y)=f(x,y)+e(x,y)
(1)
這里假設(shè)各點(diǎn)的噪聲是互不相關(guān),且具有零均值,標(biāo)準(zhǔn)差為ε。通過閾值分割將圖像分割成兩部分,由于噪聲是隨機(jī)作用于圖像的像素點(diǎn)上,則可以認(rèn)為在分割出目標(biāo)g1和背景g2圖像中的噪聲仍為e(x,y),即
g1(x,y)=f1(x,y)+e1(x,y)
(2)
g2(x,y)=f2(x,y)+e2(x,y)
(3)
在迭代算法中,需要對分割出的圖像分別求其灰度值,則
E{g1(x,y)}=E{f1(x,y)+e1(x,y)}=E{f1(x,y)}
(4)
E{g2(x,y)}=E{f2(x,y)+e2(x,y)}=E{f2(x,y)}
(5)
上式說明,隨著迭代次數(shù)的增加,平均灰度值將趨于真值。因此,用迭代算法求得的閾值將不受噪聲的干擾[1]。從而大幅提高了圖像閾值分割的準(zhǔn)確性。
1.2 膨脹與腐蝕
在通過閾值分割獲得的二值分割圖像中,由于在細(xì)胞內(nèi)部可能存在小洞,在其周邊存在凹坑和凸刺,使得形態(tài)學(xué)特征的獲取受到影響。[5-7]因此,本文算法在提取細(xì)胞形態(tài)特征之前,對其進(jìn)行了適當(dāng)?shù)母g和膨脹處理,以消除這些噪聲的影響。本文采用了閉運(yùn)算,即先膨脹再腐蝕。閉運(yùn)算可以平滑圖像的輪廓,融合窄的缺口和細(xì)長的彎口,能填補(bǔ)圖像的裂縫及破洞[2]。實(shí)驗(yàn)表明,形態(tài)學(xué)閉運(yùn)算提高了細(xì)胞形態(tài)學(xué)特征提取的準(zhǔn)確性,從而提高了可疑癌細(xì)胞的識別準(zhǔn)確率。
基于癌細(xì)胞相對于正常細(xì)胞更接近于圓,因此該系統(tǒng)通過檢查一幅圖像中細(xì)胞的圓度,來判別其中是否有癌細(xì)胞并將其提取出來。[8-9]首先給出圓度的定義如下
C=4πA/L2
(6)
式中,L為目標(biāo)的周長;A為目標(biāo)的面積;C描述了目標(biāo)形狀與圓形的接近程度。C≤1,C越接近1,目標(biāo)形狀越接近于圓,C=1時(shí),則為圓形[10-12]。
考慮到既要計(jì)算圖像中細(xì)胞的面積又要計(jì)算細(xì)胞輪廓的周長,而如果已知目標(biāo)區(qū)域輪廓的鏈碼表示,則面積和周長將很容易計(jì)算出來。又鏈碼具有簡單、節(jié)省存儲空間、便于計(jì)算,以及平移不變性等特點(diǎn)[4,13],使得對于封閉區(qū)域特征參數(shù)的統(tǒng)計(jì)變得簡單易行。因此,本文將使用鏈碼來計(jì)算細(xì)胞的周長和面積。
設(shè)方向鏈碼為{a1a2a3…an},定義ai在X軸上的分量為aix,在Y軸上的分量為aiy,則
ai=0時(shí),aix=1,aiy=0;ai=1時(shí),aix=1,aiy=1;ai=2時(shí),aix=0,aiy=1;ai=3時(shí),aix=-1,aiy=1;ai=4時(shí),aix=-1,aiy=0;ai=5時(shí),aix=-1,aiy=-1;ai=6時(shí),aix=0,aiy=-1;ai=7時(shí),aix=1,aiy=-1。
(1) 鏈碼周長
(7)
(2) 鏈碼所包圍的區(qū)域的面積
(8)
(9)
其中,y0為起始點(diǎn)的坐標(biāo)。
根據(jù)式(7)~式(9)即可將每一個(gè)細(xì)胞區(qū)域的周長和面積準(zhǔn)確地計(jì)算出來。代入式(6),即可得到細(xì)胞的圓度。
圖1為提取癌細(xì)胞的流程圖。
圖1 算法流程圖
具體算法分為以下5個(gè)步驟:
步驟1 迭代閾值處理,將圖像二值化,分割出圖像中的所有細(xì)胞。
迭代法步驟如下:
(1)求出圖像中的最小和最大灰度值Zl和Zk的閾值初值
T0=(Zl+Zk)/2
(10)
(2)根據(jù)閾值Tk將圖像分割成目標(biāo)和背景兩部分,求出兩部分的平均灰度值Z0和ZB,由式(11)和式(12)求得
(11)
(12)
(3)求出新閾值Tk+1
Tk+1=(Z0+ZB)/2
(13)
(4)若Tk=Tk+1,則結(jié)束。否則,k+1→k,轉(zhuǎn)第(2)步。
第(4)步結(jié)束后,Tk即為最佳閾值。
步驟2 對預(yù)處理后的每一個(gè)細(xì)胞區(qū)域進(jìn)行標(biāo)志;
步驟3 分別計(jì)算每一個(gè)細(xì)胞區(qū)域的面積和周長,求出圓度;
步驟4 設(shè)置圓度閾值;
步驟5 將每個(gè)細(xì)胞區(qū)域計(jì)算出來的圓度與設(shè)置的閾值進(jìn)行比較,小于閾值的從圖像中刪除,大于閾值的在原圖中標(biāo)識,從而篩選出可疑的癌細(xì)胞。
接下來對某一癌細(xì)胞圖像利用本文算法在Matlab R2010中進(jìn)行處理,處理過程和結(jié)果如圖2~圖7所示,最終將可疑的癌細(xì)胞在原圖像中標(biāo)志記出來。
利用上文提到的閾值迭代算法和相關(guān)的預(yù)處理,將每個(gè)細(xì)胞區(qū)域分割了出來,結(jié)果如圖5所示。能夠準(zhǔn)確地分割出每個(gè)細(xì)胞區(qū)域?qū)μ岣甙┘?xì)胞的識別率會有較大幫助。設(shè)置閾值后,分割出的可疑癌細(xì)胞如圖6所示,可疑的癌細(xì)胞被較好地分割了出來。
利用以上算法,進(jìn)行了大量的形態(tài)學(xué)分割實(shí)驗(yàn),從最終實(shí)驗(yàn)結(jié)果得出準(zhǔn)確率達(dá)到95%以上,處理一幅圖像平均用時(shí)約2 s。從實(shí)驗(yàn)結(jié)果可以看出,癌細(xì)胞的識別率遠(yuǎn)高于非癌細(xì)胞的識別率,即絕大數(shù)的癌細(xì)胞被正確的找出,而有少許的非癌細(xì)胞被錯誤誤認(rèn)為癌細(xì)胞。實(shí)驗(yàn)表明,這主要取決于圓度閾值的設(shè)定。因此,本文算法選擇閾值的原則為在保證癌細(xì)胞識別率最大的前提下,使非癌細(xì)胞誤識別率最小。這將通過大量的實(shí)驗(yàn)來獲得最佳閾值。
圖2 原始圖像
圖3 二值化圖像
圖4 去除無關(guān)背景
圖5 預(yù)處理后圖像
圖6 提出的可疑癌細(xì)胞圖像
圖7 標(biāo)志出的癌細(xì)胞
及早發(fā)現(xiàn)癌變,以達(dá)到準(zhǔn)確地早期診斷和治療是迫切需要解決的問題。要從大量的細(xì)胞中檢測出是否存在可疑的癌細(xì)胞,對于人工判讀來說工作量巨大,本文提出的基于形態(tài)學(xué)癌細(xì)胞的檢測大幅降低了工作量,提高了診斷的準(zhǔn)確性與效率。
[1] 胡小鋒,葉慶泰,戴星.一種精確檢測細(xì)胞真實(shí)邊緣的算法[J].光學(xué)技術(shù),2003(5):595-598.
[2] 岡薩雷斯. 數(shù)字圖像處理[M]. 3版.北京:電子工業(yè)出版社,2003.
[3] 楊萬扣,任明武,楊靜宇.數(shù)字圖像中基于鏈碼的目標(biāo)面積計(jì)算方法[J].計(jì)算機(jī)工程,2008(1):30-33.
[4] 任洪娥,徐海濤.一種基于鏈碼技術(shù)的圖像目標(biāo)物體面積統(tǒng)計(jì)新方法[J].計(jì)算機(jī)應(yīng)用研究,2008(1):303-305.
[5] 王芳.腫瘤細(xì)胞圖像預(yù)處理及特征提取[D].呼和浩特: 內(nèi)蒙古師范大學(xué),2008.
[6] 李宇卓.腫瘤細(xì)胞圖像分割算法研究[D].鄭州: 鄭州大學(xué),2007.[7] 楊萬扣.基于鏈碼的部分算法研究[D].南京: 南京理工大學(xué),2004
[8] 熊晨.一種能有效辨別癌細(xì)胞的圖像處理方法[J].中國科技財(cái)富,2008(10):128.
[9] 張佳佳.基于圖像分割的淋巴癌細(xì)胞提取方法研究[D].武漢: 武漢理工大學(xué),2013.
[10] 艾星芳. 圓度圖像測試技術(shù)及應(yīng)用研究[D].廣州: 廣東工業(yè)大學(xué),2012.
[11] 羅炳偉,余滬濤,江曉. 細(xì)胞圖像分割的新方法[J].電子科技大學(xué)學(xué)報(bào),1990(1):54-59.
[12] Wang Jiwei,Liu Wen.An energy conduction model for cell image segmentation[J].Chinese Science Bulletin,2011,56(1):1049-1055.
[13] Ma Jingfeng, Chen Shanglian.A new level set model for cell image segmentation[J].Chinese Physics B, 2011(2):572-578.
Segmentation and Recognition of Cancer Cells Based on Mathematical Morphology
Judging only by experience whether a measured picture contains cancer cells is a huge task is relatively low in accuracy. This paper introduces a cell image segmentation and recognition algorithm based on the morphology. The image is pretreated by expansion or corrosion, and then the roundness threshold is set to be compared with the calculated roundness of each cell to find suspicious cancer cells. Experiments show that the algorithm greatly reduces the workload of medical staff, and significantly improves the accuracy of cancer cells recognition to more than 95%.
morphology; image segmentation; recognition; roundness; cell
2015- 12- 29
夏劍峰(1991-),男,碩士研究生。研究方向:信號與信息處理。
10.16180/j.cnki.issn1007-7820.2016.10.011
TP391.41
A
1007-7820(2016)10-036-04