沈海洋 朱信忠 胡佳楠
摘要
肺癌早期無(wú)特異癥狀,發(fā)現(xiàn)較為困難。特別是肺癌的早期癥狀:咳嗽、吐疾與感冒、支氣管炎等癥狀相似,臨床上把肺癌誤診為肺炎的情況時(shí)有發(fā)生。影像學(xué)的發(fā)展極為迅速,特別是CT、MRI的推廣和應(yīng)用,為肺癌的識(shí)別鑒定提供比較有效的方法,同時(shí)也對(duì)醫(yī)生有了更高的要求,肺癌的識(shí)別是一項(xiàng)系統(tǒng)復(fù)雜的工程,首先是病灶的分割,其次是特征的提取,最后是識(shí)別的算法本文旨在尋找一套比較有效的方法識(shí)別肺癌,給臨床醫(yī)生提供一種行之有效的輔助方法來(lái)識(shí)別肺癌,減少誤診和漏診的概率。具體的方法為:通過(guò)改進(jìn)的U-net算法對(duì)肺癌的病灶部位進(jìn)行分割,然后PCA進(jìn)行提取特征,通過(guò)BP神經(jīng)網(wǎng)絡(luò)來(lái)進(jìn)行分類識(shí)別。
【關(guān)鍵詞】肺癌 U-net BP神經(jīng)網(wǎng)絡(luò)
1 緒論
肺癌是發(fā)病率和死亡率增長(zhǎng)最快,對(duì)人群健康和生命威脅最大的惡性腫瘤之一。據(jù)國(guó)家癌癥中心公布的最新數(shù)字顯示,中國(guó)2013年癌癥新發(fā)病例有368萬(wàn)例,其中發(fā)病率為186/10萬(wàn),死亡率為109/10萬(wàn)。而肺癌在所有癌癥發(fā)病及死亡中均占首位,我國(guó)每年約59.1萬(wàn)人死于肺癌。研究表明,早發(fā)現(xiàn)、早治療能夠?qū)⒎伟?年生存率從14%提高到49%。隨著影像學(xué)技術(shù)的發(fā)展,使得肺部腫瘤圖像越來(lái)越清晰,可以從獲得的龐大圖像數(shù)據(jù)集中取得大量的診斷結(jié)果。人工神經(jīng)網(wǎng)絡(luò)(ArtificialNeural Network;ANN)是上個(gè)世紀(jì)80年代興起的人工智能領(lǐng)域的研究?jī)?nèi)容,其主要是利用計(jì)算機(jī)從信息處理的角度對(duì)人腦神經(jīng)元網(wǎng)絡(luò)進(jìn)行抽象,建立某種簡(jiǎn)單的模型,并按照不同的連接方式組成不同結(jié)構(gòu)的網(wǎng)絡(luò)。本研究對(duì)肺結(jié)節(jié)提取與識(shí)別進(jìn)行探討,通過(guò)使用神經(jīng)網(wǎng)絡(luò)的框架U-net分割肺結(jié)節(jié),使用 PCA進(jìn)行特征提取,并最后通過(guò)一個(gè)BP神經(jīng)網(wǎng)絡(luò)進(jìn)行分類處理,最終實(shí)現(xiàn)肺結(jié)節(jié)良惡性的識(shí)別。
2 肺癌病灶的分割
2015年Olaf Ronneberger,Philipp Fischer和Thomas Brox提出了U-net網(wǎng)絡(luò)結(jié)構(gòu),U-net的產(chǎn)生極大的促進(jìn)了醫(yī)學(xué)圖像分割的研究。本文采用U-net方法進(jìn)行腫瘤圖像的分割,U-net的網(wǎng)絡(luò)框架如圖1所示。
該U-net網(wǎng)絡(luò)由一個(gè)收縮路徑和一個(gè)擴(kuò)張路徑組成,呈對(duì)稱狀態(tài),像英文字母大寫的U,因此,被命名為U-net.其中,收縮路徑遵循典型的卷積網(wǎng)絡(luò)結(jié)構(gòu),其由兩個(gè)重復(fù)的3*3卷積核組成,且均使用ReLU激活函數(shù)和一個(gè)用于下采樣的步長(zhǎng)為2的2*2最大池化操作,以及在每一個(gè)下采樣的步驟中,特征通道數(shù)量都加倍。在擴(kuò)張路徑中,每一步都包含對(duì)特征圖進(jìn)行上采樣;然后用2*2的卷積核進(jìn)行卷積運(yùn)算,用于減少一半的特征通道數(shù)量;接著級(jí)聯(lián)收縮路徑中相應(yīng)的裁剪后的特征圖;再用兩個(gè)3*3的卷積核進(jìn)行卷積運(yùn)算,且均使用ReLU激活函數(shù)。由于在每次卷積操作中,邊界像素存在缺失問(wèn)題,因此有必要對(duì)特征圖進(jìn)行裁剪。U-net的主要優(yōu)點(diǎn)為:支持少量的數(shù)據(jù)訓(xùn)練模型,通過(guò)對(duì)每個(gè)像素點(diǎn)進(jìn)行分類,獲得更高的分割準(zhǔn)確率,用訓(xùn)練好的模型分割圖像,速度快。
本文使用python編程語(yǔ)言,使用simeplelTK讀取肺部CT的DICOM文件,基于tensorflow和keras創(chuàng)建U-net網(wǎng)絡(luò)框架,傳入讀取的數(shù)據(jù)進(jìn)行訓(xùn)練。結(jié)果如圖2所示。
3 特征提取
分割出的病灶圖像信息后,由于腫瘤等醫(yī)學(xué)圖像的異質(zhì)性特性,圖像中存在的大量的冗余特征,為了實(shí)現(xiàn)肺結(jié)節(jié)的精準(zhǔn)識(shí)別,需要對(duì)數(shù)據(jù)進(jìn)行特征的提取。本文基于CT影像信息、臨床征象和腫瘤的醫(yī)學(xué)特性三個(gè)方面進(jìn)行特征提取。提取的特征主要分為:
(1)腫瘤形態(tài)特征;
(2)腫瘤強(qiáng)度特征;
(3)腫瘤灰度特征;
(4)腫瘤紋理特征。
而特征提取的方法采用的是PCA方法。PCA方法常被用來(lái)提取數(shù)據(jù)的主要特征,以達(dá)到降維的目的。目前己廣泛應(yīng)用于諸如人臉識(shí)別,圖像去噪,機(jī)器學(xué)習(xí)等領(lǐng)域。本文采用python語(yǔ)言編寫PCA方法,其核心代碼如下:
defpca(dataMat,topNfeat=9999999):
meanVals=mean(dataMat,axis=0)
meanRemoved=dataMat-meanVals
covMat=cov(meanRemoved,rowvar=0)
eigVals,eigVects=linalg.eig(mat(covMat))
eigVallnd=argsort(eigVals)
eigVallnd=eigVallnd[:-(topNfeat+1):-1]
redEigVects=eigVects[:,eigValtnd]
lowDDataMat=meanRemoved*redEigVects
reconMat=(lowDDataMat*redEigVects.T)+meanVals
return lowDDataMat,reconMat
4 基于BP神經(jīng)網(wǎng)絡(luò)的肺結(jié)節(jié)分類識(shí)別
BP(back propagation)神經(jīng)網(wǎng)絡(luò)是一種按照誤差逆向傳播算法訓(xùn)練的多層前饋神經(jīng)網(wǎng)絡(luò),是目前應(yīng)用最廣泛的神經(jīng)網(wǎng)絡(luò)。本文使用BP神經(jīng)網(wǎng)絡(luò)作為肺結(jié)節(jié)識(shí)別的分類器,并與SVM方法做進(jìn)行對(duì)比。
本文所使用的BP神經(jīng)網(wǎng)絡(luò),分為5層(輸入層,輸出層,3個(gè)中間層)。經(jīng)過(guò)PCA的特征提取,最終我們得到的特征維數(shù)為13維。因此輸入層我們采用13個(gè)神經(jīng)元,第2層采用200個(gè)神經(jīng)元,第3層采用200個(gè)神經(jīng)元,第4層采用100個(gè)神經(jīng)元,最后的輸出層采用1個(gè)神經(jīng)元,通過(guò)最后的神經(jīng)元反應(yīng)肺結(jié)節(jié)的良惡性。
本文利用40例樣本作為構(gòu)建預(yù)測(cè)模型的訓(xùn)練集,40例作為驗(yàn)證集。訓(xùn)練集中惡性腫瘤25例,良性腫瘤25例,驗(yàn)證集中惡性腫瘤15例,良性腫瘤15例。實(shí)驗(yàn)選用python作為編程語(yǔ)言,使用tensortlow平臺(tái)。得到結(jié)果如表1所示。
由表1看出,多項(xiàng)式核函數(shù)的總準(zhǔn)確度為83.25%,高斯核函數(shù)的總準(zhǔn)確度為84.50%,混合核函數(shù)的總準(zhǔn)確度為86.34%,而BP神經(jīng)網(wǎng)絡(luò)方法的總準(zhǔn)確度達(dá)到了91.13%。相比SVM方法(無(wú)論是采用多項(xiàng)式核,或高斯核,或混合核),采用本文的BP神經(jīng)網(wǎng)絡(luò)方法在分類準(zhǔn)確度最高。
5 結(jié)語(yǔ)
本文提出了一套針對(duì)肺結(jié)節(jié)良惡性判斷的整體方案,通過(guò)U-net神經(jīng)網(wǎng)絡(luò)的肺部腫瘤CT圖像自動(dòng)分割算法,對(duì)原圖像進(jìn)行肺結(jié)節(jié)的分割,然后通過(guò)PCA方法進(jìn)行特征提取,最后采用BP神經(jīng)網(wǎng)絡(luò)對(duì)肺結(jié)節(jié)的良惡性進(jìn)行分類,通過(guò)實(shí)驗(yàn)的數(shù)據(jù)證明,該方法相對(duì)于傳統(tǒng)方法更具有推廣性。
參考文獻(xiàn)
[1]張鵬,徐欣楠,王洪偉等.基于深度學(xué)習(xí)的計(jì)算機(jī)輔助肺癌診斷方法[J].計(jì)算機(jī)輔助設(shè)計(jì)與圖形學(xué)學(xué)報(bào),2018,30(01).
[2]陳首英,劉福林,龐志剛等.肺癌病人5年生存率及生存因素分析[J].預(yù)防醫(yī)學(xué)論壇,2004,10(01):1-3.
[3]Ronneberger 0,F(xiàn)ischer P,Bros T.U-Net:Convolutional Networks forBiomedical Image Segmentation[J].
[4]Song F,Guo Z,Mei D.FeatureSelection Using Principal ComponentAnalysis[C].International Conferenceon System Science,Engineering Designand Manufacturing Informatization.IEEE,2010:27-30.
[5]Con Y L,Boser B,Denker J S,etal.Handwritten digit recognitionwith a back-propagation network[J].Advances in Neural InformationProcessing Systems,1990,2(02):396-404.
[6]Osuna E,F(xiàn)reund R,G i r o s i F.Training svm:An application to facedetection(C).1997.