鐘思華,郭興明,鄭伊能
1.重慶大學(xué) 生物工程學(xué)院 重慶市醫(yī)療電子技術(shù)工程研究中心,重慶 400044
2.重慶醫(yī)科大學(xué)附屬第一醫(yī)院 放射科,重慶 400016
肺癌是發(fā)病率和死亡率最高的癌癥之一,我國(guó)每年肺癌死亡病例約61 萬人,及早診斷出肺癌并治療對(duì)于提高患者的生存率具有重要的意義[1]。肺結(jié)節(jié)是肺癌的早期表現(xiàn)形式,在CT 圖像上多表現(xiàn)為直徑不超過3 cm的局灶性、類圓形的肺部陰影,對(duì)其輪廓準(zhǔn)確地分割能夠幫助醫(yī)生實(shí)現(xiàn)肺結(jié)節(jié)良惡性的診斷。由于肺結(jié)節(jié)體積微小,其形態(tài)、亮度等特征與肺實(shí)質(zhì)中的血管等組織相似,僅通過肉眼觀察難以將其兩者分開,容易對(duì)醫(yī)生的判斷產(chǎn)生嚴(yán)重的干擾。
為了提高醫(yī)生的工作效率同時(shí)降低誤診率,近年來許多研究人員專注于利用計(jì)算機(jī)輔助診斷系統(tǒng)實(shí)現(xiàn)肺結(jié)節(jié)分割的研究[2-6]。Kostis等[7]首先采用自適應(yīng)閾值法將肺結(jié)節(jié)從肺實(shí)質(zhì)中分離出來,接著利用形態(tài)學(xué)操作實(shí)現(xiàn)了對(duì)肺結(jié)節(jié)輪廓較為精細(xì)的分割;Dehmeshki 等[8]提出了一種自適應(yīng)區(qū)域生長(zhǎng)的肺結(jié)節(jié)分割方法,該方法在待分割的肺結(jié)節(jié)區(qū)域放置種子點(diǎn),根據(jù)肺結(jié)節(jié)區(qū)域與背景區(qū)域?qū)Ρ榷炔煌奶匦?,自適應(yīng)地對(duì)肺結(jié)節(jié)進(jìn)行分割;馮寶等[9]通過結(jié)合肺結(jié)節(jié)的小波能量和漢森形狀指數(shù)特征,利用活動(dòng)輪廓模型對(duì)肺結(jié)節(jié)中的實(shí)性部分進(jìn)行分割。以上方法雖然能夠較好地實(shí)現(xiàn)肺結(jié)節(jié)的分割,但均依賴于人對(duì)于肺結(jié)節(jié)的先驗(yàn)知識(shí),不同的人對(duì)分割初始條件的設(shè)定都會(huì)影響到最終的分割效果。因此需要研究一種新的方法,讓機(jī)器自動(dòng)地學(xué)習(xí)并提取圖像特征,最終實(shí)現(xiàn)肺結(jié)節(jié)分割,從而排除不同的人所產(chǎn)生的干擾,讓分割結(jié)果更加客觀。
目前,深度學(xué)習(xí)廣泛應(yīng)用于計(jì)算機(jī)視覺領(lǐng)域并取得成功。神經(jīng)網(wǎng)絡(luò)通過模仿人腦構(gòu)造,利用大數(shù)據(jù),能夠自動(dòng)地完成對(duì)特定物體的學(xué)習(xí),如Kumar等[10]利用卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Network,CNN)實(shí)現(xiàn)了對(duì)肺結(jié)節(jié)的良惡性分類,Wang 等[11]通過多尺度的CNN有效地對(duì)肺結(jié)節(jié)進(jìn)行檢測(cè)與分割。在圖像分割方面,Long 等[12]在CNN 的基礎(chǔ)上,創(chuàng)造性地提出了一種全卷積神經(jīng)網(wǎng)絡(luò)(Fully Convolutional Network,F(xiàn)CN)。他們用卷積層替換CNN中的全連接層以獲得圖像中每個(gè)像素的分類結(jié)果,最終實(shí)現(xiàn)圖像分割;Ronneberger 等[13]隨后提出了一種新的FCN網(wǎng)絡(luò),U-Net。該網(wǎng)絡(luò)具有對(duì)稱的U 型結(jié)構(gòu),通過對(duì)圖像特征的編碼與解碼,并融合網(wǎng)絡(luò)高低層語(yǔ)義特征,可以實(shí)現(xiàn)較好的分割效果。與FCN相比,U-Net能夠在較少樣本量的情況下完成模型訓(xùn)練并實(shí)現(xiàn)圖像分割。由于在醫(yī)學(xué)圖像處理中,通常難以獲取許多高質(zhì)量的醫(yī)學(xué)圖像,因此該網(wǎng)絡(luò)也經(jīng)常應(yīng)用于醫(yī)學(xué)圖像分割中。但是,肺結(jié)節(jié)等醫(yī)學(xué)圖像具有邊緣模糊、目標(biāo)區(qū)域小等特點(diǎn),僅僅使用原始U-Net 對(duì)其訓(xùn)練,存在梯度消失、特征利用率低等問題,最終導(dǎo)致模型的分割準(zhǔn)確率難以提高。
基于此,本文在現(xiàn)有U-Net 網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,針對(duì)其存在的不足,提出了一種改進(jìn)的Dense-UNet 網(wǎng)絡(luò)的肺結(jié)節(jié)分割算法。該算法加強(qiáng)了網(wǎng)絡(luò)對(duì)特征的傳遞與利用,能夠有效緩解類不平衡問題,并對(duì)肺結(jié)節(jié)等小目標(biāo)區(qū)域的分割具有較大的改善。本文利用LIDCIDRI 肺結(jié)節(jié)公開數(shù)據(jù)集對(duì)改進(jìn)網(wǎng)絡(luò)的有效性進(jìn)行驗(yàn)證,結(jié)果表明該網(wǎng)絡(luò)能夠顯著提高肺結(jié)節(jié)分割的準(zhǔn)確率。本文的主要貢獻(xiàn)有以下兩個(gè)方面:
(1)損失函數(shù):在傳統(tǒng)語(yǔ)義分割中所使用的二值交叉熵(Binary Cross Entropy,BCE)損失函數(shù)的基礎(chǔ)上,結(jié)合Dice 相似系數(shù)(Dice Similarity Coefficient,DSC)損失函數(shù),組成混合損失函數(shù)。該混合損失函數(shù)保證了網(wǎng)絡(luò)能夠穩(wěn)定且有針對(duì)地對(duì)難以學(xué)習(xí)的樣本進(jìn)行優(yōu)化,從而緩解類不平衡問題,改善網(wǎng)絡(luò)的分割結(jié)果。
(2)網(wǎng)絡(luò)結(jié)構(gòu):借鑒了DenseNet 中密集連接(Dense Connection)的概念,在U-Net網(wǎng)絡(luò)的卷積層之間引入密集連接,將網(wǎng)絡(luò)中上下卷積層之間的特征結(jié)合起來。針對(duì)部分小目標(biāo)區(qū)域存在提取特征困難的問題,通過密集連接方式,可以加強(qiáng)網(wǎng)絡(luò)對(duì)特征的傳遞與利用,同時(shí)解決梯度消失的問題。
本文所使用的肺部CT圖像來源于LIDC-IDRI肺結(jié)節(jié)公開數(shù)據(jù)庫(kù)[14]。該數(shù)據(jù)庫(kù)是由美國(guó)國(guó)家癌癥研究所發(fā)起收集,其中一共包含了1 018 個(gè)病例。對(duì)于每個(gè)病例中的CT 圖像,都有4 名放射科醫(yī)生對(duì)肺結(jié)節(jié)的輪廓及其他征象信息進(jìn)行標(biāo)注,并將其存放至XML 格式的文件中。
由于肺結(jié)節(jié)在原始肺部CT 圖像中所占比例很小,即代表肺結(jié)節(jié)類別的像素?cái)?shù)量遠(yuǎn)小于背景類別的像素?cái)?shù)量,這種因正負(fù)樣本數(shù)量不均衡而產(chǎn)生的類不平衡問題會(huì)嚴(yán)重影響神經(jīng)網(wǎng)絡(luò)的訓(xùn)練過程,最終影響網(wǎng)絡(luò)的分割性能。因此,本文對(duì)含有肺結(jié)節(jié)的原始CT 圖像樣本進(jìn)行裁剪以減少肺部其他組織對(duì)實(shí)驗(yàn)結(jié)果帶來的干擾。原始CT圖像的尺寸為512×512像素,根據(jù)XML文件中醫(yī)生對(duì)肺結(jié)節(jié)位置信息的標(biāo)注,將原始CT 圖像裁剪成尺寸為64×64像素大小的圖像,結(jié)果如圖1所示。
圖1 CT圖像預(yù)處理
由于在U-Net網(wǎng)絡(luò)中,每一層所提取的特征通常只被學(xué)習(xí)一次,不同層次的特征之間缺乏聯(lián)系,因此網(wǎng)絡(luò)對(duì)于特征的利用率較低,影響最終的分割準(zhǔn)確率。相比之下,DenseNet[15]利用密集連接,使得網(wǎng)絡(luò)中當(dāng)前層的特征與之前所有層的特征結(jié)合起來,并將該所得特征傳遞到后續(xù)的所有層。通過這種級(jí)聯(lián)方式,每一層網(wǎng)絡(luò)都能學(xué)習(xí)到前幾層的特征,這不僅可以加強(qiáng)網(wǎng)絡(luò)對(duì)特征的傳遞,從而實(shí)現(xiàn)特征的復(fù)用,還能夠緩解網(wǎng)絡(luò)中梯度消失的問題。假設(shè)DenseNet 網(wǎng)絡(luò)中第l層的輸出為xl,則xl的定義為:
式中,函數(shù)Hl表示第l層的非線性變換,[…]表示網(wǎng)絡(luò)中各層特征的融合操作。
本文借鑒了DenseNet 中密集連接的概念,設(shè)計(jì)了密集連接模塊,其結(jié)構(gòu)如圖2所示。每個(gè)密集連接模塊主要包含了兩個(gè)3×3 的卷積層和兩次特征融合操作。對(duì)于輸入密集連接模塊的特征圖,在每經(jīng)過一次卷積操作后,所產(chǎn)生的特征圖便與最原始的特征圖進(jìn)行融合形成新的特征圖,最后再將特征圖輸入下一個(gè)密集連接模塊。
圖2 密集連接模塊結(jié)構(gòu)
此外,每個(gè)卷積層后面均添加了批量歸一化(Batch Normalization,BN)層[16]和修正線性單元(Rectified Linear unit,ReLu)激活層[17],以此提高網(wǎng)絡(luò)的性能。其中,批量歸一化層是為了解決網(wǎng)絡(luò)的訓(xùn)練效果容易受到初始數(shù)據(jù)分布的影響、模型泛化能力差等問題而提出的。批量歸一化層首先對(duì)輸入數(shù)據(jù)xi進(jìn)行歸一化操作:
式中,m為輸入數(shù)據(jù)的批量大小,μB為均值,為方差,ε為平滑因子,避免分母為零。上述操作改變了網(wǎng)絡(luò)所學(xué)到的數(shù)據(jù)特征分布,為了避免網(wǎng)絡(luò)學(xué)習(xí)效果受到特征分布改變帶來的影響,需要對(duì)歸一化后的數(shù)據(jù)進(jìn)行轉(zhuǎn)換重構(gòu):
式中,γ和β為可學(xué)習(xí)重構(gòu)參數(shù)。yi即為網(wǎng)絡(luò)對(duì)輸入數(shù)據(jù)xi進(jìn)行批量歸一化操作后的輸出值。
修正線性單元激活層負(fù)責(zé)將神經(jīng)網(wǎng)絡(luò)中神經(jīng)元的輸入映射到輸出端,為網(wǎng)絡(luò)引入了非線性因素,由此提高了網(wǎng)絡(luò)的非線性表達(dá)能力。其公式定義如下:
本文根據(jù)基本的U-Net 網(wǎng)絡(luò)結(jié)構(gòu)并結(jié)合密集連接模塊設(shè)計(jì)了一種改進(jìn)的Dense-UNet 模型,其網(wǎng)絡(luò)結(jié)構(gòu)如圖3 所示。Dense-UNet 由編碼器、解碼器、分類器和跳躍連接(Skip Connection)組成。編碼器部分包含了密集連接模塊和最大池化層,其中,密集連接模塊通過卷積層用于提取圖像的語(yǔ)義特征,最大池化層用于特征圖的下采樣操作,在減少網(wǎng)絡(luò)運(yùn)算量的同時(shí)能夠增加特征圖的感受野(Receptive Field),提高圖像特征的魯棒性。對(duì)于輸入網(wǎng)絡(luò)的圖像,首先會(huì)經(jīng)過密集連接模塊進(jìn)行兩次卷積操作,得到尺寸大小為64×64 的特征圖,隨后經(jīng)由池化操作將特征圖的尺寸大小減半。最終,在經(jīng)過四次卷積和池化操作后,得到4×4 大小的特征圖。
圖3 Dense-UNet網(wǎng)絡(luò)結(jié)構(gòu)
解碼器部分包含了密集連接模塊和反卷積層,其中,反卷積層用于特征圖的上采樣操作,從而恢復(fù)特征圖的分辨率。特征圖每經(jīng)過一次反卷積操作,其尺寸大小都增大一倍,最終可以得到大小與輸入圖像相同的特征圖。此外,在編碼器和解碼器之間通過一個(gè)密集連接模塊進(jìn)行連接。
分類器由1×1卷積層和sigmoid激活層組成,其中,1×1卷積層用于減少特征圖的數(shù)量,sigmoid激活層用于計(jì)算最終的特征圖中每個(gè)像素的類別,從而輸出網(wǎng)絡(luò)的分割概率圖。跳躍連接將網(wǎng)絡(luò)中的淺層簡(jiǎn)單特征與深層抽象特征融合起來,從而可以得到更為精細(xì)的分割結(jié)果。表1為Dense-UNet模型中各層的參數(shù)設(shè)置。
在二分類的語(yǔ)義分割任務(wù)中,常用的損失函數(shù)是二值交叉熵?fù)p失函數(shù),公式如下:
式中,gi為像素點(diǎn)i的真實(shí)類別,pi為網(wǎng)絡(luò)對(duì)像素點(diǎn)i的預(yù)測(cè)結(jié)果。
使用二值交叉熵?fù)p失函數(shù)進(jìn)行優(yōu)化,能夠穩(wěn)定地將各個(gè)類別所對(duì)應(yīng)的梯度進(jìn)行回傳,有效地解決網(wǎng)絡(luò)在反向傳播過程中梯度消失的問題。但由于該損失函數(shù)在梯度回傳的過程中對(duì)圖像上的每一個(gè)類別都平等地進(jìn)行評(píng)估,所以對(duì)于存在類不平衡問題的圖像來說,其中最常見的類別更容易改變網(wǎng)絡(luò)的優(yōu)化方向,進(jìn)而影響最終的分割結(jié)果。
表1 Dense-UNet網(wǎng)絡(luò)各層的參數(shù)設(shè)置
此外,另一種用于分割任務(wù)的損失函數(shù)為Dice相似系數(shù)損失函數(shù),公式如下:
Dice 相似系數(shù)損失函數(shù)能夠指導(dǎo)網(wǎng)絡(luò)通過不斷學(xué)習(xí),讓預(yù)測(cè)結(jié)果逐漸逼近真實(shí)結(jié)果。但是一旦預(yù)測(cè)結(jié)果中有部分像素預(yù)測(cè)錯(cuò)誤,會(huì)導(dǎo)致預(yù)測(cè)目標(biāo)的梯度變化劇烈,從而使得網(wǎng)絡(luò)的訓(xùn)練過程變得困難。
本文根據(jù)二值交叉熵和Dice 相似系數(shù)損失函數(shù)的特點(diǎn),提出了一種混合損失函數(shù),公式如下:
式中,α為權(quán)重因子,用于調(diào)節(jié)兩種損失函數(shù)所占權(quán)重。
本文實(shí)驗(yàn)的環(huán)境是基于深度學(xué)習(xí)框架Keras 結(jié)合Python編程語(yǔ)言進(jìn)行搭建的。計(jì)算機(jī)配置如下:操作系統(tǒng)為Windows10;處理器為Intel Corei7-8700K;顯卡為NVIDIA RTX 2080Ti,11 GB內(nèi)存;系統(tǒng)內(nèi)存為32 GB。
本文從LIDC-IDRI 數(shù)據(jù)庫(kù)中篩選出切片厚度不大于3 mm的CT圖像作為實(shí)驗(yàn)所需的數(shù)據(jù)集,最終得到總共5 108 張經(jīng)過預(yù)處理的圖像,并按照8∶1∶1 的比例分別將其劃分為訓(xùn)練集、驗(yàn)證集和測(cè)試集。其中,訓(xùn)練集用來訓(xùn)練模型,驗(yàn)證集用來調(diào)節(jié)模型參數(shù)使其性能達(dá)到最優(yōu),測(cè)試集用來驗(yàn)證所訓(xùn)練模型的性能,三者之間互不重疊。最后,根據(jù)XML中醫(yī)生對(duì)肺結(jié)節(jié)輪廓的標(biāo)注,生成與肺結(jié)節(jié)圖像尺寸相同的肺結(jié)節(jié)輪廓標(biāo)簽,結(jié)果如圖4所示。
圖4 實(shí)驗(yàn)數(shù)據(jù)集
為了對(duì)肺結(jié)節(jié)的分割結(jié)果進(jìn)行評(píng)估,本文采用Dice相似系數(shù)值(DSC)、準(zhǔn)確率(Precision)和召回率(Recall)作為評(píng)價(jià)指標(biāo):
式中,gi為像素點(diǎn)i的真實(shí)類別,pi為網(wǎng)絡(luò)對(duì)像素點(diǎn)i的預(yù)測(cè)結(jié)果。Dice 相似系數(shù)值是用來衡量預(yù)測(cè)結(jié)果與真實(shí)結(jié)果之間的相似程度,準(zhǔn)確率是指被正確預(yù)測(cè)為肺結(jié)節(jié)的像素總數(shù)占被預(yù)測(cè)為肺結(jié)節(jié)的像素總數(shù)的比例,召回率是指被正確預(yù)測(cè)為肺結(jié)節(jié)的像素總數(shù)占實(shí)際為肺結(jié)節(jié)的像素總數(shù)的比例。上述指標(biāo)用于肺結(jié)節(jié)分割結(jié)果的綜合評(píng)估,它們的值越大代表分割結(jié)果越好。
神經(jīng)網(wǎng)絡(luò)在訓(xùn)練過程中,選擇混合損失函數(shù)作為目標(biāo)函數(shù),采用Adam優(yōu)化器進(jìn)行優(yōu)化,其中,batch-size設(shè)置為32;初始學(xué)習(xí)率設(shè)置為10-5;動(dòng)量參數(shù)設(shè)置為0.9。
3.3.1 權(quán)重因子的選擇
本文對(duì)損失函數(shù)中的權(quán)重因子α的選擇進(jìn)行了探究,將α分別設(shè)置為0、0.2、0.4、0.6、0.8 和1。通過五組對(duì)比實(shí)驗(yàn)最終得到效果最優(yōu)的權(quán)重因子。
表2 展示了混合損失函數(shù)在不同權(quán)重因子下對(duì)Dense-UNet 性能的影響。從表中可以看出當(dāng)α取值為0.6時(shí),網(wǎng)絡(luò)的性能表現(xiàn)最佳。特別地,當(dāng)α取值為0時(shí),此時(shí)損失函數(shù)為二值交叉熵?fù)p失函數(shù);當(dāng)α取值為1時(shí),此時(shí)損失函數(shù)為相似系數(shù)損失函數(shù)。因此,本文實(shí)驗(yàn)中的α設(shè)置為0.6。
表2 不同權(quán)重因子對(duì)Dense-UNet性能的影響 %
3.3.2 訓(xùn)練迭代次數(shù)的選擇
訓(xùn)練迭代次數(shù)的選擇對(duì)網(wǎng)絡(luò)的分割性能至關(guān)重要。如果訓(xùn)練迭代次數(shù)太少,模型無法很好地?cái)M合訓(xùn)練數(shù)據(jù)的分布而容易出現(xiàn)欠擬合狀態(tài);如果訓(xùn)練迭代次數(shù)太多,模型過度依賴訓(xùn)練數(shù)據(jù)的分布而容易出現(xiàn)過擬合狀態(tài)。本文通過采用Early Stopping策略確定合適的訓(xùn)練迭代次數(shù)。
圖5 展示了在訓(xùn)練過程中Dense-UNet 在訓(xùn)練集和驗(yàn)證集上的損失值與訓(xùn)練迭代次數(shù)的關(guān)系。從圖中可以看出網(wǎng)絡(luò)的損失值隨著訓(xùn)練迭代次數(shù)的增加而降低,當(dāng)訓(xùn)練迭代次數(shù)超過30 時(shí),驗(yàn)證集的損失值趨于穩(wěn)定。因此,本文實(shí)驗(yàn)中的訓(xùn)練迭代次數(shù)設(shè)置為30。
圖5 Dense-UNet損失值與迭代次數(shù)的關(guān)系
3.4.1 不同損失函數(shù)的對(duì)比分析
為了探究不同損失函數(shù)對(duì)模型性能的影響,本文針對(duì)二值交叉熵?fù)p失函數(shù)、Dice相似系數(shù)損失函數(shù)和混合損失函數(shù)進(jìn)行了對(duì)比實(shí)驗(yàn)。表3列出了U-Net和Dense-UNet在三種不同損失函數(shù)下的分割效果,分別用BCE、Dice 和Hybrid 代表三種損失函數(shù)。從實(shí)驗(yàn)結(jié)果可以看出,兩種模型使用混合損失函數(shù)均可以達(dá)到最優(yōu)的分割結(jié)果,其原因在于肺結(jié)節(jié)區(qū)域在圖像上的占比面積較小,使用單一的損失函數(shù)進(jìn)行優(yōu)化時(shí),肺結(jié)節(jié)區(qū)域所對(duì)應(yīng)的梯度變化容易受到其他背景區(qū)域梯度的影響,導(dǎo)致網(wǎng)絡(luò)訓(xùn)練困難,而混合損失函數(shù)綜合了兩種損失函數(shù)的特點(diǎn),在網(wǎng)絡(luò)反向傳播過程中能夠?qū)﹄y以學(xué)習(xí)的樣本進(jìn)行穩(wěn)定且有針對(duì)的優(yōu)化,從而能夠緩解類不平衡的問題,提升模型的分割性能。
表3 不同損失函數(shù)對(duì)網(wǎng)絡(luò)性能的影響%
3.4.2 不同肺結(jié)節(jié)分割方法的對(duì)比分析
為了驗(yàn)證改進(jìn)的Dense-UNet 模型的分割性能,本文選取了:FCN_32s[12]、SegNet[18]、U-Net[13]和使用了批量歸一化的U-Net 四種分割網(wǎng)絡(luò)與之進(jìn)行對(duì)比。根據(jù)3.3節(jié)中的網(wǎng)絡(luò)參數(shù)設(shè)置,分別對(duì)以上五種網(wǎng)絡(luò)進(jìn)行訓(xùn)練,并利用測(cè)試集對(duì)訓(xùn)練好的模型性能進(jìn)行測(cè)試。
表4 展示了不同網(wǎng)絡(luò)在測(cè)試集上的分割結(jié)果。從表中可以看出,F(xiàn)CN_32s和SegNet的分割結(jié)果明顯低于另外三種模型的分割結(jié)果,這是由于這兩者沒有充分利用各層網(wǎng)絡(luò)所提取的圖像特征,網(wǎng)絡(luò)對(duì)于編碼器部分所提取到的特征,只是單純地進(jìn)行了上采樣操作將其恢復(fù)到輸入圖像大小,而忽略了多尺度特征在空間上進(jìn)行像素定位和分類之間的聯(lián)系,因此模型的分割結(jié)果比較粗糙。不同地,在以U-Net 結(jié)構(gòu)為基礎(chǔ)的網(wǎng)絡(luò),如U-Net、UNet+BN 和Dense-UNet 中引入了跳躍連接,網(wǎng)絡(luò)得以將淺層的簡(jiǎn)單特征和高層的抽象特征結(jié)合起來。由于高質(zhì)量的醫(yī)學(xué)圖像數(shù)量少,且目標(biāo)區(qū)域與背景的對(duì)比度低,對(duì)其提取特征較為困難,所以這類網(wǎng)絡(luò)更適合于醫(yī)學(xué)圖像分割任務(wù)。通過跳躍連接方式,利用簡(jiǎn)單特征用于像素準(zhǔn)確定位以及抽象特征用于像素準(zhǔn)確分類的特點(diǎn),將兩者結(jié)合從而幫助網(wǎng)絡(luò)得到更為精細(xì)的分割結(jié)果。
表4 Dense-UNet與其他網(wǎng)絡(luò)分割結(jié)果對(duì)比%
本文方法的Dice相似系數(shù)值、精確率和召回率分別達(dá)到了84.48%、85.35%和83.81%,與U-Net和UNet+BN相比,最終的分割結(jié)果均有不同程度的提升,這是由于一方面改進(jìn)的Dense-UNet模型中不僅采用了跳躍連接方式,而且還通過密集連接模塊將相鄰網(wǎng)絡(luò)層中提取的特征融合起來,既能夠進(jìn)一步加強(qiáng)網(wǎng)絡(luò)對(duì)特征的傳遞與利用,同時(shí)也能夠緩解網(wǎng)絡(luò)中梯度消失的問題,因此改進(jìn)的Dense-UNet對(duì)圖像中的微小或邊界模糊的肺結(jié)節(jié)區(qū)域具有更強(qiáng)的學(xué)習(xí)能力;另一方面,改進(jìn)的Dense-UNet模型通過批量歸一化操作能夠有效地統(tǒng)一訓(xùn)練數(shù)據(jù)的分布,從而提高了網(wǎng)絡(luò)的收斂速度,改善了網(wǎng)絡(luò)的優(yōu)化性能,獲得更為精確的分割結(jié)果。
五種網(wǎng)絡(luò)的分割結(jié)果的可視化如圖6所示,圖中第一列是輸入模型的肺結(jié)節(jié)圖像,第二列是醫(yī)生標(biāo)注的肺結(jié)節(jié)輪廓金標(biāo)準(zhǔn),最后一列是使用本文算法對(duì)肺結(jié)節(jié)分割的結(jié)果。由于方法[12]和[18]忽略了多尺度特征融合的重要性,使得最終的分割結(jié)果非常粗糙,只能實(shí)現(xiàn)對(duì)肺結(jié)節(jié)的大致定位。對(duì)比觀察圖中最后四行的圖像,肺結(jié)節(jié)在圖像中所占比例較小,且其像素值與背景區(qū)域中的血管等組織相近,未改進(jìn)的網(wǎng)絡(luò)容易受到與病灶相似的干擾區(qū)域的影響,錯(cuò)誤地將背景區(qū)域預(yù)測(cè)為肺結(jié)節(jié)區(qū)域,并且分割結(jié)果誤差較大。相比之下,本文提出的Dense-UNet能夠有效地區(qū)分肺結(jié)節(jié)與其他肺部組織,對(duì)肺結(jié)節(jié)輪廓的預(yù)測(cè)更為精確,同時(shí)分割結(jié)果中的假陽(yáng)性樣本也較少。綜上所述,改進(jìn)的Dense-UNet 網(wǎng)絡(luò)與其他分割網(wǎng)絡(luò)相比,分割效果得到顯著提升,在針對(duì)微小或邊界模糊的肺結(jié)節(jié)的分割過程中魯棒性高,具有良好的分割性能。
準(zhǔn)確地對(duì)肺結(jié)節(jié)進(jìn)行分割對(duì)于肺癌的早期診斷至關(guān)重要。本文在U-Net網(wǎng)絡(luò)結(jié)構(gòu)的基礎(chǔ)上,提出了一種用于肺結(jié)節(jié)分割的Dense-UNet 網(wǎng)絡(luò)。改進(jìn)的Dense-UNet 網(wǎng)絡(luò)在卷積層之間引入密集連接模塊,將網(wǎng)絡(luò)上下層的特征融合起來,進(jìn)一步加強(qiáng)了網(wǎng)絡(luò)對(duì)特征的傳遞和利用,有效地提高了網(wǎng)絡(luò)的分割性能,并且能夠解決梯度消失的問題;同時(shí)采用改進(jìn)的混合損失函數(shù)幫助網(wǎng)絡(luò)對(duì)難以學(xué)習(xí)的樣本進(jìn)行穩(wěn)定且有針對(duì)的優(yōu)化,以解決網(wǎng)絡(luò)在訓(xùn)練過程中面臨的類不平衡問題。本文實(shí)驗(yàn)數(shù)據(jù)來源于LIDC-IDRI 肺結(jié)節(jié)公開數(shù)據(jù)庫(kù),通過與FCN_32s、SegNet、U-Net 和使用了批量歸一化的 U-Net 四種分割網(wǎng)絡(luò)的實(shí)驗(yàn)結(jié)果對(duì)比,表明了改進(jìn)的Dense-UNet網(wǎng)絡(luò)能夠有效地區(qū)分肺結(jié)節(jié)與背景區(qū)域,實(shí)現(xiàn)對(duì)肺結(jié)節(jié)的準(zhǔn)確分割,具有良好的分割性能。然而本文算法仍然存在一些局限性,由于肺結(jié)節(jié)病灶存在于多張CT 切片中,本文方法只關(guān)注了單張切片中的病灶區(qū)域,而忽略了相鄰切片圖像之間的聯(lián)系,對(duì)于較小的肺結(jié)節(jié)病灶難免出現(xiàn)一些錯(cuò)檢或漏檢的現(xiàn)象。因此,利用相鄰切片中肺結(jié)節(jié)病灶之間的像素聯(lián)系以提高分割準(zhǔn)確率將是下一步的研究重點(diǎn)。
圖6 不同模型的肺結(jié)節(jié)分割結(jié)果圖