馬巧梅,梁昊然,郎雅琨
(1.中北大學(xué) 軟件學(xué)院,山西 太原 030051;2.山西省軍民融合軟件技術(shù)工程研究中心,山西 太原 030051)
計(jì)算機(jī)輔助診斷(computer aided detection,CAD)系統(tǒng)可以幫助醫(yī)生提高診斷速度和準(zhǔn)確率。早期肺結(jié)節(jié)檢測(cè)通過(guò)提取圖像特征,結(jié)合機(jī)器學(xué)習(xí)相關(guān)的分類(lèi)器對(duì)結(jié)節(jié)分類(lèi)[1-4]。隨著醫(yī)學(xué)成像技術(shù)的發(fā)展,傳統(tǒng)的檢測(cè)方法難以適應(yīng)當(dāng)前大量復(fù)雜的數(shù)據(jù)集,同時(shí)手工提取特征的步驟較為復(fù)雜,無(wú)法有效挖掘圖像中豐富的信息。
隨著深度學(xué)習(xí)的發(fā)展,將該方法應(yīng)用在肺結(jié)節(jié)檢測(cè)中可以獲得比淺層學(xué)習(xí)更好的特征表示能力[5]。卷積神經(jīng)網(wǎng)絡(luò)提取的抽象特征對(duì)圖像分類(lèi)和物體粗略定位有效,但很難精細(xì)分割物體輪廓。為解決上述問(wèn)題,相繼提出了SegNet[6]和U-Net[7]等僅使用卷積層進(jìn)行語(yǔ)義分割的網(wǎng)絡(luò)。U-Net網(wǎng)絡(luò)為醫(yī)學(xué)圖像精準(zhǔn)分割定位提供解決思路,在肺結(jié)節(jié)檢測(cè)中取得了較好的檢測(cè)效果[8-10]。本文針對(duì)現(xiàn)有肺結(jié)節(jié)檢測(cè)模型精度低、漏診率和誤診率高等問(wèn)題提出了融合深度殘差網(wǎng)絡(luò)[11]的肺結(jié)節(jié)檢測(cè)算法,在LUNA16[12]數(shù)據(jù)集上驗(yàn)證取得了良好的檢測(cè)結(jié)果。
本文提出了融合殘差模塊的肺結(jié)節(jié)檢測(cè)算法,主要包括以下步驟:①候選結(jié)節(jié)檢測(cè)階段:采用提出的RU-Net網(wǎng)絡(luò)分割肺部CT圖像,獲得候選結(jié)節(jié);②假陽(yáng)性減少階段:采用基于3D CNN的分類(lèi)網(wǎng)絡(luò),將候選結(jié)節(jié)分類(lèi)得到真實(shí)肺結(jié)節(jié)。
候選結(jié)節(jié)檢測(cè)階段的主要目的是以較快的檢測(cè)速度和較高的敏感度盡可能多的在肺部CT圖像中檢測(cè)到所有候選結(jié)節(jié)。本文提出了二維RU-Net候選結(jié)節(jié)檢測(cè)模型,該網(wǎng)絡(luò)在充分節(jié)省時(shí)間和空間的利用下提高了檢測(cè)精度和敏感度,模型框架如圖1所示。
圖1 RU-Net候選結(jié)節(jié)檢測(cè)模型框架
1.1.1 數(shù)據(jù)預(yù)處理
肺部CT圖像是對(duì)整個(gè)胸腔區(qū)域的掃描圖像,包含了肺部及其之外的其它組織和器官。為提高檢測(cè)精度和速度,同時(shí)防止檢測(cè)過(guò)程中肺部之外其它組織器官對(duì)肺結(jié)節(jié)檢測(cè)的干擾,需要對(duì)數(shù)據(jù)進(jìn)行預(yù)處理操作,分割肺實(shí)質(zhì)部分。
CT采集后所得的數(shù)值為X射線衰減值[13],單位為亨氏單位(hounsfield unit,HU),表示CT圖像上組織結(jié)構(gòu)的相對(duì)密度。根據(jù)圖像的HU值可以區(qū)分肺、血液、骨骼和其它組織器官,HU值計(jì)算公式如下
(1)
式中:μ為吸收系數(shù)或衰減系數(shù),與X射線強(qiáng)度有關(guān)。其中,CT圖像中肺部區(qū)域的HU值在-500左右,需要過(guò)濾掉空氣、骨骼和其它組織器官等像素信息。
本文對(duì)LUNA16數(shù)據(jù)集進(jìn)行數(shù)據(jù)預(yù)處理,首先提取肺部感興趣區(qū)域進(jìn)行二值化,通過(guò)像素亮度分布分離圖像區(qū)域;結(jié)合圖像形態(tài)學(xué)操作的腐蝕和膨脹消除肺部的小空洞區(qū)域;標(biāo)記連通區(qū)域獲得肺部掩模,與原始圖像進(jìn)行與操作;最終通過(guò)歸一化處理將圖像像素強(qiáng)度范圍裁剪為[-1000, 400],并將其標(biāo)準(zhǔn)化為[0, 255]。預(yù)處理具體步驟如圖2所示。
圖2 數(shù)據(jù)集預(yù)處理步驟
1.1.2 提出的RU-Net網(wǎng)絡(luò)結(jié)構(gòu)
U-Net網(wǎng)絡(luò)是由編碼器(encoder)和解碼器(decoder)構(gòu)成的U型對(duì)稱(chēng)結(jié)構(gòu),分別用來(lái)提取語(yǔ)義特征和用于精確定位,網(wǎng)絡(luò)在結(jié)構(gòu)上包含下采樣、上采樣和跳轉(zhuǎn)連接3個(gè)重要特點(diǎn)。編碼器部分由卷積和池化操作構(gòu)成,通過(guò)下采樣逐步提取圖像特征獲得高層抽象信息;解碼器通過(guò)反卷積層逐級(jí)上采樣,恢復(fù)圖像細(xì)節(jié)和空間維度信息;編碼器和解碼器之間通過(guò)跳轉(zhuǎn)連接融合特征,使上采樣結(jié)合淺層卷積特征獲得更多高分辨率信息,從而完善細(xì)節(jié)信息恢復(fù)圖像并提高分割精度。然而原始U-Net結(jié)構(gòu)存在不足之處,如易導(dǎo)致空間信息丟失、編碼器和解碼器間存在語(yǔ)義鴻溝[14]和對(duì)特征表達(dá)不準(zhǔn)確等問(wèn)題。針對(duì)在醫(yī)學(xué)圖像分割方面的缺陷,研究人員提出了如MultiResUNet[14]和CE-Net[15]等改進(jìn)結(jié)構(gòu),在不同醫(yī)學(xué)圖像數(shù)據(jù)集上都取得了較好的效果。
本文針對(duì)上述問(wèn)題,融合改進(jìn)的深度殘差模塊提出了RU-Net網(wǎng)絡(luò):①將下采樣和上采樣中的卷積層由殘差單元替代,增強(qiáng)特征提取性能,獲得豐富的結(jié)節(jié)特征;②在跳轉(zhuǎn)連接中加入串聯(lián)的殘差塊,減弱低層特征直接同高層特征拼接而產(chǎn)生的語(yǔ)義鴻溝。
殘差網(wǎng)絡(luò)主要由殘差單元構(gòu)成,當(dāng)神經(jīng)網(wǎng)絡(luò)輸入為x,輸出特征為H(x)時(shí),其學(xué)習(xí)到的殘差為F(x)=H(x)-x。在網(wǎng)絡(luò)中增加y=x的同等映射,通過(guò)跳轉(zhuǎn)連接將F(x)和x逐元素相加,最終將原函數(shù)轉(zhuǎn)換為F(x)+x構(gòu)成一個(gè)殘差單元如圖3(a)所示。本文采用的殘差單元包括兩個(gè)3×3的卷積層,在卷積操作之前采用批量標(biāo)準(zhǔn)化(batch normalization,BN)和ReLU(rectified linear unit)激活函數(shù)處理如圖3(b)所示。殘差單元通過(guò)跳轉(zhuǎn)連接將梯度自由傳遞到較低層,防止梯度消失或爆炸,核大小為3×3使參數(shù)較少且計(jì)算速度更快有利于提取局部特征。采用BN操作使網(wǎng)絡(luò)的輸入保持相同分布,提升網(wǎng)絡(luò)訓(xùn)練速度,避免產(chǎn)生梯度消失問(wèn)題。在U-Net網(wǎng)絡(luò)中添加殘差單元,使網(wǎng)絡(luò)增加一定深度提高檢測(cè)準(zhǔn)確率,同時(shí)緩解了深度增加造成梯度消失和梯度爆炸等問(wèn)題,保證模型良好的性能。
圖3 殘差單元
跳轉(zhuǎn)連接將淺層特征與深層特征拼接以保留空間特征,然而兩組特征之間可能存在語(yǔ)義差異,造成編碼器和解碼器之間產(chǎn)生語(yǔ)義鴻溝,對(duì)預(yù)測(cè)產(chǎn)生不利影響。為彌補(bǔ)特征差異造成的細(xì)節(jié)丟失,本文采用殘差跳轉(zhuǎn)連接替換原始網(wǎng)絡(luò)中的跳轉(zhuǎn)連接,以改進(jìn)編碼器和解碼器之間的特征映射。在跳轉(zhuǎn)連接中增加串聯(lián)的殘差塊,減少特征之間的語(yǔ)義差距,每個(gè)殘差塊都由3×3和1×1的卷積層通過(guò)跳轉(zhuǎn)連接相加構(gòu)成,具體結(jié)構(gòu)如圖4所示。
圖4 殘差跳轉(zhuǎn)連接
由于編碼器通過(guò)下采樣操作不斷加深特征提取,編碼器和解碼器之間特征的語(yǔ)義差異也逐漸減小。因此在跳轉(zhuǎn)連接的路徑上對(duì)3條路徑采用殘差跳轉(zhuǎn)連接,分別串聯(lián)了3,2和1個(gè)殘差塊,對(duì)差距最小的兩組特征直接采用跳轉(zhuǎn)連接進(jìn)行拼接融合。通過(guò)改進(jìn)跳轉(zhuǎn)連接結(jié)構(gòu)可以更好保存淺層細(xì)節(jié)信息,同時(shí)結(jié)合深層信息獲得更精確的特征信息,提高對(duì)結(jié)節(jié)的檢測(cè)性能。
本文提出的RU-Net網(wǎng)絡(luò)中,卷積層均由3×3的卷積核構(gòu)成,每層卷積核的數(shù)量為32,64,128,256和512,分別沿網(wǎng)絡(luò)層排序。網(wǎng)絡(luò)每層均包含卷積層和殘差塊,該網(wǎng)絡(luò)除輸出層外均由ReLU激活函數(shù)構(gòu)成,用于加速訓(xùn)練和防止過(guò)擬合,同時(shí)增加BN操作加速訓(xùn)練速度提高網(wǎng)絡(luò)泛化能力。輸出層由Sigmoid激活函數(shù)構(gòu)成公式如下
(2)
式中:x為輸入,f(x)為輸出。
1.1.3 改進(jìn)的損失函數(shù)
肺結(jié)節(jié)的分割任務(wù)主要針對(duì)肺部CT中的小目標(biāo)圖像進(jìn)行,往往一幅圖像中只有極少的候選結(jié)節(jié),且候選結(jié)節(jié)的像素比例較小,這造成了圖像類(lèi)別不均衡問(wèn)題,使網(wǎng)絡(luò)訓(xùn)練較為困難。在醫(yī)學(xué)圖像的檢測(cè)任務(wù)中,假陰性比假陽(yáng)性更難以容忍,使用不均衡數(shù)據(jù)訓(xùn)練模型可能導(dǎo)致預(yù)測(cè)結(jié)果嚴(yán)重偏向于高精度但低敏感度的問(wèn)題。為解決候選結(jié)節(jié)檢測(cè)在分割中類(lèi)別極度不均衡問(wèn)題,本文對(duì)比使用不同的損失函數(shù),以提高檢測(cè)敏感度。
原始U-Net分割網(wǎng)絡(luò)使用基于Dice系數(shù)的損失函數(shù),采用Dice距離對(duì)比兩個(gè)樣本元素之間像素級(jí)的相似性,Dice系數(shù)公式如下
(3)
式中:P表示預(yù)測(cè)值,G表示真實(shí)標(biāo)簽。
Dice系數(shù)可以處理背景和分割區(qū)域之間面積對(duì)比不均衡問(wèn)題,基于Dice系數(shù)的損失函數(shù)在訓(xùn)練準(zhǔn)確度上表現(xiàn)較好,但可能會(huì)丟失部分真實(shí)結(jié)節(jié),造成訓(xùn)練結(jié)果的不可信。在候選結(jié)節(jié)檢測(cè)任務(wù)中,需要盡可能多地保留真實(shí)結(jié)節(jié)以提高檢測(cè)敏感度,因此本文針對(duì)損失函數(shù)進(jìn)行改進(jìn)。
為解決醫(yī)學(xué)圖像分割數(shù)據(jù)不平衡問(wèn)題,Salehi等[16]提出了一種基于Tversky系數(shù)的廣義損失函數(shù),其中Tversky系數(shù)定義如下
(4)
式中:|P-G|表示假陽(yáng)性(FP),|G-P|表示假陰性(FN),通過(guò)調(diào)整α和β兩個(gè)超參數(shù)可以控制FP和FN之間的權(quán)衡,實(shí)現(xiàn)高度不平衡數(shù)據(jù)在準(zhǔn)確率和敏感度之間的平衡。
Tversky系數(shù)是一種廣義系數(shù),當(dāng)α=β=0.5時(shí),該系數(shù)為Dice系數(shù);當(dāng)α=β=1時(shí),該系數(shù)為Jaccard系數(shù)。本文為提高候選結(jié)節(jié)檢測(cè)敏感度,盡可能多地獲得候選結(jié)節(jié),結(jié)合Dice系數(shù)和Tversky系數(shù)特點(diǎn),將基于Tversky系數(shù)的損失函數(shù)應(yīng)用在候選結(jié)節(jié)檢測(cè)任務(wù)中。通過(guò)實(shí)驗(yàn)對(duì)比不同超參數(shù)取值對(duì)像素分類(lèi)的敏感度,確定最終參數(shù)值。本方法使模型在保證一定檢測(cè)準(zhǔn)確率的前提下,增加了在分類(lèi)階段的候選結(jié)節(jié),為假陽(yáng)性減少階段提供豐富的候選結(jié)節(jié)信息。
肺結(jié)節(jié)檢測(cè)任務(wù)中,在候選結(jié)節(jié)檢測(cè)階段為提高檢測(cè)敏感度往往會(huì)出現(xiàn)較高的假陽(yáng)性。為了從大量候選結(jié)節(jié)中準(zhǔn)確鑒別出真實(shí)結(jié)節(jié),需要去除假陽(yáng)性結(jié)節(jié)。肺結(jié)節(jié)形態(tài)特征是小的、類(lèi)球形的、局限性的不正常組織,具有復(fù)雜的空間上下文環(huán)境。由于采用二維卷積神經(jīng)網(wǎng)絡(luò)往往不能充分利用三維空間上下文信息,容易忽略CT圖像中肺結(jié)節(jié)在連續(xù)切片中的變化信息。因此,本文構(gòu)造基于三維卷積神經(jīng)網(wǎng)絡(luò)(3D CNN)的分類(lèi)模型,充分利用結(jié)節(jié)豐富的空間上下文信息,獲得更具鑒別能力的特征,從而準(zhǔn)確鑒別出真實(shí)肺結(jié)節(jié),具體結(jié)構(gòu)如圖5所示。
圖5 三維卷積神經(jīng)網(wǎng)絡(luò)分類(lèi)模型框架
本階段截取以二維候選結(jié)節(jié)為中心的矩形區(qū)域,將該區(qū)域切片堆疊轉(zhuǎn)換為三維圖像,作為訓(xùn)練數(shù)據(jù)集輸入3D CNN網(wǎng)絡(luò)中進(jìn)行分類(lèi)。本文采用的3D CNN網(wǎng)絡(luò)通過(guò)三維卷積層和三維最大池化層組合構(gòu)成,從而充分提取結(jié)節(jié)的空間特征信息,最后通過(guò)全連接層輸出特征,由Softmax層輸出分類(lèi)結(jié)果。3D卷積層為減少訓(xùn)練參數(shù),均采用3×3×3的卷積核提取結(jié)節(jié)特征,每層卷積核的數(shù)量為64,128,256和512。網(wǎng)絡(luò)中每層的輸出特征圖與卷積核進(jìn)行卷積運(yùn)算,提取更高層的特征表示,卷積的計(jì)算過(guò)程可以定義為
(5)
在不同的3D卷積層中,交替采用3D最大池化層對(duì)卷積層提取特征進(jìn)行下采樣,選取區(qū)域內(nèi)的最大值進(jìn)行特征抽取,從而減少網(wǎng)絡(luò)訓(xùn)練中的數(shù)據(jù)和參數(shù)量。最后將所有全連接層中的神經(jīng)元與相鄰層神經(jīng)元相連,計(jì)算類(lèi)別概率進(jìn)行分類(lèi)。在網(wǎng)絡(luò)結(jié)構(gòu)中引入dropout和L2正則化等方法防止過(guò)擬合,提高模型的泛化能力。在模型中采用二元交叉熵函數(shù)度量分類(lèi)損失。
2.1.1 數(shù)據(jù)集
本文提出的肺結(jié)節(jié)檢測(cè)算法實(shí)驗(yàn)采用LUNA16數(shù)據(jù)集進(jìn)行驗(yàn)證,該數(shù)據(jù)集來(lái)源于最大公共肺結(jié)節(jié)數(shù)據(jù)集LIDC-IDRI,包括1018個(gè)低劑量的肺部CT影像。LUNA16數(shù)據(jù)集去除切片厚度大于3 mm、切片space不一致和缺失部分切片的CT圖像,剩下數(shù)據(jù)包括888個(gè)CT掃描,數(shù)據(jù)集中的肺結(jié)節(jié)注釋選取4名專(zhuān)業(yè)放射科醫(yī)生中至少3位標(biāo)注的1186個(gè)結(jié)節(jié)作為參考標(biāo)準(zhǔn),去除小于3 mm肺結(jié)節(jié)。
2.1.2 數(shù)據(jù)增強(qiáng)
LUNA16數(shù)據(jù)集為CT掃描圖像,標(biāo)注信息包括肺結(jié)節(jié)的位置信息和直徑大小等,圖像大小為512×512像素。在深度學(xué)習(xí)中,比較成功的神經(jīng)網(wǎng)絡(luò)需要大量的參數(shù),而使得這些參數(shù)正確工作需要大量的數(shù)據(jù)進(jìn)行訓(xùn)練。采用深度學(xué)習(xí)方法訓(xùn)練醫(yī)學(xué)圖像的主要問(wèn)題是數(shù)據(jù)集較少,為增加訓(xùn)練過(guò)程中的樣本數(shù)量,防止模型過(guò)擬合,提高模型泛化能力,需要對(duì)樣本進(jìn)行數(shù)據(jù)增強(qiáng)操作。本文數(shù)據(jù)增強(qiáng)方法主要采用圖像旋轉(zhuǎn)、圖像平移和圖像翻轉(zhuǎn)等操作。圖像旋轉(zhuǎn)通過(guò)旋轉(zhuǎn)中心點(diǎn)隨機(jī)旋轉(zhuǎn)30°到180°,圖像翻轉(zhuǎn)通過(guò)水平和垂直翻轉(zhuǎn)。利用數(shù)據(jù)增強(qiáng)方法防止模型過(guò)擬合,提高肺結(jié)節(jié)的檢測(cè)性能。
根據(jù)給定的標(biāo)簽和預(yù)測(cè)結(jié)果對(duì)比,本文采用準(zhǔn)確率(Accuracy)、敏感度(Sensitivity)和特異度(Specificity)作為評(píng)估指標(biāo)對(duì)網(wǎng)絡(luò)性能進(jìn)行評(píng)價(jià),具體定義如下
(6)
(7)
(8)
式中分別表示為真陽(yáng)性(true positive,TP)、假陽(yáng)性(false positive,F(xiàn)P)、真陰性(true negative,TN)、假陰性(false negative,F(xiàn)N)。其中,定義陽(yáng)性(positive,P)為惡性結(jié)節(jié),陰性(negative,N)為良性結(jié)節(jié),具體預(yù)測(cè)結(jié)果描述見(jiàn)表1。
表1 預(yù)測(cè)結(jié)果
針對(duì)候選結(jié)節(jié)檢測(cè)階段的評(píng)估指標(biāo)主要采用Dice系數(shù)對(duì)分割性能進(jìn)行評(píng)價(jià),評(píng)估預(yù)測(cè)分割結(jié)果與真實(shí)標(biāo)簽掩模的相似度;采用敏感度評(píng)估模型檢測(cè)全部候選結(jié)節(jié)中真實(shí)結(jié)節(jié)個(gè)數(shù)所占比例,反映發(fā)現(xiàn)病人的能力,敏感度越高,漏診率越低。分割性能好的模型應(yīng)該具有較高的Dice系數(shù)和敏感度。在假陽(yáng)性減少階段,采用準(zhǔn)確率和敏感度對(duì)網(wǎng)絡(luò)模型進(jìn)行評(píng)估,分類(lèi)性能好的網(wǎng)絡(luò)可以獲得更高的準(zhǔn)確率和敏感度。
實(shí)驗(yàn)中所有網(wǎng)絡(luò)模型均使用Python3.6編寫(xiě),在Keras(tensorflow backend)深度學(xué)習(xí)框架下搭建,同時(shí)使用GPU加速網(wǎng)絡(luò)模型的訓(xùn)練。網(wǎng)絡(luò)中均采用ReLU作為激活函數(shù),并使用Adam作為算法優(yōu)化器(初始學(xué)習(xí)率為0.0001)。為防止在模型在訓(xùn)練過(guò)程中出現(xiàn)過(guò)擬合等問(wèn)題,在網(wǎng)絡(luò)中適當(dāng)加入Dropout層,并在卷積層中使用L2正則化。本文所提出的網(wǎng)絡(luò)模型在候選結(jié)節(jié)檢測(cè)階段和假陽(yáng)性減少階段都進(jìn)行了獨(dú)立的訓(xùn)練和測(cè)試,獲得了較為理想的實(shí)驗(yàn)結(jié)果。
2.3.1 候選結(jié)節(jié)檢測(cè)結(jié)果
本文在候選結(jié)節(jié)檢測(cè)階段,針對(duì)提出的RU-Net網(wǎng)絡(luò),在相同數(shù)據(jù)集LUNA16下設(shè)計(jì)多組對(duì)比實(shí)驗(yàn)驗(yàn)證其性能。實(shí)驗(yàn)主要包括模型自身改進(jìn)效果的對(duì)比實(shí)驗(yàn),以及與其它肺結(jié)節(jié)檢測(cè)系統(tǒng)在本階段的檢測(cè)性能對(duì)比實(shí)驗(yàn)。通過(guò)所設(shè)計(jì)的幾組對(duì)比實(shí)驗(yàn),驗(yàn)證RU-Net網(wǎng)絡(luò)在候選結(jié)節(jié)檢測(cè)階段的分割性能。
在候選結(jié)節(jié)檢測(cè)任務(wù)中,為減小訓(xùn)練數(shù)據(jù)集圖像類(lèi)別不均衡問(wèn)題,獲取更高的敏感度,引入Tversky系數(shù)作為損失函數(shù)。控制該系數(shù)的兩個(gè)超參數(shù)α和β可以調(diào)整假陽(yáng)性和假陰性之間的權(quán)衡,經(jīng)過(guò)實(shí)驗(yàn)驗(yàn)證提高β的權(quán)重可以獲得更高的敏感度,改善模型訓(xùn)練中數(shù)據(jù)不均衡問(wèn)題,有效降低假陰性并提高敏感度。為了對(duì)比評(píng)估Tversky損失函數(shù)和Dice損失函數(shù)在候選結(jié)節(jié)檢測(cè)方面的性能,本文在原始U-Net網(wǎng)絡(luò)上訓(xùn)練了不同的α和β取值,見(jiàn)表2。
表2 U-Net網(wǎng)絡(luò)上訓(xùn)練Tversky損失函數(shù)不同的α和β值
結(jié)果表明,敏感度和特異度之間的平衡由損失函數(shù)的參數(shù)控制;損失一定的精確度,可以提高像素分類(lèi)的敏感度;當(dāng)超參數(shù)取α=0.1,β=0.9時(shí)可以獲得較低的損失和較高的敏感度,對(duì)比將超參數(shù)設(shè)置為α=β=0.5時(shí)的Dice損失函數(shù)檢測(cè)敏感度更高。為在候選結(jié)節(jié)檢測(cè)階段獲得更高的敏感度,盡可能多地檢測(cè)到結(jié)節(jié),本文將采用α=0.1,β=0.9的基于Tversky系數(shù)的損失函數(shù)進(jìn)行對(duì)比實(shí)驗(yàn)。
本文將RU-Net網(wǎng)絡(luò)與U-Net網(wǎng)絡(luò)進(jìn)行對(duì)比實(shí)驗(yàn),驗(yàn)證候選結(jié)節(jié)檢測(cè)模型改進(jìn)算法的有效性。首先,在相同的損失函數(shù)Dice系數(shù)下對(duì)3種模型的分割性能進(jìn)行比較,實(shí)驗(yàn)對(duì)比了原始U-Net網(wǎng)絡(luò)、融合殘差單元的ResUNet改進(jìn)結(jié)構(gòu)、融合殘差單元和殘差跳轉(zhuǎn)連接的RU-Net改進(jìn)結(jié)構(gòu)。另外,對(duì)比了這3種結(jié)構(gòu)采用改進(jìn)的損失函數(shù)的分割性能。實(shí)驗(yàn)評(píng)估了在相同的數(shù)據(jù)集下6組不同模型的性能指標(biāo),見(jiàn)表3。
表3 候選結(jié)節(jié)檢測(cè)模型性能比較
實(shí)驗(yàn)結(jié)果表明,提出的RU-Net網(wǎng)絡(luò)可以獲得更高的Dice系數(shù)和特異度;采用改進(jìn)的損失函數(shù)在犧牲一定相似度的情況下,可以大幅度提高檢測(cè)模型的敏感度。在算法效率方面,實(shí)驗(yàn)對(duì)比了所提算法在檢測(cè)單張肺部CT圖像時(shí)所需的平均時(shí)間,隨著網(wǎng)絡(luò)的加深及檢測(cè)敏感度的提升,檢測(cè)時(shí)間也會(huì)相應(yīng)增加。RU-Net網(wǎng)絡(luò)檢測(cè)單張圖像平均用時(shí)為0.030 s,在時(shí)間效率上相對(duì)優(yōu)于其它3D網(wǎng)絡(luò)算法。通過(guò)實(shí)驗(yàn)驗(yàn)證,本文提出的RU-Net網(wǎng)絡(luò)獲得了更高的敏感度和相對(duì)較好的Dice系數(shù),在候選結(jié)節(jié)檢測(cè)任務(wù)性能上優(yōu)于其它模型。
同時(shí)對(duì)比了目前在肺結(jié)節(jié)檢測(cè)方法中相同階段的模型性能,Liao等[8]采用改進(jìn)的3D CNN結(jié)構(gòu)檢測(cè)可疑候選結(jié)節(jié);Xie等[17]在候選結(jié)節(jié)檢測(cè)階段采用改進(jìn)的Faster R-CNN網(wǎng)絡(luò);ZNET[12]使用U-Net網(wǎng)絡(luò)進(jìn)行檢測(cè);鄧忠豪等[10]改進(jìn)了U-Net++的網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù)檢測(cè)候選結(jié)節(jié);另外朱輝等[18]利用多尺度特征結(jié)構(gòu)的U-Net對(duì)肺結(jié)節(jié)進(jìn)行分割。對(duì)比實(shí)驗(yàn)采用LUNA16數(shù)據(jù)集,本文提出算法在Dice系數(shù)和敏感度上均優(yōu)于其它算法,結(jié)果見(jiàn)表4。
表4 不同候選結(jié)節(jié)檢測(cè)模型性能對(duì)比
實(shí)驗(yàn)結(jié)果表明,本文提出的RU-Net網(wǎng)絡(luò)取得了0.7344的Dice系數(shù)和95.21%的敏感度,與其它網(wǎng)絡(luò)結(jié)構(gòu)相比在兩個(gè)評(píng)估指標(biāo)上均有所提高。
圖6顯示了本文提出的RU-Net網(wǎng)絡(luò)在候選結(jié)節(jié)檢測(cè)階段采用基于Tversky系數(shù)的損失函數(shù)(超參數(shù)取α=0.1,β=0.9)的分割結(jié)果。其中第1行為原始CT圖像,第2行為采用RU-Net網(wǎng)絡(luò)獲得的候選結(jié)節(jié)分割結(jié)果,第3行為在CT圖像上標(biāo)出的候選結(jié)節(jié)檢測(cè)結(jié)果。
圖6 候選結(jié)節(jié)分割結(jié)果
經(jīng)過(guò)以上幾組對(duì)比實(shí)驗(yàn),驗(yàn)證了提出的RU-Net網(wǎng)絡(luò)在候選結(jié)節(jié)檢測(cè)階段可以獲得更高的分割相似度和檢測(cè)敏感度,為下一階段提供了豐富的結(jié)節(jié)信息。候選結(jié)節(jié)檢測(cè)階段可以較為準(zhǔn)確地分割結(jié)節(jié)。然而,檢測(cè)中仍然存在較多的假陽(yáng)性結(jié)節(jié),需要對(duì)提取的候選結(jié)節(jié)進(jìn)行結(jié)節(jié)和非結(jié)節(jié)的分類(lèi),以降低假陽(yáng)性獲得真實(shí)結(jié)節(jié)。
2.3.2 假陽(yáng)性減少結(jié)果
在假陽(yáng)性減少階段,主要采用3D CNN網(wǎng)絡(luò)對(duì)結(jié)節(jié)和非結(jié)節(jié)進(jìn)行分類(lèi),去除假陽(yáng)性結(jié)節(jié)獲得真實(shí)肺結(jié)節(jié)。Liao等[8]設(shè)計(jì)了3D CNN網(wǎng)絡(luò)檢測(cè)肺結(jié)節(jié);DeepLung[19]分別設(shè)計(jì)了兩個(gè)深度3D DPN用來(lái)進(jìn)行結(jié)節(jié)檢測(cè)和分類(lèi);Xie等[17]在假陽(yáng)性減少階段采用boosting方法進(jìn)行分類(lèi),該系統(tǒng)在檢測(cè)和分類(lèi)階段均采用2D CNN結(jié)構(gòu),在節(jié)省時(shí)間和空間的利用上優(yōu)于其它算法;Gong等[9]采用基于擠壓-激勵(lì)網(wǎng)絡(luò)和殘差網(wǎng)絡(luò)的3D CNN進(jìn)行候選檢測(cè)和降低假陽(yáng)性。實(shí)驗(yàn)對(duì)比了本文提出方法與不同肺結(jié)節(jié)檢測(cè)系統(tǒng)之間的性能,實(shí)驗(yàn)結(jié)果見(jiàn)表5。
表5 不同肺結(jié)節(jié)檢測(cè)系統(tǒng)性能對(duì)比
結(jié)果表明,本文在假陽(yáng)性減少階段采用3D CNN網(wǎng)絡(luò),最終獲得了96.79%的平均準(zhǔn)確率和96.19%的平均敏感度,提高了肺結(jié)節(jié)檢測(cè)算法的性能。
在肺結(jié)節(jié)檢測(cè)任務(wù)中,算法檢測(cè)效率是需要考慮的重要內(nèi)容,高效的檢測(cè)算法可以更好的在臨床上輔助醫(yī)生做出診斷。本文采用2D和3D相結(jié)合的檢測(cè)方法,在時(shí)間和空間效率上均具有優(yōu)勢(shì)。時(shí)間效率方面,所提算法在單張CT圖像上的平均處理時(shí)間僅為0.030 s;空間效率方面,候選結(jié)節(jié)檢測(cè)和假陽(yáng)性減少階段分別采用2D和3D網(wǎng)絡(luò),在取得較好檢測(cè)結(jié)果的同時(shí)大大減少對(duì)計(jì)算資源的占用,更高效準(zhǔn)確地檢測(cè)肺結(jié)節(jié)。
本文針對(duì)肺結(jié)節(jié)檢測(cè)問(wèn)題提出一種融合殘差模塊的肺結(jié)節(jié)檢測(cè)算法,實(shí)現(xiàn)了對(duì)肺結(jié)節(jié)快速、高效、準(zhǔn)確的檢測(cè)。提出RU-Net網(wǎng)絡(luò)檢測(cè)候選結(jié)節(jié),通過(guò)改進(jìn)網(wǎng)絡(luò)結(jié)構(gòu)和損失函數(shù),提高模型的檢測(cè)速度和敏感度;采用3D CNN網(wǎng)絡(luò)分類(lèi)候選結(jié)節(jié)減少假陽(yáng)性,提高對(duì)真實(shí)結(jié)節(jié)的識(shí)別率。實(shí)驗(yàn)結(jié)果表明,本文方法對(duì)比其它檢測(cè)算法,在檢測(cè)敏感度和準(zhǔn)確率上均占優(yōu),同時(shí)具有更好的檢測(cè)效率,可以在臨床上輔助醫(yī)生做出診斷。由于醫(yī)學(xué)圖像的特殊性且缺乏大量的數(shù)據(jù)集進(jìn)行訓(xùn)練,訓(xùn)練過(guò)程中易出現(xiàn)過(guò)擬合問(wèn)題,對(duì)肺結(jié)節(jié)檢測(cè)模型精度有一定影響。針對(duì)這一問(wèn)題,將進(jìn)一步結(jié)合多模態(tài)、多尺度的融合模型進(jìn)行改進(jìn),提高肺結(jié)節(jié)檢測(cè)性能。