劉珍娟,傅迎霞,張 羽,彭 飛,張宗軍
(南京中醫(yī)藥大學(xué)附屬中西醫(yī)結(jié)合醫(yī)院放射科,江蘇省中醫(yī)藥研究院,江蘇 南京 210028)
CT已成為肺癌篩查的通用手段。近年來將深度學(xué)習(xí)(deep learning, DL)技術(shù)用于CT篩查肺結(jié)節(jié),取得了較好效果[1-2],其基礎(chǔ)首先在于獲得高質(zhì)量的CT圖像,而后需要專業(yè)醫(yī)師逐個篩查存在肺結(jié)節(jié)的病例,工作量大、效率低,易漏診小結(jié)節(jié)、特別是與血管相連者。另外,CT軸位圖像中,血管斷面、結(jié)節(jié)樣胸膜增厚、小纖維條索影均可能影響醫(yī)生診斷。本研究量化評估CT圖像重建算法對于基于DL的肺結(jié)節(jié)檢測模型的影響。影響CT成像效果的關(guān)鍵因素包括輻射劑量[3-5]、重建層厚[6-8]及算法[9-13]等。
1.1 一般資料 收集298例于我院接受肺部CT檢查患者,男147例,女151例,年齡14~90歲,中位年齡54歲。
1.2 儀器與方法 采用Philips Brilliance 16螺旋CT機(jī)于吸氣末進(jìn)行全肺掃描。囑患者仰臥,掃描參數(shù):管電壓120 kV,重建層厚1.5 mm,重建層間距1.5 mm,矩陣512×512,像素間距0.683 mm。分別采用肺窗重建(LungB)、縱隔重建(SB)及骨窗重建(EB)圖像進(jìn)行評價,見圖1。
1.3 肺結(jié)節(jié)檢出模型 采用Dr.Wise肺結(jié)節(jié)輔助診斷系統(tǒng)檢測肺結(jié)節(jié),該系統(tǒng)由肺結(jié)節(jié)候選區(qū)域提取模塊和假陽性消除模塊構(gòu)成。前者通過提取結(jié)節(jié)候選區(qū)域,結(jié)合圖像及特征金字塔進(jìn)行檢測:將整幅CT圖像作為輸入,并輸出一系列帶有置信度得分的候選區(qū)域,用每個候選區(qū)域在CT圖像中的3個方向(x,y,z)及其直徑r來表示,生成一系列不同尺度的特征圖,從而在適當(dāng)分辨率下檢測結(jié)節(jié)。后者在原始CT圖像中以候選區(qū)域為中心,裁剪出固定大小的三維圖像塊,作為假陽性消除模塊的輸入,用于消除非結(jié)節(jié)候選區(qū)域。結(jié)節(jié)大小差異巨大,影響模型訓(xùn)練,可用圖像金字塔策略來生成網(wǎng)絡(luò)的輸入,或以特征金字塔池化策略來獲取不同分類率下的圖像信息。
1.4 實驗流程 以多名醫(yī)師標(biāo)注結(jié)果作為檢驗肺結(jié)節(jié)檢出的標(biāo)準(zhǔn)。由2名主治醫(yī)師以雙盲法閱片進(jìn)行初步篩選,再以計算機(jī)判斷2名醫(yī)師標(biāo)注的一致性,若一致則判定圖像為結(jié)節(jié),若不一致則由1名副主任醫(yī)師(15年以上工作經(jīng)驗)進(jìn)行判定,并作為最終結(jié)果。
運行基于DL的肺結(jié)節(jié)檢測系統(tǒng),將其檢出結(jié)果與醫(yī)師標(biāo)注結(jié)果進(jìn)行對比,以此得到不同重建算法下該系統(tǒng)檢出結(jié)節(jié)的敏感度、準(zhǔn)確率、假陽性率和F分?jǐn)?shù)等指標(biāo)。之后分別在結(jié)節(jié)類型和尺寸劃分下對不同重建算法的指標(biāo)進(jìn)行對比分析,最后由醫(yī)師審核在不同重建算法下的系統(tǒng)檢測出的假陽性結(jié)節(jié),確認(rèn)其具體分布。
1.5 統(tǒng)計學(xué)分析 采用Scipy 1.0.0統(tǒng)計分析軟件。分別統(tǒng)計3種重建算法下的肺結(jié)節(jié)檢出敏感度、準(zhǔn)確率和平衡F分?jǐn)?shù)(F1-score),后者計算公式為:
采用Kruskal-Wallis檢驗[14]分析3種算法下檢出結(jié)節(jié)的敏感度以及假陽性結(jié)節(jié)在不同類別之間的分布,P<0.05為差異有統(tǒng)計學(xué)意義。
圖1 患者男,53歲,3種重建算法下肺結(jié)節(jié)成像效果對比(從左往右依次為肺、縱隔、骨重建算法圖像)
2.1 檢出肺結(jié)節(jié) 3種重建算法檢出肺結(jié)節(jié)的各項指標(biāo)見表1。骨窗重建算法下的敏感度最高,縱隔重建算法下的敏感度最低??v隔重建算法準(zhǔn)確率最高,肺窗重建算法的準(zhǔn)確率最低。見圖2??v隔重建F分?jǐn)?shù)最高,肺窗重建F分?jǐn)?shù)最低。不同重建算法下結(jié)節(jié)檢出敏感度差異無顯著統(tǒng)計學(xué)意義(P>0.05)。不同重建算法對于實性、磨玻璃、部分實性、鈣化結(jié)節(jié)4種類型結(jié)節(jié)的檢出敏感度差異無統(tǒng)計學(xué)意義(P均>0.05,表2)。
參照文獻(xiàn)[15],將6.0 mm作為分界線,比較系統(tǒng)對于不同大小結(jié)節(jié)的敏感度??v隔重建算法下,系統(tǒng)對6.1~30.0 mm結(jié)節(jié)的敏感性較0~6.0 mm明顯升高。不同重建算法下,系統(tǒng)對于不同大小結(jié)節(jié)的檢出敏感度差異無統(tǒng)計學(xué)意義(P均>0.05)。見表3。
2.2 誤檢和漏標(biāo)注分析 對不同重建算法下系統(tǒng)檢出而醫(yī)生未標(biāo)注結(jié)節(jié)進(jìn)行判定,確認(rèn)為非結(jié)節(jié)類型者為系統(tǒng)誤檢(圖3),確認(rèn)為結(jié)節(jié)類型者為醫(yī)生漏標(biāo)注。3種重建算法之間差異無統(tǒng)計學(xué)意義(P均>0.05)。見表4。
3種重建算法下醫(yī)師漏標(biāo)結(jié)節(jié)數(shù)量在不同類型結(jié)節(jié)之間的分布見表5。不同重建算法下,醫(yī)師漏標(biāo)結(jié)節(jié)數(shù)量在不同類型結(jié)節(jié)之間差異無統(tǒng)計學(xué)意義(P均>0.05)。
表1 不同重建算法檢出肺結(jié)節(jié)指標(biāo)比較
圖2 患者男,45歲,3種重建算法下假陽性結(jié)節(jié)對比(從左往右依次為肺、縱隔、骨重建算法圖像)
表2 不同重建算法檢出不同類型結(jié)節(jié)
表3 不同重建算法對不同大小肺結(jié)節(jié)的檢出率(%)
表4 不同重建算法下檢測算法檢出而醫(yī)生未標(biāo)注結(jié)節(jié)的分布[個(%)]
表5 不同重建算法下假陽性結(jié)節(jié)分布[個(%)]
以卷積神經(jīng)網(wǎng)絡(luò)為代表的DL算法在醫(yī)學(xué)影像分析領(lǐng)域已取得顯著進(jìn)步,基于DL的肺結(jié)節(jié)輔助診斷已成為熱門研究課題,人工智能與醫(yī)療相結(jié)合,將成為未來肺結(jié)節(jié)檢測方向[9-11]。不同重建算法得到的CT圖像質(zhì)量不同(圖1),DL算法的檢出效能在很大程度上依賴高質(zhì)量圖像,同時,不同CT重建算法下,醫(yī)師診斷也會有所差異,使得觀察不同CT重建算法下圖像對肺結(jié)節(jié)模型檢出和對醫(yī)師診斷的影響顯得尤為重要[11-13]??v隔重建最為平滑,一般用于診斷縱隔相關(guān)疾?。还谴爸亟ㄗ顬殇J利,一般用于診斷骨相關(guān)疾?。欢未爸亟ń橛趦烧咧g,一般用于診斷肺部相關(guān)疾病。
傳統(tǒng)計算機(jī)輔助診斷(computer aided diagnosis,CAD)半自動檢測肺結(jié)節(jié),需要醫(yī)師手動給出結(jié)節(jié)位置[16]。Dr.Wise肺結(jié)節(jié)輔助診斷系統(tǒng)采用DL技術(shù)為基礎(chǔ),可全自動檢測肺結(jié)節(jié),使用方便,且在肺窗、縱隔、骨窗3種重建算法下對肺結(jié)節(jié)的敏感度均較高(表1)。該系統(tǒng)在肺窗和骨窗重建下敏感度均較高,而骨窗重建下假陽性率更低,即在骨窗重建圖像上能取得較高敏感度和較低假陽性率;縱隔重建下敏感度、假陽性率均最低,而準(zhǔn)確率最高,且F分?jǐn)?shù)較高,故總體性能最優(yōu)。不同重建算法下,無論是模型檢出、模型漏檢類別還是醫(yī)師漏標(biāo),在不同類別結(jié)節(jié)之間差異均無統(tǒng)計學(xué)意義,提示算法對系統(tǒng)檢出性能無顯著影響。
既往研究[9-12]多采用小樣本或模擬仿真技術(shù)。本研究由多名醫(yī)師對298例患者3種不同重建算法CT圖像分別進(jìn)行標(biāo)注、審核,較好地保證了數(shù)據(jù)的真實性和標(biāo)注的準(zhǔn)確率。以往觀察重建算法側(cè)重于圖像質(zhì)量,多由醫(yī)師評估圖像質(zhì)量,對算法檢出效能缺少系統(tǒng)全面的評價[11-13]。本研究在固定儀器參數(shù)下,分別對肺窗、縱隔、骨窗3種重建算法對檢出不同大小、不同類別結(jié)節(jié)的敏感度、準(zhǔn)確率、假陽性率和F分?jǐn)?shù)等多項指標(biāo),以及系統(tǒng)誤檢和醫(yī)師漏標(biāo)情況進(jìn)行對比分析,主要觀察模型在不同的重建算法下的檢出效能,具有一定前瞻性。3種重建算法下,系統(tǒng)對于鈣化結(jié)節(jié)的檢出敏感度達(dá)96%~98%,均高于另外3種類型;對于其余類型結(jié)節(jié),不同重建算法下的檢出敏感度多在91%~94%。經(jīng)醫(yī)師確認(rèn)后,假陽性結(jié)節(jié)中,結(jié)節(jié)和非結(jié)節(jié)占比均為50%左右,提示不同重建算法對于假陽性結(jié)節(jié)數(shù)量影響較小。
本研究主要局限性在于不同類別結(jié)節(jié)數(shù)量分布不均勻(表2),實性結(jié)節(jié)較多,其他類型結(jié)節(jié)較少;其次,所有肺結(jié)節(jié)均由放射科醫(yī)師憑借經(jīng)驗標(biāo)記,未經(jīng)病理檢查驗證。
綜上,采用基于DL的肺結(jié)節(jié)檢查算法能明顯減輕醫(yī)師工作量,提高工作效率。采用肺窗和骨窗重建檢出敏感度更高;以DL算法檢出結(jié)節(jié),再由醫(yī)師篩出假陽性結(jié)節(jié),可顯著提高識別結(jié)節(jié)的精度,更有利于醫(yī)師精確診斷,減少漏診或誤診率,提高診斷肺結(jié)節(jié)的準(zhǔn)確率,促進(jìn)推廣肺癌早期篩查[17-18]。