李彤 郝天宇 張杉杉
摘要:肝癌是常見的惡性腫瘤疾病,肝臟自動分割算法能有效幫助醫(yī)生進行診斷治療。然而在深度學(xué)習(xí)圖像分割模型中,訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)常常存在較大的分布差異,導(dǎo)致分割效果較差。因此本文開發(fā)一種可適應(yīng)于測試集的卷積神經(jīng)網(wǎng)絡(luò),用于CT圖像上的肝臟分割,進而減少醫(yī)生手動勾畫的時間,實現(xiàn)輔助診斷。在?2017LiTS肝臟數(shù)據(jù)集上驗證該方法的有效性,實驗表明,將測試集用于訓(xùn)練卷積神經(jīng)網(wǎng)絡(luò)能有效提高分割精度。
關(guān)鍵詞:CT圖像;肝臟分割;可適應(yīng)測試集;卷積神經(jīng)網(wǎng)絡(luò)
1 引言
肝癌是人類健康的一大威脅,其發(fā)病率正在逐年上升[1]。腹部CT圖像肝臟分割和定位,有助于臨床醫(yī)生準確評估肝臟腫瘤。而肝臟的輪廓通常需要經(jīng)驗豐富的放射科醫(yī)師手動勾畫,其過程非常繁瑣和耗時,因此,肝臟的自動分割算法研究對計算機輔助診斷至關(guān)重要。
肝臟的分割算法主要分為四類:基于區(qū)域增長[2]、基于圖割[3]、基于水平集[4]、和基于深度學(xué)習(xí)[5、6]。與其他方法相比,基于深度學(xué)習(xí)的方法對人工依賴較小,并且由于其強大的提取特征的能力常常能取得更好的性能。但是在現(xiàn)實中,訓(xùn)練數(shù)據(jù)和測試數(shù)據(jù)往往存在較大的分布差異,這會嚴重影響模型性能。因此,本文提出一種可適應(yīng)測試集的卷積神經(jīng)網(wǎng)絡(luò)用于CT圖像上的肝臟自動分割。
2 方法
如圖1所示,本文的整體架構(gòu)包括兩個網(wǎng)絡(luò):Teacher網(wǎng)絡(luò)和Student網(wǎng)絡(luò)。這兩個網(wǎng)絡(luò)都以U-Net模型[6]作為骨干,并且結(jié)構(gòu)相同。具體來說,這兩個網(wǎng)絡(luò)分別包括一個編碼器(Encoder)和一個解碼器(Decoder)。編碼器由卷積層和最大池化層組成,提取豐富的圖像特征。解碼器由卷積層和反卷積操作組成,進而通過Softmax函數(shù)獲得肝臟分割預(yù)測結(jié)果。
訓(xùn)練時,將有標記的訓(xùn)練數(shù)據(jù)輸入Student網(wǎng)絡(luò),無標記的測試數(shù)據(jù)輸入Student網(wǎng)絡(luò)和Teacher網(wǎng)絡(luò)。Teacher網(wǎng)絡(luò)的參數(shù)通過Student網(wǎng)絡(luò)參數(shù)的移動平均(moving?average)[7]更新得到,Student網(wǎng)絡(luò)的參數(shù)通過損失函數(shù)進行梯度下降來更新。其中損失函數(shù)包括兩個部分:第一部分是有監(jiān)督的分割損失(Segmentation?Loss),通過計算有標記的訓(xùn)練數(shù)據(jù)的預(yù)測結(jié)果與標簽的交叉熵進行迭代;第二部分是無監(jiān)督的一致性損失(Consistency?Loss),用來衡量無標記的測試數(shù)據(jù)經(jīng)過Student網(wǎng)絡(luò)和Teacher網(wǎng)絡(luò)產(chǎn)生的預(yù)測結(jié)果之間的相似性。由于Teacher網(wǎng)絡(luò)的參數(shù)是從Student網(wǎng)絡(luò)獲取的,所以無論輸入樣本是否有標簽,都可以通過測量預(yù)測結(jié)果之間的一致性來構(gòu)建損失函數(shù),保證輸出結(jié)果的穩(wěn)定性。
3 實驗與結(jié)果
3.1?實驗數(shù)據(jù)與預(yù)處理
實驗采用LiTS2017?肝臟分割數(shù)據(jù)集,該數(shù)據(jù)集包括有標簽的131例患者的腹部增強CT圖像。將前105例患者數(shù)據(jù)作為訓(xùn)練集,后?26?例患者數(shù)據(jù)作為測試集。由于該數(shù)據(jù)集中的CT圖像來源于多部設(shè)備,所以在數(shù)據(jù)預(yù)處理時進行圖像歸一化。
3.2?評價指標
Dice系數(shù)是分割網(wǎng)絡(luò)中最常用的評價指標,用于計算樣本相似度。Dice?系數(shù)公式如下所示(1):
其中,A?代表醫(yī)生標注的肝臟區(qū)域的像素點集合,B代表模型預(yù)測的肝臟區(qū)域的像素點集合。Dice取值在0到1之間,且Dice值越大表示模型預(yù)測效果越好。
3.3?實驗結(jié)果
圖2為肝臟的分割結(jié)果。第一列為CT原圖,第二列為醫(yī)生分割掩模,第三列為U-Net模型的分割結(jié)果,第四列為本實驗的分割結(jié)果,可以看出將測試數(shù)據(jù)加入網(wǎng)絡(luò)的訓(xùn)練過程能有效改進模型性能,使難分區(qū)域分割更準確。
為了驗證方法有效性,我們將本文方法與U-Net模型在同一數(shù)據(jù)集上進行對比。如表?1?所示,U-Net模型的Dice值為0.939,而本文采用可適用于測試集的模型的Dice值為0.962,模型的精度得到了提升。
4 結(jié)束語
將測試數(shù)據(jù)用于模型的訓(xùn)練過程可以降低網(wǎng)絡(luò)對不同分布數(shù)據(jù)的預(yù)測偏差,進而提升模型的分割性能。該方法具有較強的推廣性,可以適用于不同的分割模型,緩解數(shù)據(jù)之間差異較大的問題。但是該方法對數(shù)據(jù)采集的時效性要求較高,因此還需要進一步優(yōu)化,在分割精度上也有改進的空間。
參考文獻
[1]Chen?Guoyong,Zhang?Jiabin,Sun?Jianjun,et?al.Revisiting?partial?hepatectomy?of?large?hepatocellular?carcinoma?in?older?patients.Sci?Rep.2018;8:14505.
[2]Baazaoui?A,Barhoumi?W,Ahmed?A,et?al.Semi-automated?segmentation?of?single?and?multiple?tumors?in?liver?CT?images?using?entropy‐based?fuzzy?region?growing.IRBM.2017;38:98-100.
[3]Beichel?R,Bornik?A,Bauer?C,et?al.Liver?segmentation?in?contrast?enhanced?CT?data?using?graph?cuts?and?interactive?3D?segmentation?refinement?methods.Med?Phys.2012;39:1361-1373.
[4]Yinchun?Z.Level?set?image?segmentation?based?on?rough?set?and?new?energy?formula.Acta?Automatica?Sinica.2015;41:1913-1925.
[5]Ben-Cohen?A,Diamant?I,Klang?E,et?al.Fully?convolutional?network?for?liver?segmentation?and?lesions?detection.Deep?Learning?and?Data?Labeling?for?Medical?Applications;2016;77-85.
[6]Ronneberger?Olaf,PhilippFischer?Thomas?Brox.U-Net:Convolutional?Networks?for?Biomedical?Image?Segmentation.Medical?Image?Computing?and?Computer-Assisted?Intervention;2015:234-241.
[7]Tarvainen,Antti?and?Harri?Valpola.Mean?teachers?are?better?role?models:Weight-averaged?consistency?targets?improve?semi-supervised?deep?learning?results.NIPS?2017.
第一作者簡介:李彤(1997-),女,漢,甘肅白銀,碩士研究生,研究方向醫(yī)學(xué)圖像處理,蘭州財經(jīng)大學(xué),730030。