李艷 楊國慶 胡納 齊曉寧 付泉水
1.都江堰市人民醫(yī)院放射影像科,四川成都 611800;2.遂寧市中心醫(yī)院放射影像科,四川遂寧 629000;3.中國科學(xué)院計算技術(shù)研究所,北京 100190
病灶的體積定量在臨床工作中可用于評估患者的病死率,同時體積倍增時間也是鑒別疾病良惡性的重要指標(biāo)[1,2]。目前,將深度學(xué)習(xí)技術(shù)應(yīng)用于基于CT 圖像的自動定量分析是醫(yī)學(xué)影像領(lǐng)域的熱點問題,有助于提高醫(yī)學(xué)影像的診斷效率和診斷準(zhǔn)確性,但病灶體積量化分析的準(zhǔn)確性與很多因素有關(guān),包括病灶本身的特征、掃描設(shè)備、掃描參數(shù)和圖像重建方式等[3,4],現(xiàn)有的研究模型大多針對單一掃描設(shè)備,數(shù)據(jù)來源局限。另外,手動逐層分割被認(rèn)為是最接近真實值的表現(xiàn)[5,6],常被用作驗證標(biāo)準(zhǔn),但其存在測量者間和測量者內(nèi)部的誤差。本課題比較不同CT 掃描設(shè)備對人工智能深度學(xué)習(xí)模型定量測定結(jié)果準(zhǔn)確性的影響,以實驗室量筒量取的標(biāo)準(zhǔn)溶液作為驗證標(biāo)準(zhǔn),將模型測得結(jié)果與CT 設(shè)備自帶體積測量軟件進(jìn)行比較,分析探討人工智能模型應(yīng)用于臨床工作中體積測量的可行性及影響因素。
不規(guī)則密閉容器、量筒、燒杯、A 溶液(碘帕醇與生理鹽水1:50 混合溶液)、B 溶液(碘帕醇與生理鹽水1:100 混合溶液)、C 溶液(碘帕醇與生理鹽水1:500 混合溶液)。
1.1.1 模型制備 選取體積、材質(zhì)相同的不規(guī)則密閉容器,用量筒分別精準(zhǔn)量取不同體積(10ml、20ml、30ml)、不同密度(50Hu、135Hu、190Hu)的溶液注入各容器制成水球,見圖1。量筒量取溶液過程嚴(yán)格遵循使用規(guī)范,并以量筒讀數(shù)作為驗證標(biāo)準(zhǔn);根據(jù)溶液的不同密度和體積分為9 組,每組25 例,共225 例,見表1。而后按順序編號,采用分層抽樣法在每組中隨機(jī)抽取5 個作為訓(xùn)練集(n=45),其余的為測試集(n=180)。
圖1 實驗自制的標(biāo)準(zhǔn)容積水球
表1 實驗自制水球的密度和體積分組(n)
1.1.2 掃描方法 將水球放置在掃描孔的中央,用CT 機(jī)激光線定位使水球的x、y、z軸線分別與CT機(jī)的x、y、z定位線重合,常規(guī)軸位掃描,GE Revolution 256 排512 層CT 掃描層厚和層間距設(shè)置為1.25mm,Siemens SOMATOM Defintion AS 64排128 層螺旋CT 的層厚和層間距設(shè)置為1.20mm,其余掃描參數(shù)相同,均設(shè)置為管電壓120kV、管電流360mAs、機(jī)架旋轉(zhuǎn)時間1.0s,獲得CT 平掃影像資料。
1.2.1 模型建立 GE Revolution 256 排512 層CT 掃描的訓(xùn)練集圖像傳至其后處理器RAW 工作站,Siemens SOMATOM Defintion AS 64 排128 層螺旋CT 掃描的訓(xùn)練集圖像傳至其后處理器MMWP 工作站,均行1.50mm 層厚和1.50mm 層間距的圖像重組。將重組圖像統(tǒng)一傳至圖像存檔及通信系統(tǒng)(picture archiving and communications system,PACS),圖像數(shù)據(jù)以醫(yī)學(xué)數(shù)字影像和通訊(digital imaging and communications in medicine,DICOM)格式導(dǎo)出。Labelme3.11.2 作為一個開源圖像標(biāo)注工具,影像科醫(yī)生通過它勾畫CT 圖像病灶,再將勾畫好的帶標(biāo)簽圖像傳至中國科學(xué)院計算技術(shù)研究所基于U-NET 網(wǎng)絡(luò)架構(gòu)的CT 切片自動分割診斷算法進(jìn)行數(shù)據(jù)模型訓(xùn)練,訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)模型可以預(yù)測相應(yīng)類型疾病的病灶,計算病灶體積,通過不斷優(yōu)化,從而訓(xùn)練出一個準(zhǔn)確度非常高的自動病灶勾畫人工智能數(shù)據(jù)模型,見圖2。
圖2 水球圖像對比
1.2.2 體積測量 將通過兩種CT 設(shè)備掃描的測試集圖像分別傳至各自的后處理器進(jìn)行1.50mm 層厚和1.50mm 層間距重組,并基于CT 值進(jìn)行體積測量,同時將重組圖像傳至PACS 系統(tǒng),圖像數(shù)據(jù)以DICOM 格式導(dǎo)出至數(shù)據(jù)模型并得出體積測量結(jié)果,見圖3。具體的體積測量方法如下。①基于CT值的半自動體積測量方法:將GE Revolution 256排512 層CT 掃描圖像傳至RAW 工作站后,點擊Volume Viewer 進(jìn)行水球體積測量,CT 值范圍為水球密度±50Hu,然后由軟件計算出該閾值范圍內(nèi)的水球體積;將Siemens SOMATOM Defintion AS 64 排128 層螺旋CT 掃描圖像傳至MMWP 工作站三維重建卡中,Editor Region Growing 進(jìn)行水球體積測量,CT 值范圍為水球密度±50Hu,然后由軟件計算出該閾值范圍內(nèi)的水球體積。②基于深度學(xué)習(xí)的全自動體積測量方法:針對水球模型分割的復(fù)雜性,先對跨設(shè)備掃描影像數(shù)據(jù)進(jìn)行預(yù)處理后,采用U-Net 網(wǎng)絡(luò)作為主體框架,它基于編碼器-解碼器架構(gòu),編碼器部分包括了一系列的卷積塊,每個卷積塊先通過卷積將輸入的特征圖規(guī)范化,并提取特征,最后激活函數(shù)。編碼器相鄰兩層通過最大池化的方法將圖像尺寸減小為1/2,同時增加特征的通道數(shù)為2 倍。解碼器部分的結(jié)構(gòu)類似編碼器,但是每層只包含一個卷積塊。不同于編碼器,解碼器通過卷積將特征的通道減少為1/2,然后通過上采樣將特征的空間尺寸加倍,最后通過與編碼器的skip 連接,將獲得的特征與對應(yīng)層次編碼器的輸出相結(jié)合并傳到上層。解碼器最終的輸出尺寸與原圖相同,最后通過Sigmoid 函數(shù)得到分割結(jié)果,使用EfficientNet-B0 作為主干網(wǎng)絡(luò),從網(wǎng)絡(luò)的深度、寬度和圖像分辨率3 個維度擴(kuò)張網(wǎng)絡(luò),提升網(wǎng)絡(luò)精度,并統(tǒng)一矩陣為(512,512),由于水球是不規(guī)則連續(xù)區(qū)域,可將其視為等厚切片,然后根據(jù)像素間距計算每層切片病灶區(qū)域的面積,通過對面積積分得出病灶區(qū)域的體積,最后根據(jù)公式計算水球體積,見圖4。
圖3 半自動和全自動體積測量方法定量不同CT 掃描設(shè)備來源的水球的流程圖
圖4 基于Efficient-BO-UNET 的分割框架模型分割水球的流程圖
采用SPSS 26.0 統(tǒng)計學(xué)軟件對數(shù)據(jù)進(jìn)行處理分析,計量資料采用均數(shù)±標(biāo)準(zhǔn)差()或中位數(shù)(四分位數(shù)間距)[M(Q1,Q3)]表示。同一水球采用兩種體積測量方法結(jié)果對比或同一水球經(jīng)兩種CT掃描設(shè)備掃描后體積測量結(jié)果對比分析,采用配對設(shè)計資料的統(tǒng)計分析,首先對變量的差值進(jìn)行正態(tài)性檢驗,差值呈正態(tài)分布,采用配對設(shè)計t檢驗,差值非正態(tài)分布則采用配對設(shè)計的Wilcoxon 符號秩檢驗,檢驗水準(zhǔn)為0.05,P<0.05 為差異有統(tǒng)計學(xué)意義。
對測試集水球分別經(jīng)兩種CT 測量方法測量后體積的結(jié)果顯示,半自動體積測量方法[-18.750(-23.400,-14.850)]和全自動體積測量方法[-1.872(-8.423,3.123)]的測量結(jié)果百分誤差比較,全自動體積測量方法優(yōu)于半自動體積測量方法,差異有統(tǒng)計學(xué)意義(t=-16.443,P<0.001)。
測試集水球分別經(jīng)兩種CT 掃描設(shè)備掃描后的分析結(jié)果顯示,GE Revolution 256 排512 層CT[2.050(-1.691,5.935)]和Siemens SOMATOM Defintion AS 64 排128 層螺旋CT[-7.837(-14.599,-2.337)]來源的水球測量結(jié)果百分誤差比較,差異有統(tǒng)計學(xué)意義(t=-10.348,P<0.001)。
測試集中同一水球模型針對兩種掃描設(shè)備來源的數(shù)據(jù)體積測量結(jié)果變異系數(shù)分析顯示,GE Revolution 256 排512 層CT 的水球測量結(jié)果變異系數(shù)(0.029±0.007)較Siemens SOMATOM Defintion AS 64 排128 層螺旋CT(0.055±0.029)更大,差異有統(tǒng)計學(xué)意義(t=-2.432,P=0.041)。
基于Bland-Altman 圖的分析顯示,GE Revolution CT 掃描數(shù)據(jù)比 Siemens SOMATOM Defintion AS 掃描數(shù)據(jù)的測量結(jié)果的差值平均值更接近0,見圖5。
圖5 不同掃描設(shè)備來源的數(shù)據(jù)測量結(jié)果相對于實驗室量筒量取標(biāo)準(zhǔn)溶液的一致性分析
近年隨著神經(jīng)網(wǎng)絡(luò)相關(guān)算法的進(jìn)步與提高,深度學(xué)習(xí)算法被廣泛用于體積測量。基于深度學(xué)習(xí)的全自動分割技術(shù)可以對病灶和器官的影像進(jìn)行高效、準(zhǔn)確的分割,并利用分割結(jié)果進(jìn)行體積計算,深度學(xué)習(xí)在分割如血腫[7-12]、梗死[13]、結(jié)節(jié)[14]、肺炎[7,15]及腫瘤[10,16-18]等定量病灶中表現(xiàn)優(yōu)異,Ironside等[7,8]使用深度學(xué)習(xí)算法分別開發(fā)了用于顱內(nèi)出血和血腫周圍水腫體積分析的全自動分割算法,當(dāng)對照手動和半自動分割方法測試時,全自動分割算法的血腫平均體積相似性系數(shù)分別為0.894 和0.905,血腫周圍水腫的平均體積相似性系數(shù)分別為0.838 和0.843,使用全自動分割方法測得的顱內(nèi)出血量與使用手動(R2=0.981)和半自動(R2=0.979)方法測量的體積之間有很強(qiáng)的相關(guān)性。另外,在定量常見器官如肝臟[19-21]、脾臟[19,20]及前列腺[22]等的體積方面,深度學(xué)習(xí)自動分割算法也具有較高的準(zhǔn)確性,Ahn等[20]開發(fā)和驗證了一種深度學(xué)習(xí)算法用于在各種肝臟條件下使用門靜脈期CT 圖像進(jìn)行全自動肝臟和脾臟分割,深度學(xué)習(xí)算法實現(xiàn)了肝臟和脾臟分割的平均體積相似性系數(shù)分別為0.973 和0.974,不同肝臟條件下的平均體積相似性系數(shù)比較,差異無統(tǒng)計學(xué)意義。由此可見,深度學(xué)習(xí)具有較大的臨床應(yīng)用價值。
目前國內(nèi)外關(guān)于體積測量的研究報道很多,但大多數(shù)研究以放射科醫(yī)師的手動測量測得的結(jié)果作為“金標(biāo)準(zhǔn)”[7,8,13,20,23],不僅需要專業(yè)知識還需要花費(fèi)大量的時間,且存在測量者間和測量者內(nèi)部的誤差,“金標(biāo)準(zhǔn)”難以得到有效保證。本研究采用標(biāo)準(zhǔn)體積的水球進(jìn)行體積測量的評估,以實驗室量筒量取的標(biāo)準(zhǔn)溶液作為“金標(biāo)準(zhǔn)”,較手動分割更具客觀性和準(zhǔn)確性,且操作簡單快捷、具有可重復(fù)性,并對不同掃描設(shè)備的水球進(jìn)行研究,將數(shù)據(jù)來源不同的影響納入了研究。
由于本實驗中水球背景單一,模型訓(xùn)練相對簡單,因此研究僅采用45 例水球作為訓(xùn)練集。將模型測得結(jié)果與CT 設(shè)備自帶的基于閾值的半自動體積測量軟件進(jìn)行比較,可以初步得到以下結(jié)果:①基于深度學(xué)習(xí)建模的全自動體積測量方法計算CT 平掃圖像中的水球體積的各組測量數(shù)據(jù)的百分誤差小于半自動體積測量結(jié)果的百分誤差,提示全自動體積測量方法優(yōu)于傳統(tǒng)的設(shè)備自帶的基于CT 閾值的半自動體積測量方法;②將不同掃描設(shè)備來源的數(shù)據(jù)用于同一個模型進(jìn)行體積測量,測量結(jié)果的準(zhǔn)確性和穩(wěn)定性不同,這提示在未來建模過程中,需要考慮到數(shù)據(jù)來源不同的影響,提前對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化校正,通過算法糾正減少差異,建立一個適用性強(qiáng)的模型,并且這個結(jié)果也可能成為CT 掃描設(shè)備采集數(shù)據(jù)準(zhǔn)確性評估的一個新的客觀指標(biāo)。但因病例數(shù)較少,測試集中的水球呈偏態(tài)分布,對不同掃描設(shè)備來源數(shù)據(jù)的準(zhǔn)確性的差異比較采用了非參數(shù)檢驗,并且研究僅納入了兩種掃描設(shè)備,未來需要擴(kuò)大樣本量對算法的推廣、泛化進(jìn)行深入研究。