王偉,徐振宇,楊冠英,李悅,楊冰洋,高明勇*
(1.佛山市第一人民醫(yī)院 影像中心,廣東 佛山 528010;2.佛山市第一人民醫(yī)院 轉(zhuǎn)化醫(yī)學(xué)研究院,廣東 佛山 528010;3.北京天醫(yī)智醫(yī)療技術(shù)服務(wù)有限公司 臨床科研部,北京 101318;4.大連醫(yī)科大學(xué) 附屬第一醫(yī)院,遼寧 大連 116000)
近年來全球腦腫瘤發(fā)病率呈明顯增長趨勢[1-2],2020年我國前10位癌癥數(shù)據(jù)統(tǒng)計示腦腫瘤死亡率位居第8位[3]。核磁共振影像(MRI)檢查是目前評估顱內(nèi)腫瘤類型和分級最常用的影像學(xué)檢查方法,提高治療前MR影像診斷的準(zhǔn)確率,對后續(xù)的治療策略的制定和患者預(yù)后評估具有重要意義。隨著人工智能技術(shù)(artificial intelligence,AI)的蓬勃發(fā)展,深度學(xué)習(xí)系統(tǒng)(deep learning system,DLS)在影像診斷中的應(yīng)用日漸廣泛[4-7]。本次研究將探討DLS在顱內(nèi)腫瘤MRI診斷中的作用。
該研究獲得佛山市第一人民醫(yī)院醫(yī)學(xué)倫理委員會批準(zhǔn),審批號“L[2022]第8號”,回顧性分析該院2018年1月~2021年11月經(jīng)手術(shù)病理證實的顱內(nèi)腫瘤患者共455例。納入標(biāo)準(zhǔn)為:病例MR影像資料包括T1WI、T2WI和增強T1WI橫斷位;腫瘤病理類型已包括在DLS數(shù)據(jù)庫內(nèi)。排除標(biāo)準(zhǔn):手術(shù)干預(yù)(包括活檢)、腫瘤復(fù)發(fā)。
采用北京安德醫(yī)智科技有限公司研發(fā)的BioMind人工智能影像輔助診斷軟件。該產(chǎn)品核心為“注意力密集網(wǎng)絡(luò)”深度學(xué)習(xí)模型。軟件算法結(jié)構(gòu)分為以U-Net為基礎(chǔ)的“分割網(wǎng)絡(luò)”及以DenseNet為基礎(chǔ)的“分類網(wǎng)絡(luò)”兩個部分;其中分割網(wǎng)絡(luò)包含多個編碼器、多個解碼器和一個輸出卷積器;分類網(wǎng)絡(luò)包含5個密集卷積器和兩個全連接層;兩個網(wǎng)絡(luò)之間搭建“注意力連接”來傳遞特征信息;因此整個結(jié)構(gòu)稱為“注意力密集網(wǎng)絡(luò)”。算法的輸入為患者橫斷為MR圖像序列(T1WI,T2WI,增強掃描),每個序列圖像大小為24×256×256;算法的輸出為腫瘤分割圖和腫瘤類別概率。其訓(xùn)練集來自北京天壇醫(yī)院顱內(nèi)腫瘤的MR影像數(shù)據(jù),所采用的磁共振設(shè)備包括GE、Philips、Siemens和聯(lián)影的1.5T、3.0T MR,入組數(shù)據(jù)涵蓋了不同年齡、不同性別的顱內(nèi)病變患者的MR影像,DLS數(shù)據(jù)庫的病變類型共26種包括:表皮樣囊腫、神經(jīng)鞘瘤、脊索瘤、聽神經(jīng)瘤、膠質(zhì)瘤、星形細(xì)胞瘤、膠質(zhì)母細(xì)胞瘤(glioblastoma,GBM)、室管膜瘤、髓母細(xì)胞瘤、血管外皮細(xì)胞瘤、垂體瘤、顱咽管瘤、頸靜脈球瘤、淋巴瘤、腦膜瘤、血管母細(xì)胞瘤、轉(zhuǎn)移瘤、節(jié)細(xì)胞瘤、生殖細(xì)胞瘤、畸胎瘤、胚胎發(fā)育不良性神經(jīng)上皮瘤、脈絡(luò)叢乳頭狀瘤、動靜脈畸形、海綿狀血管畸形、中樞神經(jīng)細(xì)胞瘤、小腦發(fā)育不良性節(jié)細(xì)胞瘤。
所使用的后處理工作站配置為:CPU Intel Xeon Silver 4210R、內(nèi)存32GDDR4 RECC2933*4、運算卡NVIDIA RTX 3090 24GB、硬盤1.92T STAT3 SSD*3、操作系統(tǒng)ubuntu 20.04.2 Server。
采用3.0T MR機(Discovery MR 750W,GE公司,美國),標(biāo)準(zhǔn)頭顱線圈,常規(guī)行橫軸位T1WI、T2WI、T2-FLAIR、擴散加權(quán)成像(diffusion weighted imaging,DWI)及增強T1WI橫軸位、冠狀位及矢狀位。T1WI:TR 2 010 ms、TE 24 ms;T2WI:TR 6 853 ms、TE 116 ms;DWI:b值1 000、TR 4 100 ms、TE 77.20 ms;FOV 240 mm×240 mm、層厚5 mm、層間隔1 mm。增強掃描采用對比劑釓雙胺注射液(GE Healthcare Ireland Limited,愛爾蘭),靜脈注射速率1 mL/s、劑量0.1 mmoL/kg。由放射科副主任醫(yī)師職稱以上的診斷醫(yī)師對圖像進(jìn)行判讀并提供第一診斷和包含一個鑒別診斷在內(nèi)的綜合診斷。
標(biāo)本行常規(guī)HE染色和免疫組化染色,由1名病理科副主任醫(yī)師分析病理切片并診斷。
采用SPSS 25.0統(tǒng)計軟件進(jìn)行數(shù)據(jù)分析,計量資料采用()描述,計數(shù)資料用例數(shù)(%)表示。采用Kappa一致性檢驗評估DLS和放射科醫(yī)生診斷的一致性。對于準(zhǔn)確率的比較,組間差異采用McNemar配對卡方檢驗,其中對于GBM和星形細(xì)胞瘤使用Fisher精確檢驗(樣本量小于40),P<0.05說明差異有統(tǒng)計學(xué)意義。
納入研究共283例,排除共172例,其中包括腫瘤病理類型未包括在DLS數(shù)據(jù)庫內(nèi)的13例,手術(shù)干預(yù)或復(fù)發(fā)性腫瘤17例,MRI資料不全共142例。病例平均年齡是(53.55±14.34)歲,男性占52.9%,腫瘤類型如圖1所示。
圖1 不同類型腫瘤的例數(shù)和比例Figure 1 Number of cases and percentage of different types of intracranial tumors
不論第一診斷還是綜合診斷,DLS和放射科醫(yī)生均存在一致性(Kappa值分別為0.331和0.263,P=0.000)。
在總體腫瘤中,DLS和放射科醫(yī)生第一診斷準(zhǔn)確率差異無統(tǒng)計學(xué)意義(83.4%vs86.9%,P=0.194),總體診斷準(zhǔn)確率差異無統(tǒng)計學(xué)意義(91.9% vs 90.8%,P=0.728);在腦膜瘤(160例)中,DLS第一診斷準(zhǔn)確率低于放射科醫(yī)生(91.2% vs 97.5%,P=0.021),診斷準(zhǔn)確率差異無統(tǒng)計學(xué)意義(96.2% vs 98.8%,P=0.728);在垂體腺瘤(47例)中,DLS和放射科醫(yī)生第一診斷準(zhǔn)確率差異無統(tǒng)計學(xué)意義(95.7% vs 100%,P=0.500),診斷準(zhǔn)確率差異無統(tǒng)計學(xué)意義(95.7%vs 100%,P=0.500);在GBM(30例)中,DLS和放射科醫(yī)生第一診斷準(zhǔn)確率差異無統(tǒng)計學(xué)意義(76.7%vs63.3%,P=0.372),診斷準(zhǔn)確率DLS高于放射科醫(yī)生(100% vs 76.7%,P=0.016)。在星形細(xì)胞瘤(22例)中,DLS第一診斷準(zhǔn)確率高于放射科醫(yī)生(45.4% vs 40.9%,P=0.027),診斷準(zhǔn)確率高于放射科醫(yī)生(63.6% vs 45.4%,P=0.024)。
近十幾年隨著AI的發(fā)展,計算機輔助診斷(computer-aided diagnosis,CAD)開始被應(yīng)用于顱內(nèi)腫瘤影像診斷研究并取得了令人振奮的結(jié)果。MRI檢查是目前評估顱內(nèi)腫瘤類型和分級最常用的影像學(xué)檢查方法[8],近年隨著算法和算力的快速發(fā)展,已經(jīng)實現(xiàn)多模態(tài)MRI海量參數(shù)的快速提取和特征分析(如形態(tài)、紋理和信號強度),診斷準(zhǔn)確性有望進(jìn)一步得到提升[9-11]。雖然目前國內(nèi)外諸多實驗室的研究結(jié)果令人鼓舞,但商用化的顱內(nèi)腫瘤智能輔助影像診斷軟件尚未普及,本研究采用已獲得國家藥監(jiān)局頒發(fā)的人工智能輔助診斷類三類醫(yī)療器械注冊證的BioMind人工智能影像輔助診斷軟件,評估此商用軟件的臨床應(yīng)用價值。
Georgiadis[12]利用單模態(tài)-增強T1WI的紋理特征,采用改進(jìn)的概率神經(jīng)網(wǎng)絡(luò)模型,鑒別膠質(zhì)瘤和腦膜瘤的準(zhǔn)確性達(dá)到81.2%。Mohsen[13]基于T2WI圖像,采用多種基于神經(jīng)網(wǎng)絡(luò)的深度學(xué)習(xí)模型對正常腦、膠質(zhì)瘤、肉瘤和肺癌轉(zhuǎn)移瘤進(jìn)行分類研究,平均分類率最高達(dá)到96.97%。Kunimatsu[14]采用T1WI增強后紋理特征的支持向量機(support vector machine,SVM)鑒別GBM和淋巴瘤,其預(yù)測準(zhǔn)確性為75%。Kevin[15]基于增強T1WI上信號強度相關(guān)的量化數(shù)據(jù),采用提取全局和局部信號強度特征的CAD系統(tǒng)可較好的區(qū)分GBM和低級別膠質(zhì)瘤并提高了放射科醫(yī)生的診斷水平。Hie[16]基于增強T1WI、T2WI、T2液體衰減反轉(zhuǎn)恢復(fù)圖像,采用放射組學(xué)的鑒別非典型GBM和淋巴瘤,發(fā)現(xiàn)CAD較放射科醫(yī)生具有更高的準(zhǔn)確率。
除了常規(guī)序列(T1WI、T2WI和增強掃描),其他新型功能MR技術(shù)的發(fā)展也為AI準(zhǔn)確性提高提供了數(shù)據(jù)支持。Server[17]通過構(gòu)建包含腫瘤表觀擴散系數(shù)(apparent diffusion coefficient,ADC)平均值、最大值以及瘤周波譜等參數(shù)的模型預(yù)測膠質(zhì)瘤分級,準(zhǔn)確性達(dá)到91.5%。Wang[18]基于腫瘤強化區(qū)域的ADC值、彌散各向異性分?jǐn)?shù)(fractional anisotropy,F(xiàn)A)值以及瘤周水腫部位的局部腦血流量(regional cerebral blood volume,rCBV)值,應(yīng)用層次樹分類網(wǎng)絡(luò)技術(shù)較好的區(qū)分了GBM與非GBM(轉(zhuǎn)移瘤和淋巴瘤),其曲線下面 積(area under curve,AUC)值 為 0.938。Tsolaki[19]基于瘤周組織波譜數(shù)據(jù)和rCBV數(shù)據(jù),采用SVM鑒別GBM和轉(zhuǎn)移瘤獲得高達(dá)98%的準(zhǔn)確率。Svolos[20]基于瘤周FA值和rCBV,采用模式識別技術(shù)區(qū)分GBM和孤立性轉(zhuǎn)移瘤,準(zhǔn)確率高達(dá)96%。Shai[21]基于灌注、擴散張量參數(shù)圖和形態(tài)學(xué)數(shù)據(jù),采用留一交叉驗證的SVM用于二元分類和特征選擇,結(jié)果顯示對GBM、轉(zhuǎn)移瘤、腦膜瘤和淋巴瘤的分類準(zhǔn)確率分別為95.7%、92.7%、97%和91.5%。
本研究采用BioMind人工智能影像輔助診斷軟件回顧性分析了283例顱內(nèi)腫瘤的數(shù)據(jù),發(fā)現(xiàn)DLS第一診斷的準(zhǔn)確性為83.4%,而包括鑒別診斷在內(nèi)的綜合診斷的準(zhǔn)確性為91.9%,與放射科醫(yī)生的準(zhǔn)確性差異無統(tǒng)計學(xué)意義,充分顯示了目前AI在腦腫瘤MRI分析中的價值(圖2)。但針對具體腫瘤類型,DLS和放射科醫(yī)生的準(zhǔn)確率顯示出不同程度的統(tǒng)計學(xué)差異。在腦膜瘤診斷方面放射科醫(yī)生表現(xiàn)要優(yōu)于DLS,可能是由于腦膜瘤的影像特征明顯且發(fā)病率較高,醫(yī)生在日常工作中積累了豐富的經(jīng)驗。而在星形細(xì)胞瘤和GBM方面,DLS表現(xiàn)更好,但對于星形細(xì)胞瘤不論DLS還是醫(yī)生的第一診斷準(zhǔn)確率均小于50%,說明此類型腫瘤影像表現(xiàn)多樣,需要進(jìn)一步提取特征性的影像參數(shù)和指標(biāo)。
圖2 BioMind診斷正確的病例界面展示Figure 2 Case interface display of BioMind correct diagnosis
在數(shù)據(jù)方面,本軟件基于的是T1WI、T2WI和T1增強的橫斷位MRI,上述序列均是醫(yī)院進(jìn)行顱內(nèi)腫瘤檢查的常規(guī)序列,并且由于無需進(jìn)行多平面成像,因此可減輕掃描人員的工作負(fù)擔(dān),增加患者的流通量,具有較高的可接受度和較好的推廣性。在算法方面,本軟件以U-Net和DenseNet為基礎(chǔ),此為目前國際上流行和通用的算法,相較于本軟件研發(fā)醫(yī)院-北京天壇醫(yī)院內(nèi)部測試74.91%準(zhǔn)確率,在我院研究中獲得了更高的準(zhǔn)確率,證明算法具有較好的魯棒性和可移植性。在算力方面,采用主流工作站配置,軟件可以在3 min之內(nèi)給出診斷報告,較人工診斷具有更高的診斷效率。此外本軟件還可以提供發(fā)病部位、病灶體積等臨床治療中有價值的附加信息。
在研究中,DLS的局限性也需要關(guān)注,比如未能充分利用MR多平面成像的優(yōu)勢,因此漏掉了一些橫斷面難以顯示的病灶;偶爾會出現(xiàn)難以解釋的低級錯誤(圖3),需要加大對DLS可解釋性的研究;DLS對于腫瘤的分類具有滯后性:本系統(tǒng)采用的腫瘤分類標(biāo)準(zhǔn)仍是較陳舊的WHO標(biāo)準(zhǔn),而最新的2021版分類標(biāo)準(zhǔn)強調(diào)了分子診斷的重要性。因此在未來很長時間內(nèi)AI的發(fā)展需要醫(yī)工人員合作引導(dǎo)。
圖3 BioMind診斷錯誤的病例界面展示Figure 3 Case interface display of BioMind error diagnosis
本研究顯示DLS用于顱內(nèi)腫瘤磁共振診斷具有較好的準(zhǔn)確率,可以輔助放射科醫(yī)生提高工作效率和診斷的準(zhǔn)確率,具有較好的推廣應(yīng)用前景。
作者貢獻(xiàn)聲明
王偉:項目具體實施、設(shè)計;徐振宇:數(shù)據(jù)整理;楊冠英:影像資料判讀;李悅:統(tǒng)計學(xué)分析;楊冰洋:AI軟件操作及結(jié)果整理;高明勇:提出研究思路和框架。
利益沖突聲明
本研究由北京天醫(yī)智醫(yī)療技術(shù)服務(wù)有限公司提供統(tǒng)計方法和軟件使用的指導(dǎo);未受天醫(yī)智及其他第三方資助;相關(guān)單位或個人不存在潛在利益沖突。