李金凱,王沛沛,曹遠東,李彩虹,昌志剛,顧霄寰,李丹明,孫新臣
江蘇省人民醫(yī)院/南京醫(yī)科大學第一附屬醫(yī)院 放療科,江蘇 南京 210029
精確勾畫腫瘤靶區(qū)和危及器官(Organs at Risk,OARs)是實現(xiàn)精準放射治療的根本保障[1-2]。現(xiàn)階段,腫瘤靶區(qū)和OARs的輪廓線勾畫主要由經(jīng)驗豐富的臨床醫(yī)生手動完成,但人工勾畫耗時較長效率較低,且極度依賴勾畫醫(yī)生的臨床經(jīng)驗,在不同醫(yī)生或不同患者之間勾畫結果存在較大差異。因此,臨床工作中特別期待有智能的、快速的自動分割算法來實現(xiàn)腫瘤靶區(qū)和OARs的自動勾畫。目前,臨床上應用較多的主要是基于圖譜庫(Atlas)的自動分割軟件[3-4],其勾畫精度主要取決于目標圖像和Atlas之間的相似性。鑒于人體解剖多樣性和形變配準精度的限制,基于Atlas自動分割的輪廓常常需要大量的人工修正。近年來,人工智能(Artificial Intelligence,AI)尤其是機器學習、深度學習等AI技術在醫(yī)療領域取得了巨大進步,在疾病診斷、病灶識別和分割等方面均表現(xiàn)出巨大的應用潛力[5-8]。
AccuContour精確自動勾畫軟件是由Manteia(中國)公司研發(fā)的一種基于多種神經(jīng)網(wǎng)絡結構和深度學習算法的自動勾畫工具,用于在CT圖像上繪制放射治療計劃所需的全身60多個OARs自動勾畫,以及數(shù)個癌種的GTV自動勾畫。本研究利用基于AI技術的自動勾畫軟件AccuContour對頭頸部位的OARs進行智能勾畫,評估其勾畫的準確度及適用性,為正式投入臨床應用提供理論參考。
選取2019年6月至2020年1月在南京醫(yī)科大學第一附屬醫(yī)院(江蘇省人民醫(yī)院)行放射治療的10位鼻咽癌腫瘤患者,年齡28~71歲,中位年齡53歲;男性8例,女性2例;根據(jù)中國鼻咽癌分期2017版[9],其中T1-2期6例,T3期3例,T4期1例;卡氏評分≥80。所有患者均取仰臥位,雙手自然下垂緊貼于身體兩側,利用CIVCO頭頸肩板配合S型熱塑面膜固定。大孔徑CT模擬機(Siemens SOMATOM Sensation Open,德國)自由呼吸狀態(tài)下行螺旋掃描,掃描范圍自頭頂至氣管隆突水平,重建層厚和層間距均為3 mm。
AccuContour軟件通過深度學習圖像分割模型,對大量的專家勾畫數(shù)據(jù)進行學習,實現(xiàn)對目標圖像的自動分割和輪廓繪制;在模型訓練中,采用多種網(wǎng)絡結構模型、多種loss結構進行融合,以提高勾畫精度;在模型訓練之前,通過收集多數(shù)據(jù)源、多病種的醫(yī)院臨床數(shù)據(jù),按照國內外靶區(qū)及OARs勾畫標準,通過多名高年資醫(yī)生進行標注,在通過檢驗達到臨床一致性要求后,納入標準庫中。OARs勾畫精度內部測試結果為:DSC[10]0.9~0.95;HD[10]≤3.5 mm。本研究選取頭頸部OARs 18種,其中,左右對稱結構8種,分別是眼球(Eye)、晶體(Lens)、視神經(jīng)(Optic nerve)、顳頜關節(jié)(Temporomandibular Joints,TMJ)、顳葉(Temporal lobe)、中耳(Middle ear)、內耳(Inner ear)、腮腺(Parotid);獨立結構10種,分別是腦(Brain)、腦干(Brain stem)、脊髓(Spinal cord)、視交叉(Optic chiasm)、垂體(Pituitary)、下頜骨(Mandible)、口腔(Oral cavity)、喉(Larynx)、氣管(Trachea)、甲狀腺(Thyroid)。
將模擬定位CT影像傳輸至AccuContour工作站勾畫OARs,為方便后續(xù)描述,命名為RTs1,然后在多模態(tài)圖像處理工作站MIM Maestro軟件(Cleveland,美國)上由2名高年資醫(yī)師根據(jù)CT-MR圖像融合結果進行二次修改和確認,命名為RTs2,最后利用MIM Maestro自帶的“比較勾畫”工具評價自動勾畫的準確度。其中,參考MR圖像選擇軸位T1、T2加權像,F(xiàn)OV 24 cm×24 cm,矩陣256×256,層厚5 mm,層間距0。勾畫標準參考國際輻射防護與測量委員會第62號報告和中國鼻咽癌放射治療協(xié)作組OARs勾畫共識[11-12]。為評估勾畫軟件AccuContour自動勾畫的穩(wěn)定性和重復性,對10例患者的模擬CT進行OARs的二次勾畫,命名為RTs3。
通過RTs2組評估RTs1組OARs自動勾畫的準確度,通過RTs3組評估RTs1組OARs自動勾畫的重復性。評價指標[10]包括:豪斯多夫距離(Hausdorff Distance,HD),平均最小距離(Mean Distance To Agreement,MDA),戴斯相似性系數(shù)(Dice Similarity Coefficient,DSC)。
1.4.1 HD
HD用來描述兩個輪廓之間的距離,即參考輪廓中的每個體素到對照輪廓中最近點的最大距離,計算如公式(1)所示。
如公式(1)所示,A、B為空間中的兩個點集,此處代表所勾畫的輪廓,a∈A,b∈B,HD數(shù)值越接近于0,表明兩個勾畫輪廓之間的差別越小。
1.4.2 MDA
MDA與HD類似,用來描述兩個輪廓之間的距離,具體含義是所考慮的輪廓中的所有外圍點必須移動以實現(xiàn)與參考輪廓完全重疊一致所需的平均最小距離,計算如式(2)所示。
與公式(1)相同,A、B為空間中的兩個點集,此處代表所勾畫的輪廓,a∈A,b∈B,MDA數(shù)值越接近于0,表明兩個勾畫輪廓之間的差別越小。
1.4.3 DSC
DSC用于描述兩個輪廓的相似性,計算如公式(3)所示。
如公式(3)所示,VA表示自動勾畫輪廓的體積,VB表示醫(yī)生修改確認后勾畫輪廓的體積,DSC值越接近于1,表明兩樣本輪廓之間形狀相似性越大。
采用SPSS 20.0對OARs勾畫結果進行統(tǒng)計學分析,計量資料以(±s)表示。對RTs1組與RTs2組的HD、MDA及DSC結果與RTs2組的OARs體積行Spearman相關性分析,P<0.05表示具有統(tǒng)計學意義。
10例患者共得到260個OARs的輪廓數(shù)據(jù)。如表1所示,RTs1組與RTs2組HD值最大的OARs是腦,均值為10.1 mm,其中小于5 mm的有19個,占73.1%(19/26)。MDA值最大的OARs是視交叉,均值為1.0 mm,其余均值都小于1 mm,占96.2%(25/26)。DSC最小的OARs是視交叉,均值為0.66,其余均值都大于0.85,占96.2%(25/26),其中大于0.9的OARs有腦、顳葉、眼球、晶體、顳頜關節(jié)、內耳、中耳、腮腺、腦干、脊髓、下頜骨、口腔、喉、氣管、甲狀腺等,占84.6%(22/26)。相關性分析顯示,HD與RTs2組OARs體積大小存在中等程度正相關(r=0.191,P<0.01),MDA、DSC與OARs體積無明顯相關性(r=0.065、0.029,P>0.05)。
表1 RTs1組與RTs2組OARs勾畫準確度的比較評估
某一病例的OARs自動勾畫與人工修改結果如圖1所示。其中,HD值>5 mm的器官有顳葉、腦、口腔,>3 mm的器官有腮腺、腦干、視神經(jīng);MDA值均<0.5 mm,顳葉最大為0.348 mm;DSC值<0.9的器官有垂體、視神經(jīng)和視交叉,余均 >0.9。
圖1 某例鼻咽癌患者OARs自動勾畫與人工修改CT圖像示例
RTs1組與RTs3組每例患者每個OARs的勾畫體積大小完全一致。RTs1組與RTs3組各OARs的HD值及MDA值均為0,DSC均為1。
隨著精確放療技術的發(fā)展,高劑量曲線與靶區(qū)形狀高度一致,在不增加周圍正常組織器官受照劑量的同時進一步提高了靶區(qū)劑量,為放療療效的提高奠定了物理基礎[13]?;颊叩拈L期生存使得對生活質量的要求不斷提高,正常組織器官的放療并發(fā)癥,如早期急性黏膜反應和晚期顱內神經(jīng)損傷、顳葉壞死、下丘腦-垂體軸的毒副作用等神經(jīng)系統(tǒng)癥狀,因嚴重影響患者的生存質量而越來越多地受到臨床重視[14-15]。如何評估OARs的實際照射劑量,以及如何減少其受量,是當前臨床實踐中亟需解決的問題,也是當前研究的熱點。
頭頸部放療中OARs受照劑量的評估存在不確定性,其中最主要的影響因素就是OARs勾畫的差異性。具體分析,差異性主要來源于兩個方面,首先是參考指南理解偏差[16],即操作人員對OARs勾畫范圍邊界的理解不一致;其次是人為實踐操作的差異,即同一操作者在不同時間或不同地點勾畫同一病例OARs之間的偏差。針對第一方面的差異,最直接的辦法是建立統(tǒng)一的OARs勾畫指南。例如孫穎等[17]根據(jù)OARs解剖特點和放射損傷原理建議:顳葉勾畫范圍應該包括海馬和海馬旁回,除外腦島和基底節(jié)區(qū)域;腮腺需要勾畫完整的腮腺組織;脊髓需要勾畫CT上實際的脊髓而非椎管等。關于第二方面的差異,屬于手工操作誤差,很難通過制定規(guī)范或加強訓練得到完全改善。一些OARs勾畫軟件,如瑞典Elekta公司的ABAS、美國Varian公司的Velocity及美國MIM公司的Maestro等,試圖通過機械設備取代手工操作以修正人為實踐操作所引入的偏差。根據(jù)既往研究,基于Atlas的OARs自動勾畫DSC指數(shù)大多數(shù)都與體積大小有相關性,針對較大體積的OARs,如腦干、脊髓、下頜骨等,DSC指數(shù)普遍相對較高,基本都大于0.85[18]。相反,針對一些小體積OARs,如晶體、視神經(jīng)、垂體等,DSC指數(shù)都小于0.7。與Atlas方法相比,國內外很多文獻報道基于深度學習的輪廓自動分割方法擁有更高的精確度和更短的耗時[19]。Tong等[20]將完全卷積神經(jīng)網(wǎng)絡(Convolutional Neural Networks,CNN)與形狀表示模型相結合,提高了分割的準確性和魯棒性,與現(xiàn)有方法相比,分割多器官的時間更短。Wu等[21]提出了自動解剖識別方法,結果表明在條紋偽影最?。ǎ?層)及其他偏差的數(shù)據(jù)集上,總體識別精度達到2個體素,總體DSC值接近0.8,HD值在1個體素內。Men等[22]提出的CNN級聯(lián)方法在每個OARs的勾畫精度上都優(yōu)于單一的CNN方法,平均DSC值可達0.90,平均HD<3 mm,同時,CNN級聯(lián)將每個患者的平均分割時間分別減少了48%(FSU)和5%(U-Net)。本研究結果顯示AccuContour軟件對頭頸部OARs自動勾畫具有非常高的準確度和重復性,DSC值高于0.85的結構比例大于95%,基本避免了人為操作所引入的實踐誤差。與此同時,本研究還顯示基于深度學習的輪廓自動分割方法其DSC、MDA與OARs體積大小無明顯相關性,即對晶體這種小體積的OARs,DSC指數(shù)也都可以大于0.9,這非常好地體現(xiàn)了AI技術所帶來的技術優(yōu)勢。
本研究的局限性在于OARs自動勾畫結果基于CT圖像取得,雖將MR圖像作為標準參照,但不可避免會降低勾畫的準確度,獲取實體組織進行驗證會更加可靠。同時,本研究患者樣本量偏小,且研究結果在一個放療中心取得,也會增加本研究的不確定性。需要強調的是,基于AI技術的OARs自動勾畫也存在一些問題和安全隱患。例如本研究中視交叉的勾畫,其與RTs2組的DSC指數(shù)均值低于0.7,究其原因是由于AccuContour軟件的圖像分割模型與我科現(xiàn)行的頭頸部OARs勾畫標準不同所致。綜上可見,基于AI的自動勾畫是當前放療技術的發(fā)展趨勢,AccuContour軟件在頭頸部OARs的自動勾畫中具有較高的準確性和良好的重復性,可減少放療醫(yī)師工作量,提高OARs工作效率,有利于將醫(yī)生從OARs勾畫這項繁瑣的工作中解放出來。
致謝
感謝MANTEIA公司祝永進、謝璐和MIM Software公司李楊楊工程師給予的技術支持。