閆鳳,牛振洋,費振樂,吳先想,崔相利,劉苓苓
1.聯(lián)勤保障部隊第901醫(yī)院放療科,安徽合肥230031;2.蚌埠醫(yī)學院第一附屬醫(yī)院放療科,安徽蚌埠233004;3.中國科學院合肥腫瘤醫(yī)院,安徽合肥230031
容積旋轉調強(ⅤMAT)技術具有靶區(qū)外劑量快速跌落、靶區(qū)的劑量適形度高、劑量均勻性好等特性。相對于IMRT,ⅤMAT 具有縮短治療時間和總MU較低的特點,在臨床中被大量使用[1‐3]。計劃設計過程中,物理師一般根據RTOG 指南、臨床數據或自身經驗去設定優(yōu)化目標,但由于不同病人的解剖結構差異,計劃目標會出現很容易實現或者很難實現的情況[4]。危及器官(OAR)劑量學參數和OAR 與靶區(qū)空間位置以及兩者的體積等解剖信息具有相關性[5‐6]。Jun 等[7]構建Lian 空間解剖信息與劑量學指數的數學模型可以對腮腺、喉、脊髓、腦干及下頜下腺的劑量學指數做出準確預測。Appenzoller 等[8]構建OAR空間解剖信息與劑量學指數的數學模型可以對直腸、膀胱及腮腺的劑量學指數做出準確預測。本次研究主要分析患側肺、對側肺及心臟的劑量學參數和解剖信息的相關性,建立以患者解剖信息為輸入、OAR 的劑量學參數為輸出的機器學習人工神經網絡模型[9‐11]。
選取2017年5月至2018年3月接受放療的51例肺癌病例,其中,男27例,女24例;年齡40~72 歲,平均年齡51歲。由細胞學或組織學證實為非小細胞肺癌,且全部未進行手術,其中左肺癌23例,右肺癌28例。
患者均采用仰臥位、熱塑體模固定。CT 模擬定位時體位選擇為雙手舉過頭頂,掃描范圍從頸部到肝臟下緣,圖像層厚為5 mm。勾畫肺門病灶為GTⅤ,局部轉移淋巴結為GTⅤnd,同側肺門及縱隔與淋巴引流區(qū)為CTⅤ,外擴0.5~1.0 cm 獲得PTⅤ(外擴范圍和是否選用4D‐CT、CBCT、千伏影像驗證片等影像引導技術有關)。勾畫肺、心臟、脊髓、肝臟等OAR,其中患側肺、對側肺和心臟的平均體積分別為1 674.32、1 830.42、711.96 cm3,PTⅤ的平均體積為193.67 cm3。
采用Monaco(Ⅴersion 5.11)計劃系統(tǒng)設計ⅤMAT計劃,采用6 MⅤX 線,射野由前后共面雙弧構成,為降低肺部受照射的低劑量體積,根據腫瘤的空間位置,選擇合適的弧度大小及起始角度。PTⅤ的處方劑量為60 Gy,分次數為30,要求處方劑量覆蓋95%的靶區(qū)體積。
根據已有的相關研究,OAR 的劑量學指數主要受體積和空間位置兩種解剖信息影響[6‐7]。本研究中體積信息包括患側肺、對側肺、心臟和PTⅤ的體積(腫瘤位置偏向的一側所在的肺部定義為患側肺,相對一側的肺定義為對側肺);使用OAR 和PTⅤ的空間相對位置關系表示空間位置信息。肺癌患者的患側肺和靶區(qū)空間相對位置較為穩(wěn)定,和對側肺和心臟的空間相對位置穩(wěn)定性一般,且ⅤMAT 治療計劃中靶區(qū)劑量具有良好的適形性,靶區(qū)外劑量快速跌落。因此,OAR 的DⅤH 與OAR 到PTⅤ的表面距離有關。本研究采用R(d) 來描述OAR 與PTⅤ的相對空間位置信息。R(d) 的表達公式為:
其中,VPTⅤ‐d為PTⅤ外擴距離為d時所包含的體積(考慮到射束半影對靶區(qū)邊緣GT 方向上的影響,所以在0~0.6 cm 內為各向均勻外擴,外擴步進為0.3 cm;0.6~15.0 cm 內為身體前后左右方向均勻外擴,外擴步進為0.3、0.5、0.7、0.9、1.1、1.3、1.5、1.7、2.1、2.7 cm,以最少的外擴來描述OAR 的空間解剖信息,同時符合靶區(qū)外劑量跌落規(guī)律);VOAR為OAR 自身的體積;R(d)為VPTⅤ‐d與VOAR相交的體積和VOAR的比值。
將51例肺癌患者的解剖信息數據和OAR 劑量學數據(Ⅴ2.5、Ⅴ5、Ⅴ7.5…、Ⅴ57.5、Ⅴ60)導入Matlab 2017a中已經編寫好的機器學習人工神經網絡程序,流程如圖1所示,隨機選擇其中43例病人的解剖信息數據和OAR 的DⅤH 數據作為訓練集用于訓練人工神經網絡,剩下8例病人作為驗證集用于驗證人工神經網絡輸出的準確性。人工神經網絡訓練過程中采用N次k 折交叉驗證方法[12]。其中每個人工神經網絡中包含輸入層(Input layer)、隱藏層(Hidden layer)、輸出層(Output layer)[13]。
圖1 訓練人工神經網絡程序流程圖Fig.1 Flowchart of artificial neural network training
采用SPSS 19.0軟件中Pearson法對訓練組中患側肺和對側肺的Ⅴ5、Ⅴ20指數及心臟的Ⅴ30、Ⅴ40指數與自身體積、PTⅤ體積大小以及R(d)指數進行相關性分析[14],r>0.6為強相關,r=0.4~0.6為中度相關,r<0.4為弱相關,r<0為負相關。將人工神經網絡的預測值和實際值做配對t檢驗,P<0.05為差異有統(tǒng)計學意義。
優(yōu)化調整后,生成3 種人工神經網絡結構模型,其中構建的患側肺、對側肺、心臟的人工神經網絡結構模型中隱藏層分別含有41、38、34 個神經結點(neural node)。
在距PTⅤ表面一定范圍內,訓練組中R(d)值隨著外擴距離d的增加逐漸增大,達到一定距離后,R(d)值將趨于穩(wěn)定,如圖2所示。
OAR 的劑量學指數均在較大范圍內波動?;紓确?、對側肺、心臟的劑量學指數和自身體積的r值在‐0.13~0.15內,呈現為弱相關性,如表1所示。
圖2 OAR的R(d)關系曲線Fig.2 R(d)relationship curve of organs-at-risk(OAR)
表1 訓練組中OAR的劑量學指數與自身體積相關性(±s)Tab.1 Relationship between dosimetric indexes and the corresponding OAR volume in training group(Mean±SD)
表1 訓練組中OAR的劑量學指數與自身體積相關性(±s)Tab.1 Relationship between dosimetric indexes and the corresponding OAR volume in training group(Mean±SD)
OAR患側肺Ⅴ5Ⅴ20對側肺Ⅴ5Ⅴ20心臟Ⅴ30Ⅴ40相對體積0.51±0.12 0.29±0.08 0.23±0.13 0.05±0.03 0.14±0.10 0.07±0.06范圍0.19~0.73 0.07~0.43 0.01~0.56 0~0.25 0~0.36 0~0.22 r值‐0.02 0.01 0.15 0.14‐0.13‐0.11
訓練組中只有對側肺Ⅴ20與PTⅤ體積呈現為中度相關性(r=0.44),其它OAR 劑量學指數與PTⅤ體積皆呈弱相關?;紓确微?與PTⅤ的R(0.9)表現為弱相關性(r=0.3),剩下的OAR 劑量學指數和R(d) 多數表現為強相關性,部分表現為中度相關性,如表2所示。
圖3a 是關于患側肺的輸出結果,線性回歸性較好,輸出沿著回歸直線(R=0.994)分布;圖3b 是關于對側肺的輸出結果,輸出分布較為散亂,部分輸出沿回歸直線(R=0.975)分布,整體線性回歸性較差;圖3c 是關于心臟的輸出結果,輸出的劑量指數Vx在0~40%內線性回歸表現較好,40%~100%內,輸出回歸性一般,整體輸出沿著回歸直線(R=0.986)分布,部分輸出遠離回歸直線。
表2 訓練組中OAR劑量學指數與PTV體積、部分R(d)相關性Tab.2 Correlation between OAR dosimetry indexes and PTV volume and partial R(d)in training group
圖3 人工神經網絡輸出結果線性回歸分析Fig.3 Linear regression analysis on the output of artificial neural network
對患側肺預測的DⅤH數據與TPS數據表現為較好的重合性;對側肺的DⅤH 數據與TPS 數據整體重合性較差(未予以作圖);心臟的DⅤH 數據與TPS 數據在Ⅴ25~60范圍內重合性較好,在心臟Ⅴ0~25范圍內表現不太穩(wěn)定,如圖4所示。對驗證組中OAR 的預測數據中,僅對側肺Ⅴ5的預測值和實際值差異有統(tǒng)計學意義。其中患側肺Ⅴ5、Ⅴ20的預測誤差分別為2.70%±1.83%、2.84%±1.97%,對側肺Ⅴ5、Ⅴ20的預測誤差分別為 13.7%±7.8% (t=‐3.93,P<0.05) 、0.72%±0.75%,心臟的Ⅴ30、Ⅴ40的預測誤差分別為3.20%±0.63%、2.1%±1.5%。
臨床中,DⅤH 主要為計劃優(yōu)化中約束函數調整和計劃評估提供參考,以及用于預測患者在放射治療后可能出現的并發(fā)癥。雖然Njeh 等[15]認為DⅤH缺乏對劑量的空間信息表達,用于靶區(qū)和OAR 的評估具有局限性,但在劑量評估中仍具有指導意義。治療計劃設計時,物理師首先根據自身經驗對DⅤH參數做出估計,然后不斷調整靶區(qū)和OAR 的限制參數,此過程費時費力,因此對OAR 的DⅤH 受影響因素的定量分析及其預測是有必要的。醫(yī)師將靶區(qū)和OAR 勾畫完成之后,基于該方法可以對患者OAR 劑量學數據做出大概預測,方便醫(yī)師及時對靶區(qū)進行調整和修改治療方案,縮短治療方案設計周期。
目前已經有關于患者解剖信息與OAR的劑量學指數之間相關性的研究[16‐17]。Zhu 等[18]采用靶區(qū)距離直方圖(DTH)指數描述靶區(qū)和OAR的相對空間解剖信息,構建基于?-SVR 算法的數學模型預測膀胱和直腸的DⅤH,但需多次調節(jié)誤差?。本研究引入R(d)指數量化描述OAR 與靶區(qū)相對空間位置信息,與DTH 具有相似的屬性。R(d)指數相對于DTH 指數容易獲取,與靶區(qū)表面距離呈現出簡單的非線性關系,僅需少量的R(d)信息就可以較好地描述OAR與靶區(qū)的空間位置信息。
圖4 驗證組中8例肺癌患者實際的DVH數據和預測的DVH數據對比Fig.4 Comparison of actual DVH data and predicted DVH data of 8 lung cancer patients in validation group
本研究相關性分析表明,雙側肺和心臟的劑量學指數受自身體積影響較小,負相關說明OAR 的劑量指數隨著自身體積增大而減小?;紓确微?、Ⅴ20和R(0.9)、R(2.1)呈現為弱相關,主要原因是在距離靶區(qū)表面2.1 cm 范圍內,該區(qū)域的劑量一般在40 Gy 以上,所以該區(qū)域內靶區(qū)和OAR 的相對空間位置關系對患側肺的Ⅴ5、Ⅴ20影響有限。但在距離靶區(qū)表面4.1~6.9 cm 和4.1~10.7 cm 內的R(d)值分別和患側肺的Ⅴ20、Ⅴ5有很強的相關性,原因在于距離靶區(qū)表面4.1~10.7 cm 內,劑量已經分別跌落至20 Gy 以下,所以在該距離范圍內的R(d)值表現為對患側肺的Ⅴ5、Ⅴ20影響很大,因此構建出的關于患側肺的人工神經網絡模型的輸出結果較為準確,并且性能較為穩(wěn)定。由于為了保護對側肺,射束入射方向僅有部分穿過對側肺,因此對側肺受照射量較小,DⅤH 數據對射野方向較敏感,導致相同解剖結構可能對應不同的DⅤH 數據,使得人工神經網絡輸出誤差增大。在對側肺中Ⅴ5與表2所示的距離范圍內的R(d)值一直表現為中度相關,在該范圍內Ⅴ20與R(d)值一直表現為強相關,說明患側肺與PTⅤ的相對空間位置對對側肺的Ⅴ5影響一般,對Ⅴ20影響較為顯著,又因為對側肺受照射的劑量較低,對側肺的Ⅴ20在0~25%范圍內且其平均值為5%,這就導致了在低劑量區(qū)域內構建的關于對側肺的人工神經網絡模型穩(wěn)定性較差,很難根據解剖信息準確地預測出DⅤH 數據,只能對部分劑量指數做出準確預測,如Ⅴ20,回歸分析結果顯示的Vx處于0~10%內網絡模型線性回歸性較好。在距離靶區(qū)表面0.9~4.1 cm 內,心臟Ⅴ30、Ⅴ40和R(d) 值呈現為強相關性,說明該區(qū)域內解剖信息對心臟Ⅴ30、Ⅴ40影響較大,所以構建的關于心臟的人工神經網絡可以對心臟DⅤH 的高量區(qū)進行準確預測,這和對關于心臟的人工神經網絡模型輸出的線性回歸分析的結果相一致。
綜上所述,利用機器學習方法對肺癌ⅤMAT 計劃中解剖信息和OAR 的DⅤH 數據學習后,可以根據肺癌患者的解剖信息對OAR 的DⅤH 做出較為準確的預測,可以為肺癌治療計劃的設計和評估提供參考,提高計劃設計效率,具有一定的臨床應用價值。