譚昭 王舒澤 張君楊 王焌懿 白曉峰
牙頜面畸形是口腔醫(yī)學(xué)領(lǐng)域的常見病和多發(fā)病,流行病學(xué)調(diào)查顯示,大約40%以上的人患有錯畸形,其中約有5%是由于頜骨發(fā)育異常所引起的骨性錯畸形[1]。牙頜面畸形不僅影響美觀,還會影響面部發(fā)育和全身健康,并帶來不同程度的心理損害[2]。正頜手術(shù)的目的是恢復(fù)正常的咬合關(guān)系和上下頜之間及其與面部其它骨骼的正常平衡,同時改善牙頜面畸形患者的外貌。對患者進行精確、高效地診斷和治療計劃設(shè)計是確保正頜手術(shù)成功的關(guān)鍵步驟[3],此外,還需對手術(shù)結(jié)果進行客觀評價以衡量治療效果[4]。
近年來,因人工智能(artificial intelligence,AI)在醫(yī)學(xué)領(lǐng)域的發(fā)展,大量文獻[5-7]出現(xiàn)AI、機器學(xué)習(xí)(machine learning,ML)、深度學(xué)習(xí)(deep learning,DL)等概念。AI是一門關(guān)于計算機理論和系統(tǒng)的技術(shù)科學(xué),它可以通過模擬人類智慧來解決某些問題[8],ML和DL則是其解決問題的工具。ML是一類自動分析數(shù)據(jù)以獲得規(guī)律,并利用它們對未知數(shù)據(jù)進行預(yù)測的算法[9],可分為:有監(jiān)督學(xué)習(xí)(包括人工神經(jīng)網(wǎng)絡(luò)、隨機森林、線性模型等)、無監(jiān)督學(xué)習(xí)和強化學(xué)習(xí)(包括策略迭代、深度強化學(xué)習(xí)等),每種方法都可用于解決不同的任務(wù)。分析醫(yī)學(xué)圖像常用有監(jiān)督式學(xué)習(xí),即醫(yī)生標(biāo)記一小部分圖像后用其訓(xùn)練模型,隨后用該模型對數(shù)據(jù)集中其余未標(biāo)記的圖像進行分類。DL則是一種實現(xiàn)ML的技術(shù),是ML中一種對數(shù)據(jù)進行表征學(xué)習(xí)的方法[10],基于卷積神經(jīng)網(wǎng)絡(luò)(convolution neural network,CNN)的DL正越來越多地應(yīng)用于醫(yī)學(xué)領(lǐng)域,其中的經(jīng)典算法包括AlexNet、VGG、GoogleNet、ResNet、Xception以及U-Net等。目前利用CNN進行醫(yī)學(xué)圖像分析主要有兩種方法:第一種是使用大量數(shù)據(jù)集對CNN結(jié)構(gòu)進行訓(xùn)練,得到具有強大特征提取能力的模型,在模型的末尾加入任務(wù)分類器以完成分類任務(wù);第二種涉及遷移學(xué)習(xí)(transfer learning,TL),也稱為預(yù)先訓(xùn)練的模型。在數(shù)據(jù)集較少的任務(wù)中,通過TL可以使模型獲得較強的特征提取能力,而不必使用大量的數(shù)據(jù)集對模型反復(fù)訓(xùn)練。
AI在口腔醫(yī)學(xué)相關(guān)領(lǐng)域的應(yīng)用越來越廣泛,有研究證明可通過提供輸入性數(shù)據(jù),如照片和(或)影像學(xué)圖片,來提高口腔疾病診斷、治療和預(yù)后的準(zhǔn)確性和效率[11-14]。牙頜面畸形是高度依賴影像學(xué)資料及相關(guān)數(shù)據(jù)進行診斷及治療的疾病,因此提高影像學(xué)資料分析的精確性和效率對牙頜面畸形患者的診斷和治療至關(guān)總要。本文旨在總結(jié)應(yīng)用于正頜外科領(lǐng)域的AI的應(yīng)用方向和效果,并對未來可能的應(yīng)用方向給予展望。
在正頜手術(shù)治療計劃中,其中一個重要的步驟是分析患者的數(shù)據(jù)并得出正確的診斷。對于牙頜面畸形患者的診斷必須進行??茩z查,包括面部外形和功能檢查、口內(nèi)檢查以及頭顱影像學(xué)檢查,并進行X線頭影測量分析。AI工具可在進行上述步驟時輔助醫(yī)生,幫助醫(yī)生更好地診斷并做出臨床決策。目前,利用AI來輔助口腔疾病的診斷已不罕見,并已顯示出較強的診斷精確性[12,15-16],以下討論了幾種在牙頜面畸形診斷方面的應(yīng)用。
頭顱側(cè)位片已廣泛應(yīng)用于牙頜面畸形的診斷和治療設(shè)計。然而,這種方式需要手動標(biāo)記解剖位點,可能存在各種誤差,并且非常耗時[17]。以往有較多基于AI,應(yīng)用各種影像資料(如頭顱側(cè)位片和CBCT等)進行位點的自動檢測和標(biāo)記的研究[18]。近年來,科學(xué)技術(shù)的發(fā)展促進了三維頭影測量的迅速發(fā)展,它具有精確識別復(fù)雜解剖結(jié)構(gòu)的功能優(yōu)勢[19]。各種使用三維CT影像作為輸入性數(shù)據(jù)的ML已用于位點自動檢測,最近取得了顯著的成果[19-21]。Kang等[19]提出了一種將深度學(xué)習(xí)和強化學(xué)習(xí)結(jié)合的方式即深度強化學(xué)習(xí)(deep reinforcement learning,DRL),該算法能很好地適應(yīng)復(fù)雜結(jié)構(gòu)的變形,能通過與環(huán)境的順序動態(tài)交互來預(yù)測待標(biāo)記位點,是一種更接近人類思維的方式。據(jù)此前報道的一篇關(guān)于頭顱位點檢測的Meta分析顯示其納入的研究的位點誤差大約為2 mm[18]。在此研究中各標(biāo)記位點總平均誤差為(1.96±0.78)mm,該系統(tǒng)的準(zhǔn)確性顯然足以直接應(yīng)用于臨床。
對牙頜面畸形患者進行正確分類是確定治療計劃和手術(shù)設(shè)計的基礎(chǔ)。Yu等[17]使用改良的DenseNet構(gòu)建的神經(jīng)網(wǎng)絡(luò)系統(tǒng)進行完全自動、一步式、端到端的牙頜面畸形分類,這是一種多模式的CNN結(jié)構(gòu),具有網(wǎng)絡(luò)更窄、參數(shù)更少等優(yōu)點。該系統(tǒng)僅根據(jù)患者的頭顱側(cè)位片就可以自動對患者的牙頜面畸形進行分類,省去了位點檢測過程,從而避免位點檢測的潛在誤差。結(jié)果顯示該系統(tǒng)具有90%以上的準(zhǔn)確率和95%以上的曲線下面積,顯示了其輔助牙頜面畸形診斷的潛力。
對面部對稱性進行準(zhǔn)確評估,對于正頜手術(shù)計劃和正頜手術(shù)實施來說都至關(guān)重要[22]。然而目前尚無面部對稱性評定標(biāo)準(zhǔn),僅根據(jù)肉眼及一些測量數(shù)據(jù)進行評估,具有較強的主觀性且難以保證其準(zhǔn)確性。當(dāng)數(shù)據(jù)集特別小時,由于不同患者面部特征顯著不同,模型的訓(xùn)練難度也相應(yīng)提高。Lin等[23]提出了一種基于遷移學(xué)習(xí)TL的CNN,在預(yù)訓(xùn)練的人臉特征模型中引入TL,整合預(yù)訓(xùn)模型頂層架構(gòu)的設(shè)計,訓(xùn)練出新的人臉對稱特征模型,該研究納入了71 例患者的CBCT圖像,將其圖像轉(zhuǎn)換成保留3D特征的等高線圖進行模型的訓(xùn)練,并比較了幾種不同模型的準(zhǔn)確性。結(jié)果顯示,使用基于TL的CNN模型可有效提高面部對稱性的評估效率及準(zhǔn)確性,其中Xception的準(zhǔn)確性較高可達90%,因此當(dāng)數(shù)據(jù)集過小時,TL可成為一種有效的解決方案。
有經(jīng)驗的臨床醫(yī)生在診斷和做出治療計劃時有自己獨特的方法,這種方法是在長期大量的臨床工作中積累的,對于臨床經(jīng)驗不足的醫(yī)生來說,沒有辦法在短時間內(nèi)進行這一過程的訓(xùn)練。利用AI則有望解決這一問題,其結(jié)果可為缺乏經(jīng)驗的年輕醫(yī)生提供參考。
Jeong等[24]提出了使用患者的面部照片和VGG19模型判斷患者是否需要行正頜外科手術(shù)。該模型通過加深卷積層數(shù)提高其模型識別率。研究共收集了822 例的錯畸形患者的正面照和右90°側(cè)面照,模型準(zhǔn)確率為86.7%。結(jié)果表明,VGG19能夠通過面部照片判斷是否需要進行正頜手術(shù),其結(jié)果相對準(zhǔn)確,但不能單獨使用進行最終診斷。類似地,Shin等[25]構(gòu)建以ResNet34為主干網(wǎng)絡(luò)的模型,該模型能最大限度減少從輸入層傳播到輸出層時的信息丟失,隨后收集了840 例患者的頭顱X線片用于模型的訓(xùn)練、測試和驗證,其準(zhǔn)確性、敏感性和特異性分別為0.954、0.844和0.993,表明該模型可成為輔助醫(yī)生快速判斷是否需要正頜手術(shù)的可靠工具。
正頜手術(shù)術(shù)前正畸的目的是為正頜手術(shù)做準(zhǔn)備,去除牙齒代償,恢復(fù)上、下牙齒相對于上、下基骨的關(guān)系,術(shù)前正畸是否拔牙與很多因素有關(guān)[26]。Choi等[3]建立了一個簡單的AI模型,該模型由兩層神經(jīng)網(wǎng)絡(luò)模型組成,將頭顱側(cè)位片的角度和距離等測量數(shù)據(jù)和臨床數(shù)據(jù)作為輸入值,經(jīng)過模型計算后輸出結(jié)果,可用于判斷正頜手術(shù)患者是否需要拔牙。該研究共納入316 例患者,計算拔牙/不拔牙的決策成功率,將實際診斷結(jié)果與AI模型的診斷結(jié)果進行比較,模型對是否拔牙決策的診斷準(zhǔn)確率為91%。結(jié)果初步證明AI模型可以較好地應(yīng)用于正頜手術(shù)的診斷和手術(shù)設(shè)計。
盡管目前認(rèn)為正頜手術(shù)是相對安全的,但失血仍是其嚴(yán)重的手術(shù)并發(fā)癥之一[27]。因此,Stehrer等[28]使用隨機森林算法來預(yù)測圍手術(shù)期的出血量,這是一種通過集成學(xué)習(xí)的思想將多種決策集成的一種算法,該算法在運算量沒有顯著增加的前提下大大提高了預(yù)測精度。研究納入了950 例患者的數(shù)據(jù)作為數(shù)據(jù)集,分為訓(xùn)練集(80%)和測試集(20%),根據(jù)血容量、術(shù)前和術(shù)后血紅蛋白值,用血紅蛋白平衡法計算圍手術(shù)期失血量,在使用訓(xùn)練集生成預(yù)測模型后,該模型被用于預(yù)測測試集中患者的圍手術(shù)期失血量。通過該算法預(yù)測的圍手術(shù)期失血量與實際失血量的平均值僅相差7.4 mL,且雙頜手術(shù)的特征重要性最高,可能是影響圍手術(shù)期出血的主要原因。結(jié)果表明應(yīng)用該算法可以有效地在正頜手術(shù)前預(yù)測圍手術(shù)期的出血量。
在對牙頜面畸形患者進行治療設(shè)計時,能否準(zhǔn)確預(yù)測治療后容貌變化至關(guān)重要。盡管已經(jīng)存在商業(yè)3D仿真軟件(如Dolphin系統(tǒng)),然而,有研究[29]對使用Dolphin 3D軟件程序預(yù)測LeFort I型截骨術(shù)和/或矢狀骨劈開術(shù)后的三維軟組織變化的能力進行探索,發(fā)現(xiàn)其預(yù)測的準(zhǔn)確性有限,尤其是在上唇區(qū)和鼻底區(qū)。隨著AI的發(fā)展,ML中出現(xiàn)了兩種與3D仿真相關(guān)的重要算法,即基于標(biāo)志點的幾何形態(tài)測量(geometric morphometrics,GMM)和DL。Tanikawa等[30]設(shè)計了一種AI系統(tǒng),該系統(tǒng)將GMM和DL相結(jié)合,來預(yù)測正頜手術(shù)后的面部三維形態(tài)。研究共納入137 例患者的面部數(shù)據(jù),該數(shù)據(jù)由3D圖像捕獲設(shè)備獲得,其系統(tǒng)誤差為(0.94±0.43)mm,當(dāng)以<2 mm的系統(tǒng)誤差定義成功時,總成功率為100%。結(jié)果表明GMM和DL的結(jié)合有助于開發(fā)預(yù)測正頜手術(shù)術(shù)后面部三維形態(tài)的AI系統(tǒng),然而其預(yù)測精確性仍有待提高。Ter等[31]開發(fā)了一種基于DL的3D虛擬軟組織仿真模型,用于預(yù)測雙側(cè)矢狀骨劈開術(shù)前移手術(shù)后的面部形態(tài)。有研究表明質(zhì)量張量模型(mass tensor model,MTM)是同類算法中準(zhǔn)確率最高的算法之一[32],因此將結(jié)果與MTM算法進行比較,結(jié)果表明,這個新開發(fā)的深度學(xué)習(xí)模型可以根據(jù)3D照片和CBCT數(shù)據(jù)準(zhǔn)確地預(yù)測下頜前移手術(shù)后的3D面部軟組織形態(tài),其準(zhǔn)確率較MTM算法高。
通過手術(shù)治療的牙頜面畸形的患者,特別是經(jīng)過術(shù)前正畸(或不正畸)、正頜手術(shù)、術(shù)后正畸(或不正畸)后,患者往往期望面部外觀和功能發(fā)生即刻改善,然而有時效果并不十分顯著,從而影響個人的社會心理健康[33]。最近有研究表明,牙頜面畸形患者最關(guān)心的問題是容貌的改善提升[34]。然而,由外行人和(或)臨床醫(yī)生對面部吸引力進行打分的傳統(tǒng)方法會因高度的主觀性而產(chǎn)生各種偏差,且較耗時。因此,開發(fā)一種公正的工具來客觀評估患者的面部吸引力十分必要。Patcas等[35]利用 VGG16構(gòu)建的ML模型來描述正頜手術(shù)對患者的容貌吸引力的改變,并估計患者外貌年齡。該研究納入146 例正頜患者的治療前后照片共2 164 張,使用該模型進行打分,結(jié)果顯示大多數(shù)患者的外貌隨著正頜手術(shù)而改善。隨著此類模型算法的不斷完善,一款名為“Haystack”可評估面部吸引力的商業(yè)化AI軟件已面向大眾,Peck等[36]將其與人類打分結(jié)果進行了比較,結(jié)果表明AI軟件的年齡評分與人類評分的年齡評分非常相似,面部吸引力評分與人類評分者不同,但仍然反映了相同的總體趨勢,且與人工評分組比,AI軟件花費時間大大減少。
此外,對于伴有面部不對稱畸形和對外貌有著苛刻要求的患者,AI還可以以一種相對而言較為客觀的方式來評價術(shù)后患者面部對稱性,有效加強了和患者的溝通。由于研究采用的數(shù)據(jù)集較小,所以Lo等[22]采用了預(yù)先訓(xùn)練好的神經(jīng)網(wǎng)絡(luò)構(gòu)建TL模型對面部對稱性進行客觀、定量的自動評估。該研究從158 例患者的三維面部圖像中提取三維輪廓圖像,用于后續(xù)人臉對稱性自動評估,結(jié)果顯示正頜術(shù)后面部對稱性改善程度為21%。該研究還比較了幾種常見的預(yù)訓(xùn)練模型:VGG16、VGG19、ResNet50和Xception自動評估面部對稱性的能力性能,發(fā)現(xiàn)Xception的效果最佳。該系統(tǒng)為臨床醫(yī)生提供了一個可以快速評估術(shù)后面部對稱性的方法,是一種有效的醫(yī)患溝通工具。
AI在醫(yī)療領(lǐng)域的應(yīng)用,提高了診斷和治療計劃設(shè)計的準(zhǔn)確性,還可提高醫(yī)生臨床工作的效率。大量的研究證明AI的應(yīng)用可有效幫助正頜外科醫(yī)生更準(zhǔn)確地診斷和決策。本綜述的結(jié)果顯示,以AI為基礎(chǔ)的系統(tǒng)的準(zhǔn)確性較高,這些系統(tǒng)可以簡化工作,節(jié)省時間,并有助于正頜外科醫(yī)生更有效率地進行診治。但上述研究都存在一定的缺陷:(1)研究數(shù)據(jù)集較少且來源單一,對牙頜面畸形人群的代表性有限,外推性有限,且限制了其他研究學(xué)者將類似研究進行比較評估;(2)為驗證AI模型的精確性,大部分研究的標(biāo)準(zhǔn)參考為正頜外科專家,以專家診斷作為標(biāo)準(zhǔn)參考存在一定的偏倚;(3)現(xiàn)有的網(wǎng)絡(luò)結(jié)構(gòu)大多較為復(fù)雜,對計算機的要求較高,計算開銷大,存在冗余參數(shù),難以在臨床推廣使用;(4)正頜手術(shù)的治療設(shè)計需要考慮并盡量解決患者的主訴,然而現(xiàn)有的研究幾乎都未將其考慮在內(nèi)。ML算法的特性決定了用于訓(xùn)練的數(shù)據(jù)集越多,模型表現(xiàn)越好,為解決上述問題,構(gòu)建一個大型標(biāo)準(zhǔn)化的數(shù)據(jù)共享和手術(shù)計劃平臺是非常必要的。多個醫(yī)療中心可以根據(jù)標(biāo)準(zhǔn)化協(xié)議將術(shù)前數(shù)據(jù)上傳到該平臺,獲得面部骨和軟組織的仿真模型,用于虛擬手術(shù)計劃,手術(shù)計劃完成后,術(shù)后數(shù)據(jù)也可以上傳至該平臺,以便自動計算模擬術(shù)后結(jié)果與實際術(shù)后結(jié)果之間的差異,為醫(yī)生提供反饋。同時,這些數(shù)據(jù)可用于增強AI的算法,為下一次手術(shù)設(shè)計提供幫助。此外,現(xiàn)有的網(wǎng)絡(luò)設(shè)計仍需考慮基層醫(yī)院計算機性能問題,設(shè)計更加輕量的骨干網(wǎng)絡(luò),做到更加的精準(zhǔn)高效。
盡管目前AI在正頜外科領(lǐng)域的應(yīng)用已經(jīng)較為廣泛,然而在完整的三維手術(shù)評估,包括牙弓、骨基底和面部軟組織的三維采集、三維頭影測量分析和使用面部軟硬組織仿真模型的虛擬手術(shù),以及系統(tǒng)的術(shù)后評價中的臨床實踐仍然罕見[31]。因此未來的研究可著眼構(gòu)建一個基于AI的一體化系統(tǒng),該系統(tǒng)可在輸入面部軟硬組織的影像學(xué)資料后自動進行圖像處理、自動頭影測量分析、并將患者某些需求納入?yún)⒖己筮M行個性化手術(shù)設(shè)計,輸出術(shù)式(如上下頜骨的移動方式及移動距離)為經(jīng)驗不足的醫(yī)生提供參考、預(yù)測術(shù)后容貌為患者提供參考。這種系統(tǒng)將擴大病例數(shù)據(jù)庫,優(yōu)化AI模型,最大程度發(fā)揮AI技術(shù)在精準(zhǔn)醫(yī)療、個體化治療中的優(yōu)勢,并將其應(yīng)用于正頜外科領(lǐng)域,讓更多患者得到最佳治療。最后AI的應(yīng)用需要嚴(yán)格地遵守倫理準(zhǔn)則,如果AI技術(shù)能夠充分且合理地應(yīng)用,它有可能在短期內(nèi)改善人們的口腔頜面部健康狀況,從而顯著減小醫(yī)生負(fù)擔(dān)。