馬艷寧 金作林
710032 西安, 國(guó)家軍事口腔醫(yī)學(xué)重點(diǎn)實(shí)驗(yàn)室, 國(guó)家口腔疾病臨床醫(yī)學(xué)研究中心, 陜西省口腔疾病臨床研究中心, 空軍軍醫(yī)大學(xué)第三附屬醫(yī)院正畸科
近年來(lái),在醫(yī)學(xué)領(lǐng)域人工智能得到了前所未有的繁榮,智慧診療與輔助醫(yī)療決策等技術(shù)不斷涌現(xiàn)。在這樣的大環(huán)境之下,人工智能的優(yōu)勢(shì)也體現(xiàn)在了口腔數(shù)字化的掃描、診斷、設(shè)計(jì)與制造、臨場(chǎng)手術(shù)等疾病診療等方面。同時(shí)融合了三維數(shù)據(jù)采集技術(shù)、數(shù)學(xué)建模技術(shù)、計(jì)算機(jī)輔助設(shè)計(jì)與增材制造技術(shù)等,使得數(shù)字化口腔診療技術(shù)不斷的發(fā)展與革新[1]。隨著口腔正畸學(xué)科的發(fā)展,人工智能被廣泛運(yùn)用在智能影像識(shí)別系統(tǒng)、醫(yī)療決策系統(tǒng)、語(yǔ)音智能系統(tǒng)等方面,對(duì)于正畸診療方案的制定,拔牙非拔牙的決策以及診療過程中的輔助等方面都表現(xiàn)出相當(dāng)?shù)膬?yōu)勢(shì)[2]。但值得注意的是,在人工智能的開發(fā)與應(yīng)用上,存在著一些目前的技術(shù)水平尚無(wú)法解決的科學(xué)問題,加之醫(yī)學(xué)是一門復(fù)雜的學(xué)科,關(guān)乎患者的切身利益,并且由于個(gè)體差異性,用人工智能進(jìn)行醫(yī)療決策并完全替代醫(yī)生尚不可行。但要肯定的是隨著人工智能在醫(yī)學(xué)診療中的優(yōu)勢(shì)逐漸體現(xiàn),未來(lái)將會(huì)在正畸治療中逐步實(shí)現(xiàn)三維化、智能化、精準(zhǔn)化。
由于人工智能可以根據(jù)先驗(yàn)知識(shí)對(duì)相關(guān)知識(shí)點(diǎn)進(jìn)行識(shí)別加之邊緣檢測(cè)技術(shù)的運(yùn)用,因此在正畸領(lǐng)域涉獵最廣的就是頭影測(cè)量,對(duì)于二維影像的識(shí)別定位方法,從圖像過濾與基于知識(shí)的標(biāo)志點(diǎn)搜索、主動(dòng)形狀模型和主動(dòng)外觀模型建立以及相關(guān)學(xué)習(xí)的方法等技術(shù)的演變與發(fā)展,目前二維頭影測(cè)量自動(dòng)定點(diǎn)研究已日趨成熟,在臨床運(yùn)用中有效減少了頭影測(cè)量分析所需要的時(shí)間和因主觀因素而導(dǎo)致的誤差,提高了標(biāo)志點(diǎn)識(shí)別的準(zhǔn)確性,臨床運(yùn)用較為廣泛。Arik等[3]首次將卷積神經(jīng)網(wǎng)絡(luò)(CNN)應(yīng)用于識(shí)別頭顱側(cè)位片,將19 個(gè)標(biāo)志點(diǎn)中2 mm以內(nèi)的誤差檢測(cè)成功率提高到了76%,接著Leonardi等[4]運(yùn)用機(jī)器學(xué)習(xí)進(jìn)行定點(diǎn),在前期自動(dòng)定點(diǎn)軟件基礎(chǔ)上又將準(zhǔn)確率提高了5%~15%。Park等[5]運(yùn)用YOLOv3方法對(duì)80 個(gè)標(biāo)志點(diǎn)進(jìn)行檢測(cè),在此方法下,將其中19 個(gè)主要標(biāo)志點(diǎn)2 mm內(nèi)誤差范圍的檢測(cè)成功率提高到80.4%,重復(fù)性明顯高于人工標(biāo)注,且不受性別、骨骼分類、圖像質(zhì)量的影響,通過Park團(tuán)隊(duì)的研究[6]證實(shí)深度學(xué)習(xí)方法在標(biāo)志點(diǎn)定位中有高精度的表達(dá)。在此基礎(chǔ)上,Kunz等[7]使用深度學(xué)習(xí)方法對(duì)標(biāo)志點(diǎn)進(jìn)行自動(dòng)識(shí)別,在參數(shù)水平上驗(yàn)證了CNN檢測(cè)18 個(gè)標(biāo)志點(diǎn)的準(zhǔn)確率與人工沒有顯著差異,同時(shí)Lee等[8]應(yīng)用CNN對(duì)18 個(gè)標(biāo)志點(diǎn)自動(dòng)定位,定位準(zhǔn)確率達(dá)到了82.11%~95.95%。以上這些研究無(wú)不證實(shí)采用人工智能方法助力頭影測(cè)量的實(shí)現(xiàn),可以有效提高工作效率, 但在運(yùn)用中仍需醫(yī)生檢查自動(dòng)定點(diǎn)的準(zhǔn)確性,以確保在此基礎(chǔ)上的診斷以及診療的準(zhǔn)確性,因此如何提高人工智能頭影測(cè)量軟件的穩(wěn)定性與精準(zhǔn)性是目前一直在繼續(xù)深入研究的內(nèi)容。
在二維影像資料中發(fā)揮出不小的潛力之后,人工智能也在三維影像數(shù)據(jù)的識(shí)別與提取中嶄露頭角,三維計(jì)算機(jī)斷層掃描中三維頭影測(cè)量標(biāo)志的標(biāo)注已成為頭影測(cè)量分析的重要組成部分,常用于診斷、手術(shù)計(jì)劃和治療評(píng)估。由于訓(xùn)練數(shù)據(jù)的可獲得性和計(jì)算量的限制,高精度三維標(biāo)注的自動(dòng)化仍然具有挑戰(zhàn)性。Yun等[9]提出了一種分層的深度學(xué)習(xí)方法對(duì)CBCT特征點(diǎn)進(jìn)行標(biāo)注,該方法實(shí)現(xiàn)了基于二維圖像的三維形態(tài)特征學(xué)習(xí)和頭影標(biāo)記的連接向量的相似/不相似表示學(xué)習(xí)。該方法使用少量訓(xùn)練CBCT數(shù)據(jù)集,對(duì)93 個(gè)頭影測(cè)量標(biāo)志點(diǎn)實(shí)現(xiàn)了平均3.63 mm的三維點(diǎn)誤差。Minnema等[10]通過patch深度學(xué)習(xí)網(wǎng)絡(luò)對(duì)CBCT 的13 個(gè)常用標(biāo)志點(diǎn)定位進(jìn)行自動(dòng)識(shí)別,評(píng)價(jià)實(shí)驗(yàn)表明,該CNN模型平均處理時(shí)間為37.871 s,平均精度為5.785 mm。Gupta等[11]在處理CBCT標(biāo)志點(diǎn)時(shí),將相鄰的標(biāo)志點(diǎn)分成不同的組來(lái)檢測(cè),最終20 個(gè)標(biāo)志點(diǎn)的總平均誤差降低到2.01 mm。這一精度有效減輕了醫(yī)生的工作量并弱化平時(shí)依賴于人類經(jīng)驗(yàn)的解剖定位方法,更加精準(zhǔn)可靠。但值得注意的是,個(gè)體解剖學(xué)存在差異,并且容易出現(xiàn)學(xué)習(xí)的結(jié)果受到數(shù)據(jù)多樣性的影響,使得定位常常出現(xiàn)較大的偏差,加之一些標(biāo)志點(diǎn)本身影像結(jié)構(gòu)重疊不清,或圖形特征不明顯等原因,再加上人工智能最大的困擾數(shù)據(jù)集有限等問題,目前關(guān)于三維影像資料的定點(diǎn)仍需要較多的人工參與進(jìn)行校準(zhǔn)。
隨著各種深度學(xué)習(xí)的算法在頭影測(cè)量分析中的成功應(yīng)用與不斷深入,其也在正畸臨床的診斷中彰顯優(yōu)勢(shì),可以用來(lái)診斷患者的錯(cuò)畸形類型以及生長(zhǎng)發(fā)育階段的判斷等。最初的方案設(shè)計(jì)方法是基于專家系統(tǒng)的人工智能分析方法,主要包括基于規(guī)則的專家系統(tǒng)、基于案例的專家系統(tǒng)以及基于人工神經(jīng)網(wǎng)絡(luò)的專家系統(tǒng)等[12-13]。隨著機(jī)器學(xué)習(xí)以及深度學(xué)習(xí)的發(fā)展,正畸診斷方法變得更加智能化。Yu等[14]提出了一種利用CNN建立端到端的深度學(xué)習(xí)模型用于垂直向和矢狀向骨性錯(cuò)畸形的診斷,該方法省略了復(fù)雜的頭影測(cè)量過程,直接將頭顱側(cè)位片和正位片與診斷結(jié)果端對(duì)端聯(lián)系,結(jié)果顯示該模型診斷性能的靈敏度、特異度和準(zhǔn)確率均大于90%。Makaremi等[15]應(yīng)用CNN判斷頭顱側(cè)位片CVMS分期,在不同環(huán)境下對(duì)不同數(shù)量的圖像進(jìn)行訓(xùn)練、評(píng)估和測(cè)試,并對(duì)這些圖像進(jìn)行不同的預(yù)處理。對(duì)模型和方法進(jìn)行了交叉驗(yàn)證。發(fā)現(xiàn)更均勻的類別分布有助于提高準(zhǔn)確率。另一方面,Liu等[16]通過1 023 張標(biāo)注頭顱側(cè)位片建立了一種基于VGG-Lite的深度學(xué)習(xí)模型,進(jìn)行病理性腺樣體肥大的定性診斷。平均單張計(jì)算時(shí)間僅為4.2 s,診斷準(zhǔn)確率與專家水平接近。雖然在運(yùn)用中發(fā)現(xiàn)其精度并不能達(dá)到百分百的評(píng)估預(yù)測(cè)能力,但在一定程度上表明人工智能可以對(duì)生長(zhǎng)發(fā)育階段以及臨床表現(xiàn)做出評(píng)估,以幫助臨床醫(yī)生診斷分析。
基于人工智能方法下的輔助診斷模型,可以有效幫助醫(yī)生制定正畸方案。Suhail等[17]率先通過人工選定特征制定拔牙或者不拔牙的計(jì)劃,運(yùn)用287 例患者的數(shù)據(jù)訓(xùn)練了一些機(jī)器學(xué)習(xí)模型,得到較準(zhǔn)確的訓(xùn)練結(jié)果。國(guó)內(nèi)學(xué)者[12]利用人工神經(jīng)網(wǎng)絡(luò)(ANN)構(gòu)建11~15 歲患者正畸治療決策專家系統(tǒng)(ES),以確定是否需要拔牙,并且揭示出影響拔牙與否的重要因素。結(jié)果顯示該方法的準(zhǔn)確性達(dá)到80%,并且前牙暴露量以及下前牙唇傾度(IMPA)是貢獻(xiàn)最大的指標(biāo)。Thanathornwong等[18]從常用指標(biāo)中篩選出包括覆蓋、覆在內(nèi)的15 個(gè)變量,選擇貝葉斯網(wǎng)絡(luò)(BN)作為基礎(chǔ)模型,輔助評(píng)估患者是否需要正畸治療。Lee等[19]利用深度學(xué)習(xí)方法研究了正頜手術(shù)或正畸治療的必要性,消除了由標(biāo)志性測(cè)量值引起的誤差,大大提升了治療診斷的精準(zhǔn)率。Choi等[20]運(yùn)用一種雙層神經(jīng)網(wǎng)絡(luò),實(shí)現(xiàn)正頜/不正頜的決策,準(zhǔn)確度可以達(dá)到96%,同時(shí)運(yùn)用這樣的網(wǎng)絡(luò)評(píng)估手術(shù)類型與拔牙決策時(shí),表現(xiàn)出91%的準(zhǔn)確度。考慮到正畸方案的設(shè)計(jì)要根據(jù)錯(cuò)畸形類型,非常規(guī)拔牙,患者遺傳因素等問題,另外人工智能在運(yùn)用中的缺陷會(huì)影響整個(gè)正畸方案的設(shè)計(jì),關(guān)乎患者自身的切身利益,因此人工智能的方案決策仍具有局限性,若可以納入更多的影響因素,將會(huì)大幅提升人工智能在方案決策中的作用。
人工智能中的圖像識(shí)別技術(shù)最顯著的優(yōu)勢(shì)在于處理圖片過程中的智能化,可以對(duì)圖片進(jìn)行智能化的分析處理與選擇。人工智能圖像識(shí)別是基于信息技術(shù)基礎(chǔ)衍生發(fā)展而來(lái),其融合了計(jì)算機(jī)對(duì)數(shù)據(jù)信息處理的技術(shù),依賴于計(jì)算機(jī)輔助完成,但目前圖像處理中的分辨率受到圖像信息的影響,準(zhǔn)確性也會(huì)隨之受到影響。
在目前正畸相關(guān)的深度學(xué)習(xí)方法研究中,二維圖像仍是主要的數(shù)據(jù)來(lái)源。二維圖像的局限性包括因透視成像過程導(dǎo)致原本的三維結(jié)構(gòu)投射在二維圖像時(shí)的解剖結(jié)構(gòu)重疊、失真,圖像間尺度差異,以及缺乏相關(guān)標(biāo)志物或病變的三維信息,二維圖像無(wú)法對(duì)三維結(jié)構(gòu)信息進(jìn)行表達(dá),在利用機(jī)器學(xué)習(xí)對(duì)二維圖像進(jìn)行訓(xùn)練時(shí),可能會(huì)由于信息缺失影響模型的準(zhǔn)確性[21],將這些二維圖像轉(zhuǎn)為三維模型后更便于診斷分析,可有效降低以上誤差??紤]到在圖像識(shí)別技術(shù)中的缺陷性,即使是三維圖像,由于其所包含的信息量較大,仍然會(huì)影響圖像識(shí)別的準(zhǔn)確性,因此需要不斷優(yōu)化圖像識(shí)別,使基于人工智能的圖像識(shí)別技術(shù)的應(yīng)用變得更加的便捷,更全面發(fā)揮其優(yōu)勢(shì)。
訓(xùn)練深度學(xué)習(xí)網(wǎng)絡(luò)的方式包括監(jiān)督學(xué)習(xí)、無(wú)監(jiān)督學(xué)習(xí)和半監(jiān)督學(xué)習(xí)等,監(jiān)督學(xué)習(xí)指的是先使用標(biāo)記過的訓(xùn)練集進(jìn)行預(yù)訓(xùn)練,得到模型參數(shù),然后將這種學(xué)習(xí)到的經(jīng)驗(yàn)在驗(yàn)證集上進(jìn)行驗(yàn)證。而無(wú)監(jiān)督學(xué)習(xí)則不對(duì)訓(xùn)練集進(jìn)行標(biāo)記,讓深度神經(jīng)網(wǎng)絡(luò)自動(dòng)學(xué)習(xí)內(nèi)在的規(guī)則[22]。目前正畸相關(guān)的深度學(xué)習(xí)研究中,常用的模型包括CNN(卷積神經(jīng)網(wǎng)絡(luò)),RNN(循環(huán)神經(jīng)網(wǎng)絡(luò))等往往需要進(jìn)行監(jiān)督學(xué)習(xí),但是和普通訓(xùn)練數(shù)據(jù)集不同,正畸主要面對(duì)的各類非正常的畸形情況,正畸數(shù)據(jù)集并無(wú)通用標(biāo)準(zhǔn)對(duì)數(shù)據(jù)進(jìn)行標(biāo)注,因此標(biāo)記數(shù)據(jù)的誤差也會(huì)影響深度學(xué)習(xí)模型訓(xùn)練結(jié)果的準(zhǔn)確性。另外對(duì)于三維影像資料由于其包含的信息較多,由不同的平掃層面組成,標(biāo)記需要分層進(jìn)行,往往費(fèi)時(shí)較多,同時(shí)不同水平與認(rèn)知的工作人員對(duì)于標(biāo)記的把握也參差不齊,因此標(biāo)記的準(zhǔn)確性影響著正畸相關(guān)決策的制定。
基于深度神經(jīng)網(wǎng)絡(luò)的智能系統(tǒng),由于學(xué)習(xí)和預(yù)測(cè)過程不透明,不知道其根據(jù)學(xué)到的哪部分特征進(jìn)行的預(yù)測(cè)和判斷,操作者難以解釋其科學(xué)性,被稱為“黑盒特性”。深度學(xué)習(xí)的“黑盒特性”,難以用純數(shù)學(xué)理論的方法進(jìn)行分析解釋,目前缺乏完備的理論和方法體系對(duì)其網(wǎng)絡(luò)架構(gòu)進(jìn)行解釋[23]。在眾多研究中,很多學(xué)者也給出了多種非數(shù)學(xué)上的定義,包括人類對(duì)于決策原因理解的程度、人類可以持續(xù)預(yù)測(cè)模型結(jié)果的程度、向人類做出解釋的過程等[24]。在神經(jīng)網(wǎng)絡(luò)的運(yùn)行中可解釋性與決策能力呈正相關(guān),也就是說可解釋性越高,做出決策與預(yù)測(cè)的準(zhǔn)確性才能越高。深度神經(jīng)網(wǎng)絡(luò)的不透明性、不可解釋性和不可理解性,成為制約深度學(xué)習(xí)技術(shù)可靠和可信應(yīng)用的主要瓶頸。目前大多數(shù)正畸相關(guān)的深度學(xué)習(xí)研究,都無(wú)法可視化的解釋其深度學(xué)習(xí)模型運(yùn)行結(jié)果的邏輯。對(duì)于正畸醫(yī)生而言,單純依賴深度學(xué)習(xí)模型的結(jié)果做出決策就會(huì)顯得缺乏依據(jù),尤其是預(yù)測(cè)性結(jié)果的可靠性難以確認(rèn),而這種醫(yī)療決策的不可追溯性可能會(huì)導(dǎo)致潛在的醫(yī)患糾紛。
正畸患者治療的長(zhǎng)周期,決定了正畸醫(yī)生難以獲取大樣本量的數(shù)據(jù)集用于深度學(xué)習(xí)的研究。在目前正畸相關(guān)的深度學(xué)習(xí)文獻(xiàn)中,所使用的樣本量通常在1 000 例以下,少數(shù)研究的樣本量達(dá)到了幾千例。對(duì)于數(shù)據(jù)驅(qū)動(dòng)的深度神經(jīng)網(wǎng)絡(luò)而言,數(shù)據(jù)量對(duì)于模型的性能有著顯著的影響,通常訓(xùn)練良好的深度學(xué)習(xí)模型所需要的數(shù)據(jù)量在十萬(wàn)以上,過小的樣本量容易導(dǎo)致過擬合的問題[25]。除此之外,正畸樣本的可標(biāo)記數(shù)據(jù)獲取困難,標(biāo)簽數(shù)據(jù)的獲取需要大量專業(yè)醫(yī)師進(jìn)行數(shù)據(jù)標(biāo)注,這為正畸數(shù)據(jù)用于機(jī)器學(xué)習(xí)訓(xùn)練產(chǎn)生了巨大的挑戰(zhàn)。
大多數(shù)正畸相關(guān)的深度學(xué)習(xí)模型,都是使用同一機(jī)構(gòu)在一段規(guī)定的時(shí)間內(nèi)收集的少量圖像開發(fā)的。此外,用于開發(fā)算法的圖像很可能是使用相同的設(shè)備和成像協(xié)議捕獲的。因此不同時(shí)間不同設(shè)備采集的數(shù)據(jù)缺乏數(shù)據(jù)異構(gòu)性。在模型推廣應(yīng)用時(shí),面對(duì)各種異構(gòu)數(shù)據(jù)往往魯棒性和泛化能力欠佳,這可能會(huì)導(dǎo)致模型缺乏通用性和可靠性,并可能由于變量(包括設(shè)備、成像方案和患者群體)的不同而導(dǎo)致在廣泛的臨床實(shí)踐中的表現(xiàn)不盡如人意[26]。
機(jī)器學(xué)習(xí)作為人工智能的核心技術(shù),其性能和隱私受到在近年來(lái)廣泛關(guān)注,傳統(tǒng)的機(jī)器學(xué)習(xí)需要有服務(wù)商收集用戶的數(shù)據(jù)后集中訓(xùn)練, 但是用戶的數(shù)據(jù)與用戶個(gè)體緊密相關(guān), 其中不乏一些敏感信息,而這些信息若被挪作他用,則可能威脅用戶的人身安全、個(gè)人名譽(yù)和財(cái)產(chǎn)安全。另外集中訓(xùn)練后發(fā)布的模型也可能因?yàn)槭艿焦舳孤峨[私[27]。但是人工智能技術(shù)卻需要對(duì)大量數(shù)據(jù)進(jìn)行收集和融合, 如果不能獲取完整豐富的信息來(lái)訓(xùn)練模型人工智能這門技術(shù)將會(huì)受到嚴(yán)重的制約。正畸學(xué)科中的隱私保護(hù)同樣是人工智能正畸領(lǐng)域發(fā)展的制約因素,很多隱形矯治器公司,需要大數(shù)據(jù)才能確保治療方案的可靠性,但大量資料的獲得與存儲(chǔ)就使得患者的隱私受到威脅,若資料數(shù)據(jù)量不足,則嚴(yán)重制約隱形矯治技術(shù)的發(fā)展。目前大數(shù)據(jù)的個(gè)人隱私保護(hù)仍處于起步階段,在生態(tài)環(huán)境和研究的各個(gè)層面上都提出了挑戰(zhàn)性研究問題。
基于人工智能在正畸學(xué)科中的運(yùn)用現(xiàn)狀,其在未來(lái)仍有較大的發(fā)展空間,若未來(lái)可以將深度學(xué)習(xí)的訓(xùn)練方法圍繞著半監(jiān)督學(xué)習(xí)方法展開[28],從原來(lái)需要大量的數(shù)據(jù)以及大規(guī)模數(shù)據(jù)任務(wù)的監(jiān)督學(xué)習(xí)現(xiàn)狀轉(zhuǎn)變?yōu)檩^少數(shù)據(jù)需求以及較少標(biāo)注工作的轉(zhuǎn)變,則在有效降低工作量的同時(shí),不斷增加輔助診療的精準(zhǔn)度,這樣就使得人工智能這門技術(shù)實(shí)現(xiàn)低門檻,高收益,更好的服務(wù)于臨床。
在隱私保護(hù)方面,聯(lián)邦學(xué)習(xí)在數(shù)據(jù)孤島現(xiàn)象與數(shù)據(jù)融合需求的矛盾背景下,應(yīng)運(yùn)而生。它通過多個(gè)數(shù)據(jù)持有方協(xié)同訓(xùn)練模型而不分享數(shù)據(jù),這樣在保證足夠的訓(xùn)練集的前提下,患者仍可對(duì)自己的資料進(jìn)行控制[29]。
從應(yīng)用層面上來(lái)說,人工智能技術(shù)可以將優(yōu)質(zhì)化的正畸醫(yī)療資源加以智能化分析,通過數(shù)字化技術(shù)的分析存儲(chǔ)以及分享,更快更精準(zhǔn)實(shí)現(xiàn)正畸方案的確定,資源共享,可以短時(shí)間解決優(yōu)質(zhì)醫(yī)療資源分布不均衡問題。目前人工智能針對(duì)正畸數(shù)字化技術(shù)正逐步實(shí)現(xiàn)從單模態(tài)到多模態(tài),單一因素到多因素的分類分析。未來(lái)將有效解決正畸資源分布不均的問題,讓更多的患者享受到規(guī)范化的正畸診療。
總之,借助于人工智能技術(shù),發(fā)揮其在正畸診斷治療中的優(yōu)勢(shì),形成三維化、智能化正畸輔助診斷和治療計(jì)劃、并使相關(guān)數(shù)據(jù)可存可訪,對(duì)于提高基層和邊緣地區(qū)正畸方案設(shè)計(jì)的精準(zhǔn)性與高效性,提升正畸醫(yī)生的專業(yè)水平,有著重要的社會(huì)意義。但在人工智能迅速發(fā)展的當(dāng)下,需要認(rèn)清其僅可作為輔助診療的手段,人工智能本身所存在的問題以及醫(yī)療本身的個(gè)體差異性與復(fù)雜性,意味著醫(yī)生仍是治療的主體,切不可過分依賴于人工智能。