梅宏翔 程俊豪 李一洲 馬凰稅 張愷文 壽宇珂 李楊
1.口腔疾病研究國家重點實驗室 國家口腔疾病臨床醫(yī)學(xué)研究中心
四川大學(xué)華西口腔醫(yī)院,成都 610041;2.四川大學(xué)計算機學(xué)院,成都 610041
人工智能是指任何感知環(huán)境并采取行動以最大程度實現(xiàn)既定目標的設(shè)備。作為人工智能的核心,機器學(xué)習(xí)能評估給定數(shù)據(jù)集中的未知依賴關(guān)系,并用這種關(guān)系來預(yù)測新的結(jié)果。其主要包括兩種類型:1)監(jiān)督學(xué)習(xí),使用標記過的訓(xùn)練數(shù)據(jù)集學(xué)習(xí)來建立模型;2)無監(jiān)督學(xué)習(xí),使用未標記的訓(xùn)練數(shù)據(jù)集的共同特征來建立模型。機器學(xué)習(xí)解決了如何自動改進計算機系統(tǒng)模型的問題,逐漸成為應(yīng)用系統(tǒng)的首選開發(fā)方法[1]。醫(yī)學(xué)作為數(shù)據(jù)密集型領(lǐng)域,機器學(xué)習(xí)在醫(yī)學(xué)領(lǐng)域中具有極大的應(yīng)用前景。研究[2]已經(jīng)證明,與傳統(tǒng)統(tǒng)計學(xué)方法相比,機器學(xué)習(xí)方法能夠做出更為準確的腫瘤診斷及預(yù)后判定。口腔醫(yī)學(xué)作為醫(yī)學(xué)的分支學(xué)科,具備了醫(yī)學(xué)臨床思維的理念和方法。目前,研究者已經(jīng)使用機器學(xué)習(xí)對臨床檢查圖像、生化檢測、基因組信息以及生活習(xí)慣等信息進行學(xué)習(xí),以期能夠?qū)谇活M面部疾病實現(xiàn)早期診斷、鑒別診斷以及預(yù)后預(yù)測。本文就機器學(xué)習(xí)在口腔頜面部囊腫及腫瘤中的應(yīng)用進行綜述。
目前,組織病理及影像學(xué)圖片是診斷口腔頜面部囊腫和腫瘤的重要指標,而圖像識別技術(shù)在計算機領(lǐng)域逐漸成熟。圖像需要經(jīng)過預(yù)處理、圖像分割、特征提取等處理后才能被納入分類器中構(gòu)建模型,不同的圖像、處理方式及分類器將會決定模型的性能差異。
1.1.1 組織病理學(xué)圖像 囊腫的診斷主要依賴于組織學(xué)染色的圖像,目前已經(jīng)有許多研究對這一領(lǐng)域進行了探索。Landini等[3]早在2003年就開始研究口腔囊腫的上皮細胞分割方法。其對蘇木精-伊紅(hematoxylin-eosin staining,HE)染色圖像使用顏色反卷積算法進行基于光密度的細胞核定位,去卷積提取核酸位置,直方圖均衡化后通過設(shè)立光密度閾值分離出上皮區(qū)室,并通過分水嶺變換將上皮圖像分割為細胞輪廓。這樣分割所得的不規(guī)則圖像進行層距離變換以確定任意點的層級,循環(huán)進行,并引入局部向量以得到層的相對參考位置。這一研究首次提供了描述牙源性角化囊腫細胞的“柵欄狀”和“極化”特征的定量測量方法。與Landini不同的是,Eramian等[4]主要著眼于口腔囊腫上皮的整體分割。其對HE染色圖像進行亮度和色度的標準化處理后,根據(jù)色度標準進行閾值處理,初步將圖像分割為組織和非組織區(qū)域。然后根據(jù)最大流算法獲取最小切割并提取分割的二值圖像,使用無向加權(quán)圖的圖形切割上皮細胞。但測試集檢驗發(fā)現(xiàn)該方法最優(yōu)參數(shù)集的平均分割特異度僅為85%。這可能與較薄部位的過度分割有關(guān)。這些研究為構(gòu)建口腔頜面部組織學(xué)圖像的機器學(xué)習(xí)模型奠定了堅實的圖像處理基礎(chǔ)。
Landini等[5]于2006年使用上述算法[3]將HE染色的口腔囊腫病理圖像分割成理論細胞區(qū)域并區(qū)分層級,提取出單個細胞的27種形態(tài)學(xué)計量參數(shù)(包括最大軸長等11種基礎(chǔ)幾何測量值和16種計算組合),并使用系統(tǒng)聚類法計算,成功地區(qū)分出牙源性角化囊腫和根尖囊腫,達到了96.7%的正確率,但對于角化囊腫亞型(單發(fā)型和痣樣基底細胞癌綜合征型)的區(qū)分度只達到了60%。而使用同樣的方式處理圖像后,Haar級聯(lián)分類器對于上述2種囊腫的區(qū)分度能夠達到100%,但對亞型的區(qū)分度也僅為60%。Frydenlund等[6]借鑒了Eramian的整體處理方法[4]以及Landini的分層處理技術(shù)[3],并使用不同的色調(diào)表征不同的原始細胞成分,使得上皮層厚度、細胞形狀、腺樣結(jié)構(gòu)以及角蛋白等差異均被納入識別指征中,全方位描述了口腔囊腫的組織學(xué)圖像特征。其選用了支持向量機(support vector machine,SVM)和基礎(chǔ)學(xué)習(xí)者(base learner,BLR)2種分類器來構(gòu)建數(shù)據(jù)模型,用于診斷4種牙源性囊腫(含牙囊腫、牙源性角化囊腫、側(cè)牙周囊腫、腺牙源性囊腫),結(jié)果表明,SVM模型中驗證集正確率為92.3%,BLR模型中驗證集正確率為95.4%,二者訓(xùn)練前后標準一致性均接近1.0,而在去除含牙囊腫之后,準確率可以提升到96.2%。這些研究提供了口腔囊腫的一種定量測量方法,協(xié)助特征的提取和比較,可用于組織病理學(xué)的智能診斷,但其不能僅基于囊腫上皮結(jié)構(gòu)區(qū)分角化囊腫上皮亞型。
1.1.2 錐形束計算機斷層掃描(cone beam computed tomography,CBCT)圖像 Okada等[7]首先采用隨機游走分割(random walks segmentation)在CBCT中半自動區(qū)分出病變部位,并從分割區(qū)域自動提取8種圖像特征,基于這些特征構(gòu)建的LDA-AdaBoost分類器模型可以達到94.1%的準確度。Abdolali等[8]則在使用對稱分析和活動輪廓分割出頜面部囊腫之后,分別使用輪廓波和球諧函數(shù)(spherical harmonics,SPHARM)進行外形和質(zhì)地特征提取,并使用SVM和稀疏判別2種分類器對根尖囊腫、牙周囊腫和牙源性角化囊腫進行鑒別。當同時使用稀疏判別分析和正交化的SPHARM系數(shù)時,其可以實現(xiàn)96.48%的準確率。這些研究為臨床椅旁鑒別診斷囊腫奠定了基礎(chǔ)。
1.2.1 臨床數(shù)字圖像 早期實驗僅對于臨床采集的口腔黏膜白斑(oral leukoplakia,OLK)和口腔苔蘚樣病變的彩色圖像進行了研究。由臨床醫(yī)生在口腔黏膜數(shù)字圖像上描繪出病變區(qū)域、炎癥區(qū)域和正常組織,再提取出基于形狀的色度特征,最后將其納入SVM分類器中構(gòu)建自動診斷模型,成功地將89%的圖像正確地區(qū)分為癌前病變和非癌前病變[9]。
1.2.2 組織病理學(xué)圖像 口腔黏膜下纖維化(oral submucous fibrosis,OSF)作為一種重要的癌前病變,其診斷及分級卻尚無客觀定量標準[10]。Krishnan等[11]通過多重閾值化處理技術(shù)來分割上皮下結(jié)締組織,并用橢圓近似來獲得偏心率以及用計算周長/面積來獲得緊湊性,用SVM分類器根據(jù)這2種特征對上皮下結(jié)締組織中的細胞按圓形和紡錘形進行分類。模型在OSF的診斷中已經(jīng)達到了90.47%的靈敏度和88.69%的分類準確性。而該課題組另一研究[12]設(shè)計了基于紋理的分水嶺技術(shù),針對灰度、顏色及紋理的不連續(xù)性和局部相似性等元素對OSF組織學(xué)染色圖像進行分割,采用小波、分形維數(shù)、布朗運動曲線、局部二值模式(local binary pattern,LBP)和Gabor小波變換提取出69種紋理特征,并以此設(shè)計SVM分類器。當bior3.1小波系數(shù)、LBP和Gabor小波變換相結(jié)合時,分類器能夠達到88.38%的準確率。這些研究可能為OSF這一癌前病變的診斷和治療方案制定提供參考。
1.2.3 脫落細胞圖像 OLK作為另一種重要癌前病變,其臨床評估在口腔鱗狀細胞癌的早期診斷中具有極為重要的地位[10]。Liu等[13]開發(fā)了一種基于脫落細胞數(shù)據(jù)的OLK風(fēng)險定量評估模型。該模型選取了脫落細胞的DNA指數(shù),并通過對細胞群DNA的峰識別、二倍體/四倍體的提取和非整倍體的分離、信號放大和數(shù)據(jù)重建4個步驟完成數(shù)據(jù)轉(zhuǎn)換和重建。在6種分類器構(gòu)建的模型中,基于SVM的模型具有良好的靈敏度(0.939)和特異性(0.9444)。該模型能夠?qū)LK患者進行風(fēng)險評估并分級,以設(shè)立針對于高危人群的預(yù)防措施,提高臨床隨訪的成本效益。
1.3.1 組織病理學(xué)圖像 Das等[14]首先用奇異值分解(singular value decomposition,SVD)的方法對組織學(xué)染色樣本進行標準化處理,再用Otsu閾值處理與形態(tài)學(xué)算子提取出候選細胞,使用熵度量、分形維數(shù)和基于Hu’s矩描述符提取出12個描述特征,最終這些數(shù)據(jù)納入隨機森林(random forests,RF)模型以檢測口腔鱗狀細胞癌病理圖像中的有絲分裂細胞,使其達到了89%的精確度、95%的靈敏度、97.35%的特異性和96.45%的受試者曲線下面積(receiver operating characteristic curve,AUC)。Rahman等[15]則使用MATLAB軟件中的imadjust函數(shù)對組織病理圖像標準化處理,采用直方圖和灰度共生矩陣(gray level co-occurrence matrix,GLCM)提取出18種紋理特征(包括一階和二階),納入線性SVM分類器以自動診斷口腔鱗狀細胞癌,并達到了100%的準確率。
1.3.2 計算機斷層掃描(computed tomography,CT)圖像 CT是口腔惡性腫瘤診斷的重要依據(jù)。Pragna等[16]使用自適應(yīng)中值濾波器對頜面部CT圖像進行預(yù)處理,并選用Gabor濾波器來提取特征。其采用SVM分類器構(gòu)建口腔腫瘤診斷模型,展現(xiàn)出97%的準確度和95%的靈敏度。Hu等[17]提出采用結(jié)合各向異性濾波器預(yù)處理CT圖像,并選用模糊C均值聚類算法分割,隨后又通過3種不同的算法[GLCM、一階統(tǒng)計紋理( first order statistical texture,F(xiàn)O)和灰度運行長度矩陣(gray run length matrix,GLRLM)]提取特征,最后使用基于SVM的機器學(xué)習(xí)方法對于口腔腫瘤進行分類,使其最高精確度達到90.11%。
1.3.3 共聚焦內(nèi)窺鏡(confocal endoscope,CLE)圖像 由于CLE具有無創(chuàng)性、極高放大倍數(shù)以及深度穿透等優(yōu)勢,在口腔黏膜疾病診治中有著越來越大的應(yīng)用前景[18]。Jaremenko等[19]率先使用基于組織特征的經(jīng)典模式識別(局部二值模式、GLCM或局部直方圖統(tǒng)計等)作為分類依據(jù),并用RF和SVM兩種機器學(xué)習(xí)算法來自動識別口腔癌患者和健康人黏膜的CLE圖像,在診斷口腔腫瘤方面分別達到了98.0%和99.2%的準確率。Ditt berner等[20]參考上述圖像處理方法來提取頭頸部CLE圖像特征向量,并使用非線性SVM分類器來學(xué)習(xí)腫瘤和非腫瘤的差異,得到0.776 0的AUC值和74.60%的平均交叉驗證準確度。作為重要的無監(jiān)督學(xué)習(xí)方式,卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural networks,CNNs)是一種不以特征提取為基礎(chǔ)的深度學(xué)習(xí)方法。一項研究[21]對來自于4個區(qū)域的口腔鱗狀細胞癌進行診斷,平均準確率為88.3%(靈敏度86.6%,特異性90%)。然而,由于深度學(xué)習(xí)未知數(shù)較多,所需計算的參數(shù)更多,因此需要納入更大量的數(shù)據(jù)。
1.3.4 生化檢測圖像 Zlotogorski-Hurvitz等[22]測量口腔癌患者和健康人群唾液外泌體的傅里葉變換紅外吸收光譜,并通過Savitsky-Golay平滑算法減少噪聲和標準化,最后通過主成分分析—線性判別分析(principal component analysis-linear discriminant analysis,PCA-LDA)和SVM分類算法分別建立診斷模型,發(fā)現(xiàn)這2種模型的準確率分別達到95%和89%,這一研究人群較少,降低了該研究結(jié)果的可靠性,但為基于核酸、蛋白質(zhì)、脂質(zhì)結(jié)構(gòu)/數(shù)量變化的口腔癌早期診斷提供了新的研究方向。
研究[23]根據(jù)臨床診斷流程,綜合患者基本信息、臨床表現(xiàn)、臨床檢查結(jié)果、病理報告結(jié)果甚至基于大數(shù)據(jù)等構(gòu)建自動診斷專家模型,利用多種信息模擬臨床診斷過程得出準確的診斷及預(yù)后預(yù)測結(jié)果,輔助醫(yī)生臨床決策。
Mohd等[24]選取了14個臨床病理特征(包括人口統(tǒng)計學(xué)特征、臨床體征和癥狀、組織病理學(xué)特征和腫瘤早期特征)構(gòu)建早期口腔癌診斷模型,結(jié)果顯示SVM在預(yù)處理階段將特征子集選擇與合成少數(shù)類過采樣技術(shù)(synthetic minority oversampling technique,SMOTE)相結(jié)合后,其對口腔癌初期診斷的準確度優(yōu)于其他機器算法(包括可更新樸素貝葉斯、多層感知器和K最近鄰等)。結(jié)合之前的研究提示,基于SVM的圖像識別技術(shù)可能成為口腔腫瘤的識別診斷、臨床分期模型構(gòu)建的首選方法。
Turki等[25]基于現(xiàn)有的基因高通量測序數(shù)據(jù)來預(yù)測口腔癌的發(fā)展,并對SVM分類器進行了改進,使準確度、AUC等性能均優(yōu)于SVM和Xgboost這2個傳統(tǒng)的分類器模型。Exarchos等[26-27]選取了臨床、影像、組織和血液基因組數(shù)據(jù)并構(gòu)建貝葉斯網(wǎng)絡(luò)模型。雖然他們聲稱該模型對口腔惡性腫瘤復(fù)發(fā)風(fēng)險的預(yù)測準確度已達到了100%,但超過70個標記物的數(shù)據(jù)需要極大地限制了臨床應(yīng)用。Chang等[28]僅選取15項臨床病理數(shù)據(jù)和2項基因型(p53和p63)數(shù)據(jù)進行隨機組合,并選用自適應(yīng)神經(jīng)模糊推理系統(tǒng)(adaptive neuro-fuzzy inference system,ANFIS)、人工神經(jīng)網(wǎng)絡(luò)(artificial neural network,ANN)、SVM、邏輯回歸(logistic regression,LR)4種分類器進行學(xué)習(xí)和構(gòu)建口腔惡性腫瘤預(yù)后預(yù)測模型。該研究發(fā)現(xiàn),飲酒史、侵襲性和p63這3種輸入特征結(jié)合ANFIS分類器能實現(xiàn)最佳的準確度(準確度=93.81%;AUC=0.90)。Carnielli等[29]針對唾液樣本構(gòu)建了基于蛋白組學(xué)的口腔鱗狀細胞癌淋巴結(jié)轉(zhuǎn)移的預(yù)測模型。首先,其發(fā)現(xiàn)在腫瘤侵襲前沿中有7種蛋白質(zhì)存在差異性表達,采用RF對唾液中的這7種蛋白質(zhì)構(gòu)建模型發(fā)現(xiàn),白三烯水解酶A4(leukotriene A-4 hydrolase,LTA4H)、膠原蛋白α-1 [collagen alpha-1(Ⅵ)chain,COL6A1]和胱抑素-B(cystatin-B,CSTB)組合對淋巴結(jié)轉(zhuǎn)移預(yù)測性能最高。這些研究將為臨床預(yù)測口腔惡性腫瘤預(yù)后情況提供新的方法,并為臨床醫(yī)生進行醫(yī)療決策提供參考。
醫(yī)學(xué)作為一個成熟領(lǐng)域,擁有著精密的診斷思維模式、海量醫(yī)學(xué)圖像。而這些則可以轉(zhuǎn)換為機器學(xué)習(xí)領(lǐng)域所必需的算法和數(shù)據(jù)。本文提到的許多研究均認為,基于SVM的機器學(xué)習(xí)方法相比于其他分類器而言,是醫(yī)學(xué)圖像識別、智能診斷以及臨床信息分析的較佳算法,在口腔醫(yī)學(xué)領(lǐng)域的臨床應(yīng)用中具有極大的潛能。隨著組織病理圖像處理技術(shù)的發(fā)展,更多的圖像特點能夠被納入到機器學(xué)習(xí)中,這也使得基于圖像特征的頜面部囊腫及腫瘤輔助診斷水平逐漸提高。而臨床決策支持系統(tǒng)由于要求的信息量大且質(zhì)量高,尚不便于在臨床中推廣。
同時,由于機器學(xué)習(xí)仍然是一個年輕的領(lǐng)域,大多數(shù)機器學(xué)習(xí)算法的目標是從單一的數(shù)據(jù)源中學(xué)習(xí)一個特定的功能或數(shù)據(jù)模型。但是人類的知識和技能是從多年不同的訓(xùn)練經(jīng)驗中獲得,這些經(jīng)驗包括了多種學(xué)習(xí)方式,如監(jiān)督性、無監(jiān)督性以及序列學(xué)習(xí)等。所以即使擴大了臨床樣本的類型,機器學(xué)習(xí)在模擬臨床診斷思維上仍可能較為局限。
綜上所述,今后仍需要在計算機領(lǐng)域和口腔醫(yī)學(xué)領(lǐng)域開展進一步的合作,將臨床問題、臨床思路、臨床方案通過計算機算法模式展現(xiàn)出來,并將數(shù)據(jù)合作共享,共同合作,開發(fā)出能達到臨床應(yīng)用級別的軟件,優(yōu)化資源配置,促進優(yōu)質(zhì)醫(yī)療資源下沉,解決醫(yī)療資源分布不均等問題。
利益沖突聲明:作者聲明本文無利益沖突。