魏欣逸綜述,蘇斌虓審校
隨著科技的飛速發(fā)展,整個社會的自動化程度不斷提高,智能化醫(yī)療已經(jīng)成為現(xiàn)如今的發(fā)展趨勢[1-2]。面部識別作為人工智能的一種,在醫(yī)療領(lǐng)域中也逐漸成為研究熱點。疾病的發(fā)生不僅會伴有機體器質(zhì)性和生理性損害,還可能會伴有外觀特征的變化,如面部特征的改變[3]。醫(yī)師可通過對患者面部特征的辨識,對特定疾病做出初步判斷。而疾病早期細微的變化很難被肉眼觀察到,導致許多患者診治延誤。面部識別能夠捕捉這些細節(jié),幫助臨床醫(yī)師進行判斷。充分了解面部識別技術(shù),可更進一步推動智能化醫(yī)療的發(fā)展。本文就面部識別在臨床中的應(yīng)用現(xiàn)狀作一綜述。
面部識別是基于人的面部特征信息進行分析的一種智能化生物識別技術(shù)。用攝像機或攝像頭采集含有人臉的圖像或視頻,并自動在圖像中檢測和跟蹤人臉,進而對檢測到的人臉進行面部識別的一系列相關(guān)技術(shù),也可被稱為人臉識別、人像識別。經(jīng)典的面部識別系統(tǒng)主要包括三個組成部分:面部圖像采集及檢測、面部圖像特征提取和匹配與識別[4]。在臨床工作中,面部識別不僅提高了臨床的工作效率,而且可幫助醫(yī)師及時了解疾病的實時動態(tài)。
國外面部識別起步較早,20世紀50年代,心理學家就開始對面部識別進行初步探索。直到20世紀60年代,Bledsoe才真正意義上開啟了對面部識別的研究,他從面部的幾何結(jié)構(gòu)入手,通過分析面部器官特征點及其之間的拓撲關(guān)系進行辨識,建立了一個半自動的面部識別系統(tǒng)[5]。這種方法簡單直觀,但是一旦面部姿態(tài)、表情發(fā)生變化,精度就會下降。1991年,Turk和Pentland[6]提出了著名的“特征臉”方法,第一次將主成分分析和統(tǒng)計特征技術(shù)引入面部識別,提高了面部識別的實用效果,并促使面部識別從局部化走向整體化。這一思路在后續(xù)研究中得到了進一步的延續(xù),如Belhumer成功將Fisher判別準則應(yīng)用于面部分類,提出了基于線性判別分析的Fisherface方法[7]。隨著社會需求的不斷提高、人們認識的不斷深入以及科技技術(shù)的不斷發(fā)展,研究者們相繼探索出了基于彈性匹配的方法[8]、隱馬爾可夫模型(hidden markov models,HMM)方法[9]、支持向量機(support vector machine,SVM)[10]等許多新的方法。后來大數(shù)據(jù)和深度學習迅速崛起,神經(jīng)網(wǎng)絡(luò)在人臉識別的應(yīng)用中取得了前所未有的滿意結(jié)果,面部識別又邁上了一層新的階梯。
國內(nèi)人臉識別的發(fā)展起步于20世紀90年代末。早期清華大學艾海舟等[11]、阮森靈等[12],北京工業(yè)大學劉萬春等[13]、南京理工大學的韓宏等[14]都致力于該領(lǐng)域的研究,對推動我國面部識別的發(fā)展起到了不可或缺的作用。2014年是面部識別發(fā)展最關(guān)鍵的一年,香港中文大學的湯曉鷗等[15]提出將卷積神經(jīng)網(wǎng)絡(luò)應(yīng)用到面部識別上,采用20萬訓練數(shù)據(jù),在無約束自然場景人臉識別數(shù)據(jù)集(labeled face in wild,LFW)上第一次得到非常高的識別精度,成為面部識別發(fā)展歷史上的一座里程碑。目前,國內(nèi)的面部識別技術(shù)相對發(fā)展成熟,伴隨著技術(shù)的不斷進步,面部識別也逐步應(yīng)用于各種場景,如人機交互、公共安全監(jiān)控和身份識別等[16],走進了金融、司法、軍隊、公安、邊檢、政府、航天、電力、工廠、教育等領(lǐng)域,近十幾年開始進入醫(yī)療領(lǐng)域[17]。
3.1 面部識別在疾病診斷中的應(yīng)用
3.1.1 心理疾病心理疾病在如今多元化社會中較普遍[18]。心理疾病多種多樣,抑郁癥是其中一種,其特征是明顯的、持續(xù)時間較長的情緒抑郁、思維遲緩、認知障礙等[19],對患者的日常生活造成了很大困擾,嚴重者可能危害自己或他人的生命安全。因此,及時有效檢測出抑郁非常必要。臨床中對抑郁癥的評估主要是通過患者的自評量表及臨床心理訪談[20],而患者可能因為多種原因故意隱瞞或夸大病情,影響診斷結(jié)果。
研究表明,抑郁癥患者具有對積極情緒反饋減弱,消極情緒反饋增強的表情行為模式,因此在某些特定的情況下他們的正向表情會減少,負向表情會增多。徐路等[21]以此為切入點,選取152例患者,記錄患者感知、注意偏向以及工作記憶等數(shù)據(jù)。通過面部動作單元(action unit,AU)對抑郁癥患者典型表情行為進行量化及驗證,然后根據(jù)驗證結(jié)果構(gòu)建與表情行為相關(guān)的高級特征(分別有統(tǒng)計特征、速率特征與動態(tài)特征),再對這些特征進行分析,建立基于SVM分類器的抑郁識別模型,最終的模型對抑郁癥的識別率男性達到73.48%、女性達到68.43%。2019年Gavrilescu等[22]的研究中,提出了一種新的基于多層神經(jīng)網(wǎng)絡(luò)的體系結(jié)構(gòu),通過使用面部動作編碼系統(tǒng)(facial action coding system,F(xiàn)ACS)分析受試者的面部表情動態(tài)來確定抑郁焦慮壓力(depression anxiety stress scale,DASS)等級水平,在預(yù)測嚴重抑郁障礙(major depressive disorder,MDD)和創(chuàng)傷后應(yīng)激障礙(post-traumatic stress disorder,PTSD)方面均獲得了93%以上的準確性,預(yù)測廣泛性焦慮癥(generalized anxiety disorder,GAD)方面獲得了85%以上的準確性。同時建立了一個包含患者正面面部在受控情景(情緒被誘導時)和隨機情景(沒有情緒誘導時)下的視頻及自我心理分析調(diào)查問卷(self-analysis questionnaire,SAQ)結(jié)果的數(shù)據(jù)庫。
3.1.2神經(jīng)疾病目前,神經(jīng)系統(tǒng)疾病患者的數(shù)量每年都在增加,帕金森病(parkinson′s disease,PD)就是典型例子。PD是一種常見的神經(jīng)退行性疾病,起病隱匿,臨床中主要表現(xiàn)為運動遲緩、肌強直、靜息性震顫和姿勢不穩(wěn)[23],隨著病程的發(fā)展這些癥狀會逐漸加重,最終患者可能出現(xiàn)平衡障礙、步態(tài)凍結(jié)、跌倒和語言障礙,導致生活無法自理,生活質(zhì)量下降[24]。盡早診斷及時治療可以延緩病情的進展。目前帕金森病的診斷主要依靠病史、臨床癥狀及體征,患者特有的面部表情為面部識別診斷提供了良好的基礎(chǔ)。
2017年Bandini等[25]提出了一種自動分析PD患者面部表情視頻的方法,他利用人臉跟蹤器計算出面部關(guān)鍵點之間的距離,對PD患者的面部表情變化進行了量化。同時還建立了一種用于比較PD表情與標準表情的區(qū)別的自動面部識別算法。結(jié)果發(fā)現(xiàn)PD患者的面部運動距離要比健康對照者小得多。此外,這項研究還發(fā)現(xiàn)憤怒和厭惡是PD患者中兩種受損最嚴重的表情。后來Jin[26]等收集了33名PD患者及31名健康對照者微笑時的視頻,通過分析面部關(guān)鍵點的順序變化建立了帕金森病診斷的模型。其精度和F1值(統(tǒng)計學中用來衡量二分類模型精確度的一種指標)分別達到86%和75%,此外,如果利用支持向量機算法對面部表情幅度特征和面部小肌肉群的抖動進行處理,就可獲得99%的F1值。他認為該模型對帕金森病的診斷具有較好的識別能力。
3.1.3內(nèi)分泌疾病內(nèi)分泌疾病也可能會導致患者的外觀發(fā)生特征性的改變,但激素對人體的影響是長期慢性的過程,因此一些早期細微的變化很難被察覺到。許多研究者將面部識別引入了內(nèi)分泌疾病的診斷中,都達到了不錯的效果。①與糖尿病相關(guān)的一種常見皮膚表現(xiàn)稱為面部紅斑[3],通常在臨床檢查中被發(fā)現(xiàn),但往往會被醫(yī)師忽略[27]。2020年Majtner等[28]打破了以往對糖尿病并發(fā)癥的常規(guī)診斷思路,結(jié)合面部識別技術(shù)對糖尿病患者面部皮膚紅斑進行分析,最終結(jié)果表明,該模型對識別糖尿病并發(fā)癥患者的準確率達到92.86%,靈敏度達到100%,特異度達到80%。作為一項實驗性研究,他為這一領(lǐng)域的診斷程序帶來了新的視角,也為自動檢測糖尿病并發(fā)癥早期跡象的非侵入性檢查提供了可能。②肢端肥大癥通常會發(fā)生面部的典型變化,這些變化可能會被面部分類軟件識別出來。肢端肥大癥的病程進展非常緩慢,有研究表明,患者從出現(xiàn)癥狀到確診時間間隔7~10年[29]。早期發(fā)現(xiàn),對治愈該疾病會有很大幫助。2011年Miller等[30]使用先前開發(fā)的數(shù)據(jù)庫(包含200個正常人頭部的三維表示)中的照片對模型進行訓練,然后對49張照片(24張肢端肥大癥患者與25名正常對照者)進行分類,準確率達到86%,遠遠高于普通醫(yī)師的準確率(平均準確率26%)。Schneider等[31]收集57名患者和60名健康者的圖片,使用基于Gabor小波和幾何函數(shù)的計算機化相似性分析對所有采集到的圖片進行分析,對患者和健康者識別的正確率分別為72%和92%,而醫(yī)學專家們對患者和健康者識別的正確率分別為63%和81%,普通醫(yī)師對患者和健康者識別的正確率分別為42%和87%,總體而言,醫(yī)學專家的視覺分類正確率在患者和健康者中都低了10%,而普通醫(yī)師的正確率則更低??梢姡娌孔R別可幫助我們早期發(fā)現(xiàn)肢端肥大癥。③庫欣綜合征(cushing syndrome,CS)典型的代謝并發(fā)癥(高血壓、糖尿病、肥胖、骨質(zhì)疏松癥)和延遲診斷會導致患者死亡率增加[32]。早期診斷和治療,及時控制血液皮質(zhì)醇水平和代謝參數(shù)正常化,可極大地改善CS患者的預(yù)后[33]。面部脂肪分布異常是CS的特征性面部表現(xiàn),Kosilek等[34]將面部圖像輔助診斷(facial image diagnostic aid,F(xiàn)IAD)用于CS的診斷,結(jié)果顯示:患者組的分類準確率為85%,對照組的分類準確率分為95%,這說明人臉分類軟件可成功用于CS檢測。與此同時,還發(fā)現(xiàn)肥胖可能會對面部識別產(chǎn)生干擾。未來研究可能需要在地標方面進行修改,使其可更好地代表CS的特征。
3.1.4染色體疾病染色體疾病屬于遺傳病的一種,診斷主要是通過基因檢測,過程比較復(fù)雜。許多染色體疾病會出現(xiàn)典型的面部特征變化。以往的研究表明,計算機在識別多個遺傳綜合征方面的準確率均高于專家,這對未來面部識別在該領(lǐng)域的應(yīng)用有著重要的意義[17, 35]。①特納綜合征(turner syndrome,TS)的患者會出現(xiàn)疾病特異性的面部畸形,例如上瞼下垂、眼球過長、低耳垂、多發(fā)痣、低發(fā)際線、小頜下垂和蹼狀頸[36-39]。2018年Chen等[40]開發(fā)了一種用于診斷TS的面部特征模式識別的計算機輔助工具,敏感度和特異度分別為68.8%和87.5%,在TS的篩查和早期診斷中具有高準確性。同時他將該系統(tǒng)的識別準確度與臨床工作者的識別準確度進行了比較,發(fā)現(xiàn)該系統(tǒng)對TS的診斷準確率是高于醫(yī)師的,這意味著面部識別可作為染色體疾病的一種潛在的篩查方法。但他只選取了5~14歲的患者,并不能用于5歲以下TS患者的早期檢測。②22q11.2缺失綜合征是最常見的微缺失綜合征。長臉、眼瞼裂隙狹窄、鼻根變寬、顴區(qū)扁平、下頜后垂等都是22q11.2缺失綜合征患者的特征表現(xiàn)。Kruszka等[41]收集156名22q11.2缺失綜合征患者的照片,并按照國家所屬地區(qū)進行分組(高加索人、非洲人、亞洲人和拉丁美洲人),然后匹配了156名年齡、性別相仿的健康者照片,使用面部識別技術(shù)進行比較,結(jié)果顯示,所有人群的敏感度和特異度都大于96%,這表明,該面部識別系統(tǒng)對不同人群的22q11.2缺失綜合征患者具有廣泛的適用性。③唐氏綜合征,Zhao等[42]提出了一種基于獨立分量分析(independent component analysis,ICA)的分層約束局部模型,可準確定位面部解剖標志,在檢測到的面部標志點的基礎(chǔ)上,提取特定于疾病的幾何特征和局部紋理特征描述面部的形態(tài)和外觀,最后使用了多種分類器來區(qū)分唐氏綜合癥和健康人群,其中幾何特征與“Gabor jet”相結(jié)合的診斷準確率最高,達到了96.7%。同時使用該模型對唐氏綜合征和其他遺傳疾病進行了區(qū)分,準確率達到了97%。這表明該技術(shù)不僅可用于唐氏綜合癥的診斷,也可推廣到其他遺傳疾病的診斷。
3.1.5其他疾病除上述疾病之外,臨床上還有許多疾病會發(fā)生面部特征性改變。2020年Lin等[43]認為一些面部特征與冠狀動脈疾病(coronary artery disease,CAD)風險增加有關(guān)。在中國9個地點對接受冠狀動脈造影或CT血管造影的患者進行了一項多中心橫斷面研究,從患者面部照片中篩查CAD,結(jié)果顯示面部識別模型的靈敏度達到0.8,特異度為0.54;受試者工作曲線下面積(area under curve,AUC)為0.730(95%CI為0.699-0.761)。這項研究表明,基于面部照片的深度學習算法可以幫助中國人群進行CAD檢測。并且作者認為這項技術(shù)有望在門診或社區(qū)的CAD篩查中作為預(yù)檢評估方法。
3.2面部識別在臨床評估中的應(yīng)用2021年Hayasaka等[44]使用卷積神經(jīng)網(wǎng)絡(luò)(convolutional neural network,CNN)將面部圖像與實際的插管困難聯(lián)系起來,從患者的面部圖像中對插管困難進行分類,建立了一個人工智能模型,準確率達到80.5%。在疼痛領(lǐng)域,也有研究者開始使用面部識別來判斷疼痛的嚴重程度,Lu等[45]和Zhi等[46]開發(fā)了基于面部表情的新生兒疼痛評估系統(tǒng),取得了較為滿意的結(jié)果,為面部識別在疼痛評估領(lǐng)域做出了較大貢獻。
3.3面部識別在臨床預(yù)后中的應(yīng)用2020年Madrigal-Garcia等[47]對34名有臨床惡化風險患者錄制了3 min的面部視頻,以面部動作編碼系統(tǒng)測量面部行動單位,并對動作單位進行廣義線性回歸模型和時間序列分析,構(gòu)建出一種普通病房早期預(yù)警系統(tǒng),該系統(tǒng)的曲線下的面積為0.88,高于單獨的國家早期預(yù)警評分、單獨的Hn、國家早期預(yù)警評分+Hn、以及國家早期預(yù)警評分+Hn+Dn(曲線下面積分別為0.53、0.75、0.76、0.81)。為面部識別預(yù)測臨床預(yù)后作了嘗試。
面部識別開創(chuàng)了一種新的臨床診斷方式,突破了時間和空間的局限性,可為患者帶來及時的診斷線索,也可提高臨床醫(yī)師的工作效率。作為臨床診斷的輔助手段或預(yù)測手段,面部識別技術(shù)有著獨特的優(yōu)勢,如便利、高效、直觀、非接觸性或非侵入性等。由此可見,面部識別在醫(yī)療領(lǐng)域的發(fā)展空間非常大。
但就目前的研究而言,面部識別仍有許多不足,一方面現(xiàn)有的面部識別系統(tǒng)不具備普適性,未來的研究可以通過增大樣本量,豐富樣本類型進一步提高其性能;另一方面單一的算法已經(jīng)沒辦法提高面部的識別效果,現(xiàn)在已有許多研究者開始進行多模態(tài)識別的探索,可能比單一的面部識別更加有效。雖然目前能夠通過面部識別進行診斷的疾病不多,但這些結(jié)果是很鼓舞人心的,他們?yōu)槲磥砻娌孔R別用于其他更多疾病的診斷提供了可能性。隨著科學技術(shù)的進步和發(fā)展,人們對面部識別的研究會越來越深入,內(nèi)容會越來越豐富,面部識別的應(yīng)用也會越來越廣泛。