劉雨 趙勝兵 李兆申
海軍軍醫(yī)大學附屬長海醫(yī)院消化內(nèi)科,上海 200433
【提要】 隨著計算機科學技術(shù)的發(fā)展,人工智能和大數(shù)據(jù)在各個領(lǐng)域都有了關(guān)鍵性突破,醫(yī)療衛(wèi)生領(lǐng)域也受到巨大影響。盡管胰腺疾病診斷及治療相對困難,監(jiān)測及管理也較為棘手,但近年來人工智能和醫(yī)療大數(shù)據(jù)在胰腺疾病的診療和管理方面也有了較多的拓展應用,并體現(xiàn)出明顯的應用優(yōu)勢及發(fā)展?jié)撃堋?/p>
隨著電子計算機技術(shù)的飛速發(fā)展,人工智能和大數(shù)據(jù)技術(shù)如雨后春筍般興起并沖擊著各個行業(yè),其中,醫(yī)療衛(wèi)生領(lǐng)域也受到影響。人工智能和醫(yī)療大數(shù)據(jù)在疾病的診治及監(jiān)測與管理中逐漸顯現(xiàn)出重要地位。胰腺疾病是消化病中診斷及治療相對較為復雜的疾病,胰腺疾病的復雜性為人工智能與醫(yī)療大數(shù)據(jù)的應用帶來一定的挑戰(zhàn),同時也帶來巨大的發(fā)展空間和應用前景。
1956年約翰·麥卡錫將機器智能命名為“人工智能”[1],麥卡錫與尼爾斯·尼爾森后來解釋人工智能為智能的自動化,即知識的自動化[2],指讓計算機模擬人的思維信息進行傳統(tǒng)意義上的依賴人的智力才能進行的復雜工作,其中涉及計算機科學、心理學、統(tǒng)計學等多學科。機器學習是人工智能的重要方法之一,是一系列通過任務處理累積經(jīng)驗,進而自動調(diào)整參數(shù)、提高效能的算法。近幾年,源于機器學習的人工神經(jīng)網(wǎng)絡和深度學習頗受關(guān)注。人工神經(jīng)網(wǎng)絡是仿照人類神經(jīng)元的連接方式,建立多層“神經(jīng)元”結(jié)構(gòu),每層“神經(jīng)元”從上層接收數(shù)據(jù)并進行計算,再將輸出值傳遞給下層“神經(jīng)元”;深度學習則是在人工神經(jīng)網(wǎng)絡的基礎(chǔ)上進一步優(yōu)化形成,有更多的隱藏層,可憑借這些分層發(fā)掘更高級別的數(shù)據(jù)特征[3]。目前,人工智能已被廣泛應用于疾病的診斷治療、預后評估等多個方面。
大數(shù)據(jù)(big data)一詞早在20世紀80年代就已經(jīng)出現(xiàn),但當時多與計算機學科相關(guān),未對計算機以外的領(lǐng)域產(chǎn)生明顯影響。2008年《Nature》雜志出版“Big Data”專刊,介紹了大數(shù)據(jù)在多學科的機遇與挑戰(zhàn)。3年后《Science》又推出??瘡娬{(diào)大數(shù)據(jù)在科學研究中巨大潛在價值。同年在達沃斯世界經(jīng)濟論壇發(fā)布了以大數(shù)據(jù)為主題的《big data, big impact》報告,大數(shù)據(jù)正式登上科學研究的舞臺,迅速成為各領(lǐng)域的研究熱點[4]。
大數(shù)據(jù)又稱為巨量數(shù)據(jù)、海量數(shù)據(jù)等,指涉及的數(shù)據(jù)信息規(guī)模巨大,不能通過人工在合理時間內(nèi)獲取、處理、管理、加工、分析、整理成為人類所能理解和解讀的信息。醫(yī)療大數(shù)據(jù)指在醫(yī)療衛(wèi)生領(lǐng)域產(chǎn)生的數(shù)據(jù),其類型和規(guī)模以前所未有的速度增長,故僅靠現(xiàn)有的工具和軟件,很難在合理的時間內(nèi)獲取、管理并整合成能夠供醫(yī)療服務參考或能為醫(yī)療決策提供指導的信息[5]。醫(yī)療大數(shù)據(jù)主要來源于4個方面,一是來源于與生命科學研究和藥物研發(fā)生產(chǎn)等相關(guān)的機構(gòu)和企業(yè),這些單位常常存儲著規(guī)模龐大的健康醫(yī)療信息;二是來源于醫(yī)療機構(gòu)臨床診治和科學研究的相關(guān)信息數(shù)據(jù),覆蓋面廣泛,從就診患者的基本信息資料到診療過程、輔助檢查結(jié)果(如檢驗、影像檢查等)所有的醫(yī)療機構(gòu)的數(shù)據(jù);三是來源于醫(yī)療保險的運營管理信息和醫(yī)患行為的交互信息;四是來源于患者健康管理咨詢、網(wǎng)絡醫(yī)療咨詢、疾病穿戴式監(jiān)測設備、家用醫(yī)療監(jiān)測設備等個人健康信息數(shù)據(jù)。隨著科學技術(shù)的進步及互聯(lián)網(wǎng)的普及,這方面的數(shù)據(jù)規(guī)模迅速增長,其數(shù)據(jù)量未來可能無法估計[6]。
人工智能與醫(yī)療大數(shù)據(jù)在醫(yī)學領(lǐng)域的應用密不可分,二者相互結(jié)合,在胰腺疾病的診斷、治療、監(jiān)測及管理中都有了較多的應用,體現(xiàn)出巨大的潛力。
胰腺位于腹上區(qū)和左季肋區(qū),胃和腹膜后約平第一腰椎椎體處,橫臥于腹后壁。由于解剖位置相對深,胰腺疾病在早期癥狀不典型,且簡便的檢查如腹部B超等對其病變的檢出率較低,故大部分胰腺疾病(急性胰腺炎、慢性胰腺炎、胰腺良惡性腫瘤等)的診斷都必須依靠胰腺CT或MRI等影像學檢查或超聲內(nèi)鏡等侵入性檢查。傳統(tǒng)影像學檢查需要人工讀片,工作繁瑣,耗費時間,對胰腺不典型病變的檢出很大程度上依賴影像學醫(yī)師臨床經(jīng)驗的積累。由于人工智能和大數(shù)據(jù)技術(shù)分析處理速度快,效率高,故人工智能和醫(yī)療大數(shù)據(jù)技術(shù)的應用在胰腺疾病的診斷(如胰腺病理的識圖、胰腺影像的閱片、胰腺疾病易感基因的明確等)方面有廣闊的應用空間。
細針穿刺活檢是診斷胰腺腫塊良惡性的準確方法,但對于部分非典型病例,診斷其良惡性仍然是個挑戰(zhàn)。一種人工智能的多層感知神經(jīng)網(wǎng)絡系統(tǒng)可通過檢測胰腺腫塊活檢病理切片,鑒別胰腺腫塊的良惡性,對非典型病例良惡性的預測準確率達到77%,可幫助臨床醫(yī)師與患者做出最佳治療方案選擇[7]。慢性胰腺炎和胰腺癌的鑒別診斷是臨床胰腺疾病診斷中的一大難題,多項研究證實人工智能在慢性胰腺炎與胰腺癌的鑒別診斷中有重要價值,可做出快速而準確的診斷[8-11]。復旦大學團隊研發(fā)了一套計算機輔助診斷胰腺漿液性囊性腫瘤與其他胰腺囊性腫瘤的鑒別診斷方案,該方案是一個包含24個漿液性囊性腫瘤臨床及影像學特征和385個高通量篩選特征的放射組學系統(tǒng),經(jīng)過與經(jīng)驗豐富的放射學醫(yī)師評估的結(jié)果對比驗證后,證實該計算機輔助診斷方案準確可靠,可用于對患者的術(shù)前評估,提高術(shù)前診斷的準確性,幫助臨床醫(yī)師做出準確的治療決策[12]。Ikeda等[13]使用從放射學圖像數(shù)據(jù)庫中提取的數(shù)據(jù)區(qū)分腫塊性胰腺炎和胰腺導管腺癌,也發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡評估結(jié)果與經(jīng)驗豐富的放射學醫(yī)師評估結(jié)果相當。Kuwahara等[14]將3 970例行胰腺切除術(shù)的術(shù)前內(nèi)鏡超聲圖像進行人工智能的深度學習后,發(fā)現(xiàn)人工智能診斷惡性導管內(nèi)乳頭狀黏液性腫瘤(intraductal papillary mucinous neoplasms,IPMN)的靈敏度、特異度和準確率都達到92%以上,人工智能診斷IPMN可能比人類專家診斷更準確、更客觀。Li等[15]建立的基于PET/CT圖像的胰腺癌計算機輔助診斷模型,在鑒別診斷胰腺癌的準確率、靈敏度和特異度方面均超過95%。Kurita等[16]利用基本臨床資料,如血癌胚抗原、糖類抗原CA19-9和CA125、囊液淀粉酶、囊腫位置等進行機器深度學習,構(gòu)建了囊性病變良惡性鑒別的模型,發(fā)現(xiàn)人工智能可提高胰腺囊性病變的良惡性鑒別能力。也有學者構(gòu)建了通過多種血清標志物診斷胰腺癌的神經(jīng)網(wǎng)絡模型,發(fā)現(xiàn)其診斷準確率優(yōu)于應用單一腫瘤標志物和logistic模型的準確率[17]??傊?,人工智能和大數(shù)據(jù)技術(shù)憑借在胰腺影像閱片、病理圖片識別、輔助診斷模型構(gòu)建等方面的優(yōu)勢,在胰腺疾病的良惡性鑒別診斷及胰腺腫瘤的定性診斷中有廣闊的應用前景。
胰腺疾病病因復雜,許多病變機制不清。有研究指出腸道微生物在急性胰腺炎、慢性胰腺炎、胰腺癌等胰腺疾病的發(fā)生發(fā)展中扮演著重要角色[18],但腸道微生物失調(diào)的原因和后果,以及不同菌群數(shù)量的變化在胰腺疾病發(fā)生發(fā)展中所起的作用仍須探索。遺傳因素在胰腺疾病的發(fā)生發(fā)展中扮演著重要角色,SPINK1、CFTR、PRSS1、CTRC等基因均被證明能促進胰腺炎癥或纖維化進程,且近年來不斷有新的易感基因被報道。東西方人種在遺傳背景方面的差異較大,不同致病突變類型對胰腺疾病的臨床病程影響不同,但尚無確切的研究揭示各種基因突變在胰腺疾病病理生理機制中的作用[19-20]。基因測序是檢測基因突變的良好工具,然而目前通過基因測序能明確分析的數(shù)據(jù)量僅占冰山一角,大量的信息尚未被挖掘。綜上所述,未來在胃腸道微生物組及其代謝效應、胰腺疾病遺傳基因突變測序方面,若能積極利用人工智能結(jié)合大數(shù)據(jù)分析,將有助于發(fā)現(xiàn)和明確胰腺疾病新的潛在病因。
人工智能不僅可以用于良惡性腫瘤的鑒別診斷,而且可以用于區(qū)分腫瘤的邊界。Niazi等[21]提出了一種基于Ki67染色活檢圖像的深度學習方法來自動區(qū)分胰腺神經(jīng)內(nèi)分泌腫瘤的邊界,證實基于深度學習的人工智能模型將在很大程度上減少病理學者的工作量,可以較好地區(qū)分腫瘤邊界,為臨床醫(yī)師的治療決策提供一定指導。Fu等[22]利用深度學習胰腺影像的胰腺分段解剖,建立了檢測胰腺癌邊界的模型,可用于指導手術(shù)的范圍。胰腺癌的立體定向放射治療需要在向腫瘤提供消融劑量的同時保護敏感的周圍組織(十二指腸、胃、小腸)。為了解決這個難題,有研究者開發(fā)了基于專業(yè)知識的人工神經(jīng)網(wǎng)絡劑量模型來預測特定治療部位的放射劑量分布,該模型經(jīng)過檢驗具有良好的準確性,可用于預測特定治療部位所需的合適劑量,從而避免過大劑量導致的周圍器官損傷[23]。
人工智能與醫(yī)療大數(shù)據(jù)還可用于胰腺疾病嚴重程度的預測[24-25]。既往研究發(fā)現(xiàn),人工神經(jīng)網(wǎng)絡對急性胰腺炎的嚴重程度預測能力優(yōu)于廣泛應用的急性生理與慢性健康評分(APACHEⅡ評分)、修正的Glasgow評分[26-28]。與臨床評分系統(tǒng)相比,人工神經(jīng)網(wǎng)絡模型可以使用更少的變量、更早地完成急性胰腺炎患者嚴重程度的評估,患者入院6 h內(nèi)即可完成評估,有利于醫(yī)護人員為患者制定更合適的治療、護理策略。Mofidi等[26]將人工神經(jīng)網(wǎng)絡模型與修正的Glasgow評分和APACHEⅡ評分就預測疾病嚴重程度方面進行了比較,發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡模型的靈敏度(0.89)和特異度(0.96)都為最優(yōu);該研究還比較了3種評分系統(tǒng)預測患者住院第1周內(nèi)發(fā)生多器官功能障礙綜合征概率和住院期間病死率的準確性,也發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡模型在這兩方面都優(yōu)于Glasgow和APACHEⅡ評分。Halonen等[27]開發(fā)了一個預測急性胰腺炎嚴重程度的模型,受試者工作特征(ROC)曲線下面積(AUC)為0.847,大大優(yōu)于Ranson評分(AUC為0.656)、原始Glasgow評分(AUC為0.536)、APACHEⅡ評分(AUC為0.817)和多器官功能障礙評分(AUC為0.781)。除了人工神經(jīng)網(wǎng)絡以外,其他機器學習算法也被用來預測急性胰腺炎的嚴重程度。例如,Pearce等[25]使用Kernel邏輯回歸模型預測急性胰腺炎的嚴重程度,發(fā)現(xiàn)使用入院時的臨床和實驗室檢查結(jié)果預測急性胰腺炎的嚴重程度時,Kernel邏輯回歸模型比APACHEⅡ有更高的靈敏度和特異度。在預測急性胰腺炎患者住院時間方面,人工智能與大數(shù)據(jù)技術(shù)也有良好的應用前景[29]。Keogan等[30]使用影像學和實驗室檢查數(shù)據(jù),發(fā)現(xiàn)人工神經(jīng)網(wǎng)絡模型預測準確率優(yōu)于Balthazar和Ranson評分。Pofahl等[29]建立的人工神經(jīng)網(wǎng)絡模型能夠使用入院時即可收集的數(shù)據(jù)預測患者的住院天數(shù)是否會超過7 d,而傳統(tǒng)的評分系統(tǒng)需要等待至少48 h。
重癥急性胰腺炎(SAP)病情變化較快,需要早期監(jiān)測病情變化。Vistisen等[31]通過自動化的持續(xù)微創(chuàng)監(jiān)測結(jié)合機器學習算法,可以早期識別生命體征的細微變化,從而幫助指導早期治療,預防血流動力學災難性事件,確?;颊甙踩?,改善預后。有研究者收集217例SAP患者的臨床和實驗室資料,通過胰腺壞死程度、乳酸脫氫酶、血紅蛋白氧飽和度等基本資料即可建立神經(jīng)網(wǎng)絡模型,預測SAP合并急性肺損傷的風險,以便對高風險人群早期制定對策預防急性肺損傷的發(fā)生[32]。預測急性胰腺炎后門靜脈、脾靜脈、腸系膜靜脈血栓的發(fā)生是一項較困難的工作。有研究者構(gòu)建了人工神經(jīng)網(wǎng)絡預測門靜脈-腸系膜靜脈血栓的發(fā)生,證實了與傳統(tǒng)的logistic回歸預測模型比較,人工神經(jīng)網(wǎng)絡總體預測能力優(yōu)于logistic回歸模型,可更好地幫助指導患者管理及并發(fā)癥預防[33]。Walczak等[34]研究了人工神經(jīng)網(wǎng)絡預測胰腺癌患者生存期的方法,該人工神經(jīng)網(wǎng)絡模型能準確預測胰腺癌患者7個月的生存率,為醫(yī)師和患者制定最佳的治療方案提供依據(jù),幫助患者最大限度減少遺憾并提高生活質(zhì)量。Ansari等[35]也構(gòu)建了基于淋巴結(jié)轉(zhuǎn)移、腫瘤分化程度、體重指數(shù)、年齡等臨床參數(shù)的人工神經(jīng)網(wǎng)絡模型,預測胰腺導管腺癌根治術(shù)后患者的長期生存時間,發(fā)現(xiàn)該模型Harrell′s一致性指數(shù)為0.79,提示該模型可較好用于預測患者術(shù)后的長期生存時間。
南京大學團隊利用大數(shù)據(jù)挖掘技術(shù)分析了江蘇省2014年至2016年間急性胰腺炎的流行病學特征,發(fā)現(xiàn)未婚人群中發(fā)生SAP的人數(shù)較多,且SAP患者中AB型或B型血占比較高,江蘇北部比南部發(fā)生急性胰腺炎的患者更多,這可能為江蘇急性胰腺炎的預防管理提供一定參考[36]。
除上述對于患者的在院管理外,人工智能與醫(yī)療大數(shù)據(jù)技術(shù)在慢性病患者的長期管理、遠程管理方面也將有很大潛力[37-39]。利用智能穿戴設備、家用血糖監(jiān)測儀等設備,慢性病患者(如慢性胰腺炎病情穩(wěn)定的患者、胰腺良性腫瘤術(shù)后穩(wěn)定的患者等)可在家中自己監(jiān)測生命體征及其他常規(guī)健康指標,利用互聯(lián)網(wǎng)平臺將數(shù)據(jù)實時反饋給醫(yī)師,便于醫(yī)師對患者的長期管理及隨訪。這種管理模式不僅節(jié)約了醫(yī)療資源,而且減少了就醫(yī)次數(shù),方便了患者。
盡管目前仍有很多胰腺疾病的發(fā)病機制不清,治療措施有限,大多數(shù)僅能對癥治療,無法阻斷甚至逆轉(zhuǎn)胰腺病變的發(fā)展,但伴隨著人工智能和醫(yī)療大數(shù)據(jù)的研究深入,胰腺疾病的智能化診斷、治療、監(jiān)測、預后判斷和疾病管理等方面都取得了長足的進展,胰腺疾病的病因與診斷實現(xiàn)了進一步明確。相信在不遠的將來,阻斷甚至逆轉(zhuǎn)胰腺病變的方法也有望在智能化診療的輔助下成為現(xiàn)實。
利益沖突所有作者均聲明不存在利益沖突