祁海鷗,徐 欣,薛子豪
浙江大學醫(yī)學院附屬邵逸夫醫(yī)院,浙江杭州 310016
機器學習算法是實現(xiàn)人工智能的關鍵技術。在醫(yī)療護理領域中,機器學習已被廣泛應用于疾病預測與輔助診斷、醫(yī)學影像識別、疾病預后評價和慢病健康管理等環(huán)節(jié)。隨著醫(yī)療技術進步和醫(yī)院規(guī)模擴張,手術室的運營與護理管理也迎來了新的挑戰(zhàn),借助機器學習算法實現(xiàn)手術室護理工作的智能化已成為發(fā)展趨勢。當前,已有研究者在宏觀層面提出手術室大數(shù)據(jù)系統(tǒng)框架用于優(yōu)化手術室護理質量[1],但尚缺乏研究總結如何利用大數(shù)據(jù)實現(xiàn)手術室護理的智能化。本文通過總結機器學習算法在手術時長預測與手術資源規(guī)劃、手術相關壓力性損傷(surgery-related pressure injury,SRPI)預測與評估、手術部位感染(surgical site infection,SSI)與術中低體溫風險預測中的應用,以期為提升手術室運營效率、優(yōu)化手術患者的安全管理提供參考。
人工智能是通過機器模擬人類的方式,記錄、積累、再現(xiàn)和運用知識的學科,本質是對人類意識與思維信息過程的模擬[2]。人工智能的主要技術體系包括機器學習、自然語言處理、計算機視覺、人機交互等。機器學習是實現(xiàn)人工智能最重要的分支之一,其本質在于通過算法解析數(shù)據(jù)之間的關系并從中學習,以實現(xiàn)預測和決策的功能。與傳統(tǒng)統(tǒng)計分析方法不同,機器學習不需要人為決定預測因素的組合方式,算法自身將測試出最優(yōu)交互項組合以優(yōu)化目標函數(shù)。因此,機器學習相比于傳統(tǒng)統(tǒng)計更側重于提升數(shù)據(jù)分析的精確度以及算法效率。機器學習可分為監(jiān)督學習、非監(jiān)督學習、強化學習三類[3]。常用的機器學習算法包括支持向量機算法(support vector machines,SVM)、決策樹算法(decision tree,DT)、隨機森林算法(random forest,RF)、樸素貝葉斯算法(naive bayes)、梯度增強算法(gradient boosting)、神經網(wǎng)絡算法(neural networks)、logistic回歸等。
提高手術室效率、優(yōu)化手術室管理,是提升醫(yī)院整體運行效率和效益的重要環(huán)節(jié)。準確預測手術時長,合理安排手術計劃,提高手術效率并減少手術室資源浪費,是醫(yī)院管理者關注的重點??紤]到外科手術有較強的不確定性,越來越多的學者借助機器學習算法對手術時間進行預測。Tuwatananurak等[4]基于15 000個手術案例構成的數(shù)據(jù)集,采用RF構建手術時長預測模型,模型納入的預測因子包括患者因素、醫(yī)務人員因素、設施設備因素、手術操作因素和前序事件要素共五大類。使用該模型對990例外科手術進行時長預測,實際時長和預測時長中位數(shù)的差異為20.0(9.0,39.8)min,該模型將預測準確率由31.2%提高至41.1%。研究[4]還將預測模型應用于手術排程,并在為期3個月的測試周期內累計為手術室節(jié)約了19 000 min手術時間。Bartek等[5]基于2014年至2017年華盛頓大學醫(yī)學中心的5萬余例手術數(shù)據(jù),采用極端梯度算法(extreme gradient boosting,XGBoost)為醫(yī)院內每個外科??坪兔课煌饪漆t(yī)生創(chuàng)建了手術時長預測模型。以實際手術時長的10%為閾值,該模型可將預測準確率由32%提升至39%,其中特定醫(yī)生手術時長的預測準確率可達50%以上。與前述研究者不同,Bodenstedt等[6]采用卷積神經網(wǎng)絡算法(convolutional neural networks,CNN),利用腹腔鏡手術的視頻影像資料和手術設備的工作數(shù)據(jù)資料構建模型,以實現(xiàn)對手術剩余時長的實時預測。該模型預測時間的總體平均誤差為37%,半程平均誤差為28%,可為實現(xiàn)對手術排程的動態(tài)管理提供參考。在Zhao等[7]借助機器學習算法構建的機器人輔助手術時長預測模型中,采用增強回歸樹算法(boosted regression tree,BRT)構建的預測模型最優(yōu),與使用logistic回歸的基線模型相比,BRT可將預測時長的均方根誤差(root mean squared error,RMSE)由100.4 min降低至80.2 min。借助該算法在Zhao等[7]所在的醫(yī)院制定手術計劃,可將日均手術量由148臺提升至219臺?;跈C器學習算法的手術時長預測模型可輔助手術室護理管理人員進行手術排程與調度,提升手術間利用率和手術人員的工作平衡度[5]。由于預測準確性的判斷標準相對主觀,比如以絕對時長或實際手術時長的固定比例為閾值,因此在一定程度上影響了模型預測結果的說服力,在后續(xù)研究中應結合相對客觀的評價指標如RMSE、平均絕對誤差(mean absolute error,MAE)等從多方面評價模型的預測準確性。
手術資源合理規(guī)劃是手術室管理的重點,而利用信息數(shù)據(jù)協(xié)同人工管理是提升手術室效率的重要手段。手術安排與手術調度通常由經驗豐富的手術室護士進行規(guī)劃,然而這一傳統(tǒng)規(guī)劃方式已不能適應現(xiàn)代化的手術室資源管理。Runarsson[8]構建了基于神經網(wǎng)絡與概率約束的手術安排模型,為解決手術安排過程中涉及的各種不確定約束條件(如手術時長、接臺間隔、外科醫(yī)生手術列表、手術間占用情況、病房容量與預期手術患者人數(shù)等),該學者采用混合整數(shù)規(guī)劃(mixed integer programming)模型制定手術排程的解決方案,從而計算手術間每日手術計劃的最優(yōu)方案。趙亮等[9]同樣構建了手術安排與調度的數(shù)學優(yōu)化模型,在應用該模型進行手術調度后,住院患者術前等候時間縮短、手術臺次穩(wěn)步上升、手術室資源利用率得到提升。前期研究中手術時長的常見預測因子包括:性別、年齡、體重指數(shù)、手術危險分級、疾病史等患者因素;進行手術的外科醫(yī)生、麻醉師等醫(yī)務人員因素;手術種類、手術方式、麻醉方式、手術日期與手術順次、手術設備、手術接臺時間等手術流程因素。其中外科醫(yī)生相關的預測因素是導致預測時間變異的首要因素,了解預測因子的可解釋性可為后續(xù)研究開發(fā)模型納入變量提供參考。然而在前期研究的變量中,大多僅涉及手術過程相關的醫(yī)、患、設施層面的因素,而未將手術過程與患者復蘇及轉運視為整體,從而忽略了麻醉復蘇室、重癥監(jiān)護室等科室的床位及運轉情況,若相關護理單元的床位不足將迫使手術患者在手術間內復蘇,從而增加了患者離室周轉和手術接臺時間,進而影響對手術時長預測的準確性和手術間利用效率。因此,基于已有的預測變量,不斷探索完善模型以提高手術時長預測的準確性是后續(xù)研究的重點。
2.3.1SRPI預測
SRPI是衡量護理質量的敏感指標之一。由于手術時間延長、體位安置、手術器械應用以及術中體溫變化等因素,手術患者是SRPI的高發(fā)人群。一項meta分析[10]提示,術中獲得性SRPI的發(fā)生率高達18%。如何預防SRPI是手術室護理人員的關注要點,當前已有數(shù)項研究借助機器學習算法,協(xié)助護理人員對手術患者發(fā)生SRPI的風險進行預測。Su等[11]以不同的數(shù)據(jù)分析算法構建了術中SRPI的風險預測模型,其中以馬田系統(tǒng)(mahalanobis-taguchi system,MTS)模型具有最優(yōu)的靈敏度(0.833)、特異度(0.928)和G-means值(0.879),其預測變量包括7個:性別、體重、手術種類、手術體位、手術開始與結束體溫、電刀器械的使用數(shù)量,相比基于支持向量機、決策樹算法和logistic回歸所構建的預測模型,MTS模型具有相對簡潔的預測因子和較為穩(wěn)健的預測結果。Cai等[12]使用XGBoost算法,以手術時長、體重、年齡、體外循環(huán)持續(xù)時間和心臟疾病分類作為5個主要預測因子,構建了心血管外科手術的SRPI預測模型,通過對149例手術患者的測試,該模型的曲線下面積為0.806,提示具有較高的預測準確性。在SRPI預測模型的相關研究中,主要目的一是探索SRPI的危險因素,以便為手術室護士采取SRPI預防的干預措施提供依據(jù);二是比較不同算法在構建預測模型中的性能,從而精簡模型、優(yōu)化計算過程。以上研究可為后續(xù)學者開發(fā)SRPI預測模型在變量設計與算法選擇中提供參考。然而,上述研究在模型驗證過程中多采用內部驗證,缺少預測模型在多中心、前瞻性的外部驗證過程可能影響模型的穩(wěn)定性和可推廣性,因此在后續(xù)研究中SRPI預測模型的外部驗證將是研究重點。臨床工作中,手術室護士往往通過Braden量表、Munro量表或通過經驗實現(xiàn)對SRPI發(fā)生風險的評估。這一方法依賴于護士的專業(yè)能力以及對量表內容的熟悉程度,同時使用量表進行評估無法探究不同影響因素之間的交互作用。基于機器學習算法的SRPI預測模型可提取患者病歷信息及監(jiān)護數(shù)據(jù),從而實現(xiàn)風險預測的自動化和便捷化,因此將相關模型應用于臨床護理工作可為減少護士工作量、開展優(yōu)質的手術護理提供有效工具。
2.3.2SRPI評估
除了對SRPI的預測之外,機器學習算法還應用于受損創(chuàng)面的測量與分析。Zahia等[13]基于卷積神經網(wǎng)絡算法構建了端到端(end-to-end)的框架,通過輸入創(chuàng)面的二維圖像和三維成像信息,即可實現(xiàn)創(chuàng)面的檢測和分割,從而完成創(chuàng)面面積、深度、體積及軸線長度的計算,該模型的精確度可達87%。此外,還有數(shù)項研究基于卷積神經網(wǎng)絡算法和SVM算法構建了創(chuàng)面的測量模型,以實現(xiàn)對SRPI組織分類和創(chuàng)面面積與深度的評估[14-15]。以上研究可為手術室護理人員開展SRPI質量管理項目提供便捷高效的工具,通過受損部位圖像數(shù)據(jù)的采集自動獲得客觀、精確的創(chuàng)面資料,以替代傳統(tǒng)創(chuàng)面評估過程中通過經驗或使用鋼尺、探針等工具進行侵入性操作獲得的粗略結果,并為SRPI在手術間與其他臨床科室的無縫交接與延續(xù)管理提供基礎資料。
SSI是外科手術最常見的并發(fā)癥之一。SSI可導致各類并發(fā)癥和死亡率增加、進行二次手術、住院時間延長以及醫(yī)療費用支出增加[16]。預防和監(jiān)測SSI需經過醫(yī)務人員的專業(yè)評估,這一過程需要耗費較高的醫(yī)療成本,基于人工智能的計算機技術可以為分析SSI提供高效便捷的方式并減少醫(yī)療資源的占用[17]。
2.4.1基于圍手術期資料進行預測
愛荷華大學附屬醫(yī)療機構使用基于電子健康病例的機器學習算法對手術患者發(fā)生SSI的概率進行預測,在手術即將結束時,巡回護士將激活程序并自動采集電子記錄中的實時數(shù)據(jù),從而計算SSI發(fā)生的風險概率,以提醒外科醫(yī)生在關閉切口時采取必要措施降低感染風險[18]。人工智能分析程序的推進使得附屬醫(yī)療機構在3年內減少了74%SSI的發(fā)生,并節(jié)約了120萬美元的醫(yī)療成本[18]。SSI的預防和監(jiān)測貫穿術前、術中和術后,其中手術室是發(fā)現(xiàn)和應對SSI最關鍵的環(huán)節(jié),同時超過50%的SSI可應用循證策略進行預防[19]。因此開發(fā)SSI預測模型,在術中或術前階段識別SSI高危人群并給予必要的干預措施。然而,當前多數(shù)機器學習預測模型側重于在術后環(huán)節(jié)監(jiān)測SSI的發(fā)生,其模型的應用不僅需要采集患者的術前資料,還依賴術中生命體征[20]、術中醫(yī)療設備應用情況[21]、手術時長[18,22-23]、切口情況[16,23]、術后引流情況[20]等手術因素作為變量,因此這類模型無法用于指導SSI的術前或術中干預。
2.4.2基于術前資料進行預測
Almamlook等[24]采用美國外科醫(yī)師學會國家手術質量改進項目中288萬例手術患者的資料構建了SSI預測模型。其中以深層神經網(wǎng)絡(deep neural networks,DNN)為算法構建的模型相比于SVM、DT、RF等具有更優(yōu)的預測性能,其曲線下面積、準確度、精確度、靈敏度和F1分數(shù)均>0.85。DNN模型中共包括28個預測變量且均為術前危險因素,其中急診手術、手術危險分級為Ⅳ級、高體重指數(shù)、血管外科和普外科手術是該模型中預測SSI的重要因素。Yeo等[25]基于10 021例全膝關節(jié)置換術(total knee arthroplasty,TKA)患者的資料構建了TKA術后發(fā)生淺表或深部切口感染的預測模型。人工神經網(wǎng)絡算法(artificial neural networks,ANN)構建的預測模型具有最佳性能(曲線下面積=0.84、校正曲線及決策分析曲線最優(yōu)),預測因素包括人口統(tǒng)計學資料和疾病相關資料,其中最強預測因素是查爾森合并癥指數(shù)(Charlson Comorbidity Index,CCI)、體重指數(shù)(>30 kg/m2)和吸煙。在上述兩項研究中,預測模型構建均采用人口學信息、疾病史等術前資料,從而有助于醫(yī)療團隊在術前估計SSI發(fā)生風險,進行健康教育指導高?;颊叱浞诌M行術前準備,以及在手術過程中預防性使用抗生素、使用切口保護套、積極沖洗切口并進行引流等,從而減少外科手術感染的發(fā)生[26-27]。同時,上述模型也存在不足之處,如Almamlook等[24]開發(fā)的模型需要采集患者大量的病史信息,因此疾病資料不完善將可能降低預測準確性。后續(xù)研究仍需探索在確保預測準確性的同時如何精簡預測變量數(shù)目。
由非計劃或治療外因素所致機體核心溫度低于36℃被稱為非計劃術中低體溫(inadvertent perioperative hypothermia,IPH)。IPH可引發(fā)心血管不良事件,增加術中出血風險、SSI等不良后果,并使麻醉復蘇及住院時間延長[28]。盡管如此,當前患者術中核心體溫及其并發(fā)癥的監(jiān)測尚未得到足夠重視,IPH患者的院內死亡率接近40%[29]。因此,構建能夠早期識別和預測IPH的風險模型較為重要。當前研究在方法學上集中于使用多因素線性回歸或logistic回歸進行IPH模型的構建,缺點在于其無法解決非線性問題、容易使結果產生過度擬合以及忽略各因素之間的交互作用,因此容易使模型預測的準確率降低。曹立源等[30]將RF、平衡遺傳算法(equilibrium genetic algorithm,EGA)和XGBoost這3種機器學習算法進行組合,從而提升了術中低體溫預測模型的預測性能。模型的預測因素共7個,分別是術前體溫、體重指數(shù)、麻醉時間、年齡、術中補液量、出血量和是否沖洗。模型的準確率、精確度、召回率、F1值、曲線下面積分別為0.865 2、0.869 6、0.952 4、0.909 1和0.894 7,優(yōu)于logistic回歸及其他算法模型的預測性能。項海燕等[31]采用ANN算法構建了全身麻醉患者IPH預測模型,包括患者一般資料、手術相關資料(手術時長、麻醉時長、出血量、輸液量、尿量、體位等)、麻醉復蘇指標(復蘇時長、插管時長)、圍術期體溫等20個預測變量,曲線下面積、靈敏度、特異度、準確率分別為0.724、0.516、0.823和0.795。盡管該模型在預測性能方面遜色于曹立源等[30]的研究,但除了預測術中階段患者發(fā)生低體溫的風險,還能在麻醉復蘇階段這一高危環(huán)節(jié)實現(xiàn)低體溫的風險預測,應用范圍相對更加廣泛。越來越多的研究開始關注開發(fā)基于機器學習算法的IPH預測模型,這將能夠使臨床醫(yī)務人員從借助經驗實施IPH的干預策略轉變到重視IPH的準確評估和計劃性預防,從而針對性地采取外周和體腔保溫措施,降低IPH的發(fā)生風險,提升手術患者安全。
機器學習算法為手術室管理與運營提供了新的研究方向,是實現(xiàn)人工智能的關鍵技術之一。應用基于機器學習算法的預測模型能夠提高手術時長的預測準確率、增加手術臺次安排、提升手術室資源利用效率,實現(xiàn)手術相關性SRPI風險的自動化預測和評估、減少手術室護士工作量,并對SSI和IPH風險進行預測和及時干預,從而保障患者安全。與此同時,機器學習算法在手術室中的應用仍存在局限性。一方面,臨床預測模型的構建依賴于醫(yī)療大數(shù)據(jù),如何構建結構豐富的數(shù)據(jù)庫并整合多中心來源的數(shù)據(jù)資料,以及實現(xiàn)醫(yī)療設備與數(shù)據(jù)庫的互聯(lián)互通是亟待解決的問題;另一方面,模型的預測性能與可解釋性仍有待提高,且尚缺乏外部驗證的開展以提升模型在實際手術環(huán)節(jié)的可靠性和可推廣性。