陸云飛,陸 飛,方路平,葛慧青,潘 清
1(浙江工業(yè)大學(xué) 信息工程學(xué)院,杭州 310023) 2(浙江大學(xué)醫(yī)學(xué)院附屬邵逸夫醫(yī)院呼吸治療科,杭州 310016)
在重癥監(jiān)護室(Intensive Care Unit,ICU)中,機械通氣(Mechanical Ventilation,MV)指的是急性呼吸衰竭患者需要呼吸機提供足夠的通氣支持來減少患者自身呼吸所做的功的過程.機械通氣是危重病人重要生命支持手段,但是由于呼吸機參數(shù)設(shè)置不當(dāng)或者患者自身存在的不同病情體質(zhì)等原因,當(dāng)患者的呼吸需求與呼吸機設(shè)置參數(shù)不匹配時,就會造成人機不同步[1].Thille等人提出有接近四分之一的重癥病人在機械通氣時存在著較高的人機不同步發(fā)生率[2],如此高的人機不同步發(fā)生率輕則導(dǎo)致患者呼吸困難,重則可能會導(dǎo)致患者膈肌和呼吸肌的結(jié)構(gòu)損傷,進而導(dǎo)致吸氣肌無力和脫機失敗等一系列不良的臨床結(jié)果[3,4].人機不同步可以被認為是顯式的,即它可以在呼吸機屏幕上的流速和壓力波形中觀察到,但這需要操作者密切監(jiān)控呼吸波形以及在機械通氣方面有較高的專業(yè)知識.因此,有必要開發(fā)一種機械通氣人機不同自動檢測的方法,以提示醫(yī)護人員對呼吸機設(shè)置進行優(yōu)化,改善病人與呼吸機的協(xié)調(diào)性.
常見的人機不同步類型包括無效吸氣努力(Ineffective inspiratory Effort during Expiratory phase,IEE)、雙觸發(fā)、周期過短、周期過長等.本研究主要針對IEE這一類型進行檢測.IEE指的是患者在吸氣努力后未觸發(fā)呼吸機進行送氣的過程,與IEE相關(guān)的因素包括吸氣努力不足和呼氣末固有正壓(Positive End Expiratory Pressure,PEEP)的存在,后者增加了觸發(fā)呼吸機所需的努力程度.
早期IEE自動檢測主要基于波形特征的規(guī)則.Chen等人[5]在2008年提出了一種自動檢測IEE的方法,認為可以通過在呼氣相尋找流速極大值,然后在該極大值到呼氣結(jié)束點之間尋找最小值,計算極大值和最小值之間的差值,并設(shè)定閾值,當(dāng)差值大于所設(shè)閾值時,即滿足公式(1):
Fdef>Fdef_th
(1)
則認為該次呼吸是無效吸氣努力.其中Fdef為最大流速偏差,F(xiàn)def_th表示設(shè)定的最大流速偏差閾值.Thille等人[2]將IEE定義為在呼氣階段氣道壓力波形出現(xiàn)≥0.5 cmH2O的凹陷同時伴隨著流速波形有凸起,并且之后沒有開始新的呼吸周期.上述基于波形規(guī)則的算法不足之處在于最佳閾值的設(shè)置存在爭議,針對不同的數(shù)據(jù)集會存在不同的最佳閾值;當(dāng)病人存在咳嗽、打嗝或者吸痰等行為導(dǎo)致波形產(chǎn)生噪聲時,該算法容易誤判,對噪聲較為敏感,魯棒性較差.
近年來,也有一些研究應(yīng)用隨機森林(Random Forests,RF)和自適應(yīng)增強(Adaptive Boosting,AdaBoost )等機器學(xué)習(xí)方法對IEE進行分類,主要通過提取時域波形的呼吸持續(xù)時間、吸氣末流速、吸氣末壓力、吸氣末潮氣量等臨床特征然后輸入模型進行判別[6,7].上述機器學(xué)習(xí)方法缺陷在于所提取的特征僅僅是時域?qū)用娴奶卣?,而部分IEE特征存在于頻域?qū)用妫姨崛〉膫鹘y(tǒng)特征無法表現(xiàn)IEE波形復(fù)雜度、平均信息量高的特點,不能全面表征IEE形態(tài)特征.針對如何提取有效的IEE波形特征來充分挖掘呼吸波形的人機不同步信息,目前的研究還不太多.針對以上不足,本文提出了一種新的應(yīng)用多尺度提特征的自動檢測機械通氣人機不同步方法.通過小波變換實現(xiàn)多尺度信號分離,對信號進行多分辨率分析,針對IEE波形序列波動的不規(guī)律性和不可預(yù)測性的特點提取不同尺度的非線性特征;通過使用分類器避免了閾值設(shè)置的問題.通過對實驗結(jié)果的分析與比較,證明了該特征提取方法和分類算法的有效性,相比于現(xiàn)有算法性能更好,分類效果更佳理想,有望為臨床工作提供有效輔助.
IEE指的是患者進行吸氣努力而未觸發(fā)呼吸機進行送氣的過程.流速波形呼氣相中因為吸氣努力的存在而迅速上升,但是并未觸發(fā)呼吸機進行送氣,所以又轉(zhuǎn)為呼氣,流速波形在小幅下降后慢慢上升至歸零,開始下一次呼吸.所以IEE在呼吸波形上主要表現(xiàn)為呼氣相流速中有突起的同時伴隨壓力波形有凹陷[2].圖1所示為IEE波形氣道壓力和流速示意圖.
圖1 典型無效吸氣努力呼吸波形Fig.1 Typical ineffective inspiratory effort breathing waveform
圖中共有5次呼吸,其中3次呼吸為IEE,箭頭所指位置為無效吸氣努力發(fā)生位置,此圖為較為典型的波形示意圖,實際情況可能會更加復(fù)雜.從圖中可以看到IEE波形在呼氣相和正常波形相比,其波形序列復(fù)雜度更高,相鄰采樣點變化幅度分布更不均衡,所以希望通過小波變換獲得時-頻域的熵值特征以及非線性特征來區(qū)分IEE和非IEE波形.
小波變換(wavelet transform,WT)[8,9]對信號在時域和頻域上進行局部變換,能夠有效地提取信號的時-頻信息.不同長度的時間窗可以提供低頻和高頻分辨率,這使得小波變換成為一種適用于不規(guī)則數(shù)據(jù)模式識別的技術(shù)[10-12].連續(xù)信號x(t)的WT定義如公式(2)所示:
(2)
其中a和b分別為尺度因子(scale)和平移因子(translation).由于呼吸機波形數(shù)據(jù)是數(shù)字信號,為了適應(yīng)數(shù)字信號處理,需要將連續(xù)小波變換離散化,通常使用離散小波變換(Discrete Wavelet Transform,DWT )[13]:
(3)
圖2 小波分解樹Fig.2 Wavelet decomposition tree
離散小波變換可以通過低通和高通濾波器將原始信號多級分解,形成小波分解樹,其結(jié)構(gòu)如圖2所示.其中S為原始信號,g[n]表示高通濾波器,h[n]表示低通濾波器,A表示近似信號,D表示細節(jié)信號.
圖3為使用Daubechies5小波基對呼氣相流速波形進行6層離散波變換后的效果圖.
其中圖3(a)為原始圖,圖3(b)-(g)分別為d1-d6層小波子帶圖,圖3(h)表示a6層子帶圖.從圖中可以看到IEE特征在d5和d6層較為明顯,d1和d2層主要表征細節(jié)信息,代表高頻信號,而d6層則主要表征近似信息,代表低頻信號.
圖3 對呼氣相進行6層小波分解示意圖Fig.3 6-layer wavelet decomposition of the expiratory phase
基于IEE產(chǎn)生是由于患者在進行吸氣努力后未觸發(fā)呼吸機進行送氣,所以在流速波形上會存在一個快速突起然后又下降的情況(如圖1所示).我們認為兩類波形在信號復(fù)雜度和變異性方面有明顯的差異.因此,我們選取了一組反映序列信號復(fù)雜度和變異程度的特征,包括對每一層小波系數(shù)計算非線性熵值特征以及形態(tài)特征.其中熵值特征包括近似熵(Approximate Entropy,ApEn)[14,15]和模糊熵(Fuzzy Entropy,F(xiàn)E)[16,17].形態(tài)特征包括方差(Variance,Var)、四分位差(Interquartile,IQR)、平均絕對偏差(Mean Absolute Deviation,MAD)、龐加萊圖中的短時標準偏差(SD1)和長時標準偏差(SD2).近似熵ApEn和模糊熵FE都是可以用于評價給定時間序列復(fù)雜度的方法;方差Var、四分位差I(lǐng)QR和平均絕對偏差MAD都可以用于衡量一組數(shù)據(jù)的離散程度;龐加萊圖的SD1和SD2主要用于衡量一組數(shù)據(jù)短時程和長時程的變異程度.本研究主要提取特征的物理意義描述如表1所示.
表1 提取特征及描述Table 1 Extract features and descriptions
其中ApEn是一種可以量化時間序列不規(guī)則性的統(tǒng)計方法,新信息發(fā)生的可能性越高,時間序列越復(fù)雜,對應(yīng)的近似熵越大.在心電信號中ApEn常用于對情緒進行分類.ApEn計算公式如公式(4)所示:
ApEn=Φm(r)-Φm+1(r)
(4)
其中,N表示序列長度,m表示相空間維數(shù),r表示相似容限度,通常取r=0.2*std.
FE也用于衡量事物的不均勻性,在心電信號中該特征能夠用于檢測阻塞性睡眠呼吸暫停.FE計算公式如公式(5)所示:
(5)
Var表示一組數(shù)據(jù)的離散程度,計算公式如公式(6)所示:
(6)
式中Xi表示第i個序列值,n表示序列長度.
IQR可以體現(xiàn)各變量分散情形,其計算公式如公式(7)所示:
IQR=Q3-Q1
(7)
其中Q3表示第三四分位數(shù),Q1表示第一四分位數(shù).
MAD表示單變量數(shù)據(jù)集中樣本差異性的穩(wěn)健度量,計算公式如公式(8)所示:
(8)
其中m(x)表示序列的平均值.
SD1和SD2都是龐加萊圖中參數(shù),其計算公式分別如公式(9)-公式(12)所示:
(9)
(10)
(11)
(12)
為了提高所用分類器的性能,并減少所需的計算時間,本算法通過序列前向選擇算法(Sequential Forward Selection,SFS)進行最佳特征選取[18].序列前向選擇算法包括以下步驟:
a)所有的特征X1、X2、X3……XN都被單獨應(yīng)用到分類器中,以選擇效果最佳的一種特征.假定最佳特征為Xi.
b)將效果最佳的特征 分別與剩下的特征Xi一一結(jié)合,選取效果最佳的一組特征.假定最佳組合為[Xi,Xj].
c) 將[Xi,Xj]與剩下的特征X1、X2、X3……Xi-1、Xi+1……Xj-1、Xj+1……XN一一結(jié)合,選取效果最佳的一組特征.
d) 重復(fù)執(zhí)行步驟c,直到效果不再提升.
支持向量機(Support Vector Machine,SVM)[19,20]是在分類與回歸分析中對數(shù)據(jù)進行分析的監(jiān)督式學(xué)習(xí)分類識別方法.與其他分類器不同的是,SVM最大程度地降低了結(jié)構(gòu)風(fēng)險,而非經(jīng)驗風(fēng)險[21,22].通過SVM的訓(xùn)練,使模式到類分離超平面的距離最大化[23].通過不同的核函數(shù)可以將數(shù)據(jù)映射成高維層面[24],如線性核函數(shù)(linear)、多層感知機核函數(shù)(Multilayer Perceptron,MLP),高斯徑向基函數(shù)(Radial Basis Function,RBF),因而特別適用于從小樣本中分析特征與類別間的非線性關(guān)系.支持向量機因為其結(jié)構(gòu)簡單,具有較好的魯棒性,在對樣本進行分類的場景中有著較多的應(yīng)用[25,26].對于給定的訓(xùn)練樣本數(shù)據(jù)集(xi,yi),i=1,…,n,x∈Rd,yi∈{-1,1},分類超平面方程可以表示為公式(13):
(w*x)+b=0
(13)
決策函數(shù)f(x)可以表示為公式(14):
(14)
其中K(xi,x)為核函數(shù),ai代表拉格朗日乘子,b是SVM模型的偏置參數(shù),核函數(shù)有多種類型:
(15)
K(xi,x)=exp(-g‖xi-xj‖2)
(16)
其中式(15)為多項式核函數(shù),式(16)為RBF核函數(shù).
本文提出的檢測方案流程圖如圖4所示.由于IEE特征在流速波形中更為突出(如圖1所示),一些研究只針對流速波形進行分析,降低算法復(fù)雜性[5].本研究采納這一處理方式,只針對流速波形進行研究.
圖4 算法流程圖Fig.4 Algorithm flow chart
首先讀取呼吸波形數(shù)據(jù),通過尋找流速波形第一個過零點來確定呼氣開始點,并認為該點到呼氣結(jié)束為該次呼吸的呼氣相.然后通過去除呼氣相波形中的線性趨勢來消除數(shù)據(jù)偏移對后期計算的影響.通過離散小波變換對呼氣相流速波形進行6層分解,對各層小波系數(shù)進行特征提取,包括模糊熵、近似熵、樣本熵、方差、平均絕對誤差、四分位差、短時標準偏差以及長時標準偏差.利用序列前向選擇算法選擇最佳特征,最后應(yīng)用SVM分類器對最佳特征進行分類,進而得到人機不同步分類結(jié)果.
本文實驗數(shù)據(jù)來自浙江大學(xué)醫(yī)學(xué)院附屬邵逸夫醫(yī)院ICU病房,共收集了17名(11名男性,6名女性)使用Puritan Bennett 840呼吸機(Covidien,美國)進行機械通氣患者的數(shù)據(jù),共計3298.48小時,患者平均年齡為64.5歲,所患主要疾病包括呼吸系統(tǒng)疾病、自身免疫性疾病、糖尿病等.從中篩選出60.92小時的數(shù)據(jù),由5名低年資醫(yī)生進行數(shù)據(jù)標注,后由2名高年資醫(yī)生進行審核.標注時,我們不僅提供單次呼吸的波形給標注者,還提供它前后的多個波形,以及呼吸機設(shè)置參數(shù)和測量參數(shù),以幫助標注者更好地理解這些波形所反映的人機不同步情況,使標注盡可能準確.最終所選數(shù)據(jù)集包括1032次IEE呼吸以及1031次非IEE呼吸.本研究得到浙江大學(xué)醫(yī)學(xué)院附屬邵逸夫醫(yī)院倫理委員會批準(批準編號:20190916-16).
為了評估機械通氣人機不同步分類性能,我們采用了包括靈敏度(Se)、特異性(Sp)、F1得分和準確率(Acc)4個評價指標來衡量.4個評價指標定義如公式(17)-公式(20)所示:
(17)
(18)
(19)
(20)
其中TP,TN,F(xiàn)N,F(xiàn)P分別為真陽性,真陰性,假陰性,假陽性的樣本數(shù).
為了驗證本文提出的應(yīng)用小波多尺度特征的機械通氣人機不同步檢測算法的有效性,本文采用了十折交叉驗證法進行評價,采用MATLAB語言編程實現(xiàn)本文的算法.
在特征選取階段,用基于RBF核函數(shù)的SVM對每種特征分別計算分類性能,結(jié)果如表2所示.
表2 單個特征分類性能Table 2 Classification performance using individual feature
從表2中可以看到,在每個特征單獨作用時,SD1獲得了單一特征值的最高準確率94.1%,該特征在區(qū)分IEE波形和其他的效果最佳,說明了在無效吸氣努力波形中,前后兩個采樣點之間差值的離散程度要明顯高于正常波形,數(shù)據(jù)分布相對比較分散,相鄰兩個采樣點之間的差異程度要明顯高于后者.總體來看,所選取的這些非線性特征在準確率上都能高于80%,都能夠較好地反映IEE呼吸波形與非IEE呼吸波形的非線性動力學(xué)特性.
圖5 IEE和非IEE波形SD1特征的分布箱型圖Fig.5 Distribution box diagrams for the SD1 characteristic of the IEE and non-IEE waveforms
為了方便比較IEE和非IEE呼吸波形特征值的差異,繪制了d5層小波子帶SD1和ApEn兩種特征的分布箱型圖,如圖5和圖6所示,另外繪制了7種特征的均值柱狀圖,如圖7所示.由于篇幅所限,本文中僅展示了d5層小波子帶的分布情況.從圖5和圖6箱型圖中可以看出,對于大多數(shù)樣本,IEE波形的SD1特征值和ApEn特征值明顯大于非IEE波形,對比結(jié)果表明IEE發(fā)生時,其呼吸波形中的時間序列不規(guī)則度大于后者,波形更加復(fù)雜,相鄰采樣點之間的變化差異更大,產(chǎn)生新模式的概率也更高.圖7所示表明在d5層小波子帶中,IEE波形在SD1、SD2、MAD、Var、IQR這幾個特征中差別顯著,也證明了所選特征能夠作為檢測IEE的依據(jù).
圖6 IEE和非IEE波形ApEn特征的分布箱型圖Fig.6 Distribution box diagrams for the ApEn characteristic of the IEE and non-IEE waveforms
圖7 IEE與非IEE不同特征均值對比Fig.7 Comparison of the mean values of different characteristics between IEE and non IEE
當(dāng)使用RBF作為核函數(shù)時,根據(jù)SFS算法描述,在利用SD1和剩余特征一一結(jié)合之后發(fā)現(xiàn),效果最佳組合為SD1和ApEn,靈敏度和特異性達到了93.41% 和96.68%.再將SD1和ApEn與剩余特征一一結(jié)合之后發(fā)現(xiàn),效果不再提升,所以認為RBF核函數(shù)下SD1和ApEn為最佳特征.本實驗使用不同核函數(shù)的SVM分類器進行實驗,分類結(jié)果如表3所示.從表3結(jié)果可以看出,相對于linear和MLP核函數(shù)來說,基于RBF的SVM分類器得益于較強的數(shù)據(jù)處理能力,擁有最佳的靈敏度和特異性,并且準確率和F1也是最高的.說明在該分類任務(wù)中,RBF核函數(shù)擁有最佳性能.
表3 基于不同核函數(shù)的SVM分類性能Table 3 SVM classification performance based on different kernel functions
表4 傳統(tǒng)特征與本文所選取特征對比Table 4 Comparison between traditional features and the features selected in this paper
為了比較文獻[7]中作者所提取的呼吸時長、吸氣末流速、吸氣末壓力、吸氣末潮氣量等傳統(tǒng)時域波形特征的分類效果,在本實驗的數(shù)據(jù)集上基于文獻所選取的特征結(jié)合SVM分類器進行了十折實驗,結(jié)果如表4所示,表中數(shù)據(jù)為(均值±標準差).從表中可以看到基于本文所提出的特征在相同分類器情況下,分類效果優(yōu)于傳統(tǒng)特征,說明本文提出的特征提取方法能更加準確地提取IEE波形特征.
表5 不同算法結(jié)果比較Table 5 Comparison of results of different algorithms
本實驗與文獻所報道的幾種算法進行了對比,結(jié)果如表5所示.其中,論文閾值為5.45 L/min,最佳閾值通過在2 L/min-8 L/min之間按步長為0.2 L/min進行閾值掃描獲得,當(dāng)閾值為6.6 L/min時,分類效果最佳.從表中可以看到,使用文獻報道的閾值時,基于規(guī)則的算法的靈敏度和特異性較差,性能容易受到閾值設(shè)置參數(shù)的影響.基于本研究的數(shù)據(jù)集優(yōu)化閾值后,靈敏度和特異性都有提升,但是和機器學(xué)習(xí)算法還是有明顯差距.RF和AdaBoost的方法效果相近,都能達到一定的檢測精度,其中RF的性能略高于AdaBoost,都能避免閾值設(shè)置的問題.本文提出的方案得益于多尺度小波變換,能夠進行多尺度時頻分析;在各個尺度上提取時域和非線性的特征幫助模型更加準確地表達IEE形態(tài)特性,分類效果較其他方法都有所提升.
本文提出了一種應(yīng)用小波多尺度特征進行機械通氣人機不同步檢測的方法.利用小波變換具有多分辨率的特點,可以由粗到細地逐步提取信號特征,獲得不同頻率的下的信息,針對傳統(tǒng)算法提取的波形特征無法很好地表現(xiàn)IEE特征的問題,本方法基于IEE波形復(fù)雜度、平均信息量高的特點,對不同頻率下的信號提取包括模糊熵、近似熵、樣本熵、方差、平均絕對誤差、四分位差、短時標準偏差以及長時標準偏差特征,對特征通過SFS算法進行選擇,最后用SVM分類器對特征進行分類,很好地解決了高頻噪聲干擾和閾值設(shè)置以及時頻域特征提取的問題,并且提高了分類準確率,新的特征提取方法在實際表現(xiàn)中也體現(xiàn)了更佳的分類效果.考慮到標注的數(shù)據(jù)量較小,本研究選擇適合于小樣本分類的SVM作為分類器.SVM是一種適合于小樣本分類的機器學(xué)習(xí)算法.借助非線性核函數(shù),SVM在從小樣本中提取類別與特征間的非線性關(guān)系方面具有較強的性能.在多項生理信號分析研究中,應(yīng)用SVM模型可以在較小的數(shù)據(jù)集上取得較好的分類效果[27,28].
本文提出的方法雖然相較于現(xiàn)有算法準確率有一定優(yōu)勢,但是以下問題還需要進一步改進研究:特征的提取依賴于呼氣點精確定位,目前對于復(fù)雜波形呼氣點檢測存在錯檢的情況;目前只選取流速波形進行研究,后期會考慮結(jié)合氣道壓力波形共同計算以及選擇其他特征值以進一步提高分類精度.另外,人工標注的主觀性可能導(dǎo)致部分標注不夠準確.未來工作中應(yīng)考慮添加食道壓或膈肌電測量等參考信號輔助數(shù)據(jù)標注.經(jīng)進一步驗證和優(yōu)化的算法有望在將來應(yīng)用于呼吸機數(shù)據(jù)實時采集與監(jiān)控系統(tǒng)或植入呼吸機固件中,實時檢測人機不同步,提示醫(yī)護人員.醫(yī)護人員可根據(jù)自身經(jīng)驗對呼吸機做出調(diào)整,改善人機協(xié)調(diào)性,輔助病人治療.