陳宇斌,崔玉紅,梁?jiǎn)④?鄧皓明
(1.南昌航空大學(xué) 軟件學(xué)院,江西 南昌 330063;2.物聯(lián)網(wǎng)與大數(shù)據(jù)實(shí)驗(yàn)室,江西 南昌 330063;3.江西中醫(yī)藥大學(xué)附屬醫(yī)院肺病科,江西 南昌 330006)
基于光電容積(PPG)的脈搏采集設(shè)備成本低廉、外觀小巧、攜帶方便,被廣泛應(yīng)用于血壓、心率、房顫、呼吸頻率等生理參數(shù)的采集工作中。PPG信號(hào)通過對(duì)生理參數(shù)的預(yù)測(cè),直觀地反映身體狀況,在日常監(jiān)測(cè)和輔助醫(yī)生診斷方面大有可為?;赑PG的血壓預(yù)測(cè)[1-3]、心率預(yù)測(cè)[4-6]、房顫預(yù)測(cè)[7-8]、呼吸頻率預(yù)測(cè)[9-11]的研究越來越多。
PPG主要傳達(dá)了與心臟脈動(dòng)同步的血液體積變化的信息,它可以簡(jiǎn)單地使用接觸式指夾或可穿戴式傳感器來測(cè)量。此外,它還可以通過提供遠(yuǎn)程PPG信號(hào)的攝像頭進(jìn)行遠(yuǎn)程估計(jì)。無論是接觸式還是遠(yuǎn)程PPG信號(hào),已經(jīng)證明PPG信號(hào)可以用來估計(jì)重要的生理生命體征,如血壓(BP)[12-14]、心率、房顫、呼吸頻率、氧飽和度和血紅蛋白水平,甚至多電極心電圖(ECG)信號(hào),也可以通過PPG信號(hào)推斷出來。
由于生物醫(yī)學(xué)數(shù)據(jù)集的公開可用性,通過深度學(xué)習(xí)模型評(píng)估各種生理參數(shù)才得以推廣。然而,在收集和歸檔時(shí)忽略信號(hào)質(zhì)量,所以在進(jìn)一步部署前需要進(jìn)行有效的清理。因此,許多技術(shù)被引入到數(shù)據(jù)清理和異常/偽裝檢測(cè)中[15-17]。
機(jī)器學(xué)習(xí)需要大量的數(shù)據(jù)來訓(xùn)練模型,尤其是訓(xùn)練深度網(wǎng)絡(luò)時(shí)。數(shù)據(jù)集是實(shí)驗(yàn)的一部分,豐富的數(shù)據(jù)能增強(qiáng)模型的泛化能力,提高實(shí)驗(yàn)的魯棒性。在進(jìn)行機(jī)器學(xué)習(xí)時(shí),數(shù)據(jù)集一般會(huì)劃分為訓(xùn)練集和測(cè)試集,很多時(shí)候還會(huì)劃分出驗(yàn)證集。PPG是借助光電手段檢測(cè)血液容積變化的一種無創(chuàng)檢測(cè)辦法。每次心跳時(shí),血管的收縮和擴(kuò)張都會(huì)影響光的透射或是光的反射。一定波長(zhǎng)的光束照射到指端皮膚表面,光線透過皮膚組織然后反射到光敏傳感器,光照會(huì)有一定的衰減。正是由于動(dòng)脈對(duì)光的吸收有變化而其他組織對(duì)光的吸收基本不變,把光信號(hào)轉(zhuǎn)換成電信號(hào),得到的信號(hào)就可以分為直流信號(hào)和交流信號(hào)。提取其中的交流信號(hào),就能反映血液流動(dòng)的特點(diǎn)。
相比于心電圖信號(hào),PPG可以進(jìn)行長(zhǎng)時(shí)間連續(xù)監(jiān)測(cè),具有成本低,易獲取且在采集過程中受試者不會(huì)感覺到身體異樣等特點(diǎn),所以近年來對(duì)于PPG的研究逐漸盛行起來。PPG數(shù)據(jù)集從是否可以被直接獲取的角度分為公開數(shù)據(jù)集和非公開數(shù)據(jù)集。公開數(shù)據(jù)集滿足科研人員對(duì)大量實(shí)驗(yàn)數(shù)據(jù)的需求,推動(dòng)機(jī)器學(xué)習(xí)與醫(yī)學(xué)領(lǐng)域的結(jié)合。非公開數(shù)據(jù)集數(shù)據(jù)容量相對(duì)較少,一般由實(shí)驗(yàn)室自主尋求實(shí)驗(yàn)合作者,根據(jù)實(shí)驗(yàn)的特性選擇合適受試者進(jìn)行數(shù)據(jù)采集。
從文獻(xiàn)中了解到PPG數(shù)據(jù)集由公開數(shù)據(jù)集和非公開數(shù)據(jù)集組成,公開數(shù)據(jù)集可以直接下載使用,非公開數(shù)據(jù)集屬于實(shí)驗(yàn)室私有。就目前公開的PPG數(shù)據(jù)集而言,MIMIC是包含參與者數(shù)量最多的數(shù)據(jù)集,其中MIMIC II的數(shù)據(jù)是2001~2008年間貝斯以色列迪康醫(yī)學(xué)中心重癥監(jiān)護(hù)室中病人的醫(yī)療數(shù)據(jù),其中包括26 870名成人住院者。MIMIC III在MIMIC II基礎(chǔ)上擴(kuò)充數(shù)據(jù)集容量,它涵蓋2001年6月~2012年10月重癥監(jiān)護(hù)室病人數(shù)據(jù),包括53 423名成人患者。MIMIC IV在MIMIC III的基礎(chǔ)上增加了2012年到2018年的重癥監(jiān)護(hù)病房的數(shù)據(jù),與前兩個(gè)MIMIC不同的是采用模塊化方法進(jìn)行數(shù)據(jù)組織,突出數(shù)據(jù)的來源并促進(jìn)不同數(shù)據(jù)源的單獨(dú)和組合使用。MIMIC[18]作為一個(gè)免費(fèi)公開的數(shù)據(jù)庫,包含了大量PPG信號(hào)和動(dòng)脈血壓信號(hào)。該數(shù)據(jù)集包含12 000條不同長(zhǎng)度的記錄。每條記錄包括ABP(有創(chuàng)動(dòng)脈血壓)、PPG(來自指尖的光體積變化描記圖)和ECG(來自通道II的心電圖)信號(hào)。數(shù)據(jù)采樣頻率為125 Hz,以8位精度記錄。
昆士蘭大學(xué)生命體征數(shù)據(jù)集(The University of Queensland Vital Signs Dataset)涵蓋了更廣泛的生命體征。大多數(shù)病例包括來自心電圖儀、脈搏血氧儀、二氧化碳圖、無創(chuàng)動(dòng)脈血壓監(jiān)測(cè)儀、氣道流量和壓力監(jiān)測(cè)儀的數(shù)據(jù),在少數(shù)情況下,還包括從Y型肺活量計(jì)、腦電圖監(jiān)測(cè)儀和動(dòng)脈血壓監(jiān)測(cè)儀采集的數(shù)據(jù)。該數(shù)據(jù)集記錄了澳大利亞皇家阿德萊德醫(yī)院接受麻醉的32名手術(shù)患者,持續(xù)時(shí)間從13分鐘到5小時(shí)不等[19]。部分研究利用了昆士蘭大學(xué)生命體征數(shù)據(jù)庫作為實(shí)驗(yàn)的部分?jǐn)?shù)據(jù)集對(duì)血壓進(jìn)行評(píng)估[20-21]。
IEEE信號(hào)處理杯(SPC)數(shù)據(jù)集在許多研究中被使用[22-24],該數(shù)據(jù)集記錄了持續(xù)5分鐘的PPG信號(hào),同時(shí)記錄了手腕處的三軸加速度信號(hào)以及心電信號(hào)。數(shù)據(jù)集采集過程中20名受試者進(jìn)行3種類型的活動(dòng)。首先,受試者1~12執(zhí)行在跑步機(jī)上以以下速度行走或奔跑:1~2 km/h,持續(xù)0.5分鐘,6~8 km/h,持續(xù)1分鐘,12~15 km/h,持續(xù)1分鐘,6~8 km/h,持續(xù)1分鐘,12~15 km/h,持續(xù)1分鐘,1~2 km/h,持續(xù)0.5分鐘。受試者用帶有腕帶的手拉衣服,在額頭上擦汗,然后在跑步機(jī)上按下按鈕。第二,由受試者14,15,18和20進(jìn)行前臂/上臂練習(xí),例如,握手、伸展、推、跑步、跳躍、跳和俯臥撐。最后,由受試者15,16,17,18和19執(zhí)行涉及強(qiáng)烈的手臂運(yùn)動(dòng),例如拳擊。
WESAD是一個(gè)多模態(tài)的數(shù)據(jù)集,具有生理和運(yùn)動(dòng)的數(shù)據(jù),可用于可穿戴式壓力和影響檢測(cè)。該數(shù)據(jù)集是用腕戴式設(shè)備收集PPG、加速度計(jì)、皮膚電活動(dòng)和體溫,胸戴式設(shè)備收集心電圖、加速計(jì)、肌電圖、呼吸和體溫。15名受試者參加了數(shù)據(jù)的收集,每人的數(shù)據(jù)采集時(shí)間約為100分鐘。數(shù)據(jù)集記錄的目的是檢測(cè)和區(qū)分不同的情感狀態(tài)(中性、壓力、娛樂)。因此,與SPC不同,WESAD是在受試者久坐的狀態(tài)下采集的[25]。
健康志愿者構(gòu)建的Vortal包含從18~39歲年輕受試者和70歲以上老年受試者中獲得的ECG,PPG,阻抗呼吸描記(IP)和參考口鼻壓力信號(hào)[26]。在仰臥休息時(shí)從每個(gè)受試者處采集大約10分鐘的數(shù)據(jù)。此外,在步行、跑步和仰臥時(shí)從年輕受試者身上采集數(shù)據(jù),然后待狀態(tài)平穩(wěn)時(shí)再次采集年輕受試者的數(shù)據(jù)。
CapnoBase包含PPG記錄和二氧化碳圖數(shù)據(jù)[27],均以300 Hz采樣。數(shù)據(jù)集中的病例是從選擇性手術(shù)和常規(guī)麻醉期間收集的大量生理信號(hào)中隨機(jī)選擇的。該數(shù)據(jù)集包含29名兒科和13名成人患者的42段8分鐘的持續(xù)時(shí)間記錄,其中包含自主呼吸和受控呼吸下的高質(zhì)量記錄。本數(shù)據(jù)集將二氧化碳波形圖作為CapnoBase的黃金標(biāo)準(zhǔn),同時(shí)研究助理手動(dòng)標(biāo)記了呼吸周期,并且根據(jù)連續(xù)呼吸之間的時(shí)間計(jì)算了參考呼吸率值。
BIDMC是從MIMIC-II資源中提取的[28],由53名成人重癥監(jiān)護(hù)患者的PPG記錄和同步IP呼吸信號(hào)組成,記錄時(shí)間約為8分鐘,采樣率均為125 Hz。每條記錄的IP波形作為參考呼吸,其中IP信號(hào)中的每個(gè)呼吸周期由兩名研究助理獨(dú)立手動(dòng)注釋,兩組注釋都用于計(jì)算參考呼吸頻率值。
PPGDalia包括8種不同的活動(dòng)[29],這些活動(dòng)在日常生活中進(jìn)行,包括低強(qiáng)度的駕駛、中等強(qiáng)度的步行和高強(qiáng)度手臂運(yùn)動(dòng)的桌上足球活動(dòng)。同時(shí)進(jìn)行周期性的步行或下樓梯和非周期性體育活動(dòng)進(jìn)食或桌上足球。此外,為了產(chǎn)生高度可變的心率,選擇需要不同體力的活動(dòng)開車與上樓梯。該數(shù)據(jù)集有15名參與者,每位參與者接受150分鐘的數(shù)據(jù)監(jiān)測(cè)。數(shù)據(jù)分別由胸戴式和腕帶式設(shè)備記錄,其中胸戴式設(shè)備采集心電信號(hào)、三軸加速度、呼吸等數(shù)據(jù),腕帶式設(shè)備采集PPG、三軸加速度、皮膚電活動(dòng)、體溫等數(shù)據(jù)。
除了通過參與者采集數(shù)據(jù)這一方式外,還可以通過算法模擬生理參數(shù),合成數(shù)據(jù)集。在文獻(xiàn)[30]中包含大約15小時(shí)的PPG數(shù)據(jù)。來自合成數(shù)據(jù)集的數(shù)據(jù)是根據(jù)理想化PPG使用基線漂移、振幅調(diào)制和頻率調(diào)制來調(diào)制的。
除了公開數(shù)據(jù)集,還有實(shí)驗(yàn)室收集的數(shù)據(jù),通常這部分?jǐn)?shù)據(jù)是不公開的。這類數(shù)據(jù)的采集設(shè)備可能是實(shí)驗(yàn)室設(shè)計(jì)的設(shè)備,也可能是市面上封裝好的設(shè)備。指環(huán)狀可穿戴設(shè)備(CART)已被開發(fā)用于收集和分析來自手指的PPG信號(hào)[31]。使用嵌入內(nèi)部的高強(qiáng)度綠色發(fā)光二極管和光電二極管,基于反射法測(cè)量。通過CART收集受試者PPG信號(hào)可以與研究所用的智能手機(jī)直接相連接。
Chan等人詳細(xì)描述的獨(dú)立數(shù)據(jù)集是在普通門診使用智能手機(jī)從1 013名參與者中獲取的3 039個(gè)PPG波形數(shù)據(jù)[32]。PPG波形的采樣頻率為30 Hz,測(cè)量時(shí)間持續(xù)17 s。
表1 公開數(shù)據(jù)集參與者數(shù)量比較
臨床醫(yī)生注釋數(shù)據(jù)集(clinician-annotated)由402個(gè)連續(xù)的PPG記錄組成[33],這些記錄來自29個(gè)自由生活的受試者。每個(gè)連續(xù)PPG記錄平均為8小時(shí)。在這29名受試者中,13人在整個(gè)記錄過程中都有持續(xù)的房顫,2人有持續(xù)的正常竇性心律,其余14人顯示出隨時(shí)間變化的心率,包括除房顫和竇性心律意外的心律失常。NSR數(shù)據(jù)集由341份連續(xù)的PPG記錄組成,這些記錄來自53名健康的自由生活的受試者。這兩個(gè)數(shù)據(jù)集都是由三星的穿戴設(shè)備以20 Hz的采樣頻率收集。
使用有監(jiān)督的深度學(xué)習(xí)方法需要為數(shù)據(jù)提供標(biāo)簽,大部分實(shí)驗(yàn)在估計(jì)血壓時(shí)使用動(dòng)脈血壓(ABP)來標(biāo)注。而對(duì)于心率評(píng)估和房顫評(píng)估而言,標(biāo)簽一般由ECG來標(biāo)注。用于呼吸頻率估計(jì)的數(shù)據(jù)集不同,標(biāo)注信號(hào)會(huì)跟隨數(shù)據(jù)集發(fā)生改變。BIDMC用胸阻抗標(biāo)注,CapnoBase用二氧化碳圖標(biāo)注,Vortal使用阻抗肺圖和口鼻壓力信號(hào)標(biāo)注。
對(duì)于深度學(xué)習(xí)而言,預(yù)處理所花費(fèi)的精力是相對(duì)較少的。在數(shù)據(jù)信噪比較高的情況下無需做任何預(yù)處理,可以將原始的PPG信號(hào)作為深度學(xué)習(xí)模型的輸入,但PPG信號(hào)受到噪聲影響時(shí)需要進(jìn)行預(yù)處理。數(shù)據(jù)預(yù)處理階段對(duì)噪聲過濾的操作方法非常豐富[34]。例如:自適應(yīng)濾波[35]、基于小波的去噪、獨(dú)立分量分析[36]、經(jīng)驗(yàn)?zāi)B(tài)分解、時(shí)頻分析、頻譜減法[37]。
光電信號(hào)與噪聲信號(hào)擬合在一起變成帶有噪聲的信號(hào),在采集PPG信號(hào)的過程中因?yàn)樵肼曅盘?hào)是低頻的,所以可以根據(jù)小波變換的特性將光電信號(hào)和噪聲信號(hào)分解開。小波變換是將分解系數(shù)設(shè)置為零來消除低頻率和高頻率分量的,軟閾值小波變換被廣泛應(yīng)用于小波去噪。
使用小波變換的預(yù)處理方式可能會(huì)導(dǎo)致信號(hào)中信息丟失,從而對(duì)模型的分類性能產(chǎn)生極大的影響。一些研究嘗試將PPG轉(zhuǎn)換成二維灰度圖。雖然灰度圖保持了原始數(shù)據(jù)的完整性,但信號(hào)中的頻率信息卻沒有得到充分反映。傅里葉變換(FT)將信號(hào)從時(shí)域轉(zhuǎn)換到頻域,將信號(hào)所包含的頻率信息作為一個(gè)整體。傳統(tǒng)傅里葉變換(FFT)通過帶通濾波器消除特定頻率。然而,此方法忽略了時(shí)域信息。
時(shí)頻分析可以克服上述數(shù)據(jù)處理方法的缺點(diǎn)。時(shí)間-頻率分析的基本思想是設(shè)計(jì)一個(gè)時(shí)間和頻率的聯(lián)合函數(shù)[38],同時(shí)描述信號(hào)在不同時(shí)間、頻率的能量密度或強(qiáng)度。將時(shí)間和頻率結(jié)合起來,有利于對(duì)信號(hào)進(jìn)行全面處理。
基于頻譜方法的核心思想是區(qū)分周期性的心率產(chǎn)生信號(hào)與運(yùn)動(dòng)產(chǎn)生信號(hào),由運(yùn)動(dòng)衍生的時(shí)間-頻率頻譜來支持。例如,基于同時(shí)記錄的加速度信號(hào)來獲取相對(duì)干凈的信號(hào)。基于這種頻譜分析,最近開發(fā)了幾種方法,如IMAT[39],SpaMa[40],WFPV[41]和MC-SMD[42]。然而,從時(shí)頻頻譜中提取心率在目前的方法中是很麻煩的,因?yàn)樗鼈兪歉叨葏?shù)化的,并且是為特定場(chǎng)景量身定做的。
將深度學(xué)習(xí)方法用于信號(hào)質(zhì)量的評(píng)估已經(jīng)受到廣泛關(guān)注。在相關(guān)文獻(xiàn)中使用粗略清理和精細(xì)清理分步方法對(duì)數(shù)據(jù)進(jìn)行預(yù)處理。首先,粗略清理利用溫和閾值方法排除具有突出異常的信號(hào),然后,精細(xì)清理使用PCA閾值法對(duì)數(shù)據(jù)進(jìn)行進(jìn)一步清理[43]。
模型輸入有所不同,除了將原始數(shù)據(jù)作為輸入外,還可以將原始數(shù)據(jù)轉(zhuǎn)化為圖片作為輸入?;跁r(shí)間序列的深度學(xué)習(xí)模型由完全卷積塊、shuffle層、注意力LSTM層和全連接層串聯(lián)而成,其中完全卷機(jī)塊由3個(gè)時(shí)間卷積塊組成?;趫D像的深度學(xué)習(xí)網(wǎng)絡(luò)包括VGG19,Xception,ResNet18和ResNet50。為了分析訓(xùn)練集大小對(duì)分類性能的影響,分別使用10%,50%,100%的原始數(shù)據(jù)作為模型輸入,對(duì)基于特征的SVM分類器、基于時(shí)間序列的深度學(xué)習(xí)模型和基于圖像的深度學(xué)習(xí)模型進(jìn)行比較。在10%數(shù)據(jù)時(shí)SVM率先展現(xiàn)良好的準(zhǔn)確率,隨著數(shù)據(jù)量的增加ResNet18展現(xiàn)出最佳的性能[44]。同樣將圖片作為輸入的還有具有卷積層、激活層、dropout、最大池層、全連接層的網(wǎng)絡(luò)架構(gòu)[45]以及由LSTM、Bi-LSTM、卷積層、密度層堆疊的網(wǎng)絡(luò)架構(gòu)[46]。將原始信號(hào)轉(zhuǎn)變成圖片提取特征具有不錯(cuò)的實(shí)驗(yàn)效果。
采集過程中受到噪聲干擾,容易產(chǎn)生不符合范圍的生理信號(hào),對(duì)于不同的生理參數(shù)的估計(jì),使用閾值法排除質(zhì)量較差的PPG信號(hào)周期。在保持?jǐn)?shù)據(jù)質(zhì)量的情況下對(duì)數(shù)據(jù)進(jìn)行下采樣來減少模型的計(jì)算復(fù)雜度。
醫(yī)學(xué)信號(hào)非常難獲取,并且標(biāo)簽需要有經(jīng)驗(yàn)的醫(yī)生標(biāo)注,所以能夠被研究使用的數(shù)據(jù)較少,而深度學(xué)習(xí)模型的訓(xùn)練需要大量數(shù)據(jù),所以可以通過數(shù)據(jù)擴(kuò)充來增加數(shù)據(jù)數(shù)量[38]。數(shù)據(jù)擴(kuò)充通過3個(gè)基本過程來實(shí)現(xiàn),分別為縮放、添加隨機(jī)高斯噪聲以及隨機(jī)改變振幅。縮放是指將PPG數(shù)據(jù)乘以從正態(tài)分布中獲得的隨機(jī)標(biāo)度器。添加隨機(jī)高斯噪聲是指將PPG中的每個(gè)數(shù)據(jù)點(diǎn)與從正態(tài)分布中隨機(jī)獲得的不同數(shù)值相加。隨機(jī)改變振幅是指將PPG的數(shù)據(jù)點(diǎn)與隨機(jī)產(chǎn)生的高斯過程回歸曲線相乘。
周期分割能夠豐富數(shù)據(jù)集,一些實(shí)驗(yàn)在存在偽影和失真的情況下提供準(zhǔn)確的PPG節(jié)拍分割[47-48]。使用峰值檢測(cè)法將單個(gè)脈沖分離出來完成周期分割,使用動(dòng)態(tài)時(shí)間扭曲、時(shí)間上的零填充和頻率上的插值方法填充獲得相同的特征長(zhǎng)度[49]。
即使在技術(shù)進(jìn)步的今天,心血管疾病仍然是發(fā)病率和死亡率最具威脅性的原因之一,嚴(yán)重?fù)p害了老齡人口的健康。因此,持續(xù)的監(jiān)測(cè)是必不可少的。然而,隨著患者數(shù)量的不斷增加,專業(yè)的醫(yī)生數(shù)量不能滿足患者需求,所以自動(dòng)化監(jiān)測(cè)方法似乎是唯一可行的應(yīng)對(duì)危機(jī)方法?;赑PG的生理參數(shù)預(yù)測(cè)被廣泛使用。
卷積神經(jīng)網(wǎng)絡(luò)(CNN)最初是為捕捉具有可變性的二維數(shù)據(jù)設(shè)計(jì)的。后來的研究證明卷積神經(jīng)網(wǎng)絡(luò)在一維數(shù)據(jù)上也表現(xiàn)良好。
CNN從輸入中提取最佳特征集,長(zhǎng)短期記憶(LSTM)網(wǎng)絡(luò)捕獲提取功能中的時(shí)間相關(guān)性,兩者結(jié)合可以創(chuàng)造更具魯棒性的網(wǎng)絡(luò)結(jié)構(gòu)。CNN與由兩個(gè)相同的LSTM模塊串聯(lián)成的LSTM網(wǎng)絡(luò)堆疊在一起形成深度學(xué)習(xí)模型[50]。運(yùn)用上述模型對(duì)比不同數(shù)據(jù)集預(yù)測(cè)的性能,在MIMIC-II中隨機(jī)抽取的20名受試者中,對(duì)收縮壓(SBP)和舒張壓(DBP)值的預(yù)測(cè)誤差分別為3.70±3.07 mmHg和2.02±1.76 mmHg。在UQVSD上,SBP和DBP的預(yù)測(cè)誤差分別為3.70±3.07 mmHg和2.02±1.76 mmHg。
用LSTM和GRU單元取代傳統(tǒng)的循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)單元,可以更好地解決深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程中出現(xiàn)的梯度消失問題。皮爾遜相關(guān)系數(shù)評(píng)估每對(duì)特征之間的線性關(guān)系,最大信息系數(shù)評(píng)估特征和血壓之間的非線性關(guān)系。經(jīng)過以上兩種相關(guān)性評(píng)估,可以將52個(gè)輸入特征減少至24個(gè)。雙向?qū)佑兄诰W(wǎng)絡(luò)通過按前后順序處理輸入序列來捕捉更多信息。由一個(gè)雙向RNN層(Bi-RNN)、n個(gè)單向RNN(uni-RNN)層和一個(gè)注意層組成的模型預(yù)測(cè)血壓。為了增強(qiáng)訓(xùn)練網(wǎng)絡(luò)重要信息的隱藏狀態(tài)的能力,利用注意力機(jī)制來進(jìn)一步提高模型的性能[51]?;赑PG的血壓診斷算法性能比較如表2所示。
表2 基于PPG的血壓診斷算法性能比較
CatBoost是一種以對(duì)稱決策樹為基學(xué)習(xí)器實(shí)現(xiàn)的梯度提升決策樹(GBDT)框架。首先使用半經(jīng)典信號(hào)分析技術(shù)重構(gòu)算法,這樣可以平衡重建復(fù)雜性和準(zhǔn)確性,然后將重建信號(hào)的光譜特征、PPG和二階導(dǎo)數(shù)的形態(tài)特征作為CatBoost監(jiān)督算法輸入預(yù)測(cè)血壓。該方法的收縮壓和舒張壓的平均絕對(duì)誤差分別為5.37 mmHg和2.96 mmHg[52]。
MLP-Mixer包含兩種類型的層[53],一種是將多層感知機(jī)獨(dú)立應(yīng)用于圖像塊,另一種是跨塊應(yīng)用多層感知機(jī),這是一種完全基于多層感知器的架構(gòu)。MLP-BP-lstm由LSTM、MLP-Mixer、卷積層全連接層構(gòu)成[54],此網(wǎng)絡(luò)能夠預(yù)測(cè)的舒張壓平均絕對(duì)誤差為2.13±3.07,收縮壓平均絕對(duì)誤差為3.52±5.1。
相比于心電圖測(cè)量設(shè)備,PPG采集設(shè)備具有明顯的優(yōu)勢(shì),它外形小巧,成本低廉,是可穿戴設(shè)備的流行選擇。與傳統(tǒng)的心電圖數(shù)據(jù)相比,基于PPG信號(hào)的心率估計(jì)更具挑戰(zhàn)性。用戶的身體活動(dòng)容易引起運(yùn)動(dòng)偽影,從而導(dǎo)致PPG信號(hào)的質(zhì)量降低。為了提高準(zhǔn)確率,研究人員對(duì)訓(xùn)練模型進(jìn)行改進(jìn),以期獲取更加有利于心率預(yù)測(cè)的模型。
在文獻(xiàn)[55]中提出一個(gè)基于多類和非統(tǒng)一多標(biāo)簽分類的9層深度神經(jīng)網(wǎng)絡(luò)用于估計(jì)心率,該網(wǎng)絡(luò)由一個(gè)二維卷積層、一個(gè)一維卷積層、一個(gè)扁平化層、一個(gè)連接層、一個(gè)全連接層、兩個(gè)LSTM層、一個(gè)全連接層、一個(gè)softmax激活層按順序堆疊而成。后續(xù)提出了一個(gè)由16個(gè)卷積層堆疊而成的網(wǎng)絡(luò)架構(gòu),使用基于頻譜分析的校準(zhǔn)來估計(jì)最終的HR。上述方法在IEEE信號(hào)處理杯訓(xùn)練數(shù)據(jù)集上實(shí)現(xiàn)了平均1.98 bpm的絕對(duì)誤差[56]。
基于PPG的心率診斷算法性能比較如表3所示。
表3 基于PPG的心率診斷算法性能比較
DeepHeart具有基于深度學(xué)習(xí)的去噪和基于頻譜分析的校準(zhǔn)功能。該模型首先從心電圖信號(hào)生成干凈的PPG信號(hào),使用受污染的PPG信號(hào)及其相應(yīng)的干凈PPG信號(hào)訓(xùn)練一組去噪卷積神經(jīng)網(wǎng)絡(luò)(DCNN)。然后,受污染的PPG信號(hào)被一組DCNN去噪,并執(zhí)行基于頻譜分析的校準(zhǔn)以估計(jì)最終的HR。DCNN由16個(gè)卷積層堆疊而成,在第1層后進(jìn)行激活操作,第2到第15層卷積操作后進(jìn)行批量歸一化和激活,第16層卷積操作后輸出[57]。
心房顫動(dòng)(AF)是中風(fēng)的主要原因,它會(huì)增加心肌梗塞、慢性腎病、癡呆和死亡的風(fēng)險(xiǎn)。臨床上隱匿性AF經(jīng)常在早期時(shí)不容易被感知,因此,需要準(zhǔn)確檢測(cè)無癥狀A(yù)F的方法。
在過去的幾年里,基于PPG的房顫?rùn)z測(cè)已經(jīng)得到了重視。早期嘗試?yán)檬止ぶ谱鞯年P(guān)于PPG心跳間期的特征進(jìn)行檢測(cè)。關(guān)于基于PPG的房顫?rùn)z測(cè)算法的工作主要依賴于明確的規(guī)則和手工制作的特征,這些特征來自PPG波形的間隔序列,目的是捕捉脈搏不規(guī)則性,這也是房顫的標(biāo)志。判斷心房顫動(dòng)的方法包括變異系數(shù)[58]、樣本熵系數(shù)[59]、歸一化連續(xù)差異均方根和香農(nóng)熵[60]、龐加萊繪圖模式[61]和使用SVM的自相關(guān)性分析。
最近提出基于PPG的深度神經(jīng)網(wǎng)絡(luò)檢測(cè)房顫[62]。許多著名的深度學(xué)習(xí)模型,如VGGNet[63],GoogLeNet[64]和Microsoft ResNet都在國際分類比賽中取得了優(yōu)異的成績(jī),它們提供了許多解決問題的方法。CNN在提取特征方面展現(xiàn)優(yōu)勢(shì),在參數(shù)相同的情況下,依靠分組卷積展現(xiàn)比其他先進(jìn)卷積網(wǎng)絡(luò)更好的能力。分組卷積的每個(gè)區(qū)塊由3個(gè)卷積層組成,首先使用核大小為1的卷積瓶頸層來減少特征圖的數(shù)量,然后使用核大小為9的分組卷積層在每個(gè)區(qū)塊中提供更多的表達(dá)能力,最后使用內(nèi)核大小為1的卷積層恢復(fù)原始特征圖的數(shù)量。該網(wǎng)絡(luò)的16個(gè)塊被分組為4個(gè)階段,每個(gè)階段分別包含3,4,6和3個(gè)塊。特征圖在每個(gè)階段的第一個(gè)塊的分組卷積層處進(jìn)行下采樣。
基于PPG的房顫診斷算法性能比較如表4所示。
表4 基于PPG的房顫診斷算法性能比較
在文獻(xiàn)[65]中提出的模型涉及多個(gè)卷積塊、LSTM層和扁平化層。每個(gè)卷積塊中包含一個(gè)卷積層和一個(gè)最大池化層。從測(cè)試數(shù)據(jù)集中發(fā)現(xiàn)使用原始PPG波形作為輸入的深度學(xué)習(xí)算法比單獨(dú)使用PPG衍生的心率數(shù)據(jù)的機(jī)器學(xué)習(xí)算法更優(yōu)。另外,使用密度層和瓶頸層有利于提高計(jì)算效率,增強(qiáng)模型緊湊性。
2D-CNN包含四個(gè)卷積層和三個(gè)密度層。此網(wǎng)絡(luò)的輸入是使用心電信號(hào)的連續(xù)RR間隔或PPG的峰值間隔建立的龐加萊圖像,訓(xùn)練好的權(quán)重用于訓(xùn)練PPG數(shù)據(jù)集,使用神經(jīng)網(wǎng)絡(luò)的最后三個(gè)密集層對(duì)模型進(jìn)行微調(diào)[66]。
呼吸頻率(RR)是呼吸功能障礙的重要診斷標(biāo)志。異常升高的RR是心臟驟停的良好預(yù)測(cè)指標(biāo),并且與住院患者死亡率高度相關(guān)。因此,監(jiān)測(cè)RR對(duì)于評(píng)估患者在醫(yī)院和家庭或社區(qū)環(huán)境中的健康狀況至關(guān)重要。傳統(tǒng)的呼吸測(cè)量是通過使用肺活量計(jì)、肺圖或腹部肌電圖進(jìn)行的。這些測(cè)量方式對(duì)于在普通病房和家庭環(huán)境中的患者來說是非常麻煩和昂貴的。PPG傳感器集成的可穿戴設(shè)備因其普遍的便利性和簡(jiǎn)單性越來越多的被應(yīng)用于臨床醫(yī)學(xué)。當(dāng)前基于PPG的RR估計(jì)方法嚴(yán)重依賴手工規(guī)則和針對(duì)特定設(shè)置調(diào)整的參數(shù)。
選擇最優(yōu)超參數(shù)對(duì)于深度學(xué)習(xí)模型改進(jìn)至關(guān)重要,貝葉斯優(yōu)化算法已在各種機(jī)器學(xué)習(xí)模型中的超參數(shù)調(diào)優(yōu)中取得成功,包括ResNet塊的數(shù)量、濾波器大小、卷積層的內(nèi)核大小、卷積層的步長(zhǎng)和最大池化層、第一致密層等超參數(shù)的選擇。設(shè)計(jì)出由五個(gè)ResNet塊、一個(gè)最大池化層、一個(gè)扁平化層和三個(gè)具有減少單元數(shù)量的致密層構(gòu)成的網(wǎng)絡(luò)架構(gòu)識(shí)別呼吸頻率。每個(gè)ResNet塊包含三個(gè)卷積層、一個(gè)合并層和一個(gè)激活層[67]。采用貝葉斯優(yōu)化算法優(yōu)化卷積層的內(nèi)核大小、濾波器大小和步幅大小,提高預(yù)測(cè)準(zhǔn)確率。
基于PPG的呼吸頻率算法性能比較如表5所示。
表5 基于PPG的呼吸頻率算法性能比較
呼吸頻率提供了大量的診斷依據(jù),從心電圖和PPG中提取有關(guān)呼吸模式的信息可以對(duì)睡眠狀況和其他慢性呼吸系統(tǒng)疾病進(jìn)行更全面的評(píng)估。相關(guān)研究按照全卷積編碼器-解碼器的拓?fù)浣Y(jié)構(gòu)設(shè)計(jì)架構(gòu)。編碼器部分使用PPG信號(hào)作為輸入,通過下采樣產(chǎn)生特征向量。解碼器部分使用產(chǎn)生的特征向量作為其輸入,并通過上采樣產(chǎn)生輸出,從而預(yù)測(cè)呼吸信號(hào)。編碼器部分被分為8級(jí),一維卷積運(yùn)算被用來對(duì)輸入特征下采樣。為了提高訓(xùn)練效率,使用分層卷積法下采樣。每個(gè)編碼器級(jí)別的輸出被提供給擴(kuò)張的殘差起始?jí)K。擴(kuò)張的殘差起始?jí)K的使用提供了一個(gè)更大的接收?qǐng)霾⑶覜]有顯著增加參數(shù)。此外,在塊內(nèi)使用殘差連接是為了減少梯度消失所帶來的影響,并縮短訓(xùn)練期間的收斂時(shí)間。解碼器部分利用解碼器塊的特征圖與其相應(yīng)的編碼器對(duì)之間的特征連接。在進(jìn)行卷積和稀釋殘差卷積操作后,解碼器的每一級(jí)使用去卷積操作進(jìn)行上采樣。然后在解碼器的最后一級(jí),進(jìn)行卷積運(yùn)算,將特征通道映射到所需數(shù)量的輸出通道[68]。
RRWaveNet由多尺度卷積、深度時(shí)空殘差塊和呼吸率估計(jì)器三個(gè)模塊組成。多尺度卷積模塊采用三個(gè)分支并行的多尺度卷積來捕獲不同分辨率下的信號(hào)特征。三個(gè)卷積層包含不同的濾波器大小,它們獨(dú)立學(xué)習(xí)每個(gè)卷積分辨率的適當(dāng)權(quán)重。每個(gè)分支卷積層后面是批量歸一化層、ReLU激活層和最大池化層。來自三個(gè)分支的三個(gè)相同大小的張量在該模塊的末尾連接,產(chǎn)生一個(gè)張量。深度時(shí)空殘差塊由八個(gè)殘差塊串聯(lián)而成。每個(gè)殘差塊包含五層,兩組一維卷積層和一個(gè)批量歸一化層,中間有一個(gè)激活層。呼吸率估計(jì)器放置在最后一個(gè)模塊的開頭,全局平均池化層將殘差塊的輸出轉(zhuǎn)換回一維形狀,然后三組激活層和全連接層將張量壓縮到1,最后對(duì)呼吸頻率進(jìn)行評(píng)估[69]。
為了預(yù)測(cè)血壓、心率、房顫、呼吸頻率等生理參數(shù),需要一個(gè)足夠容量的數(shù)據(jù)集用于模型訓(xùn)練。數(shù)據(jù)集的類型和數(shù)量種類多樣化可以提高模型的魯棒性和泛化能力,從而提高在預(yù)測(cè)過程中生理參數(shù)的準(zhǔn)確性。因此,數(shù)據(jù)集是整個(gè)訓(xùn)練過程的基礎(chǔ)。然而,醫(yī)學(xué)數(shù)據(jù)集的缺乏影響了實(shí)驗(yàn)研究的進(jìn)展。深度學(xué)習(xí)不需要人工手動(dòng)提取特征,可以自主提取時(shí)域、頻域和非線性特征,從而實(shí)現(xiàn)端到端的生理參數(shù)預(yù)測(cè)。但是,預(yù)測(cè)準(zhǔn)確性仍有待提高。
對(duì)于數(shù)據(jù)不足的問題,可以使用公開數(shù)據(jù)集來解決。充足的數(shù)據(jù)集可以促進(jìn)端到端生理參數(shù)預(yù)測(cè)方向的研究。此外,還可以加強(qiáng)在模型架構(gòu)上的研究,以提高模型的預(yù)測(cè)準(zhǔn)確性。由于PPG采集設(shè)備具有價(jià)格低廉、易攜帶等特點(diǎn),未來基于PPG穿戴設(shè)備會(huì)在日常疾病監(jiān)測(cè)和輔助醫(yī)療診斷方面廣泛應(yīng)用。
該文概括了基于PPG信號(hào)的生理參數(shù)預(yù)測(cè)算法的比較。盡管基于PPG的診斷方式已經(jīng)成為主要研究方向,并且有著較高的準(zhǔn)確率,但是仍然無法完全滿足臨床需求,這需要更加豐富的數(shù)據(jù)集作為支撐。數(shù)據(jù)集的收集來之不易,希望通過研究者的共同努力增加數(shù)據(jù)多樣性,滿足各種生理特征的研究。近些年來單一算法和多算法融合都取得不錯(cuò)的成績(jī),希望在未來研究人員能夠開發(fā)更不懼局限性的算法,將基于PPG信號(hào)的診斷方式變得更加通用化。