黃重宇
重慶交通大學(xué)機(jī)電與車輛工程學(xué)院,重慶 400074
由于人口老齡化和工作強(qiáng)度的增加,造成人體運(yùn)動(dòng)能力不足、肌肉萎縮乃至截肢等現(xiàn)象增加,而相關(guān)人群無法擁有正常的生活動(dòng)作能力。伴隨近年來可穿戴設(shè)備如外骨骼穿戴式機(jī)器人的發(fā)展,其通過感知人體的生物信號(hào)進(jìn)行模式識(shí)別,最終提供相應(yīng)輔助的能力,為人群恢復(fù)正常動(dòng)作能力提供了重要的幫助[1]。
表面肌電信號(hào)(surface electromyography,sEMG)是一種良好的能反應(yīng)人體肌肉活躍水平的生物電信號(hào),由于其蘊(yùn)含信息豐富和測(cè)量無侵入性的優(yōu)點(diǎn)受到模式識(shí)別領(lǐng)域廣大技術(shù)人員的關(guān)注?;趕EMG信號(hào)的模式識(shí)別最終目的在于為機(jī)器人提供控制源,使機(jī)器人感知人體運(yùn)動(dòng)趨勢(shì),為人體運(yùn)動(dòng)提供助力,精確的模式識(shí)別不僅可有效提高設(shè)備的助力能力,對(duì)實(shí)現(xiàn)柔順助力、促進(jìn)身體運(yùn)動(dòng)水平恢復(fù)也至關(guān)重要[2]。
雖然目前基于sEMG信號(hào)的模式識(shí)別方法有了不錯(cuò)的進(jìn)展,但現(xiàn)有的下肢動(dòng)作模式識(shí)別方法仍然存在動(dòng)作類別少、肌電信號(hào)數(shù)據(jù)量不足、特征融合冗余及分類器識(shí)別率低等問題[3]。本文針對(duì)以上問題,采集爬坡、上樓、下樓及平地行走4種動(dòng)作的下肢sEMG信號(hào),通過綜合考慮特征相關(guān)性和任務(wù)貢獻(xiàn)度,構(gòu)建了一組優(yōu)異的特征組合作為分類器的輸入,旨在有效提高動(dòng)作模式分類識(shí)別的精度與效率。
針對(duì)基于sEMG信號(hào)的下肢動(dòng)作模式識(shí)別研究中動(dòng)作類別不足的問題,本文采集了人體下肢4種動(dòng)作(爬坡、平地行走、上樓、下樓)的sEMG信號(hào)以進(jìn)行后續(xù)動(dòng)作模式識(shí)別特征融合方法研究。采用OT Bioelettronica表面肌電記錄設(shè)備采集受試者在運(yùn)動(dòng)過程中的股直肌(RF)、股外側(cè)肌(VL)、股內(nèi)側(cè)肌(VM)、股二頭肌(BF)、內(nèi)腓腸肌(MG)、外腓腸肌(LG)、脛骨前肌(TA)7塊肌肉[4]的肌電信號(hào),采樣頻率設(shè)置為2 048 Hz。受試者包括10名年輕受試者,年齡23~25周歲,身高156~185 cm,體質(zhì)量45~80 kg,均無過往病史。且每種動(dòng)作每人采集5~10組,每次組間休息3 min,以避免肌肉疲勞的影響,同時(shí)為了排除汗液的影響,在采集開始前使用酒精擦拭并待其自然風(fēng)干,以降低靜電干擾[5]。
sEMG信號(hào)是一種由神經(jīng)肌肉系統(tǒng)產(chǎn)生的微弱的生物電信號(hào),其幅值范圍在0~5 mV,頻率在0~500 Hz,主要能量集中在20~150 Hz[6],同時(shí)由于sEMG信號(hào)是一種具有隨機(jī)性且不平穩(wěn)的信號(hào),在采集過程中極易受到外界噪聲干擾,因此須對(duì)其進(jìn)行去噪處理。
對(duì)原始信號(hào)(見圖1)及其頻譜圖(見圖2)進(jìn)行分析,發(fā)現(xiàn)采集的sEMG信號(hào)能量主要集中在20~400 Hz且存在明顯基線漂移,所以對(duì)信號(hào)進(jìn)行20~400 Hz的巴特沃斯帶通濾波去噪處理,濾波效果如圖3所示,可以明顯觀察到原始sEMG信號(hào)的基線漂移問題得到了解決,且毛刺相對(duì)原始sEMG信號(hào)明顯減少,證明20~400 Hz的帶通濾波具有一定有效性。
圖1 原始sEMG信號(hào)
圖2 頻譜圖
圖3 濾波前后對(duì)比圖
目前常見的特征包括時(shí)域特征、頻域特征和時(shí)頻域特征等,而為了保證分類識(shí)別的實(shí)時(shí)性,應(yīng)該選擇計(jì)算耗時(shí)少的特征[7],因此本文僅對(duì)時(shí)域特征進(jìn)行分析,并采用重疊窗口[8]提取特征,窗口長(zhǎng)度選擇500,步長(zhǎng)選擇250,重疊部分為50%?,F(xiàn)提取以下時(shí)域特征進(jìn)行特征分析,其中定義xi表示sEMG信號(hào)中第i個(gè)樣本點(diǎn)的幅值,Ni為該時(shí)間窗內(nèi)的采樣點(diǎn)個(gè)數(shù),sgn(x)表示符號(hào)函數(shù)。
1.3.1 絕對(duì)平均值
sEMG信號(hào)的絕對(duì)平均值(MAV)反應(yīng)了肌肉的作用力大小,即:
(1)
1.3.2 均方根值
均方根值(RMS)能夠代表sEMG信號(hào)的有效值,反應(yīng)其高斯分布特性,即:
(2)
1.3.3 方差
sEMG信號(hào)的方差(VAR)反應(yīng)了sEMG信號(hào)幅值的變化程度,即:
(3)
1.3.4 過零點(diǎn)數(shù)
sEMG信號(hào)經(jīng)過零點(diǎn)的次數(shù)(ZC)反應(yīng)信號(hào)波動(dòng)的劇烈程度,即:
(4)
1.3.5 積分肌電值
積分肌電值(IEMG)大小反應(yīng)了肌肉的活動(dòng)程度。
(5)
1.3.6 波長(zhǎng)
波長(zhǎng)(WL)屬于信號(hào)的波形特征,反應(yīng)sEMG信號(hào)的振幅信息和波動(dòng)頻率信息,即:
(6)
1.3.7 斜率符號(hào)變化次數(shù)
sEMG信號(hào)的斜率變化次數(shù)(SSC)直接反應(yīng)sEMG信號(hào)的變化程度,即:
(7)
特征融合是將多種特征結(jié)合在一起,以實(shí)現(xiàn)從數(shù)據(jù)不同層面進(jìn)行綜合信息提取,形成一個(gè)更全面的特征表示方法。然而現(xiàn)有特征融合方法鮮有考慮特征之間的相關(guān)性以及特征對(duì)于任務(wù)的貢獻(xiàn)度,多是簡(jiǎn)單將不同特征直接拼接在一起,此種方法極易造成特征數(shù)據(jù)冗余、模型過擬合或計(jì)算資源浪費(fèi)。因此在本文中首先對(duì)已提取特征數(shù)據(jù)(各類別樣本數(shù)均為4 096)進(jìn)行斯皮爾曼相關(guān)系數(shù)計(jì)算來衡量相關(guān)性大小,計(jì)算公式如下所示。
(8)
式中:rs表示相關(guān)系數(shù),di表示每對(duì)特征數(shù)據(jù)的秩差,n表示樣本大小。其中相關(guān)系數(shù)大于0為正相關(guān);小于0為負(fù)相關(guān);越接近±1,代表量2組變量之間相關(guān)性越強(qiáng);越接近0代表2組變量相關(guān)性越弱。
由圖4特征相關(guān)性熱力圖可以看出,特征IEMG、MAV、RMS、VAR、WL之間相關(guān)性較高,而SSC、ZC與其相關(guān)性較低,因此只保留IEMG、MAV、RMS、VAR、WL中的1個(gè)特征,而對(duì)SSC和ZC暫時(shí)均保留。
圖4 特征相關(guān)性熱力圖
為了評(píng)估各特征在下肢動(dòng)作模式識(shí)別任務(wù)中的貢獻(xiàn)度,本文使用MATLAB搭建4種常見機(jī)器學(xué)習(xí)模型,包括決策樹、線性判別器、支持向量機(jī)及K近鄰,以4種模型的平均分類精度作為衡量特征任務(wù)貢獻(xiàn)度的指標(biāo),并在后續(xù)對(duì)比實(shí)驗(yàn)中使用該4種模型。
首先本文將各特征數(shù)據(jù)集及其標(biāo)簽進(jìn)行隨機(jī)打亂處理,按照8:2的比例劃分為訓(xùn)練集和測(cè)試集,訓(xùn)練集用于模型的訓(xùn)練和優(yōu)化,測(cè)試集用于評(píng)估模型的性能和泛化能力。為減少隨機(jī)誤差采用交叉驗(yàn)證的方法進(jìn)行多次實(shí)驗(yàn),以提高模型的分類穩(wěn)定性。平均分類精度如圖5所示。
圖5 特征精度圖
由圖5可知,特征貢獻(xiàn)度從大到小為:ZC>WL>MAV>IEMG>RMS>VAR>SSC。結(jié)合前述相關(guān)性結(jié)果最終選擇特征“ZC+WL”作為特征融合的結(jié)果。
為了說明特征有針對(duì)性融合的優(yōu)勢(shì)以及相比原始信號(hào)直接輸入模型的優(yōu)勢(shì),本文添加2個(gè)對(duì)照試驗(yàn),分別為使用原始信號(hào)(各類別樣本數(shù)為317 440)作為輸入以及將所有特征直接拼接融合作為輸入的試驗(yàn),其分類精度以及平均耗時(shí)如表1所示。
表1 分類精度及耗時(shí)
結(jié)果顯示:與單一特征輸入相比,A、B這2種特征融合均顯現(xiàn)了特征融合的優(yōu)勢(shì),不僅提高了分類精度,同時(shí)也增加了訓(xùn)練效率,確保了實(shí)時(shí)性。相較于直接將原始數(shù)據(jù)輸入模型,采用特征組合作為輸入不僅減少了數(shù)據(jù)量,降低了運(yùn)算時(shí)間,還提供了更有效的信息,顯著提高了分類精度。而相對(duì)于將所有特征直接拼接融合,通過從特征的相關(guān)性和任務(wù)貢獻(xiàn)度出發(fā),進(jìn)行特征篩選得到的最終特征組合集在分類精度上變化微小,同時(shí)大幅度減少了耗時(shí),既保證了精確性又保持了實(shí)時(shí)性。
本文提出了一種基于特征相關(guān)性和任務(wù)貢獻(xiàn)度的特征篩選方法,并在此基礎(chǔ)上實(shí)現(xiàn)了多特征融合的下肢動(dòng)作模式識(shí)別。首先采集爬坡、平地行走、上樓以及下樓4種動(dòng)作的下肢肌電信號(hào)作為實(shí)驗(yàn)數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行含噪分析和去噪處理,然后提取了實(shí)時(shí)性較高的時(shí)域特征。通過斯皮爾曼相關(guān)系數(shù)計(jì)算特征之間的相關(guān)性,刪除冗余特征以避免特征集合維度爆炸和模型過擬合,接著結(jié)合機(jī)器學(xué)習(xí)模型檢測(cè)特征對(duì)于任務(wù)的貢獻(xiàn)度,通過單一特征貢獻(xiàn)度進(jìn)一步篩選獲得最終的特征組合。試驗(yàn)結(jié)果表明,相較于傳統(tǒng)的單一特征和原始信號(hào),以及直接將所有特征拼接的方法,本文中的方法在分類精度和實(shí)時(shí)性方面均表現(xiàn)更優(yōu),可為特征篩選和多特征融合模式識(shí)別領(lǐng)域提供一定參考價(jià)值。