毛傳波 楊慶華 蔡世波 王志恒
(浙江工業(yè)大學(xué)特種裝備制造與先進(jìn)加工技術(shù)教育部/浙江省重點(diǎn)實(shí)驗(yàn)室 杭州 310023)
腦機(jī)接口是一項(xiàng)通過解碼人類大腦皮層產(chǎn)生的腦電信號(hào)去識(shí)別人的意圖,從而產(chǎn)生控制信號(hào)驅(qū)動(dòng)外部設(shè)備的技術(shù)。運(yùn)動(dòng)想象是其主要范式之一,它是基于人在進(jìn)行不同肢體運(yùn)動(dòng)的想象時(shí),腦電信號(hào)會(huì)在特定頻段產(chǎn)生不同的事件相關(guān)去同步(eventrelated desynchronization,ERD) 和事件相關(guān)同步(event-related synchronization,ERS)現(xiàn)象[1-3]。通過對(duì)受試者進(jìn)行一定時(shí)間的訓(xùn)練,采集其進(jìn)行運(yùn)動(dòng)想象時(shí)的腦電數(shù)據(jù),根據(jù)這些數(shù)據(jù)分析其ERD/ERS模式,得到該受試者特定的分類模型,接著就可以依靠該模型對(duì)后續(xù)的運(yùn)動(dòng)想象事件進(jìn)行分類識(shí)別[4]。
目前運(yùn)動(dòng)想象均是基于機(jī)器學(xué)習(xí)技術(shù)。傳統(tǒng)的機(jī)器學(xué)習(xí)模型一般是基于2 個(gè)假設(shè):(1)測試集和訓(xùn)練集相互獨(dú)立并且是同分布的;(2)有足量的已標(biāo)注數(shù)據(jù)。然而由于腦電信號(hào)微弱且變化大,每次實(shí)驗(yàn)的環(huán)境、電極位置等因素也無法保證完全一致,導(dǎo)致同一個(gè)受試者在不同時(shí)間的實(shí)驗(yàn)數(shù)據(jù)差異巨大,這違反了假設(shè)(1),因此在傳統(tǒng)機(jī)器學(xué)習(xí)框架下受試者過去采集的數(shù)據(jù)不可用。為了收集足量可用的標(biāo)注數(shù)據(jù),傳統(tǒng)上在每次實(shí)驗(yàn)之前都需要先進(jìn)行約30 min 的校準(zhǔn)實(shí)驗(yàn)[5],即使是經(jīng)驗(yàn)豐富的受試者也是如此。這個(gè)過程耗時(shí)又枯燥,無論對(duì)科研實(shí)驗(yàn)還是應(yīng)用推廣都是不小的阻礙。
為了減少校準(zhǔn)實(shí)驗(yàn)的耗時(shí),遷移學(xué)習(xí)技術(shù)被引入到運(yùn)動(dòng)想象當(dāng)中,主要包括跨時(shí)間和跨受試者2種形式。目標(biāo)受試者過去的數(shù)據(jù)以及其他受試者的數(shù)據(jù)所分布的領(lǐng)域稱為源域,目標(biāo)受試者的測試數(shù)據(jù)所分布的領(lǐng)域稱為目標(biāo)域。遷移學(xué)習(xí)的理念是盡量減小目標(biāo)域和源域數(shù)據(jù)的分布差異,使得跨域分類識(shí)別成為可能,從而降低對(duì)校準(zhǔn)數(shù)據(jù)的需求量,減短甚至取消校準(zhǔn)實(shí)驗(yàn)的耗時(shí)。
目前已有不少學(xué)者相繼提出他們的遷移學(xué)習(xí)方法,其中較為成功的包括Zanini 等人[6]提出的黎曼空間對(duì)齊(Riemannian-space alignment,RA)方法和He 等人[7]提出的歐氏空間對(duì)齊(Euclidean-space alignment,EA)方法。RA 算法首先求得一個(gè)參考矩陣,用此參考矩陣對(duì)每一個(gè)實(shí)驗(yàn)數(shù)據(jù)的協(xié)方差矩陣進(jìn)行對(duì)齊變換,使得變換后的協(xié)方差矩陣的黎曼均值為單位矩陣,這意味著源域和目標(biāo)域的數(shù)據(jù)中心得到重合,再配合使用最小黎曼距離(minimum distance to Riemannian mean,MDRM)分類器進(jìn)行跨域遷移識(shí)別。EA 算法同樣需要先獲得一個(gè)參考矩陣,不同之處在于它被直接用于歐氏空間實(shí)驗(yàn)數(shù)據(jù)的對(duì)齊,經(jīng)對(duì)齊變換后仍可以使用在歐氏空間中性能突出的共空間模式(common spatial pattern,CSP)[8-9]特征提取方法和線性判別分析(linear discriminant analysis,LDA)分類器。另外,Wang 等人[10]和Wu等人[11]還提出了基于獨(dú)立分量分析(independent component analysis,ICA)的零訓(xùn)練分類方法,該方法不依賴任何源域的數(shù)據(jù),直接依靠對(duì)ERD/ERS模式的先驗(yàn)知識(shí)對(duì)測試數(shù)據(jù)進(jìn)行分類。值得一提的是,ICA 作為一種盲源分離技術(shù),具有不需要數(shù)據(jù)標(biāo)簽就可以獲得良好空間濾波器的優(yōu)勢。上述方法都屬于無監(jiān)督算法。為了更進(jìn)一步匹配源域和目標(biāo)域,Rodrigues 等人[12]提出了黎曼普魯克分析(Riemannian Procrustes analysis,RPA)算法,該算法在RA 的基礎(chǔ)上,利用目標(biāo)域少量有標(biāo)簽數(shù)據(jù),對(duì)目標(biāo)域所有數(shù)據(jù)在黎曼空間進(jìn)行旋轉(zhuǎn)變換,使得目標(biāo)域和源域各類中心更相近。
為了進(jìn)一步提升遷移學(xué)習(xí)的分類正確率,本文提出一種基于獨(dú)立分量分析和普魯克分析的方法。首先,對(duì)每個(gè)受試者的腦電數(shù)據(jù)進(jìn)行ICA 空間濾波,以提高信噪比。其次,依據(jù)普魯克分析的思想,對(duì)比應(yīng)用多種對(duì)齊變換方法,實(shí)現(xiàn)對(duì)樣本數(shù)據(jù)的平移和縮放。并提出歐氏空間下的旋轉(zhuǎn)變換方法,以進(jìn)一步匹配源域和目標(biāo)域的數(shù)據(jù)分布。最后,將所提算法與多種算法進(jìn)行跨受試者和跨數(shù)據(jù)集的測試對(duì)比,驗(yàn)證方法的有效性。
為了有效對(duì)比驗(yàn)證各種算法的性能,采用具有豐富受試者和多種運(yùn)動(dòng)想象類型的PhysionetMI[13]數(shù)據(jù)集和BCI-IV-2a[14]數(shù)據(jù)集。其中PhysionetMI采用全部4 類想象動(dòng)作的數(shù)據(jù),而BCI-IV-2a 僅采用想象左手、右手和雙腳3 類數(shù)據(jù),以便于后續(xù)在該數(shù)據(jù)集上進(jìn)行跨數(shù)據(jù)集的對(duì)比測試。兩數(shù)據(jù)集的具體信息如表1 所示。
表1 數(shù)據(jù)集的詳細(xì)信息
獨(dú)立分量分析是一種盲源信號(hào)分離技術(shù)[15],對(duì)于n導(dǎo)腦電信號(hào)x=[x1,x2,…,xn]T,可以看成由n個(gè)獨(dú)立源信號(hào)s=[s1,s2,…,sn]T線性混疊而成,即:
其中A為混合矩陣,對(duì)應(yīng)的解混模型為
式中,y=[y1,y2,…,yn]T為源信號(hào)s的估計(jì),W為n×n的解混矩陣。W同時(shí)還可以看作空間濾波矩陣,每一個(gè)行向量是一個(gè)空間濾波器,其元素值是原始腦電信號(hào)x各通道信號(hào)的權(quán)重,y則為經(jīng)空間濾波的信號(hào),相比于原始腦電信號(hào)其各通道信號(hào)的信噪比得到了提高。
解混矩陣W的估計(jì)算法主要有Infomax、Jade、Sobi 和Fastica,研究表明[16-17]在腦電信號(hào)處理領(lǐng)域Infomax 算法效果最佳。但經(jīng)Infomax 算法解混得到的源估計(jì)信號(hào)的順序是不確定的,需要依賴人工去篩選運(yùn)動(dòng)相關(guān)成分,同時(shí)計(jì)算成本高昂。Wu 等人[11]提出的簡化Infomax 算法很好地解決了這些問題。首先該算法的計(jì)算量小,推薦的迭代次數(shù)為300 次;更為重要的是,經(jīng)測試由該算法得到的濾波矩陣W的對(duì)角線元素的絕對(duì)值總是所在行最大的。例如在第i行的所有元素中,第i個(gè)元素的絕對(duì)值是最大的,這意味著xi對(duì)yi的貢獻(xiàn)是最大的,因此可以認(rèn)為yi是對(duì)應(yīng)i通道的濾波信號(hào),也就是說經(jīng)該算法得到的濾波信號(hào)的順序與原信號(hào)是保持一致的。
在應(yīng)用簡化的Infomax 算法之前,首先對(duì)原始腦電數(shù)據(jù)進(jìn)行8~30 Hz 的5 階巴特沃斯帶通濾波預(yù)處理,以去除肌電、基線漂移等干擾,僅保留感興趣的mu 頻段[18]和beta 頻段[19]。然后將k個(gè)n×l的腦電數(shù)據(jù)首尾拼接成n×k·l的二維信號(hào),其中k代表數(shù)據(jù)個(gè)數(shù),n代表通道數(shù),l代表每通道的信號(hào)點(diǎn)數(shù)。利用拼接后數(shù)據(jù)應(yīng)用簡化的Infomax 算法得到濾波矩陣后,參數(shù)采用推薦的0.02 步長和300 迭代次數(shù),根據(jù)式(2)對(duì)原始腦電信號(hào)進(jìn)行空間濾波。
普魯克分析是一種用來分析形狀分布的統(tǒng)計(jì)方法,常用于人臉對(duì)齊[20-21]。普魯克分析的工作原理是首先從2 個(gè)不同的形狀分布中各選取一些特征點(diǎn),然后通過一些幾何變換使得兩邊對(duì)應(yīng)的特征點(diǎn)盡可能靠近,從而達(dá)到讓2 個(gè)形狀分布對(duì)齊的效果。
假設(shè)目標(biāo)域和源域選取的特征點(diǎn)集分別為
并假設(shè)存在一個(gè)線性變換關(guān)系,使得c對(duì)的特征點(diǎn)集都具有以下等式關(guān)系:
其中,a∈Rn代表對(duì)源域數(shù)據(jù)點(diǎn)的平移變換;s∈R代表對(duì)源域數(shù)據(jù)點(diǎn)的縮放變換;Q∈Rn×n是一個(gè)正交矩陣,代表對(duì)源域數(shù)據(jù)點(diǎn)的旋轉(zhuǎn)變換。經(jīng)過以上變換后源域的特征點(diǎn)就和目標(biāo)域的特征點(diǎn)重合,普魯克分析的目標(biāo)就是求解a、s和Q。
依照普魯克分析的思想,可以對(duì)運(yùn)動(dòng)想象腦電數(shù)據(jù)做一定的平移、縮放和旋轉(zhuǎn)變換,使得源域和目標(biāo)域數(shù)據(jù)的分布盡量接近,進(jìn)而實(shí)現(xiàn)遷移分類識(shí)別。根據(jù)需要標(biāo)簽與否將變換處理分為對(duì)齊變換和旋轉(zhuǎn)變換2 個(gè)過程。對(duì)齊變換不需要樣本的標(biāo)簽,本文測試對(duì)比了通道歸一化(channel normalization,CN)、歐氏空間對(duì)齊和黎曼空間對(duì)齊3 種方法。旋轉(zhuǎn)變換需要利用樣本的標(biāo)簽,將源域每個(gè)受試者的數(shù)據(jù)向目標(biāo)域旋轉(zhuǎn)。
1.4.1 通道歸一化
對(duì)于平移和縮放變換最直觀的做法就是歸一化處理,首先是對(duì)第i個(gè)數(shù)據(jù)的第j個(gè)通道提取方差的對(duì)數(shù)作為特征:
其中yij代表ICA 濾波后第i個(gè)數(shù)據(jù)的第j個(gè)通道的腦電信號(hào),接著對(duì)每一維特征零均值化:
最后對(duì)每一維特征做歸一化:
經(jīng)過通道歸一化處理后,每個(gè)受試者數(shù)據(jù)的每一維特征都分布在零點(diǎn)附近,且與零點(diǎn)的平均距離為1,這樣源域和目標(biāo)域就得到了對(duì)齊。
1.4.2 歐氏空間對(duì)齊
相對(duì)于通道歸一化對(duì)每一維特征分別做平移和縮放,歐氏空間對(duì)齊[7]方法則是直接對(duì)整個(gè)數(shù)據(jù)n×l個(gè)數(shù)據(jù)點(diǎn)做對(duì)齊變換。
首先計(jì)算樣本數(shù)據(jù)的協(xié)方差矩陣:
其中yi代表ICA 濾波后第i個(gè)數(shù)據(jù)點(diǎn),T 代表矩陣轉(zhuǎn)置。
然后求得平均協(xié)方差矩陣:
接著是對(duì)每個(gè)樣本點(diǎn)做對(duì)齊變換:
經(jīng)過歐式空間對(duì)齊變換后,所有數(shù)據(jù)點(diǎn)的平均協(xié)方差矩陣為
即所有受試者數(shù)據(jù)的平均協(xié)方差矩陣都是單位矩陣,源域和目標(biāo)域得到了對(duì)齊。
同樣地,提取對(duì)齊后數(shù)據(jù)方差的對(duì)數(shù)作為特征:
1.4.3 黎曼空間對(duì)齊
黎曼空間對(duì)齊[6]與歐氏空間對(duì)齊的區(qū)別在于平均協(xié)方差矩陣的求解,EA 計(jì)算的是算術(shù)平均值,而RA 計(jì)算的是幾何平均值。首先是協(xié)方差矩陣之間黎曼距離的定義:
式(14)的含義是尋找一個(gè)參考矩陣,它到所有數(shù)據(jù)點(diǎn)的平均黎曼距離最小,這里采用Matlab 的covariance toolbox 進(jìn)行計(jì)算求解。
得到參考矩陣后同樣依照式(10)對(duì)數(shù)據(jù)點(diǎn)做對(duì)齊變換,變換后所有協(xié)方差矩陣樣本的黎曼均值為單位矩陣,源域和目標(biāo)域在黎曼空間得到了對(duì)齊。
最后提取特征:
1.4.4 分組對(duì)齊
需要注意的是,不僅不同受試者之間數(shù)據(jù)分布存在差異,同一個(gè)受試者不同組次之間的數(shù)據(jù)分布也可能存在一定差異。例如PhysionetMI 數(shù)據(jù)集的受試者S040,其樣本數(shù)據(jù)經(jīng)過通道歸一化后,采用t-SNE 降至二維,結(jié)果如圖1(a)所示,同一組次的數(shù)據(jù)具有明顯的聚集性,不同組次間數(shù)據(jù)分布差異顯著。而如果以組次為單位分別做通道歸一化,結(jié)果如圖1(b)所示,數(shù)據(jù)的分布將會(huì)均勻許多,本文將這種處理方式稱為分組對(duì)齊。
圖1 受試者S040 整體對(duì)齊和分組對(duì)齊下數(shù)據(jù)分布
經(jīng)過上述對(duì)齊變換和特征提取,每個(gè)受試者數(shù)據(jù)集合可以表示為
分別表示目標(biāo)域和源域的樣本集合。并假設(shè)目標(biāo)域部分樣本的標(biāo)簽和源域所有樣本的標(biāo)簽是已知的,用Tl表示目標(biāo)域有標(biāo)簽的樣本集合,Tu代表目標(biāo)域沒有標(biāo)簽的樣本集合,那么T=Tl∪Tu。分別對(duì)S和Tl求得不同類別的類中心:
這是一個(gè)正交普魯克問題[20],存在解析解,根據(jù)奇異值分解定理,可以得到:
那么所求旋轉(zhuǎn)矩陣的解為
利用得到的旋轉(zhuǎn)矩陣對(duì)集合S的數(shù)據(jù)點(diǎn)做旋轉(zhuǎn)變換:
根據(jù)對(duì)齊變換的算法選擇不同,提出以下3 種遷移學(xué)習(xí)策略。
(1) 算法1 對(duì)ICA 空間濾波后數(shù)據(jù)采用CN 算法分組對(duì)齊,對(duì)源域每個(gè)受試者的數(shù)據(jù)做旋轉(zhuǎn)變換,Tl和S作為訓(xùn)練集,Tu作為測試集,采用LDA 分類器做遷移學(xué)習(xí)分類。
(2) 算法2 對(duì)ICA 空間濾波后數(shù)據(jù)采用EA 算法分組對(duì)齊,對(duì)源域每個(gè)受試者的數(shù)據(jù)做旋轉(zhuǎn)變換,Tl和S作為訓(xùn)練集,Tu作為測試集,采用LDA 分類器做遷移學(xué)習(xí)分類。
(3) 算法3 對(duì)ICA 空間濾波后數(shù)據(jù)采用RA 算法分組對(duì)齊,對(duì)源域每個(gè)受試者的數(shù)據(jù)做旋轉(zhuǎn)變換,Tl和S作為訓(xùn)練集,Tu作為測試集,采用LDA 分類器做遷移學(xué)習(xí)分類。
為了對(duì)比驗(yàn)證所提算法的有效性,對(duì)以下4 種算法的分類性能進(jìn)行測試。
(1) 基準(zhǔn)算法1 對(duì)ICA 空間濾波后數(shù)據(jù)提取特征,Tl作為訓(xùn)練集,Tu作為測試集,采用最小距離分類器(訓(xùn)練集樣本數(shù)量較少時(shí)采用LDA 分類將產(chǎn)生奇異值)做傳統(tǒng)機(jī)器學(xué)習(xí)分類。
(2) 基準(zhǔn)算法2 對(duì)帶通濾波后數(shù)據(jù)提取協(xié)方差矩陣,Tl作為訓(xùn)練集,Tu作為測試集,采用MDRM分類器做傳統(tǒng)機(jī)器學(xué)習(xí)分類。
(3) RA-MDRM 對(duì)帶通濾波后數(shù)據(jù)提取協(xié)方差矩陣,采用RA 算法進(jìn)行對(duì)齊,S作為訓(xùn)練集,Tu作為測試集,采用MDRM 分類器做無監(jiān)督遷移學(xué)習(xí)分類。
(4) RPA-MDRM 對(duì)帶通濾波后數(shù)據(jù)提取協(xié)方差矩陣,采用RPA 算法進(jìn)行對(duì)齊變換,Tl和S作為訓(xùn)練集,Tu作為測試集,采用MDRM 分類器做半監(jiān)督遷移學(xué)習(xí)分類。
針對(duì)多分類問題,采用kappa 值作為性能指標(biāo):
其中,p0代表分類正確率,pe代表隨機(jī)概率。
為了驗(yàn)證算法的有效性,采用留一法,對(duì)每個(gè)受試者重復(fù)10 次隨機(jī)劃分?jǐn)?shù)據(jù)集,每類取N個(gè)樣本作為訓(xùn)練集,剩余樣本作為測試集,所有其他受試者的樣本同樣用作訓(xùn)練集。對(duì)于PhysionetMI 數(shù)據(jù)集,選取運(yùn)動(dòng)區(qū)FC5、FC3、FC1、FCz、FC2、FC4、FC6、C5、C3、C1、Cz、C2、C4、C6、CP5、CP3、CP1、CPz、CP2、CP4和CP6 這21 個(gè)通道對(duì)應(yīng)的特征用于分類。需要注意的是,該數(shù)據(jù)集在ICA 空間濾波和普魯克對(duì)齊變換階段都是使用全部64 通道的數(shù)據(jù)。對(duì)于BCI-IV-2a 數(shù)據(jù)集,使用全部22 通道的特征用于分類。
在PhysionetMI 上各種算法的平均kappa 值結(jié)果如表2 所示,兩兩算法之間的t檢驗(yàn)結(jié)果如圖2所示。圖中黑色方塊代表所在行的算法顯著優(yōu)于所在列的算法,白色方塊代表無顯著差異,顯著性水平為0.05??梢钥吹?在已知樣本量較小(N<15)的情況下,傳統(tǒng)機(jī)器學(xué)習(xí)算法的分類性能較差,甚至劣于無監(jiān)督算法。所提出的3 種算法在所有的N取值下均顯著優(yōu)于其他4 種算法,3 種算法之間的表現(xiàn)差異不大,僅在N=5 時(shí)算法3 相比算法2 具有顯著性優(yōu)勢。從平均結(jié)果上看,算法3 是最優(yōu)的,在N=5、10 和15 時(shí),相比基準(zhǔn)算法1 提升了0.09、0.11和0.11,相比RA-MDRM 提升了0.04、0.08 和0.09,相比RPA-MDRM 提升了0.08、0.09 和0.08。
圖2 PhysionetMI 上各種算法之間的t 檢驗(yàn)結(jié)果
表2 PhysionetMI 上各種算法跨受試者平均kappa 值
在BCI-IV-2a 上各種算法的平均kappa 值結(jié)果如表3 所示。結(jié)果表明,算法1 的表現(xiàn)較差,甚至低于基準(zhǔn)算法1,算法2 和算法3 的分類結(jié)果相近,相比其他算法具有明顯提升。在已知樣本量極少的情況下(N≤5),無監(jiān)督算法仍具有優(yōu)勢。RPA-MDRM相比基準(zhǔn)算法2 也有一定程度的提升,證明基于黎曼普魯克分析的半監(jiān)督算法確實(shí)能在小樣本量下提高分類性能。整體來看仍是算法3 最優(yōu),在N=5、10、15 和20 時(shí),相比基準(zhǔn)算法1 提升了0.03、0.02、0.04 和0.04,相比RA-MDRM 提升了0.01、0.05、0.09和0.1,相比RPA-MDRM 提升了0.02、0.02、0.05和0.05。
表3 BCI-IV-2a 上各種算法跨受試者平均kappa 值
2.1 節(jié)結(jié)果證明了所提算法在跨受試者遷移學(xué)習(xí)的有效性,但其應(yīng)用前提條件是已有一定數(shù)量其他受試者的樣本數(shù)據(jù),如能夠利用其他數(shù)據(jù)集實(shí)施遷移學(xué)習(xí),將有效規(guī)避這個(gè)問題。為了測試各種算法跨數(shù)據(jù)集遷移學(xué)習(xí)的表現(xiàn),以具有大量受試者的PhysionetMI 為訓(xùn)練集,BCI-IV-2a 為測試集。為了適配BCI-IV-2a,對(duì)PhysionetMI 提取左手、右手和雙腳3 類樣本數(shù)據(jù),通道數(shù)也降至對(duì)應(yīng)的22 通道。結(jié)果如表4 所示,RA-MDRM 和所提出的3 種算法與跨受試者的結(jié)果相當(dāng),算法3 整體上有略微的提升,證明了所提算法跨數(shù)據(jù)集遷移學(xué)習(xí)的可行性。值得注意的是,RPA-MDRM 算法在跨數(shù)據(jù)集的測試中具有明顯的提升,相比跨受試者的平均kappa 值,在N=5、10、15 和20 時(shí)分別提升了0.04、0.06、0.07 和0.08,整體上比算法3 提升了0.02。
表4 BCI-IV-2a 上各種算法跨數(shù)據(jù)集平均kappa 值
圖3 給出了N=20 時(shí)各受試者的kappa 值,可以明顯看到,各種算法的測試結(jié)果均與基準(zhǔn)算法呈正相關(guān),說明每個(gè)受試者數(shù)據(jù)質(zhì)量本身決定了可區(qū)分性的上限,不同算法分類性能的優(yōu)劣更多在于針對(duì)不同受試者的泛化能力。例如無監(jiān)督算法RAMDRM,其測試結(jié)果的隨機(jī)性最高,對(duì)受試者S5 具有最好的表現(xiàn),對(duì)受試者S2 的結(jié)果卻小于0(分類正確率低于隨機(jī)值)。原因在于每個(gè)個(gè)體存在特殊性,與所有個(gè)體的平均表現(xiàn)存在差異,無監(jiān)督算法無法應(yīng)對(duì)這種差異。RPA-MDRM 與RA-MDRM 的區(qū)別在于多了一步旋轉(zhuǎn)變換操作,它考慮了每個(gè)個(gè)體的特殊性,利用其少量有標(biāo)簽數(shù)據(jù)將該個(gè)體與其他個(gè)體數(shù)據(jù)分布進(jìn)一步旋轉(zhuǎn)對(duì)齊,擴(kuò)充了訓(xùn)練集,從而得到較基準(zhǔn)算法2 更高的分類精度。算法3 對(duì)每個(gè)受試者的測試結(jié)果均優(yōu)于基準(zhǔn)算法1,展示出了良好的泛化能力。
圖3 N=20 時(shí)各受試者kappa 值
表5 給出了N=20 時(shí)RPA-MDRM 和算法3 為每個(gè)受試者訓(xùn)練模型及分類的平均耗時(shí),測試環(huán)境為Matlab R2021a,硬件配置為Intel(R) Core(TM)i7-11800H@2.30 GHz,2.30 GHz,16 GB RAM。從跨受試者到跨數(shù)據(jù)集,隨著訓(xùn)練集的擴(kuò)大2 種算法的平均耗時(shí)均明顯增大,而所提算法3 的計(jì)算效率分別是RPA-MDRM 的194 倍和153 倍。究其原因,算法3 無論是旋轉(zhuǎn)矩陣的求解或是LDA 分類模型的訓(xùn)練,其內(nèi)部的數(shù)學(xué)過程都存在解析解,計(jì)算效率高。相比之下基于黎曼框架的RPA-MDRM 無論是旋轉(zhuǎn)矩陣的求解還是黎曼均值的計(jì)算都依賴于數(shù)值計(jì)算方法,需要大量的迭代運(yùn)算,計(jì)算成本高昂。
表5 N=20 時(shí)RPA-MDRM 和算法3 平均運(yùn)算耗時(shí)
對(duì)比所提的3 種方法,它們的差別僅在于數(shù)據(jù)的對(duì)齊變換環(huán)節(jié),在計(jì)算成本上相差無幾,而在分類性能上算法1 最差,算法3 略優(yōu)于算法2。也就是說RA 算法最優(yōu),EA 算法次之,CN 算法最差,這與現(xiàn)有文獻(xiàn)[22]的測試結(jié)果相符。分析其中的原因,CN 算法將單個(gè)樣本的數(shù)據(jù)按照不同的通道割裂開來,每個(gè)通道提取頻帶能量作為特征單獨(dú)考慮,忽視了各通道信號(hào)之間的聯(lián)系。雖然信號(hào)事先經(jīng)過了ICA 空間濾波,但所采用的算法是簡化的Infomax 算法,并不保證濾波后各通道信號(hào)之間完全的獨(dú)立性,僅僅是提高了信號(hào)的信噪比。而EA 與RA 算法是對(duì)樣本數(shù)據(jù)的協(xié)方差矩陣進(jìn)行整體操作的,EA 保證了對(duì)齊后所有數(shù)據(jù)的協(xié)方差矩陣算術(shù)平均值為單位矩陣,RA 保證了對(duì)齊后所有數(shù)據(jù)的協(xié)方差矩陣幾何平均值為單位矩陣。對(duì)比發(fā)現(xiàn),3 種方法不是對(duì)樣本數(shù)據(jù)本身做對(duì)齊變換,都是做了一定的降維處理,前者提取頻帶能量,后者提取協(xié)方差矩陣。協(xié)方差矩陣相比頻帶能量蘊(yùn)含更豐富的信息,其對(duì)角線上元素是各個(gè)通道信號(hào)的方差,這就相當(dāng)于頻帶能量,而其他元素是不同通道信號(hào)之間的協(xié)方差,這蘊(yùn)含了空間信息[23],也是CN 算法所忽視的部分。EA 和RA 的作用原理是相似的,只是前者是在歐氏空間,后者是在黎曼空間,協(xié)方差矩陣作為對(duì)稱正定矩陣屬于黎曼光滑流形[6],在黎曼空間上進(jìn)行處理更有優(yōu)勢。
本文提出基于獨(dú)立分量分析和普魯克分析的運(yùn)動(dòng)想象遷移學(xué)習(xí)策略,對(duì)運(yùn)動(dòng)想象信號(hào)應(yīng)用獨(dú)立分量分析和對(duì)齊變換算法,得到經(jīng)過初步對(duì)齊的特征向量,將歐氏空間下的普魯克分析引入腦電信號(hào)處理領(lǐng)域,針對(duì)性設(shè)計(jì)了旋轉(zhuǎn)變換策略以進(jìn)一步匹配源域和目標(biāo)域,從而實(shí)現(xiàn)有效的遷移學(xué)習(xí)。所提出的算法無論是在計(jì)算效率還是在分類性能上均優(yōu)于基于黎曼框架的遷移學(xué)習(xí)算法,在目標(biāo)域已知標(biāo)簽樣本量較少的情況下相比傳統(tǒng)機(jī)器學(xué)習(xí)具有顯著提高,這有助于降低對(duì)校準(zhǔn)數(shù)據(jù)量的需求,從而有效減少校準(zhǔn)實(shí)驗(yàn)的耗時(shí)。并且在跨數(shù)據(jù)集的測試中保持著良好的表現(xiàn),顯示其不對(duì)已有數(shù)據(jù)的依賴,這有利于算法的推廣應(yīng)用。未來將繼續(xù)探索將所提方法應(yīng)用于在線分類識(shí)別的可能。