• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于多源域遷移學(xué)習(xí)的腦電情感識(shí)別

    2020-07-20 06:16:10婁曉光陳蘭嵐宋振振
    關(guān)鍵詞:源域特征選擇相似性

    婁曉光,陳蘭嵐,宋振振

    (華東理工大學(xué) 信息科學(xué)與工程學(xué)院 化工過程先進(jìn)控制和優(yōu)化技術(shù)教育部重點(diǎn)實(shí)驗(yàn)室,上海 200237)

    0 引 言

    情感智能[1]是人與人之間交流過程中不可或缺的一部分,情感狀態(tài)識(shí)別是情感研究工作中的核心內(nèi)容。相較于其它方法,腦電信號(hào)靈敏度較高,能夠無視被試的情感偽裝,能直接反映與情感變化相關(guān)的大腦內(nèi)在狀態(tài),因此越來越受到研究者的青睞。Li Mi等[2]提取腦電5個(gè)頻帶的能量信息作為特征,計(jì)算不同頻帶下導(dǎo)聯(lián)與情感的相關(guān)性,分析得出與情感狀態(tài)強(qiáng)相關(guān)的腦區(qū)與頻帶。

    傳統(tǒng)的機(jī)器學(xué)習(xí)中要求訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)必須服從獨(dú)立同分布的約束條件,然而腦電信號(hào)存在很強(qiáng)的個(gè)體差異性,不同被試即使表達(dá)相同情感對(duì)應(yīng)產(chǎn)生的腦電特征也不盡相同,而遷移學(xué)習(xí)放寬了訓(xùn)練數(shù)據(jù)和測(cè)試數(shù)據(jù)服從獨(dú)立同分布的限制[3],所以利用遷移學(xué)習(xí)可將從先前被試身上學(xué)到的知識(shí)或模式應(yīng)用到另一個(gè)新被試上,挖掘出源域被試和目標(biāo)被試間共享的信息,最終構(gòu)建適應(yīng)目標(biāo)被試數(shù)據(jù)分布的模型。

    對(duì)于單源域遷移學(xué)習(xí),如果領(lǐng)域間的相關(guān)性較低,直接遷移可能會(huì)產(chǎn)生負(fù)遷移現(xiàn)象[4],并且在進(jìn)行跨被試情感識(shí)別時(shí)往往存在多個(gè)源域被試數(shù)據(jù),因此可以利用多源域遷移學(xué)習(xí)來彌補(bǔ)單源域遷移學(xué)習(xí)的不足。目前鮮有文獻(xiàn)從樣本和特征兩個(gè)層面對(duì)待遷移的多源域數(shù)據(jù)進(jìn)行優(yōu)化的報(bào)道,本文提出用多源域選擇(multi-source domain selection,MDS)與遷移特征選擇(transfer feature selection,TFS)相結(jié)合的方式得到適宜遷移的數(shù)據(jù),在此基礎(chǔ)上利用基于適配正則化線性回歸的遷移學(xué)習(xí)算法[5](adaptation regularization regularized least squares,ARRLS)對(duì)跨被試的情感數(shù)據(jù)進(jìn)行建模。

    1 情感識(shí)別總體框架

    針對(duì)多源域遷移學(xué)習(xí)問題,一種做法是將所有源域合并為一個(gè)大源域,另一種做法是將每個(gè)源域單獨(dú)考慮,訓(xùn)練多個(gè)子模型并將之集成。前者忽略了不同源域間的差異性導(dǎo)致建立的模型性能較差,后者需要建立多個(gè)遷移模型,往往計(jì)算時(shí)間過長(zhǎng),且其中存在與目標(biāo)域相似度較低的源域個(gè)體,其模型在集成過程中會(huì)影響總體的識(shí)別精度。因此多源域數(shù)據(jù)的優(yōu)化選擇及集成學(xué)習(xí)是一個(gè)值得研究的問題。Liu等[6]在全局層面將不同域視為一個(gè)整體并縮小源域與目標(biāo)域間的差異,在局部層面分析不同域間的關(guān)系以最大化分類性能。K Vogt等[7]對(duì)多個(gè)源域賦予不同權(quán)重,使模型合理利用源域間的信息,以促進(jìn)目標(biāo)域的學(xué)習(xí)。

    本文構(gòu)建的情感識(shí)別模型如圖1所示。首先對(duì)原始信號(hào)濾波并提取差分熵特征[8],其次利用MDS-TFS-ARRLS算法構(gòu)建情感識(shí)別模型。該模型的構(gòu)建分為4個(gè)步驟,前兩步主要解決“什么樣的知識(shí)適合于遷移”的問題,即對(duì)待遷移的多源域數(shù)據(jù)進(jìn)行優(yōu)化;后兩步主要解決“知識(shí)如何遷移”的問題,即采用合適的遷移學(xué)習(xí)及集成學(xué)習(xí)算法。第一步利用多源域選擇算法(MDS)全面度量目標(biāo)域與其對(duì)應(yīng)的各個(gè)源域的相似性大小,從多個(gè)源域中過濾掉可能會(huì)導(dǎo)致負(fù)遷移現(xiàn)象的部分源域,保留最優(yōu)的源域集合,降低僅用單一源域數(shù)據(jù)進(jìn)行遷移帶來的風(fēng)險(xiǎn),同時(shí)節(jié)約計(jì)算成本;第二步利用遷移特征選擇算法(TFS)從多個(gè)源域中尋找共同有效的特征子集,增強(qiáng)特征推廣性,從而使數(shù)據(jù)具有更好的遷移能力;第三步利用適配正則化線性回歸算法(ARRLS)構(gòu)建多個(gè)遷移學(xué)習(xí)模型,最后根據(jù)每個(gè)模型所對(duì)應(yīng)的源域與目標(biāo)域間的相似性大小分別賦予其不同權(quán)重建立集成遷移學(xué)習(xí)模型。

    下面對(duì)MDS-TFS-ARRLS算法中各個(gè)環(huán)節(jié)分別進(jìn)行介紹。

    圖1 情感識(shí)別模型總體框架

    2 算法介紹

    2.1 多源域選擇算法(MDS)

    本文提出了一種多源域選擇算法(multi-source domain selection,MDS),該算法目的在于通過領(lǐng)域間相似性的度量,從多個(gè)源域中篩選出與目標(biāo)域較為相似的源域集合??紤]到僅從域-域?qū)用娑攘肯嗨菩跃哂衅嫘?,因此該算法又從樣?域?qū)用娑攘肯嗨菩源笮?。MDS算法首先計(jì)算域-域和樣本-域兩個(gè)層面的相似性,然后將這兩個(gè)層面的相似性值組成源域和目標(biāo)域的聯(lián)合相似度矩陣,并使用K-means算法對(duì)聯(lián)合相似度進(jìn)行聚類,自適應(yīng)選取最優(yōu)源域集合。其中,域-域相似性是基于領(lǐng)域間整體均值的差異,樣本-域相似性是基于所有目標(biāo)域樣本到源域的距離之和。MDS算法的計(jì)算過程如圖2所示,下面分別對(duì)相似性的計(jì)算和最優(yōu)源域集合的選取做出介紹。

    圖2 MDS算法流程

    2.1.1 域-域相似性計(jì)算

    領(lǐng)域間整體數(shù)據(jù)差異在于兩者概率分布的不同導(dǎo)致數(shù)據(jù)分布的不同,常用的概率分布距離度量函數(shù)有相對(duì)熵[9]、布雷格曼散度[10]和最大均值差異(maximum mean discre-pancy,MMD)[11]。前兩種方法計(jì)算通常需要估計(jì)其分布密度,而最大均值差異可以用不同領(lǐng)域在無限維核空間中的均值差異來近似,計(jì)算相對(duì)簡(jiǎn)單且效率高,因此該方法的使用最為廣泛。本文采用MMD將源域和目標(biāo)域數(shù)據(jù)嵌入到共享的可再生希爾伯特空間中,在該空間中兩者間的均值差異代表相似度大小。MMD計(jì)算值越大代表領(lǐng)域間相似性越大。

    (1)

    (2)

    其中,Ki,j=〈φ(xi),φ(xj)〉, 本文中采用線性核。L矩陣可由式(3)求得

    (3)

    2.1.2 樣本-域相似性計(jì)算

    (4)

    (5)

    2.1.3 聯(lián)合相似性度量及聚類

    (6)

    本文利用K-means算法對(duì)相似度特征聚類,并將聚類數(shù)K取為2、3、5來分別確定其不同大小的最優(yōu)源域集合。并進(jìn)一步根據(jù)相似度向量的模值大小計(jì)算最優(yōu)源域集合中每個(gè)源域的權(quán)重ωm。ωm計(jì)算公式如下

    (7)

    2.2 遷移特征選擇算法(TFS)

    為了進(jìn)一步降低后續(xù)遷移學(xué)習(xí)的計(jì)算成本、提高識(shí)別精度,本文使用遷移特征選擇算法篩選出適宜遷移的特征子集,該算法由兩個(gè)階段組成,其計(jì)算流程如圖3所示。

    圖3 TFS算法流程

    首先計(jì)算源域中每個(gè)特征對(duì)應(yīng)的Fisher Score[13]值,F(xiàn)isher Score屬于過濾型特征選擇算法,具有計(jì)算速度快適用性強(qiáng)的優(yōu)點(diǎn)。該算法通過度量樣本中類間散度與類內(nèi)散度的關(guān)系,判斷特征與類別標(biāo)簽間的相關(guān)性。本文根據(jù)Fisher Score準(zhǔn)則選取具有鑒別力的特征集合。Fisher Score的計(jì)算公式如下

    (8)

    其中,C為樣本類別數(shù),特征fi的平均值為μi,nj為第j類樣本個(gè)數(shù),μij和σij為第j類樣本特征fi的平均值與標(biāo)準(zhǔn)差。

    遷移特征選擇算法第二部分通過衡量特征與域標(biāo)簽之間的相關(guān)性來選取源域與目標(biāo)域之間更具一致性的特征。通常特征選擇利用互信息來定義特征與類別標(biāo)簽間的相關(guān)性[14],本文通過互信息來衡量特征與域標(biāo)簽之間的相關(guān)性,源域數(shù)據(jù)標(biāo)簽為S,目標(biāo)域數(shù)據(jù)標(biāo)簽為T。常用的相關(guān)性度量方法有Pearson相關(guān)系數(shù)和Spearman相關(guān)系數(shù),但上述兩種方法只能度量變量間的線性關(guān)系,而互信息可以衡量非線性關(guān)系,并且對(duì)噪聲信號(hào)具有很好的魯棒性。此外,Pearson和Spearman相關(guān)系數(shù)的計(jì)算要求源域和目標(biāo)域樣本具有相同的實(shí)驗(yàn)采集順序,而利用互信息沒有該限制?;バ畔⒅翟酱蟠韮山M變量越相關(guān),因此互信息值I(fi) 越小代表特征fi與域標(biāo)簽間的相關(guān)性越小,則在該特征表示下,領(lǐng)域間的差異較小。樣本x, y的概率密度與聯(lián)合概率密度計(jì)算互信息

    (9)

    圖4為利用互信息計(jì)算特征與域標(biāo)簽相關(guān)性示意圖,根據(jù)每個(gè)特征互信息的值對(duì)其排序,選取相關(guān)性較小的部分特征組成最終特征集合,該特征集合不僅具有良好的可分性,且能夠更好地反映出源域與目標(biāo)域數(shù)據(jù)間的共享信息。

    圖4 特征與域標(biāo)簽相關(guān)性計(jì)算

    2.3 適配正則化線性回歸算法(ARRLS)

    遷移學(xué)習(xí)根據(jù)遷移的方式不同可分為:基于實(shí)例遷移、基于特征遷移、基于參數(shù)遷移和基于相關(guān)知識(shí)遷移。本文采用一種基于特征的遷移學(xué)習(xí)——適配正則化線性回歸算法(ARRLS)[5],該算法同步優(yōu)化結(jié)構(gòu)風(fēng)險(xiǎn)泛函、聯(lián)合分布距離、流形不一致性等學(xué)習(xí)準(zhǔn)則[4],同時(shí)能夠縮小領(lǐng)域間的數(shù)據(jù)結(jié)構(gòu)差異。其學(xué)習(xí)框架如式(10)所示

    (10)

    3 實(shí)驗(yàn)及結(jié)果分析

    3.1 實(shí)驗(yàn)數(shù)據(jù)

    實(shí)驗(yàn)環(huán)境:Intel(R) Core(TM) i7-8750H CPU @2.20 GHz,8 G內(nèi)存,64位Windows10系統(tǒng),算法的實(shí)現(xiàn)采用64位MATLAB R2016b。

    本文以公開數(shù)據(jù)集SEED(SJTU Emotion EEG dataset)作為研究對(duì)象。根據(jù)國(guó)際10-20系統(tǒng),使用62個(gè)通道的ESI-NeuroScan系統(tǒng)記錄腦電信號(hào),采樣頻率為1000 Hz。該數(shù)據(jù)集了記錄了15名被試(包括7名男性8名女性)觀看不同類型視頻片段所采集的腦電數(shù)據(jù)。每名被試參加3次實(shí)驗(yàn),時(shí)間間隔約為1周,共得到45組測(cè)試數(shù)據(jù)。被試觀看的視頻片段共分為3個(gè)不同情感類別,分別為Positive,Neutral,Negative[15],每次實(shí)驗(yàn)過程中視頻開始前有一個(gè)5 s提示,表示視頻的開始,視頻結(jié)束后會(huì)有45 s的自我評(píng)估,最后有15 s的休息時(shí)間,觀看時(shí)長(zhǎng)約為4 min。

    本文取每名被試第1次實(shí)驗(yàn)所得的15組實(shí)驗(yàn)數(shù)據(jù)作為分析使用。將初始腦電信號(hào)降采樣至200 Hz,并將每1 s的實(shí)驗(yàn)數(shù)據(jù)作為一個(gè)樣本,最終每名被試數(shù)據(jù)可得到3394個(gè)樣本。在5個(gè)頻帶上(delta:1 Hz-3 Hz, theta:4 Hz-7 Hz, alpha:8 Hz-13 Hz, beta:14 Hz-30 Hz, gamma:31 Hz-50 Hz)分別提取腦電信號(hào)的差分熵特征[11],因此,每個(gè)樣本共有5×62(頻帶×導(dǎo)聯(lián))=310維特征。其中差分熵的計(jì)算公式如下所示

    (11)

    其中,t表示來自EEG信號(hào)的子帶信號(hào),設(shè)該信號(hào)服從高斯分布N(μ,σ2)。 文獻(xiàn)[16]中證明原始觀測(cè)信號(hào)經(jīng)過帶通濾波后,其子帶信號(hào)的時(shí)間序列大致遵循高斯分布。

    3.2 ARRLS算法性能分析

    由于源域與目標(biāo)域數(shù)據(jù)分布不同,如果直接從源域中劃分出數(shù)據(jù)作為驗(yàn)證集確定算法的參數(shù),通常會(huì)導(dǎo)致較差的測(cè)試集實(shí)驗(yàn)結(jié)果[10]。因此本文在一定范圍內(nèi)進(jìn)行了參數(shù)搜索,展示和對(duì)比了每種算法的最佳結(jié)果。這里SVM采用Lin開發(fā)的工具包LIBSVM[18],其懲罰參數(shù)c在{2-5~25}內(nèi)搜索最優(yōu)結(jié)果,最終本文設(shè)置c=4。 TCA算法中γ,λ在{2-5~25}內(nèi)分別搜索最優(yōu)結(jié)果確定γ=1,λ=1。 ARRLS算法中參數(shù)采用基于分層網(wǎng)格搜索的優(yōu)化方法。首先將λ,γ參數(shù)在{2-5~25}內(nèi)搜索分別設(shè)置λ=1,γ=1, 其次將σ在 {0.001,0.01,0.1,0,1,10} 內(nèi)搜索后確定σ=0.1, 迭代次數(shù)設(shè)置為5。

    表1中比較了ARRLS、SVM和TCA這3種算法的平均識(shí)別精度,圖5則更為詳細(xì)地展示了這3種算法的個(gè)體識(shí)別精度。從表1中可以看出,ARRLS在兩種核函數(shù)下均具有最優(yōu)的平均實(shí)驗(yàn)結(jié)果,且遷移學(xué)習(xí)算法在跨被試實(shí)驗(yàn)中實(shí)驗(yàn)結(jié)果強(qiáng)于SVM分類器。從圖5中可看出ARRLS算法在大多數(shù)個(gè)體上具有出色的識(shí)別精度。綜合分析上述實(shí)驗(yàn)結(jié)果,由于SVM分類器算法僅利用訓(xùn)練集數(shù)據(jù)構(gòu)建模型,而該模型并不能適配于測(cè)試集數(shù)據(jù)分布,因此難以取得理想實(shí)驗(yàn)結(jié)果。TCA算法雖然將數(shù)據(jù)投影到核空間中減少不同被試間邊緣分布差異,但未能考慮到被試間條件分布也存在差異,并且未能同時(shí)優(yōu)化損失函數(shù)與流形正則化,從而導(dǎo)致結(jié)果仍然不理想。ARRLS同時(shí)最小化損失函數(shù)、聯(lián)合概率分布函數(shù)、流形正則化,因此ARRLS方法在平均和個(gè)體識(shí)別結(jié)果上均表現(xiàn)良好且更穩(wěn)定。但從表1中可以看出ARRLS算法雖然識(shí)別精度高,但存在計(jì)算時(shí)間過長(zhǎng)的問題。

    表1 不同分類算法的情感識(shí)別結(jié)果

    圖5 單個(gè)個(gè)體識(shí)別準(zhǔn)確率

    此外,通過圖6可以看出同一目標(biāo)域?qū)?yīng)的不同源域在使用ARRLS算法時(shí)分類結(jié)果相差較大。圖5中分別選取被試1,2作為目標(biāo)域。當(dāng)被試1作為目標(biāo)域時(shí),被試2,3,12作為源域時(shí)識(shí)別精度較低。當(dāng)被試2作為目標(biāo)域時(shí),被試3,12作為源域時(shí)識(shí)別精度較低。當(dāng)存在部分識(shí)別率較低的源域被試時(shí),若直接對(duì)所有源域的識(shí)別結(jié)果投票將會(huì)導(dǎo)致最終模型識(shí)別率變低。針對(duì)上述存在的兩個(gè)不足,本文進(jìn)一步提出結(jié)合樣本選擇和特征選擇的多源域遷移學(xué)習(xí)算法。

    圖6 被試1,2作為目標(biāo)域時(shí)不同源域的分類結(jié)果

    3.3 MDS算法性能分析

    為了提升識(shí)別效率同時(shí)提升模型性能,本文通過MDS算法衡量出源域與目標(biāo)域間相似性的大小,保留具有良好遷移能力的源域。圖7是一名被試作為目標(biāo)域,在K=2,3,5時(shí)14個(gè)源域被試根據(jù)相似性大小進(jìn)行聚類的示意圖。

    圖7 MDS算法實(shí)驗(yàn)結(jié)果

    被試間相似度大小可以由圖中每名被試的對(duì)應(yīng)點(diǎn)到原點(diǎn)的距離直觀看出,距離原點(diǎn)越遠(yuǎn)則相似性越高。從圖6中可以得出,不同源域被試與目標(biāo)域被試間的MMD值和Like值差異較大。K-means算法根據(jù)聯(lián)合相似度的大小將原始源域集合聚類,不同的K值得到的聚類結(jié)果也不相同,本文選取距離零點(diǎn)距離較遠(yuǎn)的集合作為最優(yōu)子集來避免出現(xiàn)負(fù)遷移現(xiàn)象。當(dāng)K=2時(shí),保留形心模值較大的集合中所包含源域,此時(shí)聚類效果較為極端,所選取的最優(yōu)源域集合僅包含1名被試數(shù)據(jù)。當(dāng)K=3時(shí),保留形心模值最大的2類包含的源域,此時(shí)最優(yōu)源域集合有8名被試組成。當(dāng)K=5時(shí),保留形心模值最大的3類包含的源域,此時(shí)聚類結(jié)果適中,最優(yōu)源域集共有5名被試數(shù)據(jù)集組成。

    3.4 TFS算法性能分析

    由于原始數(shù)據(jù)中存在部分與標(biāo)簽無關(guān)且影響遷移效果的特征,因此本文采用TFS算法去除這些特征。TFS算法首先計(jì)算出所有特征權(quán)重值F(fi),并根據(jù)權(quán)重值對(duì)所有特征排序。式(12)為當(dāng)維度為d時(shí)的特征權(quán)重占比率rate的計(jì)算公式,其中Z為特征總體維度,F(xiàn)(fi)為特征fi的Fisher Score大小

    (12)

    本文考慮到數(shù)據(jù)信息的完整性與計(jì)算成本控制,選取占比率為0.85時(shí)所對(duì)應(yīng)的最優(yōu)子集SF,特征維度d=100。對(duì)SF中的所有特征計(jì)算互信息I(fi)大小,并將由小到大排序,選取最終特征子集SI。圖8為Fisher Score與TFS算法在不同維度下的實(shí)驗(yàn)結(jié)果圖。

    圖8 特征選擇實(shí)驗(yàn)結(jié)果

    從圖8中可以看出,利用Fisher Score與TFS算法實(shí)驗(yàn)精度在初始階段會(huì)隨著所選特征數(shù)量的增加而提高,且TFS識(shí)別效果明顯優(yōu)于Fisher Score,這說明TFS算法成功選出對(duì)遷移有效的特征并排在特征序列的前列。但TFS算法所選特征維度達(dá)到一定維度后,其精度逐漸開始下降,這說明隨著后續(xù)與域標(biāo)簽強(qiáng)相關(guān)的特征加入集合中,源域與目標(biāo)域間的差異性也隨之增加,影響遷移效果,從而降低識(shí)別精度。

    3.5 MDS-TFS-ARRLS算法性能分析

    為了最大限度提升計(jì)算效率和分類效果,本文將MDS、TFS和ARRLS算法相結(jié)合進(jìn)行實(shí)驗(yàn),并將之與其它組合方式做出對(duì)比。ARRLS、TFS-ARRLS、MDS-ARRLS和MDS-TFS-ARRLS分別對(duì)應(yīng)遷移學(xué)習(xí),特征選擇+遷移學(xué)習(xí),多源域選擇+遷移學(xué)習(xí),多源域選擇+特征選擇+遷移學(xué)習(xí)4種情況,這4種方式在linear核情況下的實(shí)驗(yàn)結(jié)果見表2。

    從表2中可以看出,僅使用ARRLS算法可以得到73.19%的準(zhǔn)確率,但所用的時(shí)間為1442 s,計(jì)算效率過低。TFS-ARRLS算法對(duì)所有源域進(jìn)行特征選擇,在60維下分類,從表中可以看出由于去除冗余特征即降低特征維度,使計(jì)算時(shí)間在一定程度上有所減少,減至703 s,同時(shí)準(zhǔn)確率也提高至78.96%。MDS-ARRLS算法為使用多源域選擇后再分類,隨著K值的不同對(duì)應(yīng)的樣本保留率也不同。當(dāng)K=2時(shí),選取的樣本為原始的35%,所得準(zhǔn)確率略微低于原始準(zhǔn)確率。當(dāng)K=3或5時(shí),所選樣本數(shù)量相對(duì)增加,其對(duì)應(yīng)的準(zhǔn)確率都高于原始值,并且可以看出3種K值的計(jì)算時(shí)間都大幅縮減。MDS-TFS-ARRLS算法中,同時(shí)兼顧了特征選擇和樣本選擇兩個(gè)方面,進(jìn)一步提升識(shí)別效率與識(shí)別率。當(dāng)K=2時(shí),雖然計(jì)算時(shí)間最短,但由于去除了過多樣本信息,相較于TFS-ARRLS,計(jì)算準(zhǔn)確率降低了1.39%。K=3時(shí),對(duì)應(yīng)準(zhǔn)確率為79.92%,相較于原始準(zhǔn)確率提高6.73%,計(jì)算效率提高3.84倍。K=5時(shí),兼顧了分類準(zhǔn)確率和計(jì)算效率兩個(gè)方面,其分類準(zhǔn)確率提高6.35%同時(shí)計(jì)算效率提高5.02倍。

    表2 4種遷移學(xué)習(xí)算法實(shí)驗(yàn)結(jié)果

    從表3中給出當(dāng)K=3時(shí),MDS-TFS-ARRLS在不同維度下的識(shí)別精度與計(jì)算時(shí)間的變化情況,當(dāng)保留較多特征時(shí),其計(jì)算精度相對(duì)較高,但其計(jì)算成本同時(shí)也隨之提高。在實(shí)際應(yīng)用中可以根據(jù)實(shí)際所需選取合適的特征集合大小。

    表3 MDS-TFS-ARRLS算法最終選取不同維度結(jié)果

    綜合上述實(shí)驗(yàn)結(jié)果,本文所提出的MDS-TFS-ARRLS算法可以有效提高計(jì)算效率且提高分類準(zhǔn)確率。

    3.6 同類結(jié)果對(duì)比

    將本文提出的方法與同樣采用SEED數(shù)據(jù)集的其它方法的實(shí)驗(yàn)結(jié)果作對(duì)比,見表4。文獻(xiàn)[19]使用深度信念網(wǎng)絡(luò)(deep belief network,DBN)選取最優(yōu)電極組合,得到67.84%的分類精度;文獻(xiàn)[20]從腦電信號(hào)中提取18種線性和非線性腦電特征,并從中自動(dòng)選取與情感最相關(guān)的特征信息,利用支持向量機(jī)達(dá)到83.33%的識(shí)別率。這兩篇同類研究分別利用深度學(xué)習(xí)和淺層機(jī)器學(xué)習(xí)算法建立模型,但都沒有應(yīng)用遷移學(xué)習(xí)從本質(zhì)上減小源域與目標(biāo)域間數(shù)據(jù)分布差異。文獻(xiàn)[21]中采用辨別圖正則化極限學(xué)習(xí)機(jī)(GELM)來識(shí)別隨時(shí)間變化的穩(wěn)定模式,該文研究同一個(gè)被試跨天情感識(shí)別,因此訓(xùn)練集與測(cè)試集差異小于本文,最終分類精度為79.28%。文獻(xiàn)[22]使用最大獨(dú)立性領(lǐng)域自適應(yīng)算法(maximum independence domain adaptation,MIDA),以差分熵作為特征取得72.31%的分類精度;文獻(xiàn)[23]使用TCA遷移學(xué)習(xí)方法,但訓(xùn)練集設(shè)置為隨機(jī)取出的5000個(gè)樣本,通過將數(shù)據(jù)降至30維取得69.44%的精度。上述兩篇文獻(xiàn)雖然都采用了遷移學(xué)習(xí)算法,但相較于本文,并未考慮多源域選擇算法去除會(huì)引起負(fù)遷移的源域。

    表4 同類研究對(duì)比

    4 結(jié)束語

    本文提出一種將多源域選擇(MDS)、遷移特征選擇(TFS)和適配正則化線性回歸(ARRLS)結(jié)合建立模型的方法,并將其應(yīng)用到跨被試情感識(shí)別中。該模型考慮到目標(biāo)域與源域間相關(guān)性,用多源域選擇來合理選擇樣本信息;其次考慮到特征自身與類別標(biāo)簽和域標(biāo)簽間的相關(guān)性,使用遷移特征選擇算法去除冗余特征;最后對(duì)多個(gè)遷移學(xué)習(xí)分類模型集成。結(jié)果表明,本文算法可以去除數(shù)據(jù)集中的無關(guān)樣本與特征,具有良好的計(jì)算效率,該算法相比于其它方法具有更優(yōu)的跨被試情感識(shí)別能力。

    猜你喜歡
    源域特征選擇相似性
    多源域適應(yīng)方法綜述
    一類上三角算子矩陣的相似性與酉相似性
    基于參數(shù)字典的多源域自適應(yīng)學(xué)習(xí)算法
    淺析當(dāng)代中西方繪畫的相似性
    Kmeans 應(yīng)用與特征選擇
    電子制作(2017年23期)2017-02-02 07:17:06
    低滲透黏土中氯離子彌散作用離心模擬相似性
    聯(lián)合互信息水下目標(biāo)特征選擇算法
    可遷移測(cè)度準(zhǔn)則下的協(xié)變量偏移修正多源集成方法
    基于特征選擇和RRVPMCD的滾動(dòng)軸承故障診斷方法
    基于二元搭配詞的微博情感特征選擇
    宁安市| 信阳市| 中方县| 保康县| 定襄县| 建瓯市| 武川县| 将乐县| 通道| 吐鲁番市| 张掖市| 昌吉市| 三明市| 茶陵县| 平谷区| 北京市| 洮南市| 徐闻县| 灌阳县| 山丹县| 锦屏县| 长葛市| 芷江| 恩施市| 盐源县| 金华市| 孝感市| 永胜县| 探索| 台中市| 九江市| 岳西县| 疏勒县| 徐汇区| 池州市| 卓资县| 当雄县| 淳安县| 海口市| 长春市| 宁城县|