張曉丹,杜金祥,李 濤,佘翼翀,趙 瑞,柯熙政,康俊瑋,王舒儀
(1.西安工程大學(xué) 電子信息學(xué)院,陜西 西安 710048;2.西安電子科技大學(xué) 生命科學(xué)技術(shù)學(xué)院,陜西 西安 710071;3.西安理工大學(xué) 自動(dòng)化與信息工程學(xué)院,陜西 西安 710054)
21世紀(jì)被稱(chēng)為人工智能與腦科學(xué)的世紀(jì)[1]。情緒識(shí)別是通過(guò)獲取人的生理和非生理信號(hào)對(duì)人的情緒狀態(tài)進(jìn)行自動(dòng)辨別,更加友好和自然地實(shí)現(xiàn)人-機(jī)交互[2-3]。根據(jù)國(guó)際“10-20”系統(tǒng)分布在整個(gè)頭皮上的16、32、64或128通道獲取多通道腦電信號(hào),電極數(shù)的增加會(huì)帶來(lái)特征維數(shù)急劇上升,導(dǎo)致計(jì)算量過(guò)大,不利于特征情緒的分類(lèi)[4-5]。文獻(xiàn)[6]證明在進(jìn)行情緒識(shí)別時(shí),使用少數(shù)電極的數(shù)據(jù)并不影響識(shí)別準(zhǔn)確率;文獻(xiàn)[7]通過(guò)Relief F算法進(jìn)行通道選擇,選擇16位被試者的通用最優(yōu)通道;同理,因?yàn)楸辉囌咧g的個(gè)體差異,同樣的特征并不能精確反應(yīng)部分被試者的信息[8];文獻(xiàn)[9]利用F-score算法進(jìn)行被試特征選擇時(shí),發(fā)現(xiàn)當(dāng)特征數(shù)減少一半時(shí),對(duì)應(yīng)的情緒識(shí)別準(zhǔn)確率基本保持不變;文獻(xiàn)[10]在研究基于唯獨(dú)模型的不同情緒識(shí)別準(zhǔn)確率的評(píng)價(jià)方法中,利用Relief F算法進(jìn)行了降維處理。根據(jù)“情緒效價(jià)假說(shuō)”[11-13],即大腦在處理消極和積極情緒時(shí)的前額非對(duì)稱(chēng)性,選取前額的對(duì)稱(chēng)電極,進(jìn)行效價(jià)維度的兩類(lèi)情緒識(shí)別。為了綜合考慮信號(hào)的時(shí)頻域信息常采用小波分析[14-15];文獻(xiàn)[16]使用小波能量矩進(jìn)行腦電信號(hào)情緒識(shí)別,結(jié)合K近鄰分類(lèi)器分類(lèi)準(zhǔn)確率最高達(dá)到91.07%;文獻(xiàn)[17]提取時(shí)域和頻域特征,并使用K近鄰進(jìn)行喚醒度和效價(jià)二分類(lèi),平均識(shí)別準(zhǔn)確率達(dá)到69.9%、71.2%;文獻(xiàn)[18]通過(guò)腦電、肌電、皮膚電等外周生理信號(hào)進(jìn)行情緒研究,采用最小二乘支持向量機(jī)進(jìn)行識(shí)別;文獻(xiàn)[19-20]使用K近鄰算法進(jìn)行音樂(lè)情感分類(lèi)。
上述研究均存在因被試者個(gè)體特異性與全局閾值不匹配,以及僅采用單一腦電信號(hào)忽視了肌電、眼電中含有與情緒相關(guān)的信息而導(dǎo)致的正確率不高等問(wèn)題。為解決以上問(wèn)題,本文提出一種改進(jìn)的Relief F匹配多生理信號(hào)特征選擇方法。首先,通過(guò)優(yōu)化特征組權(quán)重,獲得不同被試者多生理信號(hào)特征組的權(quán)重,其中多生理信號(hào)包括腦電信號(hào)、肌電信號(hào)、眼電信號(hào);其次,優(yōu)選該被試者的匹配特征組,剔除冗余,同時(shí)根據(jù)特征組進(jìn)行通道選擇,減少特征維度;最后,采用概率神經(jīng)網(wǎng)絡(luò)(product-based neural network,PNN)和支持向量機(jī)進(jìn)行識(shí)別驗(yàn)證算法的有效性。
1.1.1 數(shù)據(jù)來(lái)源
在生理信號(hào)情緒分析數(shù)據(jù)庫(kù)(database for emotion analysis using physiological singles,DEAP)[21]上進(jìn)行實(shí)驗(yàn)測(cè)試。該數(shù)據(jù)庫(kù)由Koelstra等人在2012年建立,包含32名被試者,每個(gè)被試者觀看40段視頻,被試者每觀看1個(gè)視頻被視為1個(gè)獨(dú)立的實(shí)驗(yàn)。每個(gè)實(shí)驗(yàn)記錄被試者的32通道的腦電信號(hào)和包含眼電、肌電等8通道的外周生理信號(hào)。視頻觀看結(jié)束后,被試者需使用自我評(píng)價(jià)模型分別在效價(jià)、喚醒度、優(yōu)勢(shì)度以及喜好程度4個(gè)維度進(jìn)行打分。
1.1.2 數(shù)據(jù)預(yù)處理
首先,對(duì)32位被試者36通道生理信號(hào)去除3 s基線數(shù)據(jù),剩下的60 s信號(hào)作為實(shí)驗(yàn)數(shù)據(jù);其次,為了增加樣本個(gè)數(shù),使用8 s時(shí)間窗分割樣本,相鄰的時(shí)間窗有4 s的重疊窗,因此每個(gè)被試者對(duì)應(yīng)40×14=560個(gè)樣本;最后,采用“效價(jià)-喚醒度”情緒分類(lèi)模型,對(duì)標(biāo)簽中的效價(jià)和喚醒度進(jìn)行標(biāo)準(zhǔn)化處理,閾值為5,表1為情緒和標(biāo)簽所對(duì)應(yīng)的關(guān)系。
表 1 情緒分類(lèi)標(biāo)簽Tab.1 Emotion classification label
1.2.1 傳統(tǒng)Relief F算法
Relief F算法[22]是一種特征選擇算法,即根據(jù)信號(hào)特征與分類(lèi)標(biāo)簽的相關(guān)性給特征向量賦予權(quán)值,并根據(jù)權(quán)值大小刪選對(duì)分類(lèi)效果影響較小的特征子集。采用Relief F計(jì)算每類(lèi)特征的權(quán)值,判斷每類(lèi)特征對(duì)分類(lèi)的貢獻(xiàn)度(即識(shí)別準(zhǔn)確率),其中需要計(jì)算各類(lèi)特征的權(quán)重系數(shù),式(1)為樣本總量為m的樣本集中第i個(gè)樣本權(quán)值的計(jì)算公式。其權(quán)重系數(shù)變化,即
(1)
式中:W(fl)為權(quán)值集合,fl為第l個(gè)特征的權(quán)值;Hj為R與同類(lèi)樣本的間距;Mj(C)為R與不同類(lèi)樣本的間距;P(C)為C在樣本集中所占比例;D(fl,R1,R2)為R1,R2兩類(lèi)樣本在特征fl上的距離。當(dāng)fl連續(xù)時(shí),有
(2)
通過(guò)Relief F算法,將特征子集中全部特征權(quán)值相加,得到每類(lèi)特征的權(quán)值并按其大小計(jì)算每類(lèi)特征對(duì)分類(lèi)的貢獻(xiàn),在進(jìn)行情緒識(shí)別時(shí)需要使用多類(lèi)特征進(jìn)行組合作為分類(lèi)的依據(jù),但Relief F算法對(duì)消除冗余效果欠佳,因此,本文提出Relief F匹配多生理信號(hào)特征選擇(relief F matching multi-physiological signal feature selection,RMMSFS)方法,通過(guò)Relief F算法計(jì)算特征種類(lèi)和通道的權(quán)值,并通過(guò)使用交叉驗(yàn)證得到的分類(lèi)貢獻(xiàn)度對(duì)權(quán)值進(jìn)行調(diào)整,剔除無(wú)關(guān)信息與冗余信息,得到識(shí)別使用的匹配特征組,提高識(shí)別準(zhǔn)確率與減少運(yùn)行時(shí)間。
1.2.2 RMMSFS方法
RMMSFS方法由特征種類(lèi)選擇和通道選擇組成,利用特征種類(lèi)選擇得到被試者的所有特征的權(quán)值,并選出情緒識(shí)別率高的優(yōu)選特征組,再根據(jù)特征的權(quán)值進(jìn)行通道選擇,有效地減少了通道數(shù),提高了情緒識(shí)別率。
Ⅰ) 全局最優(yōu)匹配特征組和通道選擇。RMMSFS方法步驟:
步驟1:使用Relief F算法計(jì)算預(yù)處理后數(shù)據(jù)的n類(lèi)特征權(quán)重。權(quán)值越大對(duì)正確分類(lèi)的貢獻(xiàn)越大;若權(quán)值為負(fù)值則相反。
步驟2:判斷特征權(quán)重是否小于0,刪除對(duì)分類(lèi)有負(fù)作用的特征;將剩余特征組成優(yōu)選特征組,重復(fù)使用Relief F算法,直到特征中沒(méi)有負(fù)權(quán)值。
步驟3:將優(yōu)選特征組中所有的特征進(jìn)行降序排列,采用PNN分類(lèi)器及20次5折交叉驗(yàn)證,得到前n類(lèi)及n+1類(lèi)特征識(shí)別準(zhǔn)確率p(n)和p(n+1)。
步驟4:設(shè)定閾值δ1=0.01,判斷|p(n+1)-p(n)|<δ1:
1) |p(n+1)-p(n)|<δ1,若前n+1與前n項(xiàng)的差絕對(duì)值小于閾值,則完成特征選擇。
2) |p(n+1)-p(n)|>δ1,若大于閾值,則判斷p(n)和p(n+1)的大小關(guān)系:
當(dāng)p(n+1)>p(n)時(shí),按式(3)計(jì)算前n項(xiàng)特征權(quán)值,獲得更大增益。
(3)
當(dāng)p(n+1)
(4)
步驟5:使用優(yōu)選特征組作為輸入,計(jì)算36生理通道權(quán)重,并降序排列。
步驟6:剔除權(quán)重為負(fù)的生理通道,重復(fù)計(jì)算更新權(quán)重,直到所有生理通道權(quán)重為正。
步驟7:設(shè)定可變閾值δ2(δ2=0.05,0.1,…,0.9),取權(quán)值和小于δ2的前n個(gè)通道,不同域值組成多種生理通道組合。
步驟8:通過(guò)PNN分類(lèi)器進(jìn)行20次5折交叉驗(yàn)證,得到不同通道組合的識(shí)別準(zhǔn)確率及運(yùn)行時(shí)間,最終輸出最優(yōu)通道優(yōu)選特征組。
Ⅱ) 優(yōu)化特征權(quán)重因子。通過(guò)Relief F算法,將特征子集中全部特征權(quán)值相加,得到每類(lèi)特征的權(quán)值并按其大小計(jì)算每類(lèi)特征對(duì)分類(lèi)的貢獻(xiàn),但進(jìn)行情緒識(shí)別時(shí),需要使用多類(lèi)特征進(jìn)行組合作為分類(lèi)的依據(jù),且消除冗余的效果欠佳。區(qū)別于傳統(tǒng)Relief F算法,本文使用權(quán)值在匹配特征組中所占比例對(duì)特征每個(gè)權(quán)值統(tǒng)一調(diào)整,使權(quán)值較大的特征得到更多的增益,而權(quán)值較小的特征得到較小的增益,這樣可以使對(duì)分類(lèi)貢獻(xiàn)較高的特征在特征組中占有更重要的作用。在步驟4的式(3)中,更新特征權(quán)重排序,重新分類(lèi)判斷p(n)和p(n+1)的大小關(guān)系,一直更新權(quán)重直到滿(mǎn)足閾值條件,此時(shí)完成前n類(lèi)的特征選擇。
1.2.3 PNN
PNN是一種結(jié)構(gòu)簡(jiǎn)單的人工神經(jīng)網(wǎng)絡(luò)模型,分別為輸入層、模式層、求和層以及輸出層4個(gè)網(wǎng)絡(luò)層次,PNN網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)鋱D如圖1所示。
圖 1 PNN網(wǎng)絡(luò)結(jié)構(gòu)拓?fù)鋱DFig.1 PNN structure topology of network
PNN樣本層將輸入的腦電、眼電和肌電信號(hào)進(jìn)行加權(quán),通過(guò)激活函數(shù)傳輸?shù)絇NN求和層,即
(5)
式中:ci為徑向基函數(shù)中心值;δi為特性函數(shù)第i個(gè)分量所對(duì)的閾值參考量值。PNN利用非參數(shù)估計(jì)法求和估計(jì)各類(lèi)的概率,即
(6)
式中:X為需要識(shí)別的樣本數(shù)據(jù);CI為標(biāo)簽的類(lèi)型;m為數(shù)據(jù)向量的維度信息;δ為平滑參數(shù);n為第i類(lèi)別的樣本數(shù)量。
本文所提算法在Matlab2017b軟件上進(jìn)行實(shí)驗(yàn),硬件平臺(tái)CPU為intel(R)Core(TM)i5-7400,主頻為3 GHZ,機(jī)帶RAM為8 GiB,搭載Windows10,64位操作系統(tǒng)。
選用DEAP中的第25位被試者作為實(shí)驗(yàn)對(duì)象,通過(guò)對(duì)數(shù)據(jù)預(yù)處理,將560個(gè)樣本按效價(jià)和喚醒度標(biāo)簽隨機(jī)分為2組,取各自1/2樣本為訓(xùn)練集,剩余部分為測(cè)試集。第25位被試者的特征類(lèi)別選擇結(jié)果見(jiàn)表2。
表 2 特征類(lèi)別選擇結(jié)果Tab.2 Results of feature category selection
從表2可以看出:隨著特征種類(lèi)增多,權(quán)值與分類(lèi)準(zhǔn)確率增大,當(dāng)超過(guò)4種特征時(shí)識(shí)別準(zhǔn)確率無(wú)明顯變化,而程序運(yùn)行時(shí)間明顯增加?;谇?種特征的效價(jià)二分類(lèi)準(zhǔn)確率為95.35%,相較于前3類(lèi)特征識(shí)別準(zhǔn)確率增加0.020 2,大于設(shè)定閾值δ,隨著特征數(shù)量的增加,正確率增量絕對(duì)值均小于δ,故該被試者效價(jià)二分類(lèi)的匹配特征組為其優(yōu)選特征組的前4項(xiàng)特征;基于前4項(xiàng)特征的喚醒度二分類(lèi)準(zhǔn)確率為93.96%,前3項(xiàng)特征組分類(lèi)準(zhǔn)確率為93.48%,二者差值為0.048,小于閾值δ,故喚醒度二分類(lèi)的匹配特征組為其優(yōu)選特征組的前三項(xiàng)特征。
由于被試者之間存在個(gè)體差異性,不同被試者匹配特征組不盡相同,而且不同特征直接影響相應(yīng)通道權(quán)值的大小,從而影響識(shí)別結(jié)果,因此針對(duì)不同被試者選擇匹配該被試者的特征組是正確識(shí)別情緒的重要前提。第25名被試者效價(jià)和喚醒度二分類(lèi)通道選擇結(jié)果如圖2~3所示。
圖 2 效價(jià)二分類(lèi)通道選擇結(jié)果 圖 3 喚醒度二分類(lèi)通道選擇結(jié)果 Fig.2 Results of potency binary classification Fig.3 Results of potency binary classification channel selection channel selection
從圖2~3可以看出,3條曲線分別為使用RMMSFS方法、小波系數(shù)特征與本征模函數(shù)分量特征通道選擇準(zhǔn)確率曲線,體現(xiàn)了在通道選擇過(guò)程中不同方法的準(zhǔn)確率變化規(guī)律,通道權(quán)值不同時(shí)各自對(duì)應(yīng)的前n個(gè)通道的識(shí)別程序的運(yùn)行時(shí)間見(jiàn)表3。
表 3 通道不同權(quán)值時(shí)程序運(yùn)行時(shí)間Tab.3 Run time of program when channel selects different weights
從表3可見(jiàn)看出,采用RMMSFS方法進(jìn)行特征選擇的識(shí)別正確率隨著選擇通道權(quán)重和的增加而增加,當(dāng)通道權(quán)值和為0.60時(shí),2組分類(lèi)結(jié)果都達(dá)到了最大值,分別為95.46%和93.63%,對(duì)應(yīng)表3使用的通道個(gè)數(shù)均為12個(gè),識(shí)別程序運(yùn)行時(shí)間為586.28 s,較未經(jīng)過(guò)通道選擇時(shí)的836.29 s縮短了42.64%;當(dāng)通道權(quán)重和為0.9時(shí),隨著通道權(quán)重和的增加,識(shí)別正確率并未顯著增加,效價(jià)和喚醒度的通道數(shù)分別為27和25,所耗時(shí)間增加至799.61 s。表明特征數(shù)增加到一定數(shù)量時(shí),對(duì)應(yīng)的通道數(shù)也隨之增多,數(shù)據(jù)冗雜反而影響情緒平均識(shí)別率。因此,綜合考慮準(zhǔn)確率與時(shí)間復(fù)雜度,在效價(jià)和喚醒度二分類(lèi)時(shí)選擇權(quán)重和為0.6時(shí)對(duì)應(yīng)的通道。
選用DEAP中32位被試者為實(shí)驗(yàn)對(duì)象,為增加樣本容量,取4 s重疊時(shí)間窗將時(shí)長(zhǎng)60 s的樣本劃分為14段,每段對(duì)應(yīng)1 024個(gè)數(shù)據(jù)點(diǎn),分為2組,進(jìn)行100次隨機(jī)實(shí)驗(yàn)。全體被試者效價(jià)和喚醒度二分類(lèi)的匹配特征組構(gòu)成及其權(quán)值如圖4~5所示。
圖 4 效價(jià)二分類(lèi)匹配特征組構(gòu)成及其權(quán)值Fig.4 Composition and weight of valence binary matching feature group
圖 5 喚醒度二分類(lèi)匹配特征組構(gòu)成及其權(quán)值Fig.5 Composition and weight of arousal binary classification matching feature set
由小波系數(shù)均值、小波系數(shù)標(biāo)準(zhǔn)差、本征函數(shù)分量標(biāo)準(zhǔn)差與小波能量4類(lèi)特征中的2~4類(lèi)特征構(gòu)成,但不同個(gè)體之間的匹配特征組構(gòu)成有較大的差異:有32.81%樣本的匹配特征組含有4類(lèi)特征,59.38%樣本中含有3種特征,而僅有7.81%被試者分類(lèi)結(jié)果明顯受2種特征影響。而第13位被試者的喚醒度二分類(lèi)的匹配特征組由小波能量與本征函數(shù)分量標(biāo)準(zhǔn)差構(gòu)成,且未經(jīng)過(guò)RMMSFS特征選擇的權(quán)值為負(fù),說(shuō)明其對(duì)大部分樣本的分類(lèi)有消極影響,而僅在該位被試者的喚醒度二分類(lèi)中起到較強(qiáng)的積極作用,如圖5中紅色虛線框內(nèi)所示。由此可知,此4類(lèi)匹配特征及其權(quán)值雖然對(duì)大部分被試者適用,但不能匹配所有被試者。同時(shí),若樣本比例增加,匹配特征特異比例將會(huì)進(jìn)一步上升。
對(duì)DEAP數(shù)據(jù)集32位被試者利用RMMSFS方法分別識(shí)別腦電和多生理信號(hào)在PNN模型下的4類(lèi)情緒。對(duì)于每一位被試者,從腦電、眼電和肌電中組成的多生理信號(hào)中的每類(lèi)情緒的特征樣本中抽取一半樣本作為訓(xùn)練集,剩余樣本作為測(cè)試集,通過(guò)PNN分類(lèi)器獲得最終多生理信號(hào)分類(lèi)結(jié)果。首先,在RMMSFS多生理信號(hào)特征提取算法中,計(jì)算每一類(lèi)特征的權(quán)值并按降序排列,剔除權(quán)值為負(fù)的特征。選擇不同特征及其對(duì)應(yīng)通道的權(quán)值(貢獻(xiàn)度),根據(jù)貢獻(xiàn)度調(diào)整其權(quán)值及其對(duì)應(yīng)通道、多生理信號(hào)和腦電信號(hào)前n個(gè)特征對(duì)應(yīng)的平均識(shí)別準(zhǔn)確率見(jiàn)表4。
當(dāng)腦電信號(hào)的特征數(shù)為21時(shí),所需平均通道數(shù)為11.13,是多生理信號(hào)組合特征算法的2倍,且57.58%的識(shí)別率低于多生理信號(hào)組合特征62.72%;當(dāng)腦電信號(hào)特征提取最高平均識(shí)別率為85.55%時(shí),平均通道數(shù)為22.05,特征數(shù)為85個(gè),多生理識(shí)別準(zhǔn)確率最高達(dá)到87.31%,高于腦電通道1.76%,所需的通道數(shù)也少于腦電信號(hào)。當(dāng)特征數(shù)增加到90以后,腦電信號(hào)平均識(shí)別率明顯低于多生理信號(hào)的識(shí)別率,且呈現(xiàn)急速下降的形式。表明特征數(shù)增加到一定數(shù)量時(shí),對(duì)應(yīng)的通道數(shù)也隨之增多,數(shù)據(jù)冗雜反而影響情緒的平均識(shí)別率。
表 4 多生理信號(hào)和腦電信號(hào)前n個(gè)特征對(duì)應(yīng)的平均識(shí)別準(zhǔn)確率Tab.4 Average recognition accuracy corresponding tothe first n features of multiple physiologicalsignals and EEG signals
2.4.1 RMMSFS方法與Relief F算法對(duì)比
為了驗(yàn)證RMMSFS算法的有效性,對(duì)DEAP數(shù)據(jù)庫(kù)32位被試者進(jìn)行效價(jià)和喚醒度分析,使用傳統(tǒng)的Relief F算法選擇不同的2組特征,分別使用其中小波系數(shù)特征和小波能量熵、重構(gòu)信號(hào)本征函數(shù)分量差值,使用PNN進(jìn)行識(shí)別。其中RMMSFS代表改進(jìn)的Relief F匹配多生理信號(hào)特征選擇算法,Relief F COE代表使用小波系數(shù)特征進(jìn)行實(shí)驗(yàn),Relief F IMF代表使用重構(gòu)信號(hào)本征函數(shù)分量差值進(jìn)行實(shí)驗(yàn)。3組實(shí)驗(yàn)4分類(lèi)情緒識(shí)別以及平均分類(lèi)結(jié)果見(jiàn)表5。
表 5 情緒四分類(lèi)實(shí)驗(yàn)結(jié)果Tab.5 Experimental results of four emotion classifications 單位:%
從表5可以看出,愉悅情緒識(shí)別率最高為90.89%,對(duì)比Relief F COE組提升7.50%,對(duì)比Relief F IMF組提升27.62%。而在放松情緒識(shí)別率最低為82.81%,對(duì)比Relief F COE組提升3.97%,對(duì)比Relief F IMF組提升28.33%??傮w4類(lèi)情緒的識(shí)別率皆高于82%,其中,4類(lèi)情緒的平均識(shí)別率達(dá)到87.30%,而在Relief F COE情緒4分類(lèi)中平均識(shí)別率為80.95%,Relief F IMF4分類(lèi)平均識(shí)別準(zhǔn)確率為60.17%,由此可見(jiàn),使用RMMSFS方法可有效提取多生理信號(hào)中與情緒相關(guān)性較強(qiáng)的特征,優(yōu)于傳統(tǒng)的Relief F算法。
2.4.2 PNN與SVM情緒識(shí)別結(jié)果對(duì)比
為了驗(yàn)證PNN識(shí)別算法的有效性,采用PNN和SVM不同核函數(shù)分別進(jìn)行多生理信號(hào)和腦電信號(hào)4分類(lèi)情緒識(shí)別,并對(duì)2種分類(lèi)模型進(jìn)行綜合評(píng)估。PNN和SVM不同核函數(shù)情緒識(shí)別結(jié)果的數(shù)據(jù)對(duì)比見(jiàn)表6。從表6可以看出,首先從腦電信號(hào)與多生理信號(hào)分析PNN與SVM不同核函數(shù)4類(lèi)情緒的識(shí)別率和外周生理信號(hào)均得到提升,PNN平均提升1.76%,SVM平均提升8.28%,更加驗(yàn)證了多生理信號(hào)包含的情緒特征更利于情緒識(shí)別。其次,模型方面采用PNN多生理信號(hào)特征下的情緒分類(lèi)準(zhǔn)確率較SVM不同核函數(shù)的分類(lèi)準(zhǔn)確率都有一定程度的提高。RBF核函數(shù)準(zhǔn)確率和F1值均高于LR核函數(shù),是因?yàn)檫x擇的數(shù)據(jù)特征數(shù)量較小,樣本數(shù)量一般,后續(xù)選用RBF核函數(shù)與PNN對(duì)比。PNN對(duì)比RBF核函數(shù)的悲傷情緒識(shí)別準(zhǔn)確率提升了3.72%,憤怒情緒最低提升了1.33%,4類(lèi)情緒平均提升了2.07%。再次,其他指標(biāo)如評(píng)價(jià)召回率與精度常采用更客觀的F1值來(lái)綜合評(píng)價(jià),F(xiàn)1值越高,代表該模型的性能越好。從整體來(lái)看,2種模型在識(shí)別4類(lèi)情緒時(shí)F1值都大于80%,其中PNN識(shí)別愉悅、憤怒、放松、悲傷的F1值分別為89.09%、86.42%、84.18%、88.04%,對(duì)比SVM分別提高了3.36%、2.36%、2.30%、2.24%。因?yàn)椴煌榫w狀態(tài)下的腦部活動(dòng)及反應(yīng)并不是一種簡(jiǎn)單的線性系統(tǒng),若把不同的腦電情緒特征進(jìn)行簡(jiǎn)單的線性組合時(shí),容易破壞腦電情緒特征的原本的非線性結(jié)構(gòu),使不同的情緒特征之間出現(xiàn)負(fù)面作用,進(jìn)而導(dǎo)致了特征冗余的增加,背離了充分利用多生理情緒特征的初衷。因此本文的方法,能使腦電、眼電和肌電生理信號(hào)的情緒特征有效地組合在一起,提升了情緒識(shí)別的分類(lèi)性能,證明本文提出的基于RMMSFS方法與PNN組合方式能夠較充分挖掘生理信號(hào)的情緒信息。
表 6 PNN與SVM情緒識(shí)別準(zhǔn)確率
1) 優(yōu)化權(quán)重公式,獲得特征組的分類(lèi)貢獻(xiàn)度和被試者匹配特征組,以及在匹配特征組中所占的比例,優(yōu)選出有效的匹配特征組,剔除貢獻(xiàn)度小的特征組,提高了算法識(shí)別準(zhǔn)確率和效率。
2) 有效地識(shí)別不同被試者的特異性特征組,并根據(jù)被試者特異性特征選擇通道,獲得更高的識(shí)別準(zhǔn)確率。
3) PNN與傳統(tǒng)SVM算法進(jìn)行對(duì)比,在4類(lèi)情緒識(shí)別中均能夠獲得更高的識(shí)別準(zhǔn)確率。RMMSFS方法能夠獲得全局匹配特征組和不同被試者的匹配特征組,提高了識(shí)別準(zhǔn)確率和算法效率,驗(yàn)證了RMMSFS方法的有效性與可行性。