王一,薄華
(上海海事大學(xué)信息工程學(xué)院,上海 201603)
基于自發(fā)性腦電信號身份識別的方法
王一,薄華
(上海海事大學(xué)信息工程學(xué)院,上海 201603)
研究一種基于自發(fā)性腦電信號的身份識別方法,采用小波變換的方法對腦電信號高效預(yù)處理,快速提取腦電信號的時域和頻域特征(自回歸滑動平均模型系數(shù)及功率譜密度),對BP神經(jīng)網(wǎng)絡(luò)算法和K近鄰算法分類的結(jié)果進行比較。實驗結(jié)果顯示,我們的方法在一定的范圍內(nèi),K近鄰分類正確率高達94.21%,但耗時較長,而BP神經(jīng)網(wǎng)絡(luò)識別率略低,其分類耗時僅為0.18秒,進一步證明了在個體身份的識別中,自發(fā)性腦電信號可作為一種獨立的生物特征進行應(yīng)用。
腦電信號;身份識別;預(yù)處理;特征提取
身份識別是保證公共和信息安全的重要前提,比較傳統(tǒng)的識別方法包括證件、智能卡片、鑰匙、專屬密碼等,但是,傳統(tǒng)的方法可能會出現(xiàn)遺失、偽造或者被破解的問題。目前,伴隨著對腦電信號進行持續(xù)的深入探索,研究表明在一定時間內(nèi),它具有相對穩(wěn)定、不易偽造或者被破解的特點。TouYama等人提出通過使用腦電信號的P300電位作為工具,對個體身份進行辨識,具體如下。受試者隨機抽取照片,然后對選定相應(yīng)的照片來對他們進行刺激,每個受試者的刺激目標都不同,實驗結(jié)果得出識別率在77.2%到97.6%之間[2]。M.Poulos研究團隊對樣本庫中的4個人的腦電信號進行分類識別,采用學(xué)習(xí)矢量量化神經(jīng)網(wǎng)絡(luò)法,識別的準確率在72%到78%之間[2]。由此可見,通過誘發(fā)性腦電信號來進行身份識別的研究有其實際的可行性,但是,在國內(nèi)關(guān)于腦電信號在身份識別中的研究,特別是在普適環(huán)境下,其相關(guān)研究成果還是相當(dāng)匱乏的。我們通過自回歸滑動平均(Auto Regressive Moving Average,ARMA)模型對自發(fā)性腦電信號(EEG)進行建模,分別提取腦電信號的時域和頻域上的特征,最后放入相應(yīng)的分類器中對個體進行身份判斷。
建立使用者的信息和腦電數(shù)據(jù)特征庫,記錄和存儲用戶的腦電信號作為樣本。如圖1腦電信號身份識別系統(tǒng)分為如下四步:
(1)在安靜的環(huán)境下收集受試者的腦電信號;
(2)對腦電信號進行預(yù)處理,剔除與噪聲相關(guān)的信號,保留腦電中有用的成分;
(3)分別從時域和頻域上提取腦電信號特征。
(4)通過分類器,對采集到的受試者腦電信號的特征來匹配在數(shù)據(jù)庫樣本中的腦電特征,從而識別匹配受試者的信息[3]。
圖1 腦電身份識別系統(tǒng)框圖
2.1 腦電信號的采集
我們實驗數(shù)據(jù)均采用NeuroSky公司生產(chǎn)的便攜式單電極腦電采集設(shè)備采集得到。該設(shè)備通過藍牙連接,設(shè)備包含一個位于前額處的電極,以及一個置于左右兩側(cè)耳垂的接地電極。耳機與電腦相連,將接收到的腦神經(jīng)信號轉(zhuǎn)換成電腦可以識別處理的數(shù)字信號。該設(shè)備輸出頻率是512 Hz,采集到的腦電數(shù)據(jù)為有符號整型數(shù)值,以.mat格式存儲。采集過程中,測試者不能進行劇烈的思維或者肢體運動,盡量要保持雙目閉合,情緒穩(wěn)定。
2.2 噪聲來源
腦電中干擾信號的來源:眼電、心電、肌電、工頻干擾、電極松動、出汗。其中,眼電(眼睛的眨動)的主要頻域范圍為0-16Hz,幅度為50 μV-1 mV[4]。工頻噪聲來源于日常電器產(chǎn)品中的電磁感應(yīng)和電阻容性耦合,工頻干擾的頻域為50/60Hz。肌電是在采集腦電的過程中,被測試人員一些微小的面部以及肢體的動作會產(chǎn)生頻率范圍在1-100 Hz肌電信號[5]。
2.3 噪聲處理
第一步是腦電數(shù)據(jù)的采集和截取,然后對截取后的信號進行帶通濾波、小波閾值剔除噪聲。腦電信號的幅度一般是 50 μV-100 μV,但是最大會達到 200 μV,我們將閾值設(shè)定的是200 μV[6]。通過對后期特征進行分析得出,閾值的截取取決于時間的長度,截取的EEG數(shù)據(jù)需要取連續(xù)60s(60×256個釆樣點)的時間。由于EEG是非平穩(wěn)信號,在頻域上,EEG信號很容易受到其他瞬態(tài)信號的干擾(如眼電)[7],我們通過小波變換的方式把所產(chǎn)生干擾信號在頻率上進行不同尺度的分解和重構(gòu),具體如下:
(1)用高階小波和離散小波對眼電噪聲干擾的時間進行檢測,見圖2;
(2)在確定的眼電噪聲的區(qū)域中,把一維平穩(wěn)小波變換及DB7,當(dāng)做基礎(chǔ)函數(shù)來應(yīng)用,見圖3;
(3)選取合理的閾值,在眼電的標記區(qū)域里,利用小波變換分解出第一步中的腦電信號各個頻率的分量;
(4)利用一維小波逆變換(ISWT)獲得EEG降噪后較純凈的信號。
我們的身份識別系統(tǒng)主要用到AR模型系數(shù)及功率譜密度兩類特征。
自回歸滑動平均(Auto Regressive Moving Average,ARMA)模型為一個線性時不變系統(tǒng),當(dāng)階數(shù)趨于無窮時,任意一個有限方差的ARMA過程都與一個AR過程是等價的,它相當(dāng)于一個無限全極點響應(yīng)沖激濾波器[8],用差分方程表示如式(1):
圖2 Haar小波檢測并標記眼電噪聲
圖3 小波去除區(qū)域內(nèi)眼電
式(1)是比較常見的數(shù)學(xué)模型,通常用來描述復(fù)雜的不規(guī)則的EEG。(1)式中e(n)代表獨立同分布的白噪聲,是該模型的激勵信號;{x(n)}代表離散隨機過程,在我們中是一個腦電信號,代表其線性響應(yīng);C為常數(shù);P為AR模型的階數(shù);AR的模型系數(shù)可以由唯一的一組a1… ap。a1… ap表示出來,這樣,AR系數(shù)可以確定出相應(yīng)的腦電信號,因此,AR系數(shù)可以作為腦電信號在時域上非常重要的特征,在其使用過程中,人們一般只需計算出AR參數(shù)即可。
從時域上,我們可以通過AR參數(shù)來對腦電信號進行描述,但它在頻域上的特性也是我們關(guān)心的問題。在隨機離散過程中,功率譜密度表示在不同頻帶上它的能量變化及具體分布[9],這是在腦電波信號一類研究中,常見且典型的特征。下面介紹本實驗用到AR參數(shù)譜估計法。
AR參數(shù)譜估計法是現(xiàn)代功率譜估計法的代表。在線性時不變系統(tǒng)中,離散的時間信號輸入x(n)信號和輸出信號y(n)的功率譜密度關(guān)聯(lián)如式(2):
在上述的線性時不變模型中,x(n)可作為方差是σ2、均值是0,獨立同分布的白噪聲輸出的響應(yīng)[10]。同時σ2代表輸入的信號功率譜密度Sx(ω),AR的傳遞函數(shù)關(guān)系如式(3):
相應(yīng)的模型頻率響應(yīng)函數(shù)是:
所以腦電波信號的功率譜密度從(5)式可以估算出。在這里用只需用Burg算法獲得模型參數(shù)ak,k=1,…,p 即可。
圖4為對個體腦電信號采用Burg AR參數(shù)譜估計法(19階)的實驗結(jié)果,頻帶范圍為[5Hz,32Hz]。在下圖中,紅綠兩條線分別表示兩位受試者在不同時間收集的八條EEG數(shù)據(jù)所獲得的功率譜密度(Power Spectral Density,PSD)PSD特征。顯然,即使4條數(shù)據(jù)采集自不同時段不同狀態(tài),同一受試者的不同條特征曲線走勢基本一致,這表明每個人的腦電信號在一定時間內(nèi)會維持其特征,各個個體特征曲線的波峰位置和尾部波動等能量分布狀況是不一樣的,這又說明每個人的EEG具有類間差異特性。本實驗中的身份識別系統(tǒng)把Burg AR作為其功率譜密度特征,同時為了增加其細節(jié)分辨率需要對功率譜進行對數(shù)處理。由于AR模型避免了窗函數(shù)的影響,Burg譜估計法求得的PSD曲線比較平滑。
圖4 兩位不同受試者Burg AR功率譜密度
我們首先對腦電信號進行預(yù)處理,采用19階AR模型系數(shù)和49階Burg AR功率譜密度[5Hz,30Hz]特征矢量相互結(jié)合的方法。如果分類過程采用所有特征點,其計算量相當(dāng)龐大復(fù)雜,所以在獲取特征以后如圖5所示,特征矢量的降維可以通過線性判別(LDA)方法進行[11],把高維特征矢量投影到最優(yōu)鑒別矢量空間中,這樣既有效降低了特征維度,也得到最小類內(nèi)距離及最大類間距離。
圖5 腦電波識別系統(tǒng)框圖
我們使用10折交叉驗證的方法對計算分類結(jié)果:即將已建立的數(shù)據(jù)庫的數(shù)據(jù)平均分為10份,選擇將其中9份輪流作為訓(xùn)練數(shù)據(jù),1份作為測試數(shù)據(jù),進行試驗。將10次的結(jié)果的正確率的平均值當(dāng)作對算法精度的估計,之后進行多次10折交叉驗證,接著計算出平均值。此外,其分類正確比例可以表示為公式(6),式中aii代表第i個人分類到第j個人的次數(shù)。
通過特征數(shù)量判斷BP神經(jīng)網(wǎng)絡(luò)輸入層數(shù)量,如果身份識別中,EEG數(shù)據(jù)所提取個體的特征是N個,那么神經(jīng)網(wǎng)絡(luò)輸入層數(shù)量同樣是N個[12]。此外,在BP網(wǎng)絡(luò)輸出層數(shù)量方面,主要通過個體種類判斷。比如,受試者為20名,用M表示,假設(shè)采用二進制表示要5位,那么其輸出層數(shù)量是5個。一般情況下,通過使用H=sqrt(N+M)+Q計算出所隱藏層節(jié)點數(shù)量。在上式中,H代表隱藏層節(jié)點數(shù)量,Q代表1至10間的整數(shù),一般情況下依據(jù)經(jīng)驗選用或者通過反復(fù)實驗才能確定。我們可知,MATLAB中的神經(jīng)網(wǎng)絡(luò)工具箱能夠?qū)崿F(xiàn)BP神經(jīng)網(wǎng)絡(luò)算法。
相比于其他分類方法,K鄰近算法不僅簡單,而且識別率非常高。在分類過程中,通常先比較待識別樣本和訓(xùn)練集數(shù)據(jù),接著經(jīng)運算后獲得未知樣本和己知種類訓(xùn)練樣本間的距離,尋找K個相距最近樣本,由這些樣本中出現(xiàn)次數(shù)最多的種類可得到判別結(jié)果。此外,K可以為任意整數(shù),如果K為1,分類器將會退化到最近鄰判決法[13],即比較待識別者所反映出的數(shù)據(jù)和庫中所收集的所有種類樣本,同時將其認定為與它相距最近樣本所在種類。找到距離最近的K個樣本,如式(7)歐幾里德距離,我們中將設(shè)置K=1,與待識別人的腦電特征矢量距離最小的樣本的標簽即是識別結(jié)果。
我們采集20個受試者的腦電信號,所有的被測試者都是20到28歲的健康青年,30天內(nèi)無服用任何藥物。受試者安靜閉眼時,腦電信號由單電極便攜式腦電采集儀記錄,采樣率為512Hz,時長為60秒,每四秒對特征進行一次運算,同時時間窗的重疊為兩秒左右。如果腦電的時間達到m秒時長,那么其分類次數(shù)為(m-2)/2次。假設(shè),PDF(i,j)表示分類結(jié)果向量的概率密度函數(shù),即:
最終,式(8)中如果j使得PDF(i,j)最大,則認為某位受試i為j。
由上文可知,PDF及S所使用的數(shù)據(jù)往往不同,其中對于所有腦電數(shù)據(jù),每進行一次腦電識別,都產(chǎn)生一個PDF函數(shù)。所不同的是,S主要面向全部腦電信號識別系統(tǒng),每進行一次試驗,將只獲取一個分類正確比例。
我們分析對比了BP神經(jīng)網(wǎng)絡(luò)和K鄰近(K=1)算法,在下表1中對比它們在身份識別時的正確比例及所消耗的時間。
表1 BP神經(jīng)網(wǎng)絡(luò)與K鄰近算法比較
選擇濾波與閾值小波相結(jié)合的方法,對20位個體的腦電信號的進行去噪,取得了良好的預(yù)處理效果,同時提取腦信號的時域和頻域的特征進行分析,比較了兩種分類器,K鄰近分類正確率高達94.21%,但耗時較長,BP神經(jīng)網(wǎng)絡(luò)識別率為90.4%,其分類耗時只有0.18s。經(jīng)過研究被試者腦電的判斷正確率及誤判率之后,發(fā)現(xiàn)其正確分類率均高達90%以上,進一步證明了自發(fā)性腦電信號是可以用以作為個體身份識別領(lǐng)域未來的發(fā)展方向。
參考文獻:
[1]Palaniappan R.Mandic D P.EEG Based Biometric Framework for Automatic Identity Verification.The Journal of VLSI Signal Processing,2007,49(2):243-250.
[2]Palaniappan R.Method of identifying individuals using VEP Signals and Neural Network.IEE Proceedings Science,Measurement and Technology,2004,151(1):16-20.
[3]王亮,胡衛(wèi)明,譚鐵牛等.基于步態(tài)的身份識別[J].計算機學(xué)報,2003,26(3):353-360.
[4]Wardzinski R.Emerging biometrics:EEG-based identity 2008,1:4118-21.
[5]林江凱.腦—機接口中運動想象腦電信號的特征提取和分類方法研究[D].重慶大學(xué),2010.
[6]李金瑞.基于圖像的金屬表面直接標記條碼的質(zhì)量評價和信息增強[D].山東大學(xué),2014.
[7]朱麗敏.基于希爾伯特黃變換和源定位的精神分裂癥MEG分析與識別研究[D].南京郵電大學(xué),2016.
[8]王佳威.腦電波信號的處理方法與應(yīng)用[D].北京郵電大學(xué),2015.
[9]馬靜.干涉高光譜圖像高效壓縮技術(shù)研究[D].西安電子科技大學(xué),2009.
[10]付海濤.基于循環(huán)平穩(wěn)的單信道時頻重疊信號分析[D].電子科技大學(xué),2010.
[11]葉洪雨.基于收縮LDA的ERP成分分類研究[J].哈爾濱師范大學(xué)自然科學(xué)學(xué)報;2014年02期.
[12]鄒清.基于AR模型的腦電信號特征提取與識別[D].中南大學(xué);2008年.
[13]張志國.時間序列分析在導(dǎo)彈結(jié)構(gòu)模態(tài)識別中的應(yīng)用[J].四川兵工學(xué)報,2014,35(3):122-125.
[14]張金穎.動態(tài)口令身份認證方案的研究與實現(xiàn)[D].西南交通大學(xué),2006..
Research on Electroencephalograph(EEG)Based Biometrics
WANG Yi,BO Hua
(College of Information Engineering,Shanghai Maritime University,Shanghai 201603)
Proposes an identification method based on EEG signal in a certain range,uses the method of wavelet transform is to process the electrical signals efficiently,rapid extraction of EEG at the time domain and frequency domain features(Auto Regressive Moving Average and Power Spectral Density),and the BP neural network algorithm and K recently nearby comparison,at the same time,K neighboring classification accuracy as high as 94.21%recently,but takes longer,and the BP neural network recognition rate is only slightly lower,its classification takes just 0.18 seconds.It is further evidence that the spontaneous EEG signal can be used as an independent biometric mode applied to the identification of individual identity.
1007-1423(2017)23-0022-05
10.3969/j.issn.1007-1423.2017.23.005
王一(1991-),男,碩士研究生,研究方向為模式識別與圖像處理薄華(1971-),女,博士,副教授,研究方向為模式識別與圖像處理
2017-05-08
2017-08-10
Electroencephalograph;Identity;Pretreatment;Feature Extraction