常文文,王 宏,化成城,王翹秀,原 玥,劉 沖
(東北大學(xué)機械工程與自動化學(xué)院 沈陽 110819)
近年來,基于大腦認(rèn)知事件相關(guān)電位(event related potential, ERP)的隱藏信息測試方法得到快速發(fā)展[1-3],其相關(guān)研究主要涉及以下幾個方面:首先,要能夠成功地誘發(fā)出被試者試圖隱藏的信息,實驗刺激范式的設(shè)計特別重要;其次,如何對誘發(fā)得到的腦電位信號進(jìn)行信息解讀,也即提取到能夠正確表征隱藏信息所誘發(fā)腦電信號的特征量;最后,結(jié)合不同的應(yīng)用場合,選擇和開發(fā)快速、高效和準(zhǔn)確的分類識別算法也是非常關(guān)鍵的一個方面。
目前主流的隱藏信息測試范式都是基于圖片刺激對被試誘發(fā)ERP來完成[1-2],同時文獻(xiàn)[3]研究通過聽覺刺激范式實現(xiàn)對隱藏信息的測試,發(fā)現(xiàn)聽覺刺激測量得到的判別準(zhǔn)確率低于視覺刺激,整體測試效果視覺刺激范式相對較好。本文設(shè)計了視聽同步刺激實驗范式,并同視覺刺激進(jìn)行了對比分析,旨在探究視聽同步刺激對隱藏信息測試的效果。同時大量相關(guān)研究基于單通道或少數(shù)通道(Cz,Pz,Fz)信號的時域和頻域分析為主[1-2,4-5],隨著近幾年腦網(wǎng)絡(luò)分析方法在大腦認(rèn)知研究中的廣泛發(fā)展和成功應(yīng)用[6-8],本文把該方法應(yīng)用到基于腦電信號的隱藏信息測試中,將功能網(wǎng)絡(luò)參數(shù)作為特征量,從而從空間域的角度探究在隱藏信息測試過程中大腦功能狀態(tài)的變化。對不同狀態(tài)腦網(wǎng)絡(luò)特征參數(shù)進(jìn)行分類時,考慮到主流分類器如支持向量機和人工神經(jīng)網(wǎng)絡(luò),存在參數(shù)選擇困難、容易產(chǎn)生區(qū)部最優(yōu)解以及訓(xùn)練速度慢等特點[4-5],本文設(shè)計了基于量子神經(jīng)網(wǎng)絡(luò)(QNN)的特征分類方法,對視覺刺激和視聽同步刺激的ERP腦功能網(wǎng)絡(luò)特征進(jìn)行模式分類和對比分析。
本文設(shè)計了基于聽覺刺激和視聽同步刺激的隱藏信息測試實驗,使用Neuroscan-32導(dǎo)腦電記錄系統(tǒng)完成被試信號的采集,提取出對隱藏信息敏感的P300信號[9],通過計算全腦區(qū)各電極導(dǎo)聯(lián)之間的互信息來構(gòu)建腦功能連接網(wǎng)絡(luò),以功能網(wǎng)絡(luò)的基本特征參數(shù)作為QNN分類器的輸入量,完成對試圖隱藏信息狀態(tài)的檢測。同時本文證實了腦網(wǎng)絡(luò)分析方法和QNN分類器在隱藏信息測試中的可行性以及視聽同步刺激在隱藏信息測試范式設(shè)計中的效果。
20名被試參加實驗(均值:23.6歲, SD:5.3,7名女性),實驗前,每名被試提供兩張照片,一張為被試的導(dǎo)師,另一張是被試的家庭成員,并告知實驗人員照片對應(yīng)的名字。所有照片處理成相同分辨率、亮度和對比度的灰度圖片,大小為37.3 mm×50.3 mm;對應(yīng)名字通過文字?聲音轉(zhuǎn)換軟件轉(zhuǎn)換成音頻文件(.wav格式,男聲,48 kHz采樣,16位),并調(diào)整到相同的聲壓級。每個聲音刺激都由漢字組成,聲音持續(xù)時間為1 000 ms。
實驗為兩種不同的刺激范式:視覺和視聽同步刺激[10-11],通過STIM2軟件來呈現(xiàn)刺激,聲音刺激通過立體耳機呈現(xiàn)給被試。視覺刺激中,只呈現(xiàn)照片,每張照片持續(xù)時間為1 000 ms,窗口時間為1 500 ms,間隔時間為1 700 ms。視聽同步刺激中,照片和聲音同時呈現(xiàn),照片和音頻刺激的時間都為1 000 ms,間隔時間也為1 700 ms。靶刺激(Target, T)為被試導(dǎo)師,無關(guān)刺激(Irrelevant, I)為被試不認(rèn)識的人,探測刺激分兩類,其中被試不熟悉的人為探測刺激1(Probe1, P1),被試熟悉的人為探測刺激2(Probe2, P2),以便于進(jìn)行對比分析。
20名被試分成5組,每組4名被試,對某組中的某名被試,刺激由2張該被試自己提供的照片和音頻文件(T和P2),以及其他3名被試提供的6張照片和音頻文件(1個P1和5個I)組成,也即一個刺激序列有8張照片/音頻刺激。每一個實驗?zāi)K(block)設(shè)計成oddball范式,T、P1、P2和I呈現(xiàn)的次數(shù)分別為15、15、15和75,每個block重復(fù)3次(每名被試總訓(xùn)練(trial)數(shù)為45)。要求被試對出現(xiàn)的照片或聲音做按鍵操作,當(dāng)T出現(xiàn)時,按YES,對不熟悉的人按NO,并告訴被試試圖隱藏對P2的信息,將其歸類到自己不認(rèn)識范圍(即“說謊”),然后按NO。先完成視覺刺激,每個block中途休息3 min。被試坐在舒適的座椅上,眼睛到顯示屏距離80 cm,對視聽同步刺激范式,被試要求眼睛注視顯示器中央。
實驗刺激呈現(xiàn)和EEG數(shù)據(jù)記錄采用neuroscan32導(dǎo)采集系統(tǒng),該系統(tǒng)為10-20國際電極標(biāo)準(zhǔn),采樣頻率為1 000 Hz,參考電極為左右耳垂,前額接地,在線采樣頻帶為0~100 Hz,垂直眼電電極位于左眼上下2 cm,兩眼外眼角處為水平眼電電極。在EEGLAB軟件中對腦電初始信號進(jìn)行去眼電、去除漂移較大和噪聲污染嚴(yán)重的數(shù)據(jù)段等,完成偽跡處理。截取?100~923 ms的數(shù)據(jù)點為一個epoch數(shù)據(jù)段(1 024個點),也即一個ERP片段數(shù)據(jù),之后對所有epoch進(jìn)行平均,得到每位被試的ERP數(shù)據(jù),對有效被試的ERP進(jìn)行總平均得到如圖1所示的總平均ERP信號(圖中為Pz導(dǎo)聯(lián)上的ERP)。通過對ERP數(shù)據(jù)的7層小波包分解和對delta波段(0.48~3.9 Hz)的重構(gòu)得到對隱藏信息敏感的P300信號[9]。
圖1 視覺刺激和視聽同步刺激誘發(fā)ERP信號(Pz導(dǎo)聯(lián))
同時對圖1中Pz導(dǎo)聯(lián)處說謊(P2)和說真話(P1)狀態(tài)下P300幅值信號計算均值并做t檢驗,對視聽刺激,P1:Mean=8.380 1,SD=1.954 3,P2:Mean=12.394 4,SD=1.358 1,t=2.408,p=0.027;對視覺刺激,P1:Mean=4.712 5,SD=1.730 5,P2:Mean=6.544 9,SD=1.429 9,t=2.156,p=0.039??梢钥闯霰辉囋谡f謊和說真話時P300幅值信號之間有顯著的差異。
研究表明,人的大腦在處理認(rèn)知任務(wù)的過程中需要全腦不同功能區(qū)域的協(xié)調(diào)和合作,但是不同腦區(qū)對應(yīng)于不同的認(rèn)知功能分配[7,12],因此最為直接的研究手段是探究不同腦區(qū)之間信號的相關(guān)程度,來了解不同認(rèn)知任務(wù)在不同腦區(qū)的活躍程度以及全腦功能狀態(tài)的變化。目前文獻(xiàn)中有關(guān)信號間相互依賴性的算法有很多[13-14],但互信息(mutual information,MI)能夠同時表征兩個時間序列之間的線性和非線性統(tǒng)計特性[15],可以成功地表現(xiàn)腦區(qū)連接中的信息傳遞關(guān)系。因此本文采用互信息來計算全腦區(qū)不同電極之間的依賴關(guān)系,并構(gòu)建對應(yīng)的腦功能網(wǎng)絡(luò)。
在信息論中,熵用來度量兩個信號間的不確定性。對于一離散隨機序列X,其對應(yīng)的輸出量為Xi,為序列點數(shù),每一個輸出對應(yīng)的概率為pi,對應(yīng)該序列的Shannon熵定義為[14-15]:
基于對熵的定義,可以定義序列X和Y之間的同步關(guān)系,將其互信息定義為:
一般腦網(wǎng)絡(luò)表示為G(V,E),其中,V為網(wǎng)絡(luò)的節(jié)點,對應(yīng)腦電信號中不同的導(dǎo)聯(lián),本文采集有效數(shù)據(jù)導(dǎo)聯(lián)為30;E為網(wǎng)絡(luò)的邊[6-7],對應(yīng)腦電信號中不同導(dǎo)聯(lián)之間的相互依賴關(guān)系,本文中即為上述討論的MI值。對以上20名被試中有效被試(視聽刺激為17名,視覺刺激為16名)在不同實驗范式和不同刺激類型下各導(dǎo)聯(lián)ERP總平均信號計算其各導(dǎo)聯(lián)之間的MI值,得到不同導(dǎo)聯(lián)之間的鄰接矩陣(30×30),并表示為大腦拓?fù)浣Y(jié)構(gòu)圖的形式,如圖2所示??梢灾庇^地看到,“說謊”組腦網(wǎng)絡(luò)拓?fù)溥B接密度整體大于“說真話”組,同時被試對熟悉人的拓?fù)溥B接密度大于對陌生人的連接密度,而視覺刺激和視聽同步刺激拓?fù)浣Y(jié)構(gòu)存在細(xì)微差異,但定性表征的差異不夠明顯。
圖2 不同狀態(tài)下腦功能網(wǎng)絡(luò)拓?fù)溥B接
為了定量表征腦網(wǎng)絡(luò)特征,本文重點討論了腦功能網(wǎng)絡(luò)的兩個基本特征量[6-7]:聚集系數(shù)C(clustering)和特征路徑長度L(path length)。聚集系數(shù)表示的是網(wǎng)絡(luò)的局部聚集能力。對于節(jié)點i,如果周圍和它相連的節(jié)點數(shù)為k,也即有k個鄰居節(jié)點,則將節(jié)點i的聚集系數(shù)定義為該節(jié)點鄰居節(jié)點間實際的連接邊和最多可能的連接邊的比值:
式中,w為不同節(jié)點i,j,k之間的加權(quán)連接邊;N為網(wǎng)絡(luò)的總節(jié)點數(shù)。則整個網(wǎng)絡(luò)的聚集系數(shù)定義為:
特征路徑長度表征了網(wǎng)絡(luò)的全局特性,對于加權(quán)網(wǎng)絡(luò),為了處理網(wǎng)絡(luò)中的孤立節(jié)點,一般用全局效率的倒數(shù)來計算特征路徑長度。首先將某條路徑上所有邊的長度之和定義為這條路徑的加權(quán)長度,選擇Lij為節(jié)點i和j之間的最短路徑長度,整個網(wǎng)絡(luò)的加權(quán)長度定義為所有節(jié)點對之間最短路徑長度的總平均:
計算所有有效被試以上不同刺激范式和不同狀態(tài)下的C和L,如圖3所示,圖中“*”表示p<0.05。
可以看出,不管是對視覺刺激還是視聽同步刺激,I狀態(tài)下的C值和L值和P1狀態(tài)下的值接近,T狀態(tài)和P2狀態(tài)的特征值接近。同時就說謊組和真實組的腦網(wǎng)絡(luò)參數(shù)進(jìn)行了t檢驗,其結(jié)果顯示不管是對視聽刺激還是視覺刺激,聚集系數(shù)和特征路徑長度都有顯著性差異(視聽刺激,C:t=3.975,p=0.001,L:t=3.612,p=0.002;視覺刺激,C:t=3.167,p=0.006,L:t=2.830,p=0.013)??梢缘贸龃竽X對熟悉人的信息和陌生人的信息誘發(fā)的腦網(wǎng)絡(luò)參數(shù)是有差異的,整體來講對熟人刺激產(chǎn)生的腦功能網(wǎng)絡(luò)的C值相對增大,而L值相對減小,表明被試在受到熟人信息刺激的時候大腦各區(qū)域局部聚集能力增強,全局連接能力變?nèi)酰竽X活動更加集中在某些特定區(qū)域內(nèi)。從圖中并不能直觀得到視覺刺激和視聽刺激之間的差別,因此考慮通過對腦網(wǎng)絡(luò)參數(shù)的量子神經(jīng)網(wǎng)絡(luò)分類,來判斷和驗證腦網(wǎng)絡(luò)特征對隱藏信息分析的作用。
圖3 不同刺激范式和不同刺激狀態(tài)下腦網(wǎng)絡(luò)特征參數(shù)均值及t檢驗結(jié)果
量子神經(jīng)網(wǎng)絡(luò)將量子計算的方法應(yīng)用到人工神經(jīng)網(wǎng)絡(luò)中,使其具有較小的網(wǎng)絡(luò)規(guī)模和簡單的拓?fù)浣Y(jié)構(gòu)、更好的穩(wěn)定性和有效性,具有快速學(xué)習(xí)和高速信息處理能力[16-17]。本文設(shè)計了基于量子門節(jié)點的神經(jīng)網(wǎng)絡(luò)分類器(quantum gated neural network,QGNN),如圖4所示[18-19]。其中,網(wǎng)絡(luò)輸入為隱層輸出為神經(jīng)網(wǎng)絡(luò)輸出為
圖4 量子門節(jié)點神經(jīng)網(wǎng)絡(luò)模型
對于n維樣本空間第k個樣本表示為k,有為樣本總數(shù),則其對應(yīng)的量子態(tài)表述為:
式中,
將網(wǎng)絡(luò)的誤差定義為:
本文計算了所有有效被試在所有刺激類型下的腦網(wǎng)絡(luò)參數(shù)C和L,表1為所有有效被試對應(yīng)參數(shù)值??紤]到實驗設(shè)計中靶刺激和無關(guān)刺激的作用,定義了隱藏信息特征判別系數(shù)為:
分別計算不同刺激范式下對應(yīng)的Cindex和Lindex,作為量子門神經(jīng)網(wǎng)絡(luò)的輸入向量,對視覺刺激和視聽同步刺激分開處理。
表1 所有有效被試在不同狀態(tài)下腦功能網(wǎng)絡(luò)特征參數(shù)值(聚集系數(shù):C,特征路徑長度:L)
本文通過最小梯度法構(gòu)建量子神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)算法,通過訓(xùn)練數(shù)據(jù)得到分類器最佳參數(shù),然后使用測試數(shù)據(jù)進(jìn)行分類測試。通過十則交叉驗證,最后得到平均分類準(zhǔn)確率分別為:視覺刺激80.25%,視聽同步刺激81.69%??梢钥吹揭曈X刺激和視聽同步刺激誘發(fā)腦網(wǎng)絡(luò)特征參數(shù)結(jié)合量子神經(jīng)網(wǎng)絡(luò)對隱藏信息測試能夠得到較高的識別準(zhǔn)確率,同時視聽同步刺激的分類識別率稍高,主要是因為實驗過程中視聽同步刺激相對單調(diào)的視覺刺激更能引起被試注意力的集中以及對隱藏信息的響應(yīng)。為了同常用分類器進(jìn)行對比,用SVM對上述同樣的參數(shù)進(jìn)行了分類討論,得到分類正確率為:視覺刺激82.19%,視聽同步刺激84.23%??梢钥闯?,對兩種刺激范式,SVM分類器能夠得到較高的識別率,而且高于本文中重點討論的QNN分類器。這主要是由于本文中樣本數(shù)量偏小,QNN的優(yōu)勢并沒有表現(xiàn)出來,同時對量子神經(jīng)網(wǎng)絡(luò)分類器的結(jié)構(gòu)也有待優(yōu)化提升。但是這并不影響將QNN引入到隱藏信息測試中,相信隨著對QNN研究的深入,將會有更多更加高效的優(yōu)質(zhì)QNN分類器出現(xiàn)。
本文使用Neuroscan腦電實驗設(shè)備,對模擬說謊狀態(tài)下的20名被試進(jìn)行了隱藏信息監(jiān)測,分別在視覺刺激和視聽同步刺激范式下完成實驗和腦電信號采集,利用互信息構(gòu)建了不同狀態(tài)下腦功能網(wǎng)絡(luò),計算腦網(wǎng)絡(luò)特征參數(shù)作為本文的基本特征量;最后設(shè)計了量子門節(jié)點神經(jīng)網(wǎng)絡(luò)分類器,對被試在說謊和沒說謊這兩種狀態(tài)下的腦網(wǎng)絡(luò)特征量進(jìn)行了分類。結(jié)果顯示,兩種刺激范式都有較高的識別正確率,視聽同步刺激的識別率要稍微高于視覺刺激,說明利用腦網(wǎng)絡(luò)基本特征參數(shù)可以較好地識別被試的說謊狀態(tài),同時表明由于視聽同步刺激給被試的刺激信息要大于單純的視覺刺激,在實驗過程中對隱藏信息能夠產(chǎn)生更多的腦區(qū)活動,更容易對其進(jìn)行辨識。量子神經(jīng)網(wǎng)絡(luò)作為一種新型高效神經(jīng)網(wǎng)絡(luò)算法,由于其特有的優(yōu)點在隱藏信息監(jiān)測等模式分類研究中發(fā)揮獨特的作用。隨著腦與認(rèn)知科學(xué)研究的深入,特別是近幾年腦成像技術(shù)的發(fā)展,融合多范式多特征以及特定分類算法的隱藏信息檢測研究將會是未來研究的重點,本文也是對多種方法融合的一種嘗試。