鄭 銳,劉久富 ,楊 忠,王志勝,劉海陽(yáng),丁曉彬
(1.南京航空航天大學(xué) 自動(dòng)化學(xué)院,江蘇 南京 211100;2.東南大學(xué) 電子科學(xué)與工程學(xué)院,江蘇 南京 210096)
睡眠質(zhì)量問(wèn)題一直是人們關(guān)注自身健康和科學(xué)研究的重點(diǎn)之一,有效地區(qū)分睡眠質(zhì)量的高低對(duì)于治療睡眠呼吸暫停,失眠和發(fā)作性睡病十分有益。以往,人們對(duì)睡眠質(zhì)量的檢測(cè)基本是依靠人自身的主觀感受,醫(yī)學(xué)專(zhuān)家只有通過(guò)病人口述癥狀和結(jié)合其他并發(fā)癥狀才能判斷出病人的睡眠情況,這種方法缺乏客觀性,過(guò)程繁瑣,準(zhǔn)確性不高。睡眠研究的重要數(shù)據(jù)人體腦電信(electroencephalogram,EEG)數(shù)據(jù)量巨大,人工通過(guò)實(shí)驗(yàn)觀察存在較大的復(fù)雜性。計(jì)算生物學(xué)上常應(yīng)用統(tǒng)計(jì)學(xué)和計(jì)算機(jī)算法對(duì)復(fù)雜海量的生物學(xué)信號(hào)進(jìn)行識(shí)別和處理,可以有效地提取有用的信息[1]。文中引入了睡眠專(zhuān)家標(biāo)注過(guò)的六狀態(tài)睡眠分期腦電信號(hào)進(jìn)行分析。
馬氏田口方法作為一種模式識(shí)別與分類(lèi)方法,廣泛應(yīng)用于多元系統(tǒng)的自動(dòng)化異常診斷與分析中,準(zhǔn)確性較好[2-3]。通過(guò)構(gòu)建馬氏基準(zhǔn)空間,可以有效地區(qū)分正常樣本和異常樣本。通過(guò)正交表和信噪比來(lái)對(duì)各個(gè)變量進(jìn)行優(yōu)化,選取最優(yōu)的變量從而對(duì)所研究的問(wèn)題進(jìn)行更好的分類(lèi)和預(yù)測(cè)[4]。文中在人工專(zhuān)家睡眠分期標(biāo)記過(guò)的腦電信號(hào)數(shù)據(jù)的基礎(chǔ)上,采用施密特正交化馬氏田口方法(Mahalanobis-Taguchi-Gram-Schmidt process,MTGS)對(duì)人睡眠質(zhì)量的正常和異常進(jìn)行檢測(cè)。與傳統(tǒng)的馬氏田口方法(Mahalanobis-Taguchi system,MTS)需要計(jì)算相關(guān)矩陣的逆矩陣不同,該方法通過(guò)施密特正交化計(jì)算馬氏距離,能夠有效地處理多重共線性問(wèn)題,不必通過(guò)正交表計(jì)算信噪比,降低了算法的運(yùn)算復(fù)雜度。
MTGS比MTS具有更大的優(yōu)勢(shì),為了突出顯示這些方法之間的差異,先闡述一下MTS,之后將討論MTGS及其改進(jìn)的變體。
在馬氏田口系統(tǒng)中計(jì)算馬氏距離(Mahalanobis-distance,MD)可參見(jiàn)下列公式[5-6]:
(1)
Zij=(Xij-mi)/si
(2)
其中,i(i=1,2,…,k)表示變量數(shù)目,k表示變量總數(shù);j(j=1,2,…,n)表示樣本數(shù)目,n表示樣本總數(shù);Zij表示歸一化變量Xij的標(biāo)準(zhǔn)化向量,Xij表示第j個(gè)樣本的第i個(gè)變量值;mi表示健康組中的第i個(gè)變量的平均值;si表示健康組中第i個(gè)變量的標(biāo)準(zhǔn)偏差;C表示健康組的關(guān)聯(lián)矩陣。
在計(jì)算馬氏距離(MD)之后,使用正交陣列來(lái)計(jì)算每個(gè)實(shí)驗(yàn)的信噪比S/N。在正交陣列中,考慮了兩個(gè)級(jí)別的變量,這表明它們的存在或不存在。根據(jù)用于構(gòu)建MD的變量,確定信噪比S/N的類(lèi)型。對(duì)于真實(shí)水平異常未知的制造檢驗(yàn),信噪比S/N越大越好[7]。信噪比S/N可以用以下方式計(jì)算:
(3)
在式1中,對(duì)于所考慮的變量之間存在相關(guān)性非常高的情況,相關(guān)矩陣變得奇異,相關(guān)矩陣C的逆矩陣不正確。這種在變量之間具有強(qiáng)相關(guān)性的現(xiàn)象稱(chēng)為多重共線性,根據(jù)式1和式2,可能不準(zhǔn)確。此外,在某些情況下需要觀察到良好的異常值發(fā)生方向,MTS無(wú)法識(shí)別異常的方向,對(duì)于異常方向的多重共線性和識(shí)別,優(yōu)選MTGS方法。
MTGS是對(duì)MTS的改進(jìn),通過(guò)Gram-Schmidt正交化處理(Gram-Schmidt orthogonalization process,GSP)可以計(jì)算出MTGS方法中的MD。
Gram-Schmidt正交化處理將線性獨(dú)立向量轉(zhuǎn)換成正交向量。通過(guò)式2得到的正態(tài)變量(Zij)的標(biāo)準(zhǔn)化向量被視為線性獨(dú)立向量以計(jì)算向量的正交集合。Gram-Schmidt正交化過(guò)程的方程組如下[8-9]:
(4)
其中,Zk=(Zk1,Zk2,…,Zkn)是根據(jù)等式獲得的標(biāo)準(zhǔn)矢量的第k組;Uk=(Uk1,Uk2,…,Ukn)是具有相同線性跨度的相互垂直向量的第k組。
對(duì)應(yīng)第j次觀測(cè)的馬氏距離如下式[10]:
(5)
其中,Ukj是正交矢量Uk的元素;Sk是Uk的標(biāo)準(zhǔn)偏差;k是變量總數(shù)。
在MTGS方法中,可以直接計(jì)算變量的S/N比。第i個(gè)變量的信噪比S/N[11]為:
(6)
然而,根據(jù)式6計(jì)算S/N,只有當(dāng)所考慮的變量之間的部分相關(guān)性的影響不顯著時(shí)才有效。另外,通過(guò)利用式6在MTGS過(guò)程中,結(jié)果取決于考慮變量的順序。因此,通過(guò)MTGS方法計(jì)算MD并采用正交陣列,并根據(jù)式3評(píng)估S/N比的方法消除了MTS和MTGS的所有缺點(diǎn)。這里使用改進(jìn)過(guò)的MTGS方法。
算法:MTGS異常檢測(cè)算法
輸入:Xij,M,N;
1.獲取數(shù)據(jù)序列Xij。
3.求解歸一化向量Zij。
While(1≤i≤M)
While(1≤i≤N)
Zij=(Xij-mi)/si
End While;
End While;
ReturnZij
4.施密特正交化處理,得到Uij。
While(1≤k≤M)
End While;
ReturnU1,U2,…,Uk
5.求解Uk的標(biāo)準(zhǔn)差si,Uij為Uk中的元素。
6.計(jì)算信噪比值ηi。
While(1≤j≤N)
While(1≤i≤M)
ηi=-10*log(Si*Si/Uji*Uji)
End While;
End While;
Returnηi
While(1≤j≤N)
x=x+ηi
End While;
多導(dǎo)睡眠圖是一種應(yīng)用于睡眠障礙診斷和治療的技術(shù),其中腦電信號(hào)(EEG)是代表大腦神經(jīng)元活動(dòng)的一種電信號(hào),可無(wú)創(chuàng)測(cè)量,所以EEG信號(hào)一直是研究人體不同睡眠周期大腦活動(dòng)的有力工具[12]。傳統(tǒng)的睡眠階段分類(lèi)是專(zhuān)家根據(jù)Rechtschaffen和Kales(R & K)制定的分類(lèi)標(biāo)準(zhǔn)。文中使用R & K標(biāo)準(zhǔn)中的六狀態(tài)睡眠階段:清醒期(Awa),第1階段(S1),第2階段(S2),第3階段(S3),第4階段(S4)和快速眼動(dòng)期(REM)。
使用的實(shí)驗(yàn)數(shù)據(jù)來(lái)自Sleep-EDF數(shù)據(jù)庫(kù),它是Physionet數(shù)據(jù)庫(kù)的一部分。文中使用了兩組實(shí)測(cè)的睡眠腦電數(shù)據(jù)記錄,測(cè)試者的年齡為21~55歲,平均年齡36歲。第一組數(shù)據(jù)記錄了112例睡眠健康志愿者的睡眠數(shù)據(jù),把這一組作為研究的睡眠正常組。第二組數(shù)據(jù)記錄了108例有輕度睡眠障礙的受試者的睡眠數(shù)據(jù),把這一組作為研究的睡眠異常組。在這項(xiàng)研究中,選擇Pz-Oz和Fpz-Cz兩個(gè)通道的EEG信號(hào)來(lái)分析和識(shí)別睡眠階段。這些段的原始睡眠階段用6個(gè)類(lèi)別來(lái)標(biāo)記:S1,S2,S3,S4,REM和Awa,文中研究?jī)H涉及AWA,S1~S4和REM睡眠階段。對(duì)每個(gè)通道的每個(gè)睡眠階段分別采樣,兩個(gè)通道的六個(gè)周期各采集200組EEG信號(hào)值,EEG信號(hào)圖如圖1所示。
圖1 EEG信號(hào)
采用前述的GSP方法對(duì)睡眠數(shù)據(jù)進(jìn)行處理。MTGS異常檢測(cè)算法展示了數(shù)據(jù)處理的全過(guò)程,健康組樣本和異常組樣本均采用該算法。
利用六個(gè)周期的健康組和異常組樣本數(shù)據(jù),計(jì)算出各個(gè)通道的均值mi、標(biāo)準(zhǔn)差si。然后根據(jù)式2對(duì)原始向量進(jìn)行標(biāo)準(zhǔn)化處理以得到線性獨(dú)立向量,對(duì)線性獨(dú)立向量做正交化處理。使用式6計(jì)算出各樣本的S/N信噪比值。分別求取健康組和異常組六個(gè)睡眠周期的S/N比率的平均值,繪制健康組與異常組S/N信噪比平均值分布的波形圖,如圖2所示。
可以看出,從清醒期開(kāi)始,第一階段到第四階段,再到REM階段,睡眠正常者的各周期信噪比均值均處于睡眠異常者的上方,由此看來(lái),可以明顯區(qū)分出睡眠正常者和睡眠異常者。
圖2 S/N均值波形
圖中,睡眠異常者的清醒期的信噪比均值與睡眠正常者相比,差距很大,進(jìn)入睡眠第一階段后有一個(gè)明顯的提升。相較于睡眠正常者,異常者的六個(gè)睡眠周期的信噪比均值的波動(dòng)性較大。此外,兩條信噪比均值的曲線都呈上升趨勢(shì),其中異常者的上升幅度明顯快于正常者。
在清醒期(Awa),睡眠正常者和異常者信噪比均值分別為-51.84和-67.94,二者差值達(dá)到了16.1,差距很大。在睡眠周期的第一階段,睡眠正常者信噪比均值為-44.22,睡眠異常者信噪比均值為-51.62,比健康者降低了7.4,相較于清醒期差值有所減?。坏诙A段相較于第一階段二者的差距有所拉大;第三階段,睡眠正常者的信噪比均值為-45.64,睡眠異常者的信噪比均值為-51.13,異常者要比正常者低了5.49,信噪比均值的差距縮小,但仍大于第一階段的差距;第四階段,睡眠異常者要比正常者低了7.0,相較于上一階段差距增大;在REM階段,睡眠正常者與異常者的差值達(dá)到6.21,比上一階段有小幅減少。
闡述了人體睡眠質(zhì)量的自動(dòng)檢測(cè)方法,采用施密特正交化馬氏田口方法求取EEG信號(hào)的信噪比均值,進(jìn)而實(shí)現(xiàn)對(duì)正常者和異常者的有效辨識(shí)。采用的EEG信號(hào)由人工專(zhuān)家精確劃分為六個(gè)睡眠周期,分別對(duì)這六個(gè)睡眠周期使用馬氏田口正交化處理方法(MTGS)求取信噪比值。最后對(duì)各個(gè)周期的信噪比均值波形進(jìn)行對(duì)照發(fā)現(xiàn),從清醒期開(kāi)始,第一階段到第四階段,再到REM階段,睡眠正常者的各周期信噪比均值均處于睡眠異常者的上方。因此,使用MTGS方法可以有效地區(qū)分睡眠正常者和睡眠異常者。將該算法應(yīng)用于人體睡眠質(zhì)量判別,為人工智能自動(dòng)檢測(cè)睡眠質(zhì)量取代傳統(tǒng)人工判別提供了新的思路。
將馬氏田口模型應(yīng)用于解決人體睡眠質(zhì)量的檢測(cè)問(wèn)題,有一定的可行性,但考慮其實(shí)現(xiàn)的前提是要基于人工專(zhuān)家劃分完成的六個(gè)睡眠分期,使其應(yīng)用存在局限性。未來(lái)可考慮采用馬氏田口模型對(duì)睡眠腦電信號(hào)進(jìn)行自動(dòng)睡眠分期,從而提升整體睡眠質(zhì)量檢測(cè)算法的應(yīng)用范圍。