李 艷,卓雁文,楊思琪,湯 池,羅二平,謝康寧
(1空軍軍醫(yī)大學(xué)軍事生物醫(yī)學(xué)工程學(xué)系軍事醫(yī)學(xué)裝備與計量學(xué)教研室,陜西 西安 710032; 2解放軍第95788部隊60分隊,四川 成都 610000)
生理信號可以看作是生物系統(tǒng)的輸出變量,其中蘊含著大量有關(guān)生物系統(tǒng)的狀態(tài)信息。人們可以通過分析生理信號來區(qū)分人體不同的生理或病理狀態(tài),例如借助心電圖幫助診斷心律失常、心肌缺血等疾病[1];通過腦電信號判斷帕金森、癲癇等精神性疾病[2-4],還可以用于監(jiān)測術(shù)中的麻醉深度以及研究睡眠分期[5-7]。因此,生理信號具有十分重要的研究意義。生理信號的特點決定了其分析的復(fù)雜性和多樣性,而傳統(tǒng)的時頻分析等方法更適用于分析線性平穩(wěn)信號,而對于生理信號這類具有非線性、非平穩(wěn)等特點的信號分析則存在一定局限。近些年來人們嘗試用非線性動力學(xué)方法來分析生物信號,得到了較好的結(jié)果。其中,復(fù)雜度就是時間序列信號非線性動力學(xué)的重要特征之一。
多尺度熵(multiscale entropy,MSE)是用于測量時間序列復(fù)雜度的常用算法,并被應(yīng)用于生物醫(yī)學(xué)、交通和金融等領(lǐng)域[8-9]。MSE及其變體作為度量生理信號復(fù)雜度的方法之一,被廣泛研究。然而,MSE及其改進方法有兩個缺點:首先,MSE認(rèn)為含有白噪聲的生理時間序列具有更高的復(fù)雜度,而白噪聲是一種完全隨機信號,無序程度最高,應(yīng)該具有最低的復(fù)雜度。其次,MSE并不能直接表明復(fù)雜性,在比較熵值大小的同時還需要考慮熵值變化趨勢[8-11]。
為了克服這兩個困難,HAN等[12-13]提出了一種新的生物信號復(fù)雜度分析方法——冪律調(diào)制多尺度熵(power-law exponent modulated multiscale entropy,pMSE),針對MSE的不足和缺陷進行了改進,可以為生理時間序列提供直接的復(fù)雜性度量。然而,對于較短的時間序列而言,需要避免未定義的熵值,并減小計算方差。WU等[14]提出的修正多尺度熵(modified multiscale entropy,MMSE),使用移動平均過程代替粗?;^程,可以在短時間序列上提高精度和避免未定義的熵值。
在本次研究中,我們基于pMSE算法并借鑒MMSE算法的移動平均過程,提出一種改進的定量生理信號復(fù)雜度的方法——低方差冪律調(diào)制多尺度熵(low-variance power-law modulation multiscale entropy,Lv-pMSE)算法,并通過仿真和真實信號進行驗證和測試。
生理信號的功率譜服從冪律分布,即信號的功率譜隨頻率的增加呈冪律函數(shù)遞減,用公式可以表示為:P∝1/fβ,其中P是功率,f是頻率,β是冪律指數(shù)[8]。當(dāng)β=0時,信號為白噪聲;當(dāng)β=1時,信號稱為1/f噪聲或閃爍噪聲。
HAN等[12-13]基于MSE算法,將熵和分形的自相似相結(jié)合,并借助冪律指數(shù)β來描述信號的自相似性,提出了pMSE算法,計算公式為:
(1)
其中τ是尺度因子,MSEτ是第τ個尺度的多尺度熵值,βτ是第τ個尺度上的冪律指數(shù)。當(dāng)以尺度因子τ的自然對數(shù)ln(τ)為橫坐標(biāo)時,MSE在各個尺度上的值與ln(τ)成正比,關(guān)系表達式為:
(2)
表達式中slopeτ是MSE曲線的斜率,則MSE曲線的斜率slopeτ與βτ之間存在一種線性關(guān)系,即
(3)
計算出MSE在各個尺度處曲線的斜率slopeτ,便可以得到估計的βτ近似值。所以pMSE可以寫成:
pMSEτ=MSEτ×|slopeτ+0.5|
(4)
雖然pMSE方法有較好的應(yīng)用效果,但是在估計冪律指數(shù)β的過程中引入了一定誤差,導(dǎo)致pMSE分析中的方差較大[12]。同時,粗?;^程導(dǎo)致大時間尺度下樣本熵的統(tǒng)計可靠性和估計準(zhǔn)確性降低。
為了降低pMSE在分析信號中的方差,我們借鑒了MMSE中的移動平均過程思想[14],提出了Lv-pMSE,希望可以在保持pMSE好的應(yīng)用效果的同時,降低其在分析中的方差并適用于小數(shù)據(jù)分析,提高pMSE運算結(jié)果的穩(wěn)定性。
Lv-pMSE的計算過程結(jié)合了MMSE中的移動平均法和pMSE的冪律指數(shù)β估計,該算法首先對時間序列xi進行移動平均過程計算,得到尺度τ所對應(yīng)的移動平均時間序列zτ:
(5)
然后計算尺度因子τ下的時間序列的MMSE:
MMSE(x,m,r,t)=SampEn(zτ,m,r,t)
(6)
其中SampEn是樣本熵[15],m是嵌入維數(shù),r是延遲因子,τ是尺度因子,通常取m=2,r=1,τ=20。則Lv-pMSE的表達式為:
(7)
βτ的計算方法與pMSE算法相同,Lv-pMSE最終可以寫為:
Lv-pMSEτ=MMSEτ×|slopeτ+0.5|
(8)
白噪聲和1/f噪聲是兩種具有冪律分布特征的特殊單分形信號。β=0時,信號為白噪聲;β=1時,信號為1/f噪聲。為了驗證Lv-pMSE算法的可靠性,首先采用這兩種仿真信號對其進行算法驗證。
2.1.1 實驗方法 ①在Matlab(版本號R2018b)中生成單分形條件下的冪律分布信號。白噪聲信號(β=0)和1/f噪聲信號(β=1),噪聲信號均由LITTLE等[16]提供的函數(shù)powernoise.m生成。②研究數(shù)據(jù)長度對pMSE和Lv-pMSE方法的影響。使用Matlab依次生成30組多種數(shù)據(jù)長度(N=3 000,5 000,10 000)的白噪聲和1/f噪聲信號,對不同長度的白噪聲和1/f噪聲序列進行pMSE和Lv-pMSE的熵值曲線分析,對三種數(shù)據(jù)長度的兩種方法的方差進行統(tǒng)計學(xué)分析。每種數(shù)據(jù)長度均采取30組獨立的噪聲樣本。
2.1.2 實驗結(jié)果 使用pMSE和Lv-pMSE分別對N=3 000、N=5 000和N=10 000時的白噪聲和1/f噪聲進行分析。其中在N=3 000時,白噪聲的pMSE曲線和Lv-pMSE在各個尺度上均有差異(Mann-Whitney檢驗,P<0.05);在N=5 000和N=10 000時,僅在少部分尺度上有差異,所以數(shù)據(jù)長度N=3 000時,Lv-pMSE方法的擬合效果欠佳(圖1)。1/f噪聲的Lv-pMSE曲線波動小于pMSE,且整體均值更接近1(圖2)。結(jié)果表明,Lv-pMSE的分析結(jié)果更符合ZHANG[17]的結(jié)論,即白噪聲復(fù)雜度為0,1/f噪聲復(fù)雜度接近于1。
A:N=3 000的白噪聲熵值分析;B:N=5 000的白噪聲熵值分析;C:N=10 000的白噪聲熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:冪律調(diào)制多尺度熵;Lv-pMSE:低方差冪律調(diào)制多尺度熵。 aP<0.05 vs Lv-pMSE。圖1 白噪聲的pMSE和Lv-pMSE分析
A:N=3 000的1/f噪聲熵值分析;B:N=5 000的1/f噪聲熵值分析;C:N=10 000的1/f噪聲熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:冪律調(diào)制多尺度熵;Lv-pMSE:低方差冪律調(diào)制多尺度熵。aP<0.05 vs Lv-pMSE。圖2 1/f 噪聲的pMSE和Lv-pMSE分析
不同數(shù)據(jù)長度中,不論是白噪聲還是1/f噪聲,Lv-pMSE的方差均小于pMSE的方差。在白噪聲的pMSE和Lv-pMSE分析中,當(dāng)N=3 000時,pMSE中方差的中位數(shù)為0.575 0,Lv-pMSE中方差的中位數(shù)為0.315,可以認(rèn)為pMSE的方差高于Lv-pMSE的方差,差異有統(tǒng)計學(xué)意義(Mann-Whitney檢驗,P<0.05)。當(dāng)N=5 000時,pMSE中方差的中位數(shù)為0.325 0,Lv-pMSE中方差的中位數(shù)為0.023 5,可以認(rèn)為pMSE的方差高于Lv-pMSE的方差,差異有統(tǒng)計學(xué)意義(Mann-Whitney檢驗,P<0.05)。當(dāng)N=10 000時,pMSE中方差的中位數(shù)為0.023 0,Lv-pMSE中方差的中位數(shù)為0.017 0,可以認(rèn)為pMSE的方差高于Lv-pMSE的方差,差異有統(tǒng)計學(xué)意義(Mann-Whitney檢驗,P<0.05)。在1/f噪聲的pMSE和Lv-pMSE分析中,當(dāng)N=3 000時,pMSE中方差的中位數(shù)為0.222 5,Lv-pMSE中方差的中位數(shù)為0.140 0,可以認(rèn)為pMSE的方差高于Lv-pMSE的方差,差異有統(tǒng)計學(xué)意義(Mann-Whitney檢驗,P<0.05)。當(dāng)N=5 000時,pMSE中方差的中位數(shù)為0.146 0,Lv-pMSE中方差的中位數(shù)為0.083 5,可以認(rèn)為pMSE的方差高于Lv-pMSE的方差,差異有統(tǒng)計學(xué)意義(Mann-Whitney檢驗,P<0.05)。當(dāng)N=10 000時,pMSE中方差的中位數(shù)為0.065 0,Lv-pMSE中方差的中位數(shù)為0.048 5,可以認(rèn)為pMSE的方差高于Lv-pMSE的方差,差異有統(tǒng)計學(xué)意義(Mann-Whitney檢驗,P<0.05)。
隨著信號數(shù)據(jù)長度的增加,方差的降低比例也逐漸降低。計算可得,在白噪聲的分析中,當(dāng)數(shù)據(jù)長度分別為N=3 000、N=5 000和N=10 000時,Lv-pMSE的方差比pMSE的方差分別降低了53.0%、36.0%和34.0%。在1/f噪聲的分析中,當(dāng)數(shù)據(jù)長度分別為N=3 000、N=5 000和N=10 000時,Lv-pMSE的方差比pMSE的方差分別降低了48.3%、51.0%和44.0%。
2.2.1 數(shù)據(jù)來源與處理 為了驗證Lv-pMSE算法對真實數(shù)據(jù)復(fù)雜度評估的有效性,選取了心電信號進行Lv-pMSE評價。心電數(shù)據(jù)選自PhysioNet數(shù)據(jù)庫[18],從數(shù)據(jù)庫中選取正常竇性心律(normal sinus rhythm,NSR)受試者、充血性心力衰竭(congestive heart failure,CHF)患者和房顫(atrial fibrillation,AF)患者的典型心跳間期時間序列進行分析。分別從每組數(shù)據(jù)中隨機選取14組心電間期信號數(shù)據(jù),按上文所述的方法對所選數(shù)據(jù)進行預(yù)處理,然后對各組信號進行pMSE和Lv-pMSE分析。
2.2.2 實驗結(jié)果 分別在NSR、CHF和AF的心電RR間期時間序列上進行pMSE和Lv-pMSE算法的效果測試,所選取的數(shù)據(jù)長度為N=10 000。結(jié)果顯示,雖然三者的pMSE和Lv-pMSE曲線較好的重合,無顯著性差異,但方差沒有得到顯著的降低。與pMSE相比,經(jīng)Lv-pMSE計算得出的NSR、CHF和AF的心電間期信號的方差分別降低了1%、1%和5%(圖3)。
A:正常竇性心律的熵值分析;B:充血性心力衰竭的熵值分析;C:房顫的熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:冪律調(diào)制多尺度熵;Lv-pMSE:低方差冪律調(diào)制多尺度熵。N=10 000。圖3 心電間期信號的pMSE和Lv-pMSE分析
仿真信號中的實驗結(jié)果表明,隨著信號數(shù)據(jù)長度的減小,方差的降低比例也逐漸增大。同樣地,在心電信號中進行驗證,從截取的信號中分別隨機選取N=5 000和N=2 000的數(shù)據(jù)段進行分析。
圖4A~C分別表示N=5 000時,pMSE和Lv-pMSE對NSR、CHF和AF的心電間期信號分析,結(jié)果顯示,N=5 000時的各類信號的Lv-pMSE的方差小于N=10 000時的方差。在小尺度上,Lv-pMSE與pMSE的方差幾乎相等,但在大尺度上,Lv-pMSE方差降低較多。經(jīng)計算得出,NSR、CHF和AF的心電間期信號經(jīng)Lv-pMSE分析后的方差比pMSE分析后的方差分別降低了8%、6%和6%。
A:正常竇性心律的熵值分析;B:充血性心力衰竭的熵值分析;C:房顫的熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:冪律調(diào)制多尺度熵;Lv-pMSE:低方差冪律調(diào)制多尺度熵。N=5 000,aP<0.05 vs Lv-pMSE。圖4 心電間期信號的pMSE和Lv-pMSE分析及其方差對比
圖5A~C的結(jié)果顯示,當(dāng)N=2 000時,由Lv-pMSE計算得到的三種信號的方差明顯降低。在大尺度上,三種信號的pMSE和Lv-pMSE均欠擬合(Mann-Whitney檢驗,P<0.05),Lv-pMSE的分析方差降低更明顯,該結(jié)論與N=5 000時的結(jié)論一致;pMSE和Lv-pMSE的均值表現(xiàn)出差異,Lv-pMSE在大尺度上的均值要比pMSE更小。經(jīng)計算得出,NSR、CHF和AF的心電間期信號經(jīng)Lv-pMSE分析后的方差比pMSE分析后的方差分別降低了22%、16%和11%。
A:正常竇性心律的熵值分析;B:充血性心力衰竭的熵值分析;C:房顫的熵值分析。MSE:多尺度熵;Scale:尺度因子;pMSE:冪律調(diào)制多尺度熵;Lv-pMSE:低方差冪律調(diào)制多尺度熵。N=2 000, aP<0.05 vs Lv-pMSE。圖5 正常竇性心律、充血性心力衰竭和房顫的心電間期信號的pMSE和Lv-pMSE分析及其方差對比
最后,分別用pMSE和Lv-pMSE對三種信號進行分析,結(jié)果如圖6所示。其中,圖6A~B的數(shù)據(jù)長度N=2 000,圖6C~D的數(shù)據(jù)長度N=5 000。N=2 000時,Lv-pMSE的方差雖然顯著減小,但也無法僅通過值來區(qū)分不同復(fù)雜度的信號。N=5 000時,Lv-pMSE很好地保持了pMSE對信號的區(qū)分能力,即NSR的心電RR間期信號的復(fù)雜度大于CHF和AF的心電RR間期信號的復(fù)雜度。
A:pMSE對N=2 000的信號測試;B:Lv-pMSE對N=2 000的信號測試;C:pMSE對N=5 000的信號測試;D:Lv-pMSE對N=5 000的信號測試。pMSE:冪律調(diào)制多尺度熵;Lv-pMSE:低方差冪律調(diào)制多尺度熵;Scale:尺度因子。圖6 pMSE和Lv-pMSE分析中正常竇性心律、充血性心力衰竭和房顫信號對比
本研究主要圍繞Lv-pMSE算法進行了探索和研究。目前發(fā)現(xiàn)導(dǎo)致pMSE方差大的原因主要有兩個:①信號冪律指數(shù)的估計過程會引入一定的誤差;②粗?;^程會導(dǎo)致樣本熵統(tǒng)計學(xué)可靠性降低,產(chǎn)生不精確的熵估計或?qū)е挛炊x的熵。因此,本研究基于pMSE算法,將MMSE與冪律指數(shù)相結(jié)合,以移動平均法代替了粗?;^程,提出了Lv-pMSE算法,并通過仿真和心電信號對Lv-pMSE的實際應(yīng)用效果進行了評估。
本研究主要得到了以下結(jié)果和結(jié)論:①Lv-pMSE的均值曲線較pMSE的均值曲線更平穩(wěn);②Lv-pMSE在大尺度上降低方差的效果較好,且在一定范圍內(nèi),時間序列數(shù)據(jù)長度越短,減小方差的效果越好;③Lv-pMSE較好地保持了pMSE對信號的區(qū)分效果,并可以在更短的時間序列上進行分析。
本研究不足之處主要有:①選取的心電信號樣本類型較少,不能很好地評估Lv-pMSE在其他復(fù)雜生理信號中的應(yīng)用效果;②當(dāng)時間序列的數(shù)據(jù)長度N=10 000時,Lv-pMSE的方差幾乎沒有減小,且運算量比pMSE更大,而在時間序列的數(shù)據(jù)長度較短的時候,雖然Lv-pMSE減小方差的效果更好,但與pMSE相比,其在大尺度上的均值有所偏差;③Lv-pMSE沒有完全解決pMSE在尺度1上均值和方差偏大的問題。
綜上所述,本研究結(jié)果表明,當(dāng)生理信號時間序列的數(shù)據(jù)長度N=5 000時,Lv-pMSE減小方差的效果最好,且保持了pMSE對信號的區(qū)分效果。
下一步,本課題組將在更多的生理信號(如腦電信號、姿勢信號等)和應(yīng)用場景中測試Lv-pMSE,以便更好地幫助臨床疾病的診斷與康復(fù)。