張小飛 陶 凌 鄧 娟 龍 偉
(南昌大學(xué)信息工程學(xué)院,南昌 330031)
基于希爾伯特-黃變換的白細(xì)胞信號(hào)分析
張小飛 陶 凌 鄧 娟 龍 偉*
(南昌大學(xué)信息工程學(xué)院,南昌 330031)
白細(xì)胞信號(hào)(WBS)具有脈沖形狀多樣和時(shí)頻特性各異的特點(diǎn),目前臨床上用細(xì)胞信號(hào)脈沖計(jì)數(shù)的方法來(lái)分析WBS通常難以反映其所攜帶的豐富的生理和病理信息,并直接影響到細(xì)胞分類問(wèn)題。針對(duì)這一問(wèn)題,探索能自適應(yīng)地分解非線性非平穩(wěn)信號(hào)的希爾伯特-黃變換算法在WBC時(shí)頻分析和分類中的應(yīng)用效果。通過(guò)對(duì)血細(xì)胞中的WBC進(jìn)行HHT變換,獲取WBC的本征模態(tài)函數(shù)(IMF)分量、分量的Hilbert邊際譜以及信號(hào)Hilbert譜;利用瞬時(shí)頻率、瞬時(shí)幅值等進(jìn)行計(jì)算提取健康人與患者的WBS平均強(qiáng)度、譜質(zhì)心以及能量貢獻(xiàn)率等特征作對(duì)比分析,根據(jù)其時(shí)頻特征分布規(guī)律構(gòu)建用于分類實(shí)驗(yàn)的特征向量;采用支持向量機(jī)(SVM)分類器,對(duì)58名健康人和60名患者的白細(xì)胞實(shí)驗(yàn)樣本進(jìn)行分類實(shí)驗(yàn)。結(jié)果表明,該方法提取的健康人和患者的WBS分量譜質(zhì)心分布、平均強(qiáng)度值以及能量貢獻(xiàn)率具有較好的區(qū)分度,分類正確率到達(dá)了94.83%。HHT方法能有效提取WBS特征,可輔助臨床WBS的處理和分析。
白細(xì)胞;希爾伯特-黃變換;特征提?。环诸愖R(shí)別
脈沖計(jì)數(shù)法是目前臨床診斷中血細(xì)胞分析的常用方法。然而,受到管內(nèi)負(fù)壓、細(xì)胞懸液溶度等影響,加上細(xì)胞通過(guò)流式細(xì)胞盒出現(xiàn)“結(jié)伙”、“溜邊”、“返流”等現(xiàn)象,通常細(xì)胞信號(hào)具有脈沖形狀多樣、時(shí)頻特性也各異的特點(diǎn)。采用脈沖計(jì)數(shù)法分析具有非平穩(wěn)、非線性、非高斯的固有特征[1]的白細(xì)胞信號(hào)(WBS),顯然難以反映信號(hào)的特點(diǎn)和攜帶的豐富的生理和病理信息,從而直接影響到最終的健康和病患細(xì)胞的分類判別結(jié)果。
時(shí)頻分析方法作為一種新興的信號(hào)處理方法,近年來(lái)受到越來(lái)越多的重視。由于可以提供時(shí)間域與頻率域的聯(lián)合分布信息,清楚地描述信號(hào)頻率隨時(shí)間變化的關(guān)系,所以時(shí)頻分析方法可作為時(shí)變非平穩(wěn)信號(hào)分析的有力工具。基于此,對(duì)WBS進(jìn)行時(shí)頻分析,有望克服傳統(tǒng)血細(xì)胞分析方法脈沖計(jì)數(shù)不準(zhǔn)確的弱點(diǎn),提高分析結(jié)果的準(zhǔn)確性。
傳統(tǒng)的時(shí)頻分析方法幾乎都以傅里葉變換作為最終的理論依據(jù),受Heisenberg測(cè)不準(zhǔn)原理制約,因而不能精確地描述頻率隨時(shí)間的變化[2],且基函數(shù)比較固定,缺乏自適應(yīng)性。希爾伯特-黃變換(Hilbert-Huang transform,HHT)[3]徹底擺脫了線性和平穩(wěn)性束縛,突破了傳統(tǒng)分析方法定義簡(jiǎn)諧信號(hào)為基底的局限,可處理分析非平穩(wěn)、非線性隨機(jī)信號(hào),近幾年來(lái)在生物醫(yī)學(xué)信號(hào)的分析與處理中成功地用于冠狀動(dòng)脈舒張期雜音分析[4]、橈動(dòng)脈血流信號(hào)分析[5]、超聲脈搏信號(hào)研究[6]和心臟心率變異性分析[7-8]等,但是在血細(xì)胞分析領(lǐng)域應(yīng)用甚少。
采用HHT方法,分析血細(xì)胞中的WBS。通過(guò)將復(fù)雜WBC分解成本征模態(tài)函數(shù)(intrinsic mode function,IMF)分量進(jìn)行Hilbert變換,求出信號(hào)的能量、頻率在空間或時(shí)間尺度上的分布,實(shí)現(xiàn)WBS特征的提取,將特征值用于SVM分類,達(dá)到對(duì)健康人與患者WBS分類識(shí)別的目的。
希爾伯特-黃變換是20世紀(jì)末由Huang等提出的一種用來(lái)處理非平穩(wěn)、非線性信號(hào)的方法,它包含兩個(gè)部分:經(jīng)驗(yàn)?zāi)B(tài)分解(empirical mode decomposition,EMD)和Hilbert 變換[3]。
1.1經(jīng)驗(yàn)?zāi)B(tài)分解
經(jīng)驗(yàn)?zāi)B(tài)分解(EMD)是將復(fù)雜的信號(hào)自適應(yīng)地分解成一系列表征信號(hào)特性的、具有物理意義的本征模態(tài)函數(shù)(IMF)分量,用于進(jìn)行Hilbert 變換。
EMD 分解的過(guò)程如下:
1) 提取出原始信號(hào)x(t)的局部極值點(diǎn),運(yùn)用三次樣條函數(shù)插值,求得原信號(hào)的上下包絡(luò)。
2) 對(duì)信號(hào)的上下包絡(luò)取平均,得到其均值m(t)。
3) 用x(t)減去m(t),得h(t)=x(t)-m(t);如果h(t)已滿足IMF分量定義的條件,那么它就是一個(gè)IMF分量;否則,將h(t)作為原始信號(hào)按上述步驟再進(jìn)行分解,直到新得到的h(t)滿足IMF的定義,就求得第一個(gè)IMF分量,并將其記為c1(t)。
對(duì)于是否滿足IMF定義而停止篩選,依據(jù)前后h(t)的標(biāo)準(zhǔn)差SD的大小作判斷,有
(1)
研究表明,SD值在0.2~0.3之間為最佳,提取出的本征模態(tài)函數(shù)既有物理意義,又保證了其線性和穩(wěn)定性[9]。
4) 提取出c1(t)后,得剩余信號(hào)r1(t)=x(t)-c1(t);再將r1(t)作為一個(gè)新的原始信號(hào),重復(fù)上述3個(gè)步驟,直到rn(t)變成一個(gè)常量或單調(diào)信號(hào)的殘余項(xiàng),分解過(guò)程完成。
由IMF分量和殘余項(xiàng)rn(t)可以重構(gòu)得到原信號(hào)x(t),表示為
(2)
1.2希爾伯特變換
在EMD分解得到若干個(gè)IMF后,對(duì)其進(jìn)行希爾伯特變換[10],有
(3)
式中,PV為柯西主值。
由此可構(gòu)造出各IMF分量的解析信號(hào)為
(4)
由此得到解析信號(hào)的瞬時(shí)幅值、瞬時(shí)相位以及瞬時(shí)頻率為
(5)
(6)
(7)
鑒于殘余項(xiàng)rn(t)為常量或單調(diào)信號(hào),所含信息量少,舍去rn(t)后原信號(hào)x(t)可由其解析信號(hào)求實(shí)部得到,即
(8)
將幅值表示為時(shí)間和頻率的函數(shù)時(shí),幅值的時(shí)間-頻率分布稱為Hilbert譜,記為H(ω,t)。由Hilbert譜對(duì)時(shí)間積分,得到Hilbert邊際譜為
(9)
邊際譜是在每個(gè)頻率上的振幅在整個(gè)時(shí)間段上的累積,能夠體現(xiàn)能量在頻率上的分布情況。
圖3 WBS及其EMD分解結(jié)果Fig.3 WBS signal and its EMD decomposition results
WBS的分析與處理過(guò)程如圖1所示。首先經(jīng)過(guò)EMD分解得到信號(hào)的本征模態(tài)函數(shù)(IMF),再對(duì)IMF進(jìn)行Hilbert變換得到分量的邊際譜、瞬時(shí)頻率、瞬時(shí)幅值以及信號(hào)的Hilbert譜,然后分別求平均強(qiáng)度、譜質(zhì)心以及能量貢獻(xiàn)率,并做出譜質(zhì)心和平均強(qiáng)度分布圖和能量貢獻(xiàn)率直方圖的對(duì)比分析,最后擬定構(gòu)造特征向量T用于SVM分類實(shí)驗(yàn)。
圖1 白細(xì)胞信號(hào)處理流程Fig.1 Flowchart of WBC processing
2.1信號(hào)分析
圖2是一例典型的WBS波形。信號(hào)由白細(xì)胞分析儀采集,并經(jīng)過(guò)了濾波預(yù)處理。由圖可見,信號(hào)脈沖形狀各異,還有M脈沖。采用目前常用的臨床脈沖計(jì)數(shù)法,設(shè)定門限閾值來(lái)檢測(cè)脈沖個(gè)數(shù),分析結(jié)果將不準(zhǔn)確。
圖2 白細(xì)胞信號(hào)Fig.2 WBS
為提取WBS有用特征,首先采用HHT方法對(duì)細(xì)胞信號(hào)進(jìn)行分析,探尋其時(shí)頻特征(如頻率、幅度以及能量的分布規(guī)律。將一例白細(xì)胞信號(hào)波形及其經(jīng)過(guò)EMD分解,得到若干個(gè)IMF分量和一個(gè)殘余項(xiàng)的波形,如圖3所示。對(duì)各IMF分量求Hilbert邊際譜,結(jié)果如圖4所示。
圖4 白細(xì)胞信號(hào)IMF分量的Hilbert邊際譜Fig.4 IMFs and Hilbert marginal spectrum of WBS
由圖3和圖4可見:原信號(hào)被分解成了頻率由高到低的IMF分量,高頻分量首先被分解出來(lái);各個(gè)分量在同一局部位置上不會(huì)出現(xiàn)相同的頻率成分、相同時(shí)間尺度的振蕩,但能無(wú)遺漏地體現(xiàn)原信號(hào)中的任何局部振蕩;前幾個(gè)分量是信號(hào)的主要貢獻(xiàn)分量,包含較多原信號(hào)特征信息。各個(gè)IMF分量上的頻率分布和時(shí)間尺度隨原信號(hào)而變化的,說(shuō)明EMD分解是自適應(yīng)的,分解出的分量能夠真實(shí)地反映原信號(hào)的固有特征,且主要貢獻(xiàn)集中在第2~6個(gè)IMF分量上。
對(duì)原信號(hào)經(jīng)過(guò)EMD分解后的IMF分量進(jìn)行Hilbert變換,得到其瞬時(shí)頻率及瞬時(shí)幅值,二者都是關(guān)于時(shí)間的函數(shù)。將幅值表示成頻率-時(shí)間的分布后,得到原信號(hào)的Hilbert譜,如圖5所示。從Hilbert譜中可以看出,信號(hào)發(fā)生變化時(shí),對(duì)信號(hào)幅值的主要貢獻(xiàn)頻率也發(fā)生變化,主要集中在5~8 kHz和10~12 kHz兩個(gè)頻段內(nèi),這與圖4中各個(gè)主要貢獻(xiàn)分量的主要頻率段相對(duì)應(yīng)。
圖5 白細(xì)胞信號(hào)的Hilbert譜Fig. 5 Hilbert spectrum of WBC signal
2.2特征提取
白細(xì)胞通過(guò)檢測(cè)儀器的細(xì)胞盒時(shí)產(chǎn)生電信號(hào)變化,包含著白細(xì)胞的數(shù)量以及大小等信息,這種變化與信號(hào)頻率、幅度等特征有內(nèi)在聯(lián)系,因而信號(hào)的幅值、頻率以及能量的相關(guān)特征可以反映信號(hào)的固有特征。本研究首先求取健康人和患者WBC各分量的平均強(qiáng)度、譜質(zhì)心以及能量貢獻(xiàn)率來(lái)進(jìn)行對(duì)比分析,再根據(jù)各特征值在二者之間的區(qū)分度來(lái)擬定選取最終用于分類實(shí)驗(yàn)的特征向量。
第i個(gè)IMF分量的平均強(qiáng)度體現(xiàn)信號(hào)的幅值變化、細(xì)胞數(shù)量和大小的特征,可定義為
(10)
式中,N為信號(hào)長(zhǎng)度,a(j)為IMF分量中第j個(gè)采樣點(diǎn)的瞬時(shí)幅值。
譜質(zhì)心是信號(hào)頻率成分的重心,是在某頻率段內(nèi)通過(guò)能量加權(quán)平均的頻率,體現(xiàn)了頻率分布和能量分布的重要信息,是描述信號(hào)的重要參數(shù)之一。第i個(gè)IMF分量的譜質(zhì)心為[11]
(11)
式中,N為原信號(hào)的長(zhǎng)度,f(j)、E(j)分別為IMF分量中第j個(gè)采樣點(diǎn)的瞬時(shí)頻率和瞬時(shí)能量。
分量能量貢獻(xiàn)率可體現(xiàn)各個(gè)IMF分量對(duì)原信號(hào)的能量貢獻(xiàn)程度。由于各分量包含一定帶寬的頻率分量和一定范圍時(shí)間尺度的振蕩,所以能量貢獻(xiàn)率也能體現(xiàn)原信號(hào)的一些固有特征。定義第i個(gè)IMF分量的能量貢獻(xiàn)率為
(12)
式中,N為原信號(hào)的長(zhǎng)度,E(j)為IMF分量中第j個(gè)采樣點(diǎn)的瞬時(shí)能量,K為原信號(hào)經(jīng)EMD分解得到除殘余項(xiàng)外IMF分量的數(shù)量。
在式(1)~式(13)中,i=1,…,11。
現(xiàn)分別對(duì)健康人和患者的血細(xì)胞中WBS進(jìn)行HHT,求其各分量的平均強(qiáng)度、譜質(zhì)心以及能量貢獻(xiàn)率,畫出兩類信號(hào)的譜質(zhì)心和平均強(qiáng)度分布圖以及能量貢獻(xiàn)率直方圖。
圖6 健康人和患者的譜質(zhì)心和平均強(qiáng)度分布Fig.6 Average intensity and spectral centroid distribution of healthy peopel and patients
圖7 健康人和患者的IMF能量貢獻(xiàn)率Fig.7 The IMFs energy contribution rate Histogram of healthy peopel and patients
從圖7中看出,在能量貢獻(xiàn)率分布方面,兩者都集中在第2~6個(gè)分量上,但健康人主要側(cè)重于前幾個(gè)高頻分量,而患者分布側(cè)重點(diǎn)則往后移,健康人的能量貢獻(xiàn)率在前幾個(gè)高頻分量上較患者大,后幾個(gè)低頻分量上較患者小,同樣具有較好區(qū)分度,所以選取Ep2、Ep3、Ep4、Ep5、Ep6作為特征向量的第11~15個(gè)分量。
分類實(shí)驗(yàn)數(shù)據(jù)樣本包含58名健康人和60名患者,每個(gè)樣本提取4組16維特征向量,然后取均值作為實(shí)驗(yàn)用特征向量,隨機(jī)抽取一半的數(shù)據(jù)樣本作為分類器訓(xùn)練樣本,另一半作為待測(cè)樣本。采用的分類器是支持向量機(jī)分類器(supportvectormachine,SVM),SVM的類型為C-SVC,核函數(shù)的選取會(huì)直接影響分類精度,通過(guò)對(duì)線性、多項(xiàng)式以及RBF的3個(gè)核函數(shù)做實(shí)驗(yàn)對(duì)比,其中RBF核函數(shù)的正確率最高。RBF函數(shù)中的參數(shù)c和g運(yùn)用參數(shù)自動(dòng)尋優(yōu)的工具Python進(jìn)行選優(yōu),最終確定c=0.031 25,g=0.5。分類結(jié)果如表1所示。
表1 SVM分類結(jié)果
由表1可知,分類的正確率達(dá)到了94.83%。結(jié)果表明,通過(guò)希爾伯特-黃變換對(duì)WBS分析提取特征向量,能夠表征原信號(hào)的固有特征來(lái)用于分類實(shí)驗(yàn),并且能取得很好的分類效果,分析方法比較有效。
以時(shí)頻特征分析為切入點(diǎn),采用HHT方法對(duì)非線性不平穩(wěn)的WBS進(jìn)行時(shí)頻分析,這相比臨床上脈沖計(jì)數(shù)法僅從時(shí)域?qū)BS進(jìn)行分析而言,是對(duì)傳統(tǒng)方法的改進(jìn)和突破。本研究成功運(yùn)用HHT方法處理WBS,經(jīng)HHT后WBS自適應(yīng)地分解成頻率從高到低的IMF分量,每個(gè)IMF分量的頻率聚集度高,且沒(méi)有振蕩的重疊,有較好的辨識(shí)度。依據(jù)IMF分解的結(jié)果,可分析WBS的頻率重心分布范圍、瞬時(shí)頻率和瞬時(shí)幅值等特征。基于以上特征,筆者給出了WBS分量譜質(zhì)心、平均強(qiáng)度和能量貢獻(xiàn)等時(shí)頻特征函數(shù)的定義;根據(jù)定義計(jì)算健康人和患者的白細(xì)胞信號(hào)的這些特征函數(shù),結(jié)果表明其在分布上有很大的差異。以此為據(jù),構(gòu)造特征向量并用于白細(xì)胞分類實(shí)驗(yàn),分類正確率達(dá)到了94.83%。
深入挖掘WBS經(jīng)HHT變換得到的特征函數(shù)以及分類實(shí)驗(yàn)的結(jié)果,發(fā)現(xiàn)WBS的瞬時(shí)頻率、瞬時(shí)強(qiáng)度與WBS所攜帶的生理和病理信息存在著必然聯(lián)系,反映出細(xì)胞數(shù)量、大小等物理特征。病患的白細(xì)胞與健康人相比,在數(shù)量、大小等方面都發(fā)生了變化,這是引起WBS的頻率、強(qiáng)度發(fā)生變化且使得病患WBS有著與健康人不同的頻率、強(qiáng)度以及能量等特征的根本原因。這些表征白細(xì)胞信號(hào)的病理信息的特征函數(shù),可以用來(lái)區(qū)別二者的WBS。也就是說(shuō),HHT方法對(duì)WBS的分析,能避免傳統(tǒng)的脈沖計(jì)數(shù)法計(jì)數(shù)統(tǒng)計(jì)不精確的問(wèn)題;對(duì)存在M類信號(hào)的WBS細(xì)胞數(shù)量測(cè)不準(zhǔn)的問(wèn)題,以及非細(xì)胞數(shù)量所能體現(xiàn)的WBS病理信息對(duì)其影響的問(wèn)題,通過(guò)給出的特征函數(shù),即可達(dá)到對(duì)健康人和患者WBS有效分類的目的。作為一種更準(zhǔn)確有效的WBS分析方法,可為臨床白細(xì)胞信號(hào)分析和與此相關(guān)的疾病診斷提供一種新的思路和路徑。
本研究?jī)H對(duì)血細(xì)胞信號(hào)時(shí)頻分析進(jìn)行了初步的探索。雖然基于HHT變換獲取的瞬時(shí)頻率、瞬時(shí)幅值構(gòu)建的3個(gè)特征函數(shù)對(duì)于分析WBS細(xì)胞具有普遍的適用性,但筆者僅以WBS信號(hào)作為樣本進(jìn)行了分析,特征函數(shù)的種類還有待拓展,特征分布的規(guī)律也有待進(jìn)一步探究,然而這并不能掩蓋HHT作為一種新的WBS分析方法所具有的價(jià)值和意義。后續(xù)研究工作將通過(guò)擴(kuò)大樣本數(shù)量,拓展時(shí)頻特征函數(shù)的種類,對(duì)不同種類的血細(xì)胞信號(hào)進(jìn)行分析,對(duì)不同病患的血細(xì)胞信號(hào)時(shí)頻特征差異進(jìn)行分析,建立相應(yīng)的數(shù)據(jù)模型等,實(shí)現(xiàn)對(duì)更多不同血細(xì)胞疾病患者的血細(xì)胞信號(hào)的甄別,輔助臨床血細(xì)胞的分析。
[1] 叢玉隆.當(dāng)代檢驗(yàn)分析技術(shù)與臨床[M].北京:中國(guó)科學(xué)技術(shù)出版社:2002,20-21.
[2] 鐘佑明.希爾伯特-黃變換局瞬信號(hào)分析理論的研究[D].重慶:重慶大學(xué),2002.
[3] Huang NE, Zheng Shen, Steven R,etal. The empirical mode decomposition and the hilbert spectrum for nonlinear and non-stationary time series analysis[J]. Proc Roy Soc Lond, 1998,454:903-993.
[4] 趙治棟. 基于舒張期心音信號(hào)分析與特征提取的冠心病無(wú)損診斷研究[D].杭州:浙江大學(xué),2004.
[5] 許超. 橈動(dòng)脈超聲多普勒血流信號(hào)的特征提取及分類研究[D].哈爾濱:哈爾濱工業(yè)大學(xué),2008.
[6] 張冬雨,李乃民,賈丹兵,等. 超聲脈搏圖與人體胃氣關(guān)系的觀察[C] // 中國(guó)中西醫(yī)結(jié)合學(xué)會(huì),編.第二次全國(guó)中西醫(yī)結(jié)合診斷學(xué)術(shù)研討會(huì)論文集.北京:中國(guó)中西醫(yī)結(jié)合學(xué)會(huì),2008:281-287.
[7] Li Helong,Yang Lihua,Huang Daren. Application of Hilbert-Huang transform to heart rate variability analysis [C] // Proceedings of 2nd International Conference on Bioinformatics and Biomedical Engineering. Shanghai:IEEE, 2008:648-651.
[8] Li Helong, Sam K, Yang Lihua,etal. Hilbert-Huang transform for analysis of heart rate variability in cardiac health[J]. IEEE/ACM Trans on Com Bio and Bioinformatics, 2011,8(6):1557-1567.
[9] 熊學(xué)軍,郭炳火,胡筱敏,等. EMD方法和Hilbert譜分析法的應(yīng)用與探討[J]. 黃渤海海洋,2002,02:12-21.
[10] 鄭君里,應(yīng)啟珩,楊為理.信號(hào)與系統(tǒng)[M].北京:高等教育出版社,2000.
[11] 王娜,陳克安.分段譜質(zhì)心特征在水下目標(biāo)識(shí)別中的應(yīng)用[J].兵工學(xué)報(bào),2009,02:144-149.
TheAnalysisofWhiteBloodCellSignalBasedonHilbert-HuangTransform
ZHANG Xiao-Fei TAO Ling DENG Juan LONG Wei*
(SchoolofInformationEngineering,NanchangUniversity,Nanchang330031,China)
White cell signal (WBS) has various shapes of pulse and different time-frequency features, which makes it difficult to extact the physiological and pathological information from WBS using cell signal pulse-counting method and classify the blood cells accurately in clinics. In this work, the Hilbert-Huang transform (HHT) method which can adaptively decompose non-stationary and nonlinear signal was investigated to explore its application in WBS time-frequency analysis and classification. Using HHT, WBC′s intrinsic mode function (IMF), Hilbert marginal spectrum of IMF and Hilbert spectrum of WBS were obtained; Average intensity, spectral centric and the energy contribution rate of WBS of healthy people and patients were extracted and analysised through instantaneous frequency and instantaneous amplitude. According to the distribution of time-frequency features, the feature vector for classification experiments were constructed, and then support vector machine (SVM) was adopted in the classification of WBS experimental samples of 58 healthy persons and 60 patients. Results showed that the correct ratio of WBS classification was 94.83%. In conclusion, the HHT method is effective in extracting the WBS features and may be expected to assist clinical WBS processing and analysis.
white blood cell; Hilbert-Huang transform; feature extracting; classification
10.3969/j.issn.0258-8021. 2014. 01.009
2013-07-10, 錄用日期:2013-11-15
國(guó)家自然科學(xué)基金(61261011)
R318.04 TP391.4
A
0258-8021(2014) 01-0057-06
*通信作者。E-mail: E-mail: 13803535927@139.com