葉明珠,趙治棟
(杭州電子科技大學(xué)電子信息學(xué)院,浙江 杭州 310018)
電子胎心宮縮監(jiān)護(hù)(Cardiotocography, CTG)作為胎心率和子宮活動(dòng)的圖形表示,是正確評(píng)價(jià)胎兒宮內(nèi)狀況最常用的方法。CTG評(píng)估的臨床實(shí)踐很大程度上取決于臨床醫(yī)師的經(jīng)驗(yàn)和主觀判斷,造成CTG分析的差異性和不準(zhǔn)確性。胎心率是判斷胎兒在子宮內(nèi)的安全指標(biāo),是CTG最重要的組成部分。胎心率診斷系統(tǒng)一般分為胎心率(Fetal Heart Rate,FHR)信號(hào)預(yù)處理、FHR信號(hào)特征提取、特征降維和狀態(tài)分類??v觀現(xiàn)有的CTG分類算法,可分為傳統(tǒng)手動(dòng)特征提取算法和特征自學(xué)習(xí)算法。2000年以來,多位學(xué)者對(duì)FHR參數(shù)進(jìn)行研究,提取出多個(gè)線性、時(shí)域、頻域及非線性等特征,采用不同算法對(duì)特征進(jìn)行降維和分類,在小數(shù)據(jù)下取得了較為理想的效果。G.G.Georgoulas等[1]采用隱馬爾可夫模型對(duì)CTG參數(shù)進(jìn)行分類,將胎兒分為正常組和低氧組。J.Spilka等[2]在分析胎兒心率信號(hào)時(shí),增加了一些非線性特征,提高了信號(hào)分類的準(zhǔn)確性。但是,此類算法的準(zhǔn)確性在很大程度上取決于選擇的特征是否能準(zhǔn)確反應(yīng)胎心率的波形變化狀態(tài),且手動(dòng)提取特征過程過于繁瑣。為了提高分類性能,許多學(xué)者對(duì)分類算法進(jìn)行深入研究,如人工神經(jīng)網(wǎng)絡(luò)、基于機(jī)器學(xué)習(xí)的算法。A.Georgieva等[3]使用人工神經(jīng)網(wǎng)絡(luò)對(duì)FHR進(jìn)行監(jiān)控,省去繁瑣的特征提取過程,且分類效果有所提升。
為提高胎兒評(píng)估算法的準(zhǔn)確率,并簡(jiǎn)化胎兒評(píng)估算法的步驟,本文提出基于遷移學(xué)習(xí)和支持向量機(jī)(Support Vector Machine,SVM)的胎心率分類算法,節(jié)省了胎兒狀態(tài)評(píng)估的時(shí)間成本,取得了較好的分類效果。
本文算法分為4個(gè)步驟:預(yù)處理、FHR信號(hào)轉(zhuǎn)換為圖像、AlexNet特征提取和SVM分類,如圖1所示。首先,對(duì)原始的FHR信號(hào)進(jìn)行插值預(yù)處理。然后,將預(yù)處理后的信號(hào)從參數(shù)有限的時(shí)域轉(zhuǎn)換為具有更詳細(xì)局部特征的頻域。FHR軌跡圖像通過在頻域的每個(gè)時(shí)間點(diǎn)繪制當(dāng)前FHR軌跡(每種情況下用N個(gè)點(diǎn)繪制N個(gè)FHR軌跡)獲得,實(shí)現(xiàn)了對(duì)二維圖像的一維信號(hào)處理,充分反映了FHR信號(hào)在一個(gè)連續(xù)周期內(nèi)的頻譜特征趨勢(shì)。AlexNet作為輸入軌跡圖像的特征提取器,節(jié)省了手動(dòng)特征提取、特征降維等復(fù)雜步驟。最后,從卷積神經(jīng)網(wǎng)絡(luò)中提取特征作為SVM的輸入,SVM比卷積神經(jīng)網(wǎng)絡(luò)的Softmax分類器具有更好的泛化能力,且針對(duì)二分類問題具有更好的分類效果。
圖1 算法流程圖
本文采用的數(shù)據(jù)庫來自捷克技術(shù)大學(xué)布爾諾大學(xué)醫(yī)院(Czech Technical University-University Hospital in Brno,CTU-UHB)CTG數(shù)據(jù)庫,包含552個(gè)原始FHR信號(hào),數(shù)據(jù)為2009—2012年在捷克共和國(guó)布爾諾大學(xué)醫(yī)院產(chǎn)科病房獲得的9 164次分娩CTG記錄的子集,所有信號(hào)采樣頻率均為4 Hz。CTU-UHB數(shù)據(jù)庫中使用的孕婦和新生兒生理參數(shù)的詳細(xì)信息見文獻(xiàn)[4]。
臨床實(shí)踐中,新生兒臍動(dòng)脈血的pH值是一種常用的胎兒注記方法。本文選擇pH值為標(biāo)準(zhǔn),對(duì)胎兒心率信號(hào)進(jìn)行跟蹤分類。pH<7.15為異常,pH≥7.15為正常。數(shù)據(jù)庫含正常胎兒447例,病理異常胎兒105例。數(shù)據(jù)庫中正常和異常CTG信號(hào)的1個(gè)例子如圖2所示。本文從CTU-UHB數(shù)據(jù)庫中隨機(jī)選取正常和異常信號(hào)各100例進(jìn)行訓(xùn)練和測(cè)試,其中訓(xùn)練集占70%,測(cè)試集占30%。
圖2 正常和病理異常FHR信號(hào)示例
本文采用線性插值方法對(duì)原始信號(hào)進(jìn)行預(yù)處理,減少了由于胎兒運(yùn)動(dòng)和換能器位移引起的偽影和尖峰。首先,移除值為0,且持續(xù)時(shí)間大于15 s的FHR信號(hào);然后,當(dāng)信號(hào)不穩(wěn)定時(shí),即相鄰2點(diǎn)的絕對(duì)值大于25次/min,在初始采樣點(diǎn)和下一個(gè)穩(wěn)定部分的第一個(gè)點(diǎn)之間進(jìn)行插值;最后,采用埃爾米特(Hermite)樣條插值填補(bǔ)信號(hào)值大于200 bpm和小于50 bpm的信號(hào)。數(shù)據(jù)庫中的每例FHR信號(hào)包括14 400個(gè)時(shí)間點(diǎn),實(shí)驗(yàn)隨機(jī)截取信號(hào)的1 800個(gè)點(diǎn)以供后續(xù)工作。預(yù)處理的效果如圖3所示。
圖3 FHR信號(hào)預(yù)處理結(jié)果
信號(hào)的瞬時(shí)頻率特征反映信號(hào)在不同時(shí)刻的頻率變化規(guī)律。本文采用廣義S變換(Generalized S-transformation, GST)對(duì)信號(hào)進(jìn)行時(shí)頻分析[5],得到比原始時(shí)域更為豐富的信息。與傳統(tǒng)的時(shí)頻分析方法相比,廣義S變換具有可變形態(tài)的窗口,可以對(duì)信號(hào)的特定區(qū)域進(jìn)行時(shí)頻聚焦,得到更好的局部譜和時(shí)頻聚集。因此,本文采用廣義S變換對(duì)FHR信號(hào)進(jìn)行時(shí)頻域轉(zhuǎn)換處理,將一維的時(shí)域信號(hào)映像到二維的圖像信號(hào)處理,得到FHR信號(hào)的二維圖像,作為卷積神經(jīng)網(wǎng)絡(luò)(Convolutional Neural Networks,CNN)的輸入層。
S變換是連續(xù)小波變換的“相位校正”,即多分辨率下小波變換的擴(kuò)展。而廣義S變換是在S變換基礎(chǔ)上,對(duì)高斯窗函數(shù)的改進(jìn)。
首先,x(t)的S變換表示為:
(1)
式中,τ為窗函數(shù)的中心點(diǎn),t為積分時(shí)間,f為頻率,j為虛部符號(hào),廣義高斯窗口函數(shù)表示為:
(2)
式中,λ和p為調(diào)節(jié)因子,用于調(diào)節(jié)高斯窗口函數(shù)的形狀,使時(shí)間窗適應(yīng)頻率的變化,從而細(xì)致地表征信號(hào)的局部特性,獲得理想的時(shí)頻分析效果。將式(2)代入式(1),得到廣義S變換的標(biāo)準(zhǔn)形式:
(3)
式(3)得到復(fù)數(shù)矩陣,矩陣的每一列代表每一個(gè)時(shí)刻的瞬時(shí)時(shí)頻域特征。每例FHR信號(hào)中含1 800個(gè)時(shí)間點(diǎn),從中隨機(jī)抽取100個(gè)時(shí)間點(diǎn),對(duì)其進(jìn)行廣義S變換,得到100個(gè)時(shí)頻特征,樣本包含200個(gè)FHR信號(hào),于是,采用廣義S變換得到的FHR軌跡圖共有20 000幅,其中胎兒的正常類別和異常類別各占10 000幅,每幅圖像的分辨率為227×227×3。
CNN使原問題轉(zhuǎn)化成圖像分類問題,通過大量樣本數(shù)據(jù)的訓(xùn)練,無需圖像預(yù)處理和手動(dòng)特征提取即可獲得理想的分類結(jié)果。圖4給出了一個(gè)典型的CNN網(wǎng)絡(luò)結(jié)構(gòu),主要包括卷積層、下采樣層、池化層、全連接層。卷積層通過卷積運(yùn)算來提取圖像特征;下采樣層在減少數(shù)據(jù)處理量的同時(shí)保留有用信息;池化層減少網(wǎng)絡(luò)參數(shù),緩解模型過擬合問題;全連接層得到CNN提取的圖片特征,Softmax作用于輸出層,得到每個(gè)像素的分類結(jié)果。CNN避免了傳統(tǒng)的手動(dòng)提取特征的步驟,但其強(qiáng)大的特征自學(xué)習(xí)功能依賴于大數(shù)據(jù)庫的長(zhǎng)時(shí)間訓(xùn)練。遷移學(xué)習(xí)的主要優(yōu)點(diǎn)是節(jié)省訓(xùn)練時(shí)間,而且在大多數(shù)情況下,不需要通過大量的數(shù)據(jù)來提高性能。在預(yù)先訓(xùn)練的CNN上進(jìn)行特征提取是最簡(jiǎn)單、最快的方法。
圖4 CNN結(jié)構(gòu)圖
AlexNet模型是文獻(xiàn)[6]提出的一種深卷積神經(jīng)網(wǎng)絡(luò)模型,在2012年的ImageNet比賽中獲得冠軍,模型成功地對(duì)1 000個(gè)物體進(jìn)行分類,取得了準(zhǔn)確率為99.99%的識(shí)別結(jié)果。本文采用預(yù)訓(xùn)練的AlexNet對(duì)數(shù)據(jù)集進(jìn)行特征提取,數(shù)據(jù)集由20 000條輸入的FHR軌跡組成,分為訓(xùn)練集和測(cè)試集。10 000例正常CTG數(shù)據(jù)中,7 000例納入訓(xùn)練組,其余納入測(cè)試組。10 000例病理數(shù)據(jù)以同樣的方式劃分。詳細(xì)的網(wǎng)絡(luò)架構(gòu)如表1所示。微調(diào)預(yù)訓(xùn)練的AlexNet對(duì)新的圖像集合進(jìn)行分類,首先加載并劃分?jǐn)?shù)據(jù)集,然后調(diào)整圖像大小以適應(yīng)網(wǎng)絡(luò)的輸入大小,指定最小批量,將神經(jīng)網(wǎng)絡(luò)的Softmax分類器替換為SVM,從網(wǎng)絡(luò)中提取測(cè)試圖像的特征并輸入到SVM中。SVM是一種用于數(shù)據(jù)二分類的監(jiān)督學(xué)習(xí)分類器,其決策邊界是求解學(xué)習(xí)樣本的最大邊緣超平面。相比于Softmax,SVM對(duì)于未見過的測(cè)試樣本具有更好的推廣能力,且得到的是全局最優(yōu)解,解決了神經(jīng)網(wǎng)絡(luò)中無法避免的極值問題。
表1 網(wǎng)絡(luò)架構(gòu)
本文采用3個(gè)評(píng)價(jià)指標(biāo)來評(píng)價(jià)FHR信號(hào)分類算法的性能,分別為:真陽性率(True Positive Rate,TPR)、假陽性率(False Positive Rate,F(xiàn)PR)和準(zhǔn)確率(Accuracy, ACC),TPR又稱靈敏度,F(xiàn)PR為特異性。這些指標(biāo)的定義如下:
PTPR=NTP/(NTP+NFN)
(4)
PFPR=NTN/(NTP+NFP)
(5)
PACC=(NTN+NTP)/(NTP+NTN+NFN+NFP)
(6)
真正例(True Positive,TP)表示原始正確樣本被歸類為正確的樣本。真反例(True Negative,TN)表示最初錯(cuò)誤樣本被歸類為錯(cuò)誤的樣本。假正例(False Positive,F(xiàn)P)表示原始錯(cuò)誤樣本被歸類為正確的樣本。假反例(False Negative,F(xiàn)N)表示原始正確樣本被歸類為錯(cuò)誤的樣本。這些參數(shù)有規(guī)律地應(yīng)用于具有二分類問題中,以測(cè)試分類方法的性能。實(shí)驗(yàn)結(jié)果得到PACC,PTPR,PFPR分別為97.90%,98.38%和97.42%。
為了驗(yàn)證本文方法的分類性能,在使用相同的數(shù)據(jù)集CTU-UHB數(shù)據(jù)庫的基礎(chǔ)上,與EMD、統(tǒng)計(jì)檢驗(yàn)和短時(shí)傅里葉變換進(jìn)行比較,結(jié)果如表2所示。
表2 本文方案與前人方案比較
通過表2可以看出:本文方法的分類準(zhǔn)確率達(dá)到97.90%,優(yōu)于傳統(tǒng)胎心率分類算法。與文獻(xiàn)[7]和文獻(xiàn)[9]方法相比,本文通過采用廣義S變換對(duì)FHR信號(hào)進(jìn)行圖像變換,大大提高了模型的精度;與文獻(xiàn)[8]相比,本文方法基于AlexNet的遷移學(xué)習(xí)進(jìn)行特征自學(xué)習(xí),省去了特征提取的繁瑣步驟;與文獻(xiàn)[9]相比,本文方法的輸出層將卷積神經(jīng)網(wǎng)絡(luò)的Softmax分類器替換成SVM,得到更好的分類效果。因此,可以通過遷移學(xué)習(xí)和SVM來提高FHR信號(hào)的分類效果。
本文通過研究胎兒狀態(tài)評(píng)估方法,提出基于遷移學(xué)習(xí)和SVM的胎心率分類算法,較傳統(tǒng)分類算法有更高的分類精度,且分類過程簡(jiǎn)單。本文亦存在不足之處,一方面實(shí)驗(yàn)使用的數(shù)據(jù)庫較為單一,另一方面實(shí)驗(yàn)算法沒有得到臨床驗(yàn)證,下一步把算法運(yùn)用在臨床數(shù)據(jù)中,不斷改進(jìn)算法的臨床可實(shí)踐性。