• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于特征級聯(lián)的肺炎咳嗽聲識別

      2022-09-09 03:17殷仁杰徐文龍
      現(xiàn)代電子技術 2022年17期
      關鍵詞:咳嗽聲波包級聯(lián)

      殷仁杰,徐文龍

      (中國計量大學,浙江 杭州 310000)

      0 引 言

      肺炎是在肺部產(chǎn)生炎癥影響的一種常見呼吸道疾病,其癥狀表現(xiàn)為持續(xù)的咳嗽和胸部疼痛等。根據(jù)2019 年國家衛(wèi)生健康委統(tǒng)計信息中心數(shù)據(jù)顯示,由主要感染性疾病導致死亡的概率中肺炎占比最高。文獻[2]指出不同疾病引發(fā)的咳嗽聲具有各種差異,根據(jù)差異對咳嗽聲進行處理,達到識別肺炎的目的。當前在識別肺炎方面常采用肺音、呼吸音等作為信息載體,但相比之下識別咳嗽聲具有非接觸性、設備成本低、操作簡單等優(yōu)點。

      對肺炎咳嗽聲的識別研究主要是通過組合不同的淺層特征,或?qū)M合后的高維特征使用遺傳算法、主成分分析等降低維度保留良好特征,最后應用機器學習模型實現(xiàn)識別。文獻[3]從咳嗽聲提取梅爾頻率倒譜系數(shù)等22 維特征,輸入到人工神經(jīng)網(wǎng)絡分類器,實現(xiàn)肺炎的識別。文獻[4]組合梅爾頻率倒譜系數(shù)以及時間序列的最大值、方差等統(tǒng)計參數(shù)來識別慢性阻塞性肺炎,并使用信息增益方法選擇特征,獲得了85.4%的識別準確率。文獻[5]采用小波分析方法,對爆裂音、啰音、喘息等不同狀態(tài)的肺音,提取小波能量特征,在BP 神經(jīng)網(wǎng)絡上識別準確率為82.5%。文獻[6]指出肺炎咳嗽聲含有裂紋信號,使用小波分析方法得到小波系數(shù)特征,與非高斯評分、雙譜評分、對數(shù)能量等30 維特征組合作為邏輯回歸模型輸入,得到88%的特異性。文獻[7]提出通過短時傅里葉變換將咳嗽聲轉(zhuǎn)換成語譜圖,通過圖像識別的方法達到對咳嗽聲的識別。使用深度網(wǎng)絡模型對語譜圖進行特征提取,可以很好地得到咳嗽聲隱藏的深層特征。

      本文通過特征級聯(lián)方法結(jié)合兩種層次特征,分別為小波包分解咳嗽聲提取出的淺層特征,以及特征提取模型從語譜圖保留的深層特征,實現(xiàn)同時保留咳嗽聲的淺層細節(jié)和深層抽象信息的目的,較使用單一特征有效提高了識別準確率。

      1 識別系統(tǒng)流程

      肺炎咳嗽聲識別方法主要對咳嗽聲提取不同層次的特征,借助于信號處理和圖像識別技術,采用深度網(wǎng)絡模型作為分類器來識別肺炎。為患者提供一種自主檢測手段,降低就診成本,同時作為一種輔助型肺炎診斷方法。本文識別系統(tǒng)流程如圖1所示。

      圖1 咳嗽聲識別流程圖

      2 咳嗽聲處理

      2.1 小波包分解

      小波變換是一種時頻分析方法,在處理非平穩(wěn)信號領域被廣泛使用。小波變換使用可變的時頻窗,具有較高時頻分辨率。小波包分解方法是在小波變換基礎上改進得到的,對每次分解得到的頻帶再次分解為低頻和高頻部分。

      層小波變換僅把信號分解為(+1)段頻帶,小波包可以分解為2段頻帶,使分解的頻帶更為精細,能得到更高的頻率分辨率。

      小波包分解公式中,將小波包系數(shù)d()分解為d()和d()。其中和代表層數(shù)和節(jié)點數(shù),()和()分別保留信號低頻或高頻部分。

      對小波包系數(shù)求平方得到小波包能量E,小波包能量占總頻帶能量的比值,即相對小波包能量,相對小波包能量可以體現(xiàn)出咳嗽聲信號在每個頻帶內(nèi)的能量分布情況。本文采用db3 小波對咳嗽聲信號進行6 層小波包分解,使用相對小波包能量作為淺層特征。小波包能量E和相對小波包能量P計算公式如下:

      2.2 生成語譜圖

      語譜圖含有大量的時頻域特征,如基音周期、共振峰、能量密度、清音濁音等,超過了時域和頻域的信息總和,在信號分析領域具有重要作用;結(jié)合頻譜圖和波形圖兩者之間的優(yōu)點,使二維圖像可以表達出三維信息;其橫軸和縱軸方向分別代表時間和頻率,而圖上點的灰度值表示幅值的高低。

      經(jīng)過對咳嗽聲信號進行分幀、加窗、離散傅里葉變換等步驟處理,生成語譜圖。首先對咳嗽聲信號S()加窗分幀處理,幀移設為幀長的1 2,使用漢明窗()作為窗函數(shù),窗長為。其次對預處理后的咳嗽聲信號求取傅里葉系數(shù):

      再求取傅里葉系數(shù)的對數(shù)能量:

      最大最小值歸一化處理得到(,):

      圖2 正常與肺炎人群咳嗽聲的語譜圖

      3 SELeNet-5 網(wǎng)絡模型

      3.1 LeNet-5 特征提取模型

      卷積神經(jīng)網(wǎng)絡是一種具有局部連接、權重共享等特性的深層前饋神經(jīng)網(wǎng)絡,主要使用在圖像分類和目標檢測等方面。其中LeNet-5 是具有代表性的卷積神經(jīng)網(wǎng)絡之一,早期用于識別銀行手寫數(shù)字方面,本文將LeNet-5網(wǎng)絡模型用于對圖像進行特征提取,能很好地得到語譜圖深層特征。LeNet-5 特征提取模型總共有7 層,由卷積層、池化層、全連接層交叉堆疊構成。首先經(jīng)過卷積層通過卷積核對語譜圖的局部區(qū)域進行特征提取,其中不同大小的卷積核相當于使用不同的特征提取器;其次池化層起到降維的作用,對卷積層得到的特征降低維度,從而大大減少了網(wǎng)絡模型的參數(shù)數(shù)量,加快網(wǎng)絡模型的運行速度;最后經(jīng)過全連接層選取保留下語譜圖深層特征。

      LeNet-5 起始用于分類圖像方面,其輸入和輸出分別為32×32 的圖像以及10 個分類結(jié)果概率值。因此,對LeNet-5 網(wǎng)絡模型的初始參數(shù)和網(wǎng)絡層進行修改,以達到對語譜圖特征提取的功能;將第一個全連接層神經(jīng)元參數(shù)設為64,與淺層特征數(shù)量保持相等;省略最后輸出層以達到特征提取的目的,最終將保留64 維深層特征。LeNet-5 特征提取模型結(jié)構如圖3所示。

      圖3 LeNet-5 特征提取模型結(jié)構圖

      3.2 特征級聯(lián)網(wǎng)絡層

      依靠單一的網(wǎng)絡模型或特征,對于準確率的提升往往有限,而級聯(lián)方法借助于級聯(lián)對象之間的差異大小,相比單一對象可以在一定程度上提高準確率。根據(jù)級聯(lián)對象的不同,級聯(lián)可以分為特征級聯(lián)、分類器級聯(lián)兩種。特征級聯(lián)相比分類器級聯(lián)方法,可以有效利用特征之間的差異,發(fā)揮不同層次特征優(yōu)勢。

      特征級聯(lián)方法主要是通過在網(wǎng)絡模型中添加Add或Concatenate 網(wǎng)絡結(jié)構層實現(xiàn),將來源不同的特征向量進行合并,組合成一組新的特征向量,進而輸入到分類器進行識別。兩種特征級聯(lián)結(jié)構層具有不同的合并特征方法,主要有以下區(qū)別:Add 網(wǎng)絡層屬于對特征通道內(nèi)部包含的信息進行合并,并且保持特征通道數(shù)量不變;Concatenate 網(wǎng)絡層是對特征通道的合并,增加了特征通道數(shù)量,通道內(nèi)部包含的信息保持不變。本文選擇Concatenate 網(wǎng)絡結(jié)構層作為特征級聯(lián)網(wǎng)絡層,有效增加特征通道數(shù)量,使咳嗽聲具有較多的特征表示,并在Concatenate 層后添加BN 層,可以有效加快收斂速度,防止過擬合。假設,分別是淺層和深層特征,分別使用兩種特征級聯(lián)方法得到級聯(lián)特征,兩種特征級聯(lián)方法區(qū)別如下:

      3.3 注意力機制網(wǎng)絡模塊

      通過特征級聯(lián)網(wǎng)絡層結(jié)合淺層和深層特征,增加了特征通道數(shù)量,但各個特征通道對于識別結(jié)果的作用大小不同,無關特征會大大增加模型計算量,增加網(wǎng)絡模型的計算復雜度。注意力機制網(wǎng)絡模塊是采用犧牲較小的計算成本和時間,對特征通道的注意力進行分配,將有限的計算資源聚焦于有效特征通道上,并帶來一定的性能提升。

      注意力機制網(wǎng)絡模塊由一個全局池化層、兩個全連接層和Sigmoid 函數(shù)構成,根據(jù)模型訓練損失值來確定各個通道的重要程度。首先第一個全連接層將原始特征輸入降為其1 16維度;其次通過第二個全連接層將其升為原始維度,使其具有更多的非線性,得到通道之間的相關性;最終通過Sigmoid 函數(shù)歸一化權重,輸出新的特征通道權重集合。注意力機制網(wǎng)絡模塊結(jié)構圖如圖4所示。

      圖4 注意力機制網(wǎng)絡模塊結(jié)構圖

      圖4中,Scale 是將歸一化權重以矩陣相乘方法加權到原始特征通道,完成對原始特征通道上的權重更新。權重更新公式如下:

      式中:代表特征通道權重集合;為128 維級聯(lián)特征的通道矩陣。

      因此在特征級聯(lián)網(wǎng)絡層后加入注意力機制網(wǎng)絡模塊,調(diào)整特征級聯(lián)得到的128 維特征通道的權重大小,加大有效特征通道的權重大小,提高模型準確率。將經(jīng)過注意力機制網(wǎng)絡模塊更新權重后的特征,通過兩個全連接層保留主要信息,輸入到Softmax 函數(shù),輸出肺炎咳嗽聲識別結(jié)果。整體網(wǎng)絡模型命名為SELeNet-5 網(wǎng)絡模型,網(wǎng)絡架構如圖5所示。

      圖5 SELeNet-5 網(wǎng)絡結(jié)構圖

      4 實驗結(jié)果與分析

      4.1 數(shù)據(jù)采集與處理

      實驗所使用的肺炎咳嗽數(shù)據(jù)來源于醫(yī)院病房,采集前已征得受試者的同意,對其多次連續(xù)性采集咳嗽聲。采集設備為索尼PCM-D100 錄音器,錄音器采樣率設置為44.1 kHz。采集過程中保持相對安靜的環(huán)境,將錄音器放置在受試者嘴部大約40 cm 的位置,使受試者肺部充分吸氣,并多次主動性咳嗽。共獲得23 名(男18 名,女5 名)受試者樣本咳嗽聲數(shù)據(jù),受試者所患疾病包括慢性阻塞性肺炎、支氣管肺炎等常見肺炎,且具有專業(yè)臨床醫(yī)生開具的臨床診斷。正常受試者咳嗽聲數(shù)據(jù)來源于課題組實驗室,采集方法與肺炎咳嗽聲的采集方法相同。為了保證數(shù)據(jù)分類的穩(wěn)定,同樣選取23名(男18名,女5 名)正常受試者作為樣本采集,且選取與肺炎咳嗽聲等量的片段作為正常咳嗽聲數(shù)據(jù)。

      使用Audacity 音頻處理軟件,人工選取咳嗽聲并將其裁剪為等長320 ms 的片段,使每個片段均包含咳嗽聲??偣驳玫椒窝卓人月暺魏驼?人月暺胃?18 個。采用數(shù)據(jù)增強對咳嗽聲數(shù)據(jù)集進行擴充,避免數(shù)據(jù)集體量小,產(chǎn)生過擬合等問題。將音量調(diào)高為原始數(shù)據(jù)的1.5 倍,以及添加白噪聲生成新數(shù)據(jù),數(shù)據(jù)擴充后的數(shù)據(jù)量約為原始數(shù)據(jù)的2 倍。將數(shù)據(jù)擴充前后的咳嗽聲片段混合,并隨機劃分為80%的訓練集和20%的測試集。數(shù)據(jù)集組成如表1所示。

      表1 咳嗽數(shù)據(jù)集組成 段

      4.2 實驗結(jié)果

      為了體現(xiàn)特征級聯(lián)方法對肺炎咳嗽聲識別的有效性,采用不同層次特征進行對比實驗。方法1 將相對小波包能量通過兩層全連接層輸出識別結(jié)果;方法2 將語譜圖輸入到LeNet-5 特征提取模型,再通過兩層全連接層輸出識別結(jié)果;方法3使用兩種特征輸入到SELeNet-5網(wǎng)絡模型實現(xiàn)識別。三種不同輸入特征對比實驗結(jié)果如圖6所示。

      圖6 準確率實驗結(jié)果

      由圖6 得到:方法2 比方法1 的識別準確率高3.89%,證明了深度網(wǎng)絡模型能很好地處理圖像問題,以圖像識別的形式可以較好地用于識別咳嗽聲;方法3相比方法1 和方法2 準確率分別提高了6.81%和2.92%,表明通過特征級聯(lián)方法及使用注意力機制網(wǎng)絡模塊,可以有效地兼顧淺層和深層兩種特征,對于提高咳嗽聲識別方面是有效的。

      5 結(jié) 語

      當前醫(yī)學上對于肺炎疾病識別方面,主要依賴于胸片檢查和專業(yè)醫(yī)生聽診等手段,存在成本高、專業(yè)要求高等缺點。本文提出的基于特征級聯(lián)的肺炎咳嗽聲識別方法,提供了一種非接觸性、低成本、較高準確率的肺炎識別方法,采用特征級聯(lián)方法合并兩種不同層次特征,實現(xiàn)對肺炎咳嗽聲的識別。實驗結(jié)果表明,特征級聯(lián)方法可以有效提高肺炎咳嗽聲識別的準確率。下一步將研究基于音頻識別出咳嗽聲并自動裁剪的方法,以及設計一套便攜式硬件系統(tǒng)用于識別肺炎咳嗽聲。

      猜你喜歡
      咳嗽聲波包級聯(lián)
      爸爸的咳嗽聲
      爸爸的咳嗽聲
      爸爸的咳嗽聲
      基于小波包Tsallis熵和RVM的模擬電路故障診斷
      級聯(lián)LDPC碼的STBC-OFDM系統(tǒng)
      不同意
      基于級聯(lián)MUSIC的面陣中的二維DOA估計算法
      基于小波包變換的電力系統(tǒng)諧波分析
      小波包理論與圖像小波包分解
      LCL濾波器在6kV級聯(lián)STATCOM中的應用
      徐水县| 东辽县| 浪卡子县| 营山县| 潍坊市| 涞源县| 金昌市| 北票市| 尚志市| 旌德县| 西乌| 曲松县| 富宁县| 文成县| 南雄市| 忻城县| 通海县| 焉耆| 长顺县| 安陆市| 汨罗市| 屯昌县| 上林县| 淅川县| 鹤岗市| 都昌县| 湘乡市| 自贡市| 南乐县| 宁津县| 鄂尔多斯市| 旬阳县| 长沙县| 依兰县| 庆云县| 桓台县| 芜湖县| 宝鸡市| 饶平县| 衡阳市| 赫章县|