• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于元音分類度的帕金森病語音特征分析

    2011-06-09 01:44:54洪文學常鳳香劉旭龍
    中國生物醫(yī)學工程學報 2011年3期
    關(guān)鍵詞:語言障礙測試者元音

    張 濤 洪文學 常鳳香 劉旭龍

    1(燕山大學信息科學與工程學院,秦皇島 066004)

    2(燕山大學生物醫(yī)學工程研究所,秦皇島 066004)

    引言

    帕金森病(Parkinson's Disease,PD)是人類常見的神經(jīng)退行性疾病之一,其發(fā)病率僅次于阿爾茨海默病(Alzheimer's Disease)。據(jù)流行病學調(diào)查,在北美約有100萬的帕金森病患者[1]。而在我國,2001年約有 200萬患者[2],且每年以 10萬人的速度遞增。

    同許多其他神經(jīng)系統(tǒng)疾病一樣,對帕金森病的診斷主要依賴于專家的臨床經(jīng)驗[3]。目前,我國大約有6成的帕金森病患者被誤診或者漏診。除了對帕金森病認識不夠的因素外,高昂的診斷費用與復雜的診斷過程往往令大部分早期患者望而卻步。隨著老齡化社會的到來,急需一種可以應用于基層醫(yī)療機構(gòu)甚至家庭的方便可行、費用低廉的帕金森病初步診斷方法,這對于提高帕金森病的早期就診率具有重大意義[4]。因此,以應用簡便為特色的帕金森病新型診斷方法也成為研究的熱點。

    在帕金森病的各種表現(xiàn)中,語言障礙為早期帕金森病的典型癥狀之一[5],大約90%的帕金森患者會出現(xiàn)某種程度的語言障礙[6]。對語言障礙的測量具有測量方便、有利于遠程診斷的特點,使得該類方法得到了極大的關(guān)注[6]。Little等對此進行了一系列的研究[7-8],并利用模式識別方法對基于語言障礙的帕金森病診斷進行了分析,奠定了模式識別方法在基于語言障礙的帕金森病機器診斷方法中的理論基礎?;?Little等的數(shù)據(jù)集,Guo、張濤等分別運用遺傳算法和多維篩對其進行了分析[9-10]。從模式識別角度看,現(xiàn)有的分類精度達到了較高水平。與此同時,針對語言障礙與所選擇語音特征及發(fā)音間關(guān)系的研究卻未見報道。由于不同發(fā)音對應的神經(jīng)控制不同,而不同發(fā)音情況下其語音特征表現(xiàn)必然有所差異,因此該研究的進展水平將影響基于語言障礙的帕金森病的檢測與識別過程。

    基于此,本研究利用持續(xù)發(fā)音法,對不同元音進行語音特征分析與統(tǒng)計,尋找不同語音特征下不同元音的類間分離度并討論其物理意義,為具有明確物理意義的帕金森病語音診斷奠定基礎。

    1 實驗方法

    1.1 采集方法與對象選擇

    目前,有多種方式對語言障礙進行測試,如持續(xù)發(fā)音法、連續(xù)演講法等。其中,持續(xù)發(fā)音法只要求受試者發(fā)出特定的音節(jié),這不但可以有效地避免發(fā)音不清帶來的干擾,而且不受語種與方言等因素的影響,因此得到了廣泛的應用??紤]到帕金森病發(fā)病地域性廣的特點,筆者采用持續(xù)發(fā)固定元音法進行研究。考慮到語音的普遍性,本研究選擇的元音來源于英語國際音標中的 5個,包括[ei][i:][?][?:][a:]。在語言學中,絕大多數(shù)的語言都有相同或類似的發(fā)音,因此該測試結(jié)果具有普遍性。

    在受試對象的選擇上,本實驗選擇50個健康受試對象,由其進行健康人健康組與模擬帕金森患者的發(fā)音。在實驗前,每位受試者要進行帕金森患者發(fā)音狀況的學習。由健康人模擬帕金森患者發(fā)音,除了考慮到測試所需時間較長、帕金森患者的身體狀況難以承受之外,還可以對同一人、不同狀況下的發(fā)音進行監(jiān)測,從而發(fā)現(xiàn)遞進變化規(guī)律。其中,正常發(fā)音錄制的語音歸類為健康組,模擬發(fā)音錄制的語音歸類為障礙組。

    在樣本采集過程中,測試者使用持續(xù)發(fā)固定元音法,針對[ei][i:][?][?:][a:]這五個特定元音分別錄制樣本,每段語音樣本的長度在6~10 s不等,采樣頻率為8 kHz,由于人類日常語音的頻率范圍在300~3 400 Hz,符合奈奎斯特抽樣定理,切實可行。錄制完畢的樣本隨后被送入計算機,進行后續(xù)語音特征分析,以獲得所需的有效信息。

    1.2 語音特征選擇

    在對現(xiàn)有各種語音特征算法進行對比分析的基礎上,結(jié)合Little等的研究成果[8],選取了周期變化特征、峰值變化特征以及諧波信噪比、趨勢波動分析法等作為研究重點,以期明確各特征算法的物理意義,為語音診斷提供更合理的理論依據(jù)。

    2 實驗結(jié)果與討論

    2.1 周期變化特征

    由語音信號本身特點及持續(xù)發(fā)音法的測試特點可知,采集到的語音時域波形圖具有明顯的類周期性。但是,要想進一步了解各語音周期值的相對變化情況,就需要對所獲得的語音周期序列進行算法分析。對于周期變化特征,可采用跳動、相對幅度振動、5點周期振動商、周期間平均絕對差與平均周期比進行測量[11],結(jié)果分別如表1~表4所示。

    表1 相對跳動結(jié)果Tab.1 The results of relative jitter

    表2 相對幅度振動結(jié)果Tab.2 The results of RAP

    表3 5點周期振動商結(jié)果Tab.3 The results of PPQ5

    表4 周期間平均絕對差與平均周期比結(jié)果Tab.4 The results of DDP

    經(jīng)過對各組數(shù)據(jù)的對比分析可以看出,人類的語音信號是一個類周期信號,基音周期值隨時間會發(fā)生一定振動,而存在語言障礙的確可以使基音周期的振動情況發(fā)生變異,本研究中所使用的跳動(jitter)、相對幅度振動、n點周期振動商、周期間平均絕對差與平均周期比這些語音特征也確實可以把這種變異情況展現(xiàn)出來。

    對各元音的運算結(jié)果進行橫向比較后發(fā)現(xiàn),在發(fā)[ei][i:][a:]這 3個元音時,健康測試者的特征值略大于模擬語言障礙測試者的特征值。而在發(fā)[?][?:]這兩個元音時,模擬語言障礙測試者的數(shù)據(jù)反而會大于健康測試者的特征數(shù)據(jù)。這是由于人的發(fā)音過程類似于一個非線性動力系統(tǒng)。在發(fā)出不同的語音時,口腔及聲道形狀、肌肉群的緊張程度都會有所不同,造成了整個非線性動力系統(tǒng)特性的改變[13]。反映到語音特征值上,發(fā)不同的元音,其運算結(jié)果的特點也就會有所不同。

    2.2 峰值變化特征

    與周期變化特征的研究類似,為更清晰地體現(xiàn)語音峰值的相對變化情況,同樣需要對所獲得的語音峰值序列進行特征算法分析?;诖?,引入閃爍、n點幅度振動商(n=3,5,11)以及相鄰周期幅度差的平均絕對差的概念[14]。其中,閃爍分為絕對閃爍(shimmer dB)和相對閃爍(relative shimmer)。表5~表10分別為各特征對語音數(shù)據(jù)樣本的運算結(jié)果。

    表5 絕對閃爍結(jié)果Tab.5 The results of shimmer

    表6 相對閃爍結(jié)果Tab.6 The results of relative shimmer

    表7 3點幅度振動商Tab.7 The results of APQ3

    表8 5點幅度振動商Tab.8 The results of APQ5

    表9 11點幅度振動商Tab.9 The results of APQ11

    表10 相鄰周期幅度差的平均絕對差Tab.10 The results of DDA

    對比實驗數(shù)據(jù)結(jié)果可以看出,類周期性的語音信號,其幅度峰值隨著時間推移也會發(fā)生一定振動,并且不同語音樣本的峰值振動情況均可以由閃爍(shimmer)、n點幅度振動商以及相鄰周期幅度差的平均絕對差這些語音特征展示出來。

    經(jīng)過這六個特征值的提取運算,所使用的元音[ei][i:][?][?:][a:]分別體現(xiàn)了不同的變化特點。其中,針對[ei]與[?:]的運算,模擬語言障礙測試者的數(shù)據(jù)明顯大于健康測試者的特征數(shù)據(jù);而在元音[?]的特征值提取結(jié)果中,健康測試者的數(shù)據(jù)均大于模擬語言障礙測試者的數(shù)據(jù)。與這兩種情況不同,[i:]和[a:]的特征值提取結(jié)果雖表現(xiàn)出了峰值的振動特點,但兩類測試者的數(shù)據(jù)基本相同,暫時無法把它們作為診斷依據(jù)使用。

    以上實驗結(jié)果再次證明,存在某種語言障礙會影響人的發(fā)音動力系統(tǒng)。但由于發(fā)不同的語音其動力系統(tǒng)的特點不同,就造成了針對不同發(fā)音,同一種語音特征也會以不同形式將語言障礙體現(xiàn)出來。該結(jié)論符合語音模型和帕金森病的發(fā)病機理。

    2.3 諧波信噪比

    自相關(guān)性是衡量數(shù)據(jù)之間關(guān)聯(lián)程度的一種常用方法,而諧波信噪比就是一種基于自相關(guān)理論的特征值算法。

    以元音[ei]與[i:]的相應語音樣本的自相關(guān)為例,結(jié)合其自相關(guān)運算結(jié)果圖,具體分析其在諧波信噪比這一語音特征中的應用。

    圖1和圖2分別為為健康組和障礙組針對元音[ei]的自相關(guān)運算結(jié)果。對于一個穩(wěn)定時間信號x(t),其自相關(guān)函數(shù)為

    圖1 元音[ei]健康組數(shù)據(jù)自相關(guān)Fig.1 The self-correlation of[ei]from healthy group

    由于語音信號是一種類周期信號,所以自相關(guān)運算結(jié)果并沒有周期性出現(xiàn)最大值,均出現(xiàn)了一些局部最值,當τ=2時,自相關(guān)函數(shù)取到局部最值。中的最大值,用此值比上τ=0時的函數(shù)值,即為語音信號中的諧波比重。

    圖2 元音[ei]障礙組數(shù)據(jù)自相關(guān)Fig.2 The self-correlation of [ei]from disorder group

    與元音[ei]類似,針對[i:]的語音樣本數(shù)據(jù)進行自相關(guān)運算后,其結(jié)果也沒有周期性出現(xiàn)最大值,而只是出現(xiàn)有一些局部最值,如圖3和圖4所示。當τ=2時,自相關(guān)函數(shù)值取到局部最值中的最大值,用此值比上0點的函數(shù)值,同樣代表了語音樣本信號中的諧波成分。

    圖3 元音[i:]健康組數(shù)據(jù)自相關(guān)Fig.3 The self-correlation of[i:]from healthy group

    圖4 元音[i:]障礙組數(shù)據(jù)自相關(guān)Fig.4 The self-correlation of[i:]from disorder group

    人的語音信號或多或少都會夾雜一定的噪聲成分,若不考慮外界環(huán)境的干擾,這種噪聲主要就與發(fā)音動力系統(tǒng)的特點有關(guān),所使用的諧波信噪比就是一個用來度量信號中諧波成分與噪聲成分比例的特征值。表11列出函數(shù)諧波信噪比對語音數(shù)據(jù)樣本的運算結(jié)果。

    從數(shù)據(jù)分析不難看出,由于加入了顫抖、發(fā)音間隔及較多的氣息聲,使障礙組的諧波信噪比明顯小于健康組,而諧波信噪比取值較小說明其噪聲成分較大。所以,借助本研究所使用的諧波信噪比這一特征的取值,可以展示出發(fā)音者是否存在語言障礙。

    表11 諧波信噪比結(jié)果 dBTab.11 The results of HNR in dB

    2.4 趨勢波動分析

    趨勢波動分析(detrended fluctuation analysis,DFA)是一類應用于研究語音信號中隨機噪聲自相似程度的語音特征。這種隨機噪聲大多是在發(fā)聲時氣流經(jīng)過聲帶而產(chǎn)生的。對于那些存在語言障礙的帕金森病患者,由于其聲帶存在病變,就會使夾雜進語音信號中的隨機噪聲發(fā)生改變。

    表12和表13為針對健康組與障礙組測試語音樣本在不同窗口長度下的計算結(jié)果。如前所述,趨勢波動分析是一類基于非線性動力系統(tǒng)理論的新型語音特征,其具體實施過程主要分為兩大部分,即語音數(shù)據(jù)變化趨勢求取和語音數(shù)據(jù)圍繞其變化趨勢上下波動情況分析。通過對隨機噪聲特性分析,可以觀測到帕金森患者的病變情況。

    表12 健康組樣本的趨勢波動分析Tab.12 The results of DFA for healthy group

    表13 障礙組樣本的趨勢波動分析Tab.13 The results of DFA for disorder group

    針對趨勢波動分析,元音[ei][?][?:]在兩組數(shù)據(jù)中表現(xiàn)出了明顯的特異性,可以作為診斷依據(jù)做進一步分析,而[i:][a:]差異不明顯。該結(jié)論符合語音信號分析中的共振腔模型。

    3 結(jié)論

    經(jīng)過對所得數(shù)據(jù)的分析處理,進一步闡明了各語音特征的物理意義及其應用特點,為基于語言障礙檢測的帕金森病早期診斷提供了可靠依據(jù)。在證明語音特征用于帕金森病診斷有效性的同時,分析了不同特征下不同元音的類間分離度,為基于語音障礙的帕金森病自動診斷奠定了基礎。

    在后續(xù)的工作中,除了加強語音特征的數(shù)量以達到更好的檢測效果外,在簡化實驗過程的前提下,引入真實的各階段帕金森患者進行語音樣本采集是重要的工作方向。

    [1]Lang AE,Lozano AM.Parkinson's disease-first of two parts[J].New England Journal of Medicine,1998,339:1044 - 1053.

    [2]Zhang Zhenxin,Gustavo CR,Zhen Hong,et al.Parkinson’s disease in China:prevalence in Beijing,Xian,and Shanghai[J].The Lancet,2005,365(9459):595 - 597.

    [3]張振馨.神經(jīng)系統(tǒng)疾病流行病學調(diào)查方法和問題[J].中華神經(jīng)科雜志,2005,38(2):65 -66.

    [4]韓艷,張曉紅,陳彤,等.帕金森病診治現(xiàn)狀調(diào)查[J].中華保健醫(yī)學雜志,2008,10(1):18 -20.

    [5]Duffy JR.Motor speech disorders:substrates,differential diagnosis,and management[M].Saint Louis:Elsevier Mosby,2005:80-142.

    [6]Sapir S,Spielman JL,Ramig LO,et al.Effects of intensive voice treatment on vowel articulation in dysarthric individuals with idiopathic parkinson disease:acoustic and perceptual findings[J].J Speech Lang Hear Res,2007,50:899 - 912.

    [7]Little MA,Patrick EM,Eric JH,et al.Suitability of dysphonia measurements for telemonitoring of Parkinson’s disease[J].IEEE Transactions on Biomedical Engineering,2009,56(4):1015-1022.

    [8]Little MA,Patrick EM,Stephen JR,et al.Exploiting nonlinear recurrence and fractalscaling propertiesforvoice disorder detection [J].BioMedical Engineering OnLine,2007,6(1):1:19.

    [9]Guo Peifang,PrabirB,NawwafK.Advancesin detecting parkinson’s disease [J].Lecture Notes in Computer Science,2010,6165:306 -314.

    [10]張濤,洪文學,李銘婷.基于多維篩分類器的可視化帕金森病診斷 [J].燕山大學學報,2010,34(2):180 -184.

    [11]Li Xi,Tao Jidong,Michael TJ.Stress and emotion classification using jitter and shimmer features//ICASSP 2007,Hawaii:IEEE,2007:1081 -1084.

    [12]PaulB.Accurate short-term analysis ofthe fundamental frequency and the harmonics-to-noise ratio of a sampled sound[J].J Acoustical Society of America,1993,17:97 - 110.

    [13]Kantz H,Schreiber T.Nonlinear time series analysis[M].Cambridge:Cambridge University Press,1999:39 -154.

    [14]Andre G A.Modeling prosodic different for speaker recognition[J].Speech Communication,2007,49:277-291.

    猜你喜歡
    語言障礙測試者元音
    康復護理在腦卒中后語言障礙患者中的應用研究
    基于數(shù)據(jù)挖掘的呂英教授治療自閉癥語言障礙的用藥規(guī)律分析
    元音字母和元音字母組合的拼讀規(guī)則
    元音字母和元音字母組合的拼讀規(guī)則
    搜救犬幼犬挑選測試
    學前特殊兒童語言障礙的矯治策略
    知識文庫(2018年13期)2018-05-14 01:10:04
    指紋收集器
    可監(jiān)測腦電波的智能燈
    Playing with “ar”
    很多英國人不會拼常用詞
    玉树县| 南岸区| 牙克石市| 桐乡市| 油尖旺区| 云龙县| 会东县| 磐石市| 上杭县| 拉萨市| 兰考县| 黎川县| 南漳县| 彭山县| 宜君县| 寿阳县| 广丰县| 常州市| 资溪县| 沾化县| 浦北县| 盐边县| 西昌市| 南木林县| 塔城市| 崇文区| 保亭| 禄丰县| 宿松县| 安仁县| 江陵县| 固始县| 九江县| 东丰县| 长阳| 黄平县| 平邑县| 丰镇市| 宜州市| 定远县| 夏河县|