• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于模型過濾的多任務回歸在帕金森癥預測中的應用

      2018-12-14 05:32:56峰,季薇,李
      計算機應用 2018年11期
      關鍵詞:多任務帕金森特征選擇

      劉 峰,季 薇,李 云

      (1.南京郵電大學 通信與信息工程學院,南京 210003; 2.南京郵電大學 計算機學院,南京 210023)(*通信作者電子郵箱873216019@qq.com)

      0 引言

      帕金森癥(Parkinson’s Disease,PD)是繼阿爾茨海默氏病后第二大常見的神經(jīng)退行性疾病,僅中國大陸就有超過300萬人受到該病的影響[1-2]。它的主要癥狀是肌肉僵硬、運動過緩、靜止性震顫以及其他一些運動障礙[3-4]。臨床實踐中,醫(yī)生大多采用統(tǒng)一帕金森定量表(Unified Parkinson’s Disease Rating Scale, UPDRS)[5-6]來衡量患者帕金森癥癥狀的嚴重性。已有研究表明,60%~90%的帕金森患者會出現(xiàn)語言障礙,患有某種程度上的語音損傷,語音損傷也可能是帕金森最早的征兆之一[7], 因此,可以通過語音分析來對患者的病情進行早期診斷。

      近幾年研究中,Goetz等[8]強調了利用語音信號預測UPDRS 的重要性;Tsanas[9]在此基礎上使用了各種語音信號處理算法得到了相關病特征,并利用傳統(tǒng)的機器學習方法(如最小二乘(Least Squares, LS)、決策回歸樹等)預測帕金森癥患者的 motor-UPDRS(motor Unified Parkinson’s Disease Rating Scale) 評分和 total-UPDRS(total Unified Parkinson’s Disease Rating Scale)評分;文獻[10-11]在此基礎上介紹了基于參數(shù)優(yōu)化的支持向量機的帕金森病診斷方法,證明了經(jīng)參數(shù)優(yōu)化的支持向量機可以提高帕金森病診斷的準確率;Athansios等[12]則通過語音測試來證明UPDRS評估具有臨床上有用的準確性,同時指出motor-UPDRS和total-UPDRS受不同語音特征影響,其在預測motor-UPDRS和total-UPDRS時,貢獻度并不相同。然而,Tsanas只考慮了在單任務條件下利用各種語音特征預測motor-UPDRS 和total-UPDRS分析病情,但是并沒考慮到在多任務學習過程時,子任務語音特征對motor-UPDRS和total-UPDRS的貢獻度的不同,各子任務的共享特征也會影響到其他子任務的預測效果。較之于單獨的學習各個子任務,對于多個相關的子任務同時學習能有效地提升預測性能[13], 并且,一致性原理[14]又對此給出了理論保障,即若最大化各相關子學習機的一致性,則能使各子學習機的性能得到改善。Evgeniou等[15]提出了正則化多任務學習(regularized multi-task learning)方法,其思想是在保持各個自學機局部優(yōu)化的同時,使得多個學習機之間的全局差異最小化。正則化多任務學習以其模型的簡潔性從而成為多任務學習理論研究基礎。

      本文考慮到了在預測motor-UDPRS和total-UPDRS時,子任務語音特征之間相互影響,通過特征選擇,合理利用子任務之間的共享特征,使得模型可解釋性更強,模型更為稀疏。同時在考慮不同對象分布域不同的基礎上,添加了過濾機制,提出了基于模型過濾的多任務回歸算法來解決帕金森UPDRS多任務預測問題。

      1 帕金森語音預處理

      1.1 語音數(shù)據(jù)集描述

      本文采用UCI遠程帕金森數(shù)據(jù)集,數(shù)據(jù)集詳見文獻[8]。數(shù)據(jù)集包含了42位原發(fā)性帕金森患者的采集信息,其中男性共有28位,女性占了14位,每一位患者都有5年的患病歷史。采集數(shù)據(jù)期間,病人每周完成醫(yī)生制定的一系列測試,并記錄該病人的6條語音,持續(xù)6個月,由此一共采集了5 875條語音音頻,其中男性占4 010條,女性占1 865條。

      1.2 語音特征提取及選擇

      1.2.1 帕金森語音特征提取

      利用錄制到的語音音頻對帕金森癥患者UPDRS進行預測時,首先需要經(jīng)過去噪算法以及各種語音信號處理算法處理得到相關語音特征, 例如諧波噪聲比(Harmonic to Noise Ratio,HNR)、噪聲諧波比(Noise to Harmonic Ratio,NHR)、趨勢波動分析(Detrended Fluctuation Analysis,DFA)、循環(huán)周期密度熵(Recurrence Period Density Entropy, RPDE)和基因周期熵(Pitch Period Entroy, PPE)等; 然后,將帕金森病理特征向量作為輸入向量,通過構建的模型,得到患者UPDRS。本文采用文獻[5,8,11]中介紹的語音信號處理算法進行帕金森語音處理,詳見表1。

      表1 語音信號處理方法

      通過上述線性和非線性語音信號處理方法,能夠將1條語音處理成一個16維的語音特征向量,每一維表示一個提取的語音信號特征值。經(jīng)過語音特征的提取,得到一個5 875*16的數(shù)據(jù)集。

      1.2.2 帕金森語音特征選擇

      基于L1正則化的學習方法則是一種嵌入式特征選擇方法,其特征選擇過程和學習器訓練過程融為一體,同時完成[16]。本文在構建模型時引入L1正則化項,進行帕金森語音特征選擇,從而合理利用子任務之間共享的帕金森語音特征,使得各子任務差異性更小,提高預測模型的稀疏性和泛化能力。

      2 基于模型過濾的多任務回歸算法

      2.1 數(shù)據(jù)集分析

      在數(shù)據(jù)集預處理階段,本文隨機選取了5個對象,畫出motor-UPDRS隨時間變化的曲線,如圖1所示。本文發(fā)現(xiàn),不同對象之間的帕金森病情進展有顯著的不同。其中,如對象1和對象2,兩者之間變化規(guī)律的差異性很大;相反,對象1和對象5曲線變化規(guī)律卻非常相似。很顯然在進行對象1的UPDRS預測時,本文須考慮帕金森對象分布在不同的域對預測模型的影響,否則模型的精確度將會大幅降低。因此本文添加過濾機制,來區(qū)分不同帕金森對象,提高預測精確度。

      圖1 對象motor-UPDRS值隨時間變化規(guī)律

      2.2 多任務回歸模型過濾

      在本實驗中UPDRS的預測作為一個多任務回歸問題,結合帕金森對象病情之間的差異性這一事實,提出了基于模型過濾的多任務回歸方法(Multi-Task Regression Model Filtering, MTRMF)。該模型算法包含三部分:多任務回歸算法構建模型并進行特征選擇、添加過濾機制進行模型融合。多任務回歸構建模型部分,則將N-1個已知對象數(shù)據(jù)構建N-1個多任務回歸模型;添加過濾機制部分,則利用驗證集數(shù)據(jù)對N-1個回歸模型進行過濾,具體步驟詳見實驗;模型融合部分,則將過濾之后的剩余模型進行融合,獲取待測對象的最終預測模型,從而提高算法的泛化能力。

      設訓練數(shù)據(jù)集中包含N個對象,共n條語音記錄,X∈Rn×d為輸入語音特征矩陣;Y∈Rn×t為UPDRS值矩陣,即帕金森病人motor-UPDRS值和total-UPDRS值;W∈Rd×t為模型參數(shù)矩陣。其中:d為帕金森語音特征向量維度,n為語音數(shù)據(jù)記錄數(shù),t為任務數(shù)。λ1為L1正則化參數(shù),λ2為L2正則化參數(shù)。

      建立模型如下:

      (1)

      在求解模型之前引入如下定理:

      定理1 假設F1和F2是兩個下半連續(xù)的凸函數(shù),F(xiàn)2在Rn×m中可微且對某個β∈(0,+∞)滿足β-Lipschitz連續(xù),即為:

      ‖▽F2(U)-▽F1(V)‖F(xiàn)≤β‖U-V‖F(xiàn)

      (2)

      則對于凸優(yōu)化問題:

      (3)

      有如下性質:

      1)如果F1+F2是強制的,即為:

      (4)

      則問題2)至少有一個解。

      2)如果F1+F2是嚴格凸的,則問題2)至多存在一個解。

      3)如果F1和F2同時滿足條件1)和條件2),則問題2)存在唯一解,且對任意的初始值X0及0<δ<2/β,用如下方法生成的迭代序列Xk+1收斂到問題2)的唯一解:

      Xk+1=proxδF1(Xk-δ▽F2(Xk))=

      (5)

      其中,k為迭代次數(shù),且性質(3)所描述的求解算法通常稱之為近鄰前向后向分裂(Proximal Forward Backward Splitting,PFBS)算法。證明詳見文獻[17]。

      定理2 對任意的τ>0,Y∈Rn×m,矩陣收縮算子ζτ(Y)滿足

      sign(Y)·max(0,|Y|-τ)

      (6)

      其中sign(·)為符號函數(shù)。證明詳見文獻[18]。則MTRMF模型問題求解轉化為:

      Wk+1=

      (7)

      MTRMF算法偽代碼如下:

      算法 基于模型過濾的多任務回歸算法(MTRMF)。

      輸入Xn×d,Yn×t,λ1,λ2,δ;

      fori=1,2,…,N

      1) 進行預處理Xn×d

      2) 設定迭代次數(shù)k,和正則化參數(shù)λ1,λ2

      3) forj=1,2,…,N-1

      form=1,2,…,k

      end

      end

      5) 添加過濾機制,獲得剩余符合條件的M個模型

      end

      3 實驗與分析

      將數(shù)據(jù)集中任一對象作為待預測對象,其他N-1對象作為已知對象建立模型進行對比實驗;同時將待測對象的數(shù)據(jù)平均分為3部分,前1/3作為驗證集,使用N-1個訓練出的回歸模型對其進行預測,并計算出平均絕對誤差(Mean Absolute Error, MAE)值來衡量N-1個模型對待測對象的表現(xiàn)性能。其中,將MAE值大于閾值σ的模型進行過濾,并選出剩余較好的M個模型進行融合。后2/3作為測試集進行模型預測,同樣使用MAE來衡量融合后模型的性能。

      實驗分別比較了單任務條件下最小二乘(Least Squares, LS)法[6]、加權迭代的最小二乘法(Iteratively Reweighted Least Squares, IRLS)[9]、決策回歸樹(Classification and Regression Tree, CART_rg)[4]以及多任務回歸模型(MTRMF)的預測效果。在實驗訓練階段,IRLS設置迭代次數(shù)為100,迭代次數(shù)采用文獻[9]設置的迭代次數(shù)。MTRMF模型迭代次數(shù)設置為100,delta設置為0.000 01,lmada2設置為0.2。根據(jù)文獻[11]得出的結論,帕金森選擇的特征數(shù)達到13時, F-Measure趨于穩(wěn)定,并且錯誤率達到最低。由此可以得出當帕金森病理特征選擇數(shù)目達到13時,模型的泛化能力,可解釋性達到最佳。經(jīng)過實驗,本文設置lmada1為12.5,預測效果達到最佳; 同時,在進行模型過濾時,閾值σ設置為8。最終motor-UPDRS對比實驗結果如圖2所示,total-UPDRS對比實驗結果如圖3所示。

      由圖3可知,在大部分對象預測的表現(xiàn)上,MTRMF比單任務條件下LS,IRLS和CART_rg預測的誤差更小。為了精確描述MTRMF性能,本文采用MAE的方差來衡量算法穩(wěn)定性。實驗結果如表2所示。

      表2 各回歸算法預測MAE結果的方差

      由表2可知,基于模型過濾的多任務回歸模型在預測UPDRS時,比單任務條件下LS模型預測motor值準確度提高了67.2%;預測total值則提高了83.3%。相比單任務條件下CART_rg預測motor值提高了64%;預測total值則提高了78.4%。同時在實驗時利用L1正則化項進行特征選擇發(fā)現(xiàn),模型對于振幅擾動類特征、HNR、RPDE和DFA等特征更為偏好,預測效果相較于單任務回歸算法得到極大提升。為了驗證挑選出的13種特征是否有效,本文將挑選出的特征在單任務下用最小二乘法(LS)進行訓練,發(fā)現(xiàn)當剔除Jitter(Abs)、Jitter(RAP)、Jitter(PPQ5)這三種特征后,最小二乘法(LS)預測模型效果基本不變,如表3所示。結果表明,本文方法在進行特征選擇時,并沒有漏除重要語音特征,相反回歸模型變得更為稀疏,預測性能更好。實驗表明在多任務回歸模型中添加L1正則化項進行特征選擇有助于模型稀疏化,也提高了模型的泛化能力和模型的可解釋性。進一步表明,在預測病人UPDRS時,一定要注意采集語音期間病人連續(xù)穩(wěn)定發(fā)聲,實驗時應該多關注HNR、RPDF、Shimmer類特征的變化。

      圖2 在帕金森數(shù)據(jù)集各對象上預測motor-UPDRS的MAE比較

      預測結果方差特征選擇前LS_MAE特征選擇后LS_MAEmotor-UPDRS15.1214.52total-UPDRS37.1635.16

      4 結語

      本文將多任務回歸模型應用到遠程帕金森數(shù)據(jù)集中,實現(xiàn)了對motor-UPDRS和total-UPDRS的聯(lián)合預測, 并且與單任務條件下最小二乘法、決策樹回歸等傳統(tǒng)回歸方法比較。實驗表明,在帕金森UPDRS預測過程中,對于多變量預測、多任務回歸模型比單任務模型更加有效。該方法在建模過程中利用L1正則化項進行特征選擇,使得模型更為稀疏,模型可解釋性更強,模型的泛化能力與傳統(tǒng)單任務模型相比,得到了極大的提升。同時本模型考慮到了帕金森對象的差異性,使用已有的驗證數(shù)據(jù)在模型融合前進行過濾,使得預測效果變得更好的前提下,模型的穩(wěn)定性得到增強。當然,本文只考慮了不同對象分布在不同的域中,但是如何取測量不同時間維度下的帕金森UPRDS數(shù)據(jù)的發(fā)展以及病情程度的相似度問題,將是下一步工作的重點。

      圖3 在帕金森數(shù)據(jù)集各對象上預測total-UPDRS的MAE比較

      猜你喜歡
      多任務帕金森特征選擇
      一對一心理護理對帕金森伴抑郁癥患者的影響
      多巴胺不敏感型帕金森綜合征診斷及治療的研究進展
      基于中心化自動加權多任務學習的早期輕度認知障礙診斷
      Kmeans 應用與特征選擇
      電子制作(2017年23期)2017-02-02 07:17:06
      基于判別性局部聯(lián)合稀疏模型的多任務跟蹤
      自動化學報(2016年3期)2016-08-23 12:02:56
      基于多任務異步處理的電力系統(tǒng)序網(wǎng)絡拓撲分析
      電測與儀表(2016年5期)2016-04-22 01:13:46
      聯(lián)合互信息水下目標特征選擇算法
      2013~2015年廣東同江醫(yī)院門診抗帕金森藥應用分析
      基于特征選擇和RRVPMCD的滾動軸承故障診斷方法
      患帕金森綜合癥的日子——一位匿名神經(jīng)學家的自述
      世界科學(2014年2期)2014-02-28 14:58:11
      商都县| 招远市| 淄博市| 濉溪县| 鄂伦春自治旗| 巫溪县| 衡南县| 遂溪县| 安平县| 武乡县| 大安市| 淳安县| 浦城县| 乐陵市| 全州县| 平顶山市| 唐河县| 长岭县| 海南省| 沙坪坝区| 冷水江市| 洛阳市| 罗源县| 太谷县| 麻栗坡县| 武穴市| 徐汇区| 深泽县| 库车县| 乐昌市| 洛浦县| 东方市| 朝阳区| 柳州市| 正镶白旗| 古浪县| 德兴市| 山丹县| 湾仔区| 颍上县| 巴中市|