陳艷霞 劉揮
基于BP神經(jīng)網(wǎng)絡的醫(yī)學數(shù)據(jù)分析
陳艷霞 劉揮
BP網(wǎng)絡是一種基于誤差反向傳播(Back Propagation)算法的多層前向神經(jīng)網(wǎng)絡。采用動量梯度下降算法(TRAINGDM)訓練BP網(wǎng)絡,建立輸入到輸出的函數(shù)映射關(guān)系,使其對48例兩類五種醫(yī)學免疫學數(shù)據(jù)進行訓練與分類。訓練集數(shù)據(jù)正確檢出率為100%,測試集數(shù)據(jù)正確檢出率為87.5%,效果優(yōu)良。結(jié)論BP網(wǎng)絡應用于免疫學數(shù)據(jù)分類取得很好效果,在臨床免疫學人工智能診斷方面將有更為廣泛的應用空間。
BP神經(jīng)網(wǎng)絡;動量梯度下降算法;免疫學數(shù)據(jù)
人工神經(jīng)網(wǎng)絡理論以非線性大規(guī)模并行分布處理為特點,突破了傳統(tǒng)的線性處理模式,以其高度的并行性,良好的容錯性和自適應能力成為人們研究其賴以生存的非線性世界、探索和研究某些復雜大系統(tǒng)的有力工具,已應用于很多領(lǐng)域的信息處理工作。
BP算法的多層前饋網(wǎng)絡的人工神經(jīng)網(wǎng)絡模型采用典型的有教師學習方式來進行預測和分類問題的處理。采用的傳遞函數(shù)通常是sigmoid型可微函數(shù),可以實現(xiàn)輸入和輸出間的任意非線性映射。這使其在函數(shù)逼近、模式識別、數(shù)據(jù)壓縮領(lǐng)域有著更加廣泛的應用。該模型的特點是信號由輸入層單向傳遞到輸出層,同一層神經(jīng)元之間互不傳遞信息,每個神經(jīng)元與鄰近層所有神經(jīng)元相連,各神經(jīng)元的作用函數(shù)為Sigmoid函數(shù),用樣本集合反復訓練網(wǎng)絡,并不斷修改權(quán)值,直到使實際輸出向量達到要求,訓練過程結(jié)束。應用BP網(wǎng)絡處理正常狀態(tài)與處于焦慮狀態(tài)的學生的血液中免疫學指標數(shù)據(jù),取得了很好的效果[1]。
數(shù)據(jù)選自在某大學就讀的大學生,共計48例。在自愿、正常學習生活的情況下抽取他們的血液標本,然后再在考試前抽取他們的血液標本,分別進行五項免疫學指標檢驗,共獲得兩類、五項、480組數(shù)據(jù)。隨機把其中的20例學生的兩類、五項數(shù)據(jù)做為訓練集輸入矢量輸入,目標矢量為處于考前狀態(tài)的五項數(shù)據(jù)輸出為1,平時正常生活狀態(tài)的五項數(shù)據(jù)輸出為0。網(wǎng)絡訓練時調(diào)整神經(jīng)元之間的連接權(quán)值,使網(wǎng)絡的輸出和實際的兩類情況盡可能相符。如果對所有的訓練樣本集網(wǎng)絡的輸出95%或更高能保證與實際結(jié)果一致,則訓練過程結(jié)束。網(wǎng)絡訓練好后,剩余的28例學生的5項數(shù)據(jù)作為神經(jīng)網(wǎng)絡的輸入項,神經(jīng)網(wǎng)絡的輸出值就是該學生是處于考前狀態(tài)1還是平時正常生活狀態(tài)0。主要設(shè)計程序如下: %NEWFF-生成一個新的前向神經(jīng)網(wǎng)絡;%TRAIN-對BP神經(jīng)網(wǎng)絡進行訓練;%SIM-對BP神經(jīng)網(wǎng)絡進行仿真;pause%敲任意鍵開始
表1 BP神經(jīng)網(wǎng)絡處理免疫學數(shù)據(jù)結(jié)果
其中對于訓練集,正常狀態(tài)與考前狀態(tài)的正確檢出率為100%。對于測試集,正常狀態(tài)的正確檢出率為85.7%;考前狀態(tài)的正確檢出率為89.3%。平均為87.5%。
3.1 本研究所采用的人工神經(jīng)網(wǎng)絡檢驗免疫數(shù)據(jù)的結(jié)果較好地符合了已知數(shù)據(jù),具有較高的準確性。
3.2 要想進一步提高該方法的準確性,應該注意收集更多更全面的檢驗數(shù)據(jù)。如果我們所使用的數(shù)據(jù)越多越全面,則其中所蘊含的事物本身的規(guī)律性就越強,利用人工神經(jīng)網(wǎng)絡從中所抽取的函數(shù)關(guān)系就越具有普遍性,因而就更準確。
3.3 可能對亞健康的診斷具有指導意義。亞健康問題各國醫(yī)學界已作了一些研究,并取得了某些實際的成果。但是,由于亞健康的多種類型以及多種相關(guān)因素,使得現(xiàn)有的診斷在準確性和實用性方面都存在著相當?shù)木窒扌?,如建模復雜困難。由于對影響罹病與否的各種因子的作用機制了解得不是很清楚,如何建立診斷模型,以及如何確定新建立的模型在何種程度上與實際情況相吻合還是一個問題;容錯能力不強,適用范圍不廣;依賴于某些病例庫新建立起來的醫(yī)學模型往往具有很強的局限性,用于新的病例庫時誤差有時較大。另外,由于醫(yī)學方面的原因,我們收集到的數(shù)據(jù)有時不完整,而現(xiàn)有的研究方法所建立起的醫(yī)學模型由于容錯性差,對這些不完整的數(shù)據(jù)通常都難以處理。人工神經(jīng)網(wǎng)絡理論突破了傳統(tǒng)的線性處理模式,以其高度的并行性,良好的容錯性和自適應能力成為人們研究其賴以生存的非線性世界,探索和研究某些復雜大系統(tǒng)的有力工具。對亞健康的診斷關(guān)鍵在于準確找到亞健康的判定函數(shù),可能利用BP網(wǎng)絡的函數(shù)逼近功能來實現(xiàn)。這需要有更多的醫(yī)學數(shù)據(jù)來實踐檢驗。
[1]許東,吳征.基于MATLAB6.X的系統(tǒng)分析與設(shè)計-神經(jīng)網(wǎng)絡.西安電子科技大學出版社,2002:9.
[2]王俊杰,陳景武.BP神經(jīng)網(wǎng)絡在疾病預測中的應用.數(shù)理醫(yī)藥學雜志,2008,21(3):260-262.
116044 大連醫(yī)科大學醫(yī)學影像學系(陳艷霞);大連醫(yī)科大學檢驗醫(yī)學院(劉揮)