潘艷軍
摘 要 隨著大數(shù)據(jù)時(shí)代的來(lái)臨,互聯(lián)網(wǎng)和物聯(lián)網(wǎng)技術(shù)的快速發(fā)展帶來(lái)了數(shù)據(jù)的上傳和下載等更多的便利,促使互聯(lián)網(wǎng)上的數(shù)據(jù)量出現(xiàn)了急劇增長(zhǎng)的狀態(tài),在這樣的環(huán)境下,也就產(chǎn)生出了專(zhuān)門(mén)針對(duì)大數(shù)據(jù)的存儲(chǔ)、計(jì)算、分析以及處理等一些新的問(wèn)題。而在醫(yī)療領(lǐng)域中,大數(shù)據(jù)的作用也就顯得越來(lái)越重要。因此,基于基因組學(xué)和現(xiàn)代生物醫(yī)學(xué)技術(shù)的個(gè)性化醫(yī)療,也就成了未來(lái)醫(yī)學(xué)領(lǐng)域發(fā)展的主要方向。但是目前,怎樣對(duì)大數(shù)據(jù)進(jìn)行獲取、分類(lèi)、存儲(chǔ)、將其中有價(jià)值的信息挖掘出來(lái),以及怎樣將其更加有效地應(yīng)用在醫(yī)療領(lǐng)域中也就成了熱點(diǎn)話題。為了對(duì)此進(jìn)行更加深入的研究和分析,文章對(duì)大數(shù)據(jù)及其特征、大數(shù)據(jù)分析技術(shù)以及其在醫(yī)療領(lǐng)域中的應(yīng)用作了如下綜述。
關(guān)鍵詞 大數(shù)據(jù);醫(yī)療領(lǐng)域;應(yīng)用;分析
中圖分類(lèi)號(hào) G2 文獻(xiàn)標(biāo)識(shí)碼 A 文章編號(hào) 1674-6708(2018)218-0117-02
隨著科技時(shí)代的到來(lái),各個(gè)領(lǐng)域中均出現(xiàn)了數(shù)據(jù)的爆炸式增長(zhǎng),而大數(shù)據(jù)也成為當(dāng)今社會(huì)被研究的重點(diǎn)話題,并且其數(shù)據(jù)的分析以及應(yīng)用也已經(jīng)成了世界科技界以及各國(guó)政府所關(guān)注的焦點(diǎn)話題,“大數(shù)據(jù)時(shí)代”真的已經(jīng)來(lái)到了我們的身邊。但是目前所面臨的難題依舊是怎樣更好的獲取、分類(lèi)、存儲(chǔ)、處理和傳輸這些數(shù)據(jù)。在醫(yī)療領(lǐng)域,我國(guó)正處在一個(gè)醫(yī)學(xué)信息爆炸的時(shí)代,如醫(yī)學(xué)圖像、電力病例記錄、基因序列、多中心臨床藥物試驗(yàn)等各個(gè)領(lǐng)域每天都會(huì)產(chǎn)生大量的數(shù)據(jù),這也對(duì)醫(yī)療領(lǐng)域在對(duì)大數(shù)據(jù)技術(shù)對(duì)比應(yīng)用起到了推進(jìn)的作用[ 1 ]。
1 大數(shù)據(jù)及其特征
大數(shù)據(jù)具有以下幾個(gè)特征,即極大的數(shù)據(jù)量:來(lái)自于互聯(lián)網(wǎng)、物聯(lián)網(wǎng)以及電子商務(wù)等多個(gè)方面的數(shù)據(jù);模態(tài)極多:其有文本、視頻、語(yǔ)音、網(wǎng)頁(yè)等半結(jié)構(gòu)化和非結(jié)構(gòu)化的數(shù)據(jù)模態(tài);速度快:其所產(chǎn)生的數(shù)據(jù)都有著較強(qiáng)的時(shí)效性;有著密度較低的高價(jià)值信息[ 2 ]。
2 大數(shù)據(jù)分析技術(shù)
2.1 機(jī)器學(xué)習(xí)和數(shù)據(jù)挖掘算法
大數(shù)據(jù)分析的基礎(chǔ)就是機(jī)器學(xué)習(xí),要想從無(wú)模式、凌亂、復(fù)雜的大數(shù)據(jù)中挖掘出更多有價(jià)值的信息,就需計(jì)算機(jī)對(duì)人類(lèi)學(xué)習(xí)的過(guò)程進(jìn)行模擬。目前,使用較多的機(jī)器學(xué)習(xí)系統(tǒng)則為神經(jīng)網(wǎng)絡(luò)(DNN),其也大大降低了語(yǔ)音識(shí)別的錯(cuò)誤率。其包括大數(shù)據(jù)的分類(lèi)、聚類(lèi)、關(guān)聯(lián)分析、并行算法等。數(shù)據(jù)挖掘算法是以數(shù)據(jù)為依據(jù)創(chuàng)建數(shù)據(jù)挖掘模型的一種試探計(jì)算法。其主要是利用機(jī)器學(xué)習(xí)來(lái)實(shí)現(xiàn)對(duì)數(shù)據(jù)的分類(lèi),進(jìn)而從其中找到有價(jià)值的信息。
2.2 預(yù)測(cè)性分析
這是一種重要的大數(shù)據(jù)分析方法,通過(guò)科學(xué)的建立一個(gè)模型,將已知的數(shù)據(jù)輸入,對(duì)未來(lái)進(jìn)行預(yù)測(cè),所得出的結(jié)果在本質(zhì)上只是一個(gè)概率。其包括對(duì)數(shù)據(jù)的獲取、檢測(cè)、分析、預(yù)測(cè)建模等。
2.3 可視化分析
大數(shù)據(jù)的查詢和分析的實(shí)用性和有效性直接決定著人們對(duì)決策信息的獲取情況,而可視化的大數(shù)據(jù)分析技術(shù)就將數(shù)據(jù)的分析結(jié)果更加形象和直觀的展示了出來(lái),進(jìn)而找出蘊(yùn)藏在其中的規(guī)律和特征,將有價(jià)值的信息挖掘出來(lái)[ 3 ]。此種大數(shù)據(jù)分析技術(shù)極其簡(jiǎn)單,甚至一些非IT專(zhuān)業(yè)的人員也能夠通過(guò)實(shí)現(xiàn)對(duì)大數(shù)據(jù)的分析和應(yīng)用,所以,此種技術(shù)不但是對(duì)大數(shù)據(jù)進(jìn)行分析的關(guān)鍵技術(shù),還是呈現(xiàn)對(duì)大數(shù)據(jù)分析結(jié)果的關(guān)鍵技術(shù)。
2.4 語(yǔ)義引擎
此種大數(shù)據(jù)分析技術(shù)就是從詞語(yǔ)表達(dá)大語(yǔ)義和層次上對(duì)用戶的檢索請(qǐng)求進(jìn)行識(shí)別和處理,其被廣泛的應(yīng)用在了對(duì)網(wǎng)絡(luò)數(shù)據(jù)的挖掘中。用戶利用此種技術(shù),將需要的關(guān)鍵詞輸入到檢索系統(tǒng)中,從而找到需要的數(shù)據(jù)[4]。
2.5 知識(shí)計(jì)算
知識(shí)計(jì)算需要從大量的數(shù)據(jù)中搜索出高價(jià)值的知識(shí),并將其構(gòu)成能夠支持查詢、分析和計(jì)算的知識(shí)庫(kù)。
2.6 數(shù)據(jù)質(zhì)量和數(shù)據(jù)管理
大數(shù)據(jù)分析中,最為關(guān)鍵的就是數(shù)據(jù)的質(zhì)量和管理。其能夠更加科學(xué)的對(duì)大數(shù)據(jù)進(jìn)行分析,從而將使分析出來(lái)的結(jié)果更有價(jià)值。
3 大數(shù)據(jù)分析技術(shù)在醫(yī)療領(lǐng)域中的應(yīng)用
3.1 在基因生物學(xué)中的應(yīng)用
有研究人員從1990年開(kāi)始到2004年,歷經(jīng)15年,完成了人類(lèi)基因組的計(jì)劃,其對(duì)人類(lèi)23對(duì)染色體基因組中的堿基對(duì)進(jìn)行了測(cè)序和檢定。目前為止,已經(jīng)發(fā)現(xiàn)20?500多個(gè)基因,其會(huì)在不同的微環(huán)境中表現(xiàn)出較大的差異,并且其所產(chǎn)生的不同的表達(dá)物中可以產(chǎn)生大量的數(shù)據(jù)。而大數(shù)據(jù)技術(shù)會(huì)通過(guò)互聯(lián)網(wǎng),使數(shù)據(jù)庫(kù)被科研人員共享,從而促進(jìn)數(shù)據(jù)的快速產(chǎn)生。
3.2 在致病因素分析中的應(yīng)用
在醫(yī)療領(lǐng)域,病人各項(xiàng)信息都會(huì)被存儲(chǔ)在病案信息庫(kù)中,工作人員通過(guò)對(duì)病人的個(gè)人信息進(jìn)行檢索,使用大數(shù)據(jù)分析技術(shù)(如聚類(lèi)分析法)就可以對(duì)病人的相關(guān)信息進(jìn)行關(guān)聯(lián)性的分析,從而找出疾病的發(fā)生與給一些外在因素之間潛在的關(guān)系,指導(dǎo)人民群眾提高警惕,遠(yuǎn)離致病因素,將此種疾病的發(fā)生率降到最低。
3.3 在臨床診斷和治療中的應(yīng)用
在對(duì)疾病的臨床診斷和治療中,大數(shù)據(jù)分析技術(shù)能夠有效提高準(zhǔn)確率和治療效果。由于疾病的錯(cuò)綜復(fù)雜,致病因素之間所存在的較大差異,導(dǎo)致同一種疾病在不同階段也會(huì)出現(xiàn)不同的癥狀,即便是不同的疾病,有時(shí)也會(huì)表現(xiàn)出高度相似的臨床特征[ 5 ]。采用大數(shù)據(jù)分析技術(shù)(如數(shù)據(jù)挖掘算法)能夠根據(jù)病人的病歷以及個(gè)人信息對(duì)造成疾病的相關(guān)因素進(jìn)行分析,這對(duì)疾病的治療是非常重要的。
3.4 在疾病預(yù)測(cè)中的應(yīng)用
大數(shù)據(jù)分析技術(shù)最為核心的內(nèi)容就是預(yù)測(cè),在醫(yī)療大數(shù)據(jù)中,其中包括大量病人的地區(qū)區(qū)域、飲食習(xí)慣等信息,這些信息為對(duì)某種疾病的發(fā)病史以地區(qū)分布性提供的線索。并且研究人員還可以通過(guò)對(duì)大數(shù)據(jù)的分析,對(duì)疾病的遺傳性和非遺傳性進(jìn)行分析,為治療人員提供相應(yīng)的防治措施,從而降低此種疾病的發(fā)病率[6]。另外,大數(shù)據(jù)分析技術(shù)還可以對(duì)某些疾病的發(fā)展趨勢(shì)進(jìn)行預(yù)測(cè),(如機(jī)器學(xué)習(xí)法)可以對(duì)部分疾病信息進(jìn)行精確判讀,其還是對(duì)傳染性疾病進(jìn)行預(yù)測(cè)和預(yù)警的利器。
3.5 在醫(yī)學(xué)影像中的應(yīng)用
在醫(yī)學(xué)領(lǐng)域的影像(如CT、MRI)分析中,采用大數(shù)據(jù)分析技術(shù)能夠?qū)λ贸龅挠跋窠Y(jié)果進(jìn)行分析,進(jìn)而對(duì)病人的疾病做出正確的診斷。
3.6 在檢驗(yàn)醫(yī)學(xué)中的應(yīng)用
檢驗(yàn)醫(yī)學(xué)的快速發(fā)展,如細(xì)胞免疫學(xué)、細(xì)胞學(xué)、酶學(xué)、分子生物學(xué)等,不但加快了對(duì)臨床基因的檢測(cè)速度,還在基因的診斷中,(如病毒、細(xì)菌等基因的快速檢測(cè)、遺傳性疾病的診斷)得到了廣泛的應(yīng)用。免疫學(xué)的發(fā)展拓寬了其在檢測(cè)界的領(lǐng)域,還提高了檢測(cè)的靈敏度,對(duì)試驗(yàn)過(guò)程步入自動(dòng)化起到了促進(jìn)的作用[7]。
3.7 在醫(yī)院管理中的應(yīng)用
目前,各大醫(yī)院所應(yīng)用的綜合信息管理系統(tǒng)、影像系統(tǒng)、OA系統(tǒng)、以電子病歷為中心的管理系統(tǒng)等,在一定程度上提高了醫(yī)院的管理水平、經(jīng)濟(jì)效益以及診療水平。而隨著大數(shù)據(jù)技術(shù)的不斷發(fā)展,各個(gè)醫(yī)院的電子病歷系統(tǒng)會(huì)通過(guò)互聯(lián)網(wǎng)而實(shí)現(xiàn)醫(yī)療信息的共享[8]。
3.8 在新藥研發(fā)中的應(yīng)用
目前,在醫(yī)療領(lǐng)域,藥物研發(fā)的重要工具就是網(wǎng)絡(luò)藥理學(xué)和分子對(duì)接技術(shù),其也是大數(shù)據(jù)分析技術(shù)所應(yīng)用的重點(diǎn)領(lǐng)域。比如,系統(tǒng)的完整性能夠保證生物個(gè)體內(nèi)各個(gè)機(jī)制的正常運(yùn)行,而各個(gè)節(jié)點(diǎn)之間進(jìn)行一種相互作用后就又可以形成一個(gè)復(fù)雜的網(wǎng)絡(luò)體系,而一旦網(wǎng)絡(luò)體系被打亂,就說(shuō)明生物機(jī)體出現(xiàn)了某種疾病。利用大數(shù)據(jù)分析技術(shù),有效的利用網(wǎng)路數(shù)據(jù)和藥物網(wǎng)絡(luò)數(shù)據(jù),將會(huì)在很大程度上提高對(duì)新藥研發(fā)的水平。
3.9 在藥物副作用分析中的應(yīng)用
采用大數(shù)據(jù)分析技術(shù),通過(guò)互聯(lián)網(wǎng)對(duì)各家醫(yī)院所出現(xiàn)的藥物不良反應(yīng)進(jìn)行挖掘,能夠幫助治療人員更加科學(xué)、全面的了解到藥物的副作用情況,使其在用藥時(shí),會(huì)提高警惕,從而將藥物的副作用降到最低,保證病人合理用藥[9]。
4 結(jié)論
總之,科學(xué)技術(shù)的發(fā)展,大數(shù)據(jù)在醫(yī)療領(lǐng)域中的作用愈發(fā)重要。在這些醫(yī)學(xué)領(lǐng)域中,常常隱藏著很多的有價(jià)值的信息,通過(guò)對(duì)大數(shù)據(jù)科學(xué)有效的進(jìn)行利用,能夠有效實(shí)現(xiàn)各大醫(yī)院對(duì)病例的共享、對(duì)流行性疾病發(fā)病情況的預(yù)測(cè)、藥物作用的預(yù)測(cè)以及個(gè)體化的精準(zhǔn)醫(yī)療等,并且對(duì)提高臨床診斷水平,保證患者用藥的安全性和有效性等都有著重要的指導(dǎo)作用。
參考文獻(xiàn)
[1]潘長(zhǎng)玲.大數(shù)據(jù)分析在健康管理領(lǐng)域中的應(yīng)用及挑戰(zhàn)[J].現(xiàn)代醫(yī)學(xué)與健康研究電子雜志,2018,2(9):135-136.
[2]馬曉,孫瑞靖,宋小明.淺析醫(yī)療大數(shù)據(jù)對(duì)醫(yī)學(xué)研究領(lǐng)域的創(chuàng)新進(jìn)展[J].內(nèi)蒙古科技與經(jīng)濟(jì),2018(7):93,96.
[3]趙俊,孫亞丹.基于Hadoop的醫(yī)療健康非結(jié)構(gòu)化大數(shù)據(jù)分析研究[J].科技視界,2017(36):1-2,74.
[4]徐志祥,王瑩.我國(guó)醫(yī)療行業(yè)大數(shù)據(jù)應(yīng)用現(xiàn)狀及政策建議[J].中國(guó)衛(wèi)生信息管理雜志,2017,14(6):822-825.
[5]趙浴光.淺議大數(shù)據(jù)分析技術(shù)在醫(yī)藥領(lǐng)域的應(yīng)用[J].科技創(chuàng)新導(dǎo)報(bào),2017,14(34):162-163.
[6]孫愛(ài)婷,張海平.大數(shù)據(jù)技術(shù)在醫(yī)療領(lǐng)域應(yīng)用的發(fā)展前景[J].中國(guó)管理信息化,2017,20(19):193-195.
[7]張春麗,成彧.大數(shù)據(jù)分析技術(shù)及其在醫(yī)藥領(lǐng)域中的應(yīng)用[J].標(biāo)記免疫分析與臨床,2016,23(3):327-333.
[8]郭曉明,周明江.大數(shù)據(jù)分析在醫(yī)療行業(yè)的應(yīng)用初探[J].中國(guó)數(shù)字醫(yī)學(xué),2015,10(8):84-85,111.
[9]鄒北驥.大數(shù)據(jù)分析及其在醫(yī)療領(lǐng)域中的應(yīng)用[J].計(jì)算機(jī)教育,2014(7):24-29.