曾一昕
摘 要:隨著計(jì)算機(jī)科學(xué)技術(shù)的發(fā)展,人工智能正在成為各個(gè)領(lǐng)域的核心技術(shù),并分別得到了廣泛的應(yīng)用。其中,智能醫(yī)療在近年來(lái)蓬勃發(fā)展,成為人工智能的一個(gè)重要應(yīng)用方向?;诖?, 本文以人工智能醫(yī)療為例,闡述了人工智能和機(jī)器學(xué)習(xí)的背景,提出了若干人工智能在醫(yī)療領(lǐng)域的潛在應(yīng)用。與此同時(shí),本文還基于結(jié)構(gòu)化查詢(xún)語(yǔ)言對(duì)醫(yī)療大數(shù)據(jù)進(jìn)行了定量分析,進(jìn)一步采用向量機(jī)算法探究了控制參數(shù)如懲罰系數(shù),核函數(shù),批尺寸等對(duì)訓(xùn)練模型效率的影響,其結(jié)論對(duì)于智能醫(yī)療相關(guān)的應(yīng)用算法具有參考意義。
關(guān)鍵詞:人工智能;醫(yī)療;機(jī)器學(xué)習(xí);大數(shù)據(jù);應(yīng)用算法
中圖分類(lèi)號(hào):TP18 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1671-2064(2018)22-0028-02
1 引言
追求健康始終是人類(lèi)社會(huì)最長(zhǎng)久不衰的議題之一,因此醫(yī)療行業(yè)的每一次發(fā)展與突破都對(duì)社會(huì)產(chǎn)生著深刻的變革。在21世紀(jì)信息化時(shí)代的新背景下,隨著機(jī)器學(xué)習(xí)和深度學(xué)習(xí)等人工智能技術(shù)(Artificial Intelligence,AI)的大獲成功,深入開(kāi)發(fā)和研究AI的浪潮席卷全球,人工智能在各個(gè)領(lǐng)域都得到了廣泛的應(yīng)用。
人工智能在醫(yī)療領(lǐng)域的應(yīng)用具有劃時(shí)代意義,是越來(lái)越多的數(shù)據(jù)科學(xué)家和臨床醫(yī)生進(jìn)行診斷、治療等研究的熱點(diǎn)。對(duì)此,許多學(xué)者對(duì)智能醫(yī)療給出了自己獨(dú)到的見(jiàn)解。周雪芹等人在2015年就發(fā)表了報(bào)告,對(duì)國(guó)內(nèi)外大數(shù)據(jù)發(fā)展的現(xiàn)狀進(jìn)行了深入的討論,分析了大醫(yī)學(xué)數(shù)據(jù)的具體來(lái)源和應(yīng)用前景[1]。李蘭娟等人2017年發(fā)文詳細(xì)闡述了智能醫(yī)療對(duì)個(gè)人,健康產(chǎn)業(yè)及國(guó)家政策的意義,指出了智能醫(yī)療發(fā)展所面臨的挑戰(zhàn)和智能醫(yī)療發(fā)展的一些參考思路[2]。最近,趙飛等人總結(jié)概述了目前我國(guó)人工智能在醫(yī)療領(lǐng)域的相關(guān)研究,并結(jié)合了我國(guó)國(guó)情,提出與我國(guó)人工智能有關(guān)的發(fā)展建議[3]。如何利用人工智能手段及大數(shù)據(jù)分析,基于繁復(fù)冗雜的海量信息對(duì)疾病進(jìn)行有效的分析與預(yù)測(cè),已成為計(jì)算機(jī)科學(xué)領(lǐng)域關(guān)注的焦點(diǎn)之一,同時(shí)也是迫切需要突破和解決的難點(diǎn)之一。
基于此,本文以醫(yī)療數(shù)據(jù)為研究對(duì)象,基于人工智能相關(guān)的軟件技術(shù)對(duì)某醫(yī)院的共計(jì)10000例檔案進(jìn)行了的篩選分析,并通過(guò)機(jī)器學(xué)習(xí)對(duì)其進(jìn)行了預(yù)測(cè),對(duì)不同函數(shù)模型下的準(zhǔn)確率、召回率及運(yùn)行速度的影響進(jìn)行了比較和討論,最后給出了全文總結(jié)。
2 人工智能的背景及醫(yī)療應(yīng)用
2.1 人工智能與機(jī)器學(xué)習(xí)
人工智能是指機(jī)器產(chǎn)生的智能,在計(jì)算機(jī)領(lǐng)域是指,根據(jù)對(duì)環(huán)境的感知,做出合理的行動(dòng),并獲得最大收益的計(jì)算機(jī)程序。自1956年達(dá)特茅斯會(huì)議,時(shí)至今日,歷經(jīng)三起三落,人工智能的發(fā)展已經(jīng)走過(guò)62個(gè)年頭。2016年,AlphaGo以4:1的比分擊敗韓國(guó)頂尖職業(yè)棋手李世石,人工智能一夜間大放異彩,成為當(dāng)下的焦點(diǎn)。21世紀(jì)以來(lái),緣于計(jì)算機(jī)技術(shù)和大數(shù)據(jù)的迅速發(fā)展,以深度學(xué)習(xí)(Deep Learning)等算法為內(nèi)核的驅(qū)動(dòng)的新一代人工智能出現(xiàn)了井噴期,弱人工智能在其各領(lǐng)域,如無(wú)人駕駛,圖像識(shí)別,自然語(yǔ)言處理,金融管理,電子商務(wù),搜索引擎,教育輔導(dǎo),智能醫(yī)療等方面得到了廣泛的應(yīng)用。
深度學(xué)習(xí)是機(jī)器學(xué)習(xí)的一個(gè)分支,而機(jī)器學(xué)習(xí)最基本的做法,是使用算法來(lái)解析數(shù)據(jù),從中學(xué)習(xí),然后對(duì)真實(shí)世界中的事件做出決策和預(yù)測(cè)。與解決特定任務(wù)的傳統(tǒng)硬編碼程序不同,機(jī)器學(xué)習(xí)使用大量的數(shù)據(jù)來(lái)訓(xùn)練和學(xué)習(xí)如何通過(guò)各種算法從數(shù)據(jù)中完成任務(wù)。在人工智能的早期,神經(jīng)網(wǎng)絡(luò)已經(jīng)存在,但它需要大量的運(yùn)算。得益于21世紀(jì)計(jì)算機(jī)能力的迅速提高,人工神經(jīng)網(wǎng)絡(luò)算法的實(shí)現(xiàn)成為了可能。機(jī)器學(xué)習(xí)主要包括以下三個(gè)步驟:人工輸入訓(xùn)練集,計(jì)算機(jī)學(xué)習(xí)算法,輸出結(jié)果,如圖1所示。首先由人工采集數(shù)十萬(wàn)甚至上百萬(wàn)的大量數(shù)據(jù),并對(duì)數(shù)據(jù)進(jìn)行加工和整理成為訓(xùn)練集(training set),再通過(guò)算法例如決策樹(shù)學(xué)習(xí)、推導(dǎo)邏輯規(guī)劃、聚類(lèi)強(qiáng)化學(xué)習(xí)、貝葉斯網(wǎng)絡(luò)、支持向量機(jī)、人工神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)等訓(xùn)練計(jì)算機(jī),最后輸出結(jié)果。
如圖2所示,機(jī)器學(xué)習(xí)可分為以下四種算法類(lèi)別:
(1)監(jiān)督學(xué)習(xí):監(jiān)督學(xué)習(xí)是指將訓(xùn)練集中需要程序去學(xué)習(xí)的特征數(shù)據(jù)人為標(biāo)注出來(lái),相當(dāng)于事先給機(jī)算機(jī)要學(xué)習(xí)的數(shù)據(jù)進(jìn)行了分類(lèi),讓計(jì)算機(jī)去學(xué)習(xí)。(2)非監(jiān)督學(xué)習(xí):非監(jiān)督學(xué)習(xí)和監(jiān)督學(xué)習(xí)之間的區(qū)別是非監(jiān)督學(xué)習(xí)不標(biāo)記數(shù)據(jù)。(3)強(qiáng)化學(xué)習(xí):強(qiáng)化學(xué)習(xí)是通過(guò)人為設(shè)定規(guī)則讓計(jì)算機(jī)與環(huán)境之間進(jìn)行互動(dòng),告訴計(jì)算機(jī)哪些行為是負(fù)面的,哪些行為是正面的,讓計(jì)算機(jī)得出最優(yōu)的方案。(4)遷移學(xué)習(xí):顧名思義,由于許多模型之間存在相關(guān)性,可以將學(xué)習(xí)好的模型參數(shù)遷移到新的模型中來(lái)幫助新模型進(jìn)行訓(xùn)練,而不用像前幾種算法那樣從零開(kāi)始學(xué)習(xí),提高了算法的學(xué)習(xí)效率。
2.2 機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域中的應(yīng)用
機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域有非常廣泛重要的應(yīng)用。如智能影像識(shí)別,藥物研發(fā),智能診療等。智能影像識(shí)別可以大大降低人工操作所產(chǎn)生的失誤,檢索影像中人工不易察覺(jué)的極其細(xì)微的生理變化,在疾病早期及時(shí)發(fā)現(xiàn),利于后期的治療。智能藥物研發(fā)通過(guò)大數(shù)據(jù)分析等技術(shù)手段快速準(zhǔn)確的挖掘和選出合適的化合物,自動(dòng)進(jìn)行數(shù)學(xué)模型構(gòu)建,分析出新型化合物具有的化學(xué)性質(zhì)和生理學(xué)性質(zhì),縮短新型藥物研究周期,促進(jìn)更多安全,有效,價(jià)廉,的新型藥物上市。通過(guò)大數(shù)據(jù)篩選出理想臨床實(shí)驗(yàn)候選者,縮短實(shí)驗(yàn)周期。智能診療將人工智能技術(shù)用于智能輔助診療中結(jié)合每個(gè)病人的家族病史,日常習(xí)慣,甚至是基因序列,為每一個(gè)病人定制個(gè)性化用藥方案結(jié)合可穿戴設(shè)備,實(shí)時(shí)監(jiān)測(cè)高危人群的各項(xiàng)生理指標(biāo),在異常情況出現(xiàn)時(shí),及時(shí)告知患者家屬和醫(yī)生。通過(guò)人工智能優(yōu)化看病流程,患者在網(wǎng)上預(yù)約,算法兼顧當(dāng)日的人流量,患者情況的緊急程度,醫(yī)生的擅長(zhǎng)領(lǐng)域等其他環(huán)境因素,自動(dòng)適配最合理的時(shí)間段和最合適的醫(yī)生,提高醫(yī)院的看病效率。
3 人工智能的醫(yī)療數(shù)據(jù)分析及預(yù)測(cè)
3.1 基于結(jié)構(gòu)化查詢(xún)語(yǔ)言(Structured Query Language,SQL)的數(shù)據(jù)分析
本文接下來(lái)以某醫(yī)院近年來(lái)的病例數(shù)據(jù)為基礎(chǔ),采用結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL),對(duì)該龐大的數(shù)據(jù)庫(kù)進(jìn)行信息提取和分析。結(jié)構(gòu)化查詢(xún)語(yǔ)言(SQL)是指訪問(wèn)和處理系統(tǒng)的計(jì)算機(jī)語(yǔ)言,使我們有能力訪問(wèn)關(guān)系數(shù)據(jù)庫(kù);SQL語(yǔ)句用于取回和更新數(shù)據(jù)庫(kù)中的數(shù)據(jù),配合數(shù)據(jù)庫(kù)軟件共同工作。
基于SQL語(yǔ)句進(jìn)行的統(tǒng)計(jì),本文涉及的數(shù)據(jù)表中總共包含10000個(gè)檔案,其中男性為4996例,女性為5004例,如圖3左圖餅狀分布所示;年齡在20到60歲之間和其他年齡段的人群數(shù)分別為5790和4210。
本文還對(duì)該數(shù)據(jù)表中受教育程度的人群進(jìn)行了數(shù)據(jù)統(tǒng)計(jì),統(tǒng)計(jì)結(jié)果如圖3右圖所示。其中,初中學(xué)歷2502人,小學(xué)學(xué)歷4863人,本科學(xué)歷356人,高中學(xué)歷916人,未填寫(xiě)學(xué)歷的1363人。
3.2 基于機(jī)器學(xué)習(xí)的預(yù)測(cè)分析
向量機(jī)算法是幾種常見(jiàn)機(jī)器學(xué)習(xí)算法之一,是從線性可分的情況下的最優(yōu)分類(lèi)面發(fā)展而來(lái),把低維為線性不可分的數(shù)據(jù),通過(guò)核函數(shù)映射到高維空間。本文接下來(lái)將探究支持向量機(jī)算法中,通過(guò)調(diào)整懲罰系數(shù)(C),核函數(shù)(Kernel),批尺寸(BatchSize)這三個(gè)參數(shù)對(duì)準(zhǔn)確率(Precision),召回率(Recall)及運(yùn)行速度(Time)的影響。通過(guò)訓(xùn)練模型預(yù)測(cè)患者信息,比較算法速度和效果如表1所示。
由表1可得如下結(jié)論:(1)控制其他參數(shù)不變,改變核函數(shù)類(lèi)型(Kernel)發(fā)現(xiàn),RBFKernel函數(shù)模型使準(zhǔn)確率和召回率極不均衡,該模型基本沒(méi)有實(shí)際價(jià)值;對(duì)于polykernel和Puk函數(shù)而言,polykernel對(duì)準(zhǔn)確率和召回率的影響更出色,且運(yùn)行時(shí)間更短,具有更大的實(shí)驗(yàn)價(jià)值。(2)控制其他參數(shù)不變,改變懲罰系數(shù)對(duì)比可知,懲罰系數(shù)等于10時(shí)運(yùn)行時(shí)間最短。(3)控制其他參數(shù)不變,改變批尺寸可知,三組實(shí)驗(yàn)差異不大,可能是樣本量不大效果不明顯所致。
4 結(jié)語(yǔ)
綜合上述,本文對(duì)人工智能醫(yī)療的相關(guān)的背景及研究概況進(jìn)行了總結(jié),闡述了機(jī)器學(xué)習(xí)在醫(yī)療領(lǐng)域中潛在應(yīng)用,并基于機(jī)器學(xué)習(xí)的向量機(jī)算法,通過(guò)調(diào)整懲罰系數(shù)(C),核函數(shù)(Kernel),批尺寸(BatchSize)這三個(gè)參數(shù)討論分析了相應(yīng)預(yù)測(cè)效率,其結(jié)論對(duì)于智能醫(yī)療應(yīng)用的算法具有一定的參考價(jià)值。新興的人工智能技術(shù)無(wú)疑將給醫(yī)療領(lǐng)域帶來(lái)全新而深刻的變革,為人們提供更高質(zhì)量的生活,創(chuàng)造更美好的明天。
參考文獻(xiàn)
[1]周雪晴,羅亞玲.信息化建設(shè)中醫(yī)療大數(shù)據(jù)現(xiàn)狀[J].中華醫(yī)學(xué)圖書(shū)情報(bào)雜志,2015,(11):48-51.
[2]李蘭娟.智能醫(yī)療的進(jìn)展與前景[J].中國(guó)科技產(chǎn)業(yè),2017,(1):66-67.
[3]趙飛,蘭藍(lán),曹戰(zhàn)強(qiáng),孫昊,尹新,金征宇.我國(guó)人工智能在健康醫(yī)療領(lǐng)域應(yīng)用發(fā)展現(xiàn)狀研究[J].中國(guó)衛(wèi)生信息管理雜志,2018,15(03):344-349.