李盼盼,譚慶平,曾平,王重,張浩宇,謝勤政,顏穎
1.國(guó)防科技大學(xué) 計(jì)算機(jī)學(xué)院,湖南 長(zhǎng)沙 410005;2.戰(zhàn)略支援部隊(duì) 興城療養(yǎng)院,遼寧 興城 125105
療養(yǎng)機(jī)構(gòu)是軍隊(duì)衛(wèi)勤保障體系的重要組成部分,擔(dān)負(fù)著預(yù)防保健、功能康復(fù),以及特勤人員的健康鑒定、醫(yī)學(xué)訓(xùn)練等療養(yǎng)保健任務(wù),是軍隊(duì)衛(wèi)勤保障鏈中不可或缺的重要組成部分[1]。近十年以來(lái),我軍療養(yǎng)機(jī)構(gòu)的信息化建設(shè)取得了跨越式發(fā)展,工作效率和衛(wèi)勤保障能力都有了顯著提高,但在基于療養(yǎng)領(lǐng)域的數(shù)據(jù)分析研究方面基礎(chǔ)薄弱。目前,療養(yǎng)機(jī)構(gòu)使用的系統(tǒng)均缺乏對(duì)療養(yǎng)數(shù)據(jù)進(jìn)行深層分析以及對(duì)療養(yǎng)知識(shí)進(jìn)行自動(dòng)獲取的功能,制約了我軍療養(yǎng)領(lǐng)域的進(jìn)一步發(fā)展。
當(dāng)前,在改革強(qiáng)軍的背景下,療養(yǎng)服務(wù)模式正由傳統(tǒng)經(jīng)驗(yàn)?zāi)J较蛞辕燄B(yǎng)與科研有機(jī)融合為核心的循證療養(yǎng)模式轉(zhuǎn)變[2],因此引入機(jī)器學(xué)習(xí)技術(shù)和數(shù)據(jù)挖掘技術(shù)對(duì)于提升療養(yǎng)數(shù)據(jù)的利用率、拓展療養(yǎng)服務(wù)功能、制定療養(yǎng)保健政策、合理配置衛(wèi)勤資源等具有積極的意義。
在傳統(tǒng)的療養(yǎng)數(shù)據(jù)分析過(guò)程中,一般采用通過(guò)問卷調(diào)查或是平行組實(shí)驗(yàn)來(lái)獲得實(shí)驗(yàn)數(shù)據(jù),然后進(jìn)行統(tǒng)計(jì)學(xué)分析的技術(shù)路線,指標(biāo)一般是帶有檢驗(yàn)的回歸誤差或分類精度。例如,張燚德等[3]采用明尼蘇達(dá)滿意度問卷短式版對(duì)246名特勤人員實(shí)施隨機(jī)抽樣問卷調(diào)查并對(duì)結(jié)果采用單因素方差分析和Spearman相關(guān)分析進(jìn)行統(tǒng)計(jì)分析,得出論特勤人員工作滿意度的主要影響因素;任佰慧[4]通過(guò)對(duì)97名特勤療養(yǎng)員行進(jìn)行心理護(hù)理的平行組實(shí)驗(yàn),然后對(duì)相關(guān)實(shí)驗(yàn)數(shù)據(jù)進(jìn)行統(tǒng)計(jì)分析,得出心理護(hù)理能夠提高和改善特勤療養(yǎng)員心理健康水平和自我和諧程度的結(jié)論。
上述方法適用于對(duì)數(shù)據(jù)維度低、質(zhì)量好、符合統(tǒng)計(jì)規(guī)律的小樣本數(shù)據(jù)分析,但在面對(duì)低數(shù)學(xué)特征、非規(guī)范化形式的復(fù)雜數(shù)據(jù)分析時(shí)往往效果不好。而療養(yǎng)數(shù)據(jù)具有多態(tài)性(純數(shù)據(jù)、圖像、文字等)、不完整性、冗余性等特征,這些特征決定了療養(yǎng)數(shù)據(jù)的復(fù)雜性。此外,上述方法只對(duì)臨時(shí)采集的數(shù)據(jù)進(jìn)行了分析,沒有利用歷史數(shù)據(jù),而歷史數(shù)據(jù)中往往蘊(yùn)含著寶貴的信息規(guī)律。因此,現(xiàn)階段真正意義上的療養(yǎng)數(shù)據(jù)挖掘尚處于探索階段,本文即是對(duì)機(jī)器學(xué)習(xí)技術(shù)在療養(yǎng)數(shù)據(jù)挖掘中的應(yīng)用探索進(jìn)行介紹。
機(jī)器學(xué)習(xí)是對(duì)能通過(guò)經(jīng)驗(yàn)自動(dòng)改進(jìn)的計(jì)算機(jī)算法的研究,是從大量數(shù)據(jù)中自動(dòng)或半自動(dòng)地尋找有用模式的過(guò)程[5]?;跀?shù)據(jù)的機(jī)器學(xué)習(xí)是現(xiàn)代人工智能技術(shù)中的一個(gè)重要研究?jī)?nèi)容和方向,其主要研究是從觀測(cè)數(shù)據(jù)(樣本)出發(fā)尋找規(guī)律,并利用這些規(guī)律對(duì)未來(lái)數(shù)據(jù)或無(wú)法觀測(cè)的數(shù)據(jù)進(jìn)行預(yù)測(cè)[6]。
機(jī)器學(xué)習(xí)的概念是阿瑟·薩繆爾在1956年的達(dá)特茅斯會(huì)議上首次提出的,薩繆爾將其定義為“不顯式編程地賦予計(jì)算機(jī)能力的研究領(lǐng)域”。1957年,Rosenblatt[7-8]提出了第一個(gè)學(xué)習(xí)機(jī)器的模型,稱作為感知器,這標(biāo)志著人們對(duì)學(xué)習(xí)過(guò)程進(jìn)行數(shù)學(xué)研究的真正開始。感知機(jī)是神經(jīng)網(wǎng)絡(luò)和支持向量機(jī)的基礎(chǔ),它的提出對(duì)機(jī)器學(xué)習(xí)乃至整個(gè)計(jì)算機(jī)科學(xué)都具有里程碑的意義[9]。二十世紀(jì)80年代,是機(jī)器學(xué)習(xí)成為一個(gè)獨(dú)立的學(xué)科領(lǐng)域并開始快速發(fā)展、各種機(jī)器學(xué)習(xí)技術(shù)百花齊放的時(shí)期。而二十世紀(jì)90年代中期到21世紀(jì)00年代中期是機(jī)器學(xué)習(xí)發(fā)展的黃金時(shí)期,主要標(biāo)志是學(xué)術(shù)界涌現(xiàn)出一批重要成果,比如,基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)[10]、隨機(jī)森林和Freund等[11]集成分類方法,基于正則化理論的稀疏學(xué)習(xí)模型及應(yīng)用等。
從2010年以后,深度學(xué)習(xí)帶來(lái)了機(jī)器學(xué)習(xí)的一個(gè)新的浪潮,受到從學(xué)術(shù)界到工業(yè)界的廣泛重視,也導(dǎo)致了“大數(shù)據(jù)+深度模型”時(shí)代的來(lái)臨[12]。今天,機(jī)器學(xué)習(xí)已經(jīng)與我們的生活密切相關(guān),例如在天氣預(yù)報(bào)、能源勘探、環(huán)境監(jiān)測(cè)等方面,有效地利用機(jī)器學(xué)習(xí)技術(shù)對(duì)衛(wèi)星和傳感器發(fā)回的數(shù)據(jù)進(jìn)行分析可以提高預(yù)報(bào)和檢測(cè)的準(zhǔn)確性;在商業(yè)營(yíng)銷中,有效地利用機(jī)器學(xué)習(xí)技術(shù)對(duì)營(yíng)銷數(shù)據(jù)、客戶信息進(jìn)行分析,不僅可以幫助商家優(yōu)化庫(kù)存減低成本,還有助于針對(duì)用戶設(shè)計(jì)特殊營(yíng)銷策略[13]。
我軍療養(yǎng)機(jī)構(gòu)的信息化建設(shè)比較完善,軍隊(duì)療養(yǎng)院信息管理系統(tǒng)、一卡通系統(tǒng)、體檢系統(tǒng)等信息系統(tǒng)的應(yīng)用在方便療養(yǎng)工作的同時(shí)也累積了大量結(jié)構(gòu)化和非結(jié)構(gòu)化的療養(yǎng)數(shù)據(jù),這些數(shù)據(jù)是非常珍貴的資源,包含了療養(yǎng)員的基本信息、體檢信息、療案信息等。除此以外,還有很多非結(jié)構(gòu)化的數(shù)據(jù)對(duì)于分析療養(yǎng)行為、制定個(gè)性化療養(yǎng)方案也非常有用,比如療養(yǎng)員的心理測(cè)評(píng)報(bào)告、滿意度調(diào)查問卷等紙質(zhì)資料。這些累積的信息數(shù)據(jù)為機(jī)器學(xué)習(xí)的應(yīng)用提供了非常好的數(shù)據(jù)支撐。
機(jī)器學(xué)習(xí)技術(shù)的種類很多,回歸算法、神經(jīng)網(wǎng)絡(luò)、支持向量機(jī)(Support Vector Machine,SVM)、聚類算法、降維算法、推薦算法等技術(shù)在不同領(lǐng)域都取得了非常好的應(yīng)用效果。例如在醫(yī)療領(lǐng)域,崔文等[14]采用反向傳播(Back Propagation,BP)神經(jīng)網(wǎng)絡(luò)算法,解決了醫(yī)療監(jiān)護(hù)中存在的病人體征緩慢變化監(jiān)測(cè)問題;楊靜等[15]基于主成分分析和BP神經(jīng)網(wǎng)絡(luò)算法,實(shí)現(xiàn)血液中肝癌細(xì)胞的自動(dòng)識(shí)別;胡啟東等[16]基于SVM提出了一種有效的醫(yī)療圖像血管識(shí)別方法。療養(yǎng)數(shù)據(jù)與醫(yī)療數(shù)據(jù)具有類似的數(shù)據(jù)特征,因此我們可以參考機(jī)器學(xué)習(xí)技術(shù)在醫(yī)療數(shù)據(jù)上的成熟技術(shù)[17-18]。除此之外,面向機(jī)器學(xué)習(xí)的可用框架也迎來(lái)了爆發(fā)式增長(zhǎng),這些為機(jī)器學(xué)習(xí)在療養(yǎng)數(shù)據(jù)挖掘提供了非常好的技術(shù)基礎(chǔ)。
療養(yǎng)機(jī)構(gòu)雖然不同于以疾病治療為主的醫(yī)院,但也擔(dān)負(fù)著我軍療養(yǎng)員的健康鑒定、預(yù)防保健、功能康復(fù)等醫(yī)療任務(wù)。應(yīng)用機(jī)器學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)、關(guān)聯(lián)規(guī)則等技術(shù),通過(guò)分析療養(yǎng)數(shù)據(jù)中療養(yǎng)員的入院診斷、體檢信息、用藥信息、出院診斷等各種醫(yī)療信息,挖掘出有價(jià)值的診斷規(guī)則,從而輔助醫(yī)生做出診斷[19-20]。例如,Khosla等[21]提出一種集成機(jī)器學(xué)習(xí)的方法,用來(lái)解決卒中疾病的預(yù)測(cè)問題;Palaniappan等[22]應(yīng)用如決策樹、貝葉斯等機(jī)器學(xué)習(xí)技術(shù)開發(fā)智能心臟病預(yù)測(cè)系統(tǒng)。
個(gè)性化療養(yǎng)是近幾年為了提高我軍的療養(yǎng)保障質(zhì)量而提出的新概念,具體是針對(duì)不同療養(yǎng)個(gè)體和療養(yǎng)團(tuán)體的特點(diǎn),在體能訓(xùn)練、心理治療、景觀活動(dòng)、文化娛樂、飲食營(yíng)養(yǎng)及自然療養(yǎng)因子治療等方面制定個(gè)性化療養(yǎng)活動(dòng),具有針對(duì)性強(qiáng)、療養(yǎng)效果好的優(yōu)點(diǎn)[23-24]。在實(shí)施過(guò)程中,利用機(jī)器學(xué)習(xí)技術(shù)可以分析得出不同特征療養(yǎng)員的特點(diǎn)和需求,以此來(lái)制定針對(duì)性的療養(yǎng)方案。
自然療養(yǎng)因子,是在療養(yǎng)地和療養(yǎng)院的特定環(huán)境中被應(yīng)用的具有醫(yī)學(xué)價(jià)值的自然界的物理、化學(xué)和生物因子,其性質(zhì)屬于生態(tài)學(xué)因子范疇[25]。療養(yǎng)學(xué)的一個(gè)研究分支,就是研究自然療養(yǎng)因子的連續(xù)作用對(duì)阻斷人體有害因子作用的機(jī)制,采用機(jī)器學(xué)習(xí)中的關(guān)聯(lián)規(guī)則算法,可以從歷史數(shù)據(jù)中挖掘療養(yǎng)因子和療養(yǎng)員生理指標(biāo)之間的關(guān)聯(lián)性。例如,胡瑞娟等[26]利用改進(jìn)的Apriori算法對(duì)乳腺疾病數(shù)據(jù)進(jìn)行分析,建立腫瘤復(fù)發(fā)和其他屬性間的關(guān)聯(lián)規(guī)則,取得了很好的效果。田亞凱等[27]將改進(jìn)的關(guān)聯(lián)規(guī)則算法應(yīng)用在了醫(yī)療監(jiān)控中,提高了效率,為監(jiān)護(hù)人員針對(duì)一些突發(fā)性疾病做出及時(shí)診斷提供了良好的決策支持。
療養(yǎng)信息的統(tǒng)計(jì)上報(bào)和療案的質(zhì)控管理是療養(yǎng)院的一項(xiàng)重要工作,利用機(jī)器學(xué)習(xí)中的異常檢測(cè)技術(shù),對(duì)療養(yǎng)系統(tǒng)中的數(shù)據(jù)進(jìn)行實(shí)時(shí)管理,發(fā)現(xiàn)問題及時(shí)提醒相關(guān)人員修改,保障療養(yǎng)信息錄入質(zhì)量達(dá)到上級(jí)的數(shù)據(jù)采集標(biāo)準(zhǔn),保證療案質(zhì)控質(zhì)量。陳小杰等[28]基于機(jī)器學(xué)習(xí)算法對(duì)光電反射傳感器采集的心率大數(shù)據(jù),研制了心律異常智能可穿戴預(yù)警系統(tǒng),取得了不錯(cuò)的效果。
我軍的療養(yǎng)機(jī)構(gòu)很大一部分集中在我國(guó)北方,這些療養(yǎng)機(jī)構(gòu)的特點(diǎn)就是季節(jié)性非常明顯,在療養(yǎng)旺季時(shí)車輛、理療設(shè)備、醫(yī)護(hù)資源、溫泉場(chǎng)所等資源非常緊張[29],因此療養(yǎng)資源的管理和分配非常重要??梢岳脵C(jī)器學(xué)習(xí)中的回歸算法和神經(jīng)網(wǎng)絡(luò)等技術(shù),分析療養(yǎng)數(shù)據(jù)中療養(yǎng)員的入院時(shí)間、入院人數(shù)、入住天數(shù)、理療次數(shù)等信息,得出療養(yǎng)員的住院規(guī)律和療養(yǎng)需求,構(gòu)建出相應(yīng)的預(yù)測(cè)模型,從而做好療養(yǎng)資源的最優(yōu)化合理分配,提高療養(yǎng)保障能力。例如,徐曉明[30]在分析分布交互仿真任務(wù)特有需求的基礎(chǔ)上,提出了一種基于SVM機(jī)器學(xué)習(xí)的仿真資源調(diào)度模型,實(shí)驗(yàn)表明,該調(diào)度模型可以獲得整體最優(yōu)的調(diào)度結(jié)果。
不同于傳統(tǒng)的基于統(tǒng)計(jì)學(xué)處理的療養(yǎng)數(shù)據(jù)分析方法,機(jī)器學(xué)習(xí)技術(shù)在面對(duì)低數(shù)學(xué)特征、非規(guī)范化形式的復(fù)雜數(shù)據(jù)分析時(shí)往往具有更好的效果。而且到目前為止,人們?cè)谶M(jìn)行療養(yǎng)數(shù)據(jù)分析時(shí)很少利用大量積累的歷史數(shù)據(jù),一個(gè)重要的原因就是傳統(tǒng)的統(tǒng)計(jì)學(xué)更適合于小樣本數(shù)據(jù)分析。因此,機(jī)器學(xué)習(xí)技術(shù)的使用,為我們開展療養(yǎng)大數(shù)據(jù)分析提供了技術(shù)基礎(chǔ)。在療養(yǎng)領(lǐng)域,機(jī)器學(xué)習(xí)技術(shù)目前在疾病輔助診斷方面開展的研究較多,且取得了非常好的臨床使用效果,但在其它方面的研究還很少,特別是在個(gè)性化療養(yǎng)方面的基礎(chǔ)薄弱。
雖然目前機(jī)器學(xué)習(xí)技術(shù)在我軍療養(yǎng)領(lǐng)域的研究尚處于研究階段,但隨著相關(guān)工作的開展,機(jī)器學(xué)習(xí)技術(shù)在療養(yǎng)領(lǐng)域的發(fā)展趨勢(shì)必將越來(lái)越深入、越來(lái)越廣泛。機(jī)器學(xué)習(xí)技術(shù)在我軍療養(yǎng)領(lǐng)域中的應(yīng)用不僅能夠有效提升療養(yǎng)數(shù)據(jù)挖掘的效率和質(zhì)量,為我軍療養(yǎng)機(jī)構(gòu)工作的開展提供有效支持,而且為解決療養(yǎng)領(lǐng)域存在的問題提供了新思路,對(duì)于促進(jìn)數(shù)據(jù)挖掘等新技術(shù)在療養(yǎng)行業(yè)的研究和應(yīng)用起到了極大的推動(dòng)作用。
[參考文獻(xiàn)]
[1] 王月兵,田徑.加強(qiáng)新時(shí)期軍隊(duì)療養(yǎng)院療養(yǎng)保障建設(shè)的思考[J].臨床合理用藥雜志,2017,10(13):172-173.
[2] 廖忠友,李學(xué)成,宋大宇,等.對(duì)加快中西部地區(qū)軍隊(duì)療養(yǎng)院療養(yǎng)康復(fù)學(xué)科建設(shè)的思考[J].西南國(guó)防醫(yī)藥,2014,24(3):321-322.
[3] 張燚德,楊文華,吳明蘭.特勤人員工作滿意度調(diào)查分析[J].海軍醫(yī)學(xué)雜志,2016,37(6):481-483.
[4] 任佰慧.療養(yǎng)期間特勤人員心理護(hù)理效果分析[J].中國(guó)療養(yǎng)醫(yī)學(xué),2017,26(4):395-397.
[5] 威滕.數(shù)據(jù)挖掘?qū)嵱脵C(jī)器學(xué)習(xí)技術(shù)[M].北京:機(jī)械工業(yè)出版社,2006.
[6] 任力安,何清,史忠植.分類超曲面方法在海量數(shù)據(jù)分類中的應(yīng)用[J].計(jì)算機(jī)科學(xué),2002,29(9):33-35.
[7] Rosenblatt F.The perceptron—a perceiving and recognizing automaton[A].Math. Stat[C].1957.
[8] Rosenblatt F.The perceptron: a probabilistic model for information storage and organization in the brain[J].Psychol Rev,1958,65(6):386.
[9] 王玨,石純一.機(jī)器學(xué)習(xí)研究[J].廣西師范大學(xué)學(xué)報(bào)(自然科學(xué)版),2003,21(2):1-15.
[10] 唐發(fā)明.基于統(tǒng)計(jì)學(xué)習(xí)理論的支持向量機(jī)算法研究[D].武漢:華中科技大學(xué),2005.
[11] Freund Y,Schapire R,Abe N.A short introduction to boosting[J].J Japan Society Artif Intel,1999,14(771-780):1612.
[12] 何清,李寧,羅文娟,等.大數(shù)據(jù)下的機(jī)器學(xué)習(xí)算法綜述[A].中國(guó)計(jì)算機(jī)學(xué)會(huì)人工智能會(huì)議[C].2013.
[13] 周志華.機(jī)器學(xué)習(xí)[J].中國(guó)民商,2016,(3).
[14] 崔文,金杉.基于BP神經(jīng)網(wǎng)絡(luò)的病人體征緩變監(jiān)護(hù)方法[J].電子技術(shù)與軟件工程,2017,(3):19.
[15] 楊靜,王成,謝成穎,等.基于主成分分析和反向傳播神經(jīng)網(wǎng)絡(luò)的肝癌細(xì)胞后向散射顯微光譜判別[J].生物醫(yī)學(xué)工程學(xué)雜志,2017,(2):246-252.
[16] 胡啟東,李建強(qiáng),張苓琳,等.一種基于SVM的醫(yī)療圖像血管識(shí)別方法:中國(guó),CN106530283A[P].2017.
[17] Lehrstühle.Machine learning in medical applications[J].Circulation,2015,132(20):1920-1930.
[18] Criminisi A.Machine learning for medical images analysis[J].Med Image Anal,2016,33:91-93.
[19] 陳軼.機(jī)器學(xué)習(xí)技術(shù)在醫(yī)療數(shù)據(jù)挖掘中的應(yīng)用[J].電子測(cè)試,2015,(3):93-95.
[20] 嚴(yán)旭.機(jī)器學(xué)習(xí)技術(shù)在醫(yī)療數(shù)據(jù)挖掘中的應(yīng)用探討[J].信息系統(tǒng)工程,2016,(1):89.
[21] Khosla A,Cao Y,Lin CY,et al.An integrated machine learning approach to stroke prediction[A].ACM SIGKDD International Conference on Knowledge Discovery and Data Mining[C].New York:ACM,2010:183-192.
[22] Palaniappan S,Awang R.ntelligent heart disease prediction system using data mining techniques[A].IEEE/ACS International Conference on Computer Systems and Applications[C].Trier:DBLP,2008:108-115.
[23] 吳曉青,于方,侯志峰.個(gè)性化療養(yǎng)處方的提出與實(shí)施[J].解放軍醫(yī)院管理雜志,2014,(2):165-166.
[24] 于紹冰.個(gè)性化療養(yǎng)路徑信息系統(tǒng)在軍隊(duì)干部保健療養(yǎng)中的應(yīng)用[J].中國(guó)療養(yǎng)醫(yī)學(xué),2014,23(11):1051-1053.
[25] 張衛(wèi)兵.特勤療養(yǎng)學(xué)[M].北京:人民軍醫(yī)出版社,2009.
[26] 胡瑞娟,李巖芳,何昀.基于關(guān)聯(lián)規(guī)則算法的醫(yī)療數(shù)據(jù)挖掘[J].長(zhǎng)春理工大學(xué)學(xué)報(bào)(自然科學(xué)版),2009,32(2):282-284.
[27] 田亞凱,陳小惠.改進(jìn)關(guān)聯(lián)規(guī)則算法在醫(yī)療監(jiān)控中的應(yīng)用[J].計(jì)算機(jī)技術(shù)與發(fā)展,2015,(10):183-186.
[28] 陳小杰,曹國(guó)華.基于機(jī)器學(xué)習(xí)的心律異常智能可穿戴預(yù)警系統(tǒng)[J].電子技術(shù)與軟件工程,2017,(15):102.
[29] 劉銘.優(yōu)化衛(wèi)生資源配置推進(jìn)軍隊(duì)療養(yǎng)院持續(xù)發(fā)展[J].中國(guó)療養(yǎng)醫(yī)學(xué),2006,15(4).
[30] 徐曉明.基于SVM機(jī)器學(xué)習(xí)的仿真網(wǎng)格資源調(diào)度模型[J].武漢理工大學(xué)學(xué)報(bào)(信息與管理工程版),2013,35(4):555-559.