醫(yī)學信息數(shù)據(jù)庫的建立與數(shù)據(jù)挖掘

2019-12-17 21:34:46宋曉鋒

魅力中國 2019年37期

關(guān)鍵詞：數(shù)據(jù)倉庫數(shù)據(jù)挖掘醫(yī)學

宋曉鋒

（邯鄲市永年區(qū)中醫(yī)院，河北邯鄲 057150）

醫(yī)學信息包含在醫(yī)學活動過程中錯產(chǎn)生的各種文字，圖像，聲音，溫度，壓力等多種物理數(shù)據(jù)，這些數(shù)據(jù)通過醫(yī)學信息數(shù)據(jù)庫的建立，將基礎(chǔ)理論醫(yī)學、社會醫(yī)學、臨床醫(yī)學等方面的資料集成于一庫，為用戶提供咨詢服務(wù)。我國的一些醫(yī)療機構(gòu)也已開始著手醫(yī)學信息數(shù)據(jù)庫的建設(shè)工作，目前來看已經(jīng)取得了可喜的回報。由于醫(yī)學技術(shù)具有很強的實踐性，實驗性及統(tǒng)計性，因此，探索醫(yī)學信息數(shù)據(jù)庫的建立與數(shù)據(jù)挖掘技術(shù)在醫(yī)學信息方面的應(yīng)用就具有更重要的實用價值和廣闊的發(fā)展前景。

一、為什么要建立醫(yī)學信息數(shù)據(jù)庫

就目前來看，我國醫(yī)學信息的處理大多還停留在基于數(shù)據(jù)庫技術(shù)支持的操作型事務(wù)處理的水平上，例如說數(shù)據(jù)的査詢、修改等，其中部分典型醫(yī)學數(shù)據(jù)，重要知識點，只有部分行內(nèi)的專家知曉，其信息的覆蓋面過于狹窄，對我國醫(yī)學的發(fā)展幫助很小。那么，擺在我們面前這個巨大的醫(yī)學資源寶庫究竟能為我們做些什么呢？這就需要我們建立一個全面的醫(yī)學信息數(shù)據(jù)庫，并將其覆蓋的范圍最大化，同時還要對數(shù)據(jù)進行深挖處理，盡可能多的將各項醫(yī)學信息呈現(xiàn)到用戶的面前。

二、醫(yī)學網(wǎng)絡(luò)信息資源的優(yōu)越性

（一）廣泛性

網(wǎng)絡(luò)信息資源內(nèi)容極為豐富，包括各類型的數(shù)據(jù)庫、電子出版物、各種綜合網(wǎng)站與專業(yè)網(wǎng)站等等；形式也多樣化，有全文數(shù)據(jù)，題錄文摘、圖片資料、多媒體信息、醫(yī)學臨床案例、視頻資料等等，網(wǎng)絡(luò)信息在許多方面都超出了館藏文獻的范圍，彌補了館藏文獻的不足，使得文獻資料更加的生動，促進人們對文獻的理解及提高對醫(yī)學資料學習的興趣。

（二）易用性

網(wǎng)絡(luò)信息中有不少是經(jīng)過篩選加工的二、三次文獻，包含了前人的勞動，是較成熟的信息，這對于用戶來說免去了用戶大量的重復勞動，想要查詢什么資料，直接輸入關(guān)鍵詞，便可檢索出與之相關(guān)的各項信息，為用戶節(jié)約了大量的時間和精力。另外對網(wǎng)絡(luò)一次文獻中的全文數(shù)據(jù)和圖片資料等等也可直接拿去利用，從而避免了用戶再次抄錄。

（三）及時性

醫(yī)學不同于其他的學科，對信息更新的時效性要求極高，人類的發(fā)展無時無刻不在進行，所以說醫(yī)學的發(fā)展也在每時每刻都在發(fā)生，網(wǎng)絡(luò)數(shù)據(jù)庫的建立，滿足醫(yī)學信息及時有效的這一要求，對于信息更新的的時效性極強，速度及快，幾乎全世界都有不停的更新這醫(yī)學的各項信息數(shù)據(jù)，這使用戶能快速和有效地利用到信息，從而更好的為人類的健康進行服務(wù)。

（四）傳播性

網(wǎng)絡(luò)信息資源最顯著的特點就是具有極強的傳播性，醫(yī)學信息，借助了網(wǎng)絡(luò)信息這一特點，可以將最先進的醫(yī)學咨詢以最快的速度傳遞到每個用戶的手上，極大的方便了用戶的學習，這也十分有利于我國醫(yī)學科研工作的順利進行，科研工作者可以利用網(wǎng)絡(luò)最快的了解到世界各地的最新醫(yī)學信息，從而使我國醫(yī)學的科研工作少走了很多彎路，在提高工作效率的同時也為我國醫(yī)學科研工作節(jié)約了很大的經(jīng)濟投入，變相的提高了科研工作的經(jīng)濟效益。

三、數(shù)據(jù)倉庫的建立

所謂數(shù)據(jù)倉庫是支持管理決策過程的、面向主題的、集成的、與時間有關(guān)的、持久的數(shù)據(jù)集合，它以傳統(tǒng)的敝據(jù)庫技術(shù)作為存儲數(shù)據(jù)和管理資源的基本手段，以統(tǒng)計分析技術(shù)作為分析數(shù)據(jù)和提取信息的有效方法，以人工智能技術(shù)作為挖掘知識和發(fā)現(xiàn)規(guī)律的科學途徑，是與網(wǎng)絡(luò)通信技術(shù)、面向?qū)ο蠹夹g(shù)、并行技術(shù)、多媒體技術(shù)、人丁智能技術(shù)等相互浸透、互相結(jié)合與綜合應(yīng)用的技術(shù)。醫(yī)學信息數(shù)據(jù)庫的創(chuàng)建基于HIS的數(shù)據(jù)倉庫.是從已有數(shù)據(jù)出發(fā)的數(shù)據(jù)倉庫的設(shè)計方法.稱之為“數(shù)據(jù)驅(qū)動”的系統(tǒng)設(shè)計方法。它的基本思路是：利用以前建設(shè)的數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)，按照分析領(lǐng)域?qū)?shù)據(jù)及數(shù)據(jù)之間的聯(lián)系進行重新考慮。組織數(shù)據(jù)倉庫中的主題，利用數(shù)據(jù)模型有效地識別數(shù)據(jù)和數(shù)據(jù)倉庫中的主題的數(shù)據(jù)的 “共同性”來重新組建數(shù)據(jù)庫。

四、數(shù)據(jù)的挖掘

網(wǎng)絡(luò)數(shù)據(jù)不同于其他紙質(zhì)文檔，它會隨著時間的推移，其倉庫中的數(shù)據(jù)量會不斷的增加，這些日積月累的數(shù)據(jù)中是否存在著某種關(guān)系、模式或者趨勢，是很難一眼就看得出來的。或者知道有某種關(guān)系、但必須進一步加以證明或修正，這時數(shù)據(jù)挖掘技術(shù)就有用武之地了。數(shù)據(jù)挖掘是基于人工智能、機器學習、統(tǒng)計學等技術(shù)，高度自動化地分析原有數(shù)據(jù)，作出歸納性的推理，從中挖掘出潛在的模式或行為，以幫助決策者作出正確決策的過程.也就是說為了尋找未知的模式或趨勢而在細節(jié)數(shù)據(jù)中進行搜索的過程，從而生成新的信息和知識數(shù)據(jù)挖掘利用人工智能中的一些成熟的算法和技術(shù)作為發(fā)現(xiàn)知識的方法，如人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、鄰近搜索算法、規(guī)則推理等，利用關(guān)聯(lián)分析、序列模式分析、分類分析、聚類分析作為數(shù)據(jù)挖掘的分析方法.

五、結(jié)束語

綜上所述，建立醫(yī)學信息數(shù)據(jù)庫是利用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù)，對醫(yī)學上各類信息進行歸納整理并充分利用的必要手段，這是我國醫(yī)學發(fā)展的必將之路，醫(yī)學信息數(shù)據(jù)庫的建立及數(shù)據(jù)挖掘會極大的方便各大醫(yī)療結(jié)構(gòu)的管理決策及為醫(yī)務(wù)工作者的日常工作代理極大的便利，同時也勢必為我國醫(yī)學的科學研究工作作出巨大的貢獻。