宋曉鋒
(邯鄲市永年區(qū)中醫(yī)院,河北 邯鄲 057150)
醫(yī)學信息包含在醫(yī)學活動過程中錯產(chǎn)生的各種文字,圖像,聲音,溫度,壓力等多種物理數(shù)據(jù),這些數(shù)據(jù)通過醫(yī)學信息數(shù)據(jù)庫的建立,將基礎(chǔ)理論醫(yī)學、社會醫(yī)學、臨床醫(yī)學等方面的資料集成于一庫,為用戶提供咨詢服務(wù)。我國的一些醫(yī)療機構(gòu)也已開始著手醫(yī)學信息數(shù)據(jù)庫的建設(shè)工作,目前來看已經(jīng)取得了可喜的回報。由于醫(yī)學技術(shù)具有很強的實踐性,實驗性及統(tǒng)計性,因此,探索醫(yī)學信息數(shù)據(jù)庫的建立與數(shù)據(jù)挖掘技術(shù)在醫(yī)學信息方面的應(yīng)用就具有更重要的實用價值和廣闊的發(fā)展前景。
就目前來看,我國醫(yī)學信息的處理大多還停留在基于數(shù)據(jù)庫技術(shù)支持的操作型事務(wù)處理的水平上,例如說數(shù)據(jù)的査詢、修改等,其中部分典型醫(yī)學數(shù)據(jù),重要知識點,只有部分行內(nèi)的專家知曉,其信息的覆蓋面過于狹窄,對我國醫(yī)學的發(fā)展幫助很小。那么,擺在我們面前這個巨大的醫(yī)學資源寶庫究竟能為我們做些什么呢?這就需要我們建立一個全面的醫(yī)學信息數(shù)據(jù)庫,并將其覆蓋的范圍最大化,同時還要對數(shù)據(jù)進行深挖處理,盡可能多的將各項醫(yī)學信息呈現(xiàn)到用戶的面前。
網(wǎng)絡(luò)信息資源內(nèi)容極為豐富,包括各類型的數(shù)據(jù)庫、電子出版物、各種綜合網(wǎng)站與專業(yè)網(wǎng)站等等;形式也多樣化,有全文數(shù)據(jù),題錄文摘、圖片資料、多媒體信息、醫(yī)學臨床案例、視頻資料等等,網(wǎng)絡(luò)信息在許多方面都超出了館藏文獻的范圍,彌補了館藏文獻的不足,使得文獻資料更加的生動,促進人們對文獻的理解及提高對醫(yī)學資料學習的興趣。
網(wǎng)絡(luò)信息中有不少是經(jīng)過篩選加工的二、三次文獻,包含了前人的勞動,是較成熟的信息,這對于用戶來說免去了用戶大量的重復勞動,想要查詢什么資料,直接輸入關(guān)鍵詞,便可檢索出與之相關(guān)的各項信息,為用戶節(jié)約了大量的時間和精力。另外對網(wǎng)絡(luò)一次文獻中的全文數(shù)據(jù)和圖片資料等等也可直接拿去利用,從而避免了用戶再次抄錄。
醫(yī)學不同于其他的學科,對信息更新的時效性要求極高,人類的發(fā)展無時無刻不在進行,所以說醫(yī)學的發(fā)展也在每時每刻都在發(fā)生,網(wǎng)絡(luò)數(shù)據(jù)庫的建立,滿足醫(yī)學信息及時有效的這一要求,對于信息更新的的時效性極強,速度及快,幾乎全世界都有不停的更新這醫(yī)學的各項信息數(shù)據(jù),這使用戶能快速和有效地利用到信息,從而更好的為人類的健康進行服務(wù)。
網(wǎng)絡(luò)信息資源最顯著的特點就是具有極強的傳播性,醫(yī)學信息,借助了網(wǎng)絡(luò)信息這一特點,可以將最先進的醫(yī)學咨詢以最快的速度傳遞到每個用戶的手上,極大的方便了用戶的學習,這也十分有利于我國醫(yī)學科研工作的順利進行,科研工作者可以利用網(wǎng)絡(luò)最快的了解到世界各地的最新醫(yī)學信息,從而使我國醫(yī)學的科研工作少走了很多彎路,在提高工作效率的同時也為我國醫(yī)學科研工作節(jié)約了很大的經(jīng)濟投入,變相的提高了科研工作的經(jīng)濟效益。
所謂數(shù)據(jù)倉庫是支持管理決策過程的、面向主題的、集成的、與時間有關(guān)的、持久的數(shù)據(jù)集合,它以傳統(tǒng)的敝據(jù)庫技術(shù)作為存儲數(shù)據(jù)和管理資源的基本手段,以統(tǒng)計分析技術(shù)作為分析數(shù)據(jù)和提取信息的有效方法,以人工智能技術(shù)作為挖掘知識和發(fā)現(xiàn)規(guī)律的科學途徑,是與網(wǎng)絡(luò)通信技術(shù)、面向?qū)ο蠹夹g(shù)、并行技術(shù)、多媒體技術(shù)、人丁智能技術(shù)等相互浸透、互相結(jié)合與綜合應(yīng)用的技術(shù)。醫(yī)學信息數(shù)據(jù)庫的創(chuàng)建基于HIS的數(shù)據(jù)倉庫.是從已有數(shù)據(jù)出發(fā)的數(shù)據(jù)倉庫的設(shè)計方法.稱之為“數(shù)據(jù)驅(qū)動”的系統(tǒng)設(shè)計方法。它的基本思路是:利用以前建設(shè)的數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù),按照分析領(lǐng)域?qū)?shù)據(jù)及數(shù)據(jù)之間的聯(lián)系進行重新考慮。組織數(shù)據(jù)倉庫中的主題,利用數(shù)據(jù)模型有效地識別數(shù)據(jù)和數(shù)據(jù)倉庫中的主題的數(shù)據(jù)的 “共同性”來重新組建數(shù)據(jù)庫。
網(wǎng)絡(luò)數(shù)據(jù)不同于其他紙質(zhì)文檔,它會隨著時間的推移,其倉庫中的數(shù)據(jù)量會不斷的增加,這些日積月累的數(shù)據(jù)中是否存在著某種關(guān)系、模式或者趨勢,是很難一眼就看得出來的。或者知道有某種關(guān)系、但必須進一步加以證明或修正,這時數(shù)據(jù)挖掘技術(shù)就有用武之地了。數(shù)據(jù)挖掘是基于人工智能、機器學習、統(tǒng)計學等技術(shù),高度自動化地分析原有數(shù)據(jù),作出歸納性的推理,從中挖掘出潛在的模式或行為,以幫助決策者作出正確決策的過程.也就是說為了尋找未知的模式或趨勢而在細節(jié)數(shù)據(jù)中進行搜索的過程,從而生成新的信息和知識數(shù)據(jù)挖掘利用人工智能中的一些成熟的算法和技術(shù)作為發(fā)現(xiàn)知識的方法,如人工神經(jīng)網(wǎng)絡(luò)、遺傳算法、鄰近搜索算法、規(guī)則推理等,利用關(guān)聯(lián)分析、序列模式分析、分類分析、聚類分析作為數(shù)據(jù)挖掘的分析方法.
綜上所述,建立醫(yī)學信息數(shù)據(jù)庫是利用數(shù)據(jù)倉庫和數(shù)據(jù)挖掘技術(shù),對醫(yī)學上各類信息進行歸納整理并充分利用的必要手段,這是我國醫(yī)學發(fā)展的必將之路,醫(yī)學信息數(shù)據(jù)庫的建立及數(shù)據(jù)挖掘會極大的方便各大醫(yī)療結(jié)構(gòu)的管理決策及為醫(yī)務(wù)工作者的日常工作代理極大的便利,同時也勢必為我國醫(yī)學的科學研究工作作出巨大的貢獻。