• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于Spring Cloud 的分布式醫(yī)療數(shù)據(jù)平臺建設(shè)

    2024-03-20 09:17:50胡珊珊陳敏蓮
    設(shè)備管理與維修 2024年4期

    汪 睿,胡珊珊,陳敏蓮,徐 驍

    (湖南省兒童醫(yī)院數(shù)據(jù)信息管理中心,湖南長沙 410007)

    0 引言

    伴隨互聯(lián)網(wǎng)技術(shù)的進(jìn)一步發(fā)展,海量數(shù)據(jù)和多源異構(gòu)數(shù)據(jù)不斷增加,大數(shù)據(jù)時代已經(jīng)來臨,其中在醫(yī)療領(lǐng)域更是如此。在醫(yī)療領(lǐng)域中,醫(yī)療數(shù)據(jù)來自多種來源,如電子檔案、生物特征數(shù)據(jù)、門診登記、住院記錄、患者報告、B 超和CT 圖片等。以數(shù)字方式收集和存儲的數(shù)據(jù)量呈指數(shù)級增長,數(shù)據(jù)類型也逐漸變得復(fù)雜多樣。

    醫(yī)療數(shù)據(jù)通常具有半結(jié)構(gòu)化、高數(shù)據(jù)量、數(shù)據(jù)格式復(fù)雜、不完整、更新速度快等特點。因此,傳統(tǒng)的信息技術(shù)無法有效處理海量的醫(yī)療數(shù)據(jù),同時也因為缺少相應(yīng)的規(guī)范,海量的醫(yī)療數(shù)據(jù)也處于不同的系統(tǒng)或者平臺之中,彼此互不聯(lián)通,難以挖掘和使用[1]。

    針對這些現(xiàn)狀,在整個醫(yī)療行業(yè)中,醫(yī)療大數(shù)據(jù)的研究與應(yīng)用已經(jīng)越來越多,各類機(jī)器學(xué)習(xí)與人工智能算法在醫(yī)療領(lǐng)域被廣泛的使用和研究,這些研究與應(yīng)用明顯改善了醫(yī)療實踐與患者護(hù)理,同時也優(yōu)化了醫(yī)療流程。然而復(fù)雜的疾病也使得臨床數(shù)據(jù)變得多樣,不同醫(yī)療系統(tǒng)里面的數(shù)據(jù)也呈現(xiàn)出無法聯(lián)通的景象,特別是一些非結(jié)構(gòu)化數(shù)據(jù),更是加強(qiáng)了醫(yī)療數(shù)據(jù)挖掘和分析的難度。而在大數(shù)據(jù)方面,具體技術(shù)落地較少,大部分還停留在理論和概念階段,阻礙了醫(yī)療大數(shù)據(jù)的潛在價值的發(fā)揮與挖掘。因此,醫(yī)療數(shù)據(jù)方向的研究與應(yīng)用仍然是一個具有挑戰(zhàn)性的課題。

    在大數(shù)據(jù)時代,海量的數(shù)據(jù)使得傳統(tǒng)信息化平臺在各個領(lǐng)域不再適用,而繁雜的數(shù)據(jù)格式和內(nèi)容也使得經(jīng)典的關(guān)系型數(shù)據(jù)庫在數(shù)據(jù)存儲和檢索方面捉襟見肘。因此,為了解決醫(yī)療大數(shù)據(jù)的可靠存儲問題,有效的處理多源異構(gòu)數(shù)據(jù),加強(qiáng)醫(yī)療數(shù)據(jù)的檢索能力,充分發(fā)揮大數(shù)據(jù)時代醫(yī)療信息化的潛力,提出了一種基于Spring Cloud 的分布式醫(yī)療數(shù)據(jù)平臺建設(shè)方案,該方案通過Spring Cloud 技術(shù)來構(gòu)建分布式架構(gòu),選取MongoDB 非關(guān)系型數(shù)據(jù)庫作為分布式存儲,同時對數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化、分詞等操作,從而實現(xiàn)一個異構(gòu)數(shù)據(jù)可存儲、系統(tǒng)高可用、規(guī)模易擴(kuò)展、檢索高效率的醫(yī)療數(shù)據(jù)平臺。

    1 技術(shù)選型設(shè)計

    1.1 Spring Cloud

    Spring Cloud 是一系列框架的有序集合,是在Spring Boot 基礎(chǔ)上的分布式系統(tǒng)開發(fā)。Spring Cloud 將經(jīng)過驗證的、成熟的組件或框架整合起來,進(jìn)行再封裝,屏蔽其內(nèi)部復(fù)雜的實現(xiàn)和配置,最終形成一套易開發(fā)、易部署的開發(fā)工具。其中常用的功能模塊有鏈路追蹤、服務(wù)注冊與發(fā)現(xiàn)、服務(wù)路由、服務(wù)網(wǎng)關(guān)等,這些功能模塊的實現(xiàn)大都是整合優(yōu)秀的開源組件,如feign 組件用于服務(wù)間調(diào)用;ribbon 組件用于負(fù)載均衡;config 組件用作配置中心;zuul 組件用作服務(wù)網(wǎng)關(guān)等[2]。此外,Spring Cloud 本身就是分布式架構(gòu)的集大成者,在進(jìn)行分布式應(yīng)用開發(fā)時,具有相當(dāng)大的便利,并且Spring Cloud具有約定優(yōu)于配置的特性,可以基于注解來開發(fā)。同時,對大量的組件進(jìn)行了封裝,簡化了開發(fā)難度,使組件與組件之間,具有強(qiáng)解耦性,從而在開發(fā)時更加靈活,可以實現(xiàn)盡可能輕量的系統(tǒng)而又能最大限度的滿足實際需求的開發(fā)。

    在分布式醫(yī)療數(shù)據(jù)平臺開發(fā)中,使用Eureka 來進(jìn)行服務(wù)注冊與發(fā)現(xiàn),使用Ribbon 來負(fù)責(zé)其中的負(fù)載均衡,使用Feign 進(jìn)行聲明式服務(wù)調(diào)用,添加Config 來實現(xiàn)應(yīng)用配置的外部化存儲,使用Zuul 來組成平臺網(wǎng)關(guān),進(jìn)行訪問過濾等操作,最終形成基于Spring Cloud的分布式醫(yī)療數(shù)據(jù)平臺框架(圖1)。

    圖1 分布式醫(yī)療數(shù)據(jù)平臺技術(shù)框架

    1.2 MongoDB

    MongoDB,是當(dāng)前Web 應(yīng)用的高性能數(shù)據(jù)存儲的主流存儲數(shù)據(jù)庫,MongoDB 在設(shè)計之初就具有分布式的特性,其內(nèi)核是分布式文件存儲。MongoDB 在非關(guān)系型數(shù)據(jù)庫中,功能較為豐富,采用的bson 數(shù)據(jù)存儲結(jié)構(gòu),是一種二進(jìn)制形式,這是一種類似json 的格式,支持文檔對象和數(shù)組對象,具有高效、輕量、可遍歷等特點,針對于結(jié)構(gòu)化數(shù)據(jù)或者非結(jié)構(gòu)化數(shù)據(jù)都有著良好的描述效果。相對比于json 而言,bson 有著更快的遍歷速度、更簡單的操作和額外數(shù)據(jù)存儲類型。面向?qū)ο笏枷朐贛ongoDB 中得以體現(xiàn),將每一個記錄當(dāng)做文檔對象,以此來存儲數(shù)據(jù)。同時,為了提高數(shù)據(jù)檢索性能,MongoDB 是采取的內(nèi)存映射文件的方式進(jìn)行管理。此外,MongoDB 支持復(fù)制集、主從復(fù)制、自動分片、故障恢復(fù)等特性。其中,前兩者可以保證系統(tǒng)的可靠性,實現(xiàn)服務(wù)器自治,自動分片可以有效的實現(xiàn)數(shù)據(jù)庫的水平擴(kuò)展,且這種擴(kuò)展并不會影響到其他服務(wù)器[3]。因此,MongoDB 這些優(yōu)秀的特性,使得它成為了當(dāng)前Web 應(yīng)用可擴(kuò)展的高性能數(shù)據(jù)存儲解決方案[4]。MongoDB 集群模式如圖2 所示。

    圖2 MongoDB 集群模式

    1.3 中文分詞

    在數(shù)據(jù)進(jìn)行有效存儲之后,接下來就是檢索數(shù)據(jù),發(fā)揮數(shù)據(jù)的價值。而在數(shù)據(jù)檢索的過程中,為了提高檢索的效率,通常會對文本內(nèi)容進(jìn)行分詞,得到關(guān)鍵詞組,從而提高檢索效率。然而,市場上常用的分詞是英文單詞分詞,與實際應(yīng)用中的中文分詞有一定的差別,實際檢索效果也有很大的區(qū)別。因此,在綜合考慮現(xiàn)有成熟的分詞引擎之后,選取使用JieBa 分詞庫進(jìn)行中文分詞,以此來取得良好的數(shù)據(jù)檢索效果,從而實現(xiàn)具有高效率檢索的醫(yī)療數(shù)據(jù)平臺。

    JieBa 分詞是一個中文自然語言處理的分詞庫,是屬于概率語言模型分詞,其中,常用3 種分詞模式:全模式:快速的掃描成詞的詞語;精確模式:嘗試精確地切開語句,可進(jìn)行文本分析;搜索引擎模式:對長詞進(jìn)行再次切分,提高召回率。

    選用搜索引擎模式,并且選用內(nèi)置的TF-IDF進(jìn)行關(guān)鍵詞抽取,先將醫(yī)療數(shù)據(jù)使用JieBa 分詞進(jìn)行關(guān)鍵詞抽取,并進(jìn)行切分,獲取處理后的詞組集合。再構(gòu)建一份停用詞表,對處理后的詞組集合,去除停用詞,最后得到被檢索的關(guān)鍵詞,以此來提高檢索效率。

    2 平臺建設(shè)方案

    2.1 總體架構(gòu)

    在綜合考慮使用便利性、穩(wěn)定性、兼容性等方面后,基于Spring Cloud 的分布式醫(yī)療數(shù)據(jù)平臺采用的是BS架構(gòu)。相對比于CS 架構(gòu),BS 架構(gòu)可以很方便地適配到各個不同系統(tǒng),同時在前端頁面上,也能針對性地做好優(yōu)化,保證用戶在各個終端之間所見的一致性。此外,BS 架構(gòu)的設(shè)計模式,可以有效的兼容移動端的使用,為以后數(shù)據(jù)平臺的使用范圍擴(kuò)展提供良好的基礎(chǔ)。同時,業(yè)務(wù)擴(kuò)展更方便簡單,可以通過瀏覽器隨時隨地地進(jìn)行瀏覽、查詢等業(yè)務(wù)。

    基于Spring Cloud 的分布式醫(yī)療數(shù)據(jù)平臺,主要分為5 個模塊,前端顯示模塊用于顯示數(shù)據(jù)到網(wǎng)頁上,與用戶進(jìn)行交互;服務(wù)注冊與發(fā)現(xiàn)模塊用于注冊服務(wù)端,并將新增加的服務(wù)端暴露給其他調(diào)用者;配置模塊用于放置平臺所有相關(guān)的配置,包括一些需要經(jīng)常改動的數(shù)據(jù);網(wǎng)關(guān)模塊用于將訪問請求進(jìn)行過濾,并加入負(fù)載均衡功能,將訪問請求合理的分配給相應(yīng)的服務(wù)端;數(shù)據(jù)提取模塊用于將不同醫(yī)療數(shù)據(jù)提取并進(jìn)行處理,再將數(shù)據(jù)存入數(shù)據(jù)庫?;赟pring Cloud 的分布式醫(yī)療數(shù)據(jù)平臺總體架構(gòu)如圖3 所示。

    圖3 分布式醫(yī)療數(shù)據(jù)平臺總體架構(gòu)

    2.2 平臺功能

    基于Spring Cloud 的分布式醫(yī)療數(shù)據(jù)平臺為用戶提供醫(yī)療數(shù)據(jù)存儲與檢索功能,推行線上醫(yī)療和線下醫(yī)療相結(jié)合的模式,可以有效減輕醫(yī)護(hù)人員的工作量,加強(qiáng)醫(yī)護(hù)人員的工作效率。在具體應(yīng)用方面,主要包括基礎(chǔ)業(yè)務(wù)系統(tǒng)數(shù)據(jù)、關(guān)鍵詞、異構(gòu)數(shù)據(jù)源、數(shù)據(jù)檢索4 個模塊。

    2.2.1 基礎(chǔ)業(yè)務(wù)系統(tǒng)數(shù)據(jù)

    基礎(chǔ)業(yè)務(wù)系統(tǒng)數(shù)據(jù)模塊主要對醫(yī)療基礎(chǔ)業(yè)務(wù)系統(tǒng)數(shù)據(jù)的抽取,這是醫(yī)療數(shù)據(jù)平臺的數(shù)據(jù)來源,也是對數(shù)據(jù)處理的第一步,常抽取的是4 大醫(yī)療基礎(chǔ)系統(tǒng):His(醫(yī)院信息系統(tǒng))、Lis(檢驗科系統(tǒng))、Pacs(影像科系統(tǒng))、EMR(電子病歷系統(tǒng)),在業(yè)務(wù)系統(tǒng)數(shù)據(jù)抽取之后,進(jìn)行數(shù)據(jù)的預(yù)處理和關(guān)鍵詞提取。

    2.2.2 關(guān)鍵詞

    關(guān)鍵詞模塊在上一步的基礎(chǔ)上進(jìn)行,主要是對所有存入數(shù)據(jù)庫的數(shù)據(jù)進(jìn)行關(guān)鍵詞提取,先把基礎(chǔ)業(yè)務(wù)系統(tǒng)數(shù)據(jù)進(jìn)行標(biāo)準(zhǔn)化,將不同結(jié)構(gòu)的系統(tǒng)數(shù)據(jù),以統(tǒng)一的規(guī)范進(jìn)行整理,各自不同的信息以json 串的形式存入文檔,然后進(jìn)行中文分詞,選用JieBa 分詞的搜索引擎模式,并用TF-IDF 進(jìn)行關(guān)鍵詞抽取。

    2.2.3 異構(gòu)數(shù)據(jù)源

    異構(gòu)數(shù)據(jù)源模塊是將各個不同來源的數(shù)據(jù)存入MongoDB 中,主要的非結(jié)構(gòu)化數(shù)據(jù)包括語音、視頻等數(shù)據(jù)。在異構(gòu)數(shù)據(jù)源模塊,開放對外接口,統(tǒng)一接口入?yún)?,保證不同數(shù)據(jù)源能夠簡易接入醫(yī)療數(shù)據(jù)平臺,并對處理后的數(shù)據(jù)進(jìn)行校驗,避免缺損數(shù)據(jù)和無意義數(shù)據(jù)存入數(shù)據(jù)庫中。

    2.2.4 數(shù)據(jù)檢索

    數(shù)據(jù)檢索模塊主要是對各個存入的數(shù)據(jù)進(jìn)行檢索,這里使用MongoDB 自帶的查詢功能,配合Spring Cloud分布式架構(gòu),保證能處理大量的并發(fā)請求,并且能取得良好的檢索性能,同時在內(nèi)存足夠的情況,將數(shù)據(jù)放入內(nèi)存,有著完整的索引支持,能取得更加迅速的檢索效果。

    3 結(jié)束語

    對大數(shù)據(jù)情況下的醫(yī)療數(shù)據(jù)平臺建設(shè),進(jìn)行了一定的研究,綜合當(dāng)前醫(yī)療數(shù)據(jù)的現(xiàn)狀,提出了基于Spring Cloud 的分布式醫(yī)療數(shù)據(jù)平臺的建設(shè),該平臺可以處理大量醫(yī)療數(shù)據(jù)的存儲問題,有效解決異構(gòu)數(shù)據(jù)的持久化問題,同時通過標(biāo)準(zhǔn)化、分詞操作,再搭配MongoDB 的優(yōu)秀的檢索性能,形成一個異構(gòu)數(shù)據(jù)可存儲、系統(tǒng)高可用、規(guī)模易擴(kuò)展、檢索高效率的醫(yī)療數(shù)據(jù)平臺。但醫(yī)療數(shù)據(jù)平臺也出現(xiàn)了一些問題,比如檢索性能依賴于硬件,相較于專門的檢索數(shù)據(jù)庫,MongoDB的數(shù)據(jù)檢索有待提高;異構(gòu)數(shù)據(jù)雖然得以有效存儲,但是卻無法有效使用,無法挖掘和分析出數(shù)據(jù)的價值,這些問題需要進(jìn)一步的研究和完善。

    永嘉县| 蛟河市| 东乌| 确山县| 安陆市| 定兴县| 云和县| 华安县| 阳泉市| 云阳县| 泾川县| 瑞安市| 北票市| 绩溪县| 抚州市| 高州市| 巨野县| 襄垣县| 安国市| 长丰县| 泌阳县| 芮城县| 贺兰县| 重庆市| 卢氏县| 鄂托克前旗| 辽阳市| 抚顺县| 安塞县| 九龙县| 从化市| 肥西县| 岚皋县| 房山区| 安平县| 三河市| 庄浪县| 乐清市| 明星| 边坝县| 钟祥市|