• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    生物大數(shù)據(jù)時(shí)代高血壓數(shù)據(jù)挖掘分析平臺(tái)構(gòu)建研究

    2019-05-22 10:27:32賈澤宇李宗瑾
    電腦知識(shí)與技術(shù) 2019年6期
    關(guān)鍵詞:數(shù)據(jù)挖掘

    賈澤宇 李宗瑾

    摘要:針對生物大數(shù)據(jù)時(shí)代高血壓基礎(chǔ)研究面臨數(shù)據(jù)量龐大、類型復(fù)雜、數(shù)據(jù)挖掘困難等問題,提出一種基于生物大數(shù)據(jù)的高血壓數(shù)據(jù)挖掘分析平臺(tái)的構(gòu)建方案。該平臺(tái)擬整合國際數(shù)據(jù)庫中高血壓相關(guān)的基因組、轉(zhuǎn)錄組、蛋白質(zhì)組等分子數(shù)據(jù),收集國內(nèi)外高血壓前沿科研成果,構(gòu)建高血壓醫(yī)學(xué)組數(shù)數(shù)字資源庫;同時(shí)集成主流數(shù)據(jù)分析方法和軟件,打造高血壓數(shù)據(jù)挖掘分析平臺(tái),為科研工作者及臨床醫(yī)學(xué)研究者提供專業(yè)、精準(zhǔn)、高效的數(shù)據(jù)查詢檢索、數(shù)據(jù)比對分析及成果可視化展示等服務(wù),滿足不同科研工作者的多樣化需求,提供一站式的高血壓大數(shù)據(jù)云服務(wù),為高血壓精準(zhǔn)醫(yī)學(xué)研究提供最可靠的數(shù)據(jù)支持與保障。

    關(guān)鍵詞:生物大數(shù)據(jù);高血壓云服務(wù);數(shù)據(jù)挖掘;分析平臺(tái)構(gòu)建

    中圖分類號(hào):TP311 文獻(xiàn)標(biāo)識(shí)碼:A 文章編號(hào):1009-3044(2019)06-0268-02

    1 引言

    生物信息學(xué)(Bioinformatics)是伴隨著人類基因組計(jì)劃(Human Genome Project,HGP)而迅猛發(fā)展的一門交叉學(xué)科,其涉及生物學(xué)、統(tǒng)計(jì)學(xué)及計(jì)算機(jī)科學(xué)等多個(gè)學(xué)科。生物信息學(xué)通過對生物信息數(shù)據(jù)獲取、處理、儲(chǔ)存、分析和解釋,揭示生物信息數(shù)據(jù)包含的生物學(xué)意義。隨著高通量測序技術(shù)、生物信息數(shù)據(jù)挖掘技術(shù)的飛速發(fā)展,R和Python語言在數(shù)據(jù)挖掘廣泛應(yīng)用,加之基因組、蛋白組、轉(zhuǎn)錄組等海量組學(xué)數(shù)據(jù)指數(shù)型增長。同時(shí)高通量測序?qū)嶒?yàn)技術(shù)成熟發(fā)展,生物醫(yī)學(xué)實(shí)現(xiàn)由單一組學(xué)時(shí)代向多組學(xué)融合時(shí)代的跨越。這昭示著我們已經(jīng)進(jìn)入生物大數(shù)據(jù)時(shí)代。

    在生物大數(shù)據(jù)時(shí)代,生物醫(yī)學(xué)組學(xué)數(shù)據(jù)主要呈現(xiàn)出數(shù)據(jù)多元化、增速快、數(shù)據(jù)結(jié)構(gòu)復(fù)雜且標(biāo)準(zhǔn)化程度低、數(shù)據(jù)分布零散難以整合分析等特點(diǎn)。目前,生物醫(yī)學(xué)研究面臨主要問題有:(1)數(shù)據(jù)碎片化、管理分散、難以實(shí)現(xiàn)有效整合分析;(2)數(shù)據(jù)安全無保障,缺乏交流平臺(tái),是世界最大組學(xué)數(shù)據(jù)輸出國;(3)數(shù)據(jù)缺乏標(biāo)準(zhǔn)化機(jī)制且管理混亂,質(zhì)量參差不齊,缺乏同國際交流的平臺(tái)與窗口,受國際、國內(nèi)的政策與技術(shù)的限制嚴(yán)重。

    高血壓作為一種常見的慢性非傳染性疾病,是目前我國居民健康的主要威脅之一,也是我國生物醫(yī)學(xué)領(lǐng)域的研究重點(diǎn)和熱點(diǎn)。隨著生物大數(shù)據(jù)時(shí)代來臨,高血壓生物醫(yī)學(xué)研究面臨新的機(jī)遇與挑戰(zhàn)。以基因組、轉(zhuǎn)錄組、蛋白質(zhì)組為代表的各種組學(xué)蓬勃發(fā)展為高血壓生物醫(yī)學(xué)研究提供了新的研究方向與研究方法,與此同時(shí),由于組學(xué)數(shù)據(jù)量大增速快、種類繁多結(jié)構(gòu)復(fù)雜、數(shù)據(jù)分散難以共享等特點(diǎn),使得高血壓研究面臨嚴(yán)峻挑戰(zhàn)。

    本文提出一種高血壓大數(shù)據(jù)分析平臺(tái)構(gòu)建方案,該方案借助云存儲(chǔ)技術(shù)和虛擬化技術(shù)構(gòu)建高血壓生物醫(yī)學(xué)大數(shù)據(jù)資源庫,擬解決生物大數(shù)據(jù)時(shí)代高血壓醫(yī)學(xué)數(shù)據(jù)分散、結(jié)構(gòu)復(fù)雜、不易存儲(chǔ)等問題;借助云計(jì)算技術(shù)、數(shù)據(jù)挖掘技術(shù)打造高血壓數(shù)據(jù)分析平臺(tái),彌補(bǔ)現(xiàn)階段高血壓醫(yī)療數(shù)據(jù)存儲(chǔ)分散難以共享不足,為科研和醫(yī)療工作者提供專業(yè)化的高血壓數(shù)據(jù)共享云服務(wù),為高血壓精準(zhǔn)醫(yī)學(xué)研究提供精準(zhǔn)數(shù)據(jù)支持和平臺(tái)支撐。

    2 生物大數(shù)據(jù)時(shí)代高血壓大數(shù)據(jù)分析平臺(tái)設(shè)計(jì)

    隨著生物大數(shù)據(jù)時(shí)代到來,高血壓生物醫(yī)學(xué)數(shù)據(jù)爆炸式增長,為滿足高血壓大數(shù)據(jù)發(fā)展需求,彌補(bǔ)傳統(tǒng)數(shù)據(jù)存儲(chǔ)模式和數(shù)據(jù)管理分析技術(shù)成本高、部署困難、不易擴(kuò)容、數(shù)據(jù)處理速度慢等不足。本文提出一種基于MVC架構(gòu)的高血壓數(shù)據(jù)挖掘分析平臺(tái)構(gòu)建方案,該方案利用MVC架構(gòu)低耦合的特點(diǎn)實(shí)現(xiàn)圖形界面和數(shù)據(jù)挖掘分析組件優(yōu)勢組合,用戶通過視圖將數(shù)據(jù)服務(wù)請求傳遞給控制器,控制器根據(jù)不同服務(wù)請求調(diào)用相應(yīng)模型,模型將封裝的數(shù)據(jù)參數(shù)及業(yè)務(wù)需求傳遞給數(shù)據(jù)挖掘分析系統(tǒng),系統(tǒng)在接收到數(shù)據(jù)參數(shù)后從高血壓數(shù)據(jù)資源庫中提取數(shù)據(jù),調(diào)用數(shù)據(jù)處理程序進(jìn)行挖掘分析,最后將數(shù)據(jù)分析結(jié)果通過視圖展現(xiàn)給用戶。該平臺(tái)將高血壓數(shù)據(jù)資源和數(shù)據(jù)挖掘分析組件部署于云服務(wù)器,通過負(fù)載均衡來策略協(xié)調(diào)用戶對數(shù)據(jù)挖掘系統(tǒng)的訪問,從而提升系統(tǒng)的計(jì)算效率,使用戶在服務(wù)體驗(yàn)、系統(tǒng)的交互性、可靠性等方面相對于傳統(tǒng)的數(shù)據(jù)挖掘平臺(tái)皆有很大提升。該平臺(tái)架構(gòu)圖如圖1所示。

    1)高血壓數(shù)據(jù)資源庫設(shè)計(jì)實(shí)現(xiàn)

    高血壓數(shù)據(jù)資源庫是基于云存儲(chǔ)技術(shù)設(shè)計(jì)實(shí)現(xiàn)的,在不改變現(xiàn)有物理存儲(chǔ)設(shè)備基礎(chǔ)上借助分布式存儲(chǔ)技術(shù)、虛擬化技術(shù)以及計(jì)算機(jī)網(wǎng)絡(luò)技術(shù)構(gòu)建虛擬數(shù)據(jù)云服務(wù),基于PostgreSQL數(shù)據(jù)庫技術(shù)構(gòu)建高血壓數(shù)據(jù)資源庫,并采用先進(jìn)I2B2數(shù)據(jù)管理方法,實(shí)現(xiàn)對高血壓數(shù)據(jù)的有效管理。資源庫內(nèi)的數(shù)據(jù)主要分為結(jié)構(gòu)胡數(shù)據(jù)和非結(jié)構(gòu)化數(shù),結(jié)構(gòu)化數(shù)據(jù)包括:基因組學(xué)數(shù)據(jù)、蛋白質(zhì)組學(xué)數(shù)據(jù)、轉(zhuǎn)錄組數(shù)據(jù)和表觀遺傳組數(shù)據(jù)等分子數(shù)據(jù);非結(jié)構(gòu)化數(shù)據(jù)主要包括:病例數(shù)據(jù)、科研文獻(xiàn)以及其他類型數(shù)據(jù)。高血壓數(shù)據(jù)資源庫結(jié)構(gòu)如圖2所示:

    2)高血壓數(shù)據(jù)挖掘分析系統(tǒng)設(shè)計(jì)實(shí)現(xiàn)

    高血壓數(shù)據(jù)挖掘分析系統(tǒng)是整個(gè)高血壓大數(shù)據(jù)分析平臺(tái)的核心與靈魂。數(shù)據(jù)挖掘分析系統(tǒng)采用模塊化設(shè)計(jì)思想,整個(gè)系統(tǒng)分為數(shù)據(jù)選取、數(shù)據(jù)預(yù)處理,算法模型及可視化四部分,各模塊又細(xì)分若干子模塊,模塊之間相互獨(dú)立,通過統(tǒng)一API訪問接口向外提供服務(wù),當(dāng)用戶需求改變時(shí),只需修改相關(guān)的模塊的業(yè)務(wù)參數(shù)即可,其他模塊不受影響。采用這種模塊化結(jié)構(gòu)設(shè)計(jì)模式,能夠使系統(tǒng)的擴(kuò)展性和健壯性大大提高。

    3 數(shù)據(jù)挖掘平臺(tái)關(guān)鍵技術(shù)

    高血壓數(shù)據(jù)挖掘分析平臺(tái)構(gòu)建關(guān)鍵在于平臺(tái)架構(gòu)設(shè)計(jì)和算法實(shí)現(xiàn)兩個(gè)方面,平臺(tái)設(shè)計(jì)方案的合理性和健壯性決定了平臺(tái)系統(tǒng)的穩(wěn)定性;算法的健壯性和可靠性決定了用戶體驗(yàn)。現(xiàn)針對平臺(tái)建設(shè)中涉及的關(guān)鍵技術(shù)進(jìn)行研究,詳細(xì)內(nèi)容如下:

    1)云計(jì)算技術(shù)

    云計(jì)算技術(shù)是一種借助互聯(lián)網(wǎng)技術(shù)整合大量計(jì)算數(shù)據(jù)與處理器資源并向提供可用的、便捷的、按需的資源訪問模式,其具有功能強(qiáng)大、運(yùn)行成本低、安全性高、可共享等優(yōu)點(diǎn),是高血壓數(shù)據(jù)挖掘分析平臺(tái)的核心技術(shù)之一,在平臺(tái)構(gòu)建過中,主要運(yùn)用分布式存儲(chǔ)技術(shù)、虛擬化技術(shù)、并行云計(jì)算技術(shù)。

    (1)分布式存儲(chǔ)技術(shù)。該技術(shù)借助網(wǎng)絡(luò)技術(shù)優(yōu)勢將分散的、碎片化存儲(chǔ)空間構(gòu)建成一個(gè)虛擬的整體,并將數(shù)據(jù)存儲(chǔ)于虛擬空間中。借助此方式可以將碎片化的、零散的物理存儲(chǔ)設(shè)備構(gòu)建成虛擬的、高擴(kuò)容性的存儲(chǔ)空間,在此基礎(chǔ)上構(gòu)建高血壓數(shù)據(jù)資源庫,適應(yīng)高血壓分子數(shù)據(jù)增長趨勢。

    (2)虛擬化技術(shù)。該技術(shù)可將多臺(tái)服務(wù)器設(shè)備有效連接起來構(gòu)成一個(gè)高效的服務(wù)資源池,從而優(yōu)化資源配置,使服務(wù)器資源得以最大化利用。運(yùn)用該技術(shù)將高血壓數(shù)據(jù)分析系統(tǒng)多個(gè)算法模塊分別部署在不同服務(wù)器中,保證各個(gè)數(shù)據(jù)分析模塊相互獨(dú)立,互不影響,從而提升高血壓數(shù)據(jù)挖掘分析平臺(tái)數(shù)據(jù)處理能力和處理效率。

    2)MVC框架技術(shù)

    MVC(Model-View-Controller,模型-視圖-控制器),是一種當(dāng)前主流軟件設(shè)計(jì)模式,該模式將數(shù)據(jù)、業(yè)務(wù)邏輯以及前端分割成相互獨(dú)立三部分,各部分通過控制器實(shí)現(xiàn)數(shù)據(jù)交換、業(yè)務(wù)傳遞,細(xì)化分解軟件開發(fā)工作,大大提升軟件系統(tǒng)開發(fā)效率。采用MVC架構(gòu)的高血壓數(shù)據(jù)挖掘分析系統(tǒng)具有維護(hù)成本低、耦合性低、重用性高等特點(diǎn)。該架構(gòu)實(shí)現(xiàn)了平臺(tái)中前端展示界面和數(shù)據(jù)挖掘分析組件的解耦,將兩者相互獨(dú)立,在開發(fā)過程中前端工程師不需要關(guān)心具體的數(shù)據(jù)挖掘分析流程;而后臺(tái)業(yè)務(wù)流工程師也不必關(guān)心展示界面,大大提高了數(shù)據(jù)挖掘分析平臺(tái)的開發(fā)效率。

    3)分布式并行計(jì)算技術(shù)

    分布式并行計(jì)算技術(shù)是將數(shù)據(jù)分布、任務(wù)并行、任務(wù)調(diào)度等技術(shù)細(xì)節(jié)進(jìn)行封裝,在實(shí)際的應(yīng)用中,用戶并不需考慮這些內(nèi)容,而知識(shí)能夠在終端操作應(yīng)用滿足自身的需求。利用分布式并行計(jì)算技術(shù)有利于提高數(shù)據(jù)挖掘的效率,同時(shí)降低企業(yè)數(shù)據(jù)挖掘平臺(tái)維護(hù)的成本。高血壓數(shù)據(jù)挖掘分析平臺(tái)構(gòu)建采用分布式并行計(jì)算方法協(xié)調(diào)數(shù)據(jù)與分析模塊關(guān)系。當(dāng)用戶使用時(shí)只要在終端開啟執(zhí)行數(shù)據(jù)運(yùn)算的指令就可以實(shí)現(xiàn)數(shù)據(jù)的操作,它對數(shù)據(jù)的分析以及任務(wù)的并行執(zhí)行有著推動(dòng)的作用。

    4 結(jié)語

    隨著生物大數(shù)據(jù)時(shí)代來臨,高血壓分子數(shù)據(jù)呈現(xiàn)爆炸式增長,對高血壓數(shù)據(jù)有效整合與利用可以促進(jìn)高血壓精準(zhǔn)醫(yī)學(xué)研究發(fā)展,實(shí)現(xiàn)數(shù)據(jù)資源到數(shù)據(jù)財(cái)富轉(zhuǎn)化。本研究依托云計(jì)算技術(shù)、MVC框架技術(shù)、分布式并行計(jì)算技術(shù)構(gòu)建高血壓數(shù)據(jù)資源庫以及數(shù)據(jù)挖掘分析平臺(tái),服務(wù)于廣大醫(yī)療及科研工作者,滿足不同群體不同需求,實(shí)現(xiàn)高血壓數(shù)據(jù)資源的共享,高血壓研究者提供一個(gè)專業(yè)化信息交流平臺(tái),進(jìn)一步促進(jìn)高血壓精準(zhǔn)醫(yī)學(xué)研究發(fā)展,實(shí)現(xiàn)更大的經(jīng)濟(jì)效益和實(shí)用價(jià)值。

    參考文獻(xiàn):

    [1] 胡瑩石,陳家晨,徐菱.云計(jì)算下數(shù)據(jù)挖掘平臺(tái)架構(gòu)及技術(shù)探究[J].無線互聯(lián)科技,2018,15(12).

    [2] 王曉妮,段群.基于MVC模式的數(shù)據(jù)挖掘平臺(tái)設(shè)計(jì)與實(shí)現(xiàn)[J].信息與電腦(理論版),2018(15):53-55.

    [3] 王俊,郭麗,吳建盛,湯麗華,等.大數(shù)據(jù)背景下的生物信息學(xué)研究現(xiàn)狀[J].南京郵電大學(xué)學(xué)報(bào)(自然科學(xué)版),2017,37(04):62-67.

    [4] 張國慶,李亦學(xué),王澤峰,等.生物醫(yī)學(xué)大數(shù)據(jù)發(fā)展的新挑戰(zhàn)與趨勢[J].中國科學(xué)院院刊,2018,33(08):853-860.

    [5] 丁巖,楊慶平,錢煜明.基于云計(jì)算的數(shù)據(jù)挖掘平臺(tái)架構(gòu)及其關(guān)鍵技術(shù)研究[J].中興通訊技術(shù),2013,19(01):53-56.

    [6] 樊紅珍.基于云計(jì)算的數(shù)據(jù)挖掘平臺(tái)架構(gòu)及其關(guān)鍵技術(shù)[J].電子技術(shù)與軟件工程,2017(05):196.

    [7] 趙友杰,曹涌,熊飛.基于林業(yè)大數(shù)據(jù)的生物信息云平臺(tái)的構(gòu)建研究[J].電腦知識(shí)與技術(shù),2018,14(01):23-25.

    [8] 李國妮.tranSMART轉(zhuǎn)換醫(yī)學(xué)平臺(tái)的本地化及其深層次的開發(fā)[D].長安大學(xué),2016.

    [9] 陶慶.基于云計(jì)算的MVC架構(gòu)數(shù)據(jù)挖掘平臺(tái)的研究與設(shè)計(jì)[J].集寧師范學(xué)院學(xué)報(bào),2018,40(03):53-57.

    【通聯(lián)編輯:代影】

    猜你喜歡
    數(shù)據(jù)挖掘
    基于數(shù)據(jù)挖掘的船舶通信網(wǎng)絡(luò)流量異常識(shí)別方法
    探討人工智能與數(shù)據(jù)挖掘發(fā)展趨勢
    數(shù)據(jù)挖掘技術(shù)在打擊倒賣OBU逃費(fèi)中的應(yīng)用淺析
    基于并行計(jì)算的大數(shù)據(jù)挖掘在電網(wǎng)中的應(yīng)用
    電力與能源(2017年6期)2017-05-14 06:19:37
    數(shù)據(jù)挖掘技術(shù)在中醫(yī)診療數(shù)據(jù)分析中的應(yīng)用
    一種基于Hadoop的大數(shù)據(jù)挖掘云服務(wù)及應(yīng)用
    數(shù)據(jù)挖掘在高校圖書館中的應(yīng)用
    數(shù)據(jù)挖掘的分析與探索
    河南科技(2014年23期)2014-02-27 14:18:43
    基于GPGPU的離散數(shù)據(jù)挖掘研究
    利用數(shù)據(jù)挖掘技術(shù)實(shí)現(xiàn)LIS數(shù)據(jù)共享的開發(fā)實(shí)踐
    本溪市| 大名县| 新营市| 睢宁县| 长治县| 黑水县| 类乌齐县| 佛坪县| 巢湖市| 沈阳市| 隆德县| 万载县| 车险| 禄丰县| 海原县| 宁武县| 察雅县| 陕西省| 凌源市| 老河口市| SHOW| 浦北县| 邵武市| 建瓯市| 无为县| 安阳市| 洛浦县| 广宗县| 鸡泽县| 新乡市| 保定市| 大港区| 葫芦岛市| 体育| 肇源县| 德格县| 含山县| 靖边县| 霍州市| 肥东县| 麻阳|