• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)的構(gòu)建

      2018-03-22 02:40:00,
      關(guān)鍵詞:醫(yī)學(xué)知識(shí)生物醫(yī)學(xué)知識(shí)庫(kù)

      ,

      1 精準(zhǔn)醫(yī)學(xué)的發(fā)展

      精準(zhǔn)醫(yī)學(xué)是生物技術(shù)、信息技術(shù)和多種前沿技術(shù)在醫(yī)學(xué)臨床實(shí)踐的交匯融合應(yīng)用,是醫(yī)學(xué)科技發(fā)展的前沿方向,實(shí)施精準(zhǔn)醫(yī)學(xué)已經(jīng)成為推動(dòng)全民健康的國(guó)家發(fā)展戰(zhàn)略。2011年美國(guó)國(guó)家研究理事會(huì)提出“精準(zhǔn)醫(yī)學(xué)”概念,隨著相關(guān)技術(shù)發(fā)展以及對(duì)該理念的重視,2015年美國(guó)將“精準(zhǔn)醫(yī)學(xué)計(jì)劃”提升為國(guó)家戰(zhàn)略之一。精準(zhǔn)醫(yī)學(xué)的有效實(shí)施不僅可以提高國(guó)民健康和醫(yī)療水平,也可以更好地優(yōu)化國(guó)家醫(yī)療資源分配,同時(shí)推動(dòng)相關(guān)學(xué)科和技術(shù)的快速發(fā)展及相關(guān)產(chǎn)業(yè)的發(fā)展,進(jìn)而產(chǎn)生巨大市場(chǎng)空間。因此,精準(zhǔn)醫(yī)學(xué)研究已經(jīng)成為各國(guó)的科技戰(zhàn)略制高點(diǎn)。2015年,我國(guó)科技部召開了“國(guó)家精準(zhǔn)醫(yī)療戰(zhàn)略專家會(huì)議”,成立了中國(guó)精準(zhǔn)醫(yī)療戰(zhàn)略專家組,計(jì)劃將在2030年前投入600億元,用于我國(guó)精準(zhǔn)醫(yī)學(xué)研究。2016年3月,科技部官網(wǎng)公布了《科技部關(guān)于發(fā)布國(guó)家重點(diǎn)研發(fā)計(jì)劃精準(zhǔn)醫(yī)學(xué)研究等重點(diǎn)專項(xiàng)2016年度項(xiàng)目申報(bào)指南的通知》。至此,精準(zhǔn)醫(yī)療在中國(guó)已經(jīng)上升為“國(guó)家戰(zhàn)略”。復(fù)旦大學(xué)有幸成為精準(zhǔn)醫(yī)學(xué)重點(diǎn)專項(xiàng)中的首席單位。

      精準(zhǔn)醫(yī)學(xué)研究集合現(xiàn)代醫(yī)學(xué)和生物學(xué)科技發(fā)展的知識(shí)與技術(shù),代表現(xiàn)代醫(yī)學(xué)的發(fā)展趨勢(shì)以及臨床實(shí)踐發(fā)展方向。精準(zhǔn)醫(yī)學(xué)的核心思想是通過(guò)對(duì)大樣本、海量數(shù)據(jù)進(jìn)行整合分析,構(gòu)建能夠揭示個(gè)體疾病分子機(jī)制的知識(shí)網(wǎng)絡(luò),由此針對(duì)病人的基因組和其他個(gè)體特點(diǎn)進(jìn)行預(yù)防和治療。隨著生物醫(yī)學(xué)領(lǐng)域研究的飛速發(fā)展,生物醫(yī)學(xué)數(shù)據(jù)呈指數(shù)級(jí)增長(zhǎng),導(dǎo)致科研人員和醫(yī)生難以從海量生物醫(yī)學(xué)數(shù)據(jù)中發(fā)現(xiàn)高質(zhì)量、可用性的知識(shí)。

      自從人類基因組計(jì)劃以來(lái),測(cè)序技術(shù)和質(zhì)譜技術(shù)等各類組學(xué)技術(shù)的飛速發(fā)展,推動(dòng)了基因組、轉(zhuǎn)錄組、表觀遺傳組、蛋白質(zhì)組和代謝組等海量生命科學(xué)組學(xué)數(shù)據(jù)的指數(shù)級(jí)增長(zhǎng)[1-2]。一方面,機(jī)器學(xué)習(xí)和人工智能技術(shù)的發(fā)展大幅提升了醫(yī)學(xué)信息學(xué)和生物信息學(xué)的發(fā)展,因此生物醫(yī)學(xué)數(shù)據(jù)的應(yīng)用方式也發(fā)生了改變。高通量實(shí)驗(yàn)技術(shù)的突破,直接把生物醫(yī)學(xué)數(shù)據(jù)從PB(PetaByte)時(shí)代推升到多維度數(shù)據(jù)融合的EB(ExaByte)時(shí)代。另一方面,人群隊(duì)列研究、分子流行病學(xué)研究產(chǎn)生了大量的數(shù)據(jù),從分子、細(xì)胞、組織、器官、個(gè)體等多層面描述的多維度數(shù)據(jù),匯總海量真實(shí)世界數(shù)據(jù)(Real World Data)[3-4],這些廣泛的數(shù)據(jù)構(gòu)成了復(fù)雜的高維度生物醫(yī)學(xué)大數(shù)據(jù)。

      目前生物醫(yī)學(xué)數(shù)據(jù)具有數(shù)量巨大、增長(zhǎng)迅速、質(zhì)量控制困難、來(lái)源廣泛繁雜、內(nèi)涵豐富、非標(biāo)準(zhǔn)化、非結(jié)構(gòu)化和數(shù)據(jù)相對(duì)分散等特點(diǎn),從而導(dǎo)致難以挖掘生物醫(yī)學(xué)大數(shù)據(jù)的潛在高價(jià)值。面對(duì)海量的生物醫(yī)學(xué)數(shù)據(jù),亟需構(gòu)建精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù),全面獲取各類生物醫(yī)學(xué)文本信息和組學(xué)數(shù)據(jù),在標(biāo)準(zhǔn)、統(tǒng)一的語(yǔ)義網(wǎng)絡(luò)下,通過(guò)挖掘、關(guān)聯(lián)等技術(shù),從海量信息中高效準(zhǔn)確地發(fā)現(xiàn)知識(shí),為研究和臨床決策提供充分可靠的依據(jù),最終實(shí)現(xiàn)精準(zhǔn)預(yù)防、精準(zhǔn)診斷和精準(zhǔn)治療的目標(biāo)。

      因此,構(gòu)建能夠?qū)A繑?shù)據(jù)進(jìn)行分析并提供可靠知識(shí)的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù),成為精準(zhǔn)醫(yī)學(xué)研究和臨床應(yīng)用發(fā)展的關(guān)鍵環(huán)節(jié)。

      2 生物醫(yī)學(xué)知識(shí)庫(kù)現(xiàn)狀

      2.1 國(guó)外生物醫(yī)學(xué)知識(shí)庫(kù)建設(shè)

      隨著精準(zhǔn)醫(yī)學(xué)的發(fā)展,生物醫(yī)學(xué)知識(shí)庫(kù)成為生物醫(yī)學(xué)領(lǐng)域研究的熱點(diǎn)。美國(guó)國(guó)立生物醫(yī)學(xué)中心開發(fā)了基于位點(diǎn)變異-基因-疾病的知識(shí)庫(kù)ClinVar(https://www.ncbi.nlm.nih.gov/clinvar/)[5],歐洲生物信息研究所先后開發(fā)了蛋白質(zhì)相互作用數(shù)據(jù)庫(kù)IntAct(https://www.ebi.ac.uk/intact/)[6]、生物學(xué)通路知識(shí)庫(kù)Reactome (https://reactome.org/)[7]、生物相關(guān)的化學(xué)實(shí)體數(shù)據(jù)庫(kù)ChEBI(https://www.ebi.ac.uk/inc/tool/chebi.html)、生化反應(yīng)的數(shù)學(xué)模型數(shù)據(jù)庫(kù)BioModels(http://www.ebi.ac.uk/biomodels-main/)和基因本體數(shù)據(jù)庫(kù)Gene Ontology (http://www.geneontology.org/) 等,西班牙國(guó)家生物技術(shù)中心開發(fā)了以基因?yàn)橹行?、基于PubMed 文獻(xiàn)摘要的在線文本知識(shí)挖掘服務(wù)平臺(tái) Information Hyperlinked over Proteins(iHOP),并將其用于提供基因間關(guān)聯(lián)挖掘和分析。與此同時(shí),一些公司也開展了生物醫(yī)學(xué)知識(shí)庫(kù)的開發(fā),代表性平臺(tái)有GeneGo(https://portal.genego.com/)、IPA(http://www.ipa-world.org/)和Pathway Studio(http://www.pathwaystudio.com/)。它們通過(guò)自然語(yǔ)言處理技術(shù)從文本中提取信息和知識(shí),同時(shí)聘請(qǐng)專業(yè)人士進(jìn)行判讀,保證知識(shí)的可靠性。IBM和微軟等公司依托其在人工智能及信息處理技術(shù)等方面的強(qiáng)大優(yōu)勢(shì),研發(fā)了醫(yī)學(xué)知識(shí)智能檢索、查詢和相關(guān)分析工具,代表性產(chǎn)品有Watson腫瘤治療和臨床應(yīng)用系統(tǒng)、微軟Microsoft Health系統(tǒng)[8]。 IBM Watson是一種數(shù)據(jù)分析軟件,可以自動(dòng)化分析、預(yù)測(cè)分析和可視化分析,但是需要數(shù)據(jù)預(yù)處理、統(tǒng)計(jì)概念理解和領(lǐng)域?qū)I(yè)知識(shí)[8]。

      以上產(chǎn)品或平臺(tái)為生物醫(yī)學(xué)研究和藥物開發(fā)提供了高效廣泛的解決方案,覆蓋了從藥物發(fā)現(xiàn)到新藥申請(qǐng),再到臨床試驗(yàn)和臨床輔助診斷等生物醫(yī)學(xué)各個(gè)方面??偟膩?lái)說(shuō),以基因?yàn)橹行模枋龌?基因、基因-疾病、基因-位點(diǎn)關(guān)聯(lián)的知識(shí)庫(kù)越來(lái)越多,其對(duì)精準(zhǔn)醫(yī)學(xué)的巨大價(jià)值也得到了廣泛的認(rèn)同。

      2.2 國(guó)內(nèi)生物醫(yī)學(xué)知識(shí)庫(kù)建設(shè)

      我國(guó)生物醫(yī)學(xué)知識(shí)庫(kù)建設(shè)也已經(jīng)起步,主要是基于單一信息來(lái)源的醫(yī)學(xué)知識(shí)庫(kù)建設(shè)。以文獻(xiàn)知識(shí)庫(kù)為代表的醫(yī)學(xué)知識(shí)庫(kù)廣泛服務(wù)于臨床研究機(jī)構(gòu)和臨床醫(yī)生,如以文獻(xiàn)知識(shí)庫(kù)為代表的中國(guó)生物醫(yī)學(xué)知識(shí)庫(kù) (中國(guó)醫(yī)學(xué)科學(xué)院醫(yī)學(xué)信息研究所)、中國(guó)疾病知識(shí)總庫(kù)CDD(軍事科學(xué)院圖書館 )、中國(guó)醫(yī)院知識(shí)總庫(kù)CHKD(中國(guó)知網(wǎng))以及臨床診療知識(shí)庫(kù)(萬(wàn)方醫(yī)學(xué)網(wǎng))[9]?!爸袊?guó)醫(yī)院知識(shí)總庫(kù)”和“中國(guó)疾病知識(shí)總庫(kù)”是擁有多檢索入口、分組和排序、庫(kù)間引文鏈接、知識(shí)網(wǎng)絡(luò)等功能的全文知識(shí)庫(kù)[10]?!爸袊?guó)疾病知識(shí)總庫(kù)”,不僅面向臨床醫(yī)藥學(xué)專業(yè)人員,而且兼顧普通大眾;萬(wàn)方醫(yī)學(xué)網(wǎng)是完善的臨床診斷的知識(shí)庫(kù),提供以疾病、癥狀、檢查、藥品、指南和病例報(bào)告為基礎(chǔ)整合的知識(shí)點(diǎn),方便醫(yī)生查找相關(guān)知識(shí)及病例,輔助醫(yī)生臨床診斷[10]。以上醫(yī)學(xué)知識(shí)庫(kù)為臨床診療和研究提供的知識(shí)服務(wù)源于可直接利用的知識(shí),但是沒有進(jìn)行知識(shí)識(shí)別和知識(shí)推理。近年來(lái)隨著知識(shí)庫(kù)構(gòu)建和知識(shí)圖譜技術(shù)的發(fā)展,各種基于臨床病歷和??茖2≈委煹膶n}知識(shí)庫(kù)的完善,以及專業(yè)醫(yī)學(xué)知識(shí)庫(kù)對(duì)臨床輔助診斷應(yīng)用的重要性凸顯,具備知識(shí)推理和發(fā)現(xiàn)的醫(yī)學(xué)知識(shí)庫(kù)成為了研究熱點(diǎn)。

      此外,還有一些自主構(gòu)建的知識(shí)庫(kù),如復(fù)旦大學(xué)和上海生物信息技術(shù)研究中心完成的“面向基層醫(yī)療基于循證醫(yī)學(xué)的知識(shí)庫(kù)系統(tǒng)”、中國(guó)人民解放軍軍事醫(yī)學(xué)研究院構(gòu)建的肝癌知識(shí)庫(kù)、浙江大學(xué)開發(fā)的個(gè)性化合理用藥系統(tǒng)和智能診療協(xié)議推薦系統(tǒng)等。但是這些知識(shí)庫(kù)還需要在數(shù)據(jù)完備、標(biāo)準(zhǔn)共享等方面進(jìn)行完善,從而與國(guó)際接軌。值得注意的是,目前尚無(wú)針對(duì)中國(guó)人群的生物醫(yī)學(xué)知識(shí)庫(kù),也沒有與GeneGo、IPA等比肩的應(yīng)用平臺(tái),掣肘我國(guó)精準(zhǔn)醫(yī)學(xué)發(fā)展。為了打破國(guó)外生物醫(yī)學(xué)知識(shí)庫(kù)的壟斷,更好地為中國(guó)精準(zhǔn)醫(yī)學(xué)提供支撐,以復(fù)旦大學(xué)為首的團(tuán)隊(duì)擬在國(guó)家重點(diǎn)研發(fā)項(xiàng)目中利用標(biāo)準(zhǔn)的語(yǔ)義網(wǎng)絡(luò),獲取完整全面的精準(zhǔn)醫(yī)學(xué)信息,并運(yùn)用先進(jìn)的知識(shí)發(fā)現(xiàn)技術(shù),構(gòu)建統(tǒng)一的、開放共享的、高效準(zhǔn)確的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù),從而服務(wù)于中國(guó)精準(zhǔn)醫(yī)學(xué)。

      3 疾病研究精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)

      3.1 構(gòu)建目標(biāo)

      復(fù)旦大學(xué)承擔(dān)的隸屬于國(guó)家重點(diǎn)研發(fā)項(xiàng)目的精準(zhǔn)醫(yī)學(xué)項(xiàng)目“疾病研究精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)構(gòu)建”主要針對(duì)精準(zhǔn)醫(yī)學(xué)知識(shí)數(shù)據(jù)量龐大、數(shù)據(jù)類型復(fù)雜、資源分布不均衡、利用程度低下等問(wèn)題,立足我國(guó)多層次的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)體系和安全穩(wěn)定可操作的生物醫(yī)學(xué)大數(shù)據(jù)共享平臺(tái)的建設(shè)需求。其主要目標(biāo)是面向惡性腫瘤、心腦血管疾病等全疾病譜,整合生物醫(yī)學(xué)本體和多類型醫(yī)學(xué)文本資源,融合多層次生物信息數(shù)據(jù),加工和分析海量異構(gòu)異源生物醫(yī)學(xué)本體和生物信息資源,分析生物通路和網(wǎng)絡(luò)特征,構(gòu)建規(guī)范化、結(jié)構(gòu)化、自動(dòng)更新和多維自動(dòng)化與人工審編的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)體系,形成對(duì)精準(zhǔn)醫(yī)學(xué)研究和臨床應(yīng)用的關(guān)鍵支撐。開發(fā)的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)體系填補(bǔ)了國(guó)內(nèi)空白,打破了國(guó)際壟斷,將為針對(duì)健康和疾病人群的精準(zhǔn)醫(yī)學(xué)研究和臨床應(yīng)用提供多層次支撐。

      3.2 構(gòu)建原則

      集成深度索引、相關(guān)性挖掘、重要性標(biāo)注、新穎度分析等挖掘工具,集大規(guī)模文獻(xiàn)整合分析與知識(shí)發(fā)現(xiàn)于一體,實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)知識(shí)的抽提、注釋、聚類、關(guān)聯(lián)及分析,開展基于數(shù)據(jù)關(guān)聯(lián)和可視化的精準(zhǔn)醫(yī)學(xué)知識(shí)利用技術(shù)研究,實(shí)現(xiàn)基于生物醫(yī)學(xué)語(yǔ)義和本體的全文檢索、文本識(shí)別、關(guān)鍵詞分析等功能。從海量的組學(xué)數(shù)據(jù)和臨床數(shù)據(jù)出發(fā),對(duì)生物醫(yī)學(xué)知識(shí)進(jìn)行跨庫(kù)融合,并通過(guò)大數(shù)據(jù)網(wǎng)絡(luò)特征分析技術(shù)、模型特征提取技術(shù)等生物信息學(xué)手段與工具的開發(fā),利用知識(shí)圖譜構(gòu)建與擴(kuò)展技術(shù)的應(yīng)用,構(gòu)建“基因-通路-疾病-癥狀-診療-藥物”的精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜,形成面向精準(zhǔn)醫(yī)學(xué)的疾病相關(guān)生命組學(xué)知識(shí)庫(kù)體系。進(jìn)一步開發(fā)知識(shí)網(wǎng)絡(luò)和知識(shí)圖譜的多維自動(dòng)注釋流程,建立協(xié)同審編平臺(tái),形成精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)。最后,開發(fā)可交互、定制、擴(kuò)展、自動(dòng)更新的工作流技術(shù)體系,在“精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)平臺(tái)”上實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)的檢索、展示、管理與共享,以及面向科研與臨床不同需求的知識(shí)庫(kù)應(yīng)用。匯集大規(guī)模文本挖掘、疾病相關(guān)生命組學(xué)、第三方知識(shí)庫(kù)等證據(jù)源形成的知識(shí),構(gòu)建精準(zhǔn)醫(yī)學(xué)知識(shí)整合模型,實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)知識(shí)的自動(dòng)化注釋,并研究開放式的精準(zhǔn)醫(yī)學(xué)知識(shí)人工審編技術(shù),建成多證據(jù)源整合的疾病相關(guān)精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)體系,開發(fā)檢索與展示功能,搭建精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)管理與共享平臺(tái)。

      3.3 總體框架

      構(gòu)建精準(zhǔn)醫(yī)學(xué)本體和語(yǔ)義網(wǎng)絡(luò),建立精準(zhǔn)醫(yī)學(xué)文本知識(shí)網(wǎng)絡(luò)。 通過(guò)跨庫(kù)融合、大數(shù)據(jù)網(wǎng)絡(luò)特征分析、模型特征抽取等手段,整合多種生物信息數(shù)據(jù),構(gòu)建和擴(kuò)展精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜。整合精準(zhǔn)醫(yī)學(xué)知識(shí)網(wǎng)絡(luò)和知識(shí)圖譜,建立面向文本和組學(xué)數(shù)據(jù)自動(dòng)注釋與融合的流程,基于多維度的證據(jù)進(jìn)行人工審編,形成精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù);對(duì)接“精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)平臺(tái)”,實(shí)現(xiàn)個(gè)性化檢索、展示和自動(dòng)更新,支撐面向精準(zhǔn)醫(yī)學(xué)的知識(shí)服務(wù)。具體研究?jī)?nèi)容分為以下5部分。

      3.3.1 精準(zhǔn)醫(yī)學(xué)本體和語(yǔ)義網(wǎng)絡(luò)構(gòu)建

      借鑒 ICD-10、MeSH、UMLS 等生物醫(yī)學(xué)本體,建成涵蓋組學(xué)、疾病、癥狀、藥物等科技詞表和本體的規(guī)范精準(zhǔn)醫(yī)學(xué)語(yǔ)義關(guān)系,形成標(biāo)準(zhǔn)化、結(jié)構(gòu)化的精準(zhǔn)醫(yī)學(xué)知識(shí)模型。設(shè)計(jì)并建立精準(zhǔn)醫(yī)學(xué)知識(shí)組織框架,集多來(lái)源醫(yī)學(xué)知識(shí)組織系統(tǒng)為一體的建設(shè)方案和技術(shù)路線,開展精準(zhǔn)醫(yī)學(xué)領(lǐng)域術(shù)語(yǔ)采集,實(shí)施精準(zhǔn)醫(yī)學(xué)領(lǐng)域術(shù)語(yǔ)遴選與清洗,對(duì)遴選的精準(zhǔn)醫(yī)學(xué)領(lǐng)域術(shù)語(yǔ)進(jìn)行評(píng)價(jià)并進(jìn)行結(jié)構(gòu)轉(zhuǎn)化。

      開發(fā)精準(zhǔn)醫(yī)學(xué)本體協(xié)同加工系統(tǒng),實(shí)現(xiàn)多來(lái)源的異構(gòu)異型詞表導(dǎo)入與關(guān)聯(lián)、詞表和本體的可視化與交互式編輯,研發(fā)復(fù)雜本體的概念歸并、同義關(guān)系相似度計(jì)算、不同概念間語(yǔ)義相關(guān)度計(jì)算和語(yǔ)義推理工具,為構(gòu)建并維護(hù)疾病相關(guān)組學(xué)本體和語(yǔ)義網(wǎng)絡(luò)提供有效工具。開發(fā)精準(zhǔn)醫(yī)學(xué)本體和語(yǔ)義網(wǎng)絡(luò)共享服務(wù)接口,形成標(biāo)準(zhǔn)化、結(jié)構(gòu)化的精準(zhǔn)醫(yī)學(xué)本體元數(shù)據(jù)集,為知識(shí)庫(kù)建設(shè)提供靈活調(diào)用和模塊式集成方式。

      3.3.2 精準(zhǔn)醫(yī)學(xué)文本挖掘與知識(shí)網(wǎng)絡(luò)構(gòu)建

      開展國(guó)際公開文獻(xiàn)、專利、臨床試驗(yàn)、藥品監(jiān)管等海量多源異構(gòu)文本資源的采集、加工和規(guī)范化研究,建立精準(zhǔn)醫(yī)學(xué)文本資源數(shù)據(jù)庫(kù),實(shí)現(xiàn)全文檢索、關(guān)鍵詞分析和自動(dòng)更新。根據(jù)系統(tǒng)構(gòu)建的精準(zhǔn)醫(yī)學(xué)本體元數(shù)據(jù)集,定義醫(yī)學(xué)文本的實(shí)體識(shí)別與關(guān)聯(lián)抽取標(biāo)注規(guī)范,開展工具標(biāo)注與人工修正研究,構(gòu)建更大規(guī)模、更高質(zhì)量的精準(zhǔn)醫(yī)學(xué)文本訓(xùn)練語(yǔ)料庫(kù)。基于融合詞性信息、生物實(shí)體識(shí)別文本表示,利用海量的未標(biāo)注生物醫(yī)學(xué)文本訓(xùn)練詞向量,自動(dòng)學(xué)習(xí)更抽象更有效的特征,構(gòu)建高性能的實(shí)體識(shí)別模型。

      利用深度學(xué)習(xí)的方法和已建成的精準(zhǔn)醫(yī)學(xué)實(shí)體關(guān)聯(lián)語(yǔ)料庫(kù),采取卷積神經(jīng)網(wǎng)絡(luò)進(jìn)行實(shí)體語(yǔ)義關(guān)聯(lián)抽取。利用相關(guān)性挖掘、高維聚類分析和關(guān)聯(lián)網(wǎng)絡(luò)構(gòu)建技術(shù),實(shí)現(xiàn)面向精準(zhǔn)醫(yī)學(xué)的大規(guī)模文獻(xiàn)整合分析與知識(shí)發(fā)現(xiàn),并應(yīng)用于惡性腫瘤、心腦血管疾病等全疾病譜。

      3.3.3 精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜的構(gòu)建

      通過(guò)收集、組織、整理與疾病發(fā)生、發(fā)展、治療和預(yù)后相關(guān)的基因組學(xué)、轉(zhuǎn)錄組學(xué)、表觀遺傳組學(xué)、蛋白質(zhì)組學(xué)和代謝組學(xué)等多組學(xué)數(shù)據(jù)的國(guó)際生物醫(yī)學(xué)數(shù)據(jù)庫(kù)和來(lái)源于大型臨床機(jī)構(gòu)的臨床數(shù)據(jù),利用跨庫(kù)知識(shí)融合技術(shù),初步構(gòu)建涵蓋“基因-通路-疾病-癥狀-診療-藥物”關(guān)聯(lián)關(guān)系的精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜。開展基于知識(shí)圖譜的自動(dòng)化補(bǔ)全技術(shù),填補(bǔ)知識(shí)關(guān)聯(lián)缺失值,完成精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜的第一層擴(kuò)展。針對(duì)生物醫(yī)學(xué)大數(shù)據(jù)形成的網(wǎng)絡(luò)或模型,開發(fā)生物信息學(xué)算法,利用網(wǎng)絡(luò)特征分析、模型特征提取,預(yù)測(cè)生物醫(yī)學(xué)大數(shù)據(jù)的關(guān)聯(lián)性,完成精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜的第二層擴(kuò)展。開展數(shù)億級(jí)別的海量知識(shí)圖譜查詢和檢索技術(shù)研究,構(gòu)建基于生物信息學(xué)的精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜,發(fā)展生物信息學(xué)通路和注釋知識(shí)體系,對(duì)接搭建的大型開源生物通路數(shù)據(jù)庫(kù)和系統(tǒng)生物學(xué)數(shù)據(jù)分析挖掘平臺(tái)。

      3.3.4 精準(zhǔn)醫(yī)學(xué)知識(shí)自動(dòng)化注釋與人工審編

      開發(fā)面向精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)構(gòu)建的基礎(chǔ)數(shù)據(jù)接口與ETL 工具集,整合大規(guī)模文本挖掘、疾病相關(guān)生命組學(xué)、第三方知識(shí)庫(kù)等來(lái)源的精準(zhǔn)醫(yī)學(xué)知識(shí),研究基因、蛋白、遺傳變異、疾病、表型、藥物等維度的實(shí)體異構(gòu)知識(shí)的數(shù)據(jù)整合模型,研究不同證據(jù)源的精準(zhǔn)醫(yī)學(xué)知識(shí)熱度和質(zhì)量評(píng)價(jià)算法。開發(fā)精準(zhǔn)醫(yī)學(xué)知識(shí)自動(dòng)化注釋軟件,選擇代表性的疾病組織專家進(jìn)行知識(shí)的人工審編,構(gòu)建小規(guī)模、高質(zhì)量的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)。

      開發(fā)開放式的精準(zhǔn)醫(yī)學(xué)社區(qū)平臺(tái),構(gòu)建面向知識(shí)發(fā)現(xiàn)的全疾病譜精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù),建立多證據(jù)源融合的精準(zhǔn)醫(yī)學(xué)知識(shí)數(shù)據(jù)索引,提供基因、蛋白、遺傳變異、疾病、表型和藥物等不同維度的高效檢索和篩選服務(wù),為用戶提供直觀友好和易懂可讀的知識(shí)展示。研發(fā)基于同質(zhì)和異質(zhì)的知識(shí)網(wǎng)絡(luò)的知識(shí)發(fā)現(xiàn)方法,支持文本挖掘、生命組學(xué)和第三方知識(shí)的開放式注釋等證據(jù)源的回溯。

      3.3.5 精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)管理與共享平臺(tái)研發(fā)

      對(duì)接“精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)平臺(tái)”,研發(fā)知識(shí)庫(kù)信息資源管理系統(tǒng),實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)信息資源的管理和分類展示,為各種知識(shí)庫(kù)應(yīng)用提供訪問(wèn)入口。開發(fā)可交互、定制、擴(kuò)展、更新的工作流技術(shù)服務(wù)體系,整合項(xiàng)目產(chǎn)出的知識(shí)庫(kù)工具,實(shí)現(xiàn)科研數(shù)據(jù)的處理、分析以及對(duì)接知識(shí)庫(kù)服務(wù)。以基因、蛋白質(zhì)為核心,研發(fā)基于精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)的通路和網(wǎng)絡(luò)的結(jié)果展示、重要成份標(biāo)注、功能注釋和精細(xì)化作圖等技術(shù)。面向醫(yī)學(xué)基礎(chǔ)研究和臨床實(shí)踐需求,開發(fā)個(gè)性化的知識(shí)推送系統(tǒng)和開放性的知識(shí)庫(kù)應(yīng)用接口(API)服務(wù),覆蓋典型的精準(zhǔn)醫(yī)學(xué)知識(shí)查詢。研究精準(zhǔn)醫(yī)學(xué)知識(shí)臨床轉(zhuǎn)化關(guān)鍵技術(shù),在臨床機(jī)構(gòu)建立典型應(yīng)用示范。

      3.4 關(guān)鍵技術(shù)

      3.4.1 構(gòu)建復(fù)雜生物醫(yī)學(xué)本體集成與標(biāo)準(zhǔn)化的精準(zhǔn)醫(yī)學(xué)知識(shí)模型

      利用Protégé 等本體構(gòu)建工具框架和本體映射技術(shù),集成復(fù)雜生物醫(yī)學(xué)本體對(duì)現(xiàn)有的生物醫(yī)學(xué)領(lǐng)域本體進(jìn)行規(guī)范化,實(shí)現(xiàn)多來(lái)源詞表的統(tǒng)一存儲(chǔ)與關(guān)聯(lián)。面向本體中多類概念以及復(fù)雜語(yǔ)義關(guān)系,采用詞匯級(jí)、短語(yǔ)級(jí)精準(zhǔn)醫(yī)學(xué)詞匯的映射算法,實(shí)現(xiàn)疾病、基因、蛋白質(zhì)、藥物、環(huán)境、通路等術(shù)語(yǔ)的概念歸并。

      標(biāo)準(zhǔn)化的精準(zhǔn)醫(yī)學(xué)知識(shí)模型構(gòu)建則是通過(guò)開發(fā)精準(zhǔn)醫(yī)學(xué)概念、屬性、語(yǔ)義關(guān)系和唯一標(biāo)識(shí)符控制工具,系統(tǒng)構(gòu)建并維護(hù)疾病相關(guān)組學(xué)本體和語(yǔ)義網(wǎng)絡(luò)。借鑒數(shù)據(jù)交換、知識(shí)表示存儲(chǔ)的國(guó)內(nèi)外行業(yè)標(biāo)準(zhǔn),形成標(biāo)準(zhǔn)化、結(jié)構(gòu)化的精準(zhǔn)醫(yī)學(xué)本體元數(shù)據(jù)集,實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)本體和語(yǔ)義網(wǎng)絡(luò)共享和接口調(diào)用。

      3.4.2 構(gòu)建精準(zhǔn)醫(yī)學(xué)文本實(shí)體識(shí)別和語(yǔ)義關(guān)聯(lián)抽取模型

      構(gòu)建生物醫(yī)學(xué)文本實(shí)體識(shí)別模型。針對(duì)傳統(tǒng)詞袋模型存在的維度高、數(shù)據(jù)稀疏、忽略詞序信息等問(wèn)題,提出基于融合詞性信息、生物實(shí)體識(shí)別文本表示,利用海量的未標(biāo)注生物醫(yī)學(xué)文本訓(xùn)練詞向量,學(xué)習(xí)詞語(yǔ)間豐富的內(nèi)部關(guān)聯(lián);利用結(jié)合狀態(tài)轉(zhuǎn)移概率的雙向長(zhǎng)短期記憶LSTM 神經(jīng)網(wǎng)絡(luò),自動(dòng)學(xué)習(xí)更抽象更有效的特征,構(gòu)建高性能的生物醫(yī)學(xué)文本實(shí)體識(shí)別模型。

      構(gòu)建生物醫(yī)學(xué)文本語(yǔ)義關(guān)聯(lián)抽取模型。針對(duì)現(xiàn)有詞向量大都基于線性詞序的上下文關(guān)系,忽略實(shí)體關(guān)系抽取中重要的句法信息的問(wèn)題,提出基于句法詞向量的文本表示方法,將其輸入到卷積神經(jīng)網(wǎng)絡(luò)中,通過(guò)深度學(xué)習(xí)模型學(xué)習(xí)有效的特征,提升實(shí)體關(guān)系抽取的性能。

      3.4.3 構(gòu)建基于生物信息學(xué)的精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜

      精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜的自動(dòng)化補(bǔ)全研究。依據(jù)精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜的子結(jié)構(gòu)特征與相關(guān)生物醫(yī)學(xué)資料的關(guān)系,利用人工和機(jī)器學(xué)習(xí)兩種方法,基于對(duì)應(yīng)模板提取相應(yīng)知識(shí)點(diǎn),自動(dòng)填補(bǔ)知識(shí)關(guān)聯(lián)缺失值,彌補(bǔ)人工構(gòu)建知識(shí)圖譜的局限性。

      基于生物信息學(xué)的生物數(shù)據(jù)關(guān)聯(lián)挖掘研究?;诜诸悺⒒貧w分析、時(shí)間序列分析、聚類、關(guān)聯(lián)分析和序列分析等生物數(shù)據(jù)挖掘方法,尋找生物組學(xué)數(shù)據(jù)與臨床診斷、疾病分型、預(yù)后分析、藥物開發(fā)等醫(yī)學(xué)研究與實(shí)踐的關(guān)聯(lián)關(guān)系,并將以上關(guān)系以特殊標(biāo)記屬性值的形式補(bǔ)充在精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜中。

      構(gòu)建基于生物信息學(xué)的精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜。針對(duì)生物醫(yī)學(xué)概念識(shí)別的異構(gòu)特征,如類別相似度、語(yǔ)義相似度和圖結(jié)構(gòu)相似度,歸并分散的知識(shí),增強(qiáng)對(duì)生物醫(yī)學(xué)概念的多層面理解。通過(guò)知識(shí)的跨庫(kù)融合實(shí)現(xiàn)從單純的知識(shí)庫(kù)整合到知識(shí)圖譜網(wǎng)絡(luò)構(gòu)建的跳躍。

      3.4.4 構(gòu)建精準(zhǔn)醫(yī)學(xué)知識(shí)自動(dòng)化注釋與人工審編

      多證據(jù)源的知識(shí)整合技術(shù)。精準(zhǔn)醫(yī)學(xué)知識(shí)來(lái)源多樣,既有來(lái)自采用大規(guī)模自動(dòng)挖掘得到的基于文本的知識(shí)和基于疾病相關(guān)生命組學(xué)數(shù)據(jù)挖掘得到的知識(shí),也有來(lái)自第三方的經(jīng)過(guò)審編的知識(shí)。不同來(lái)源的知識(shí)可能存在沖突,需要對(duì)證據(jù)源進(jìn)行有效的整合。

      建立開放式的精準(zhǔn)醫(yī)學(xué)知識(shí)審編社區(qū)。精準(zhǔn)醫(yī)學(xué)知識(shí)可以按照基因、蛋白、疾病等實(shí)體來(lái)組織,也可以按照文本資源來(lái)組織。2個(gè)角度的組織方式都支持對(duì)知識(shí)的評(píng)價(jià)和糾錯(cuò)機(jī)制,引導(dǎo)外部志愿者改進(jìn)知識(shí)質(zhì)量。

      精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)檢索與展示技術(shù)。采用MongoDB 的NoSQL 技術(shù),將不同證據(jù)源的知識(shí)模型優(yōu)化為簡(jiǎn)單的以鍵值對(duì)為核心的分布式結(jié)構(gòu),并引入高效的非結(jié)構(gòu)化文本資源的搜索引擎Solr,提高數(shù)據(jù)檢索性能和擴(kuò)充性能,滿足知識(shí)庫(kù)檢索和展示的需求。

      3.4.5 構(gòu)建精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)的管理與共享系統(tǒng)

      精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)管理共享平臺(tái)基礎(chǔ)架構(gòu)?;陂_源Galaxy 框架進(jìn)行二次開發(fā)構(gòu)建工作流體系,通過(guò)自動(dòng)化數(shù)據(jù)處理和人機(jī)交互數(shù)據(jù)處理方式實(shí)現(xiàn)數(shù)據(jù)庫(kù)更新。

      精準(zhǔn)醫(yī)學(xué)知識(shí)分析和精細(xì)作圖體系構(gòu)建。借鑒Reactome 等在知識(shí)分析和精細(xì)作圖體系方面的優(yōu)勢(shì),對(duì)標(biāo)GeneGo/IPA,搭建對(duì)通路信息進(jìn)行分析和可視化的工作平臺(tái)。

      精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)推送和應(yīng)用接口(API)的開發(fā)和應(yīng)用示范。針對(duì)典型精準(zhǔn)醫(yī)學(xué)知識(shí)需求,利用WebService 開發(fā)以JSON/XML 等標(biāo)準(zhǔn)發(fā)布數(shù)據(jù)的應(yīng)用接口(API),并基于此建立個(gè)性化、智能化的知識(shí)訂閱和自動(dòng)推送機(jī)制,支撐精準(zhǔn)醫(yī)學(xué)臨床決策支持并開展精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)臨床評(píng)測(cè)。

      3.5 實(shí)現(xiàn)功能

      本項(xiàng)目預(yù)期建成面向疾病研究的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)體系。該體系具有標(biāo)準(zhǔn)規(guī)范、開放共享、用戶友好、動(dòng)態(tài)更新等特點(diǎn),并可作為國(guó)家標(biāo)準(zhǔn)來(lái)促進(jìn)疾病精準(zhǔn)醫(yī)學(xué)研究成果的知識(shí)管理。在此過(guò)程中,將取得 “一個(gè)標(biāo)準(zhǔn)”“一個(gè)庫(kù)”“一個(gè)平臺(tái)”3大成果。

      3.5.1 精準(zhǔn)醫(yī)學(xué)本體和語(yǔ)義表示標(biāo)準(zhǔn)

      參照國(guó)際上通用的ICD-10 分類法及UMLS、MeSH 等生物醫(yī)學(xué)主題詞表和本體,建成涵蓋組學(xué)、疾病、癥狀、藥物等的科技詞表和本體,構(gòu)建精準(zhǔn)醫(yī)學(xué)語(yǔ)義網(wǎng)絡(luò)和知識(shí)模型,形成標(biāo)準(zhǔn)規(guī)范、系統(tǒng)全面的精準(zhǔn)醫(yī)學(xué)本體和語(yǔ)義網(wǎng)絡(luò)標(biāo)準(zhǔn)。

      3.5.2 精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)

      根據(jù)系統(tǒng)構(gòu)建的本體和語(yǔ)義網(wǎng)絡(luò),針對(duì)海量的多源異構(gòu)文本和生物信息數(shù)據(jù),利用自然語(yǔ)言處理、深層索引、相關(guān)性挖掘等技術(shù)進(jìn)行數(shù)據(jù)整合、關(guān)聯(lián)抽取,形成“精準(zhǔn)醫(yī)學(xué)文本知識(shí)網(wǎng)絡(luò)”和“基于生物信息學(xué)的精準(zhǔn)醫(yī)學(xué)知識(shí)圖譜”。通過(guò)自動(dòng)注釋和審編,并結(jié)合重要性標(biāo)注和新穎性分析,實(shí)現(xiàn)文本與組學(xué)數(shù)據(jù)的融合和知識(shí)發(fā)現(xiàn),最終形成涵蓋多證據(jù)源的,面向惡性腫瘤、代謝系統(tǒng)疾病、呼吸系統(tǒng)疾病、心腦血管疾病、免疫性疾病、神經(jīng)精神類疾病等疾病的,覆蓋科學(xué)研究和臨床應(yīng)用等需求的,可實(shí)現(xiàn)證據(jù)分級(jí)與回溯功能的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)。

      3.5.3 精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)管理與共享平臺(tái)

      該平臺(tái)將以網(wǎng)站的形式呈現(xiàn),支持面向精準(zhǔn)醫(yī)學(xué)知識(shí)發(fā)現(xiàn)的檢索、展示和分析功能(對(duì)標(biāo)GeneGO 和IPA),提供不少于20個(gè)用于知識(shí)抽提、文本挖掘、信息展示和精細(xì)作圖等的軟件工作流技術(shù)服務(wù)體系,支持面向用戶定制的知識(shí)推送,提供面向科研和臨床等多種場(chǎng)景的應(yīng)用接口。本平臺(tái)將部署在“精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)平臺(tái)”的服務(wù)器和云端,穩(wěn)定支持1000人以上并發(fā)使用,且具有自動(dòng)更新功能。本平臺(tái)將通過(guò)“精準(zhǔn)醫(yī)學(xué)大數(shù)據(jù)平臺(tái)”向本專項(xiàng)所有項(xiàng)目推廣、開放、共享。

      4 PMapp精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)介紹

      精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)(Precision Medicine knowledgebase application,PMapp)以知識(shí)地圖的形式全面整合了45個(gè)數(shù)據(jù)庫(kù)(圖1),其主要框架包括基因及其產(chǎn)物、生物信號(hào)通路和分子網(wǎng)絡(luò)、致病變異以及藥物4個(gè)部分(圖2)。

      在第一部分中,PMapp收存了20 656個(gè)編碼人類基因和38 943個(gè)非編碼人類基因,178 562個(gè)RNA以及111 716個(gè)蛋白質(zhì)。這些基因及其代謝產(chǎn)物構(gòu)成了PMapp實(shí)體存儲(chǔ)庫(kù)的主要部分。至2017年底,第二部分已經(jīng)集成21個(gè)信號(hào)通路/網(wǎng)絡(luò)數(shù)據(jù)庫(kù),其中包含13個(gè)主要相互作用類別、22種生物效應(yīng)、28種修飾和1個(gè)實(shí)驗(yàn)注釋。

      整個(gè)常規(guī)通路和網(wǎng)絡(luò)總共涵蓋31 264個(gè)生物實(shí)體(節(jié)點(diǎn))和1 804 000個(gè)相機(jī)作用(邊),包含13種不同的作用關(guān)系(表1)。致病變異方面,PMapp收集了5 738 719種致病變異,源自18 022個(gè)基因,對(duì)應(yīng)10 725種疾病。

      除此之外,9 746種藥物和其對(duì)應(yīng)的78 664個(gè)靶標(biāo)的信息也被收錄在PMapp中,包含561 180個(gè)藥物-藥物,1 191個(gè)藥物-食物,5 118個(gè)藥物-酶,以及1 839種藥物-轉(zhuǎn)運(yùn)體等相互作用。PMapp在本體方面實(shí)施面向精準(zhǔn)醫(yī)學(xué)的重大疾病本體體系結(jié)構(gòu)、知識(shí)表示模型和精準(zhǔn)醫(yī)學(xué)術(shù)語(yǔ)庫(kù)的構(gòu)建。精準(zhǔn)醫(yī)學(xué)詞匯規(guī)模達(dá)到300萬(wàn),整合了57部生物醫(yī)學(xué)領(lǐng)域詞表、術(shù)語(yǔ)3 879 621個(gè)、概念1 052 512個(gè)。完成精準(zhǔn)醫(yī)學(xué)本體的語(yǔ)義概念映射,精準(zhǔn)醫(yī)學(xué)本體覆蓋2個(gè)重大疾病領(lǐng)域,本體之間的語(yǔ)義關(guān)系包含疾病-基因-藥物。完成精準(zhǔn)醫(yī)學(xué)本體構(gòu)建,精準(zhǔn)醫(yī)學(xué)本體包括類57 746個(gè)、語(yǔ)義關(guān)系92 個(gè),涵蓋人類表型、疾病、化學(xué)物質(zhì)與藥物、細(xì)胞機(jī)制、分子機(jī)制、遺傳機(jī)制6大醫(yī)學(xué)領(lǐng)域,完成2~3個(gè)重大疾病精準(zhǔn)醫(yī)學(xué)本體建設(shè)。

      圖1 PMapp完成54個(gè)不同領(lǐng)域的數(shù)據(jù)庫(kù)數(shù)據(jù)收集和整理

      圖2 精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)的主要框架

      Pathway TypeEdge TypeDirectionalityEdge No.Signaling PathwaySR: Signaling RegulationDirected172 765ER: Expression RegulationDirected122 786CAI: Complex Assembly InteractionUndirected177 227TR: Transport RegulationDirected7 296TRc: Transport Regulation chemicalDirected3 285ca: x chemical affects PDirected469 519RNAi: RNA interferenceDirected317 556TechPPITechPPI: Technical Protein-Protein InteractionUndirected316 437Metabolic Pathwaysp: metabolic reaction sE→pF→Directed14 428sE: metabolic reaction sE→pF→Directed22 480Ep: metabolic reaction sE→pF→Directed21 334EE: metabolic reaction sE→pF→Directed154 975rw: x reacts with yUndirected3 912

      目前PMapp網(wǎng)站集成了項(xiàng)目產(chǎn)出的本體和術(shù)語(yǔ)資源以及數(shù)據(jù)庫(kù)資源,搭建了精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)檢索網(wǎng)站,可以檢索基因、藥物等主要精準(zhǔn)醫(yī)學(xué)概念。在基因展示頁(yè)面中,對(duì)基因基本信息、GO 注釋信息、蛋白質(zhì)結(jié)構(gòu)、蛋白質(zhì)相互作用、關(guān)聯(lián)藥物、關(guān)聯(lián)疾病等分別做了顯示。因此, PMapp是面向科學(xué)研究的,可以進(jìn)行通路/網(wǎng)絡(luò)精細(xì)做圖、通路分析和智能檢索的系統(tǒng)。

      此外,PMapp將無(wú)縫銜接本體富集分析等已有的分析工具,對(duì)標(biāo)IPA基本的工作流分析體系,可以實(shí)現(xiàn)對(duì)組學(xué)數(shù)據(jù)的差異基因分析,并給出火山圖等圖表;也會(huì)在系統(tǒng)中整合基因本體、通路本體、疾病本體、Mesh 本體 以及本項(xiàng)目產(chǎn)出的綜合本體等資源數(shù)據(jù),對(duì)數(shù)據(jù)進(jìn)行本體注釋及富集分析,并提供可呈現(xiàn)上下層級(jí)關(guān)系的本體樹圖形及表格多樣化的結(jié)果展示。

      針對(duì)用戶關(guān)注或感興趣的組學(xué)數(shù)據(jù)或基因列表,本系統(tǒng)可為用戶提供一系列的注釋信息,比如本體、分子網(wǎng)絡(luò)等。將要實(shí)現(xiàn)的本體表格和DAG樹狀結(jié)構(gòu)的展示以及分析功能,對(duì)標(biāo)IPA/GeneGO 的精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)通路分析展示系統(tǒng)的通路展示和分析。通過(guò)搜索頁(yè)面找到需要的通路,然后通過(guò)網(wǎng)絡(luò)展示頁(yè)面顯示通路分子成份之間的關(guān)系,也可以對(duì)網(wǎng)絡(luò)進(jìn)行編輯和聚類分析等。

      在這個(gè)過(guò)程中,項(xiàng)目團(tuán)隊(duì)首先針對(duì)精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)如PharmGKB 提供了一種新的知識(shí)查詢服務(wù)。目前最大的問(wèn)題是現(xiàn)有的標(biāo)準(zhǔn)化知識(shí)訪問(wèn)協(xié)議通常都是基于標(biāo)準(zhǔn)術(shù)語(yǔ)系統(tǒng)和編碼來(lái)檢索的,而目前臨床數(shù)據(jù)通常不太具備這樣的數(shù)據(jù)質(zhì)量。后續(xù)需要改進(jìn)中文術(shù)語(yǔ)的標(biāo)準(zhǔn)化編碼查詢服務(wù),以滿足知識(shí)精準(zhǔn)查詢的需求,實(shí)現(xiàn)PMapp雙重角色,即為針對(duì)健康和疾病人群的精準(zhǔn)醫(yī)學(xué)研究和臨床應(yīng)用提供多層次支撐。

      5 精準(zhǔn)醫(yī)學(xué)知識(shí)庫(kù)展望

      實(shí)現(xiàn)精準(zhǔn)醫(yī)學(xué)的核心,是結(jié)合多維度的臨床、影像和多組學(xué)數(shù)據(jù),利用深度學(xué)習(xí)、自然語(yǔ)言處理、多組學(xué)整合分析等方法,研發(fā)面向疾病風(fēng)險(xiǎn)預(yù)測(cè)、早期診斷、精準(zhǔn)治療、療效評(píng)估和預(yù)后監(jiān)控的精準(zhǔn)醫(yī)療臨床決策支持系統(tǒng),為精準(zhǔn)醫(yī)學(xué)臨床應(yīng)用轉(zhuǎn)化提供有效途徑,從而實(shí)現(xiàn)疾病精準(zhǔn)預(yù)防、精準(zhǔn)檢測(cè)和精準(zhǔn)診療的目標(biāo)。

      通過(guò)知識(shí)庫(kù)的構(gòu)建和完善,完成多學(xué)科協(xié)作、貫通診療全過(guò)程的精準(zhǔn)醫(yī)療臨床決策支持系統(tǒng)。該系統(tǒng)具備多模態(tài)信息融合、影像組學(xué)聯(lián)合分析、深度學(xué)習(xí)決策模型集成、多尺度決策硬件加速和多環(huán)節(jié)全景式分析等能力,可實(shí)現(xiàn)覆蓋多學(xué)科及完整就醫(yī)閉環(huán)流程的精準(zhǔn)醫(yī)療輔助決策,依托大型綜合性醫(yī)院驗(yàn)證推廣,將明顯提高惡性腫瘤、代謝系統(tǒng)疾病、呼吸系統(tǒng)疾病、心腦血管疾病、免疫性疾病、神經(jīng)精神類疾病和罕見疾病等重大疾病的醫(yī)療水平和防治效益。

      猜你喜歡
      醫(yī)學(xué)知識(shí)生物醫(yī)學(xué)知識(shí)庫(kù)
      芻議“生物醫(yī)學(xué)作為文化”的研究進(jìn)路——兼論《作為文化的生物醫(yī)學(xué)》
      靈長(zhǎng)類生物醫(yī)學(xué)前沿探索中的倫理思考
      基于TRIZ與知識(shí)庫(kù)的創(chuàng)新模型構(gòu)建及在注塑機(jī)設(shè)計(jì)中的應(yīng)用
      國(guó)外生物醫(yī)學(xué)文獻(xiàn)獲取的技術(shù)工具:述評(píng)與啟示
      思維導(dǎo)圖在醫(yī)學(xué)中的應(yīng)用
      加強(qiáng)班級(jí)凝聚力建設(shè),激發(fā)學(xué)生學(xué)習(xí)的積極性
      高速公路信息系統(tǒng)維護(hù)知識(shí)庫(kù)的建立和應(yīng)用
      LED光源在生物醫(yī)學(xué)中的應(yīng)用分析
      新環(huán)境下《解剖學(xué)》教學(xué)資源開發(fā)探討分析
      基于Drupal發(fā)布學(xué)者知識(shí)庫(kù)關(guān)聯(lián)數(shù)據(jù)的研究
      圖書館研究(2015年5期)2015-12-07 04:05:48
      门源| 盖州市| 司法| 白城市| 库尔勒市| 咸宁市| 新巴尔虎左旗| 吴桥县| 昌平区| 乌审旗| 岱山县| 游戏| 迁西县| 新河县| 平湖市| 铜梁县| 临安市| 辽宁省| 铜川市| 昭觉县| 桐梓县| 石渠县| 治县。| 务川| 遵义市| 元氏县| 工布江达县| 德格县| 郯城县| 右玉县| 安康市| 漳浦县| 临城县| 云梦县| 平谷区| 集安市| 东莞市| 乐亭县| 奉贤区| 梅州市| 精河县|