• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于語義表達(dá)的中藥概念數(shù)據(jù)模型構(gòu)建

      2017-04-22 03:49:56劉麗紅
      世界中醫(yī)藥 2017年4期
      關(guān)鍵詞:數(shù)據(jù)模型本體語義

      劉麗紅 朱 彥

      (中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京,100700)

      基于語義表達(dá)的中藥概念數(shù)據(jù)模型構(gòu)建

      劉麗紅 朱 彥

      (中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所,北京,100700)

      目的:中藥領(lǐng)域大量內(nèi)容豐富、異質(zhì)異構(gòu)數(shù)據(jù)為領(lǐng)域信息交換與共享帶來困難。建立基于語義表達(dá)的中藥數(shù)據(jù)模型,一方面,能在語義層面上提供知識(shí)共享與重用;另一方面,能促進(jìn)數(shù)據(jù)資源的集成、交換和應(yīng)用的互操作。方法:采用本體與底層數(shù)據(jù)相結(jié)合的方法,基于現(xiàn)有本體中國中醫(yī)藥學(xué)語言系統(tǒng)(Traditional Chinese Medicine Language System,TCMLS),參照已有概念數(shù)據(jù)模型,結(jié)合基于基礎(chǔ)數(shù)據(jù)進(jìn)行概念抽取構(gòu)建中藥概念數(shù)據(jù)模型。結(jié)果:基于中醫(yī)藥一體化數(shù)據(jù)模型(Traditional Chinese Medicine Integrated Model,TCMIM)框架,分析目前中藥領(lǐng)域數(shù)據(jù)資源,抽取中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念,構(gòu)建中藥概念數(shù)據(jù)模型框架。結(jié)論:運(yùn)用本體與數(shù)據(jù)相結(jié)合的方法,在概念層面建立中藥數(shù)據(jù)模型,在數(shù)據(jù)層面有利于數(shù)據(jù)建模的準(zhǔn)確性,促進(jìn)信息資源的集成與交換;在語義層面上有利于豐富補(bǔ)充領(lǐng)域本體。

      中藥;概念數(shù)據(jù)模型;語義表達(dá)

      1 概述

      數(shù)據(jù)模型分概念層、邏輯層、物理層的3層架構(gòu)。概念數(shù)據(jù)模型(Conceptual Data Model)描述計(jì)算機(jī)系統(tǒng)將要處理的問題領(lǐng)域中的事物,它本身常常采用實(shí)體聯(lián)系模型(E-R Model)。概念/語義數(shù)據(jù)模型可以被看作是“語義模型”或“信息模型”,它與“本體”基本上處于同樣的相對(duì)位置。這些模型都可以從本體研究那里找到重疊或借鑒的東西[1](如圖1)。

      本體自20世紀(jì)90年代引入計(jì)算機(jī)人工智能領(lǐng)域,目前主要有兩層含義:一是哲學(xué)領(lǐng)域的存在,是本體論的研究對(duì)象;二是延伸到特定領(lǐng)域之中,指某套概念及其相互之間關(guān)系的形式化表達(dá),包括概念化、規(guī)范化、形式化和共享4個(gè)特征[2]。信息科學(xué)中的本體論的目標(biāo)是確定領(lǐng)域內(nèi)共同認(rèn)可的詞匯,并從不同層次的形式化模型上給出這些詞匯和詞匯間相互關(guān)系的明確定義,從而獲取相關(guān)領(lǐng)域的知識(shí),提供對(duì)該領(lǐng)域知識(shí)的共同理解[3]。謝琪等提出應(yīng)用領(lǐng)域本體方法建立中醫(yī)概念信息模型的思路與構(gòu)想,解決中醫(yī)藥領(lǐng)域頂層設(shè)計(jì)理論指導(dǎo)不足的問題,是從頂層設(shè)計(jì)本體,發(fā)現(xiàn)語義關(guān)系,構(gòu)建中醫(yī)藥概念信息模型。郭磊[4]根據(jù)方證相關(guān)性構(gòu)建中醫(yī)藥關(guān)系型數(shù)據(jù)庫中數(shù)據(jù)概念模型,張麗穎[5]等基于本體建立醫(yī)學(xué)科研信息模型,提出本體建模的依據(jù)與方式方法。李明[6]等采用本體方法,探討中醫(yī)證候本體表達(dá)模式的構(gòu)建方法及其在語義檢索、智能診斷、數(shù)據(jù)分析等方面的應(yīng)用。周揚(yáng)[7]等提出了構(gòu)建中藥本體的思路,期望全面描述中藥本質(zhì),揭示中藥本身及中藥間復(fù)雜的功效與物質(zhì)關(guān)系,澄清中藥的知識(shí)結(jié)構(gòu)。婁苗苗[8]等提出基于領(lǐng)域信息構(gòu)建國家衛(wèi)生信息概念數(shù)據(jù)模型的方法,目的是為元數(shù)據(jù)項(xiàng)目開發(fā)和管理提供一致、透明的語義背景。

      圖1 各模型與本體關(guān)系圖

      在一些行業(yè)領(lǐng)域,對(duì)于數(shù)據(jù)模型的研究較為成熟的如交通地理信息領(lǐng)域,其系統(tǒng)的交通地理信息系統(tǒng)數(shù)據(jù)模型[9]基于應(yīng)用出發(fā),從傳統(tǒng)數(shù)據(jù)模型、線性定位參照體系、導(dǎo)航數(shù)據(jù)模型至GIS一T時(shí)空數(shù)據(jù)模型,用來表達(dá)地理信息系統(tǒng)中數(shù)據(jù)之間的聯(lián)系與邏輯組織形式,滿足交通地理信息系統(tǒng)導(dǎo)航需要、多維化與時(shí)態(tài)化。在石油工業(yè)領(lǐng)域,熊方平等[10]以實(shí)體為主線,將各專業(yè)數(shù)據(jù)有機(jī)、完整結(jié)合,形成一體化勘探開發(fā)數(shù)據(jù)庫,滿足各個(gè)層面應(yīng)用研究需求的跨專業(yè)勘探開發(fā)一體化數(shù)據(jù)模型EPDM。這些數(shù)據(jù)模型成熟且完善,覆蓋了該行業(yè)各個(gè)業(yè)務(wù)領(lǐng)域過程環(huán)節(jié)數(shù)據(jù),方便一體化管理,為跨專業(yè)的綜合研究提供了基礎(chǔ)。國內(nèi)對(duì)于信息交換研究進(jìn)行了一些探索,張玉海[11]等對(duì)國家衛(wèi)生信息概念數(shù)據(jù)模型與HL7RIM之間進(jìn)行了映射關(guān)系的對(duì)照,確定了它們之間的關(guān)系,檢驗(yàn)概念數(shù)據(jù)模型的范圍。唐忠[12]分析軍用電子設(shè)備試驗(yàn)數(shù)據(jù),研究設(shè)計(jì)了試驗(yàn)數(shù)據(jù)庫概念模型,采用時(shí)間、設(shè)備和試驗(yàn)題三維關(guān)聯(lián)數(shù)據(jù)模型,滿足試驗(yàn)數(shù)據(jù)庫管理系統(tǒng)應(yīng)用需求。

      在中醫(yī)藥領(lǐng)域,數(shù)據(jù)模型研究基本處于探索階段,還未見系統(tǒng)完整的概念數(shù)據(jù)模型,語義web技術(shù)得到了一些應(yīng)用[13]。目前,由于沒有統(tǒng)一語義的數(shù)據(jù)模型標(biāo)準(zhǔn),沒有參照,重復(fù)建設(shè),低質(zhì)量的數(shù)據(jù)模型直接影響應(yīng)用系統(tǒng)的質(zhì)量,更談不上應(yīng)用互操作,阻礙了信息資源的的集成、交換。

      中藥概念數(shù)據(jù)模型屬數(shù)據(jù)模型范疇,一方面通過梳理中藥知識(shí)體系,分析中藥類數(shù)據(jù)資源,基于基礎(chǔ)數(shù)據(jù)進(jìn)行中藥概念信息抽取,另一方面利用中醫(yī)藥領(lǐng)域內(nèi)本體及現(xiàn)有模型指導(dǎo)約束概念及概念間關(guān)系的確定。利用本體與數(shù)據(jù)結(jié)合構(gòu)建概念數(shù)據(jù)模型,明確概念含義,理清概念間關(guān)系,有利于數(shù)據(jù)建模的準(zhǔn)確性,促進(jìn)信息資源的集成與交換;在語義層面上有利于補(bǔ)充領(lǐng)域本體。

      2 研究方法與步驟

      2.1 中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念特征分析

      2.1.1 中藥業(yè)務(wù)領(lǐng)域數(shù)據(jù)資源分析 中藥概念數(shù)據(jù)模型中的概念來源主要基于中藥領(lǐng)域數(shù)據(jù)資源進(jìn)行抽取。中藥領(lǐng)域數(shù)據(jù)來源需根據(jù)概念數(shù)據(jù)模型構(gòu)建需求設(shè)定。

      一方面,中藥領(lǐng)域核心概念來源要考慮反映中藥核心知識(shí)體系,需分析中藥領(lǐng)域權(quán)威辭典、工具書、教材,如《中華人民共和國藥典》《中華本草》《中藥大辭典》《中藥學(xué)》《臨床中藥學(xué)》等;另一方面,中藥概念數(shù)據(jù)模型是針對(duì)數(shù)據(jù)構(gòu)建的模型,要考慮反映中藥領(lǐng)域數(shù)據(jù)庫信息特點(diǎn)。

      中國中醫(yī)科學(xué)院中醫(yī)藥信息研究所的中藥相關(guān)數(shù)據(jù)庫包括中國中藥數(shù)據(jù)庫、中藥科技基礎(chǔ)信息數(shù)據(jù)庫、中藥藥理實(shí)驗(yàn)數(shù)據(jù)庫、中藥化學(xué)實(shí)驗(yàn)數(shù)據(jù)庫、中藥化學(xué)成分?jǐn)?shù)據(jù)庫、中國方劑數(shù)據(jù)庫等;相關(guān)數(shù)據(jù)庫包括中醫(yī)臨床疾病數(shù)據(jù)庫、中醫(yī)醫(yī)案數(shù)據(jù)庫、有毒中藥數(shù)據(jù)庫等。另外,中國科學(xué)院的中國中草藥數(shù)據(jù)庫、中藥有效成分?jǐn)?shù)據(jù)庫、中藥基本信息數(shù)據(jù)庫、中國中成藥數(shù)據(jù)庫、中國英文中藥數(shù)據(jù)庫,上海中醫(yī)中藥數(shù)據(jù)中心的SIRC/TCM中醫(yī)藥信息系統(tǒng),中國科學(xué)院武漢植物園的神農(nóng)架藥用植物數(shù)據(jù)庫與華中藥用植物數(shù)據(jù)庫,復(fù)旦大學(xué)生物多樣性科學(xué)研究所的上海市藥用植物數(shù)據(jù)庫查詢系統(tǒng)等。通過分析這些數(shù)據(jù)庫系統(tǒng)的數(shù)據(jù)集與核心數(shù)據(jù)元,利用權(quán)威辭典對(duì)數(shù)據(jù)元進(jìn)行規(guī)范抽取,可以作為中藥核心概念的可靠來源。

      圖2 中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念

      2.1.2 中藥相關(guān)業(yè)務(wù)領(lǐng)域范圍設(shè)定 TCMIDM的構(gòu)建研究提出了數(shù)據(jù)模型集成框架[14]。基于此集

      表1 中藥類數(shù)據(jù)元

      圖3 中藥核心概念示例

      成框架,中藥概念數(shù)據(jù)模型包含中藥及相關(guān)業(yè)務(wù)領(lǐng)域術(shù)語資源、數(shù)據(jù)資源、信息系統(tǒng)等方面概念的抽取,進(jìn)行中藥概念數(shù)據(jù)模型構(gòu)建,以中藥為核心進(jìn)行相關(guān)業(yè)務(wù)領(lǐng)域數(shù)據(jù)資源概念抽取如圖2。

      2.2 中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念及概念間相互關(guān)系 楊喆[15]等基于國家衛(wèi)生信息概念數(shù)據(jù)模型為基礎(chǔ),提煉和描述衛(wèi)生領(lǐng)域數(shù)據(jù)元,表達(dá)數(shù)據(jù)元及其語義關(guān)聯(lián)。該方法與中藥概念數(shù)據(jù)模型中基礎(chǔ)概念抽取一致。在中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念抽取中,以中藥知識(shí)體系為核心概念體系,相關(guān)業(yè)務(wù)領(lǐng)域概念為補(bǔ)充完善。前期研究[16]對(duì)中藥知識(shí)資源體系進(jìn)行了比較,結(jié)合“中醫(yī)藥數(shù)據(jù)元標(biāo)準(zhǔn)研究”中藥類數(shù)據(jù)源[17],進(jìn)行中藥類數(shù)據(jù)元整理修訂,結(jié)果如表1?;跀?shù)據(jù)元進(jìn)行核心概念的抽取與描述,示例如圖3。

      在進(jìn)行中藥概念數(shù)據(jù)涉及的業(yè)務(wù)領(lǐng)域分析研究中,需結(jié)合調(diào)研咨詢、業(yè)務(wù)梳理、專家討論等,辨析中藥及相關(guān)業(yè)務(wù)域概念含義及其在理論中的地位、性質(zhì)、作用,確定核心概念、非核心概念,比較概念含義及其重要性,確定核心概念、非核心概念,對(duì)中藥領(lǐng)域概念與相關(guān)業(yè)務(wù)領(lǐng)域概念進(jìn)行梳理。

      2.3 中藥概念數(shù)據(jù)模型構(gòu)建 參考中藥工具書、教材、相關(guān)專著及中藥規(guī)范數(shù)據(jù)元研究成果,根據(jù)其含義及其在理論中的地位、性質(zhì)、作用,確定核心概念、非核心概念,對(duì)核心概念與非核心概念之間的層次、類屬、邏輯關(guān)系等進(jìn)行深入辨析,確定其相互關(guān)系;結(jié)合中藥相關(guān)業(yè)務(wù)領(lǐng)域,分析中藥域與其他域之間的關(guān)系,進(jìn)行中藥概念及關(guān)系的考量。以本體論方法為指導(dǎo),全面分析提取概念間的語義關(guān)系,以TCMLS的56種語義關(guān)系為參照,結(jié)合其語義關(guān)系適用情況,進(jìn)行適當(dāng)?shù)脑鰟h調(diào)整,梳理中藥概念間的語義關(guān)系,基于統(tǒng)一語義表達(dá),構(gòu)建中藥概念數(shù)據(jù)模型。

      中藥概念數(shù)據(jù)模型的建立,一方面希望可以作為數(shù)據(jù)物理模型的上層,指導(dǎo)數(shù)據(jù)庫規(guī)范建設(shè),方便數(shù)據(jù)交換與共享,另一方面作為領(lǐng)域概念信息的抽取,可以豐富和補(bǔ)充TCMLS,完善中醫(yī)藥領(lǐng)域頂層本體建設(shè)。

      3 結(jié)語

      運(yùn)用本體與數(shù)據(jù)相結(jié)合的方法,基于基礎(chǔ)數(shù)據(jù)進(jìn)行中藥及相關(guān)業(yè)務(wù)領(lǐng)域概念及概念間抽取,概念及概念間關(guān)系的確定需結(jié)合利用領(lǐng)域本體TCMLS,重用概念及概念間關(guān)系,兼顧HL7 RIM模型,建立概念間關(guān)系,在概念層面建立中藥數(shù)據(jù)模型。這種構(gòu)建概念數(shù)據(jù)模型的模式,概念來源于基礎(chǔ)數(shù)據(jù),能夠反映數(shù)據(jù)結(jié)構(gòu)特點(diǎn),利用語義表達(dá)概念間關(guān)系,可在語義層面上提供知識(shí)共享與重用,為中藥本體的構(gòu)建提供來源。

      概念數(shù)據(jù)模型一方面要有較強(qiáng)的表達(dá)能力,另一方面也需要簡單、清晰,易于理解。在實(shí)際應(yīng)用過程中,必須進(jìn)一步轉(zhuǎn)換成為邏輯數(shù)據(jù)模型、物理數(shù)據(jù)模型,才能在具體數(shù)據(jù)庫中實(shí)現(xiàn)[18]。

      [1]余彤鷹.札記:本體及數(shù)據(jù)、信息、領(lǐng)域、企業(yè)建模與模型.http://www.ee-forum.org/wp/pub/ty/2011-02-p2491.html,2016-06-07.

      [2]Studer Rudi,Richard Benjamins,Dieter Fensel.Knowledge engineering:principles and methods[J].Data and Knowledge Engineering,1998,25(1/2):161-197.

      [3]蘇里,朱慶偉,陳宜金,等.基于地理本體的空間數(shù)據(jù)庫概念建模[J].計(jì)算機(jī)工程,2007,33(12):87-89.

      [4]郭磊.根據(jù)方證相關(guān)理論構(gòu)建中醫(yī)藥關(guān)系型數(shù)據(jù)庫概念模型探討[J].山西中醫(yī),2009,25(3):60-61.

      [5]張麗穎,馬鳴華,金巖.基于本體的醫(yī)學(xué)科研信息模型的建立與分析[J].中華中醫(yī)藥學(xué)刊,2013,31(10):2259-2261.

      [6]李明,張昌林,包漢飛,等.中醫(yī)證候本體表達(dá)模式的構(gòu)建與應(yīng)用研究[J].上海中醫(yī)藥雜志,2013,4(1):7-11.

      [7]周揚(yáng),王振國.中藥Ontology概念關(guān)系體系的構(gòu)建探析[J].中國中醫(yī)藥信息雜志,2009,16(3):96-97.

      [8]婁苗苗,楊喆,劉丹紅,等.基于領(lǐng)域信息的衛(wèi)生信息概念數(shù)據(jù)模型構(gòu)建方法[J].中國數(shù)字醫(yī)學(xué),2015,10(1):74-77.

      [9]石建軍,許國華,何民,等.交通地理信息系統(tǒng)數(shù)據(jù)模型的研究進(jìn)展[J].北京工業(yè)大學(xué)學(xué)報(bào),2004,30(3):311-322.

      [10]熊方平,馬進(jìn)山,陳新燕,等.中國石油一體化勘探開發(fā)數(shù)據(jù)模型研究與實(shí)踐[J].信息技術(shù)與信息化,2011,(3):49-55,60.

      [11]張玉海,徐勇勇,劉丹紅,等.國家衛(wèi)生信息概念數(shù)據(jù)模型與HL7RIM的映射研究[J].第四軍醫(yī)大學(xué)學(xué)報(bào),2006,27(11):999-1001.

      [12]唐忠,周含冰,何榮茂,等.軍用電子設(shè)備試驗(yàn)數(shù)據(jù)庫概念模型設(shè)計(jì)[J].計(jì)算機(jī)與數(shù)字工程,2013,41(1):148-150.

      [13]于彤,崔蒙,李敬華.語義Web在中醫(yī)藥領(lǐng)域的應(yīng)用研究綜述[J].世界中醫(yī)藥,2013,8(1):107-109.

      [14]劉麗紅,朱彥,李海燕,等.中醫(yī)藥一體化數(shù)據(jù)模型的構(gòu)建[J].中國數(shù)字醫(yī)學(xué),2015,10(10):70-72.

      [15]楊喆,劉丹紅,婁苗苗,等.基于信息建模的數(shù)據(jù)元標(biāo)準(zhǔn)化方法[J].中國數(shù)字醫(yī)學(xué),2016,11(2):58-60,70.

      [16]劉麗紅,賈李蓉,劉靜,等.中藥本體相關(guān)概念描述探討[J].中國數(shù)字醫(yī)學(xué),2016,1(2):90-92.

      [17]董燕,張竹綠,李海燕,等.中醫(yī)藥數(shù)據(jù)元提取規(guī)則與分類探討[J].中國數(shù)字醫(yī)學(xué),2013,8(11):79-80,88.

      [18]梁禮方.數(shù)據(jù)模型[J].金融科技時(shí)代,2014(1):45-51.

      (2016-06-08收稿 責(zé)任編輯:白樺)

      Building Chinese Medicine Conceptual Data Model Based on Semantic Representation

      Liu Lihong,Zhu Yan

      (InstituteofInformationonTraditionalChineseMedicine,ChinaAcademyofChineseMedicalSciences,Beijing100700,China)

      Objective:A large amount of rich content and heterogeneous data in Chinese medicine field bring difficulties for information exchange and sharing. On the one hand,it can provide knowledge sharing and reusing on semantic level,on the other hand,it can promote the integration,exchange and application of data resources. Methods:Combining ontology and data,Chinese medicine conceptual data model was established based on the existing ontology Traditonal Chinese Medicine Language System (TCMLS),with reference to the existing conceptual data model to extract concepts. Results:Based on the Traditional Chinese Medicine integrated data model framework,the current data resources in the Chinese medicine field were analyzed,Chinese medicine and related business concepts were extracted to build the framework of Chinese medicine concept data model. Conclusion:With combination of ontology and data,Chinese medicine data model is built at the conceptual level,for the accuracy of data modeling on data level and it could promote the integration and exchange of information resources and supplement the domain ontology at semantic level.

      Chinese medicine; Conceptual data model; Semantic representation

      國家自然科學(xué)基金青年項(xiàng)目(編號(hào):61601521)

      朱彥(1983.04—),男,中醫(yī)信息學(xué)博士,研究實(shí)習(xí)員,研究方向:中醫(yī)藥知識(shí)組織與挖掘,E-mail:zhuyan166@126.com

      R-331;R286

      A

      10.3969/j.issn.1673-7202.2017.04.058

      猜你喜歡
      數(shù)據(jù)模型本體語義
      Abstracts and Key Words
      對(duì)姜夔自度曲音樂本體的現(xiàn)代解讀
      語言與語義
      面板數(shù)據(jù)模型截面相關(guān)檢驗(yàn)方法綜述
      加熱爐爐內(nèi)跟蹤數(shù)據(jù)模型優(yōu)化
      電子測試(2017年12期)2017-12-18 06:35:36
      “上”與“下”語義的不對(duì)稱性及其認(rèn)知闡釋
      《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
      認(rèn)知范疇模糊與語義模糊
      Care about the virtue moral education
      卷宗(2013年6期)2013-10-21 21:07:52
      面向集成管理的出版原圖數(shù)據(jù)模型
      北流市| 望谟县| 周至县| 土默特右旗| 宜宾县| 宁阳县| 舟山市| 镇巴县| 上高县| 墨江| 黄山市| 广南县| 南通市| 黎平县| 沈阳市| 贵港市| 盐城市| 宜黄县| 张家川| 福州市| 佛冈县| 孝义市| 建宁县| 新邵县| 洞头县| 阳朔县| 富蕴县| 嵊州市| 封开县| 手游| 沙河市| 巴里| 桂东县| 尼勒克县| 日照市| 昭平县| 镇安县| 瑞安市| 平和县| 兴安盟| 临洮县|