• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      基于Neo4j 的《傷寒論》知識圖譜構(gòu)建研究?

      2021-03-22 09:11:42王菁薇晏峻峰
      關(guān)鍵詞:顳淺傷寒論結(jié)構(gòu)化

      王菁薇 肖 莉 晏峻峰

      (1.湖南中醫(yī)藥大學(xué)信息科學(xué)與工程學(xué)院 長沙 410208)(2.湖南中醫(yī)藥大學(xué)中醫(yī)學(xué)院 長沙 410208)

      1 引言

      隨著計(jì)算機(jī)相關(guān)技術(shù)的不斷完善和成熟,與各個(gè)領(lǐng)域都有了較高、有效的結(jié)合,其在中醫(yī)藥領(lǐng)域的應(yīng)用卻步履維艱。在浩如煙海的非結(jié)構(gòu)化形式的古籍中蘊(yùn)含著中醫(yī)藥領(lǐng)域豐富的知識,將其抽取轉(zhuǎn)化為結(jié)構(gòu)化知識,對中醫(yī)藥的傳承和發(fā)展具有一定的現(xiàn)實(shí)意義。

      2 研究的背景和意義

      2019 年12 月底,新型冠狀病毒引起的疫情以武漢為中心,進(jìn)而迅速向全國乃至全球蔓延。中醫(yī)較早介入了中國對新型冠狀病毒肺炎的防治,在第六、七版《新型肺炎診療方案》中推薦使用的“清肺排毒湯”是《傷寒論》相關(guān)經(jīng)方的融合創(chuàng)新運(yùn)用,其對新冠肺炎各階段患者均有明顯療效[1]。 由此可知,中醫(yī)藥古籍,如《傷寒論》,在當(dāng)前社會(huì)背景下仍具有重要的醫(yī)療價(jià)值。但面對諸多歷史性新機(jī)遇的同時(shí),中醫(yī)藥古籍的傳承模式也面臨著新的挑戰(zhàn)。構(gòu)建基于中醫(yī)藥古籍的知識圖譜是將中醫(yī)藥古籍中非結(jié)構(gòu)化的知識變成結(jié)構(gòu)化知識的過程,便于計(jì)算機(jī)相關(guān)技術(shù)更好地利用中醫(yī)藥古籍中豐富的知識,是現(xiàn)代化醫(yī)療體系建設(shè)的要求。因此,對《傷寒論》知識圖譜構(gòu)建的研究不僅僅是對中華傳統(tǒng)文化的傳承與發(fā)展,也是對中國衛(wèi)生醫(yī)療的發(fā)展,同時(shí)對國家的發(fā)展也具有長遠(yuǎn)的意義。

      3 研究現(xiàn)狀

      3.1 知識圖譜

      知識圖譜概念出現(xiàn)于20 世紀(jì)60 年代,是由谷歌在2012 年提出的,目的是為了更好地優(yōu)化搜索結(jié) 果[2]。“Exploiting Linked Data and Knowledge Graphs in Large Organisations[3]”一書中對知識圖譜的定義:“A knowledge graph consists of a set of inter?connected typed entities and their attributes[4]”,即知識圖譜由一組相互連接的類型化實(shí)體及其屬性組成。

      構(gòu)建知識圖譜的關(guān)鍵是信息抽取、知識融合以及知識計(jì)算[6]。信息抽取也稱知識抽取,指的是通過人工或自動(dòng)等方式從數(shù)據(jù)源中提取實(shí)體、屬性以及關(guān)系的技術(shù)[7]。從數(shù)據(jù)結(jié)構(gòu)的角度來看,數(shù)據(jù)源包括非結(jié)構(gòu)化數(shù)據(jù)、半結(jié)構(gòu)化數(shù)據(jù)以及結(jié)構(gòu)化數(shù)據(jù)。相較于半結(jié)構(gòu)化數(shù)據(jù)以及結(jié)構(gòu)化數(shù)據(jù),對非結(jié)構(gòu)化數(shù)據(jù),如:文本、圖像、視頻等,的知識抽取能為知識圖譜提供大量較高質(zhì)量的三元組事實(shí)[7]。知識融合主要是對概念實(shí)體進(jìn)行鏈接,來自不同數(shù)據(jù)源的概念可能存在命名相同但指代不同實(shí)體,命名不同概念可能相同以及概念指代的粒度不同等問題[9]。為了解決以上問題,人們已經(jīng)提出了各種各樣的本體匹配算法,從最早的啟發(fā)式方法、概率方法,到現(xiàn)如今基于機(jī)器學(xué)習(xí)或是推理的方法[10]。知識計(jì)算主要是根據(jù)圖譜提供的信息得到更多隱含的知識[10],如數(shù)據(jù)中存在的隱含知識可以利用本體或者規(guī)則推理系列技術(shù)獲取,經(jīng)過不一致檢測技術(shù)發(fā)現(xiàn)數(shù)據(jù)中的燥聲和缺陷。

      3.2 中醫(yī)藥知識圖譜現(xiàn)狀

      中醫(yī)藥領(lǐng)域知識圖譜的應(yīng)用研究主要集中在中醫(yī)臨床病例醫(yī)案。阮彤等基于上海曙光醫(yī)院的信息系統(tǒng)以及知識庫數(shù)據(jù)構(gòu)造了中醫(yī)藥知識圖譜,提供了語義問答和輔助開方應(yīng)用[11]。朱玲等通過對中醫(yī)文獻(xiàn)中“哮喘”相關(guān)知識的提取,實(shí)現(xiàn)了哮喘相關(guān)知識的領(lǐng)域建模[12]。方芳等通過本體技術(shù)構(gòu)建了糖尿病醫(yī)案本體庫[13]。

      4 《傷寒論》知識圖譜的構(gòu)建

      4.1 中醫(yī)命名實(shí)體抽取

      中醫(yī)命名實(shí)體抽取是將疾病、證候、癥狀等中醫(yī)詞匯從數(shù)據(jù)源中抽取出來。

      1)實(shí)體抽取原則:本著“全面準(zhǔn)確、繼承發(fā)展”的理念,依據(jù)以下原則納入實(shí)體數(shù)據(jù)。

      (1)全面收錄《傷寒論》中疾病、證候、癥狀、處方、藥物有關(guān)詞條;

      (2)注重實(shí)體錄入的準(zhǔn)確性;

      3.1 評估顳淺靜脈 經(jīng)顳淺靜脈置管前應(yīng)充分評估顳淺靜脈的可見度、充盈度及其走行方向。由于右側(cè)顳淺靜脈距離上腔靜脈近,故選常右側(cè)。將患兒頭偏向左側(cè),先觸摸血管是否搏動(dòng),觀察血管外形以防誤入動(dòng)脈,再評估靜脈充盈度,如顳淺靜脈明顯可直接備皮。顳淺靜脈不明顯可用大拇指在顳枕骨縫處橫向來回輕摸,觸到一條縱向凹槽,用左手拇指和食指輕按血管遠(yuǎn)近兩端,并緩慢內(nèi)聚數(shù)次,可見兩指間皮膚呈條索狀隆起,再備皮[1]。如右側(cè)顳淺靜脈顯露不清晰,且無法觸及凹槽時(shí),再同法選左側(cè)。

      (3)錄入數(shù)據(jù)在《傷寒論》有據(jù)可依。

      2)實(shí)體抽取方法:以《傷寒論》原文為研究對象,確定其中與疾病、證候、癥狀、處方、藥物相關(guān)的主題詞,如“太陽病”“中風(fēng)”“脈浮”“桂枝湯”“桂枝”等。對采集的數(shù)據(jù)人工錄入數(shù)據(jù)庫中,要求對每一條數(shù)據(jù)標(biāo)注所出自的《傷寒論》條文。

      依據(jù)以上實(shí)體抽取準(zhǔn)則和方法以及《中醫(yī)臨床術(shù)語標(biāo)準(zhǔn)規(guī)范》等規(guī)范將《傷寒論》外感疾病演變過程的各種癥候群,區(qū)分為太陽、陽明、少陽、太陰、少陰、厥陰六經(jīng)?。?3],并對其進(jìn)行綜合分析,歸納其證候、癥狀、處方以及藥物組成,存儲(chǔ)在EXCEL 表格(《傷寒論》全數(shù)據(jù)庫.xlsx)中,實(shí)體數(shù)據(jù)格式要求如表1 所示。實(shí)體抽取結(jié)果,經(jīng)兩位中醫(yī)學(xué)博士進(jìn)行校對。

      表1 實(shí)體數(shù)據(jù)格式要求

      4.2 關(guān)系抽取

      知識圖譜是一個(gè)語義網(wǎng)絡(luò),實(shí)體關(guān)系是它的重點(diǎn)[15]。本文在構(gòu)建知識圖譜的過程中,依據(jù)《傷寒論》的解讀,定義了三類實(shí)體關(guān)系:上下位關(guān)系、治愈關(guān)系以及整體與部分關(guān)系,具體如表2所示。

      表2 實(shí)體關(guān)系表

      4.3 《傷寒論》知識圖譜存儲(chǔ)

      4.3.1 Neo4j存儲(chǔ)的優(yōu)點(diǎn)

      目前知識圖譜的存儲(chǔ)方式主要有SQL 關(guān)系型數(shù)據(jù)庫和NoSQL 非關(guān)系型數(shù)據(jù)庫。在非關(guān)系數(shù)據(jù)庫中,Neo4j數(shù)據(jù)庫被廣泛使用。Neo4j圖數(shù)據(jù)庫是以圖形結(jié)構(gòu)的形式存儲(chǔ)信息,關(guān)聯(lián)數(shù)據(jù)本身就是它所包含的數(shù)據(jù),因此它可以直接顯示關(guān)聯(lián)數(shù)據(jù)特征。相較于傳統(tǒng)的關(guān)系型數(shù)據(jù)庫,Neo4j 的遍歷算法設(shè)計(jì)能夠運(yùn)用圖結(jié)構(gòu)的自然伸展特點(diǎn)來設(shè)計(jì),不需要復(fù)雜的連接運(yùn)算,因此數(shù)據(jù)的增加以及關(guān)系復(fù)雜程度的增加不會(huì)導(dǎo)致查詢效率的下降。

      4.3.2 數(shù)據(jù)預(yù)處理

      該部分實(shí)驗(yàn)是對人工抽取、整理并錄入得到的中醫(yī)命名實(shí)體數(shù)據(jù)——《傷寒論》全數(shù)據(jù)庫。xlsx進(jìn)行的。其目的是借助Python 相關(guān)工具將人工整理錄入的數(shù)據(jù)切分成符合Neo4j的導(dǎo)入要求的CSV文件,分別包括疾病、證候、癥狀、處方、藥物五個(gè)實(shí)體文件以及疾病與證候、疾病與癥狀、證候與癥狀、癥狀與處方、處方與藥物五個(gè)實(shí)體關(guān)系文件。

      4.3.3 知識的導(dǎo)入

      Neo4j 數(shù)據(jù)導(dǎo)入的方式有三種包括使用Cy?pher LOAD CSV 語句,使用Cypher Create 語句以及使用Neo4j-Import 工具。Cypher 語言的LOAD CSV語句可以適用于任何情況下數(shù)據(jù)的導(dǎo)入,本文通過這種方法將預(yù)處理后經(jīng)過標(biāo)準(zhǔn)化的實(shí)體文件以及實(shí)體間關(guān)系文件導(dǎo)入到Neo4j 數(shù)據(jù)庫中(需將導(dǎo)入文件預(yù)先放入Neo4J安裝目錄的import目錄下)。

      1)節(jié)點(diǎn)的導(dǎo)入

      節(jié) 點(diǎn) 導(dǎo) 入 模 型:(variable:Lable{key1:val?ue1,…,keyN:valueN})。

      節(jié)點(diǎn)的標(biāo)簽(Lable)等同于關(guān)系型數(shù)據(jù)庫的表名,屬性相當(dāng)于關(guān)系數(shù)據(jù)庫中表的列。每個(gè)節(jié)點(diǎn)都有一個(gè)默認(rèn)的內(nèi)部屬性ID,當(dāng)生成新的節(jié)點(diǎn)時(shí),Neo4j 圖數(shù)據(jù)庫服務(wù)器會(huì)自動(dòng)為其分配一個(gè)整數(shù)ID。在默認(rèn)的情況下,節(jié)點(diǎn)的ID 屬性在圖數(shù)據(jù)庫中是自動(dòng)遞增且唯一的。以“疾病”和“證候”兩個(gè)結(jié)點(diǎn)的導(dǎo)入為例,具體Cypher語句如下:

      LOAD CSV WITH HEADERS FROM“file:///disease.csv”AS line

      MERGE(z:疾?。鹡ame:line.name})

      LOAD CSV WITH HEADERS FROM“file:///syndrome.csv”AS line

      create(z:證候{name:line.name,id:line.id})

      2)關(guān)系的導(dǎo)入

      關(guān)系構(gòu)建模型:

      startNode-[variable:relationshipType{key1:val?ue1,…,keyN:valueN}]->endNode

      與節(jié)點(diǎn)的語法類似,關(guān)系的方括號內(nèi)定義了關(guān)系的類型和屬性。關(guān)系的類型類似節(jié)點(diǎn)標(biāo)簽,在創(chuàng)建關(guān)系時(shí),關(guān)系類型的指定是必不可少的,但只能指定一個(gè)關(guān)系類型。在Cypher 語言中,關(guān)系可分為兩種:使用一對短橫線(即--)表示一個(gè)無方向的關(guān)系;若在無方向關(guān)系的一端加上箭頭(即-->或<--)表示一個(gè)有方向的關(guān)系以病名和證候的一對多的關(guān)系為例,具體設(shè)置如下:

      load csv with headers from“file:///drs1.csv”as line

      match(from:病名{name:line.from}),(to:證候{name:line.to})

      merge(from)-[r:關(guān) 系{property:line.rela?tion}]->(to)

      5 結(jié)語

      通過人工抽取《傷寒論》原文的知識,完成了《傷寒論》知識圖譜的構(gòu)建。目前知識庫中總共構(gòu)建了639 個(gè)實(shí)體,2076 條實(shí)體關(guān)系其中包括了6 個(gè)疾病類實(shí)體,43 個(gè)證候類實(shí)體,394 個(gè)癥狀類實(shí)體,106 個(gè)處方類實(shí)體,90 個(gè)藥物類實(shí)體,實(shí)體數(shù)量統(tǒng)計(jì)如表3所示。在圖數(shù)據(jù)庫Neo4j中,《傷寒論》知識圖譜采用圖節(jié)點(diǎn)和圖邊來存儲(chǔ)知識?!秱摗分R圖譜在Neo4j中的部分實(shí)體關(guān)系展示,如圖1所示。

      表3 實(shí)體數(shù)量統(tǒng)計(jì)表

      圖1 《傷寒論》知識圖譜部分實(shí)體關(guān)系圖

      基于《傷寒論》知識圖譜的構(gòu)建將《傷寒論》中非結(jié)構(gòu)化知識轉(zhuǎn)換為結(jié)構(gòu)化知識,為后期基于《傷寒論》知識圖譜的推薦系統(tǒng),問答系統(tǒng)以及基于中醫(yī)藥古籍的知識挖掘與機(jī)器學(xué)習(xí)的研究奠定了基礎(chǔ),為中醫(yī)藥現(xiàn)代化過程中對中醫(yī)藥古籍的傳承和發(fā)展提供了思路。

      猜你喜歡
      顳淺傷寒論結(jié)構(gòu)化
      基于三維測量的顳淺動(dòng)脈干解剖學(xué)研究
      General principle of high-quality academic development of traditional chinese medicine: “carrying on the essence,while pursuing innovations”
      《傷寒論》六經(jīng)溯源與理論淺析
      《傷寒論》實(shí)為115方
      促進(jìn)知識結(jié)構(gòu)化的主題式復(fù)習(xí)初探
      A Patient with End-stage Respiratory Failure Gets Recovery from Mechanical Ventilation by Utilization of Chinese Traditional Medicine
      結(jié)構(gòu)化面試方法在研究生復(fù)試中的應(yīng)用
      基層醫(yī)院顱腦外傷擴(kuò)大翼點(diǎn)入路顳淺動(dòng)脈保護(hù)的體會(huì)
      基于圖模型的通用半結(jié)構(gòu)化數(shù)據(jù)檢索
      面部除皺術(shù)中顳淺筋膜瓣轉(zhuǎn)移覆蓋眼輪匝肌治療魚尾紋的臨床研究
      黔南| 漳浦县| 嘉禾县| 阳西县| 称多县| 桂东县| 平度市| 咸宁市| 荆州市| 桃源县| 贺州市| 剑阁县| 连城县| 将乐县| 新民市| 镇坪县| 镇远县| 会同县| 休宁县| 阿巴嘎旗| 宜兰县| 剑川县| 洞口县| 庆安县| 兴仁县| 大埔县| 瑞金市| 新平| 永嘉县| 弥渡县| 天气| 郯城县| 曲麻莱县| 清徐县| 慈利县| 通江县| 维西| 保亭| 江都市| 社旗县| 马龙县|