• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      中成藥數(shù)據(jù)圖譜可視化與知識問答平臺研究

      2022-05-26 08:56:36周雪陽廖詩雨董澤華程春雷
      軟件導(dǎo)刊 2022年5期
      關(guān)鍵詞:中成藥圖譜可視化

      周雪陽,廖詩雨,董澤華,程春雷,葉 青

      (江西中醫(yī)藥大學(xué)計算機學(xué)院,江西南昌 330004)

      0 引言

      中醫(yī)是中華民族優(yōu)秀文化的重要組成部分,現(xiàn)代中醫(yī)干預(yù)疾病的主要方式為中藥[1]。中藥在新冠肺炎的預(yù)防和治療中發(fā)揮了重要作用,疫情爆發(fā)期間湖北省的中藥救治參與率達91.05%,全國其他區(qū)域達96.37%[2]。

      中成藥是中藥的重要流通形式。與中成藥相關(guān)的數(shù)據(jù)多為半結(jié)構(gòu)化或非結(jié)構(gòu)化,具有4V 特征[3]:數(shù)據(jù)容量大(Volume)、數(shù)據(jù)增速快(Velocity)、數(shù)據(jù)來源廣(Variety)、真實性不高(Veracity)。傳統(tǒng)的關(guān)系型數(shù)據(jù)庫關(guān)聯(lián)效率較低,且不易擴展,已無法適應(yīng)關(guān)聯(lián)性高的中成藥數(shù)據(jù)。知識圖譜是大數(shù)據(jù)時代用于大規(guī)模知識管理和智能服務(wù)的新興技術(shù),其可以捕捉和呈現(xiàn)領(lǐng)域概念之間錯綜復(fù)雜的關(guān)系,并將各種信息系統(tǒng)中分散的知識連接起來。知識圖譜技術(shù)能有效解決中醫(yī)藥領(lǐng)域的知識島問題,有助于整合知識資源,提高知識服務(wù)能力?;诖?,本文構(gòu)建基于知識圖譜技術(shù)的中成藥可視化與知識問答平臺,以便更好地管理和存儲關(guān)系復(fù)雜、種類繁多、結(jié)構(gòu)多變的中成藥數(shù)據(jù)。

      1 研究現(xiàn)狀

      目前已上市的中成藥有接近1 萬種[4],相關(guān)大數(shù)據(jù)亟待開發(fā)與利用,但存在以下困難:①中成藥數(shù)據(jù)來源廣泛,但卻沒有統(tǒng)一標準,數(shù)據(jù)質(zhì)量不能保證;②中成藥數(shù)據(jù)共享不足,不能充分實現(xiàn)數(shù)據(jù)價值;③中成藥數(shù)據(jù)沒有統(tǒng)一管理規(guī)范,存在數(shù)據(jù)濫用現(xiàn)象[5]。

      數(shù)據(jù)可視化是指將海量數(shù)據(jù)以圖像的形式表示,并利用數(shù)據(jù)分析和開發(fā)工具發(fā)現(xiàn)其中未知信息的處理過程[6]。目前,數(shù)據(jù)可視化不再是簡單地利用各種圖表對實體及其之間的關(guān)系進行展示,通常需要從多維數(shù)據(jù)、層次關(guān)系、文本數(shù)據(jù)3 個方面進行可視化研究[7]:①多維數(shù)據(jù):使用不同形式對數(shù)據(jù)進行多維關(guān)系展示,使用戶能夠通過簡單操作實現(xiàn)數(shù)據(jù)的觀察與分析,從而獲得所需信息;②層次關(guān)系:大數(shù)據(jù)關(guān)注的重點往往是不同實體之間的聯(lián)系,這就要求采用不同圖形,盡可能豐富地呈現(xiàn)數(shù)據(jù)的層次關(guān)系;③文本數(shù)據(jù):必須結(jié)合文本數(shù)據(jù)幫助用戶理解信息,因此應(yīng)注意文本信息的視覺效果,以便發(fā)揮知識問答的作用。

      目前,各大醫(yī)學(xué)數(shù)據(jù)可視化平臺多以傳統(tǒng)的表格、折線圖、直方圖等形式展示數(shù)量龐大的中成藥數(shù)據(jù)[8],具有簡單直觀的特點,但也存在許多問題[9]:①展示視角不夠全面,無法綜合文獻、臨床、商業(yè)等多背景數(shù)據(jù);②圖形比例設(shè)置不當,導(dǎo)致用戶產(chǎn)生視覺誤差;③平臺過分追求界面簡潔,文字說明少,很多數(shù)據(jù)只通過簡單的圖形進行展示,導(dǎo)致用戶難以解讀內(nèi)容;③沒有中醫(yī)專業(yè)人士的參與,平臺只能展示提前設(shè)定的數(shù)據(jù),用戶難以找到所需信息。為此,許多學(xué)者嘗試應(yīng)用知識圖譜技術(shù)對中醫(yī)辨證、案例分析等進行可視化展示,取得了一些研究成果。例如,王菁薇等[10]利用中醫(yī)經(jīng)典古籍《傷寒論》中的數(shù)據(jù)文本進行中醫(yī)藥知識圖譜構(gòu)建;賈李蓉等[11]結(jié)合可視化技術(shù)研發(fā)出中醫(yī)藥知識圖譜可視化平臺;秦錦玉等[12]基于可視化技術(shù)對中醫(yī)藥知識進行整合與可視化展示,開發(fā)出一個中醫(yī)藥知識圖譜可視化交互平臺;陳姍姍等[13]利用知識可視化軟件梳理國內(nèi)有關(guān)中醫(yī)藥國際化發(fā)展的文獻,呈現(xiàn)出該領(lǐng)域的知識圖譜;鄭懿鳴等[14]將知識圖譜與知識卡片相結(jié)合,開發(fā)出中醫(yī)藥知識圖譜用藥推薦系統(tǒng);孫華君等[15]詳細分析了知識圖譜在中醫(yī)基礎(chǔ)、中醫(yī)臨床、中醫(yī)養(yǎng)生保健等領(lǐng)域中的應(yīng)用。在此基礎(chǔ)上,本文采用知識圖譜技術(shù)結(jié)合可視化技術(shù)對中成藥大數(shù)據(jù)進行研究分析,以期解決中醫(yī)藥數(shù)據(jù)利用不足、管理不規(guī)范等問題。

      2 系統(tǒng)設(shè)計

      首先從中成藥數(shù)據(jù)的實際需求關(guān)系出發(fā),選取必要的實體、屬性等;然后使用爬蟲技術(shù)從互聯(lián)網(wǎng)上獲取相關(guān)數(shù)據(jù),存入對象關(guān)系型數(shù)據(jù)庫Postgresql,通過對中成藥數(shù)據(jù)進行實體識別、關(guān)系抽取、整理分析,構(gòu)建中成藥知識圖譜并存入圖形數(shù)據(jù)庫Neo4j 中;最后利用Python 中的Flask 框架搭建可視化平臺,實現(xiàn)數(shù)據(jù)的多角度展示以及智能問答。具體實現(xiàn)流程如圖1所示。

      Fig.1 System implementation flow圖1 系統(tǒng)實現(xiàn)流程

      2.1 數(shù)據(jù)選取與獲取

      根據(jù)實際調(diào)查,將中成藥的實體屬性分為基本屬性、安全性、經(jīng)濟性3大類,細分屬性如表1所示。

      Table 1 Detailed properties of Chinese patent medicine表1 中成藥細分屬性

      以中成藥名稱為檢索關(guān)鍵詞,使用Python 爬蟲技術(shù)從站內(nèi)眾多開放網(wǎng)站中爬取相關(guān)網(wǎng)頁源碼[16],利用正則表達式技術(shù)提取所需數(shù)據(jù)并存入關(guān)系型數(shù)據(jù)庫Postgresql 中,以實現(xiàn)中成藥數(shù)據(jù)的動態(tài)更新。以中成藥萊陽梨止咳糖漿為例,其屬性如表2所示。

      2.2 中成藥可視化與知識問答平臺設(shè)計

      使用Python 中Web 開發(fā)模塊的Flask 框架進行中成藥知識圖譜可視化平臺開發(fā)。Flask 框架是一個輕量級Web開發(fā)框架,較其他同類型框架更靈活、安全且容易上手,可開發(fā)出功能強大的網(wǎng)站。同時,使用Ajax 技術(shù)進行網(wǎng)站交互設(shè)計,Ajax 即Asynchronous JavaScript and XML(異步JavaScript 和XML),是一種創(chuàng)建交互式、快速動態(tài)應(yīng)用的網(wǎng)頁開發(fā)技術(shù),無需重新加載整個網(wǎng)頁便能實現(xiàn)部分網(wǎng)頁的更新?;贏jax 技術(shù)的異步交互方法[17]可以實現(xiàn)前端頁面的無等待實時刷新,提高人機交互水平,提升用戶體驗。

      Table 2 Property examples of Laiyang pear cough syrup表2 萊陽梨止咳糖漿屬性示例

      中成藥可視化與知識問答平臺主要分為8 個模塊,詳見圖2。用戶在搜索框中輸入中成藥名稱,點擊搜索后,平臺將自動加載出相應(yīng)信息。

      Fig.2 Design of visualization and knowledge Q&A platform of patent medicine圖2 中成藥可視化與知識問答平臺設(shè)計

      (1)用戶搜索框。用戶可在搜索框中輸入中成藥名稱,點擊搜索按鈕即可進行該中成藥相關(guān)數(shù)據(jù)的查詢。

      (2)知識圖譜模塊。網(wǎng)站以知識圖譜的形式將被搜索中成藥的相關(guān)數(shù)據(jù)展示出來,用戶根據(jù)實際需求進行選擇性節(jié)點展示、刷新知識圖譜以及保存下載相關(guān)圖片等操作。

      (3)中成藥屬性表單模塊:網(wǎng)站以表格的形式呈現(xiàn)被搜索中成藥相關(guān)屬性數(shù)據(jù),方便用戶查看。

      (4)藥品生產(chǎn)企業(yè)模塊:網(wǎng)站以詞云的形式呈現(xiàn)被搜索中成藥的生產(chǎn)廠家信息,用戶通過點擊某個生產(chǎn)廠家可以在藥品廣告流通信息模塊單獨查看該企業(yè)生產(chǎn)的藥品流通信息。

      (5)藥品廣告流通信息模塊:該模塊以折線圖或柱狀圖的形式呈現(xiàn)被搜索中成藥所有廣告在不同年份的流通數(shù)量,用戶亦可以查看不同生產(chǎn)企業(yè)的廣告流通信息。

      (6)藥品產(chǎn)地模塊:該模塊以餅狀圖的形式呈現(xiàn)被搜索中成藥的產(chǎn)地,用戶可查看不同省份生產(chǎn)該中成藥的比例。

      (7)藥品經(jīng)濟模塊:該模塊以折線圖的形式展示被搜索中成藥的市場售價信息。

      (8)知識問答模塊:用戶可通過輸入中成藥名稱、藥材、癥狀等關(guān)鍵詞檢索出相關(guān)信息。

      3 數(shù)據(jù)可視化與知識問答應(yīng)用

      3.1 中成藥知識圖譜可視化應(yīng)用

      基于知識圖譜對中成藥數(shù)據(jù)進行存儲能有效避免傳統(tǒng)關(guān)系型數(shù)據(jù)庫的弊端,使非結(jié)構(gòu)化的中成藥數(shù)據(jù)具有更好的關(guān)聯(lián)性,為文本處理提供更為全面的語義特征[18]。

      選取中成藥的商品名作為實體結(jié)點,以基本屬性、經(jīng)濟性、安全性作為一級屬性結(jié)點,其中主要規(guī)格、用途、用法用量、組成、產(chǎn)品分類、廠家數(shù)量、性狀為從屬基本屬性的二級屬性結(jié)點;文獻研究、藥品禁忌、不良反應(yīng)為從屬安全性的二級屬性結(jié)點;基藥目錄、醫(yī)保目錄、標準來源為從屬經(jīng)濟性的二級屬性結(jié)點;從數(shù)據(jù)庫中提取的中成藥相關(guān)數(shù)據(jù)作為對應(yīng)屬性下的三級實例結(jié)點?;谝陨闲畔⒔⒅谐伤幹R圖譜數(shù)據(jù)庫,具體示例見圖3、圖4。

      Fig.3 Example of knowledge map of"Juyuan Zhike Tablet"圖3 桔遠止咳片知識圖譜示例

      運用Neo4j 數(shù)據(jù)庫存儲中成藥相關(guān)數(shù)據(jù),將單個中成藥的相關(guān)屬性分為基本屬性、安全性、經(jīng)濟性3 大類,分別以不同顏色展示,不同中成藥實體根據(jù)其相同屬性連接起來,形成中成藥知識圖譜體系,運用圖匹配技術(shù)實現(xiàn)基于知識圖譜技術(shù)的中成藥智能問答研究。

      Fig.4 Knowledge map example of relationship between different Chinese patent medicines圖4 不同中成藥之間關(guān)系的知識圖譜示例

      采用Echarts 可視化技術(shù)融合大屏可視化背景元素完成中成藥知識圖譜可視化平臺的構(gòu)建,平臺以知識圖譜、表格、柱狀圖、折線圖、散點圖、詞云、餅狀圖等形式將中成藥相關(guān)數(shù)據(jù)呈現(xiàn)給用戶,界面展示如圖5所示。

      Fig.5 Visualization platform of Chinese patent medicine knowledge map圖5 中成藥知識圖譜可視化平臺界面展示

      由圖5 可知,平臺以知識圖譜和表單的形式呈現(xiàn)被搜索中成藥的基本屬性、安全性、經(jīng)濟性3 大類信息,以折線圖、柱狀圖的形式呈現(xiàn)流通信息(以廣告招標數(shù)量表示),以散點圖的形式呈現(xiàn)其市場流通價格信息,以餅狀圖的形式呈現(xiàn)生產(chǎn)地區(qū)信息,以詞云的形式呈現(xiàn)生產(chǎn)企業(yè)信息。

      同時,平臺的交互功能可以幫助用戶更詳細地查看相關(guān)數(shù)據(jù),具體表現(xiàn)為:①用戶通過點擊知識圖譜模塊中的對象、對象屬性、關(guān)聯(lián)對象、所屬類別圖標,可以選擇性隱藏部分結(jié)點信息;②用戶通過點擊某個生產(chǎn)企業(yè),可以在藥品廣告流通信息模塊中單獨查看該企業(yè)生產(chǎn)的藥品流通信息。

      3.2 知識問答應(yīng)用

      基于中成藥知識圖譜數(shù)據(jù)庫和中成藥知識圖譜可視化平臺,可進行中成藥知識問答研究。通過融入自然語言處理技術(shù),抽取與表征中醫(yī)藥領(lǐng)域文本特征,采用基礎(chǔ)的模式匹配與Transformer 深度學(xué)習(xí)模型相結(jié)合的方式,實現(xiàn)平臺的中醫(yī)藥智能問答功能。具體實施流程如圖6所示。

      Fig.6 Implementation process of knowledge Q&A platform圖6 知識問答平臺實施流程

      采用Python 進行自然語言處理,構(gòu)建中醫(yī)藥問答詞典,增加分詞精確度,構(gòu)建相關(guān)問題模板,提高問答效率。通過分詞、實體識別、關(guān)鍵詞提取將用戶輸入的自然語言文本形成問題列表,通過與已有問答模板進行關(guān)鍵詞匹配分析問答類型,再跳轉(zhuǎn)至相應(yīng)的數(shù)據(jù)查詢模塊進行查詢,并將所得數(shù)據(jù)整合成答案傳到前端。對于未匹配到的問題文本,采用Transformer 深度學(xué)習(xí)模型對問題進行解析,通過自定義中醫(yī)藥知識問答素材抽取問題答案呈現(xiàn)給用戶。具體處理流程如圖7所示。

      由圖7 可知,系統(tǒng)通過對輸入文本進行自然語言分詞處理、文本特征分析、模式匹配等選擇合適的模板回答搜索問題,針對未能匹配到的文本,使用Transformer 深度學(xué)習(xí)抽取式問答生成答案及得分,分數(shù)大于0.6 的回答視為正確答案輸出,反之則表示未能理解[19]。

      Fig.7 Process of knowledge Q&A圖7 知識問答處理流程

      4 結(jié)語

      本文采用Python 爬蟲技術(shù)采集中成藥開源數(shù)據(jù),通過實體抽取、屬性抽取、知識融合等技術(shù)成功構(gòu)建了基于Neo4j 圖形數(shù)據(jù)庫的中醫(yī)藥知識圖譜體系,同時結(jié)合Flask框架與Echarts 可視化技術(shù)搭建了中成藥數(shù)據(jù)可視化平臺。目前,本文設(shè)計的智能問答功能模塊尚且只注重模板匹配以及簡單的素材文本抽取式問答,難以達到醫(yī)藥類問答對于精確度的要求。在后續(xù)研究中將深入挖掘中醫(yī)藥古籍文獻數(shù)據(jù),解析中醫(yī)藥多維度數(shù)據(jù),并采用深度學(xué)習(xí)技術(shù)構(gòu)建可泛化計算的智能問答模型[20],以更好地挖掘中成藥數(shù)據(jù)的應(yīng)用價值,為大眾提供中成藥大數(shù)據(jù)服務(wù)。

      猜你喜歡
      中成藥圖譜可視化
      老年人便秘,中成藥如何選擇
      中老年保健(2022年3期)2022-08-24 02:58:54
      基于CiteSpace的足三里穴研究可視化分析
      基于Power BI的油田注水運行動態(tài)分析與可視化展示
      云南化工(2021年8期)2021-12-21 06:37:54
      骨質(zhì)疏松怎樣選擇中成藥
      繪一張成長圖譜
      基于CGAL和OpenGL的海底地形三維可視化
      “融評”:黨媒評論的可視化創(chuàng)新
      傳媒評論(2019年4期)2019-07-13 05:49:14
      骨質(zhì)疏松怎樣選擇中成藥
      補腎強身片UPLC指紋圖譜
      中成藥(2017年3期)2017-05-17 06:09:01
      主動對接你思維的知識圖譜
      女性| 神池县| 荔浦县| 腾冲县| 图木舒克市| 崇阳县| 新营市| 富锦市| 奈曼旗| 白银市| 隆林| 大邑县| 华宁县| 新和县| 郎溪县| 昆明市| 车险| 九寨沟县| 浦县| 南充市| 岑溪市| 留坝县| 江城| 通山县| 金乡县| 四会市| 嫩江县| 兰溪市| 麦盖提县| 瓮安县| 鞍山市| 库尔勒市| 冕宁县| 嵊泗县| 双江| 阜新市| 马龙县| 和平区| 固镇县| 大关县| 沙洋县|