• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      PubMed與Embase的主題標(biāo)引及主題檢索功能比較研究

      2018-03-22 02:41:04,,
      關(guān)鍵詞:詞表標(biāo)引主題詞

      ,,

      PubMed和Embase是生物醫(yī)學(xué)領(lǐng)域的兩大文摘類數(shù)據(jù)庫,它們獨有的主題詞表有效地提高了文獻(xiàn)標(biāo)引及檢索能力,因而受到專業(yè)人士的青睞。PubMed長期堅持免費開放,在全球范圍內(nèi)擁有廣泛的用戶基礎(chǔ);Embase近年來除保持藥學(xué)與病理學(xué)方面的特色外,還通過整合MEDLINE數(shù)據(jù)(PubMed的主體部分)提升產(chǎn)品影響力。對二者的詞表構(gòu)成及標(biāo)引策略展開研究,既能促進(jìn)用戶對檢索系統(tǒng)的認(rèn)識和利用,也能推動信息檢索理論的發(fā)展。

      1 國內(nèi)外研究現(xiàn)狀

      對PubMed或Embase的分析或比較研究,國內(nèi)外均已有較多文獻(xiàn)述及。在數(shù)據(jù)標(biāo)引、收錄范圍、所用詞表,專指度等方面[1-3],認(rèn)為MeSH詞表的收詞量及專指度較為適宜[4];Emtree的詞匯量大,專指性強(qiáng),因而可保證較高的查全率和查準(zhǔn)率[5];Embase主題檢索查全率高于PubMed,PubMed基本檢索查準(zhǔn)率更高[6]。需注意的是,這些成果大多發(fā)表于20年前,由于研究視角、研究方法不同,尤其是檢索問題、檢索范圍、檢索時間及檢索途徑不同,還可能導(dǎo)致研究結(jié)論完全不同[7-9]。在國外研究方面,除Bekhuis等[10]所做的MeSH和Emtree收錄術(shù)語及覆蓋范圍的比較效果研究(Comparative Effectiveness Research,CER)外,較多學(xué)者將注意力集中于醫(yī)學(xué)某一分支領(lǐng)域開展實驗性比較研究,如關(guān)于ClinicalTrials.gov、PubMed、Embase及Google scholar收錄卵巢癌臨床試驗結(jié)果的透明度分析[11],MEDLINE和Embase數(shù)據(jù)庫麻醉學(xué)系統(tǒng)綜述檢索策略優(yōu)化的實驗研究等[12]。Cadwell等認(rèn)為,利用Embase的“Major Focus”功能可減少臨床系統(tǒng)綜述文獻(xiàn)的篩查負(fù)擔(dān)[13];Glanville等認(rèn)為,盡管Embase是健康技術(shù)評估(HTAs)時需檢索的一個關(guān)鍵數(shù)據(jù)庫,但因其主題詞數(shù)量太多而可能導(dǎo)致查準(zhǔn)率不高[14];Lam等發(fā)現(xiàn)盡管Embase的收錄范圍更廣,但美國和加拿大的醫(yī)學(xué)界并未用Embase替代MEDLINE[15]。

      從數(shù)據(jù)庫及檢索系統(tǒng)本身變化情況來看,Embase于2017年在檢索途徑及功能方面作了重大升級,2018年發(fā)布了新版Embase標(biāo)引策略綜合指南;PubMed在主題詞表的修訂與完善方面也做了較多改變,2018年新增主題詞1000余個,為近年來增幅之最,還在增補(bǔ)概念表中新增了有機(jī)體類詞匯,在限定檢索中增加了主題限定等。

      綜上,國內(nèi)雖有PubMed與Embase的比較研究,但大多成文時間較早,難以反映最新內(nèi)容,研究結(jié)論的不一致也易使讀者產(chǎn)生混淆;國外則更偏重于應(yīng)用領(lǐng)域的實驗性研究,對二者詞表構(gòu)成及主題標(biāo)引的比較分析較少,反映最新變化較少。

      2 詞表簡介及構(gòu)成

      2.1 MeSH詞表

      PubMed所用敘詞表為《醫(yī)學(xué)主題詞表》(Medical Subject Headings,以下簡稱MeSH),由美國國立醫(yī)學(xué)圖書館(以下簡稱NLM)編制而成,主要用于NLM生物醫(yī)學(xué)文獻(xiàn)信息的索引編目以及檢索利用。MeSH屬于層級制醫(yī)學(xué)受控詞表,具有相對完善和固定的結(jié)構(gòu)體系,被認(rèn)為是詞表之典范[1]。其創(chuàng)建時間最早可追溯至1940年《醫(yī)學(xué)索引》的季度累積主題索引。1960年,隨著《醫(yī)學(xué)索引》新專輯的出版,《醫(yī)學(xué)主題詞表》首版正式發(fā)行,共收錄4400個詞匯[16]。目前,詞表分為16個大類,最多可達(dá)13個層級[17]。

      MeSH詞表由主題詞(Descriptors,亦稱敘詞)、副主題詞(Qualifiers,亦稱限定詞)和增補(bǔ)概念(Supplementary Concept Records,簡稱SCRs)3類記錄構(gòu)成。主題詞是MeSH的主體部分,由以下4類記錄構(gòu)成:第1類為主標(biāo)題(Main Headings),用于MEDLINE數(shù)據(jù)庫、出版物和其他數(shù)據(jù)庫收錄文獻(xiàn)內(nèi)容特征的編目索引,可在PubMed的[MH]字段中檢索到,一般為年度更新,遇特殊情況時會頻繁更新,如2003年的“非典”時期,NLM在5月份就將“Severe Acute Respiratory Syndrome”與“SARS Virus”加入到MeSH中;第2類為出版類型(Publication Characteristics或Publication Types),如期刊文章、臨床試驗、綜述等;在MEDLINE記錄中標(biāo)記為“PT”而不是“MH”;第3類為特征詞(Check Tags),用于特定類別信息的標(biāo)引,不會出現(xiàn)在MeSH樹狀結(jié)構(gòu)表中,之前曾收錄人類、動物、性別、年齡等特征詞,目前僅保留性別(包括“男性”和“女性”)特征詞,其余均轉(zhuǎn)換為第1類主題;第4類為地理名詞(Geographics),用來描述物理位置,列入MeSH樹狀結(jié)構(gòu)表的Z類中。

      副主題詞是指對主題某一方面內(nèi)容進(jìn)行限定的詞,如“治療”“遺傳學(xué)”等,其數(shù)量比主題詞少很多,也相對固定,官方宣稱現(xiàn)有80個,但筆者發(fā)現(xiàn)其中的“antagonists & inhibitors”與“antagonists and inhibitors”疑為重復(fù)。一般情況下副主題詞不單獨使用,但在PubMed中也可使用[SH]標(biāo)記實現(xiàn)副主題詞字段的限定檢索。

      標(biāo)引人員常會遇到找不到合適的主題詞標(biāo)引文獻(xiàn)的情況,如某些特定化學(xué)品、罕見疾病或藥物聯(lián)合治療方案等。NLM的解決方案是將其作為增補(bǔ)概念記錄(SCRS)添加至MeSH詞表中作為補(bǔ)充。不同于正規(guī)主題詞的是,增補(bǔ)概念不列入MeSH樹狀結(jié)構(gòu)中,而是單獨成表,通過MeSH字段映射的方式來建立與主題詞表的聯(lián)系并實現(xiàn)其檢索功能。從結(jié)構(gòu)上看,增補(bǔ)概念包含術(shù)語結(jié)構(gòu)和概念結(jié)構(gòu)兩種模式,術(shù)語結(jié)構(gòu)由入口詞、優(yōu)選詞兩級結(jié)構(gòu)組成,概念結(jié)構(gòu)由類、概念和術(shù)語三級結(jié)構(gòu)組成。概念和術(shù)語之間為嚴(yán)格的同義關(guān)系,類和概念之間可以是密切關(guān)聯(lián)的同義、相關(guān)或廣義關(guān)系[18-19]。從內(nèi)容上看,增補(bǔ)概念分為4類:化學(xué)物質(zhì)和藥物,主要映射到D類主題;治療方案,用于化療方案,一般映射到主題“抗腫瘤聯(lián)合化療方案”和其他D類主題;罕見疾病,一般映射到C類和部分A類主題;有機(jī)體為2018年新增內(nèi)容,一般映射到B類主題。目前,增補(bǔ)概念表每周更新,現(xiàn)收錄詞匯逾24萬[17]。

      2.2 Emtree詞表

      Emtree是生物醫(yī)學(xué)和相關(guān)生命科學(xué)領(lǐng)域的一種層級結(jié)構(gòu)受控詞表,主要用于Embase收錄文獻(xiàn)的標(biāo)引與檢索[20]。Emtree詞表創(chuàng)建于1988年,其前身為MALIMET(Master List of Medical Indexing Terms),在規(guī)范控制方面借鑒了MeSH[5,21]的樹狀層級結(jié)構(gòu),所以二者在結(jié)構(gòu)上相似。目前,該詞表由14個大類構(gòu)成,分類層級比MeSH更多,如“Chlorocebusaethiops”,在MeSH中為第13級,在Emtree中為第22級。 與MeSH類似,Emtree由主題詞(Preferred Terms,亦稱優(yōu)先詞)、副主題詞(Subheadings)和候選詞(Candidate Terms)3類術(shù)語構(gòu)成,具體包括通用術(shù)語、藥物名、特征詞、候選詞、副主題詞(藥物、疾病及設(shè)備類)、藥物商品名及廠商名、設(shè)備商品名及廠商名、臨床試驗號、分子序列號以及CAS的化學(xué)物質(zhì)登記號等10大類[22]。 Emtree的副主題詞數(shù)量共計82個,其中疾病類14個、藥物類64個、設(shè)備類4個,總量與MeSH大致相當(dāng)。與MeSH不同的是,Emtree僅疾病、藥物或設(shè)備類主題詞才搭配副主題詞。

      3 詞表詳細(xì)比較

      3.1 ELSEVIER的觀點

      ELSEVIER從收錄術(shù)語數(shù)量、詞表結(jié)構(gòu)及覆蓋范圍、更新頻率等方面詳細(xì)比較了Emtree與MeSH:Emtree收錄術(shù)語數(shù)量更多,在藥物類主題方面覆蓋范圍更廣、更新速度更快,更方便用戶查閱最新文獻(xiàn)等,具體見表1[23]。

      3.2 補(bǔ)充比較

      主題詞的表現(xiàn)形式不一,各有優(yōu)缺點。Emtree的自然語序形式更為直觀,更易于識別和理解;而MeSH的倒置形式則是為了使用戶在利用主題詞字順表、索引表或在檢索輸入過程中能夠更便捷地識別與選擇同族詞匯,這種倒置表達(dá)形式可在一定程度上彌補(bǔ)檢索系統(tǒng)沒有分類檢索功能的不足[4]。

      Emtree收詞量比MeSH大,二者的側(cè)重點和新詞處理方式大同小異。Emtree收錄主題詞82 067個[22],約為MeSH的2.8倍。其中“化學(xué)品和藥物”類所占比例最重,達(dá)39.54%;其后依次為“過程、參數(shù)和設(shè)備”類(14.30%)及“疾病”類(11.58%)。“化學(xué)品和藥物”類收錄的可用于檢索的同義詞在其同義詞表中所占比例更高,達(dá)60%[23]。正因為如此,ELSEVIER在產(chǎn)品介紹時特別強(qiáng)調(diào)Embase側(cè)重于藥物、疾病與設(shè)備檢索。

      筆者統(tǒng)計2018年的MeSH詞表發(fā)現(xiàn),“D化學(xué)品和藥品”類占整個MeSH詞表的38.37%,其后依次為“C疾病”類(占19.70%),“E分析、診斷與治療用技術(shù)及設(shè)備”類(占8.69%)。三者累積達(dá)66.76%,比Emtree還略高一些,說明MeSH從總體上也是側(cè)重于藥物、疾病與設(shè)備的。在數(shù)據(jù)更新方面,二者均使用了自動標(biāo)引與人工標(biāo)引相結(jié)合的方式。2009年,Embase引入自動標(biāo)引技術(shù),會議摘要、預(yù)出版文獻(xiàn)以及處理過程中的文獻(xiàn)均采用自動標(biāo)引技術(shù)[24],PubMed則要更早些。新主題詞替換舊主題詞時,Embase將會回溯更新數(shù)據(jù)[24];而PubMed僅在副主題詞更替時才會回溯更新數(shù)據(jù),主題詞變更時則不作處理,這就需要用戶在主題詞檢索過程中關(guān)注主題詞的變化情況。二者的新詞處理方法相似:在Embase的數(shù)據(jù)標(biāo)引過程中,標(biāo)引人員遇到新詞時可將其作為候選詞(candidate term)直接編入Emtree[25];PubMed的標(biāo)引人員在遇到新詞時可將其放到增補(bǔ)概念表中,用戶可在MeSH中直接檢索,增補(bǔ)概念表每周更新,與Emtree的每年更新3次相比,更新頻率更快[26]。

      在入口詞或同義詞方面,NLM宣稱PubMed的入口詞有9萬多條,增補(bǔ)概念表收錄詞匯超過24萬條,二者累積量超過了Emtree的同義詞。Embase將MeSH詞匯完全收入后大多作為入口詞或同義詞,為用戶從PubMed轉(zhuǎn)到Embase提供了方便。在藥物方面,其同義詞數(shù)量總體上超過MeSH。

      以“阿司匹林”為例,MeSH直接采用“Aspirin”,收錄入口詞共19個,利用MeSH Browser查詢到增補(bǔ)概念表中映射到該詞的記錄共104個;Emtree采用的是“acetylsalicylic acid”,其同義詞數(shù)量多達(dá)268個??梢奅mtree的主題詞標(biāo)引粒度更細(xì)。

      表1 Emtree與MeSH的不同點

      *2018年5月的數(shù)據(jù)

      盡管二者副主題詞數(shù)量大致相當(dāng),但標(biāo)引方式大相徑庭。在PubMed中,任一類主題詞均有可與之匹配的若干副主題詞,且副主題詞間是分級的,最多可存在3個層級,如“外科學(xué)-治療-移植。若用戶檢索某一主題時選擇了其副主題詞“治療”或“外科學(xué)”,其檢索結(jié)果均包含了“移植”的相關(guān)內(nèi)容。讓人難以理解的是,PubMed檢索系統(tǒng)實現(xiàn)了自動擴(kuò)展檢索副主題詞功能,卻沒有在用戶檢索操作界面中將副主題詞的層級清晰直觀地體現(xiàn)出來,這種功能上的缺失可能會使用戶感到困擾。在主題檢索過程中,PubMed檢索系統(tǒng)會自動屏蔽那些無法與之匹配的副主題詞,如以“肝腫瘤”作主題詞時,系統(tǒng)會屏蔽 “化學(xué)合成”“藥理學(xué)”“治療應(yīng)用”等副主題詞。在Embase中,僅有疾病、設(shè)備和藥物3類主題詞可搭配副主題詞:藥物類副主題詞共64個,其中47個為給藥途徑類副主題詞,其他17個副主題詞中有5個為主要副主題詞;疾病類副主題詞14個,2個為主要副主題詞;設(shè)備類副主題詞4個,于2014年引入,其中2個為主要副主題詞[27]。此外,在Embase中副主題詞與主題詞的結(jié)合不如PubMed緊密,Embase強(qiáng)調(diào)其副主題詞可獨立于特定主題,可單獨檢索,因而被稱為自由浮動(free-floating)或浮動(floating)副主題詞[21]。這樣做的好處是在標(biāo)引或檢索時組配更加靈活,缺點則是可能會產(chǎn)生檢索噪音。

      4 實例分析

      4.1 主題標(biāo)引

      前已述及,Emtree主題詞數(shù)量是MeSH的2.8倍,因而從理論上來說,Embase收錄文獻(xiàn)的主題詞數(shù)量應(yīng)超過PubMed,加拿大藥物與生物技術(shù)局的最新研究證實了該推斷。研究顯示,Embase的檢索結(jié)果中平均有3~4個主要主題詞和最多50個次要主題詞,而MEDLINE記錄平均只有10~20個主題詞[14]。

      此外,二者在副主題詞標(biāo)引方面差異明顯。如PubMed中可與“阿司匹林”組配的副主題詞共有30個,Embase僅有17個副主題詞,Embase只是在“給藥途徑”方面細(xì)分出47種不同給藥方式;再如以“肝腫瘤”作為主題詞檢索時,PubMed可與之匹配的副主題詞達(dá)49個,而Embase則僅有14個。Emtree在副主題詞組配方面存在小“瑕疵”,如藥物類主題詞可組配“藥物治療”,而疾病類主題詞可組配“副作用”,邏輯上不太合理;PubMed則處理得更好,藥物類主題組配“治療應(yīng)用”,疾病類主題則組配“治療”,“副作用”只與化學(xué)及藥物類主題詞組配。究其原因,筆者認(rèn)為是標(biāo)引方法不同所致,Embase采用浮動或自由浮動副主題詞的方式進(jìn)行標(biāo)引,而PubMed則采用先組式標(biāo)引方式,主題詞與副主題詞關(guān)系緊密,存在嚴(yán)格的邏輯主從關(guān)系。

      長期以來,PubMed對中醫(yī)藥文獻(xiàn)的收錄與標(biāo)引缺乏足夠重視,而Embase宣稱在亞洲文獻(xiàn)的收集方面超過PubMed。筆者以點代面,以“龍膽瀉肝湯”為例,考察比較二者中醫(yī)文獻(xiàn)收錄及標(biāo)引情況。經(jīng)檢索發(fā)現(xiàn),MeSH將龍膽瀉肝湯收入SRCs中,并映射到主題詞“Drugs,Chinese Herbal”下,可直接檢索。在檢索過程中也發(fā)現(xiàn)存在因翻譯差異造成重復(fù)收錄的情況,如2008年收錄“l(fā)ongdanxiegan decoction”,2010年收錄“l(fā)ongdanxiegan tang”。此外發(fā)現(xiàn)類似的情況還存在因漢語拼音與拉丁文翻譯不同、劑型缺省、詞形差異等原因造成的重復(fù)收錄[28]。Emtree則將“l(fā)ongdanxiegan tang”列入候選詞表中,未見有術(shù)語重復(fù)收錄的情況,檢出的文獻(xiàn)也比PubMed的多。

      4.2 主題檢索

      筆者使用中發(fā)現(xiàn),在一般情況下,Embase的檢索結(jié)果往往比PubMed的多。以“阿司匹林”為例,在PubMed與Embase中選擇主題途徑檢索,檢索日期為2018-06-01,分別得到42 330和195 434篇文獻(xiàn)。在對檢索結(jié)果的進(jìn)一步篩選時,Embase檢索系統(tǒng)的優(yōu)勢就體現(xiàn)出來,可根據(jù)每一篩選項尤其是自動浮動副主題詞以及其后列出的檢索結(jié)果適時調(diào)整檢索策略。

      Embase在2017年改版后不僅增加了藥物安全警示導(dǎo)引(PV Wizard)、循證醫(yī)學(xué)(PICO)等檢索途徑,恢復(fù)了設(shè)備檢索途徑,而且大大提升了檢索結(jié)果處理能力。一是在藥物、疾病及設(shè)備等3類主題檢索時,用戶可在檢索結(jié)果列出后進(jìn)一步限定副主題詞;二是系統(tǒng)會在檢索結(jié)果頁的左部列出來源、藥物、疾病、設(shè)備、浮動副主題詞、年齡、性別、研究類型、出版類型、期刊名稱、出版年、作者、會議摘要、藥物商品名、藥物廠商名、設(shè)備商品名及設(shè)備廠商名17類篩選項,點擊“疾病”“藥物”或“設(shè)備”中的任一類,系統(tǒng)會列出檢索結(jié)果中包含該類主題,再點擊其后的“details”圖標(biāo)后,系統(tǒng)會彈出“主要副主題詞”選擇框,待用戶選擇后,系統(tǒng)還會進(jìn)一步彈出與之相關(guān)的其它主題詞的列表供用戶進(jìn)一步限定。Embase的浮動副主題詞文獻(xiàn)篩選功能在一定程度上相當(dāng)于PubMed的多主題詞合并檢索,但不同的是,Embase的用戶可根據(jù)檢索結(jié)果適時優(yōu)化檢索策略。該功能還可為用戶帶來很多益處,如幫助用戶從藥物的角度獲取文獻(xiàn)中涉及藥物不良反應(yīng)、藥物聯(lián)用、藥物比較等細(xì)節(jié)性的內(nèi)容;從疾病領(lǐng)域出發(fā),對文獻(xiàn)進(jìn)行篩選,進(jìn)行疾病分析;查尋一些在研或上市的藥物名稱等。浮動副主題詞文獻(xiàn)篩選功能的實現(xiàn)主要得益于Embase的“三重標(biāo)引(Triple Indexing)”機(jī)制,如表2所示[29]。

      二者在主題檢索中還有其他一些小功能,如“AutoComplete”功能,即在輸入主題詞時能從主題詞表中將所有以這些字母開頭的數(shù)據(jù)提示給用戶,供用戶選擇。

      表2 Embase三重標(biāo)引示例

      5 結(jié)語

      綜上所述,從發(fā)展歷程上看,MeSH歷史久遠(yuǎn),體系結(jié)構(gòu)成熟穩(wěn)定,被許多其他醫(yī)學(xué)文獻(xiàn)檢索系統(tǒng)直接借鑒或間接參考;Emtree也不例外,不僅借鑒了其規(guī)范化控制,還將MeSH術(shù)語納入自身的同義詞表。從構(gòu)成關(guān)系上看,二者結(jié)構(gòu)類似,Emtree體量更大,但從入口詞與同義詞數(shù)量來看,利用增補(bǔ)概念擴(kuò)充MeSH可從數(shù)量上接近Emtree。從主題標(biāo)引上看,二者各有特色,PubMed在規(guī)范性方面更為出色,Embase的篇均標(biāo)引量更高。在檢索功能方面,PubMed更注重降低用戶的學(xué)習(xí)成本,操作簡捷易用,而Embase在用戶友好性方面更勝一籌。

      猜你喜歡
      詞表標(biāo)引主題詞
      A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會項目名稱漢英對照詞表
      英語世界(2021年13期)2021-01-12 05:47:51
      檔案主題標(biāo)引與分類標(biāo)引的比較分析
      本刊對來稿中關(guān)鍵詞標(biāo)引的要求
      敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
      本刊對來稿中關(guān)鍵詞標(biāo)引的要求
      我校學(xué)報第32卷第5期(2014年10月)平均每篇有3.04個21世紀(jì)的Ei主題詞
      我校學(xué)報第32卷第6期(2014年12月)平均每篇有3.00個21世紀(jì)的Ei主題詞
      2014年第16卷第1~4期主題詞索引
      《疑難病雜志》2014年第13卷主題詞索引
      本刊對來稿中關(guān)鍵詞標(biāo)引的要求
      威海市| 东兴市| 江陵县| 宿迁市| 马尔康县| 德清县| 榆树市| 泰来县| 依安县| 同仁县| 广安市| 皋兰县| 阜平县| 石棉县| 玛曲县| 南昌市| 武夷山市| 临海市| 恩施市| 丹棱县| 桂东县| 建湖县| 运城市| 富宁县| 始兴县| 方城县| 泽州县| 武冈市| 阳原县| 洛隆县| 巨野县| 杭锦旗| 白水县| 湛江市| 湖州市| 常熟市| 高邑县| 徐闻县| 志丹县| 石嘴山市| 嵊泗县|