• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    計(jì)量學(xué)主題詞表詞間關(guān)系構(gòu)建方法探析

    2014-12-11 03:46:11張明李麗劉羿彤潘峰陽(yáng)彩軍
    中國(guó)科技縱橫 2014年22期
    關(guān)鍵詞:查全率計(jì)量學(xué)詞表

    張明 李麗 劉羿彤 潘峰 陽(yáng)彩軍

    (中國(guó)計(jì)量科學(xué)研究院 信息與實(shí)驗(yàn)室條件保障部,北京 100013)

    計(jì)量學(xué)主題詞表詞間關(guān)系構(gòu)建方法探析

    張明 李麗 劉羿彤 潘峰 陽(yáng)彩軍

    (中國(guó)計(jì)量科學(xué)研究院 信息與實(shí)驗(yàn)室條件保障部,北京 100013)

    為了防止敘詞性漢語(yǔ)主題詞表可能存在的詞義模糊甚至歧義的問(wèn)題,防止在應(yīng)用中出現(xiàn)“誤檢”“漏檢”的現(xiàn)象。在構(gòu)建計(jì)量學(xué)主題詞表時(shí),本文通過(guò)“前方一致”、“后方一致”等方法對(duì)專(zhuān)業(yè)術(shù)語(yǔ)進(jìn)行排序,并針對(duì)不同特征進(jìn)行歸納演繹,有效的獲得了詞間關(guān)系,提高了實(shí)際應(yīng)用中“查準(zhǔn)率”和“查全率”。

    敘詞表 計(jì)量學(xué) 查準(zhǔn)率 查全率

    1 前言

    敘詞表以規(guī)范化的、受控的、動(dòng)態(tài)性的敘詞為基本成分,并以參照系統(tǒng)顯示詞間關(guān)系,主要用于信息的標(biāo)引與檢索。它是通過(guò)代表概念的、來(lái)源于自然語(yǔ)言的具體詞匯實(shí)現(xiàn)[1]。這些詞匯也可以稱(chēng)為術(shù)語(yǔ)或者概念。概念間有一定的關(guān)系,統(tǒng)稱(chēng)為詞間關(guān)系。因此在構(gòu)建主題詞表時(shí),構(gòu)建詞間關(guān)系是一項(xiàng)最重要和基礎(chǔ)性的工作。敘詞表的詞間關(guān)系包括以下三種:等同關(guān)系、等級(jí)關(guān)系和相關(guān)關(guān)系[2]。(1)等同關(guān)系(Equivalence Relationship),用代關(guān)系,這種關(guān)系含有概念相同或用法相同的關(guān)系。揭示等同關(guān)系有利于增加檢索的入口率。(2)等級(jí)關(guān)系(Hierarchical Relationship),又稱(chēng)屬分關(guān)系,這種關(guān)系包含屬種、整部和多層級(jí)關(guān)系,每種層級(jí)關(guān)系的下位詞都必須與上位詞的概念類(lèi)型相同,即兩者都必須屬于同一范疇內(nèi)的事物、行為或性質(zhì)。揭示等級(jí)關(guān)系有助于通過(guò)它擴(kuò)大和縮小查找范圍,提高族性檢索能力。(3)相關(guān)關(guān)系(Associative Relationship),是相互關(guān)聯(lián)的一種關(guān)系。相關(guān)關(guān)系是揭示敘詞間各種主要聯(lián)系、擴(kuò)大檢索范圍、進(jìn)行相關(guān)信息查找的重要手段,揭示相關(guān)關(guān)系有助于提高檢索的查全率[3]。

    2010年,中國(guó)科學(xué)技術(shù)信息研究所啟動(dòng)了《漢語(yǔ)主題詞表》(簡(jiǎn)稱(chēng)《漢表》)的修訂工作。新《漢表》一方面要吸納先前的專(zhuān)業(yè)概念,借鑒已有的參照關(guān)系;更為重要的是充分利用文獻(xiàn)數(shù)據(jù)庫(kù)中的關(guān)鍵詞以及檢索系統(tǒng)中的檢索詞作為敘詞選擇的重要來(lái)源。中國(guó)計(jì)量科學(xué)研究院作為項(xiàng)目組成員單位之一承擔(dān)了計(jì)量學(xué)漢語(yǔ)主題詞表的編制工作。本文從計(jì)量學(xué)的實(shí)際出發(fā),提出一些構(gòu)建詞間關(guān)系的方法以及思考。

    圖3 屬分關(guān)系合并模擬圖

    2 構(gòu)建詞間關(guān)系

    2.1 構(gòu)建原則

    通過(guò)網(wǎng)絡(luò)查詢(xún)信息時(shí),經(jīng)常會(huì)發(fā)現(xiàn)有時(shí)檢索結(jié)果并不滿(mǎn)意,檢索結(jié)果要么太多,要么太少或未能找到自己所需的相關(guān)信息,因此如何選擇恰當(dāng)?shù)臋z索詞,對(duì)用戶(hù)來(lái)說(shuō)是至關(guān)重要的。因而一部具有優(yōu)秀概念和語(yǔ)義工具的主題詞表,帶著其獨(dú)有的知識(shí)組織體系和語(yǔ)義結(jié)構(gòu),在組織信息和查找信息資源,尤其在網(wǎng)絡(luò)數(shù)據(jù)庫(kù)檢索等實(shí)踐應(yīng)用方面,勢(shì)必發(fā)揮著越來(lái)越大的作用,有著重要的現(xiàn)實(shí)意義?;谝陨峡紤],在建設(shè)網(wǎng)絡(luò)版主題詞表時(shí)我們充分考慮這些因素,秉承以下構(gòu)建原則建立詞間關(guān)系。

    (1)準(zhǔn)確性。盡可能的提高檢索的準(zhǔn)確性,即“查準(zhǔn)率”,一方面是盡量減少麻煩。應(yīng)該使讀者在少問(wèn)路的情況下很快找到自己要找的目標(biāo)或?qū)ο蟆?/p>

    (2)直觀性。機(jī)器檢索系統(tǒng)包括計(jì)算機(jī)檢索系統(tǒng)要同人接觸的,人要把自己的檢索要求,檢索詞或由檢索詞構(gòu)成的檢索公式,告訴機(jī)器系統(tǒng),機(jī)器系統(tǒng)要把查找結(jié)果告訴查者。這就不能不考慮查找者的習(xí)慣。因此直觀明了的敘詞更容易被使用者接受。

    (3)通用性。在一個(gè)專(zhuān)業(yè)領(lǐng)域所使用的通用詞是最適用于科技交流和思想交流的,特別是當(dāng)讀者自己在終端進(jìn)行檢索時(shí),這一點(diǎn)就顯得特別重要,因此選擇敘詞的通用性也至關(guān)重要,因此共現(xiàn)詞頻很大程度上也反映了詞語(yǔ)的通用性。

    2.2 構(gòu)建方法

    2.2.1 通過(guò)“前方一致”獲得詞間分類(lèi)

    通過(guò)系統(tǒng)平臺(tái)提供的“前方一致”功能,將相關(guān)敘詞聚類(lèi),并按照2.1原則并結(jié)合貢獻(xiàn)頻次等方法,確定敘詞及屬分關(guān)系。屬分關(guān)系是最常見(jiàn)的關(guān)系,確定的這些敘詞可直接應(yīng)用到敘詞表或本體構(gòu)建中。

    2.2.2 通過(guò)“后方一致”獲得詞間關(guān)系

    建好上下級(jí)關(guān)系之后,我們?cè)诰垲?lèi)詞中通過(guò)“后方一致”來(lái)獲得詞間關(guān)系,對(duì)這些詞進(jìn)行聚會(huì),在同級(jí)詞中通過(guò)演繹法來(lái)構(gòu)建等同級(jí)相關(guān)等關(guān)系[4]。

    2.2.3 對(duì)各種詞間關(guān)系進(jìn)行合并

    對(duì)已經(jīng)分好組建好敘詞的詞之間進(jìn)行關(guān)系合并,在合并過(guò)程中有幾種情況需要處理。

    (1)等同關(guān)系的合并。選定一個(gè)詞為敘詞的前提下,與其他詞設(shè)為等同關(guān)系;在詞匯合并的等同關(guān)系集合里,根據(jù)構(gòu)建敘詞表的選詞規(guī)則重新確定敘詞身份,在合并后的等同關(guān)系詞匯集中,也會(huì)繼承過(guò)來(lái)一些等級(jí)關(guān)系、甚至概念對(duì)立的概念詞匯,具體細(xì)化為等級(jí)關(guān)系,還是保留等同關(guān)系。如圖1所示。

    (2)相關(guān)關(guān)系的合并。如果兩個(gè)敘詞是等同概念,相關(guān)關(guān)系則直接進(jìn)行合并,根據(jù)敘詞選定規(guī)則,重新確定一個(gè)詞為敘詞,另一個(gè)詞為非敘詞,其他詞都改為相關(guān)詞。一般我們按照2.1的原則來(lái)確定敘詞。如圖2所示。

    (3)屬分關(guān)系的合并。等級(jí)關(guān)系的合并從最小的節(jié)點(diǎn)或從最大的節(jié)點(diǎn)均可,通過(guò)人工判斷每個(gè)相同的節(jié)點(diǎn),如果是相同的概念,則在該節(jié)點(diǎn)將兩個(gè)詞族進(jìn)行連接合并去重,該節(jié)點(diǎn)的下位概念或關(guān)系,如果是同等級(jí)別的概念,則以同位類(lèi)關(guān)系合并;如果下位概念不是同位類(lèi)關(guān)系,甚至含有等級(jí)關(guān)系,則應(yīng)該表達(dá)合理的等級(jí)關(guān)系。如圖3所示。

    3 思考

    3.1 擴(kuò)大選詞規(guī)模

    備選詞資源豐富,可以獲得更多的詞間關(guān)系,當(dāng)然也需要更多的人力成本,在人力資源豐富的前提下,擴(kuò)大選詞規(guī)模必然會(huì)獲得更多更完整的詞間關(guān)系,同樣搜索的準(zhǔn)確率查全率都會(huì)隨之提高。

    3.2 確定詞間的等同關(guān)系是核心

    從上述論述中可以看出,詞間關(guān)系的合并大多是通過(guò)等同關(guān)系為契機(jī)點(diǎn)的,所以準(zhǔn)確的找出等同關(guān)系,是處理的核心。要想找出等同概念,途徑有兩條,一是通過(guò)計(jì)算機(jī)匹配,直接找出相同的術(shù)語(yǔ),然后人工判斷是否為等同概念; 二是通過(guò)詞間關(guān)系推薦或推理,通過(guò)人工進(jìn)行確認(rèn)。

    3.3 實(shí)際操作中要結(jié)合應(yīng)用方向,結(jié)合其他的方法進(jìn)行構(gòu)建

    在實(shí)際應(yīng)用,不同的學(xué)科有不同的傾向性,我們?cè)趯?shí)際操作中應(yīng)該結(jié)合本學(xué)科進(jìn)行有針對(duì)性的構(gòu)建詞間關(guān)系,這才應(yīng)該是學(xué)科主題詞表的精髓[5]。

    4 結(jié)語(yǔ)

    構(gòu)建詞間關(guān)系在敘詞表編制中是至關(guān)重要的一部分,在獲得一定數(shù)量的專(zhuān)業(yè)領(lǐng)域術(shù)語(yǔ)以后,我們通過(guò)“前方一致”、“后方一致”等方法對(duì)這些術(shù)語(yǔ)進(jìn)行排序,針對(duì)不同特征的歸納演繹方法,獲得有效的詞間關(guān)系,在實(shí)際應(yīng)用中有極高的使用概率且準(zhǔn)確率高[6]。另外,目前詞間關(guān)系的建立多數(shù)要依靠操作人員的經(jīng)驗(yàn)來(lái)完成,我們應(yīng)該更多的找到機(jī)器識(shí)別的方法,減少人力成本投入,能更好的提高構(gòu)詞效率。

    [1] 劉華,曾建勛,沈玉蘭.網(wǎng)絡(luò)環(huán)境下敘詞表編制標(biāo)準(zhǔn)的國(guó)際發(fā)展趨勢(shì)[J].情報(bào)雜志,2009,28(11).

    [2] 常春,盧文林.敘詞表編制歷史、現(xiàn)狀與發(fā)展[J].農(nóng)業(yè)圖書(shū)情報(bào)學(xué)刊,2002(5).

    [3] 吳雯娜,曾建勛.敘詞表微觀結(jié)構(gòu)的描述與評(píng)價(jià):EI敘詞表與中文敘詞表的對(duì)比分析[J].圖書(shū)情報(bào)工作,2009,53(8).

    [4] 常春,吳雯娜,曾建勛.基于后方一致獲取詞間關(guān)系[J].情報(bào)科學(xué),2009.7.27(7).

    [5] 朱禮軍,趙新力,喬曉東,等.跨領(lǐng)域多來(lái)源主題詞表集成與服務(wù)研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù),2007,(1).

    [6] 吳雯娜,王星.敘詞表融合方法研究[J].中國(guó)圖書(shū)館學(xué)報(bào),2012,4(110).

    In order to prevent Chinese Thesaurus may exist vague even ambiguity and mistake and Omissions in application. When building thesaurus of metrology, Specialty vocabulary is ordered by the method of front unanimous and rear unanimous in this paper, generalized by characteristic. So the relationship towards the vocabulary is got effective, increase the accuracy and coverage.

    thesaurus metrology accuracy coverage class number g253

    張明(1983—),男,北京人,職稱(chēng):館員,學(xué)位:碩士。

    猜你喜歡
    查全率計(jì)量學(xué)詞表
    生物化學(xué)計(jì)量學(xué)原理在離散生物動(dòng)力系統(tǒng)的應(yīng)用
    云南化工(2021年5期)2021-12-21 07:41:34
    針刺治療失眠癥的文獻(xiàn)計(jì)量學(xué)分析
    A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱(chēng)漢英對(duì)照詞表
    海量圖書(shū)館檔案信息的快速檢索方法
    基于詞嵌入語(yǔ)義的精準(zhǔn)檢索式構(gòu)建方法
    敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
    基于科學(xué)計(jì)量學(xué)的公安院??蒲信c評(píng)價(jià)
    2004-2013年中醫(yī)藥治療性早熟的文獻(xiàn)計(jì)量學(xué)分析
    中文分詞技術(shù)對(duì)中文搜索引擎的查準(zhǔn)率及查全率的影響
    國(guó)外敘詞表的應(yīng)用與發(fā)展趨勢(shì)探討*
    江北区| 郁南县| 广水市| 南充市| 彭阳县| 辽宁省| 绍兴县| 柘城县| 新干县| 涟水县| 白朗县| 庆安县| 怀化市| 库车县| 铁岭市| 中山市| 阿坝县| 柳州市| 徐闻县| 海门市| 多伦县| 阿合奇县| 临漳县| 阜新市| 侯马市| 赤水市| 霍林郭勒市| 施甸县| 保定市| 手游| 华坪县| 株洲市| 拜城县| 阳春市| 永安市| 武威市| 托里县| 南部县| 金湖县| 阿勒泰市| 横山县|