• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    知識(shí)組織系統(tǒng)構(gòu)建技術(shù)研究

    2018-12-26 04:41:26趙易新
    數(shù)碼設(shè)計(jì) 2018年2期
    關(guān)鍵詞:術(shù)語(yǔ)語(yǔ)義規(guī)則

    趙易新

    (天津港信息技術(shù)發(fā)展有限公司,天津,300450)

    引言

    隨著新技術(shù)、新理念的發(fā)展,當(dāng)前社會(huì)已經(jīng)進(jìn)入到信息化、知識(shí)化的時(shí)期,其中主要的表現(xiàn)在于知識(shí)信息呈幾何式的擴(kuò)展,因此怎樣對(duì)知識(shí)進(jìn)行組織和整合,是當(dāng)前時(shí)代極為重要的問(wèn)題。知識(shí)組織是專(zhuān)門(mén)用來(lái)研究知識(shí)的理論與方法,在知識(shí)的獲取、描述、整合、共享等方面意義重大,下面我們便針對(duì)知識(shí)組織的系統(tǒng)建構(gòu)進(jìn)行考察分析。

    1 知識(shí)組織系統(tǒng)的基本概念簡(jiǎn)述

    所謂“知識(shí)組織系統(tǒng)”,是為了闡釋某種概念、性質(zhì)及相關(guān)概念之間具體聯(lián)系而建立的組織系統(tǒng)。這一系統(tǒng)在概念、概念性質(zhì)及概念間聯(lián)系表達(dá)的基礎(chǔ)上,在特定知識(shí)庫(kù)結(jié)構(gòu)建設(shè)的支持下,將知識(shí)信息加以編排,利用組織系統(tǒng),實(shí)現(xiàn)知識(shí)信息的語(yǔ)義檢索、語(yǔ)義理解和語(yǔ)義導(dǎo)航等操作,從而給各種學(xué)科領(lǐng)域內(nèi)的專(zhuān)家知識(shí)的交流共享提供平臺(tái)。

    2 國(guó)內(nèi)主要知識(shí)組織系統(tǒng)的基本情況

    2.1 中國(guó)知網(wǎng)(CNKI)

    中國(guó)知網(wǎng)是當(dāng)前我國(guó)建設(shè)程度最完善的知識(shí)組織系統(tǒng)之一。知網(wǎng)本身?yè)碛写罅康闹R(shí)信息,在知識(shí)庫(kù)組織建設(shè)上已經(jīng)十分成熟。知網(wǎng)的基本結(jié)構(gòu)表現(xiàn)為“三層知識(shí)網(wǎng)絡(luò)”,集合了“基本知識(shí)庫(kù)”、“資源倉(cāng)庫(kù)”、“知識(shí)元庫(kù)”,能夠?qū)τ脩?hù)提供數(shù)據(jù)資源智能化的挖掘與供給,并以知識(shí)組織系統(tǒng)的方式提供知識(shí)組織、搭建知識(shí)之間聯(lián)系的作用。在給用戶(hù)提供知識(shí)檢索的基本服務(wù)外,能夠快速提供相似的文獻(xiàn)連接、文獻(xiàn)引用服務(wù)、文獻(xiàn)來(lái)源查詢(xún)等功能。

    2.2 萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)

    萬(wàn)方數(shù)據(jù)知識(shí)服務(wù)平臺(tái)是國(guó)內(nèi)另一大主要的知識(shí)組織系統(tǒng)。較中國(guó)知網(wǎng),萬(wàn)方提供的知識(shí)服務(wù)大致有三大類(lèi):(1)知識(shí)脈絡(luò)的分析。該服務(wù)以用戶(hù)輸入的主題詞為中心,通過(guò)統(tǒng)計(jì)分析數(shù)據(jù)庫(kù)內(nèi)論文知識(shí)節(jié)點(diǎn)間共現(xiàn)關(guān)系,以直觀可視化的方式,為用戶(hù)展示知識(shí)節(jié)點(diǎn)的變化過(guò)程。(2)行業(yè)知識(shí)在線(xiàn)服務(wù)。該服務(wù)依托萬(wàn)方巨大的知識(shí)庫(kù),參照用戶(hù)的行為特點(diǎn),在科學(xué)組織、合理分類(lèi)的基礎(chǔ)上,給用戶(hù)提供專(zhuān)業(yè)的行業(yè)知識(shí)。(3)專(zhuān)利分析。該服務(wù)建立在專(zhuān)利信息及情報(bào)分析與知識(shí)挖掘的基礎(chǔ)上,對(duì)專(zhuān)利信息展開(kāi)多維度的統(tǒng)計(jì)分析,繼而實(shí)現(xiàn)定量化的智能分析,再將分析結(jié)果以表格等方式呈獻(xiàn)給用戶(hù)。

    3 知識(shí)組織的設(shè)計(jì)和應(yīng)用分析

    3.1 知識(shí)組織系統(tǒng)建設(shè)理念

    所謂“知識(shí)組織”,即進(jìn)行知識(shí)的加工整理及表示控制,并將之組織化。而“知識(shí)組織系統(tǒng)”則是服務(wù)于知識(shí)組織的,其實(shí)質(zhì)為一套特殊的術(shù)語(yǔ)和符號(hào)體系。知識(shí)服務(wù)系統(tǒng)所涵蓋的內(nèi)容很多,其中分類(lèi)法和主題法是其中兩種主要的方法,在兩種方法之外,延伸出如敘詞表、詞匯系統(tǒng)等多種方法,是當(dāng)前知識(shí)系統(tǒng)的主流展示形式。通過(guò)知識(shí)組織系統(tǒng),實(shí)現(xiàn)知識(shí)數(shù)據(jù)的整理分析,從而提供優(yōu)質(zhì)的知識(shí)服務(wù)。知識(shí)組織系統(tǒng)還可以細(xì)分為總中心系統(tǒng)與分中心系統(tǒng),總中心系統(tǒng)包含了分中心系統(tǒng),通過(guò)不同的系統(tǒng)可以快速獲取希望得到的各種專(zhuān)業(yè)知識(shí)。

    3.2 知識(shí)組織系統(tǒng)的知識(shí)結(jié)構(gòu)設(shè)計(jì)和加工

    就上文所述的基本概念來(lái)看,知識(shí)組織系統(tǒng)實(shí)現(xiàn)知識(shí)整理與檢索的前提在于各種語(yǔ)義詞匯的結(jié)構(gòu)整合,所以詞匯之間的各種關(guān)聯(lián)其實(shí)是知識(shí)組織系統(tǒng)的關(guān)鍵所在,在進(jìn)行知識(shí)結(jié)構(gòu)的設(shè)計(jì)與加工時(shí),要從語(yǔ)義結(jié)構(gòu)及其關(guān)系角度出發(fā),具體來(lái)說(shuō)有以下四點(diǎn)工作內(nèi)容

    (1)語(yǔ)義結(jié)構(gòu)框架設(shè)計(jì)

    語(yǔ)義詞匯:類(lèi)型,包括核心詞及基礎(chǔ)詞等。

    定義及概念:要確保每一個(gè)核心詞至少包含一條定義。

    關(guān)系:語(yǔ)義關(guān)系是對(duì)稱(chēng)的,而屬分關(guān)系則是不對(duì)稱(chēng)的。在同一類(lèi)屬下,其是傳遞的。

    分類(lèi)映射:按照關(guān)聯(lián)的分類(lèi)方法置,映射可以設(shè)定為多維度分類(lèi)的方式。

    性質(zhì):按照相關(guān)的知識(shí)領(lǐng)域及服務(wù)要求加以設(shè)定。

    (2)語(yǔ)義關(guān)系的類(lèi)型設(shè)計(jì)

    語(yǔ)義關(guān)系:分為同義語(yǔ)義、近義語(yǔ)義及反義語(yǔ)義三種。

    等級(jí)關(guān)系:分為類(lèi)屬、整體、實(shí)例三種。

    相關(guān)關(guān)系

    (3)術(shù)語(yǔ)自動(dòng)抽取技術(shù)

    術(shù)語(yǔ)的自動(dòng)抽?。ㄗ詣?dòng)識(shí)別)即在特定領(lǐng)域的文獻(xiàn)中抽取代表該領(lǐng)域核心理念的術(shù)語(yǔ)詞匯,術(shù)語(yǔ)自動(dòng)抽取展開(kāi)的過(guò)程如下:

    第一、完成擬抽取領(lǐng)域的文獻(xiàn)整合;第二、領(lǐng)域文獻(xiàn)的語(yǔ)料預(yù)處理,包括分詞及詞性的標(biāo)注、語(yǔ)料轉(zhuǎn)換等步驟;第三、從語(yǔ)料中篩選出候選的術(shù)語(yǔ);第四、通過(guò)一定的語(yǔ)法規(guī)則、統(tǒng)計(jì)規(guī)則及通用詞表等,對(duì)候選術(shù)語(yǔ)再識(shí)別,得到領(lǐng)域相關(guān)的術(shù)語(yǔ)列表。

    就術(shù)語(yǔ)自動(dòng)抽取技術(shù)來(lái)說(shuō),目前主要的辦法有三種:基于規(guī)則的方法、基于統(tǒng)計(jì)的方法及二者(規(guī)則、統(tǒng)計(jì))相結(jié)合的方法?;谝?guī)則的辦法基本利用了術(shù)語(yǔ)詞典和規(guī)則模板實(shí)現(xiàn)術(shù)語(yǔ)篩選,該辦法針對(duì)那些符合規(guī)則的特定術(shù)語(yǔ)效果較好。基于統(tǒng)計(jì)的辦法利用了統(tǒng)計(jì)學(xué)的原理,通過(guò)術(shù)語(yǔ)在語(yǔ)料庫(kù)中的分布統(tǒng)計(jì)情況來(lái)實(shí)現(xiàn)術(shù)語(yǔ)的篩選,該辦法的優(yōu)勢(shì)在于適應(yīng)性強(qiáng),但是術(shù)語(yǔ)篩選的準(zhǔn)確度仍要改進(jìn)。規(guī)則、統(tǒng)計(jì)相結(jié)合辦法首先利用語(yǔ)法規(guī)則篩選出候選術(shù)語(yǔ),再利用統(tǒng)計(jì)學(xué)原理進(jìn)行再次篩選,即綜合了上述兩種辦法的優(yōu)點(diǎn),在準(zhǔn)確度方面表現(xiàn)地更為良好。

    目前主流的術(shù)語(yǔ)自動(dòng)抽取方法主要分為3 類(lèi):基于規(guī)則的方法、基于統(tǒng)計(jì)的方法以及統(tǒng)計(jì)與規(guī)則相結(jié)合的方法?;谝?guī)則的方法主要利用術(shù)語(yǔ)詞典和規(guī)則模板來(lái)進(jìn)行術(shù)語(yǔ)抽取,這類(lèi)方法對(duì)符合規(guī)則的某些特定類(lèi)型的術(shù)語(yǔ)抽取具有良好的效果?;诮y(tǒng)計(jì)的方法以統(tǒng)計(jì)學(xué)理論為基礎(chǔ),利用術(shù)語(yǔ)已經(jīng)在語(yǔ)料庫(kù)中的分布統(tǒng)計(jì)屬性來(lái)識(shí)別術(shù)語(yǔ),該方法適應(yīng)性更強(qiáng),實(shí)用性更好,但在術(shù)語(yǔ)抽取的準(zhǔn)確率上還有待提高。統(tǒng)計(jì)與規(guī)則相結(jié)合的方法先是通過(guò)語(yǔ)法規(guī)則過(guò)濾出候選術(shù)語(yǔ)列表,再使用統(tǒng)計(jì)學(xué)方法對(duì)候選術(shù)語(yǔ)列表中的術(shù)語(yǔ)進(jìn)行篩選,最終得到最后的候選術(shù)語(yǔ)列表,兩者相結(jié)合可以提高術(shù)語(yǔ)抽取的準(zhǔn)確度。

    總之,術(shù)語(yǔ)自動(dòng)抽取的準(zhǔn)確率及效率越高,則知識(shí)組織系統(tǒng)的建立就越完善、科學(xué),對(duì)此要重視術(shù)語(yǔ)自動(dòng)抽取技術(shù)的發(fā)展。

    4 結(jié)束語(yǔ)

    總而言之,知識(shí)組織系統(tǒng)的搭建和計(jì)算機(jī)技術(shù)、人工智能技術(shù)、檢索技術(shù)、語(yǔ)言處理技術(shù)等密切相關(guān)。在當(dāng)前,過(guò)去的知識(shí)組織系統(tǒng)通過(guò)詞匯標(biāo)引和元數(shù)據(jù)等形式,基本上能夠?qū)崿F(xiàn)知識(shí)資源的檢索與獲取,但是隨著時(shí)代的發(fā)展,知識(shí)組織系統(tǒng)中的資源組織及語(yǔ)義表示等涉及知識(shí)資源分布等方面,需要得到進(jìn)一步的完善。我們期待在今后的研究中,攻克這些問(wèn)題,為我國(guó)學(xué)術(shù)事業(yè)發(fā)展貢獻(xiàn)力量。

    [1]畢強(qiáng).數(shù)字圖書(shū)館知識(shí)組織系統(tǒng)建構(gòu)的發(fā)展趨勢(shì)——從機(jī)器可讀到機(jī)器可理解[J].國(guó)家圖書(shū)館學(xué)刊, 2010, 19(1):12-17.

    [2]黃日昆, 陳永騰, 孫逸玲.自主創(chuàng)新能力的助長(zhǎng)劑—“中國(guó)知網(wǎng)”《中國(guó)知識(shí)資源總庫(kù)》及其應(yīng)用[J].圖書(shū)館界, 2006(1):63-67.

    [3]司莉, 徐麗曉, 陳紅艷.知識(shí)組織系統(tǒng)在我國(guó)數(shù)字圖書(shū)館中的應(yīng)用及界面研究[J].情報(bào)科學(xué), 2007, 25(3):445-450.

    [4]徐興文.我國(guó)企業(yè)社會(huì)工作研究文獻(xiàn)綜述——基于CNKI與萬(wàn)方數(shù)據(jù)庫(kù)的文獻(xiàn)分析[J].企業(yè)導(dǎo)報(bào), 2010(10):235-236.

    [5]張運(yùn)良, 梁健, 朱禮軍,等.基于術(shù)語(yǔ)定義的科技知識(shí)組織系統(tǒng)自動(dòng)豐富關(guān)鍵技術(shù)研究[J].現(xiàn)代圖書(shū)情報(bào)技術(shù), 2010, 26(7):66-71.

    猜你喜歡
    術(shù)語(yǔ)語(yǔ)義規(guī)則
    撐竿跳規(guī)則的制定
    數(shù)獨(dú)的規(guī)則和演變
    語(yǔ)言與語(yǔ)義
    讓規(guī)則不規(guī)則
    Coco薇(2017年11期)2018-01-03 20:59:57
    TPP反腐敗規(guī)則對(duì)我國(guó)的啟示
    “上”與“下”語(yǔ)義的不對(duì)稱(chēng)性及其認(rèn)知闡釋
    認(rèn)知范疇模糊與語(yǔ)義模糊
    有感于幾個(gè)術(shù)語(yǔ)的定名與應(yīng)用
    從術(shù)語(yǔ)學(xué)基本模型的演變看術(shù)語(yǔ)學(xué)的發(fā)展趨勢(shì)
    語(yǔ)義分析與漢俄副名組合
    长阳| 于田县| 黔西| 新绛县| 梧州市| 泉州市| 阿城市| 陆河县| 眉山市| 太康县| 大足县| 阿勒泰市| 沅陵县| 本溪市| 清水河县| 岳普湖县| 忻州市| 宜黄县| 敦煌市| 潍坊市| 庄浪县| 抚顺县| 绥芬河市| 望城县| 保定市| 澳门| 游戏| 五莲县| 绥德县| 芦溪县| 监利县| 合山市| 炎陵县| 河北区| 瓦房店市| 桃园市| 孟津县| 牙克石市| 芦山县| 疏附县| 疏勒县|