• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      國(guó)內(nèi)外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究比較分析*

      2020-03-30 13:53:18李朝陽(yáng)龐弘燊
      圖書館研究 2020年1期
      關(guān)鍵詞:圖情發(fā)文關(guān)聯(lián)

      李朝陽(yáng) ,龐弘燊

      (1.嶺南師范學(xué)院圖書館,廣東 湛江 524048;2.深圳大學(xué)圖書館,廣東 深圳 518060;3.中國(guó)科學(xué)技術(shù)信息研究所,北京 100038)

      Linked data(關(guān)聯(lián)數(shù)據(jù))一詞,最早于2006年由萬(wàn)維網(wǎng)主席Tim Berners-Lee在一個(gè)語(yǔ)義網(wǎng)項(xiàng)目會(huì)議上提出。2009年,TED會(huì)議上他提出了關(guān)聯(lián)數(shù)據(jù)三個(gè)精簡(jiǎn)原則[1]。2011年,Tim Berners-Lee等正式以論文的形式給予系統(tǒng)闡述。關(guān)聯(lián)數(shù)據(jù)是web用來(lái)在不同來(lái)源的數(shù)據(jù)庫(kù)之間創(chuàng)建類型鏈接。這里的不同數(shù)據(jù)源,可能是不同地理位置上的兩個(gè)組織維護(hù)的數(shù)據(jù)庫(kù),也可以是自一個(gè)組織內(nèi)部的異構(gòu)系統(tǒng),雖然他們不能進(jìn)行數(shù)據(jù)級(jí)別的互操作,但它們很可能存在著關(guān)聯(lián)[2]。Linked data(關(guān)聯(lián)數(shù)據(jù))一詞一經(jīng)興起,圖情領(lǐng)域立即引入。2008年Brooks,Terrence A在電子期刊發(fā)文將Linked open data概念正式引入圖情領(lǐng)域[3];2009年Bradley等最先在紙質(zhì)期刊發(fā)文闡述Linked data[4];2009年姚小樂(lè)、劉煒等最先將Linked data(關(guān)聯(lián)數(shù)據(jù))一詞正式引入中國(guó)[5],關(guān)聯(lián)數(shù)據(jù)研究在行業(yè)內(nèi)迅速風(fēng)靡。但是由于本體研究、語(yǔ)義網(wǎng)檢索技術(shù)、大數(shù)據(jù)和云計(jì)算等新興互聯(lián)網(wǎng)技術(shù)發(fā)展水平,館藏資源數(shù)字化程度,學(xué)科發(fā)展水平上存在差異,國(guó)內(nèi)外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究在發(fā)展進(jìn)程、技術(shù)水平、內(nèi)容和深度上也不盡相同。本文選取2009-2018年間,國(guó)內(nèi)CSSCI和國(guó)外WOS數(shù)據(jù)庫(kù)相關(guān)研究文獻(xiàn),利用文獻(xiàn)計(jì)量學(xué)方法和SATI;Citespace等分析工具,從發(fā)文趨勢(shì)、核心作者、研究機(jī)構(gòu)、合作關(guān)系、熱點(diǎn)等方面對(duì)其進(jìn)行科學(xué)計(jì)量和分析,為我國(guó)圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)的研究提供指導(dǎo)。

      1 數(shù)據(jù)來(lái)源與研究方法

      1.1 數(shù)據(jù)來(lái)源

      在CNKI期刊頁(yè)面中,選中文獻(xiàn)分類目錄“圖書情報(bào)與數(shù)字圖書館”和來(lái)源類別“CSSCI”,以主題詞=“關(guān)聯(lián)數(shù)據(jù)”或者“開放關(guān)聯(lián)數(shù)據(jù)”,其他不勾選,經(jīng)過(guò)瀏覽題名、關(guān)鍵詞和摘要等題錄信息,人工篩選和剔除無(wú)效文獻(xiàn)后,得到期刊文獻(xiàn)450篇,根據(jù)后期分析工具格式的要求,導(dǎo)出RefWorks和EndNote格式文本題錄信息,并以“download_***”開頭命名,以便軟件識(shí)別。在WOS核心集中,以主題詞=(“l(fā)inked data”)OR(“l(fā)inked open data”)OR(“LOD”),其他不勾選,限定學(xué)科類別“INFORMATION SCIENCE LIBRARY SCIENCE”和文獻(xiàn)類型“ARTICLE”,得到相關(guān)文獻(xiàn)256篇,根據(jù)后期分析工具的要求,導(dǎo)出html格式文本和純文本題錄信息。檢索時(shí)間均為2019年1月18日。發(fā)文年度均為“2009-2018”。

      1.2 研究方法和思路

      本文主要采用了統(tǒng)計(jì)分析、社會(huì)網(wǎng)絡(luò)分析、共現(xiàn)聚類分析、對(duì)比分析等分析方法。利用分析工具統(tǒng)計(jì)分析發(fā)文趨勢(shì)、核心作者、主要研究機(jī)構(gòu)、關(guān)鍵詞等數(shù)據(jù)。社會(huì)網(wǎng)絡(luò)分析用于作者合作關(guān)系和機(jī)構(gòu)合作關(guān)系分析。關(guān)鍵詞共現(xiàn)聚類分析主要用來(lái)反映主題之間親疏關(guān)系和結(jié)構(gòu)。對(duì)比分析主要是將國(guó)內(nèi)外研究從各方面進(jìn)行對(duì)比,試圖找出各自研究特點(diǎn)和規(guī)律。將CNKI和WOS下載的數(shù)據(jù)分別導(dǎo)入SATI和Citespace進(jìn)行統(tǒng)計(jì)和分析,研究思路見圖1。

      圖1 研究思路與框架

      圖2 國(guó)內(nèi)外年度發(fā)文趨勢(shì)圖

      2 中外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究現(xiàn)狀

      2.1 年度發(fā)文分析

      圖2中國(guó)內(nèi)外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)的研究論文,基本符合普賴斯文獻(xiàn)指數(shù)增長(zhǎng)規(guī)律和文獻(xiàn)邏輯增長(zhǎng)規(guī)律,國(guó)內(nèi)外在該領(lǐng)域的研究幾乎同時(shí)起步,研究逐步深入,同步發(fā)展。2009-2018年分為四個(gè)階段。研究初始階段(國(guó)內(nèi)2012年前,國(guó)外2013年前),受學(xué)術(shù)趨勢(shì)影響,關(guān)聯(lián)數(shù)據(jù)從誕生開始,與圖情學(xué)科研究交叉滲透,發(fā)文量穩(wěn)步增長(zhǎng)。研究停滯階段(國(guó)內(nèi)201-2013,國(guó)外2013-2014),受外界社會(huì)、資金、技術(shù)和人力等因素的制約,發(fā)文量出現(xiàn)停滯倒退現(xiàn)象。研究爆發(fā)階段(國(guó)內(nèi)2013-2015,國(guó)外2014-2015),制約因素取得突破,發(fā)文量爆發(fā)式增長(zhǎng)。研究相對(duì)成熟階段(國(guó)內(nèi)外均為2015-2017),增長(zhǎng)率變小,曲線變得平緩,這一時(shí)期文獻(xiàn)壽命長(zhǎng),對(duì)后期學(xué)科領(lǐng)域發(fā)展貢獻(xiàn)大。2017年后,國(guó)內(nèi)外發(fā)文量增長(zhǎng)再次受到外界因素制約呈下降趨勢(shì),停滯現(xiàn)象再次出現(xiàn),但突破也在形成,研究人員要抓住機(jī)遇。普賴斯提出隨著科研人數(shù)n的增長(zhǎng),科研文獻(xiàn)量以√n數(shù)量增長(zhǎng)。科研人員參與度制約因素主要有:學(xué)術(shù)趨勢(shì)、碩博士和職稱發(fā)文要求、科研經(jīng)費(fèi)支持度、研究范圍細(xì)分和擴(kuò)大、學(xué)科交叉滲透、技術(shù)突破和應(yīng)用拓展。技術(shù)突破對(duì)關(guān)聯(lián)數(shù)據(jù)的深入研究至關(guān)重要,通過(guò)對(duì)信息學(xué)科文獻(xiàn)的分析,我們發(fā)現(xiàn)圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究是伴隨語(yǔ)義網(wǎng)搜索技術(shù)、數(shù)據(jù)挖掘、云計(jì)算、大數(shù)據(jù)和數(shù)字圖書館技術(shù)等的發(fā)展而發(fā)展的,著重于數(shù)據(jù)關(guān)系的發(fā)現(xiàn)、建立和利用。并隨著虛擬技術(shù)、物聯(lián)網(wǎng)技術(shù)、應(yīng)用平臺(tái)等的發(fā)展,逐漸由數(shù)據(jù)向?qū)嶓w服務(wù)轉(zhuǎn)變。

      表1 國(guó)內(nèi)外核心作者發(fā)文統(tǒng)計(jì)表

      2.2 作者及合作度分析

      通過(guò)Citespace分析國(guó)內(nèi)作者夏翠娟、劉煒、陳濤、張磊、張春景等;畢強(qiáng)、牟冬梅、張艷俠、黃麗麗、趙夷平、孫中秋、沈涌等;歐石燕、胡珊、周宇等;夏立新和王忠義;邢啟迪、景然、耿騫等;司莉和李鑫;李欣和張毅;李春旺和蔣世銀;姜恩波和王振榮合作關(guān)系密切。國(guó)外作者Salvador Sanchezal和Jose A Senso、Sandor Dominguezvelasco、Miguelangel Sicilia、Amed Leivamederos等;Ceri Binding和douglas Tudhope合作關(guān)系密切。

      文獻(xiàn)計(jì)量學(xué)通常用合作度和合著率來(lái)衡量論文合作情況。一般來(lái)說(shuō)合作度越高科研合作越緊密;合著率越高學(xué)科發(fā)展水平就越高。具體領(lǐng)域計(jì)算公式:

      利用SATI統(tǒng)計(jì)分析,國(guó)內(nèi)外作者總數(shù)分別為630人和368人;國(guó)內(nèi)外論文總數(shù)分別為450篇和256篇;國(guó)內(nèi)外合作論文數(shù)分別為315篇和172篇。計(jì)算得出,十年內(nèi)國(guó)內(nèi)外合作度分別為1.4和1.44,合著率分別為70.0%和67.2%,為了比較趨勢(shì),又計(jì)算得2018年國(guó)內(nèi)圖情領(lǐng)域所有CSSCI期刊論文合作度和合著率分別為1.31和61.7%,從作者間交流合作頻繁、互動(dòng)密切表明了國(guó)內(nèi)外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究合作緊密和研究水平較高。

      2.3 機(jī)構(gòu)及合作度分析

      通過(guò)Citespace分析國(guó)內(nèi)機(jī)構(gòu)中科院系統(tǒng)、大學(xué)系統(tǒng)和公共圖書館系統(tǒng)之間合作關(guān)系緊密。國(guó)外 Univ Washington、Univ Florence、IBM 等;Univ Brasilia、Univ Fed Espirito Santo、Univ Estadual Paulista等;Univ Politecn Valencia和Univ Murcia等;Univ Maryland、Univ Stanford、Univ Rice等機(jī)構(gòu)合作緊密。

      表2 國(guó)內(nèi)外機(jī)構(gòu)發(fā)文統(tǒng)計(jì)表

      SATI、citespace分析不能區(qū)分機(jī)構(gòu)細(xì)小文字上的差異,人工合并得到表2。分析國(guó)內(nèi)外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究機(jī)構(gòu)呈現(xiàn)三個(gè)特點(diǎn):

      系統(tǒng)內(nèi)機(jī)構(gòu)追隨效應(yīng),追隨系統(tǒng)內(nèi)主要機(jī)構(gòu)和研究者。中國(guó)科學(xué)院(包含中科院的國(guó)家科學(xué)圖書館、文獻(xiàn)情報(bào)中心、大學(xué)、科研所等)不僅技術(shù)強(qiáng)而且信息溝通流暢,所以交叉學(xué)科研究時(shí)發(fā)展迅速;圖情領(lǐng)域傳統(tǒng)強(qiáng)校南京大學(xué)、武漢大學(xué)、吉林大學(xué)科研教學(xué)實(shí)力強(qiáng)大,穩(wěn)居前列;上海圖書館研究者最先將關(guān)聯(lián)數(shù)據(jù)引入,同是公共館系統(tǒng)的國(guó)家圖書館發(fā)文量緊隨其后。

      地區(qū)內(nèi)機(jī)構(gòu)協(xié)同合作效應(yīng),地區(qū)內(nèi)主要研究機(jī)構(gòu)和研究者協(xié)同合作。如中科院、國(guó)家圖書館同處北京;南京大學(xué)、東南大學(xué)同處南京;武漢大學(xué)、華中師范大學(xué)同處武漢;上海圖書館和華東師范大學(xué)同處上海,溝通合作便利,發(fā)文合作較多。國(guó)外西班牙和美國(guó)是最主要的研究國(guó)家。

      機(jī)構(gòu)學(xué)術(shù)傳承效應(yīng),繼承前期成果發(fā)展相關(guān)研究。西班牙Univ Murcia、美國(guó)Univ Illinois、中國(guó)武漢大學(xué)、南京大學(xué)等在本體研究、語(yǔ)義網(wǎng)等方面研究排名靠前。本體研究領(lǐng)域的上海圖書館夏翠娟、吉林大學(xué)畢強(qiáng)、牟冬梅也是關(guān)聯(lián)數(shù)據(jù)研究的主要參與者。此外,個(gè)人貢獻(xiàn)也不可忽視。山西大學(xué)國(guó)內(nèi)排名靠前,賈君枝貢獻(xiàn)巨大,但是其碩士和博士學(xué)位都是在武漢大學(xué)取得,可以說(shuō)還有系統(tǒng)內(nèi)機(jī)構(gòu)追隨效應(yīng)和學(xué)術(shù)傳承效應(yīng)的影響。

      3 基本理論、技術(shù)工具及應(yīng)用領(lǐng)域分析

      3.1 熱點(diǎn)關(guān)鍵詞聚類及詞頻表

      利用SATI共抽取中文關(guān)鍵詞934個(gè),西文關(guān)鍵詞755個(gè),人工合并同義詞、近義詞,刪除無(wú)意義的詞匯,取前30的關(guān)鍵詞降序生成表3。同時(shí)利用Citespace進(jìn)行關(guān)鍵詞聚類分析得到圖3和圖4。結(jié)合分析將研究熱點(diǎn)劃分為三大領(lǐng)域:基本理論研究、技術(shù)方法和工具研究、應(yīng)用研究。

      表3 國(guó)內(nèi)外研究熱點(diǎn)關(guān)鍵詞詞頻表

      圖3 國(guó)內(nèi)研究關(guān)鍵詞聚類

      圖4 國(guó)外研究關(guān)鍵詞聚類

      3.2 基本理論研究

      國(guó)內(nèi)圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)基本理論研究主要集中在關(guān)聯(lián)數(shù)據(jù)的概念、特點(diǎn)、基本原則、模型、應(yīng)用、技術(shù)、前景和挑戰(zhàn)等方面。劉煒探討了關(guān)聯(lián)數(shù)據(jù)概念、基本內(nèi)涵、技術(shù)實(shí)現(xiàn)和當(dāng)前國(guó)內(nèi)外的研究應(yīng)用狀況。[7]肖強(qiáng),鄭立新等探討了關(guān)聯(lián)數(shù)據(jù)的概念、原則、發(fā)布方式、發(fā)布工具、應(yīng)用及面臨的挑戰(zhàn)。[8]林海青,樓向英,夏翠娟等探討了關(guān)聯(lián)數(shù)據(jù)發(fā)布、消費(fèi)、服務(wù)和平臺(tái)等四種模式。[9]國(guó)內(nèi)基本理論多為綜述性文章,沒(méi)有通過(guò)判斷和推理,將關(guān)聯(lián)數(shù)據(jù)的概念、范疇、原理、邏輯體系等基本理論內(nèi)容與圖情學(xué)科形成深度融合和發(fā)展。

      國(guó)內(nèi)基本理論研究有三個(gè)新的趨向,一是由描述、發(fā)布關(guān)聯(lián)數(shù)據(jù)向利用、消費(fèi)和平臺(tái)建設(shè)轉(zhuǎn)換,更為注重實(shí)際效果。二是由組織和管理關(guān)聯(lián)數(shù)據(jù)逐漸向互聯(lián)、匹配和聚合的技術(shù)方法方向轉(zhuǎn)換,研究更為深入。三是以資源描述RDA為基礎(chǔ),為各應(yīng)用領(lǐng)域搭建資源描述框架和建立行業(yè)規(guī)范,更為注重拓展應(yīng)用。國(guó)外較早的完成了基于信息生命周期的關(guān)聯(lián)數(shù)據(jù)從描述、發(fā)布、組織、檢索和消費(fèi)的基本理論研究,目前研究多和實(shí)踐項(xiàng)目、技術(shù)、工具和方法相融合,來(lái)拓展關(guān)聯(lián)數(shù)據(jù)研究的邏輯體系和應(yīng)用范圍。如:利用關(guān)聯(lián)數(shù)據(jù)方法對(duì)元數(shù)據(jù)上下級(jí)關(guān)系發(fā)現(xiàn)[10];建立異構(gòu)數(shù)字資源語(yǔ)義互操作框架[11];進(jìn)行社交領(lǐng)域的情感識(shí)別[12]和智慧政府的建設(shè)[13]等等。

      3.3 技術(shù)方法和工具研究

      關(guān)聯(lián)書目信息處理技術(shù)、方法和工具。關(guān)鍵詞如CNMARC、MARC、FRBR、Bibframe[14]、SchemaBibEx[15]等。

      關(guān)聯(lián)數(shù)據(jù)的描述、組織、存儲(chǔ)、轉(zhuǎn)化、定位、運(yùn)算、發(fā)布、發(fā)現(xiàn)、檢索等技術(shù)和工具,可分為基礎(chǔ)層技術(shù)、工具層技術(shù)和應(yīng)用層技術(shù)。如:可擴(kuò)展標(biāo)記語(yǔ)言XML、統(tǒng)一資源定位符URL、資源描述與檢索技術(shù)RDA[16]、資源描述框架RDF[17]、知識(shí)組織系統(tǒng)KOS[18]、簡(jiǎn)單知識(shí)組織系統(tǒng) SKOS、網(wǎng)絡(luò)知識(shí)組織系統(tǒng)NKOS、中國(guó)網(wǎng)絡(luò)知識(shí)組織系統(tǒng)CNKOS、鏈接工具Silk和LIMES[19]、開放源代碼數(shù)字存儲(chǔ)系統(tǒng)Dspace、RDF查詢語(yǔ)言和協(xié)議SPARQL、關(guān)系數(shù)據(jù)庫(kù)間轉(zhuǎn)換D2R語(yǔ)言、關(guān)聯(lián)數(shù)據(jù)映射語(yǔ)言R2R、Web數(shù)據(jù)到RDF數(shù)據(jù)轉(zhuǎn)換框架W2R、互操作OAI-ORE技術(shù)、web信息處理OWL語(yǔ)言、RDF的數(shù)據(jù)庫(kù)系統(tǒng)處理軟件Virtuoso、大規(guī)模數(shù)據(jù)集運(yùn)算工具M(jìn)apReduce、發(fā)布技術(shù) Drupal[20]、模塊化關(guān)聯(lián)數(shù)據(jù)客戶端Rdfizer、RDF數(shù)據(jù)關(guān)系發(fā)現(xiàn)工具RelFinder。

      特定領(lǐng)域內(nèi)關(guān)聯(lián)數(shù)據(jù)應(yīng)用技術(shù)。圖書館元數(shù)據(jù)發(fā)布eXtensible Catalog[21]、維基百科結(jié)構(gòu)化信息提取工具DBpedia、中文百科結(jié)構(gòu)化信息提取工具CN-DBpedia和SinoPedia[22]、美國(guó)國(guó)會(huì)圖書館標(biāo)題表LCSH、中文敘詞表本體共建共享系統(tǒng)OTCSS[23]、中文分詞系統(tǒng) ICTCLAS[24]、關(guān)鍵詞搜索工具Triplify[25]、統(tǒng)一醫(yī)學(xué)語(yǔ)言系統(tǒng) UMLS[26]、中國(guó)科學(xué)家在線 iAuthor[27]等。

      技術(shù)方法和工具研究的共同點(diǎn)是,國(guó)內(nèi)外基礎(chǔ)的技術(shù)都為計(jì)算機(jī)領(lǐng)域著所開發(fā),少數(shù)應(yīng)用領(lǐng)域和圖情領(lǐng)域?qū)<液献鏖_發(fā),如LCSH、OTCSS、UMLS。不同點(diǎn)是多為國(guó)外開發(fā),國(guó)內(nèi)繼承和發(fā)展,如CNMARC、CNKOS、CN-DBpedia、SinoPedia、OTCSS、ICTCLAS、iAuthor,集中在書目、主題詞、敘詞、關(guān)鍵詞、人名等的關(guān)系數(shù)據(jù)的技術(shù)處理,創(chuàng)新較少。

      3.4 應(yīng)用研究

      國(guó)內(nèi)外共同應(yīng)用領(lǐng)域集中在(1)LAM(圖書館、檔案館、博物館)的資源和服務(wù)上,論文關(guān)鍵詞體現(xiàn)在如書目數(shù)據(jù)、詞表控制、元數(shù)據(jù)、數(shù)字圖書館、移動(dòng)圖書館、館藏資源、特藏資源、數(shù)據(jù)庫(kù)、視聽資源、圖片資源、科技報(bào)告、會(huì)議文獻(xiàn)、文化遺產(chǎn)、機(jī)構(gòu)知識(shí)庫(kù)、科學(xué)數(shù)據(jù)、數(shù)據(jù)策展、數(shù)據(jù)監(jiān)護(hù)、數(shù)據(jù)挖掘、數(shù)據(jù)質(zhì)量評(píng)估、知識(shí)管理和服務(wù)、資源發(fā)現(xiàn)、知識(shí)發(fā)現(xiàn)、知識(shí)地圖、圖書館自動(dòng)化系統(tǒng)、參考咨詢服務(wù)、用戶需求、個(gè)性化服務(wù)、數(shù)字人文等。(2)網(wǎng)絡(luò)資源管理和服務(wù)。關(guān)鍵詞體現(xiàn)在門戶導(dǎo)航、推薦系統(tǒng)、信息檢索(移動(dòng)視覺(jué)搜索、語(yǔ)義檢索、自問(wèn)答檢索探索式檢索)、注釋和標(biāo)簽、電子政務(wù)、電子商務(wù)、開放政府、MOOC、開放資源、在線學(xué)習(xí)、web數(shù)據(jù)、大數(shù)據(jù)、云計(jì)算、情感識(shí)別、泛在網(wǎng)絡(luò)等詞語(yǔ)上。(3)其他如人名地名術(shù)語(yǔ)名稱規(guī)范、語(yǔ)義出版、可視化等應(yīng)用領(lǐng)域。同時(shí)也發(fā)現(xiàn)了一些國(guó)外少有涉及的,但是國(guó)內(nèi)獨(dú)有的領(lǐng)域,比如:機(jī)構(gòu)評(píng)價(jià)、學(xué)者和學(xué)術(shù)關(guān)系發(fā)現(xiàn)、家譜、版本關(guān)系、微博、閱讀推廣、智慧圖書館、智庫(kù)等應(yīng)用領(lǐng)域。

      而國(guó)外獨(dú)有且國(guó)內(nèi)少有涉及領(lǐng)域包括:上市公司數(shù)據(jù)、3D、公共衛(wèi)生分析、流行音樂(lè)、社交媒體、考古學(xué)、專業(yè)詞庫(kù)、隱私保護(hù)、詞匯映射、協(xié)同標(biāo)注、地圖、圖像增強(qiáng)、制圖資源、生物醫(yī)藥信息聚合、海洋物種信息聚合、教育資源發(fā)現(xiàn)、課程、政府智能治理、政府預(yù)算、政治選舉、電子外交、立法信息、跨學(xué)科研究等應(yīng)用領(lǐng)域??梢?,國(guó)外圖情領(lǐng)域?qū)﹃P(guān)聯(lián)數(shù)據(jù)研究社會(huì)化應(yīng)用趨勢(shì)更為明顯。

      4 研究發(fā)展路徑和新興領(lǐng)域分析

      4.1 研究發(fā)展路徑及趨勢(shì)

      分析工具做的關(guān)鍵詞突顯分析不能區(qū)分同義詞、近義詞,也不能做相關(guān)數(shù)據(jù)合并處理。本文利用關(guān)鍵詞逐年相異詞矩陣,進(jìn)行應(yīng)用領(lǐng)域發(fā)展路徑和新興領(lǐng)域識(shí)別。分別對(duì)國(guó)內(nèi)外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)新興關(guān)鍵詞及詞頻進(jìn)行統(tǒng)計(jì),并與時(shí)間構(gòu)成矩陣,以2009年產(chǎn)生的關(guān)鍵詞為基準(zhǔn),橫軸表示時(shí)間,縱軸表示新興關(guān)鍵詞及總詞頻,通過(guò)SATI和人工逐年剔除重復(fù)的關(guān)鍵詞,最終呈現(xiàn)每年新興關(guān)鍵詞及總詞頻,從而追蹤應(yīng)用領(lǐng)域拓展情況和識(shí)別新興領(lǐng)域爆發(fā)情況,這樣既能逐年全面追蹤又能增加主題識(shí)別準(zhǔn)確度,見圖5和圖6。

      圖5 國(guó)內(nèi)應(yīng)用領(lǐng)域發(fā)展路徑逐年相異矩陣圖

      圖6 國(guó)外應(yīng)用領(lǐng)域發(fā)展路徑逐年相異矩陣圖

      分析發(fā)現(xiàn)圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究國(guó)外和國(guó)內(nèi)相比有四個(gè)特點(diǎn):(1)理論研究逐步深入。逐步對(duì)信息生命周期各階段關(guān)聯(lián)數(shù)據(jù)角色定位展開研究;從開發(fā)和發(fā)展關(guān)聯(lián)數(shù)據(jù)的描述、索引、組織、發(fā)布和檢索等的工具,走向著重解決關(guān)聯(lián)數(shù)據(jù)的可管理性、可重用性、可共享性、可交換性和互操作性的研究。(2)技術(shù)引領(lǐng)應(yīng)用。通過(guò)MARC、BIBFRAME、RDA、RDF、SKOS、D2R、DHC、SPARQL、Drupal、DBpedia等信息資源創(chuàng)建、組織和發(fā)布的技術(shù)或工具,引導(dǎo)應(yīng)用的發(fā)展;(3)社會(huì)化應(yīng)用趨勢(shì)增強(qiáng)。從在LAM(圖書館、檔案館、博物館)的應(yīng)用開始,漸漸注重社會(huì)化應(yīng)用,如在政治、經(jīng)濟(jì)、文化、醫(yī)藥、衛(wèi)生、法律等領(lǐng)域的應(yīng)用;(4)研究方法理論聯(lián)系實(shí)踐增強(qiáng)。多以項(xiàng)目和案例形式開展研究。

      4.2 新興領(lǐng)域及要解決的問(wèn)題

      需要關(guān)注的新興主題領(lǐng)域主要有:

      (1)關(guān)注關(guān)聯(lián)數(shù)據(jù)本身。相關(guān)性理論模型和規(guī)則制定、數(shù)據(jù)或數(shù)據(jù)集自動(dòng)分類和類簇構(gòu)建、數(shù)據(jù)及數(shù)據(jù)集處理、數(shù)據(jù)聚合質(zhì)量和誤差、行業(yè)詞表、潛在語(yǔ)義分析、語(yǔ)義融合、知識(shí)孵化、跨語(yǔ)言數(shù)據(jù)匹配等。(2)關(guān)注技術(shù)采用??鐜?kù)數(shù)據(jù)轉(zhuǎn)化器、大數(shù)據(jù)處理、共享云平臺(tái)、數(shù)據(jù)監(jiān)護(hù)、可配置計(jì)算、人工智能、視覺(jué)搜索、詞庫(kù)管理工具等。(3)關(guān)注在圖書館的應(yīng)用。智慧圖書館、智慧服務(wù)、讀者行為分析、用戶生成內(nèi)容、協(xié)同信息推送、推薦系統(tǒng)、協(xié)同標(biāo)引、學(xué)術(shù)鏈接、開放引文語(yǔ)料庫(kù)、信息揭示影響機(jī)制等。(4)關(guān)注社會(huì)化應(yīng)用。智慧政府、智庫(kù)、智能治理、人名或地名消歧、社交網(wǎng)絡(luò)、社交標(biāo)記、情感分析、情景計(jì)算及模擬等。

      通過(guò)分析國(guó)內(nèi)外新興主題2016-2018發(fā)文量,我們發(fā)現(xiàn)和國(guó)外相比目前關(guān)聯(lián)數(shù)據(jù)服務(wù)的實(shí)踐在國(guó)內(nèi)開展較少,同時(shí)發(fā)文量呈現(xiàn)萎縮的趨勢(shì),這與重點(diǎn)問(wèn)題在理論和技術(shù)上沒(méi)有突破有很大關(guān)系。還是要重點(diǎn)解決關(guān)聯(lián)數(shù)據(jù)可管理性、可重用性、可共享性、可交換性和互操作性等問(wèn)題,才能更好的實(shí)現(xiàn)關(guān)聯(lián)數(shù)據(jù)服務(wù)的大面積推廣和應(yīng)用。

      猜你喜歡
      圖情發(fā)文關(guān)聯(lián)
      數(shù)字時(shí)代圖情檔學(xué)科教育的數(shù)據(jù)化創(chuàng)新
      10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
      新文科建設(shè)背景下的圖情檔學(xué)科建設(shè)(筆談)“新文科”呼喚圖情檔成為“硬”學(xué)科
      聚青年學(xué)者之睿智 窺圖情檔學(xué)科之未來(lái)
      ——寫在《圖書與情報(bào)》“圖情檔青年學(xué)者專輯”出版之前
      “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
      校園拾趣
      爺孫趣事
      以牙還牙
      奇趣搭配
      智趣
      讀者(2017年5期)2017-02-15 18:04:18
      靖宇县| 南充市| 沐川县| 哈尔滨市| 曲阳县| 兖州市| 庆安县| 和静县| 睢宁县| 德昌县| 和硕县| 九龙坡区| 襄汾县| 磴口县| 日土县| 台北市| 灌云县| 肥东县| 永丰县| 尚志市| 乌兰浩特市| 武义县| 汉沽区| 固原市| 忻城县| 临朐县| 曲水县| 高要市| 闵行区| 江北区| 武汉市| 晋中市| 罗平县| 恩平市| 汾西县| 津市市| 宾川县| 祁门县| 聂拉木县| 平泉县| 井冈山市|