• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于數(shù)字資源聚合的學(xué)術(shù)期刊語(yǔ)義出版研究*

    2019-02-20 13:10:01許鑫毛璐江燕青
    數(shù)字圖書(shū)館論壇 2019年7期
    關(guān)鍵詞:本體關(guān)聯(lián)檢索

    許鑫 毛璐 江燕青

    (華東師范大學(xué)經(jīng)濟(jì)與管理學(xué)部,上海 200062)

    隨著科學(xué)技術(shù)的發(fā)展,數(shù)字出版成為目前的主流出版模式,在科學(xué)、技術(shù)和醫(yī)學(xué)領(lǐng)域(Science,Technology and Medicine,STM)發(fā)展迅猛,給科研人員帶來(lái)了豐富的學(xué)術(shù)資源。與此同時(shí),如何幫助科研人員在海量學(xué)術(shù)資源中快速準(zhǔn)確地找到自己所需的信息成為必須考慮的問(wèn)題。大量半結(jié)構(gòu)化、非結(jié)構(gòu)化的數(shù)字資源使得傳統(tǒng)的科學(xué)交流系統(tǒng)無(wú)法滿足科研人員對(duì)數(shù)據(jù)語(yǔ)義的高度要求。而語(yǔ)義網(wǎng)的發(fā)展則為新時(shí)代的學(xué)術(shù)交流創(chuàng)造了條件,并促進(jìn)了語(yǔ)義出版的形成和發(fā)展。目前,基于對(duì)文獻(xiàn)知識(shí)內(nèi)容做結(jié)構(gòu)化處理和發(fā)布的語(yǔ)義出版成為新興出版形式被廣泛關(guān)注。

    2009年語(yǔ)義出版的概念被Shotton[1]提出后,語(yǔ)義出版就成為出版和學(xué)術(shù)界的熱點(diǎn)。語(yǔ)義出版是一種語(yǔ)義增強(qiáng)的出版形式,通過(guò)對(duì)文章內(nèi)容和形式進(jìn)行語(yǔ)義標(biāo)記,增強(qiáng)內(nèi)容之間的關(guān)聯(lián),提高科研人員的檢索和獲取效率,實(shí)現(xiàn)智能化出版。在數(shù)據(jù)、信息、知識(shí)、智慧鏈(Data Information Knowledge Wisdom,DIKW)中,數(shù)據(jù)出版是基于數(shù)據(jù)、信息的時(shí)間基層的出版模式;而語(yǔ)義出版則是從知識(shí)層面不斷向智慧面延伸的空間深層次語(yǔ)義信息交流的出版模式,它無(wú)疑是數(shù)據(jù)出版的進(jìn)一步發(fā)展。本文的研究以數(shù)字資源聚合為基礎(chǔ),通過(guò)探究學(xué)術(shù)期刊語(yǔ)義出版的發(fā)展過(guò)程,總結(jié)歸納國(guó)外學(xué)術(shù)期刊語(yǔ)義出版的相關(guān)實(shí)踐,探索性研究了基于數(shù)字資源聚合的學(xué)術(shù)期刊語(yǔ)義出版模式,旨在為國(guó)內(nèi)學(xué)術(shù)期刊基于資源聚合和內(nèi)容組織實(shí)現(xiàn)語(yǔ)義出版提供經(jīng)驗(yàn)與借鑒。

    1 相關(guān)研究

    語(yǔ)義出版通過(guò)結(jié)構(gòu)化描述關(guān)聯(lián)外部資源,使得文章的可讀性和交互性增強(qiáng)[2],提升了學(xué)術(shù)出版功能,對(duì)科研人員從事科研閱讀和研究的幫助顯著[3]。語(yǔ)義出版有助于推動(dòng)出版機(jī)構(gòu)實(shí)現(xiàn)資源間的關(guān)聯(lián)分析和知識(shí)挖掘,為用戶提供體系化的知識(shí)[4]。2013年Outsell公司發(fā)布的STM報(bào)告[5]指出,STM期刊的技術(shù)發(fā)展依托語(yǔ)義技術(shù)得以實(shí)現(xiàn),通過(guò)借助符合語(yǔ)義標(biāo)準(zhǔn)的關(guān)聯(lián)數(shù)據(jù)進(jìn)行更加高效的內(nèi)容檢索和服務(wù)[6]。

    在英國(guó)皇家化學(xué)學(xué)會(huì)(RSC)、愛(ài)思唯爾(Elsevier)、自然出版集團(tuán)(Nature)、美國(guó)科學(xué)公共圖書(shū)館(PLoS)等的推動(dòng)下,出現(xiàn)了一系列語(yǔ)義出版的舉措和學(xué)術(shù)研究。Elsevier的“Article of the Future”(未來(lái)文章)計(jì)劃對(duì)學(xué)術(shù)期刊的上下文結(jié)構(gòu)、內(nèi)容關(guān)聯(lián)、期刊呈現(xiàn)方式均做了創(chuàng)新,并借助Science Direct(全文文獻(xiàn)數(shù)據(jù)庫(kù))平臺(tái)開(kāi)展多個(gè)學(xué)科領(lǐng)域的語(yǔ)義出版實(shí)踐,搭建了語(yǔ)義出版實(shí)現(xiàn)的基礎(chǔ)[7]。PLoS為了實(shí)現(xiàn)期刊內(nèi)容的有機(jī)豐富,將期刊鏈接到多種外部資源上,以此來(lái)提升學(xué)術(shù)出版的功能。RSC為了實(shí)現(xiàn)期刊內(nèi)部以及期刊同外部資源的語(yǔ)義關(guān)聯(lián),對(duì)相關(guān)領(lǐng)域本體進(jìn)行了關(guān)聯(lián),并通過(guò)語(yǔ)義標(biāo)注部分期刊內(nèi)容實(shí)現(xiàn)期刊的Rich HTML形式[8]。Hudson-Vitale等[9]提出研究是全球性的,學(xué)術(shù)界需要可互操作的中心,相互關(guān)聯(lián)的數(shù)據(jù)和基礎(chǔ)設(shè)施,支持跨庫(kù)信息交換,包括標(biāo)準(zhǔn)、元數(shù)據(jù)模式和語(yǔ)義互操作性。De Ribaupierre等[10]在實(shí)證研究的基礎(chǔ)上,分析了科學(xué)家的實(shí)際需求并考慮了文檔的語(yǔ)義和特殊性,提出了一種使用SciAnnotDoc模型自動(dòng)注釋PDF文檔的方法。Balaji等[11]提出使用共引用鄰近分析進(jìn)行擴(kuò)展,以發(fā)現(xiàn)語(yǔ)義相似性,進(jìn)而找到與給定研究出版物相匹配的研究論文的最佳語(yǔ)義路徑。Lafia等[12]提出通過(guò)生成可以在主題和空間上查詢的鏈接元數(shù)據(jù),使得數(shù)據(jù)集或文檔具有唯一資源標(biāo)識(shí)符(URI)和現(xiàn)有工具充分支持的基本元數(shù)據(jù),進(jìn)而使得跨域數(shù)據(jù)集被發(fā)現(xiàn),并且可理解、可重復(fù)使用。

    在國(guó)內(nèi),2009年張曉林教授[13]從關(guān)聯(lián)發(fā)現(xiàn)、內(nèi)容增強(qiáng)、開(kāi)放與合作交流三方面對(duì)學(xué)術(shù)期刊的數(shù)字化發(fā)展進(jìn)行了闡釋?zhuān)氏忍岢隽薐ournal 3.0模型。2012年王曉光等[14]提出語(yǔ)義出版可以借助多層次的領(lǐng)域本體對(duì)文章中的概念與資源實(shí)體進(jìn)行關(guān)聯(lián),集成不同事件、資料、記錄來(lái)減輕科研人員進(jìn)行反復(fù)資源搜集和整理工作的負(fù)擔(dān),將更多精力用于論點(diǎn)的理解和數(shù)據(jù)的分析。2013年周杰等[15]指出語(yǔ)義出版通過(guò)對(duì)知識(shí)的統(tǒng)一編碼實(shí)現(xiàn)對(duì)象的關(guān)聯(lián)和內(nèi)容的結(jié)構(gòu)化呈現(xiàn),實(shí)現(xiàn)用戶的精準(zhǔn)語(yǔ)義查詢,將成為未來(lái)主流的出版形態(tài)。2017年張偉偉等[16]基于供給側(cè)視角得出未來(lái)語(yǔ)義出版是學(xué)術(shù)期刊數(shù)字化出版的一個(gè)重要發(fā)展方向。李嬌等[17]通過(guò)對(duì)國(guó)內(nèi)外學(xué)術(shù)期刊數(shù)字資源描述、語(yǔ)義知識(shí)增強(qiáng)、語(yǔ)義出版發(fā)布等方面的分析,發(fā)現(xiàn)國(guó)內(nèi)語(yǔ)義出版實(shí)踐與國(guó)外相比仍有差距。陳鋼等[18]通過(guò)對(duì)廣東省16家科技期刊的出版方式進(jìn)行調(diào)研發(fā)現(xiàn),語(yǔ)義出版將代表今后的出版趨勢(shì),但目前語(yǔ)義出版仍在小規(guī)模實(shí)踐并未進(jìn)行大規(guī)模推廣。

    綜上,語(yǔ)義出版的到來(lái)為大型服務(wù)提供商和出版機(jī)構(gòu)的發(fā)展創(chuàng)造了契機(jī),它們可以將現(xiàn)有的期刊信息和外部資源進(jìn)行關(guān)聯(lián),實(shí)現(xiàn)對(duì)知識(shí)的挖掘和分析,促使用戶有效利用期刊、全面獲取知識(shí)。語(yǔ)義出版是學(xué)術(shù)期刊資源聚合的更高需求,基于數(shù)字資源聚合的語(yǔ)義出版實(shí)現(xiàn)需要同時(shí)具備語(yǔ)義網(wǎng)、本體、關(guān)聯(lián)數(shù)據(jù)等技術(shù)和挖掘深層次文獻(xiàn)語(yǔ)義特征的功能,從而幫助用戶檢索到更加體系化、知識(shí)化的信息。

    2 學(xué)術(shù)期刊語(yǔ)義出版的發(fā)展

    互聯(lián)網(wǎng)技術(shù)的發(fā)展使得目前學(xué)術(shù)期刊主要以數(shù)字化方式出版[19],相較國(guó)外學(xué)術(shù)期刊數(shù)字化的發(fā)展,國(guó)內(nèi)學(xué)術(shù)期刊數(shù)字化起步較晚,并且呈現(xiàn)散、小、弱的特點(diǎn),其數(shù)字化發(fā)展存在諸多障礙。面對(duì)海量學(xué)術(shù)資源,科研人員需要快速查詢到所需的有用信息,這需要學(xué)術(shù)資源的合理有效聚合。但是,目前學(xué)術(shù)期刊的數(shù)字出版面臨瓶頸化現(xiàn)象,而學(xué)術(shù)期刊的語(yǔ)義出版能夠揭示資源間的相互關(guān)系,實(shí)現(xiàn)數(shù)據(jù)挖掘和語(yǔ)義檢索,所以要基于數(shù)字資源聚合實(shí)現(xiàn)語(yǔ)義出版在學(xué)術(shù)期刊上更好地應(yīng)用。

    2.1 學(xué)術(shù)期刊語(yǔ)義出版的背景

    從學(xué)術(shù)期刊開(kāi)始數(shù)字化至今,大部分期刊只是將錄用的文章收錄到數(shù)據(jù)庫(kù)或者自建的學(xué)術(shù)期刊網(wǎng)站上[20]以PDF或者CAJ格式供用戶下載使用,在此過(guò)程中用戶不僅需要下載支持PDF/CAJ格式的閱讀軟件,并且無(wú)法很好地進(jìn)行語(yǔ)義標(biāo)注和互動(dòng),難以實(shí)現(xiàn)資源之間的互操作,這為用戶的使用帶來(lái)了不便,制約了學(xué)術(shù)期刊的數(shù)字化出版,突出表現(xiàn)為兩個(gè)方面。

    (1)學(xué)術(shù)期刊數(shù)字資源內(nèi)部由于未形成統(tǒng)一的數(shù)據(jù)標(biāo)準(zhǔn),因而無(wú)法實(shí)現(xiàn)更深層次的關(guān)聯(lián),知識(shí)資源聚合目標(biāo)更是無(wú)法達(dá)到。此外,用戶若想實(shí)現(xiàn)對(duì)知識(shí)的集中獲取,需要滿足數(shù)字資源內(nèi)部知識(shí)單元與外部相關(guān)數(shù)據(jù)庫(kù)或知識(shí)組織關(guān)聯(lián)的條件,傳統(tǒng)的數(shù)字出版無(wú)法滿足。

    (2)提高信息檢索的效率需要實(shí)現(xiàn)語(yǔ)義上的精確匹配,而目前我國(guó)的學(xué)術(shù)期刊官網(wǎng)只能實(shí)現(xiàn)基于關(guān)鍵詞的檢索,無(wú)法解決知識(shí)體系中存在的一詞多義、一義多詞現(xiàn)象,使得用戶無(wú)法實(shí)現(xiàn)對(duì)知識(shí)的深層次發(fā)現(xiàn)和挖掘[21]。語(yǔ)義出版則可以解決基于關(guān)鍵詞檢索中存在的低查全率、低檢索效率、用戶需重復(fù)檢索操作的問(wèn)題。

    通過(guò)以上分析可以看出,現(xiàn)有的學(xué)術(shù)期刊數(shù)字出版只是將紙質(zhì)期刊進(jìn)行了數(shù)字化轉(zhuǎn)化,并未抓住期刊內(nèi)容和語(yǔ)義層面的重點(diǎn),無(wú)法實(shí)現(xiàn)學(xué)術(shù)期刊數(shù)字資源間的語(yǔ)義互操作,降低了學(xué)術(shù)期刊的服務(wù)質(zhì)量和效率。所以,變革當(dāng)前學(xué)術(shù)期刊的數(shù)字出版方式是當(dāng)務(wù)之急。

    2.2 學(xué)術(shù)期刊語(yǔ)義出版的價(jià)值

    作為數(shù)字出版高級(jí)形態(tài)的語(yǔ)義出版,具有傳統(tǒng)出版無(wú)法比擬的特點(diǎn),能夠促進(jìn)數(shù)字時(shí)代的信息交流和聚合。對(duì)于學(xué)術(shù)期刊數(shù)字聚合的發(fā)展來(lái)說(shuō),語(yǔ)義出版可以整合大量分散的、紊亂的信息,并對(duì)信息資源進(jìn)行有機(jī)管理,打破“信息孤島”的局面,為用戶查找和利用信息提供便利[22]。

    (1)語(yǔ)義出版可以實(shí)現(xiàn)知識(shí)關(guān)聯(lián)和語(yǔ)義查詢。語(yǔ)義出版機(jī)構(gòu)不同于以往基于形式劃分的學(xué)術(shù)期刊,它通過(guò)界定不同元素的屬性和類(lèi)型,以知識(shí)點(diǎn)為單位來(lái)分解、標(biāo)注整篇文章。對(duì)期刊知識(shí)單元的關(guān)聯(lián)和揭示有利于形成語(yǔ)義聯(lián)系的知識(shí)網(wǎng)絡(luò),實(shí)現(xiàn)將用戶與所需知識(shí)進(jìn)行匹配。此外,語(yǔ)義出版基于知識(shí)推理構(gòu)建語(yǔ)義查詢可以減少以往基于關(guān)鍵詞查詢的工作量,提高查準(zhǔn)率和知識(shí)獲取速度。

    (2)語(yǔ)義出版可以實(shí)現(xiàn)用戶行為分析和興趣推薦。語(yǔ)義出版可以通過(guò)收集用戶經(jīng)常查詢的關(guān)鍵詞和瀏覽的頁(yè)面借助數(shù)據(jù)挖掘和推薦算法對(duì)用戶行為進(jìn)行分析,找到用戶所需并分析用戶興趣從而構(gòu)建出用戶畫(huà)像。同時(shí),可以根據(jù)用戶行為構(gòu)建用戶數(shù)據(jù)庫(kù),基于興趣進(jìn)行個(gè)性化推薦服務(wù),并通過(guò)使用行為找出與目標(biāo)用戶相似性高的用戶,為目標(biāo)用戶推薦資源。

    (3)語(yǔ)義出版可以實(shí)現(xiàn)信息抽取和主題揭示。語(yǔ)義出版可以通過(guò)高亮詞條和語(yǔ)義標(biāo)簽以可視化方式展示文章知識(shí)結(jié)構(gòu),實(shí)現(xiàn)主題揭示。同時(shí),語(yǔ)義出版構(gòu)建了期刊數(shù)字資源與外部資源的鏈接,因而可以實(shí)現(xiàn)關(guān)聯(lián)信息的抽取,幫助用戶更好地理解文章內(nèi)容。

    2.3 學(xué)術(shù)期刊語(yǔ)義出版的應(yīng)用

    語(yǔ)義出版對(duì)數(shù)字資源聚合提出了更高程度的要求。語(yǔ)義出版強(qiáng)調(diào)通過(guò)利用本體、關(guān)聯(lián)技術(shù)等實(shí)現(xiàn)自然語(yǔ)言處理,構(gòu)建信息與信息資源結(jié)構(gòu)化描述的關(guān)聯(lián),通過(guò)機(jī)器可理解和資源間的語(yǔ)義互操作,實(shí)現(xiàn)信息的可視化呈現(xiàn),提高科研人員的檢索效率。

    基于數(shù)字資源聚合方法在學(xué)術(shù)期刊語(yǔ)義出版中的應(yīng)用主要體現(xiàn)在以下方面。首先,通過(guò)元數(shù)據(jù)、本體、關(guān)聯(lián)數(shù)據(jù)等技術(shù)可以解決學(xué)術(shù)期刊的異構(gòu)資源、跨庫(kù)檢索等問(wèn)題。學(xué)術(shù)期刊的語(yǔ)義出版可以通過(guò)元數(shù)據(jù)的提取,本體庫(kù)的構(gòu)建以及數(shù)據(jù)的關(guān)聯(lián)使得不同來(lái)源、不同類(lèi)型的數(shù)字資源完成跨庫(kù)檢索,實(shí)現(xiàn)學(xué)術(shù)期刊數(shù)字資源的有效聚合。其次,專(zhuān)業(yè)本體庫(kù)和領(lǐng)域本體庫(kù)的構(gòu)建可以使用戶查詢期刊資源不再拘于關(guān)鍵詞查詢的限制,實(shí)現(xiàn)不同文獻(xiàn)、不同知識(shí)單元的語(yǔ)義關(guān)聯(lián),一詞多義、一義多詞將不是難題,用戶能夠獲取更精確的答案。最后,在文章中添加語(yǔ)義標(biāo)簽,可以使文章各部分內(nèi)容層次分明、相互關(guān)聯(lián),并且以機(jī)器可自動(dòng)讀取的結(jié)構(gòu)化形式呈現(xiàn),實(shí)現(xiàn)文本內(nèi)容的自動(dòng)化獲取和智能化處理。

    實(shí)現(xiàn)數(shù)字資源的深度聚合是語(yǔ)義出版中不可或缺的重要環(huán)節(jié),采用本體、關(guān)聯(lián)數(shù)據(jù)等語(yǔ)義網(wǎng)相關(guān)技術(shù)實(shí)現(xiàn)的資源聚合能促進(jìn)學(xué)術(shù)期刊的知識(shí)一體化、體系化、結(jié)構(gòu)化,通過(guò)構(gòu)建不同知識(shí)本體間的語(yǔ)義映射關(guān)系可以實(shí)現(xiàn)知識(shí)單元間的語(yǔ)義關(guān)聯(lián),并為用戶提供更好的服務(wù)和更佳的體驗(yàn)。

    3 國(guó)外學(xué)術(shù)期刊語(yǔ)義出版的實(shí)踐

    Elsevier、施普林格(Springer)、科睿唯安(Clarivate Analytics)作為全球領(lǐng)先的3家STM出版社,每年出版論文種類(lèi)十分豐富,并且均在語(yǔ)義出版方面開(kāi)展了很多實(shí)踐,為學(xué)術(shù)期刊的語(yǔ)義出版提供了諸多發(fā)展經(jīng)驗(yàn)。本文主要以這3家國(guó)外學(xué)術(shù)期刊語(yǔ)義出版的實(shí)踐為例進(jìn)行介紹。

    3.1 Elsevier語(yǔ)義出版下的資源查詢管理

    Elsevier的語(yǔ)義出版模式不同于以往學(xué)術(shù)期刊線性的出版方式,它結(jié)合超鏈接和語(yǔ)義標(biāo)記致力于改善用戶的閱讀體驗(yàn)、提供最佳瀏覽方式給用戶,其出版特點(diǎn)如下。

    (1)一站式集成檢索。ClinicalKey集成了醫(yī)學(xué)圖書(shū)、期刊、專(zhuān)家評(píng)論等各種資源,用戶無(wú)須前往不同醫(yī)學(xué)信息庫(kù)查找信息,在同一平臺(tái)便可獲取所有臨床專(zhuān)科的豐富資源,提高了用戶獲取資源的效率。2019年5月Elsevier與Scilligence ELN合作,化學(xué)研究人員可以通過(guò)Scilligence的ELN進(jìn)入Reaxys進(jìn)行搜索,尋找感興趣的結(jié)構(gòu)、性質(zhì)、反應(yīng)、路線設(shè)計(jì)等信息,將結(jié)果讀取并存入ELN,而無(wú)須復(fù)制、粘貼或手動(dòng)繪制等操作。這一整合能夠有效幫助化學(xué)研究人員簡(jiǎn)化工作流程,提高效率,改善交叉引用并減少人為因素引發(fā)的錯(cuò)誤。同時(shí),嚴(yán)謹(jǐn)遵循科學(xué)數(shù)據(jù)管理的FAIR原則(可查找、可訪問(wèn)、互操作、可重用),Elsevier為科研數(shù)據(jù)共享的效率和質(zhì)量提供了保證。

    (2)支持語(yǔ)義檢索,實(shí)現(xiàn)精確檢索匹配結(jié)果。EMMeT構(gòu)建了能夠深度描述和標(biāo)引醫(yī)學(xué)數(shù)據(jù)的概念詞匯,從而幫助用戶進(jìn)行語(yǔ)義檢索醫(yī)學(xué)資源,實(shí)現(xiàn)對(duì)檢索結(jié)果的精確匹配,為用戶在最短時(shí)間內(nèi)準(zhǔn)確獲取所需答案提供保證,減少了用戶反復(fù)查找信息的時(shí)間。

    (3)提供智能化知識(shí)。Elsevier通過(guò)打通文章內(nèi)部知識(shí)單元的關(guān)聯(lián)、構(gòu)建文章與外部資源的鏈接,為用戶提供智能化的知識(shí)。2019年4月,Elsevier與靈北公司(Lundbeck)合作,有效解決了生命科學(xué)企業(yè)管理海量數(shù)據(jù)的難題。Elsevier通過(guò)化學(xué)及生物活性綜合數(shù)據(jù)庫(kù)Reaxys和Reaxys Medicinal Chemistry(RMC)藥物化學(xué)模塊,幫助科研人員提高信息的可見(jiàn)性、復(fù)用性和實(shí)踐性,加快數(shù)據(jù)分享和挖掘,推進(jìn)企業(yè)用戶內(nèi)部信息的自由訪問(wèn)和與Reaxys及RMC模塊無(wú)縫對(duì)接,破除了內(nèi)部信息孤島,提高了數(shù)據(jù)互通性。

    3.2 Springer語(yǔ)義出版下的關(guān)聯(lián)開(kāi)放數(shù)據(jù)

    2017年3月,施普林格?自然集團(tuán)(Springer Nature)推出了SciGraph關(guān)聯(lián)開(kāi)放數(shù)據(jù)平臺(tái),將所有的科研資助機(jī)構(gòu)、會(huì)議、出版物等信息集成到這一平臺(tái)上,截至2017年底,這一平臺(tái)將學(xué)術(shù)界關(guān)注對(duì)象的信息(三元組)擴(kuò)充到10億多條,并可以與CrossRef和DBPedia等數(shù)據(jù)集相鏈接。

    Springer Nature SciGraph平臺(tái)在進(jìn)行關(guān)聯(lián)數(shù)據(jù)發(fā)布之前,將需要發(fā)布數(shù)據(jù)中的實(shí)體類(lèi)型和實(shí)體間的關(guān)系一一對(duì)應(yīng),并以URI為資源命名,保證資源的可獲取。目前Springer Nature已經(jīng)可以做到期刊、文章、資助者、主題等實(shí)體型在關(guān)聯(lián)開(kāi)放數(shù)據(jù)中發(fā)布。Springer Nature在建立唯一、有效的URI之后,還建立了SciGraphcore ontology本體,這一本體的構(gòu)建使得數(shù)據(jù)不僅可以被Springer Nature更好地描述,還可以更好地被外界所引用。

    Springer Nature SciGraph關(guān)聯(lián)開(kāi)放數(shù)據(jù)平臺(tái)通過(guò)對(duì)數(shù)據(jù)進(jìn)行關(guān)聯(lián)和互操作,打破了數(shù)據(jù)組織結(jié)構(gòu)的原有體系,是關(guān)聯(lián)開(kāi)放科研在出版領(lǐng)域得以實(shí)現(xiàn)的開(kāi)始,使科研人員可以共享學(xué)術(shù)合作、機(jī)構(gòu)知識(shí)庫(kù)等平臺(tái),促進(jìn)了學(xué)術(shù)期刊語(yǔ)義出版的發(fā)展。

    3.3 Clarivate Analytics語(yǔ)義出版下的資源獲取

    2017年6月Clarivate Analytics宣布與Impactstory開(kāi)展合作,這一行為使得科研人員可以獲取高質(zhì)量、經(jīng)過(guò)同行評(píng)議的開(kāi)放內(nèi)容。Clarivate Analytics資助Impactstory建立oaDOI服務(wù),以更容易發(fā)現(xiàn)開(kāi)放獲取的內(nèi)容,提高科研工作從發(fā)現(xiàn)相關(guān)信息到發(fā)布最后成果的效率。Clarivate Analytics可借助Impactstory創(chuàng)建的在線工具,使科學(xué)文獻(xiàn)可以更好地開(kāi)放和重用。目前,oaDOI可通過(guò)免費(fèi)開(kāi)放的API實(shí)現(xiàn)9 000萬(wàn)篇文章的開(kāi)放獲取。Clarivate Analytics目前致力于提高從科研想法的出現(xiàn)到實(shí)驗(yàn)驗(yàn)證,再到同行評(píng)審以及最后出版的整個(gè)研究生命周期的效率。Clarivate Analytics與Impactstory的合作可以使研究人員實(shí)現(xiàn)開(kāi)放獲取Web of Science上的1 800萬(wàn)篇新文章,有利于科研用戶的研究和創(chuàng)新。

    此外,Clarivate Analytics的Kopernio作為一個(gè)免費(fèi)的瀏覽器插件及在線工具,通過(guò)集成超過(guò)2萬(wàn)個(gè)期刊網(wǎng)站、平臺(tái)、數(shù)據(jù)庫(kù)、開(kāi)放獲取知識(shí)庫(kù)和搜索引擎,幫助科研人員實(shí)現(xiàn)一鍵式合法獲取學(xué)術(shù)期刊全文文獻(xiàn),可以有效節(jié)省科研人員獲取文獻(xiàn)的時(shí)間和步驟。此外,它可以自動(dòng)將用戶檢索過(guò)的PdF全文保存在個(gè)人的PDF全文臨時(shí)儲(chǔ)存盤(pán)內(nèi),方便用戶后續(xù)回訪閱讀。

    4 基于數(shù)字資源聚合的學(xué)術(shù)期刊語(yǔ)義出版模型

    語(yǔ)義出版的發(fā)展為學(xué)術(shù)期刊的創(chuàng)新提供了新的方式,同時(shí)揭示了資源對(duì)象間的關(guān)聯(lián),幫助資源內(nèi)容實(shí)現(xiàn)更好地重組和發(fā)布,因而語(yǔ)義出版的實(shí)現(xiàn)需要以數(shù)字資源聚合作為基礎(chǔ),數(shù)字資源聚合的目標(biāo)則為語(yǔ)義出版。本文通過(guò)對(duì)當(dāng)前學(xué)術(shù)期刊數(shù)字化進(jìn)程中存在的問(wèn)題進(jìn)行分析,并結(jié)合基于數(shù)字資源聚合的語(yǔ)義出版存在的價(jià)值和應(yīng)用,借鑒Elsevier、Springer、Clarivate Analytics的出版實(shí)踐經(jīng)驗(yàn),探索了基于數(shù)字資源聚合的學(xué)術(shù)期刊語(yǔ)義出版模型。該模型以實(shí)現(xiàn)學(xué)術(shù)期刊的語(yǔ)義出版為目標(biāo),以數(shù)字資源聚合為抓手,從三個(gè)層面進(jìn)行構(gòu)建。第一層是基于本體的數(shù)字資源聚合,第二層是基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源聚合,第三層是基于關(guān)聯(lián)數(shù)據(jù)的訪問(wèn)和應(yīng)用,如圖1所示。

    (1)基于本體的數(shù)字資源聚合。由于學(xué)術(shù)期刊通常采用不同的元數(shù)據(jù)規(guī)范對(duì)來(lái)源不同、類(lèi)型不同的資訊進(jìn)行描述,使得大量結(jié)構(gòu)異構(gòu)的數(shù)字資源存在于學(xué)術(shù)期刊之中,造成聚合和檢索的困難。僅依靠元數(shù)據(jù)只能形成數(shù)字資源的語(yǔ)義化基礎(chǔ),資源描述的異構(gòu)性和語(yǔ)義性問(wèn)題仍然存在。想要實(shí)現(xiàn)不同類(lèi)型、不同格式的元數(shù)據(jù)進(jìn)行互操作需要依靠本體來(lái)完成。本體可以通過(guò)對(duì)元數(shù)據(jù)進(jìn)行描述,轉(zhuǎn)換為統(tǒng)一RDF格式,進(jìn)而使不同元數(shù)據(jù)之間可以進(jìn)行語(yǔ)義互操作。同時(shí),同義詞的描述、領(lǐng)域本體庫(kù)的建立可以解決以往資源聚合中存在的一詞多義、一義多詞難題,幫助用戶更好地獲取信息。

    (2)基于關(guān)聯(lián)數(shù)據(jù)的數(shù)字資源聚合。在這一層面將采用HTTO協(xié)議中的URI地址命名所有資源,對(duì)數(shù)字資源進(jìn)行語(yǔ)義化描述,在元數(shù)據(jù)本體化模型的基礎(chǔ)上,同時(shí)采用SKOS語(yǔ)義化描述,統(tǒng)一RDF格式描述其他資源、鏈接相關(guān)資源,實(shí)現(xiàn)學(xué)術(shù)期刊內(nèi)部不同知識(shí)單元間的聚合和外部知識(shí)組織的鏈接?;陉P(guān)聯(lián)數(shù)據(jù)的數(shù)字資源聚合可以實(shí)現(xiàn)不同格式、不同來(lái)源的數(shù)據(jù)相關(guān)聯(lián)。不同數(shù)據(jù)庫(kù)中的資源以及同一數(shù)據(jù)庫(kù)中不同格式、不同類(lèi)型、無(wú)法實(shí)現(xiàn)互操作的數(shù)據(jù)均可以通過(guò)關(guān)聯(lián)數(shù)據(jù)構(gòu)建數(shù)據(jù)網(wǎng)絡(luò),將資源整合成無(wú)縫鏈接的整體。關(guān)聯(lián)數(shù)據(jù)還可以通過(guò)HTTP協(xié)議和RDF鏈接實(shí)現(xiàn)與其他相關(guān)資源在語(yǔ)義層面的關(guān)聯(lián),通過(guò)揭示資源間的關(guān)系,豐富期刊的知識(shí)內(nèi)容。

    (3)基于關(guān)聯(lián)數(shù)據(jù)的訪問(wèn)和應(yīng)用。這一層面通過(guò)關(guān)聯(lián)數(shù)據(jù)來(lái)瀏覽查詢學(xué)術(shù)期刊中的數(shù)字資源,不僅可以得到簡(jiǎn)潔清晰的答案,還可以鏈接到其他相關(guān)數(shù)據(jù)資源,實(shí)現(xiàn)資源間的無(wú)縫對(duì)接。在數(shù)據(jù)資源聚合和關(guān)聯(lián)數(shù)據(jù)發(fā)布的基礎(chǔ)上,用戶可以通過(guò)關(guān)聯(lián)數(shù)據(jù)瀏覽器在不同數(shù)據(jù)源之間進(jìn)行瀏覽,這得益于數(shù)據(jù)之間已通過(guò)RDF進(jìn)行鏈接,并且已實(shí)現(xiàn)語(yǔ)義搜索。同時(shí),用戶還可以通過(guò)資源導(dǎo)航瀏覽整個(gè)數(shù)據(jù)網(wǎng)絡(luò),借助關(guān)聯(lián)數(shù)據(jù)搜索引擎實(shí)現(xiàn)對(duì)關(guān)聯(lián)數(shù)據(jù)的查詢,高效抓取關(guān)聯(lián)數(shù)據(jù)檢索所需信息?;陉P(guān)聯(lián)數(shù)據(jù)的訪問(wèn)和應(yīng)用可以使用戶體驗(yàn)到更加智能化的數(shù)據(jù)服務(wù)。

    5 結(jié)束語(yǔ)

    從印刷期刊到數(shù)字化期刊再到語(yǔ)義出版,學(xué)術(shù)期刊出版模式在不斷發(fā)生變化。數(shù)字環(huán)境下,傳統(tǒng)的圖片、文字、段落表達(dá)已經(jīng)無(wú)法達(dá)到科研人員所需。而語(yǔ)義出版則是對(duì)出版物內(nèi)容層面的深度挖掘,借助本體、關(guān)聯(lián)數(shù)據(jù)等語(yǔ)義技術(shù)生成有價(jià)值的知識(shí)單元,實(shí)現(xiàn)語(yǔ)義層面更細(xì)粒度的知識(shí)關(guān)聯(lián)。通過(guò)本文的研究,可以發(fā)現(xiàn):①語(yǔ)義出版的應(yīng)用實(shí)踐還處于發(fā)展階段,隨著語(yǔ)義技術(shù)的發(fā)展,基于淺層語(yǔ)義的資源組織方式會(huì)逐漸向深度語(yǔ)義化的知識(shí)關(guān)聯(lián)與集成轉(zhuǎn)變;②語(yǔ)義出版是學(xué)術(shù)期刊數(shù)字資源聚合的目標(biāo),而學(xué)術(shù)期刊數(shù)字資源聚合是實(shí)現(xiàn)語(yǔ)義出版的基礎(chǔ)性工作;③借鑒現(xiàn)有的國(guó)外學(xué)術(shù)期刊語(yǔ)義出版實(shí)踐,探索符合我國(guó)學(xué)術(shù)期刊發(fā)展的語(yǔ)義出版模式,是這一領(lǐng)域的重點(diǎn)研究?jī)?nèi)容之一;④借助本體、關(guān)聯(lián)數(shù)據(jù)等語(yǔ)義技術(shù),實(shí)現(xiàn)對(duì)學(xué)術(shù)期刊及其知識(shí)內(nèi)容的語(yǔ)義化描述是語(yǔ)義出版的主要技術(shù)路線,并以此為基礎(chǔ),探索基于數(shù)字資源聚合的學(xué)術(shù)期刊語(yǔ)義出版模式,為國(guó)內(nèi)學(xué)術(shù)期刊基于資源聚合和內(nèi)容組織實(shí)現(xiàn)語(yǔ)義出版提供經(jīng)驗(yàn)與借鑒。

    綜上所述,學(xué)術(shù)期刊數(shù)字資源的深度聚合為其語(yǔ)義出版實(shí)現(xiàn)提供了良好的資源基礎(chǔ),在本體、關(guān)聯(lián)數(shù)據(jù)等相關(guān)語(yǔ)義技術(shù)的不斷變革和大量數(shù)據(jù)、知識(shí)的不斷涌現(xiàn)以及科研人員對(duì)語(yǔ)義出版更高要求更迫切需求的背景下,只有不斷發(fā)現(xiàn)和挖掘出更多的隱性知識(shí)特征,不斷促進(jìn)學(xué)術(shù)期刊在資源上的深度聚合和在語(yǔ)義層面上的發(fā)展才能跟上數(shù)字化、語(yǔ)義化的時(shí)代潮流。為此,推動(dòng)數(shù)字資源聚合下的學(xué)術(shù)期刊語(yǔ)義出版發(fā)展刻不容緩。

    猜你喜歡
    本體關(guān)聯(lián)檢索
    Abstracts and Key Words
    對(duì)姜夔自度曲音樂(lè)本體的現(xiàn)代解讀
    “一帶一路”遞進(jìn),關(guān)聯(lián)民生更緊
    2019年第4-6期便捷檢索目錄
    奇趣搭配
    智趣
    讀者(2017年5期)2017-02-15 18:04:18
    專(zhuān)利檢索中“語(yǔ)義”的表現(xiàn)
    《我應(yīng)該感到自豪才對(duì)》的本體性教學(xué)內(nèi)容及啟示
    Care about the virtue moral education
    卷宗(2013年6期)2013-10-21 21:07:52
    語(yǔ)言學(xué)與修辭學(xué):關(guān)聯(lián)與互動(dòng)
    内乡县| 拉孜县| 疏勒县| 泌阳县| 宁蒗| 南漳县| 西贡区| 六枝特区| 长泰县| 同德县| 达州市| 高尔夫| 湘阴县| 邵阳市| 来宾市| 永兴县| 顺昌县| 安塞县| 甘谷县| 古丈县| 西和县| 丰原市| 普兰店市| 叙永县| 阳新县| 榆林市| 大连市| 江孜县| 沐川县| 无极县| 藁城市| 山东省| 临西县| 长白| 海城市| 宜阳县| 鲜城| 铜山县| 南漳县| 杂多县| 瑞安市|