• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    基于高校圖書館的書目關(guān)聯(lián)數(shù)據(jù)創(chuàng)建實(shí)踐

    2023-02-25 06:35:48郭雨絲首都體育學(xué)院
    文化產(chǎn)業(yè) 2023年5期
    關(guān)鍵詞:詞表書目發(fā)文

    郭雨絲 首都體育學(xué)院

    關(guān)聯(lián)數(shù)據(jù)自提出起就快速成為國(guó)內(nèi)外的研究熱點(diǎn),但國(guó)內(nèi)除國(guó)家圖書館和上海圖書館外,還少有這方面的實(shí)踐開展?,F(xiàn)通過(guò)文獻(xiàn)計(jì)量法、可視化分析對(duì)近五年國(guó)內(nèi)外關(guān)聯(lián)數(shù)據(jù)的研究情況進(jìn)行梳理,并基于關(guān)聯(lián)數(shù)據(jù)在圖書館領(lǐng)域的應(yīng)用和BIBFRAME模型在書目資源關(guān)聯(lián)化中的應(yīng)用,通過(guò)小規(guī)模試驗(yàn)對(duì)高校圖書館書目關(guān)聯(lián)數(shù)據(jù)創(chuàng)建的方向和困難進(jìn)行分析和探討。

    關(guān)聯(lián)數(shù)據(jù)(Linked Data)最早是由萬(wàn)維網(wǎng)發(fā)明者、萬(wàn)維網(wǎng)聯(lián)盟(W3C)創(chuàng)辦者Tim Berners-Lee于2006年提出的。近年來(lái),國(guó)內(nèi)關(guān)于關(guān)聯(lián)數(shù)據(jù)的相關(guān)研究持續(xù)增加,關(guān)聯(lián)數(shù)據(jù)在圖情領(lǐng)域的應(yīng)用也逐漸得到學(xué)界的廣泛認(rèn)同,但具體的圖書館館藏資源數(shù)據(jù)的關(guān)聯(lián)化還與國(guó)際有較大差距。

    圖情界關(guān)聯(lián)數(shù)據(jù)的發(fā)展與研究情況

    自關(guān)聯(lián)數(shù)據(jù)提出以來(lái),圖情界對(duì)其的研究眾多,李朝陽(yáng)等(2020)通過(guò)對(duì)國(guó)內(nèi)外圖情領(lǐng)域關(guān)聯(lián)數(shù)據(jù)研究論文的分析和研究,認(rèn)為國(guó)內(nèi)外在該領(lǐng)域的研究幾乎同時(shí)起步,同步發(fā)展,并將2009—2018年分為初始、停滯、爆發(fā)和成熟四個(gè)階段,研究?jī)?nèi)容涉及基本理論研究、技術(shù)方法和工具研究、應(yīng)用研究等方面。隨著關(guān)聯(lián)數(shù)據(jù)的概念逐漸被廣泛認(rèn)知,近年來(lái),越來(lái)越多的學(xué)者進(jìn)入這一領(lǐng)域的研究中,本文利用Bicomb和Gephi等分析工具,借助CNKI和Web Of Science數(shù)據(jù)庫(kù),對(duì)近五年國(guó)內(nèi)外該領(lǐng)域的研究文獻(xiàn)進(jìn)行比較分析,包括發(fā)文量、作者及合作關(guān)系、研究機(jī)構(gòu)、關(guān)鍵詞比較等。

    數(shù)據(jù)來(lái)源

    在WOS核心集中,以主題詞=“l(fā)inked data”O(jiān)R“l(fā)inked open data”進(jìn)行搜索,限定學(xué)科類別“INFORMATION SCIENCE LIBRARY SCIENCE”,限定文獻(xiàn)類型為“論文”O(jiān)R“綜述論文”,得到相關(guān)文獻(xiàn)73篇。

    在CNKI期刊頁(yè)面中,以主題詞=“關(guān)聯(lián)數(shù)據(jù)”或者“開放關(guān)聯(lián)數(shù)據(jù)”進(jìn)行精確搜索,篩選文獻(xiàn)分類學(xué)科為“圖書情報(bào)與數(shù)字圖書館”,來(lái)源類別為“CSSCI”和“北大核心”,得到相關(guān)文獻(xiàn)210篇。

    檢索時(shí)間為2022年12月7日,發(fā)文年度均為“2018—2022”。

    年度發(fā)文量

    如圖1所示,近五年國(guó)內(nèi)有關(guān)關(guān)聯(lián)數(shù)據(jù)的研究數(shù)量持續(xù)下降。通過(guò)泛讀論文,筆者認(rèn)為其主要原因是理論研究與實(shí)踐推進(jìn)嚴(yán)重脫節(jié)。從發(fā)文內(nèi)容可以看出,國(guó)內(nèi)文獻(xiàn)大量集中在概念解讀、理論探討和對(duì)國(guó)外技術(shù)的介紹上,即使是少部分實(shí)踐內(nèi)容也是以框架搭建、模式設(shè)計(jì)為主,核心源動(dòng)力的缺失使發(fā)文量持續(xù)走低。

    圖1 國(guó)內(nèi)外年度發(fā)文趨勢(shì)(作者自制)

    相比來(lái)講,國(guó)外的相關(guān)研究發(fā)文量緩慢增長(zhǎng),穩(wěn)扎穩(wěn)打,多國(guó)對(duì)書目數(shù)據(jù)的關(guān)聯(lián)化進(jìn)行了實(shí)踐推進(jìn),并基于此不斷進(jìn)行詞表、代碼和技術(shù)的更新演變。當(dāng)然,統(tǒng)計(jì)口徑和選取標(biāo)準(zhǔn)也是發(fā)文絕對(duì)數(shù)量產(chǎn)生差異的一個(gè)主要原因,因此此處不對(duì)絕對(duì)數(shù)量進(jìn)行比較,僅對(duì)近五年國(guó)內(nèi)外本學(xué)科發(fā)文數(shù)量的趨勢(shì)進(jìn)行探討。

    作者及合作度分析

    通過(guò)Bicomb對(duì)210篇國(guó)內(nèi)文獻(xiàn)及73篇國(guó)外文獻(xiàn)的作者進(jìn)行分析,統(tǒng)計(jì)結(jié)果如表1所示。國(guó)內(nèi)有2位學(xué)者5年內(nèi)發(fā)文超過(guò)10篇,4位學(xué)者發(fā)文數(shù)在5—10篇之間,另有8位學(xué)者發(fā)表4篇,5位學(xué)者發(fā)表3篇,參與寫作的學(xué)者共計(jì)380人;由于搜索總量限制,國(guó)外作者整體發(fā)文量較少,有1人發(fā)表3篇,2人發(fā)表2篇,其他198名學(xué)者均為單篇發(fā)文。國(guó)內(nèi)作者合作度(一段時(shí)期內(nèi)作者總數(shù)/論文總數(shù))為1.81(380位學(xué)者參與寫作210篇文獻(xiàn)),國(guó)外作者合作度為2.75(201位學(xué)者參與寫作73篇文獻(xiàn)),整體來(lái)講,國(guó)外學(xué)者在這個(gè)研究領(lǐng)域的科研合作更為緊密,平均每篇文章需要3個(gè)人共同完成。

    表1 發(fā)文作者統(tǒng)計(jì)

    國(guó)內(nèi)外研究關(guān)鍵詞分析

    通過(guò)Bicomb共抽取了中文關(guān)鍵詞521個(gè),英文關(guān)鍵詞261個(gè),經(jīng)過(guò)篩選、消歧后統(tǒng)計(jì)詞頻較高的關(guān)鍵詞統(tǒng)計(jì)如表2所示,同時(shí)利用Gephi進(jìn)行中文文獻(xiàn)的關(guān)鍵詞聚類分析,如圖2所示。

    表2 研究熱點(diǎn)關(guān)鍵詞詞頻統(tǒng)計(jì)

    圖2 國(guó)內(nèi)研究關(guān)鍵詞聚類關(guān)系(作者自制)

    結(jié)合圖表可見,圖情界關(guān)聯(lián)數(shù)據(jù)的研究熱點(diǎn)大致有6個(gè)主要方向,分別為知識(shí)組織和知識(shí)發(fā)現(xiàn)、數(shù)據(jù)和信息服務(wù)、書目數(shù)據(jù)轉(zhuǎn)換、數(shù)字人文及數(shù)字圖書館、大數(shù)據(jù)及知識(shí)庫(kù)構(gòu)建、科學(xué)數(shù)據(jù)及科技文獻(xiàn)。其中,對(duì)如本體、元數(shù)據(jù)、詞表等基本理論的研究,對(duì)基于BIBFRAME的書目數(shù)據(jù)轉(zhuǎn)換,以及基于關(guān)聯(lián)數(shù)據(jù)在圖情領(lǐng)域可以實(shí)現(xiàn)的知識(shí)組織、知識(shí)服務(wù)、科學(xué)數(shù)據(jù)、知識(shí)圖譜等應(yīng)用領(lǐng)域的研究是近五年較為熱門的研究?jī)?nèi)容。

    關(guān)聯(lián)數(shù)據(jù)在圖書館系統(tǒng)內(nèi)的應(yīng)用

    現(xiàn)狀及前景

    關(guān)聯(lián)數(shù)據(jù)在圖書館資源管理與服務(wù)中具有明顯優(yōu)勢(shì),可以協(xié)助實(shí)現(xiàn)不同機(jī)構(gòu)資源的聚合和共享,實(shí)現(xiàn)館藏不同類型文獻(xiàn)資源的關(guān)聯(lián),實(shí)現(xiàn)數(shù)據(jù)發(fā)現(xiàn)和知識(shí)挖掘,并能進(jìn)一步實(shí)現(xiàn)圖書館資源檢索能力的躍升。

    但是以上都建立在關(guān)聯(lián)數(shù)據(jù)的理念能落地實(shí)現(xiàn)的基礎(chǔ)上。盡管學(xué)界對(duì)關(guān)聯(lián)數(shù)據(jù)的技術(shù)討論和研究非常熱烈,但在實(shí)際應(yīng)用中并未進(jìn)行規(guī)模性推廣,甚至從某種程度來(lái)說(shuō),關(guān)聯(lián)數(shù)據(jù)的概念還并不為廣大圖書館界從業(yè)人員所知。國(guó)家圖書館最新的編目員培訓(xùn)課程仍是對(duì)CNMARC進(jìn)行講解和使用,而關(guān)聯(lián)數(shù)據(jù)構(gòu)建和應(yīng)用的推廣并未被提上日程。

    國(guó)外有許多圖書館將MARC數(shù)據(jù)轉(zhuǎn)換成關(guān)聯(lián)數(shù)據(jù),而在國(guó)內(nèi),僅有上海圖書館基于關(guān)聯(lián)數(shù)據(jù)構(gòu)建了開放數(shù)據(jù)平臺(tái),應(yīng)用于圖書館的人文信息描述方面,并開放給大眾使用。中國(guó)國(guó)家圖書館于2009年啟動(dòng)“國(guó)家圖書知識(shí)組織標(biāo)準(zhǔn)規(guī)范”項(xiàng)目,基于數(shù)字圖書館文獻(xiàn)資源描述和組織框架完成了部分知識(shí)組織工具與數(shù)字館藏元數(shù)據(jù)的語(yǔ)義化,制定了CNMARC、MARC21與國(guó)家圖書館元數(shù)據(jù)核心元素集映射轉(zhuǎn)換指南,但目前其詞表和資源尚無(wú)法直接訪問(wèn)。

    2Bibframe在書目數(shù)據(jù)關(guān)聯(lián)中的應(yīng)用

    關(guān)聯(lián)數(shù)據(jù)的核心為RDF的三元陳述組,即以主謂賓的形式描述每個(gè)元素,并對(duì)描述元素進(jìn)行關(guān)聯(lián),從而解決信息孤島的問(wèn)題。對(duì)于書目數(shù)據(jù)關(guān)聯(lián)化的轉(zhuǎn)換,BIBFRAME書目描述框架是一種國(guó)際普遍認(rèn)同的框架方式,可以用于取代目前的MARC的書目數(shù)據(jù)格式,以實(shí)現(xiàn)細(xì)粒度、語(yǔ)義性、開放性、向后兼容的資源存儲(chǔ)方式。

    BIBFRAME是由美國(guó)國(guó)會(huì)圖書館于2011年5月發(fā)布的新型書目數(shù)據(jù)模型與詞表,它設(shè)計(jì)了一套完整的關(guān)聯(lián)數(shù)據(jù)模型、詞匯、需求與用例,并且提供工具與服務(wù)。與現(xiàn)在使用的MARC相比,BIBFRAME模型可以基于實(shí)體的層次化結(jié)構(gòu)檢索,以細(xì)粒度的語(yǔ)義數(shù)據(jù)進(jìn)行標(biāo)記,實(shí)現(xiàn)書目的開放和關(guān)聯(lián),對(duì)非專業(yè)用戶更加友好。

    基于高校圖書館的書目關(guān)聯(lián)數(shù)據(jù)發(fā)布實(shí)驗(yàn)

    實(shí)驗(yàn)內(nèi)容及意義

    高校作為教育研究的主要陣地,一直走在各個(gè)學(xué)科探索和實(shí)踐的前沿,而高校圖書館在師生教學(xué)科研的過(guò)程中處于核心地位。結(jié)合國(guó)際前沿發(fā)展趨勢(shì),對(duì)高校內(nèi)的特色型數(shù)據(jù)逐步開始關(guān)聯(lián)化嘗試,為未來(lái)這一工作的全面展開做好技術(shù)、人才和戰(zhàn)略上的儲(chǔ)備,是推進(jìn)智慧圖書理念館落地的核心工作。并且,關(guān)聯(lián)數(shù)據(jù)在知識(shí)發(fā)現(xiàn)、規(guī)范控制和資源關(guān)聯(lián)方面有著獨(dú)特優(yōu)勢(shì),可以彌補(bǔ)目前各高??蒲袛?shù)據(jù)平臺(tái)在這方面的不足。

    本次實(shí)驗(yàn)將結(jié)合首都體育學(xué)院的辦學(xué)特色對(duì)主題詞為“體育產(chǎn)業(yè)”的相關(guān)書籍信息進(jìn)行關(guān)聯(lián)化實(shí)踐,并利用Open Refine工具實(shí)現(xiàn)關(guān)聯(lián)數(shù)據(jù)發(fā)布,在這一過(guò)程中尋找問(wèn)題,發(fā)現(xiàn)問(wèn)題,為進(jìn)一步探討和深入實(shí)踐打下基礎(chǔ)。

    實(shí)驗(yàn)設(shè)計(jì)與實(shí)驗(yàn)過(guò)程

    1.選擇資源

    本實(shí)驗(yàn)源數(shù)據(jù)的獲取是通過(guò)檢索系統(tǒng),對(duì)“體育產(chǎn)業(yè)”相關(guān)的館藏書籍進(jìn)行搜索,并摘取題名、著者、出版方、出版地、出版年、頁(yè)碼、尺寸、ISBN號(hào)、索書號(hào)等進(jìn)行關(guān)聯(lián)數(shù)據(jù)發(fā)布。以上信息既可以幫助讀者對(duì)書目形成基本的了解,也可以通過(guò)ISBN號(hào)對(duì)書目進(jìn)行唯一定位,并基于圖書館屬性,幫助讀者在圖書館搜索查找相關(guān)書籍。

    2.數(shù)據(jù)建模

    源數(shù)據(jù)包含11項(xiàng)內(nèi)容,其中題名為檢索系統(tǒng)對(duì)書籍名稱和著者的描述,方便直接搜索;著者為作者信息,包含作者的出生年代等部分內(nèi)容;出版方為書籍的出版社信息;出版地和出版年分別描述了書籍出版時(shí)的地域、年代特征;頁(yè)碼和尺寸描述了書籍實(shí)體的物理特征;ISBN號(hào)作為書籍的身份證號(hào),可以搜索到唯一的相關(guān)數(shù)據(jù);索書號(hào)是讀者到圖書館進(jìn)行實(shí)體書搜索的數(shù)據(jù)依托;SameAs是與上海圖書館數(shù)據(jù)關(guān)聯(lián)的外部鏈接;URI是對(duì)應(yīng)的每本書籍的唯一標(biāo)識(shí)符。

    對(duì)以上信息進(jìn)行整理匯總后,使用Open Refine工具導(dǎo)入數(shù)據(jù),根據(jù)數(shù)據(jù)建模及其屬性對(duì)應(yīng)的詞表,在工具中添加自定義詞表的URI和命名空間,以及所重用詞表的前綴、類和屬性,并定義類及屬性值的資源類型,從而將數(shù)據(jù)映射到適當(dāng)?shù)念惡蛯傩灾?。書目信息的關(guān)聯(lián)化詞表,在本實(shí)驗(yàn)中主要是用BIBFRAME進(jìn)行定義的,外部鏈接使用的是owl的詞表中的SameAs。

    3.定義URI

    由于書目存在同名或者同出版社等情況,而ISBN號(hào)無(wú)法直接閱讀大致方向,因此本實(shí)驗(yàn)中使用索書號(hào)對(duì)URI進(jìn)行分配。以《布局與結(jié)構(gòu)區(qū)域體育產(chǎn)業(yè)發(fā)展研究》為例,定義URI的命名空間前綴為http://www.HLibrary.org/org/,并在其后分配索書號(hào)G812/41,以備查看時(shí)大致了解其類別屬性。

    定義屬性、類和值后,使用Open Refine工具生成RDF文檔,并通過(guò)https://www.w3.org/RDF/Validator/進(jìn)行可視化和驗(yàn)證。

    實(shí)驗(yàn)結(jié)果

    實(shí)驗(yàn)中,由于中文識(shí)別問(wèn)題,導(dǎo)出的RDF存在大量亂碼問(wèn)題,可視化和驗(yàn)證的過(guò)程中也出現(xiàn)了一定的問(wèn)題。多次報(bào)錯(cuò)發(fā)現(xiàn)自動(dòng)生成的RDF文檔中多處存在結(jié)尾句少“<”的問(wèn)題,這可能是亂碼導(dǎo)致的符號(hào)識(shí)別錯(cuò)誤。逐個(gè)進(jìn)行修改后,再次驗(yàn)證有效性并生成部分可視化圖形。

    本次實(shí)驗(yàn)是對(duì)書目數(shù)據(jù)的關(guān)聯(lián)化,尚未對(duì)書目之間的關(guān)聯(lián)性進(jìn)行探討,未來(lái)可對(duì)相同的出版商進(jìn)行統(tǒng)一URI的定義和關(guān)聯(lián),對(duì)相同作者也進(jìn)行關(guān)聯(lián),從而進(jìn)一步發(fā)揮關(guān)聯(lián)數(shù)據(jù)在智庫(kù)搜索中的作用。

    思考與討論

    在本次實(shí)驗(yàn)中,筆者通過(guò)探究高校圖書館對(duì)特色學(xué)科書目數(shù)據(jù)關(guān)聯(lián)化的實(shí)驗(yàn),細(xì)致化體驗(yàn)了創(chuàng)建關(guān)聯(lián)數(shù)據(jù)的過(guò)程。學(xué)界在談到關(guān)聯(lián)數(shù)據(jù)時(shí),總是探討數(shù)據(jù)關(guān)聯(lián)后可以實(shí)現(xiàn)的種種功能,但就目前來(lái)看,關(guān)聯(lián)數(shù)據(jù)的發(fā)展離這一目標(biāo)的實(shí)現(xiàn)還有較大距離。

    創(chuàng)建RDF文件的軟件平臺(tái)的本地化是第一步,保證生成的文檔不報(bào)錯(cuò)、不亂碼,是首先需要解決的問(wèn)題。統(tǒng)一工具后的下一步是統(tǒng)一詞表,詞表的復(fù)用非常重要,BIBFRAME雖然與國(guó)際接軌,但是對(duì)國(guó)內(nèi)許多一線工作人員并不友好。就像此前針對(duì)MARC數(shù)據(jù)我們要制作對(duì)應(yīng)的CNMARK一樣,國(guó)家圖書館正在針對(duì)這一方面積極建設(shè),相信國(guó)內(nèi)通用的基礎(chǔ)詞表很快就會(huì)出現(xiàn)。擁有了基礎(chǔ)詞表和軟件平臺(tái),還需要培養(yǎng)一批工作人員對(duì)數(shù)據(jù)進(jìn)行改造和創(chuàng)建,這個(gè)過(guò)程需要耗費(fèi)大量的人力、物力和時(shí)間,初期需要各高校分工,對(duì)現(xiàn)有圖書、期刊、電子資源進(jìn)行關(guān)聯(lián)化,用統(tǒng)一的平臺(tái)和詞表進(jìn)行標(biāo)識(shí),后期主要是數(shù)據(jù)重用和對(duì)各自領(lǐng)域的特殊數(shù)據(jù)進(jìn)行輕加工,雖然繁雜但是有序。

    總體來(lái)講,關(guān)聯(lián)數(shù)據(jù)的確是大勢(shì)所趨,但就目前的發(fā)展情況來(lái)看,圖書館領(lǐng)域的書目數(shù)據(jù)關(guān)聯(lián)化仍然任重而道遠(yuǎn)。

    猜你喜歡
    詞表書目發(fā)文
    推薦書目《初春之城》
    都市人(2022年3期)2022-04-27 00:44:57
    A Chinese-English List of the Sports Programmes in Winter Olympics 冬奧會(huì)項(xiàng)目名稱漢英對(duì)照詞表
    10條具體舉措! 山東發(fā)文做好返鄉(xiāng)留鄉(xiāng)農(nóng)民工就地就近就業(yè)
    校園拾趣
    爺孫趣事
    以牙還牙
    敘詞表與其他詞表的互操作標(biāo)準(zhǔn)
    國(guó)外敘詞表的應(yīng)用與發(fā)展趨勢(shì)探討*
    本刊郵購(gòu)書目
    常用聯(lián)綿詞表
    繁峙县| 山东省| 连南| 山丹县| 柘荣县| 申扎县| 邵阳县| 宁蒗| 郯城县| 嘉义市| 大厂| 融水| 峨山| 时尚| 滦平县| 前郭尔| 苗栗县| 广河县| 嘉义市| 大足县| 民县| 楚雄市| 江陵县| 灵武市| 工布江达县| 乌苏市| 曲靖市| 巨野县| 大足县| 汽车| 垫江县| 陵川县| 贵阳市| 龙口市| 锦州市| 渭南市| 宝应县| 买车| 汾西县| 黄骅市| 章丘市|