• 
    

    
    

      99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

      國家圖書館西文規(guī)范數(shù)據(jù)庫更新機(jī)制述略

      2019-07-22 05:35:28張麗娟
      數(shù)字圖書館論壇 2019年6期
      關(guān)鍵詞:西文國圖字段

      張麗娟

      (國家圖書館,北京 100081)

      1 規(guī)范控制概述

      規(guī)范控制,又稱權(quán)威控制,是為確保文獻(xiàn)信息資源檢索點的唯一性和一致性,而建立、維護(hù)、使用和評估規(guī)范記錄(authority record)和規(guī)范文檔(authority file)的工作過程[1]。

      規(guī)范控制是編目工作不可或缺的重要環(huán)節(jié),是書目系統(tǒng)先進(jìn)性和完整性的具體體現(xiàn),是實現(xiàn)目錄功能的主要途徑。規(guī)范控制的作用可歸納為:首先,規(guī)范控制能確定統(tǒng)一的檢索點形式,匯集質(zhì)同形異的檢索點,從而提高檢索的查全率;其次,規(guī)范控制能確定唯一的檢索點形式,區(qū)別形同質(zhì)異的檢索點,從而提高檢索的查準(zhǔn)率;最后,規(guī)范控制能在相關(guān)檢索點形式之間建立一種邏輯關(guān)系,通過參照系統(tǒng)予以揭示,從而將用戶從檢索點的非規(guī)范形式指引到規(guī)范形式或相關(guān)檢索點,最終獲得理想的檢索結(jié)果,即提高檢索的便捷性,起到導(dǎo)航作用[2]。

      規(guī)范控制工作的開展既需要深厚的編目思想的指導(dǎo),又需要先進(jìn)的計算機(jī)和網(wǎng)絡(luò)技術(shù)的支撐,內(nèi)涵豐富,環(huán)節(jié)復(fù)雜。1985年,美國伊利諾依州立大學(xué)的Burger[3]出版了有關(guān)規(guī)范控制工作的專著,他按照流程將規(guī)范工作的內(nèi)容歸納為規(guī)范記錄的創(chuàng)建、規(guī)范文檔的聚合、規(guī)范系統(tǒng)的建立、維護(hù)和評估五個環(huán)節(jié)。這些環(huán)節(jié)中的核心是規(guī)范文檔,規(guī)范控制工作都是圍繞規(guī)范文檔的建設(shè)和利用開展的。規(guī)范文檔是指規(guī)范記錄的集合,是將受控檢索點的規(guī)范形式、變異形式及說明信息按照一定的次序排列而成的統(tǒng)一管理和維護(hù)檢索點、對書目文檔實施規(guī)范控制的工具。隨著信息技術(shù)的飛速發(fā)展,規(guī)范文檔從傳統(tǒng)的縮微平片等載體形式轉(zhuǎn)變?yōu)殡娮踊臄?shù)據(jù)庫形式。

      規(guī)范文檔是一個生長的有機(jī)體,隨時保持更新的狀態(tài),包括新增記錄、修改記錄和刪除記錄3種更新類型。在新增記錄方面,如果館藏中出現(xiàn)新的實體,則需要為其創(chuàng)建新的規(guī)范記錄。如果以往規(guī)范記錄由于不能區(qū)分而共用一條規(guī)范記錄,則在獲得足夠區(qū)分信息時就可從共用記錄中分離出新規(guī)范記錄。在修改記錄方面,如果規(guī)范檢索點形式、變異形式或參照說明等發(fā)生變化,則需要對規(guī)范記錄進(jìn)行修改。或者書目機(jī)構(gòu)獲得了更多的限定信息,則可對規(guī)范記錄進(jìn)行補(bǔ)充說明。在刪除記錄方面,如果一條規(guī)范記錄的規(guī)范檢索點被廢止,則需要刪除相應(yīng)的規(guī)范記錄?;蛘哂捎谝?guī)范數(shù)據(jù)庫是合作項目共建,如果發(fā)現(xiàn)重復(fù)記錄則予以刪除。上述更新類型都是針對規(guī)范文檔本身的。除此之外,更新還包括另一層含義,即將規(guī)范記錄的更新變化體現(xiàn)到書目記錄中與之相連的規(guī)范檢索點中去。本文主要涉及規(guī)范文檔自身的更新。

      國家圖書館(以下簡稱“國圖”)西文規(guī)范控制建設(shè)始于20世紀(jì)80年代,經(jīng)過30多年的努力,西文規(guī)范控制業(yè)已形成較完善的體系,不僅在系統(tǒng)內(nèi)實現(xiàn)了規(guī)范記錄對書目檢索點的有效控制,還自行研發(fā)了應(yīng)用程序,較好地解決了規(guī)范數(shù)據(jù)庫自身的更新問題。但是,由于國圖西文規(guī)范控制屬于引用模式,通過直接購買國外成熟的規(guī)范文檔和相應(yīng)更新文件用于本地規(guī)范控制,因此在規(guī)范控制過程中存在一些現(xiàn)實問題。本文以介紹國圖西文規(guī)范控制更新工作的開展為切入點,總結(jié)數(shù)據(jù)庫更新的各類情況,進(jìn)而思考完全引進(jìn)模式所存在的問題,提出新的工作思路。

      2 更新機(jī)制

      2.1 概況

      國圖西文規(guī)范控制工作起步較早,但比較系統(tǒng)地開展西文規(guī)范控制工作則歸功于2003年引進(jìn)的Aleph 500圖書館集成管理系統(tǒng)。規(guī)范控制的核心是規(guī)范數(shù)據(jù)庫的建設(shè),國圖西文規(guī)范控制采用直接引用模式,即引進(jìn)了美國國會圖書館(Library of Congress,LC)的名稱規(guī)范文檔(LC Name Authority File,LCNAF)和主題規(guī)范文檔(LC Subject Authority File,LCSAF),并將其裝載至Aleph 500系統(tǒng),通過系統(tǒng)功能與書目數(shù)據(jù)相連,實現(xiàn)對書目檢索點的有效控制。為保持規(guī)范數(shù)據(jù)庫的活力,國圖還配套引進(jìn)了LC規(guī)范數(shù)據(jù)庫的周更新文件,用于對規(guī)范數(shù)據(jù)的維護(hù)。

      系統(tǒng)使用初期,為確保系統(tǒng)安全,周更新文件無法即時對規(guī)范數(shù)據(jù)庫進(jìn)行更新,國圖只能暫時采用集中更新的方式,將更新文件按照時間的先后順序合并,再用合并后的最終文件對規(guī)范數(shù)據(jù)庫進(jìn)行整體更新。LC的規(guī)范數(shù)據(jù)每年有二三十萬的增長量,而集中更新每三年才進(jìn)行一次,西文規(guī)范數(shù)據(jù)庫的時效性嚴(yán)重滯后。2010年,國圖信息技術(shù)部門研發(fā)了專門的更新文件裝載程序,可通過外部應(yīng)用軟件直接將更新文件中的規(guī)范記錄灌裝至Aleph 500系統(tǒng)[4],至此終于實現(xiàn)西文規(guī)范數(shù)據(jù)庫與LC規(guī)范數(shù)據(jù)庫的同步更新。

      目前西文名稱規(guī)范數(shù)據(jù)已達(dá)10 610 526條,主題規(guī)范數(shù)據(jù)量已達(dá)433 018條。2010年1月—2018年12月,國圖共完成名稱和主題規(guī)范數(shù)據(jù)庫更新各469期,名稱規(guī)范數(shù)據(jù)庫更新記錄6 579 610條,主題規(guī)范數(shù)據(jù)庫更新記錄153 912條,兩個數(shù)據(jù)庫記錄新增、修改、刪除3種情況的數(shù)據(jù)更新量如圖1和圖2所示。

      圖1 2010—2018年名稱規(guī)范數(shù)據(jù)庫各年更新量對比圖

      圖2 2010—2018年主題規(guī)范數(shù)據(jù)庫各年更新量對比圖

      由此可見,名稱規(guī)范數(shù)據(jù)庫的數(shù)據(jù)總量和更新量都遠(yuǎn)遠(yuǎn)高于主題規(guī)范數(shù)據(jù)庫。原因在于,名稱規(guī)范數(shù)據(jù)庫主要由LC領(lǐng)銜的名稱規(guī)范合作項目(Name Authority Cooperative Program,NACO)成員館基于增加館藏的情況予以建設(shè),由于館藏數(shù)量迅猛增長,所以名稱規(guī)范記錄的數(shù)量也隨之大幅增長。而主題規(guī)范數(shù)據(jù)庫是基于美國國會圖書館標(biāo)題表(Library of Congress Subject Headings,LCSH)的內(nèi)容,通過主題規(guī)范合作項目(Subject Authority Cooperative Program,SACO)參與者以提議的方式并由LC政策專家審核批準(zhǔn)后才能用于更新記錄,所以主題規(guī)范記錄的增長十分有限。在新增、修改、刪除3種更新類型中,兩個規(guī)范數(shù)據(jù)庫都是刪除記錄的情況最少,這主要得益于LC和相關(guān)參與者高質(zhì)量的工作及穩(wěn)定的規(guī)則體系。名稱規(guī)范記錄每年新增記錄的數(shù)量基本保持在30萬條上下,比較平穩(wěn)。雖然LC在2013年3月31日開始實行資源描述與檢索(Resource Description and Access,RDA)規(guī)則,但是LC的RDA化進(jìn)程不是一刀切的,而是從2008年完成RDA測試之后逐步開始的,到“RDA切換日”這天,RDA數(shù)據(jù)的比例達(dá)到100%。LC實現(xiàn)RDA本地化之后,規(guī)范記錄也沒有迅猛增長,這是因為新規(guī)則的啟用引發(fā)了對歷史數(shù)據(jù)的修改,但并不會造成實體數(shù)量的增加,因此,在RDA全面實施的2012年和2013年,名稱規(guī)范記錄的修改量達(dá)到高峰,但是增長量保持穩(wěn)定。

      2.2 工作流程

      LCNAF和LCSAF周一至周六每天更新,內(nèi)容包括LC編目員在前一天創(chuàng)建和修改的記錄,以及由NACO參與者提供的記錄,而上一周的刪除記錄在每個周末統(tǒng)一刪除。LC政策專家進(jìn)行審核通過的需更新的主題記錄每周進(jìn)行更新。LC將這些更新文件按周制作成LC規(guī)范文檔的周更新文件,供其他機(jī)構(gòu)下載使用。2010年國圖在完成LC規(guī)范數(shù)據(jù)裝載軟件測試后,也制定了更新工作規(guī)范,并設(shè)計了更新工作流程。

      首先由專人負(fù)責(zé)將這些周更新文件定期從LC提供的FTP地址上下載至本地,并上傳至指定的FTP進(jìn)行長期保存。LC規(guī)范文檔的周更新文件為ISO 2709數(shù)據(jù)格式,以卷、期組合的方式命名,包括5種類型的文件,分別是XML文件、report文件、property list文件、records文件、UTF8文件。這些文件除可用于對本地規(guī)范記錄的更新外,還包含更新量匯總,每條被更新記錄的完整記錄信息等,對于了解每期更新動態(tài),減少操作失誤,嚴(yán)格保證數(shù)據(jù)庫更新操作的安全,具有非常重要的意義。

      隨后由專人通過專門研發(fā)的裝載軟件對Aleph 500系統(tǒng)中的本地規(guī)范數(shù)據(jù)庫進(jìn)行更新。裝載軟件基于Web的B/S模式,將功能實現(xiàn)的核心部分集中到服務(wù)器上,僅需在IE瀏覽器上輸入相應(yīng)的地址即可方便快捷地使用該軟件,更新只需五個步驟:確定要更新的目標(biāo)庫,即是對名稱庫還是主題庫進(jìn)行更新;將LC原始規(guī)范數(shù)據(jù)文件上傳到Aleph 500服務(wù)器,并對該文件進(jìn)行第一步的轉(zhuǎn)換,即加回車換行符到文件中,使其分行;將上一步生成的已分行MARC21格式文件轉(zhuǎn)換為Sequence格式,輸入的文件為上一步輸出的文件;將生成的Sequence文件轉(zhuǎn)換字符集為UTF;將生成的UTF文件中的數(shù)據(jù)更新到相應(yīng)的西文規(guī)范數(shù)據(jù)庫。最后,將上述各步驟生成的文件下載保存,將第五步生成的文件中實際更新的記錄總量與LC更新文件中記錄更新量對比是否一致,數(shù)量相同,則從本期更新中隨機(jī)抽取有代表性的規(guī)范記錄,在本地規(guī)范數(shù)據(jù)庫中查看這些記錄的更新狀態(tài)及更新時間,核對無誤后,更新人員認(rèn)真填寫更新日志。

      規(guī)范數(shù)據(jù)庫更新是一項嚴(yán)謹(jǐn)?shù)墓ぷ?,一旦誤操作就可能造成規(guī)范數(shù)據(jù)庫的混亂,糾正這些錯誤將會耗費(fèi)更新人員大量的時間和精力。因此,由專人對整個操作進(jìn)行監(jiān)督及文檔管理至關(guān)重要。

      2.3 更新規(guī)則

      更新文件中的規(guī)范記錄如何與目標(biāo)庫進(jìn)行匹配是準(zhǔn)確完成更新的重要前提。在LC規(guī)范記錄中,為每條記錄都分配了唯一的記錄控制號,同時記錄在001字段和010字段。兩個字段的區(qū)別在于,如果規(guī)范記錄進(jìn)行了本地化修改,則001字段所記錄的LC控制號(Library of Congress Control Number,LCCN)將被本地控制號所取代,但是010字段所記錄的LCCN在任何情況下都保持不變。此外,本地修改之后,規(guī)范記錄中還會增加一個表示操作員代碼的字段“OWN”。在開展更新工作時,主要依靠010字段LCCN來匹配數(shù)據(jù),同時兼顧本地修改的情況。具體更新規(guī)則如下。

      對于LC更新文件中的新增記錄,直接裝入目標(biāo)數(shù)據(jù)庫。對于LC更新文件中的修改記錄,用目標(biāo)庫010字段LCCN進(jìn)行匹配,如果目標(biāo)庫中無同號記錄,則作為新增記錄直接裝入;如果數(shù)據(jù)庫中已有同號記錄,且未進(jìn)行過本地修改,則用更新文件中的修改記錄覆蓋庫中的同號記錄。對于更新文件中的刪除記錄,用目標(biāo)庫的010字段LCCN進(jìn)行匹配,如果數(shù)據(jù)庫中無同號記錄,則該記錄不必寫入;如果數(shù)據(jù)庫中已有同號記錄,且未進(jìn)行過本地修改,則用刪除記錄覆蓋數(shù)據(jù)庫中同號記錄。對于編目員已修改而無法進(jìn)行同號覆蓋的LC更新文件中的規(guī)范記錄,裝入臨時庫暫存,裝載時同樣先用010字段LCCN進(jìn)行匹配,如果臨時庫中無同號記錄,則直接寫入;如果臨時庫中已有同號記錄,則覆蓋。

      3 更新情況分析

      規(guī)范數(shù)據(jù)庫發(fā)生日常更新的原因很多。資源種類的豐富、出版方式的變化、版本形式的多樣化等使館藏資源與日俱增。在這些增加的館藏中可能會出現(xiàn)新的責(zé)任者、新的作品或者原有作品的衍生品,這些都需要在編目時為其構(gòu)建新的規(guī)范檢索點。此外,編目員從這些新館藏資源中可能獲取到更多的有用信息用于優(yōu)化舊的規(guī)范記錄。再則,編目界日新月異,新規(guī)則層出不窮,規(guī)則變化會導(dǎo)致規(guī)范數(shù)據(jù)發(fā)生批量更新。如RDA取消了檢索點選取的“3原則”,書目記錄中檢索點的范圍大幅擴(kuò)展,促使大量新規(guī)范記錄產(chǎn)生;RDA規(guī)則鼓勵“如實轉(zhuǎn)錄”,因此規(guī)范檢索點取消了大量的人為縮寫,而以用戶容易理解的全拼形式記錄,增強(qiáng)表達(dá)性,從而引發(fā)大量規(guī)范檢索點的形式變化;RDA采用“首選名稱+附加成分”構(gòu)建規(guī)范檢索點的方法,對首選名稱和變異名稱的選擇,以及為區(qū)分同一名稱的不同實體添加附加成分的順序都與AACR2存在差異。格式上的變化也是造成規(guī)范數(shù)據(jù)庫更新的原因之一。MARC21規(guī)范數(shù)據(jù)格式為適應(yīng)RDA做了相應(yīng)修訂,增加字段近40個。

      規(guī)范數(shù)據(jù)庫日常更新的3種類型一般通過MARC21規(guī)范數(shù)據(jù)格式的頭標(biāo)/05字符位代碼予以表示,即分別用“n”“c”“d”表示“新增”“修改”和“刪除”。

      3.1 新增規(guī)范記錄

      如果某實體在規(guī)范數(shù)據(jù)庫中找不到對應(yīng)的規(guī)范記錄,就需為其創(chuàng)建規(guī)范記錄,常見的是為新增的個人、團(tuán)體創(chuàng)建規(guī)范記錄,還可以為新增的作品或內(nèi)容表達(dá)建立新記錄。如2014年出版的《習(xí)近平談治國理政》英文版就是一個新的內(nèi)容表達(dá),可為其創(chuàng)建規(guī)范記錄如下。

      LDR/05 n

      100 1#$aXi, Jinping.$tXi Jinping tan zhi guo li zheng.$lEnglish

      400 1#$a 習(xí)近平.$t 習(xí)近平談治國理政.$lEnglish

      400 1#$aXi, Jinping.$tXi Jinping, the governance of China

      430#0$a 習(xí)近平談治國理政

      670##$aXi Jinping, The governance of China, 2014: $bcolophon(Xi Jinping tan zhi guo li zheng--English)

      此外,在LC規(guī)范控制實踐中還存在一種需要新增規(guī)范記錄的情況,即分離未區(qū)分的規(guī)范記錄。當(dāng)多個實體擁有相同的名稱,但是用于區(qū)分它們的信息不足時,這些實體可暫時共用一條規(guī)范記錄,待后續(xù)編目員獲得的信息足以將它們區(qū)分開時,再重新創(chuàng)建規(guī)范記錄。在LC規(guī)范數(shù)據(jù)庫中目前存在51 785條名稱未區(qū)分的規(guī)范記錄[5]。未區(qū)分的規(guī)范記錄用008字段32字符位代碼“b”表示。

      例如,LC控制號為“nr2001024383”的規(guī)范記錄就是一條未區(qū)分的記錄,其規(guī)范檢索點形式為“Li, Qiang”。《國家圖書館藏民國軍事檔案文獻(xiàn)初編》的責(zé)任者之一“李強(qiáng)”和《大型公共場所人員疏散策略模擬與應(yīng)用》的著者“李強(qiáng)”是兩個不同的實體,卻共用同一規(guī)范檢索點形式。

      LDR/05 c

      008/32 b

      100 1# $aLi, Qiang

      400 1# $a 李強(qiáng)

      670##$aDa xing gong gong chang suo ren yuan shu san ce lüe mo ni yu ying yong, 2011: $bt.p.(李強(qiáng), Li Qiang)

      670##$aGuo jia tu shu guan cang Minguo jun shi dang an wen xian chu bian, 2009: $bt.p.(李強(qiáng) = Li Qiang)

      由于規(guī)范形式通過添加附加成分可區(qū)分,為后者“李強(qiáng)”創(chuàng)建規(guī)范記錄。RDA規(guī)定個人名稱附加成分的優(yōu)先順序為:出生日期和(或)死亡日期、名稱的更完整形式、個人活躍期、職業(yè)或工作添加。由于無時間信息,名稱也完整,所以根據(jù)資源的題名推斷職業(yè)或工作信息作為附加成分。

      LDR/05 n

      008/32 a

      100 1#$aLi, Qiang$c(Writer on evacuation of civilians)

      400 1#$a李強(qiáng)$c(Writer on evacuation of civilians)

      667##$aFormerly on undifferentiated name record:nr2001024383.

      670##$aDa xing gong gong chang suo ren yuan shu san ce lüe mo ni yu ying yong, 2011: $bt.p.(李強(qiáng), Li Qiang)

      3.2 修改規(guī)范記錄

      規(guī)范記錄的數(shù)據(jù)內(nèi)容部分一般包括規(guī)范檢索點、單純參照、相關(guān)參照、參考數(shù)據(jù)源等信息,當(dāng)這些信息發(fā)生變化時,就要對規(guī)范記錄進(jìn)行修改,使規(guī)范記錄的信息更完整,更方便識別和區(qū)分。

      規(guī)范檢索點一般由“首選名稱+附加成分”組成,當(dāng)首選名稱或附加成分發(fā)生變化時,即需對規(guī)范記錄進(jìn)行修改。例如,將LC控制號為“n 79133113”的規(guī)范記錄“Ba, Jin, 1904-”由于補(bǔ)充了卒年信息,規(guī)范檢索點形式修改為“Ba, Jin, 1904-2005”。規(guī)則變化也常常引發(fā)記錄的修改。例如,RDA規(guī)則要求不應(yīng)人為地進(jìn)行縮寫,如用“approximately”取代了拉丁文縮寫“ca”,個人活躍期用“active”,取代“fl.”,所以當(dāng)對原AACR2的規(guī)范檢索點進(jìn)行“RDA化”修改后,拉丁縮寫要轉(zhuǎn)化為完整英語形式。此外,參照或數(shù)據(jù)源信息的補(bǔ)充也會造成數(shù)據(jù)的修改。例如,為LC控制號為“n 00011963”的規(guī)范記錄“Sargent, John F.”增加了670字段的來源信息“$aPhone call to author, Feb.10,2012 $b (prefers full name, John Francis Sargent, Jr.;b.1962)”。

      3.3 刪除規(guī)范記錄

      LCCN是不可重復(fù)使用的,一旦為某實體創(chuàng)建規(guī)范記錄,并將LCCN分配給該記錄,則不能將該控制號用于其他實體。如果規(guī)范記錄本身發(fā)生變化,可將規(guī)范記錄連同LCCN一并刪除。MARC21規(guī)范數(shù)據(jù)格式頭標(biāo)/05字符位除了代表“d”表示刪除之外,還有兩個代碼“s”和“x”也表示刪除的情形?!皊”表示一個規(guī)范檢索點因被拆分成兩個或多個規(guī)范檢索點而刪除的記錄,該規(guī)范檢索點在被拆分后新增的規(guī)范記錄中以單純參照形式出現(xiàn)。“x”表示由于一個規(guī)范檢索點被另一個規(guī)范檢索點取代而被刪除的記錄,該規(guī)范檢索點也會以單純參照形式出現(xiàn)在另一條規(guī)范記錄中。當(dāng)代碼“s”和“x”皆不適用或者編目機(jī)構(gòu)不需要細(xì)分刪除的情形,則用代碼“d”表示已刪除的記錄。LC規(guī)范記錄即是如此,僅用代碼“d”表示已刪除的記錄。對于未區(qū)分的規(guī)范記錄,如果獲得了可區(qū)分的信息實現(xiàn)了所有未區(qū)分記錄的分離,均新建了規(guī)范記錄,則原始的那條共用記錄則需要刪除。

      4 小結(jié)

      國圖西文規(guī)范控制直接引用模式能充分共享國外的先進(jìn)經(jīng)驗和成果,大大節(jié)省了建設(shè)規(guī)范數(shù)據(jù)庫的人力和物力,還通過摸索實現(xiàn)與引用規(guī)范數(shù)據(jù)庫的同步更新。盡管取得了一定的成績,但是國圖西文規(guī)范數(shù)據(jù)庫的更新建設(shè)還存在一些有待解決的問題。

      首先,更新雖然及時,但是缺乏自建的模式仍然不能完全滿足西文規(guī)范控制建設(shè)的需要。例如,館藏書目數(shù)據(jù)的檢索點不能實現(xiàn)與規(guī)范數(shù)據(jù)庫檢索點的完全匹配。由于LC規(guī)范數(shù)據(jù)庫是基于其多個成員館的館藏情況而共同建設(shè),館藏資源的獲取途徑、發(fā)行限制和受眾群體等不同,國圖編目員經(jīng)常遇到對書目數(shù)據(jù)的檢索點進(jìn)行規(guī)范控制時,在西文規(guī)范數(shù)據(jù)庫中找不到匹配規(guī)范記錄的情況,編目員只能憑經(jīng)驗使用資源上的檢索點形式,造成書目數(shù)據(jù)庫中非控檢索點的存在,尤其是在編目亞洲發(fā)行的資源時這種情況尤其突出。大量非控檢索點的存在無疑為今后數(shù)據(jù)庫維護(hù)增加了工作負(fù)擔(dān)。再如,對于中國名稱,LC規(guī)范檢索點采用了漢語拼音的拉丁化形式。近年來,LC在建設(shè)名稱規(guī)范數(shù)據(jù)時加大了對中國實體信息的補(bǔ)充,為不少中國名稱增加了中文形式的單純參照,以便用戶更好地識別實體。但是,由于中國名稱的特殊性,僅靠拼音很難區(qū)分實體,而LC在中文信息方面不具備優(yōu)勢,因此添加的單純參照十分有限。國圖編目員如果能利用自身信息優(yōu)勢,在規(guī)范記錄更新時盡可能為中國名稱添加可靠的單純參照,將大大提升LC名稱規(guī)范數(shù)據(jù)庫的質(zhì)量。但是完全引進(jìn)的更新模式使編目員無法通過自建來完善規(guī)范記錄。

      其次,大量的更新也造成問題數(shù)據(jù)量的增長。數(shù)量如此龐大的數(shù)據(jù)庫難免存在記錄質(zhì)量問題。例如,LC一些規(guī)范記錄的008字段,代碼應(yīng)記錄為小寫字母,但是經(jīng)常會出現(xiàn)大寫字母,這樣的記錄無法實現(xiàn)對書目文檔相關(guān)檢索點的自動更新。在這種情況下,編目員只能將大寫字母改為小寫,雖然只是簡單修改,但是保存之后會形成本地控制號和操作員代碼。這樣的記錄更新時不能依靠控制號的匹配自動覆蓋,只能暫時將它們放置在臨時數(shù)據(jù)庫中。隨著更新的進(jìn)行,這部分記錄的數(shù)量不斷增長,更新信息無法在規(guī)范數(shù)據(jù)庫中體現(xiàn),造成更新無效。

      最后,更新的一個重要方面是為規(guī)范檢索點增加了諸多單純參照,但是國圖Aleph 500系統(tǒng)并未將這些增加參照信息即時抽取索引,造成更新內(nèi)容不能快速在檢索機(jī)制中體現(xiàn),而大大降低了更新的效果。

      解決上述問題的關(guān)鍵是逐步在引進(jìn)模式中增加自建環(huán)節(jié)。隨著對規(guī)范記錄創(chuàng)建內(nèi)容及格式標(biāo)準(zhǔn)認(rèn)識和理解的深入,國圖編目員已經(jīng)具備一定的規(guī)范自建能力,他們希望在共享國外規(guī)范成果的同時,盡可能多地參與到項目建設(shè)的愿望愈發(fā)強(qiáng)烈。按照NACO對成員館的要求,加入項目的前提條件是參加一個聯(lián)機(jī)合作編目系統(tǒng),以便能夠提交聯(lián)機(jī)規(guī)范記錄。國圖2010年正式加入OCLC實現(xiàn)書目記錄的上傳,已具備提交規(guī)范記錄的基本條件。國圖應(yīng)積極申請加入NACO等國際規(guī)范控制合作項目,在引進(jìn)LC成熟規(guī)范數(shù)據(jù)庫的同時,逐步增加自建環(huán)節(jié),這樣可以解決規(guī)范數(shù)據(jù)庫沒有相關(guān)檢索點的問題,同時還可以在發(fā)揮中文信息優(yōu)勢以及完善中國有關(guān)實體規(guī)范記錄方面做出更多的貢獻(xiàn)。在參與國際規(guī)范控制共建過程中,國圖還能充分吸收各國規(guī)范控制建設(shè)經(jīng)驗,打造一支素質(zhì)優(yōu)良、具備參與國際項目建設(shè)能力的編目員隊伍。隨著規(guī)范控制工作的深入,國圖應(yīng)設(shè)置規(guī)范管理綜合崗,用于專門解決規(guī)范控制中的各類問題。對于臨時數(shù)據(jù)庫中的更新記錄,應(yīng)由專人負(fù)責(zé)比對,用人工或半人工的方式將更新的重要信息合并至規(guī)范數(shù)據(jù)庫中。國圖也應(yīng)加強(qiáng)對檢索點抽取工作的力度,即使不能實現(xiàn)時時抽取,也應(yīng)加大批量抽取的頻率,使規(guī)范記錄更新中的參照形式能盡快在索引中體現(xiàn),從而提升OPAC的檢索效果。

      規(guī)范數(shù)據(jù)庫的更新是規(guī)范控制建設(shè)中的重要一環(huán)。除國圖之外,我國圖書館界在外文資源信息組織方面也多采用引進(jìn)國際上成熟規(guī)范數(shù)據(jù)庫的方式,因此,國圖在西文規(guī)范數(shù)據(jù)庫更新方面的經(jīng)驗對于其他圖書館建設(shè)外文書目系統(tǒng)具有一定的參考借鑒意義。我國中文文獻(xiàn)信息編目中的規(guī)范控制環(huán)節(jié)雖完全采用自建模式,但也需要建立科學(xué)合理的更新維護(hù)機(jī)制,因此對于LC規(guī)范數(shù)據(jù)庫相關(guān)情況的研究在一定程度上也希望能給予中文規(guī)范控制系統(tǒng)建設(shè)以很好的啟發(fā)。

      猜你喜歡
      西文國圖字段
      高校圖書館西文古籍開發(fā)整理實踐及對策探討
      ——以河北大學(xué)圖書館為例
      樂籍西譯:五種《樂記》西文譯本、譯者及其傳播
      圖書館中文圖書編目外包數(shù)據(jù)質(zhì)量控制分析
      110歲國圖正青春
      文苑(2019年24期)2020-01-06 12:06:52
      《那風(fēng)·那雪·那年除夕》(國畫)
      西文圖書編目中RDA書目記錄使用分析
      高等教育英語專業(yè)建設(shè)回顧
      誰是國圖
      意林(2015年1期)2015-05-14 16:49:40
      CNMARC304字段和314字段責(zé)任附注方式解析
      無正題名文獻(xiàn)著錄方法評述
      泸州市| 天镇县| 汪清县| 宁远县| 芮城县| 泊头市| 巢湖市| 彭山县| 台安县| 江西省| 临潭县| 邢台县| 封丘县| 安义县| 福贡县| 玛曲县| 凭祥市| 交城县| 富顺县| 镇雄县| 莱州市| 平凉市| 绍兴市| 贺兰县| 灌南县| 喀喇沁旗| 荔波县| 都江堰市| 新田县| 九寨沟县| 无为县| 肥城市| 彰武县| 元朗区| 望江县| 唐山市| 吴桥县| 舞钢市| 顺义区| 淳安县| 遂宁市|