胡媛
摘?要:名稱規(guī)范控制工作是圖書館重要的業(yè)務(wù)工作,隨著圖書館文獻(xiàn)類型的增多,名稱規(guī)范工作的重要功能更加凸顯,但中文名稱規(guī)范數(shù)據(jù)屬性的不足制約了其功能的發(fā)揮。因此,圖書館只有加強(qiáng)中文個(gè)人名稱規(guī)范數(shù)據(jù)屬性分析,做好關(guān)聯(lián)性研究,才能使圖書館真正回歸文化建設(shè)的核心地位。文章在梳理我國(guó)圖書館中文名稱規(guī)范理論與實(shí)踐成果的基礎(chǔ)上,進(jìn)行了數(shù)據(jù)屬性的詳盡分析與關(guān)聯(lián)性研究。
中圖分類號(hào):G250文獻(xiàn)標(biāo)識(shí)碼:A文章編號(hào):1003-1588(2019)01-0112-03
關(guān)鍵詞:名稱規(guī)范數(shù)據(jù);規(guī)范數(shù)據(jù)屬性;關(guān)聯(lián)性
隨著社會(huì)經(jīng)濟(jì)和文化的發(fā)展及圖書文獻(xiàn)的增加,中文書目數(shù)據(jù)量猛增,編目員在書目管理中經(jīng)常會(huì)遇到同一責(zé)任者異名、同名不同責(zé)任者、同書異名、同名異書等情況。為了更好地區(qū)分同名責(zé)任者并集中文獻(xiàn)資源,做好圖書館書目的優(yōu)化管理,中文個(gè)人名稱規(guī)范研究工作愈發(fā)重要,尤其是如何從規(guī)范數(shù)據(jù)的內(nèi)容表達(dá)演進(jìn)到規(guī)范數(shù)據(jù)的屬性表達(dá)與關(guān)系構(gòu)建,需要以關(guān)聯(lián)性為基礎(chǔ)進(jìn)行嚴(yán)謹(jǐn)細(xì)致的分析。
1?我國(guó)圖書館中文名稱規(guī)范歷史
圖書館中文名稱規(guī)范起源于20世紀(jì)80年代,在文化部的資助下,北京圖書館制定了規(guī)范數(shù)據(jù)款目著錄規(guī)則和中國(guó)機(jī)讀規(guī)范格式兩大草案。而真正進(jìn)入規(guī)范實(shí)踐層面是1995年北京圖書館中文圖書編目部名稱規(guī)范組的成立,從成立到現(xiàn)在,我國(guó)圖書館中文名稱規(guī)范經(jīng)歷了三個(gè)發(fā)展階段。
1.1?第一階段:維護(hù)與制作
從1995年到2000年,這五年時(shí)間是中文個(gè)人名稱規(guī)范數(shù)據(jù)維護(hù)與制作的階段。中文名稱來源于權(quán)威的工具書,所有信息經(jīng)考證處理,但本質(zhì)上卻脫離了中文書目數(shù)據(jù),與中文書目規(guī)范控制的初衷相悖,這一階段也被認(rèn)為是奠基發(fā)展階段。
1.2?第二階段:跨越發(fā)展
從2000年到2003年,這三年是我國(guó)圖書館中文個(gè)人名稱跨越式發(fā)展的階段。除了權(quán)威工具書的輔助,圖書館開始依據(jù)中文普通書目數(shù)據(jù)進(jìn)行中文名稱規(guī)范數(shù)據(jù)的統(tǒng)計(jì)。在這一階段,圖書館中文個(gè)人名稱規(guī)范取得實(shí)質(zhì)性的研究成果,但是受所編文獻(xiàn)限制較為明顯。
1.3?第三階段:積累提升
從2003年到現(xiàn)在,是圖書館中文個(gè)人名稱規(guī)范發(fā)展的第三階段。該階段總結(jié)前兩個(gè)階段規(guī)范工作開展的不足,更關(guān)注管理機(jī)制的優(yōu)化。中文名稱規(guī)范組被撤銷,并入書目數(shù)據(jù)組,中文個(gè)人名稱規(guī)范與圖書編目相融合。該階段更關(guān)注信息技術(shù)的創(chuàng)新引用,隨著ALEPH系統(tǒng)的應(yīng)用,一部分規(guī)范數(shù)據(jù)經(jīng)過系統(tǒng)匹配與書目數(shù)據(jù)進(jìn)行了掛接,編目員將另一部分規(guī)范數(shù)據(jù)與書目數(shù)據(jù)進(jìn)行比對(duì),并進(jìn)行了掛接,實(shí)現(xiàn)了中文個(gè)人名稱規(guī)范數(shù)據(jù)對(duì)中文書目數(shù)據(jù)的有效控制。前兩個(gè)階段為理論探討與嘗試階段,第三個(gè)階段則是實(shí)踐落地實(shí)施的階段。
2?中文個(gè)人名稱規(guī)范的模型建構(gòu)
2.1?本體選擇
本體定義了類及屬性,便于中文個(gè)人名稱的規(guī)范。本體詞匯與規(guī)范數(shù)據(jù)能準(zhǔn)確映射并帶動(dòng)不同資源數(shù)據(jù)的關(guān)聯(lián)與互動(dòng)操作。目前,很多本體中的類及屬性都能對(duì)中文個(gè)體名稱規(guī)范中的MARC字段進(jìn)行描述,便于后期數(shù)據(jù)的擴(kuò)展。本體選擇使關(guān)聯(lián)數(shù)據(jù)后的規(guī)范記錄與其他資源的兼容性更有保障。SKOS、FOAF等都被用來進(jìn)行規(guī)范數(shù)據(jù)的描述,基于虛擬規(guī)范文檔(VIAF)關(guān)聯(lián)數(shù)據(jù)模型的演進(jìn),語義描述的側(cè)重點(diǎn)從概念名稱開始轉(zhuǎn)向?qū)嶓w本身。近年來,一種新的中文名稱規(guī)范Schema.org是以微數(shù)據(jù)為基礎(chǔ)的通用標(biāo)記詞匯集,其除了對(duì)原始數(shù)據(jù)類型進(jìn)行規(guī)范,更包含了新的標(biāo)記類型。Schema.org對(duì)應(yīng)的事物類型以一定的層次結(jié)構(gòu)組合起來,每一類都有相應(yīng)屬性。該規(guī)范的優(yōu)勢(shì)體現(xiàn)在三個(gè)方面:一是數(shù)據(jù)類型更豐富,可以詳細(xì)精準(zhǔn)地描述名稱規(guī)范文檔中包含的個(gè)人、地點(diǎn)等實(shí)體。二是通用性高。一種屬性對(duì)應(yīng)多個(gè)類,單一的類也可以對(duì)應(yīng)多個(gè)子類,避免了重新定義時(shí)多個(gè)類在其他應(yīng)用范圍的充當(dāng),實(shí)現(xiàn)了外部擴(kuò)展關(guān)聯(lián)數(shù)據(jù)的更精準(zhǔn)關(guān)注。三是表達(dá)特點(diǎn)突出。微數(shù)據(jù)機(jī)制內(nèi)嵌于網(wǎng)頁之中,語義特性增加結(jié)構(gòu)性的描述,詞匯表和微數(shù)據(jù)結(jié)合生成豐富的文本信息,便于后期的表達(dá)。
2.2?關(guān)聯(lián)性描述建構(gòu)
對(duì)圖書館中文個(gè)人名稱進(jìn)行規(guī)范,關(guān)鍵點(diǎn)是數(shù)據(jù)的關(guān)聯(lián)性描述建構(gòu)。中文個(gè)人名稱規(guī)范中被結(jié)構(gòu)抽取的實(shí)體屬性及關(guān)聯(lián)較少,一些重要的信息被簡(jiǎn)單地定義為一般附注,僅僅是內(nèi)容層面的描述,信息的關(guān)聯(lián)性無法體現(xiàn)。而Schema.org中一些屬性的數(shù)據(jù)類型屬于文本范疇,一些屬性的數(shù)據(jù)類型屬于數(shù)據(jù)類范疇,實(shí)體與實(shí)體間的關(guān)聯(lián)有了現(xiàn)實(shí)可能。通過Schema.org,個(gè)人可以與其他個(gè)人建立關(guān)系,屬性可以與機(jī)構(gòu)、地點(diǎn)建立關(guān)系。因此,基于FRAD對(duì)個(gè)人的定義,個(gè)人可以是使用一個(gè)名稱的個(gè)體集合,無法準(zhǔn)確定義身份的個(gè)人也可以被劃入未區(qū)分的記錄中,在減少數(shù)據(jù)冗余的同時(shí)也避免不完整記錄,實(shí)現(xiàn)個(gè)人名稱規(guī)范與未區(qū)分記錄的關(guān)聯(lián),將本地的中文個(gè)人名稱與外部資源進(jìn)行關(guān)聯(lián),將定義的實(shí)體與其他實(shí)體進(jìn)行關(guān)聯(lián)。
2.3?圖書館中文名稱規(guī)范的VIAF數(shù)據(jù)處理
VIAF可以基于圖書館提供的數(shù)據(jù)為名稱數(shù)據(jù)創(chuàng)建增強(qiáng)型規(guī)范記錄,增強(qiáng)型的規(guī)范記錄是由初始名稱規(guī)范記錄和書目記錄轉(zhuǎn)換成的規(guī)范記錄,支持比規(guī)范記錄本身更為嚴(yán)格的數(shù)據(jù)匹配過程。其數(shù)據(jù)處理流程是根據(jù)成員機(jī)構(gòu)提供的書目記錄,為100—700字段中的每個(gè)責(zé)任者名稱進(jìn)行規(guī)范記錄的登記,這來源于書目記錄。規(guī)范記錄與相應(yīng)的名稱規(guī)范記錄合并形成增強(qiáng)型規(guī)范記錄,增強(qiáng)型規(guī)范文檔作為成員機(jī)構(gòu)貢獻(xiàn)的文檔與VIAF文檔進(jìn)行匹配,匹配成功的文檔會(huì)作為VIAF記錄的初版本,在數(shù)據(jù)匹配的過程中會(huì)有中間結(jié)果產(chǎn)生,這意味著一些信息可以作為規(guī)范文檔信息。匹配是不斷修正與規(guī)范的動(dòng)態(tài)過程。每一個(gè)進(jìn)行匹配的檢索點(diǎn)都是一個(gè)單獨(dú)的匹配點(diǎn),VIAF會(huì)將這些信息進(jìn)行強(qiáng)與弱的區(qū)分,其中強(qiáng)的匹配點(diǎn)有控制號(hào)、書的題目、人物的生卒日期、作為主題詞的人名及合著者等。如果一個(gè)強(qiáng)的匹配點(diǎn)匹配上去了,那么可以肯定這兩人是同一個(gè)人。而弱的匹配點(diǎn)主要是生卒日期、主題領(lǐng)域、出版形式、語種及出版社等,多個(gè)弱匹配點(diǎn)的匹配則可以判定是一個(gè)對(duì)象。
2.4?中文個(gè)人名稱規(guī)范數(shù)據(jù)庫的建立
為了更好地進(jìn)行中文個(gè)人名稱規(guī)范數(shù)據(jù)屬性的分析,做好關(guān)聯(lián)性研究,國(guó)家圖書館創(chuàng)建了中文名稱規(guī)范數(shù)據(jù)庫,截止到2017年12月,累計(jì)數(shù)據(jù)達(dá)到160余萬條,這些累計(jì)的數(shù)據(jù)類型中包括大量的個(gè)人名稱與團(tuán)體名稱。中文個(gè)人名稱規(guī)范數(shù)據(jù)庫的建立為圖書館個(gè)人名稱的規(guī)范提供了數(shù)據(jù)支持。例如,國(guó)家圖書館、臺(tái)灣圖書館及上海交通大學(xué)圖書館在OPAC中檢索著者字段,檢全率為60%以上;檢索讀者不太熟悉的責(zé)任者變異名稱,檢全率也在40%以上。而在中文個(gè)人名稱規(guī)范數(shù)據(jù)庫建立之前,著者字段檢索的檢全率為45%,讀者不太熟悉的責(zé)任者變異名稱檢索的檢全率僅為20%。以上數(shù)據(jù)再次說明,中文個(gè)人名稱規(guī)范數(shù)據(jù)庫的建立對(duì)文獻(xiàn)資源的檢索有顯著的促進(jìn)作用。
3?中文規(guī)范名稱工作的幾點(diǎn)建議
早在20世紀(jì)70年代,我國(guó)就開始著手圖書館書目名稱的規(guī)范,中文個(gè)人名稱的規(guī)范開始于20世紀(jì)80年代中后期,1995年我國(guó)圖書館中文個(gè)人名稱規(guī)范工作步入正軌,2003年之后書目數(shù)據(jù)制作的實(shí)時(shí)控制與規(guī)范進(jìn)入快速、穩(wěn)定發(fā)展的時(shí)期。針對(duì)中文個(gè)人名稱規(guī)范數(shù)據(jù)屬性分析及關(guān)聯(lián)研究,筆者認(rèn)為圖書館需要特別關(guān)注以下幾點(diǎn)。
3.1?個(gè)人名稱目標(biāo)的更新關(guān)注
信息的獲取不是一蹴而就的,而是一個(gè)相對(duì)漫長(zhǎng)的過程,變動(dòng)是名稱規(guī)范數(shù)據(jù)的顯著特征。在個(gè)人名稱規(guī)范的維護(hù)過程中,編目員經(jīng)常會(huì)遇到個(gè)人名稱目標(biāo)更改的情況,如果單純進(jìn)行手工修改,不僅工作量大,人工操作也很容易出錯(cuò),因此,通過手工修改的方式進(jìn)行書目數(shù)據(jù)的檢索是費(fèi)時(shí)費(fèi)力的事情。而計(jì)算機(jī)編目系統(tǒng)具有及時(shí)、快捷的自動(dòng)更新功能,但其也有一個(gè)客觀限制,即圖書館中文個(gè)人名稱規(guī)范數(shù)據(jù)庫對(duì)中文書目數(shù)據(jù)的控制是跨庫的,各種中文文獻(xiàn)包含其中,而不局限于普通的圖書。從本質(zhì)上說,中文書目數(shù)據(jù)檢索并沒有過多地考慮與中文個(gè)人名稱規(guī)范的關(guān)聯(lián),對(duì)書目數(shù)據(jù)檢索點(diǎn)的隨意更新都會(huì)導(dǎo)致檢索錯(cuò)誤,目標(biāo)的更新必須與計(jì)算機(jī)功能的發(fā)揮相結(jié)合,確保系統(tǒng)對(duì)關(guān)聯(lián)的書目數(shù)據(jù)進(jìn)行自動(dòng)更新。
3.2?關(guān)注個(gè)人名稱非完整形式記錄
當(dāng)前,國(guó)家圖書館信息匱乏的名稱規(guī)范都被劃入非完整形式記錄范疇中,之所以出現(xiàn)這種情況,多數(shù)是因?yàn)榫幠繂T根據(jù)圖書的學(xué)科屬性進(jìn)行學(xué)科附加成分的推測(cè)。其原因是多方面的:其一,跨學(xué)科著者無法科學(xué)推測(cè)學(xué)科附加成分。其二,翻譯者無法科學(xué)推測(cè)學(xué)科附加成分。其三,通俗性讀物的讀者無法科學(xué)推測(cè)學(xué)科附加成分。其四,主編、編者無法科學(xué)推測(cè)學(xué)科附加成分。因此,要想做好個(gè)人名稱的規(guī)范工作,圖書館必須從名稱規(guī)范著錄規(guī)則加以明確,是否所有的責(zé)任者都必須進(jìn)行規(guī)范,還是有所選擇地進(jìn)行規(guī)范,不解決這個(gè)問題,個(gè)人名稱數(shù)據(jù)會(huì)越來越難以控制。
3.3?虛擬團(tuán)體名稱的規(guī)范
中文個(gè)人名稱的規(guī)范研究也涉及虛擬團(tuán)體名稱。一般來說,虛擬團(tuán)體名稱是沒有任何隸屬及掛靠關(guān)系的團(tuán)體名稱,或者這些團(tuán)體名稱本身就是虛擬的、不存在的。如考研命題研究組或教育考試研究中心,從字面上看這些團(tuán)體貌似很權(quán)威的機(jī)構(gòu),是政府授權(quán)的機(jī)構(gòu),但編目員根本查詢不到,虛構(gòu)這些權(quán)威性的團(tuán)體名稱其實(shí)是為了提高書目的購(gòu)買價(jià)值,為了在市場(chǎng)上獲得穩(wěn)定的銷路,屬于一種商業(yè)營(yíng)銷手段。這些書目多為考試輔導(dǎo)、公務(wù)員考試輔導(dǎo)、選調(diào)生考試輔導(dǎo)、注冊(cè)會(huì)計(jì)師考試輔導(dǎo)書等。筆者認(rèn)為,虛擬團(tuán)體名稱不是唯一的,也不具有專屬性,在使用上限制少、范疇廣,必將成為圖書館中文個(gè)人名稱規(guī)范研究的重點(diǎn)內(nèi)容,需要圖書館在名稱規(guī)范數(shù)據(jù)研究中給予重視。
隨著社會(huì)文化建設(shè)的推進(jìn),我國(guó)圖書館在資源管理使用中也面臨更多的挑戰(zhàn),暴露出更多的問題。不同圖書館名稱規(guī)范文檔資源不同,資源描述方式也不同,管理系統(tǒng)和平臺(tái)就會(huì)存在一定的差異,資源間操作困難,資源共享程度較低,而中文個(gè)人名稱的規(guī)范是一大制約因素。因此,探討中文個(gè)人名稱規(guī)范問題具有現(xiàn)實(shí)必要性。中文個(gè)人名稱的規(guī)范是復(fù)雜與系統(tǒng)的,規(guī)范文檔的整合、虛擬國(guó)際規(guī)范文檔的共享實(shí)施、名稱規(guī)范關(guān)聯(lián)數(shù)據(jù)的發(fā)布是三大主導(dǎo)方向。只有加強(qiáng)圖書館中文個(gè)人名稱規(guī)范數(shù)據(jù)屬性的分析,做好關(guān)聯(lián)性研究,才能使圖書館真正回歸文化建設(shè)的核心地位。
參考文獻(xiàn):
[1] 王瑞云,賈君枝.中文個(gè)人名稱規(guī)范記錄的實(shí)體匹配與聚簇[J].國(guó)家圖書館學(xué)刊,2017(2):79-86.
[2] 賈君枝,石燕青.中文個(gè)人名稱規(guī)范文檔的關(guān)聯(lián)數(shù)據(jù)化研究[J].情報(bào)學(xué)報(bào),2016(7):696-703.
[3] 石燕青.中文個(gè)人名稱規(guī)范文檔共享研究及語義化探索[D].太原:山西大學(xué),2016.
[4] 郝嘉樹.Web2.0環(huán)境下的自規(guī)范及其對(duì)個(gè)人名稱規(guī)范維護(hù)工作的啟示[J].國(guó)家圖書館學(xué)刊,2016(2):16-21.
[5] 郝嘉樹.利用開放語義資源豐富個(gè)人名稱規(guī)范數(shù)據(jù):基于FOAF的方案設(shè)計(jì)[J].現(xiàn)代圖書情報(bào)技術(shù),2016(2):75-82.