董永梅 (天津工業(yè)大學(xué)圖書館 天津 300387)
分類是指以事物的本質(zhì)屬性或其他顯著特征為依據(jù),把各種事物集合成類的過程,是人們認(rèn)識事物、區(qū)分事物、組織事物的一種邏輯方法[1]。在實(shí)踐應(yīng)用中,傳統(tǒng)文獻(xiàn)分類法、網(wǎng)絡(luò)自編分類法和大眾分類法中的每種分類法都有其他兩種分類法所不能替代的優(yōu)勢,也都存在不足。本文從非物質(zhì)文化遺產(chǎn)(以下簡稱非遺)資源分類角度,研究如何將3種分類法整合,構(gòu)建科學(xué)、符合用戶需求的分類體系,這是非遺資源數(shù)據(jù)庫建設(shè)的組成部分,也是非遺信息化建設(shè)的基礎(chǔ)。
自2006年以來,在文化部的監(jiān)督和直接推動下,各省、市、縣的文化局及圖書館、文化館、博物館、藝術(shù)研究所等機(jī)構(gòu)積極參與非遺網(wǎng)站和專題數(shù)據(jù)庫的建設(shè)。目前,已完成的非遺網(wǎng)站和專題數(shù)據(jù)庫在資源分類上存在一些問題。
(1)分類結(jié)構(gòu)簡單 已構(gòu)建的非遺網(wǎng)站和專題數(shù)據(jù)庫對非遺資源的分類基本采用的是《國家級非物質(zhì)文化遺產(chǎn)名錄》(以下簡稱《名錄》)中的分類法,即將非遺資源分為民間文學(xué)、民間音樂、民間舞蹈、傳統(tǒng)戲劇、曲藝、雜技與競技、民間美術(shù)、傳統(tǒng)手工技藝、傳統(tǒng)醫(yī)藥、民俗等十大類,沒有設(shè)二級類目,也沒有采用分類相對較全的《中國民族民間文化保護(hù)工程普查工作手冊》(以下簡稱《手冊》)中的分類法。
(2) 立類面不全 已構(gòu)建的非遺網(wǎng)站和專題數(shù)據(jù)庫基本都從學(xué)科分類、傳承人、地域和級別4個(gè)角度立類,而沒有考慮時(shí)間、民族、載體類型、學(xué)術(shù)資源、相關(guān)機(jī)構(gòu)等其他分類面。
(3)已構(gòu)建的非遺網(wǎng)站和專題數(shù)據(jù)庫未考慮類面之間的橫向組配關(guān)系,不能從多種途徑提供瀏覽和檢索。
對于網(wǎng)絡(luò)和數(shù)據(jù)庫技術(shù)支撐下的非遺資源分類,既要按照非遺資源本身的事物屬性進(jìn)行研究,也要考慮網(wǎng)絡(luò)和數(shù)據(jù)庫技術(shù)對非遺資源分類的影響。非遺資源分類處于目前狀態(tài)的原因主要有以下幾點(diǎn):
(1)關(guān)于非遺資源分類的理論和應(yīng)用研究還很少,因此,缺乏對于現(xiàn)有網(wǎng)站和專題數(shù)據(jù)庫中非遺資源分類的理論和實(shí)踐指導(dǎo)。
(2)已構(gòu)建的非遺網(wǎng)站和專題數(shù)據(jù)庫正處于非遺資源數(shù)字化存儲實(shí)踐的探索階段,沒有提供簡單或復(fù)雜檢索的、成熟的數(shù)據(jù)庫結(jié)構(gòu)和數(shù)據(jù)庫技術(shù)可供借鑒和應(yīng)用。
(3)非遺資源建設(shè)是一項(xiàng)復(fù)雜的系統(tǒng)工程,資料范圍廣、內(nèi)容多,涉及表格、文檔、圖片、視頻、音頻等各種形式,目前還沒有全部整理完成,也影響分類體系的構(gòu)建。
隨著互聯(lián)網(wǎng)的迅速發(fā)展,網(wǎng)絡(luò)資源用戶激增,其認(rèn)知能力和知識結(jié)構(gòu)有很大差異,從用戶角度構(gòu)建非遺資源分類體系對于非遺數(shù)字資源的存儲和傳播有重要的意義。
在Web1.0時(shí)代,網(wǎng)站與用戶之間是“人—機(jī)”單向信息傳遞模式,用戶只能被動地接收信息。當(dāng)時(shí),圖書情報(bào)學(xué)和各相關(guān)學(xué)科領(lǐng)域的專家構(gòu)建了“知識樹”分類結(jié)構(gòu),盡管專業(yè)性強(qiáng)、層次嚴(yán)謹(jǐn),但復(fù)雜繁瑣,用戶只能按照“知識樹”的層層節(jié)點(diǎn)向下進(jìn)行單一檢索,這種分類結(jié)構(gòu)僅適合Web1.0的技術(shù)模式——用戶只能被動地接收信息。而Web2.0以應(yīng)用的開放性、技術(shù)的滲透性、信息傳播的交互性、讀寫并存的表達(dá)方式、社會化的聯(lián)合方式和便捷化的體驗(yàn)方式,改變了用戶獲取信息的方式:用戶具有網(wǎng)絡(luò)信息的瀏覽者和提供者的雙重身份,屬于“人—人”模式[2]。在該模式下,非遺資源分類應(yīng)匯聚廣大非遺愛好者、研究學(xué)者的集體智慧,由分類專家在后臺加強(qiáng)分類語義控制和關(guān)聯(lián)。
用戶能否方便、快捷地在網(wǎng)站或數(shù)據(jù)庫中檢索到所需資源,是衡量該網(wǎng)站或數(shù)據(jù)庫分類體系是否成功的一個(gè)重要標(biāo)準(zhǔn)。在構(gòu)建非遺網(wǎng)絡(luò)分類法時(shí),一方面,要以事物為中心設(shè)置類目,直接以表達(dá)事物概念的主題詞作為類目名稱,并且要盡量選擇符合大眾認(rèn)知水平的自然語言詞匯;另一方面,采用以多重列類、多元劃分和多角度展開為主的類目劃分方式,以方便用戶從不同角度檢索、瀏覽。
從信息組織的角度看,分類體系需要考慮類目之間的邏輯性、橫向關(guān)系和縱向關(guān)系等。非遺資源分類主要考慮以下幾種關(guān)系。
非遺資源分面組配包含分面和組配兩層含義:①分面是將所有非遺相關(guān)資源按其不同屬性特征劃分為若干組類目。首先將非遺資源按學(xué)科類別、地域、級別等分為不同的范疇方面,然后將每個(gè)分面分解為若干個(gè)亞面(如學(xué)科類別分面可分為民族語言、民間文學(xué)、民間美術(shù)等亞面),將每個(gè)亞面再分解為更小的子面,如民間美術(shù)亞面可分為繪畫、雕塑、工藝等子面;②組配是將不同的分面、亞面和子面進(jìn)行組配,如將民族語言和地域進(jìn)行組配。一方面,分面組配可以使用戶通過不同途徑瀏覽,解決同一問題,如楊柳青年畫可以從民間美術(shù)和地域兩個(gè)途徑檢索;另一方面,可以解決跨類別的類目歸屬問題,如云南白族的“霸王鞭”舞,既可劃歸為民族舞蹈中的生活習(xí)俗舞,也可劃歸為歲時(shí)節(jié)令習(xí)俗舞蹈。
同義或近義關(guān)系是指正式敘詞與非正式敘詞之間的關(guān)系。對同義或近義關(guān)系進(jìn)行控制,是對涵義相同或相近而詞形不同的詞進(jìn)行處理的一種手段,一般是從敘詞表中優(yōu)選一個(gè)詞作為正式敘詞,落選的其他非正式敘詞保留在敘詞表中,提供檢索入口,指向正式敘詞[3]。通過該處理,可將非遺資源中同一主題內(nèi)容的資源集中在同一語詞之下,從而增加用戶的查全率,降低漏檢率,如海南省黎族的“打柴舞”,也稱“跳竹竿”,這兩詞即屬于同義關(guān)系。
類目之間的層級關(guān)系,也稱為主從關(guān)系或上下位關(guān)系,體現(xiàn)知識的邏輯性和系統(tǒng)性。非遺資源是從屬于文化藝術(shù)資源中的一個(gè)分支體系,其內(nèi)容特征具有層級性。目前,考慮到用戶的興趣、時(shí)間和精力等因素,不論是綜合性商業(yè)網(wǎng),還是政務(wù)網(wǎng)、高校信息網(wǎng),其信息資源組織層次數(shù)目一般控制在3或4層,因此非遺資源分類層次也應(yīng)控制在3或4層。
相關(guān)關(guān)系又稱聯(lián)想關(guān)系、類緣關(guān)系、非等級關(guān)系,指類目之間或檢索詞之間除同近義關(guān)系和層級關(guān)系以外的其他各種關(guān)系。發(fā)掘相關(guān)關(guān)系可以擴(kuò)大檢索范圍,如宗教信仰舞蹈和舞蹈音樂分別從屬于民間舞蹈和民間音樂兩個(gè)不同的類目,但是舞蹈和音樂是互為一體的藝術(shù)形式,用戶在瀏覽了舞蹈資源后,如果有興趣則可以通過相關(guān)類目瀏覽相應(yīng)的音樂資源。
傳統(tǒng)文獻(xiàn)分類體系一般適用于學(xué)術(shù)性網(wǎng)站(如中國知網(wǎng)、維普數(shù)據(jù)庫等),能較為全面和客觀地反映知識全貌及其內(nèi)在的邏輯聯(lián)系,符合人類認(rèn)識事物的邏輯思維方式,在揭示信息內(nèi)容、歸并相同信息、區(qū)分不同信息方面有著廣泛的應(yīng)用基礎(chǔ)[4]。傳統(tǒng)文獻(xiàn)分類法有經(jīng)過權(quán)威認(rèn)定、成熟、完整的受控詞表,但它不能直接用于非遺資源分類,因?yàn)閭鹘y(tǒng)的文獻(xiàn)分類體系是所有知識領(lǐng)域的學(xué)科劃分,非遺資源只是其中的一小部分,相比較而言,劃分不夠細(xì)、深,也不適合網(wǎng)絡(luò)環(huán)境下非遺資源的分面設(shè)類、多重列類等。
自編分類體系和結(jié)構(gòu)適用于綜合性網(wǎng)站(如搜狐、新浪、淘寶等),其分類機(jī)理具有以下共性:①重視以事物和主題為中心設(shè)置類目;②直接用語詞組織信息;③具有等級知識樹結(jié)構(gòu);④橫向關(guān)系重復(fù)揭示;⑤采用分面組配方式增加檢索途徑;⑥類目設(shè)置具有動態(tài)性,更新方便;⑦采用人工分檢和歸類。這些綜合性網(wǎng)站采用商業(yè)運(yùn)行機(jī)制,更多地從大眾關(guān)注的熱點(diǎn)、新聞、生活等方面設(shè)置主題,其架構(gòu)思路值得網(wǎng)絡(luò)環(huán)境下非遺資源分類借鑒和參考。
大眾分類法適用于以“用戶為中心”的社會服務(wù)網(wǎng)絡(luò)(如Flickr、Furl、Del.icio.us等),通過用戶標(biāo)注描述性標(biāo)簽,由分類系統(tǒng)自動聚合及標(biāo)簽頻率使用統(tǒng)計(jì)實(shí)現(xiàn)協(xié)作分類。其具有以下特性:①界面簡潔,類目結(jié)構(gòu)是平面、非等級的,通常以標(biāo)簽云或知識地圖的形式出現(xiàn);②匯集了大眾的發(fā)散性和開放性思維,是由下而上的分類過程;③標(biāo)簽分類是共享和公開的,但是,由于信息的分類在網(wǎng)絡(luò)系統(tǒng)中是一個(gè)用詞構(gòu)成的平面結(jié)構(gòu),不存在根節(jié)點(diǎn),不利于用戶從宏觀上把握知識的體系結(jié)構(gòu),也無法使用戶從一個(gè)相對確定的路徑查找所需資源,也就是說,用戶檢索到的往往是具有廣度的信息,很難檢索到深度信息。
圖1 3種分類法優(yōu)勢分析
圖2 非遺資源分類體系
上述3種分類方法具有各自的優(yōu)勢和劣勢,將3種分類法結(jié)合(見圖1),能夠克服各自的不足,構(gòu)建符合用戶需求的非遺資源分類體系:①基于傳統(tǒng)文獻(xiàn)分類法和網(wǎng)絡(luò)自編分類法,構(gòu)建非遺資源基于不同事物屬性的分類基本框架;②借鑒傳統(tǒng)文獻(xiàn)分類法的受控詞表構(gòu)建非遺資源基本受控詞庫(或基本標(biāo)簽庫);③采用大眾分類法中的標(biāo)簽功能對非遺資源基本標(biāo)簽庫進(jìn)行修正和完善;④將大眾分類法與傳統(tǒng)文獻(xiàn)分類法和網(wǎng)絡(luò)自編分類法中的等級列舉法整合,構(gòu)建標(biāo)簽間的層次,以加強(qiáng)標(biāo)簽間的縱向關(guān)系的表達(dá);注重大眾對非遺資源分類的理解和認(rèn)知反饋,及時(shí)更新和維護(hù)基本標(biāo)簽庫和層級結(jié)構(gòu),形成非遺資源分類體系(見圖2)。
由圖2可知,非遺資源分類體系構(gòu)建的核心是基于大眾分類法的“前控制”和“后控制”?!扒翱刂啤敝冈诖蟊娺M(jìn)行資源描述之前,構(gòu)建分類基礎(chǔ)框架、基本標(biāo)簽庫和初始等級層次,實(shí)現(xiàn)對用戶標(biāo)注的適當(dāng)控制和引導(dǎo),克服大眾分類法的不足;“后控制”指在大眾標(biāo)注后對標(biāo)簽集和分類層次在系統(tǒng)自動分析基礎(chǔ)上的人工干預(yù),從而修正和完善非遺資源分類體系。
不同用戶的非遺信息需求不同、認(rèn)知觀不同、瀏覽角度也不同。因此,首先要根據(jù)非遺資源的內(nèi)容屬性和外在屬性確定非遺資源分面,可將其劃分為學(xué)科類別、地域、級別、傳承人、時(shí)間、民族、載體類型、學(xué)術(shù)資源、相關(guān)機(jī)構(gòu)9個(gè)分面;再根據(jù)每個(gè)分面的特征值設(shè)計(jì)該分面的“知識樹”結(jié)構(gòu),即確定每一級的類目。由于每個(gè)分面集中于信息空間的一個(gè)特定角度,是由多個(gè)“純色”的分類組成[5],因此每個(gè)分類的類目可與其他分面的類目組配,形成許多組配類目,實(shí)現(xiàn)同一內(nèi)容的多種途徑檢索。例如,對于昆曲,可以從學(xué)科類別、地區(qū)、級別、傳承人等多種角度檢索。
由于學(xué)科類別還沒有系統(tǒng)、成熟的劃分體系,在本研究中,筆者建議采用《手冊》中的分類法構(gòu)建2層或3層基本結(jié)構(gòu),然后采用大眾分類的標(biāo)簽法不斷完善和修正這一基本框架結(jié)構(gòu)。
大眾分類法與傳統(tǒng)受控語言相比,其機(jī)制是基于“開放性元數(shù)據(jù)標(biāo)準(zhǔn)”和“自然語言社群積聚”的[6],因?yàn)槿狈σ?guī)范化控制,大眾分類法中的標(biāo)簽具有一定的缺陷:歧義缺陷、同義缺陷、同現(xiàn)缺陷、語法缺陷等[7],從而影響了信息的查全率和查準(zhǔn)率。因此,在非遺資源分類體系構(gòu)建中,不能完全采用大眾分類法的自然語言構(gòu)建分類體系,需要參考受控詞表或語義詞典對標(biāo)簽進(jìn)行規(guī)范和控制。
傳統(tǒng)的受控語言是經(jīng)過實(shí)踐檢驗(yàn)、科學(xué)的規(guī)范體系,將其與大眾分類法結(jié)合構(gòu)建層次合理、用詞規(guī)范的標(biāo)簽庫,不僅在一定程度上規(guī)范了大眾的標(biāo)注行為,也為標(biāo)簽分類提供了科學(xué)的資源環(huán)境??捎煞诸悓<液头沁z研究人員共同就每個(gè)分面設(shè)計(jì)合理的類名庫,即基本標(biāo)簽庫,如學(xué)科類別分面可參考《中國分類主題詞表》。
(1)非遺資源“缺乏類名”的補(bǔ)充 一些非遺資源的類名在《中國分類主題詞表》中是沒有的,這部分的“缺乏類名”需要依靠大眾標(biāo)注來完善。如果用戶標(biāo)注的某一詞匯的使用頻率高,則需要專家判斷其是否有價(jià)值,若有價(jià)值,可以將其補(bǔ)充到標(biāo)簽庫中。
(2)不符合大眾認(rèn)知理解的類名修正 用戶標(biāo)注標(biāo)簽時(shí),幾乎都不采用基本標(biāo)簽庫中推薦的詞匯,而是自定義標(biāo)注,當(dāng)其他用戶對同一事物進(jìn)行標(biāo)注時(shí),主要參考系統(tǒng)中已經(jīng)存在的自定義標(biāo)注,如果某一自定義標(biāo)注的詞匯比基本標(biāo)簽庫中的受控詞使用頻率高,說明基本庫中的詞匯不符合大眾的認(rèn)知理解,需要專家干預(yù),決定是否將用戶使用頻率高的自定義標(biāo)注詞補(bǔ)充到基本標(biāo)簽庫中。
大眾分類標(biāo)注的標(biāo)簽在系統(tǒng)中的排列是一個(gè)用詞構(gòu)成的平面類目結(jié)構(gòu),不能揭示標(biāo)簽之間的層次關(guān)系,因而不能揭示信息之間的復(fù)雜關(guān)系。但是,人的思維模式和知識結(jié)構(gòu)具有分類和認(rèn)知層次,因此需要將大眾分類法與傳統(tǒng)文獻(xiàn)分類法和網(wǎng)絡(luò)自編分類法中的等級列舉法整合,構(gòu)建等級層次。
大眾用戶在非遺資源分類系統(tǒng)中標(biāo)注資源類別時(shí),系統(tǒng)首先會根據(jù)標(biāo)簽庫中設(shè)定的等級體系向用戶推薦相關(guān)類目,讓用戶選擇資源的類別,如果用戶無法判定其類別,系統(tǒng)會根據(jù)標(biāo)簽自動將相應(yīng)資源歸入相關(guān)類別;如果用戶不認(rèn)可系統(tǒng)推薦的類別,可以將資源歸入自身認(rèn)知的類別。當(dāng)然,如果大眾歸入的某個(gè)標(biāo)簽類別的頻率高,而系統(tǒng)自動歸入的類別的頻率低,說明該系統(tǒng)推薦的類別不符合大眾的認(rèn)知,需要通過專家干預(yù)決定是否修改。
隨著大眾對非遺資源標(biāo)注意識和標(biāo)注能力的提高,其對非遺資源的標(biāo)注行為,一方面,揭示出大眾對于非遺資源的主題和內(nèi)容表達(dá)有著深刻而獨(dú)特的認(rèn)知和理解;另一方面,不斷地補(bǔ)充和修正了非遺資源基本標(biāo)簽庫和層級結(jié)構(gòu),促進(jìn)了非遺資源分類體系的形成和完善。
現(xiàn)代主流文化通過網(wǎng)絡(luò)媒介的傳播,對非遺文化的發(fā)展和傳承產(chǎn)生了巨大的沖擊。構(gòu)建基于網(wǎng)絡(luò)的非遺網(wǎng)站和數(shù)據(jù)庫是保護(hù)和繼承非遺文化的重要途徑和手段,而可行的非遺資源分類體系構(gòu)建是非遺網(wǎng)站和數(shù)據(jù)庫建設(shè)過程中的重要環(huán)節(jié),希望本研究能夠?yàn)榉沁z分類體系構(gòu)建提供有價(jià)值的參考。
[1]俞君立,陳樹年.文獻(xiàn)分類學(xué)[M].武漢:武漢大學(xué)出版社,2001:2.
[2]熊回香. 面向Web3.0的大眾分類研究[D].武漢:華中師范大學(xué)信息管理系,2011:1.
[3]司 莉. 信息組織原理與方法[M]. 武漢:武漢大學(xué)出版社, 2011:106.
[4]施國良.網(wǎng)絡(luò)信息分類:原理與應(yīng)用[M].北京:科學(xué)出版社,2008:41-42.
[5]張振森,程 灝.網(wǎng)絡(luò)信息分面分類體系的理論與應(yīng)用研究[J].情報(bào)雜志,2009 (8):62-66.
[6]周榮庭,鄭 彬.分眾分類:網(wǎng)絡(luò)時(shí)代的新型信息分類法[J].現(xiàn)代圖書情報(bào)技術(shù),2006(3): 72-75.
[7]靳延安,李瑞軒,文坤梅,等.社會標(biāo)注及其在信息檢索中的應(yīng)用研究綜述[J].中文信息學(xué)報(bào),2010(7):52-62.