林 強
(河北大學(xué) 河北 保定 071000)
由于計算機(jī)技術(shù)和互聯(lián)網(wǎng)技術(shù)的廣泛應(yīng)用,突破億萬的用戶通過各種渠道和手段獲得或創(chuàng)造了各種各樣的信息,加之電子出版物時代的到來,數(shù)字資源的長期保存成為這種環(huán)境下用戶對社會及其相關(guān)部門所提出的要求。數(shù)字資源長期保存項目的存在是對人類智力資源、文化資源等一切文明的保存與延續(xù)。美國、澳大利亞、荷蘭等是開展數(shù)字資源長期保存項目較早的國家[1]。我國的數(shù)字資源長期保存活動也在逐步進(jìn)行。此外,數(shù)字資源長期保存僅依靠圖書館是無法完成的,需要社會各界的通力合作。
開展數(shù)字資源長期保存工作,首先,需要建立有效的資源收集與處理機(jī)制;其次,針對數(shù)字資源存在與應(yīng)用的特點運用各種技術(shù)對其進(jìn)行處理和保存;再次,數(shù)字資源保存是長期項目,穩(wěn)定的資金與規(guī)范的組織是活動的前提與保障;最后,對項目的評估與完善是此項活動不可缺少的環(huán)節(jié),能夠為下一次數(shù)字資源保存提供理論與實踐依據(jù)。因此,建立良好的數(shù)字資源長期保存模式,井然有序地開展數(shù)字資源長期保存項目將使數(shù)字資源保存更加規(guī)范。從戰(zhàn)略角度出發(fā),應(yīng)將數(shù)字資源的長期保存看作是可持續(xù)任務(wù)。
對2009—2010年數(shù)字資源長期保存項目進(jìn)行收集與分析,從中選擇了若干項目探討如下。
AIMS (An Inter-Institutional Mode for Stewardship,機(jī)構(gòu)間數(shù)據(jù)管理模型)是一個為期兩年(2009年10月—2011年10月)的數(shù)字檔案保存計劃,是弗吉尼亞大學(xué)圖書館聯(lián)合斯坦福大學(xué)、赫爾大學(xué)、耶魯大學(xué)在Andrew W Mellon基金會的組織下成立的,旨在建立一個完善的國內(nèi)或者國際間的數(shù)字檔案框架,以保存?zhèn)€人或者組織的數(shù)字檔案信息。該計劃是合作式的團(tuán)隊運行項目,在該項目里,每個合作者(團(tuán)體)都有各自的領(lǐng)導(dǎo)與基礎(chǔ)設(shè)施,并且負(fù)責(zé)人之間可以相互聯(lián)系,對自己或者另一部門的工作進(jìn)行評價與指導(dǎo),從實際工作中吸取經(jīng)驗。
ArchivePress項目是由英國倫敦大學(xué)電腦中心與英國國家圖書館數(shù)字信息保存部門合作,由JISC (Joint Information Systems Committee,聯(lián)合信息系統(tǒng)委員會)出資于2009年3月成立的。該項目重在解決博客內(nèi)容(評論、嵌入式內(nèi)容和元數(shù)據(jù))歸檔的實際問題。ArchivePress是通過RSS和博客的API(Application Programming Interface,應(yīng)用程序編程接口)獲取博客內(nèi)容。歸檔后的內(nèi)容將被項目所擁有的數(shù)據(jù)庫存儲和管理,并保持博客原始的數(shù)據(jù)結(jié)構(gòu)和格式。該項目人員將這些信息匯集到Wordpress數(shù)據(jù)庫上,作為歸檔引擎進(jìn)行保護(hù)與利用。目前,該項目已在Google上進(jìn)行試用。
歐盟領(lǐng)導(dǎo)下的歐洲數(shù)字圖書館旨在為后代保存那些具有豐富歷史價值和文化價值的圖書、電影、雜志、地圖、照片、音樂等一系列的文化資源和科技資源。他們通過創(chuàng)建電子博物館、檔案館及與歐洲的各大成員國圖書館聯(lián)合,為用戶提供保存下來的各種信息,以滿足后代的生活、學(xué)習(xí)和娛樂的需求。該倡議看起來較為分散,但實際上是十分實用的項目,在由歐盟各個成員國組成的委員會的領(lǐng)導(dǎo)下開展各項工作。
2009年的歐洲數(shù)字圖書館倡議會議上,通過了針對孤兒和成員國文化遺產(chǎn)的數(shù)字化計劃;制定了關(guān)于運作歐洲數(shù)字圖書館與資源使用標(biāo)準(zhǔn)。這項倡議下的歐洲數(shù)字圖書館計劃可以帶動其他相關(guān)產(chǎn)業(yè)的發(fā)展,促進(jìn)社會與經(jīng)濟(jì)的進(jìn)步,通過對文化產(chǎn)業(yè)數(shù)字化的保存推動其他行業(yè)的發(fā)展,如政府信息公開、電子商務(wù)、教育培訓(xùn)、人們健康意識、通訊和廣播等都得到發(fā)展。
數(shù)字保護(hù)聯(lián)盟是為了保存英國的數(shù)字資源而建立的,并與其他國家聯(lián)合保護(hù)全球數(shù)字信息和知識。其保存數(shù)字資源的計劃為非營利會員組成的聯(lián)盟實現(xiàn)這一目標(biāo)提供了良好的經(jīng)營機(jī)制與先導(dǎo),該聯(lián)盟的最終目標(biāo)是推進(jìn)數(shù)字化的保存與管理。從2009 —2011年間的戰(zhàn)略構(gòu)想看,該聯(lián)盟是以中立、友好、協(xié)商的態(tài)度去達(dá)到滿足成員需求、維護(hù)良好數(shù)字資源、分享數(shù)字資源、發(fā)展數(shù)字保護(hù)標(biāo)準(zhǔn)的工作目標(biāo)。
音像內(nèi)容建檔項目從歐洲發(fā)起,是針對那些由于數(shù)字時代到來而在格式與形式上都面臨著改變的音像內(nèi)容所采取的保護(hù)措施。由于數(shù)字化媒體的廣泛應(yīng)用,原來的音像制品將會失去原有的存在環(huán)境,那么,就需要為這些音像制品建立檔案,并且為這些檔案提供良好的保存環(huán)境,提供必要的技術(shù)支持。用戶可以通過網(wǎng)上數(shù)字圖書館訪問歐洲范圍內(nèi)的所有音像資料。該項目所進(jìn)行的工作并不是把音像制品進(jìn)行簡單的復(fù)制與儲存,而是將原有格式進(jìn)行處理,使之變成當(dāng)前環(huán)境下能訪問與應(yīng)用的文件。在這個過程中要遵循與制訂相應(yīng)的標(biāo)準(zhǔn)來規(guī)范保存格式的選擇、處理保存內(nèi)容的技術(shù)及提供所保存信息檢索技術(shù)等過程,不管是對文件的描述還是儲存格式的要求,都要在一定范圍內(nèi)按照一致的標(biāo)準(zhǔn)進(jìn)行。
該項目聯(lián)合了歐洲一些大學(xué)的圖書館,在歐洲基金會、博物館、檔案館等一些重要合作伙伴的協(xié)助下,為工業(yè)(infustry)、企業(yè)(enterprise)市場需求提供服務(wù)。主要的組織者和項目經(jīng)理組成委員會對該項目負(fù)責(zé)。
PARSE. Insight(Permanent Access to the Records of Science in Europe, 歐盟科學(xué)數(shù)據(jù)長期保存計劃)歷時兩年,在歐盟第7框架項目下聯(lián)合了英國、荷蘭、德國、法國、瑞士等國家參加,主要是集中研究歐盟提供的數(shù)字資源(主要是科學(xué)信息),并延長其壽命,改善數(shù)字資源的存在環(huán)境與利用狀況。這需要項目組織者下屬的相關(guān)技術(shù)部門建立數(shù)據(jù)庫來收集這些資源并且為收集資源提供必要的渠道,鼓勵和支持社會各界分享他們的數(shù)據(jù),同時為這項研究提供技術(shù)、方針政策、基礎(chǔ)設(shè)施上的支持和引導(dǎo)。該項目中提到 “很多數(shù)字資源構(gòu)成了當(dāng)今歐洲眾多智力資源的基礎(chǔ),新一代研究人員需要站在巨人的肩上才能達(dá)到事業(yè)頂端”。在這里提到的“巨人的肩上”無非就是這些數(shù)字資源。保存這些數(shù)字資源并且使其能夠長時間為人類使用,就能創(chuàng)造出更多的利益。越來越多的數(shù)字資源和先進(jìn)的數(shù)字技術(shù)的應(yīng)用縮短了這些資源的生命周期,如何保護(hù)好這些智力資本是PARSE. Insight項目所要考慮的問題,正如OAIS(Open Archival Information System,開放檔案信息系統(tǒng))和ISO (International Organization for Standards,國際標(biāo)準(zhǔn)化組織)14721里提到的“要對在短短幾年時間里發(fā)生變化的媒體和數(shù)據(jù)資源進(jìn)行保護(hù),在技術(shù)上應(yīng)對這一不斷變化的現(xiàn)實?!?/p>
Inter PARES 3( The International Research on Permanent Authentic Records in Electronic Systems 3,文件真實永久保存電子系統(tǒng)國際合作研究第3階段)是一項大型的跨國合作研究項目,其目的是為制訂長期保管真實電子文件的國際、國家及機(jī)構(gòu)政策、戰(zhàn)略和標(biāo)準(zhǔn)提供原則和依據(jù),其項目資金由加拿大社會科學(xué)和人文研究理事會的社區(qū)大學(xué)研究聯(lián)盟贈款。目前已經(jīng)進(jìn)行到了第3階段,主要工作目標(biāo)是將前兩期的豐碩研究成果付諸實踐并進(jìn)一步檢驗與完善前期研究成果,幫助各級各類機(jī)構(gòu)建立基于電子文件真實性保障的電子文件管理系統(tǒng)和相關(guān)的制度、指南、人員培訓(xùn)模式。
項目的開展是在有資金投入的情況下進(jìn)行的,沒有穩(wěn)定的資金,數(shù)字資源長期保存工作就沒有得以運行的基礎(chǔ)。從所調(diào)查的國外項目開展情況上看,資金可以從所屬委員會和參與并享有使用權(quán)的會員中獲得,也可以由公益性質(zhì)的組織募得。以上只是該類項目在運行過程中獲得資金的部分方式,但是從這幾種形式中可以看出,資金的來源可以決定資源的使用和組織存在的性質(zhì)。資金往往是作為啟動和開展數(shù)字資源長期保存活動的物質(zhì)基礎(chǔ),有時它還可以決定技術(shù)與資料的獲得程度。
數(shù)字資源長期保存項目的規(guī)模與參與者的數(shù)量、部門等方面相關(guān)。項目的規(guī)模在一定程度上決定項目的影響力。如果數(shù)字資源保存項目有權(quán)威部門的領(lǐng)導(dǎo)、廣泛的合作領(lǐng)域、豐富的資源、強大的合作團(tuán)隊和知名企業(yè)或者大學(xué)的參與,那么便會吸引很多人去關(guān)注并加入到這項保存活動當(dāng)中。
數(shù)字資源長期保存對象是整個項目中最關(guān)鍵的部分,只有明確保存對象才能展開一系列相應(yīng)的工作。在明確保存對象的工作過程中,確定資源的呈現(xiàn)方式和獲取方式是進(jìn)行數(shù)字資源保存的初始工作。要對保存對象進(jìn)行徹底分析,弄清楚從什么地方、以什么方式獲得該資源,之后又以什么形式或者格式保護(hù)或保存經(jīng)過技術(shù)處理的數(shù)字資源,同時,需要對經(jīng)過技術(shù)處理前后的保存對象進(jìn)行校審與評估,這對數(shù)字資源長期保存工作起到了十分重要的作用。
從國外數(shù)字資源長期保存項目來看,絕大多數(shù)的組織者都屬于計算機(jī)、檔案、圖書館、數(shù)據(jù)庫商等掌握有大量數(shù)字資源和先進(jìn)技術(shù)的部門或某個行業(yè)及公益部門。由此可見,數(shù)字資源長期保存項目的開展是一項綜合且需求突出的活動。從組織者的角度去考慮,沒有需求就沒有開展這項活動的出發(fā)點,但從組織者的最終目的上看,對保存后的數(shù)字資源的使用可以分為商業(yè)性和非商業(yè)性,這與整個項目的構(gòu)建與所要達(dá)到的目的是分不開的,同樣也是組織者的期望。
總之,一項具有歷史意義的保存項目如果沒有良好的運行模式,很難達(dá)到長期保存數(shù)字資源的目的。良好的運營模式可以在一定程度上起到推波助瀾的作用。
隨著計算機(jī)網(wǎng)、有線電視網(wǎng)和電信網(wǎng)三者聯(lián)合即三網(wǎng)融合的發(fā)展,我國傳播、出版和IT產(chǎn)業(yè)的格局有所改變,在用戶對資源的使用和數(shù)字資源的保存上需要革命性的變革。但是,對數(shù)字資源保存項目的構(gòu)建不能脫離領(lǐng)導(dǎo)、組織、技術(shù)、評估與反饋的環(huán)節(jié)。
在一個完整的項目模式中,組織是整個項目模式的骨架。組織者是指揮和制訂計劃的“大腦”,其下面的每個部門各有分工、各盡所能,“組織”就是支撐起整個項目的基礎(chǔ)。
(1)主管機(jī)構(gòu) 是整個項目的發(fā)起者、組織者、領(lǐng)導(dǎo)者,可以是個體、團(tuán)體或組織,如項目委員會。委員會需要考慮整個項目的資金往來、資源獲取與呈現(xiàn),對項目進(jìn)行評估和工作安排。在整個項目的模式構(gòu)建中,組織者是這個項目的負(fù)責(zé)人,也是“大腦”,起到管理與協(xié)調(diào)的作用。
(2)合作者 即愿意與他人共同為這個項目出資或開展必要工作的個體或組織。部門間的合作、企業(yè)間的合作、大學(xué)間的合作等一切有利于開展工作的合作形式都是可以存在的。但是在合作過程中要協(xié)調(diào)合作者之間的任務(wù),分清合作的形式和性質(zhì)。在商業(yè)前提下的合作需要組織者和合作方共同承擔(dān)相應(yīng)的法律責(zé)任和義務(wù),在資源的利用與開發(fā)上做到“按章辦事”。
資金是開展數(shù)字資源保存工作的前提與物質(zhì)基礎(chǔ)。資金的獲取有兩方面考慮:第一,和資源的價值與保存工作的緊迫程度有關(guān)。有重要利用價值的資源需要采取積極的大量的人力、物力進(jìn)行保存以為用戶提供服務(wù);第二,和圖書館、檔案館、大學(xué)等機(jī)構(gòu)的重視程度有關(guān)。圖書館、檔案館和大學(xué)等機(jī)構(gòu)掌握著一些無法靠商業(yè)手段獲取的信息資源,他們的參與可以完善所要保存資源的內(nèi)容,從而讓更多的用戶使用到這部分資源。所以,不管是從商業(yè)的角度進(jìn)行考慮,還是源于對人類文明的繼承與分享的情懷,數(shù)字信息資源的長期保存都是不可避免的。
特別是在三網(wǎng)融合的環(huán)境下,數(shù)字資源的保存顯得尤為重要。三大部門的領(lǐng)導(dǎo)機(jī)構(gòu)需要在這個共同目標(biāo)下溝通和協(xié)調(diào)出現(xiàn)的問題,確保數(shù)字資源保存活動的正常開展。在三網(wǎng)融合后的一段時間里,應(yīng)該有一個共同的領(lǐng)導(dǎo)組織去負(fù)責(zé)三網(wǎng)的相關(guān)事宜,在其領(lǐng)導(dǎo)下將數(shù)字資源保存工作長效開展下去是大勢所趨。
在技術(shù)方面,需要考慮到當(dāng)前的技術(shù)是否適合原來的數(shù)字資源,應(yīng)如何進(jìn)行下一步的保存工作。在對保存對象的選擇環(huán)節(jié)上,應(yīng)該充分考慮保存對象的文件格式、狀態(tài)、內(nèi)容,并且要對保存項目進(jìn)行預(yù)案分析,應(yīng)該考慮保存該類數(shù)字資源的措施,即對處理過的數(shù)字資源再利用、再獲取的方式和設(shè)備等,也就是要充分考慮到原始數(shù)字資源的輸入與輸出格式與呈現(xiàn)方式。
在三網(wǎng)融合后的數(shù)字資源體現(xiàn)形式上,不僅僅是計算機(jī)網(wǎng)絡(luò)上的數(shù)字資源是需要保存的對象,那些存在于廣播、電視、電信等網(wǎng)絡(luò)上的數(shù)字資源也將會成為的保存對象。
維護(hù)與評估環(huán)節(jié)是必不可少的,因為在項目完成投入使用后的過程中所出現(xiàn)的問題應(yīng)得到及時更正,并且形成數(shù)據(jù)記載下來,以對下一個項目的開展提供必要的經(jīng)驗。對項目的評估可以使整個項目在宏觀與微觀兩個層面充分實現(xiàn)交合,確定在縝密的計劃下實施的各項工作是否取得了預(yù)期的效果,是否達(dá)成了一致的意見,但這都需要在另外一個平臺去對該項目實行客觀的評價。
總之,在三網(wǎng)融合的環(huán)境下,數(shù)字資源保存的力度和難度將會增加,但是這并不會使數(shù)字資源保存活動消失。數(shù)字資源保存將會依托先進(jìn)的科學(xué)技術(shù),實現(xiàn)三網(wǎng)資源的整合性保存,把同一類的不同體裁類型的數(shù)字資源進(jìn)行保存。以“三網(wǎng)領(lǐng)導(dǎo)委員會”作為數(shù)字資源保存項目的最高領(lǐng)導(dǎo)機(jī)構(gòu),在其領(lǐng)導(dǎo)下可實現(xiàn)多層次、多形式的資源融合與保存。
通過對國外數(shù)字資源長期保存項目的分析與研究,筆者提出了數(shù)字資源長期保存項目應(yīng)在可行的模式中進(jìn)行,即要有明確的領(lǐng)導(dǎo)者(個人或團(tuán)體),實行部門負(fù)責(zé)制,在每個部門都有負(fù)責(zé)人對本部門工作進(jìn)行評價和指導(dǎo),并且對其他部門的工作進(jìn)行評估;另外要建立健全的資金運作保障機(jī)制,為長期保存工作提供堅實的物質(zhì)基礎(chǔ);與此同時,技術(shù)方面要充分考慮本項目對所用技術(shù)駕馭能力與用戶所處技術(shù)環(huán)境的匹配問題;最后,為了實現(xiàn)對信息資源長期保存工作的可持續(xù)發(fā)展,要對所有保存工作和結(jié)果進(jìn)行評估,以為數(shù)字資源保存工作提供動力與支持。數(shù)字資源長期保存項目在健全的模式下進(jìn)行,會處于一個長期而持久發(fā)展的狀態(tài)。作為組織者,建立健全一套行之有效的方針政策與作出正確的決策是其首當(dāng)其沖的任務(wù);實現(xiàn)與合作者之間的良好溝通與合作是開展保存項目的基礎(chǔ);獲得或者募集資金是開展工作的物質(zhì)基礎(chǔ)。在技術(shù)環(huán)節(jié)上,要充分考慮被保存資源的客觀狀態(tài),利用現(xiàn)有技術(shù)進(jìn)行保存,并且要充分考慮到前后格式上的變化。在維護(hù)與評估上,積累經(jīng)驗正確評估也是十分必要的。
以上3個方面是整個項目模式的基本要點,從組織者到技術(shù)與服務(wù),再到后期維護(hù)與評估,這3個方面是不可分割的。在一個項目中這三者也不是獨立存在的,他們分別扮演著“領(lǐng)導(dǎo)者”、“執(zhí)行者”、“用戶”的角色。由于社會的發(fā)展速度不斷加快,對數(shù)字資源的長期保存會受到來自技術(shù)和資金上的阻礙:技術(shù)上的阻礙體現(xiàn)在現(xiàn)有技術(shù)與被保存信息是否能充分結(jié)合,并能夠在未來技術(shù)環(huán)境下為用戶提供穩(wěn)定而準(zhǔn)確的服務(wù);資金上的阻礙是針對投資和利益分配上的協(xié)調(diào)機(jī)制能否促進(jìn)并長時間的投入到對信息資源的長期保存上來。所以對保存技術(shù)的選擇和解決資金運作問題顯得尤為重要。同時,對保存后的數(shù)字資源的使用需要限定在法律條例的范圍內(nèi),這樣才能保證人類的文明更持久地被保存。建立良好的內(nèi)部協(xié)調(diào)機(jī)制和適當(dāng)?shù)募夹g(shù)支持是這個模式框架下的實質(zhì)內(nèi)容,而這樣的模式為數(shù)字資源保存工作的開展提供了空間與時間,并朝著簡單、多樣與實用的方向發(fā)展,實現(xiàn)社會效益與經(jīng)濟(jì)效益的雙豐收。三網(wǎng)融合環(huán)境下,資源的多樣化和數(shù)量的激增將給數(shù)字資源保存帶來挑戰(zhàn)。新的環(huán)境對技術(shù)、人員、組織和管理的要求更高,各部門需要有機(jī)聯(lián)合,構(gòu)建合理的法律、技術(shù)、人員與資金運營框架,秉持可持續(xù)發(fā)展的態(tài)度去實現(xiàn)我國數(shù)字資源的長期保存。
[1]張士男, 閆 昱. 國內(nèi)外數(shù)字資源長期保存現(xiàn)狀研究及分析[J].圖書情報工作網(wǎng)刊, 2009(1):1-6.
[2]AIMS - Born Digital Collections: An Inter-Institutional Model for Stewardship [EB/OL]. [2010-08-05]. http://www2.lib.virginia.edu/aims/.
[3]Welcome to the Archive Press Website [EB/OL]. [2010-07-28]. http://archivepress.ulcc.ac.uk/.
[4]i2010: Digital Libraries Initiative [EB/O L].[2010-07-21].http://ec.europa.eu/information_society/activities/digital_libraries/index_en.htm.
[5]Digital Preservation Coalition [EB/OL].[2010-07-25] .http://www.dpconline.org/advice/dpc-reports.
[6]Presto PRIME [EB/OL].[2010-08-02]. http://www.prestoprime.eu/project/index.en.html.
[7]About PARSE Insight: Permanent Access to the Records of Science in Europe [EB/OL].[2010-08-01] .http://www.parse-insight.eu/.
[8]InterPARES Project [EB/OL].[2010-08-02]. http://www.interpares.org/.