施納
(長(zhǎng)沙師范學(xué)院圖書館 ,湖南 長(zhǎng)沙 4101001)
高校圖書館數(shù)字資源長(zhǎng)期保存的策略研究
施納
(長(zhǎng)沙師范學(xué)院圖書館 ,湖南 長(zhǎng)沙 4101001)
在我國數(shù)字資源保存起步較晚的情況下,高校圖書館進(jìn)行數(shù)字資源保存政策更加少。因此我國高校圖書館要結(jié)合當(dāng)前實(shí)際情況,應(yīng)制定一套合理、完善的長(zhǎng)期保存政策來引導(dǎo)數(shù)字資源保存的實(shí)踐。
數(shù)字資源;長(zhǎng)期保存;策略
隨著信息技術(shù)的發(fā)展,數(shù)字資源飛速增長(zhǎng),大多數(shù)的出版物都以數(shù)字形式出現(xiàn)。圖書館文獻(xiàn)資源體系中數(shù)字資源已經(jīng)成為的重要的一部分,特別是高校圖書館,對(duì)數(shù)字資源的利用更多,因此高校圖書館必須在數(shù)字資源保存方面發(fā)揮其主要作用,制定一整套的長(zhǎng)期保存政策來完成數(shù)字資源保存的實(shí)踐。
數(shù)字資源長(zhǎng)期保存是指為保證數(shù)字比特流可長(zhǎng)期維護(hù)和其內(nèi)容可長(zhǎng)期獲取的必要管理活動(dòng),有兩層含義,一是長(zhǎng)期存儲(chǔ)(storage),一是長(zhǎng)期可獲取(access)。其中,長(zhǎng)期存儲(chǔ)的目的是長(zhǎng)期可獲取,包括權(quán)利和技術(shù)層面的可獲取。長(zhǎng)期在這里的特殊含義是指這個(gè)資源被社會(huì)所需要的時(shí)間。數(shù)字資源很依賴于存儲(chǔ)設(shè)備和目標(biāo)管理,數(shù)字資源的長(zhǎng)期保存實(shí)際上是對(duì)數(shù)字資源本身和與之相關(guān)的技術(shù)、方法和工具的保存。因此,要想做到數(shù)字資源的長(zhǎng)期保存就必須達(dá)到以下幾個(gè)要求:①通過對(duì)數(shù)字存儲(chǔ)媒體的保護(hù)與轉(zhuǎn)移,保證存儲(chǔ)其中的物理數(shù)字?jǐn)?shù)據(jù)能準(zhǔn)確而完好地讀出;②通過對(duì)相關(guān)數(shù)字資源的格式、編碼、壓縮、加密、標(biāo)記、結(jié)構(gòu)等方面的信息,對(duì)數(shù)字資源內(nèi)容進(jìn)行識(shí)別和解析;③保存好相關(guān)的軟件和硬件的環(huán)境,通過相應(yīng)的技術(shù)工具來識(shí)別和利用數(shù)字資源;④利用數(shù)字資源的內(nèi)容驗(yàn)證、身份校驗(yàn)、版本變更知識(shí)產(chǎn)權(quán)管理機(jī)制、資源安全機(jī)制等一系列手段,可靠地、合法地來鑒別與使用被保護(hù)的數(shù)字資源;⑤對(duì)數(shù)字資源的知識(shí)組織體系和利用環(huán)境進(jìn)行保存。
(1)數(shù)字資源急劇增長(zhǎng)的需要。隨著信息技術(shù)的不斷發(fā)展與提高,人們對(duì)數(shù)字資源的依賴日益增強(qiáng),主要表現(xiàn)在網(wǎng)民數(shù)量的大幅增長(zhǎng)(如圖1所示)、IP地址數(shù)量的增長(zhǎng)(如圖2所示)、網(wǎng)站數(shù)量的增長(zhǎng)(如圖3所示)和網(wǎng)頁數(shù)量的增長(zhǎng)(如圖4所示)。
圖1 網(wǎng)民數(shù)量的大幅增長(zhǎng)
圖2 IP地址數(shù)量的增長(zhǎng)
圖3 網(wǎng)站數(shù)量的增長(zhǎng)
圖4 網(wǎng)頁數(shù)量的增長(zhǎng)
(2)保障數(shù)字資源來源的需要。政府部門、事業(yè)單位、教育機(jī)構(gòu)尤其是圖書館(幾乎所有)都在不懈的進(jìn)行著數(shù)據(jù)庫的建設(shè),根據(jù)需要或買、或建、或通過獲得贈(zèng)送等方式實(shí)現(xiàn)自己的數(shù)字資源??傮w來看,缺少統(tǒng)一規(guī)劃,呈現(xiàn)出凌亂的格局。如:①采購的期刊。國內(nèi)的如清華同方、國外的如WSN,NSTL購買的。圖書則是方正,超星或其它。②自建的。研究生論文庫、特色數(shù)據(jù)庫(如河北大學(xué)文庫)、機(jī)構(gòu)網(wǎng)站信息或其它等等。③免費(fèi)獲取的。
(3)保護(hù)脆弱的數(shù)字資源需要。數(shù)字資源一旦無法使用會(huì)帶來很多問題① 從物理存儲(chǔ)方面:數(shù)字資源及其所依賴的網(wǎng)絡(luò)、存儲(chǔ)媒體非常不穩(wěn)定;信息技術(shù)變化太快,硬件和軟件都在不可預(yù)測(cè)地老化。② 從使用方面:多數(shù)情況下信息機(jī)構(gòu)僅購買了數(shù)字資源的使用權(quán);由于多種原因,數(shù)據(jù)庫商或其委托的鏡像服務(wù)商有可能終止經(jīng)營(yíng)或者停止向用戶提供服務(wù)。
我國數(shù)字資源保存活動(dòng)雖然起步遲,通過吸收國外成功案例的經(jīng)驗(yàn)的基礎(chǔ)上也取得了一定的成績(jī)。目前中國國家圖書館WICP項(xiàng)目和中國Web信息博物館計(jì)劃是國內(nèi)比較有影響力的關(guān)于數(shù)字資源的保存活動(dòng)。
國內(nèi)圖書館的數(shù)字資源保存活動(dòng)剛剛開始,還只有極少數(shù)的文獻(xiàn)機(jī)構(gòu)對(duì)數(shù)字資源的保存地進(jìn)行研究和試驗(yàn)。高校圖書館的數(shù)字資源保存政策更是少有問津,據(jù)了解,目前僅有北京大學(xué)圖書館制定了比較正式的數(shù)字資源保存政策。清華大學(xué)圖書館通過對(duì)國外技術(shù)的借鑒并合作研發(fā)并制訂了保存元數(shù)據(jù)框架,得以實(shí)現(xiàn)數(shù)字資源的長(zhǎng)期保存。經(jīng)研究發(fā)現(xiàn),我國高校圖書館數(shù)字資源保存更適合參加第三方保存機(jī)構(gòu),通過機(jī)構(gòu)政策來約束并指導(dǎo)圖書館數(shù)字資源的保存,但加入了第三方保存機(jī)構(gòu)的圖書館不多。例如,中國科學(xué)院國家科學(xué)圖書館和清華大學(xué)圖書館參加了LOCKSS項(xiàng)目,香港浸會(huì)大學(xué)圖書館、香港教育學(xué)院圖書館、香港科技大學(xué)圖書館和北京大學(xué)圖書館參加了CLOCKSS項(xiàng)目,還有幾所高校圖書館參加了兩個(gè)及以上的第三方保存機(jī)構(gòu)。國內(nèi)其他高校圖書館基本上不僅沒有制定明確的數(shù)字資源長(zhǎng)期保存政策,也未參加任何有關(guān)的第三方保存機(jī)構(gòu)。
20世紀(jì)90年代初,歐美等發(fā)達(dá)國家的圖書館和相關(guān)聯(lián)盟為應(yīng)對(duì)數(shù)字資源長(zhǎng)期保存,對(duì)數(shù)字資源長(zhǎng)期保存方面開展了一系列的研究,如美國的OAIS參考模型和NDIIPP項(xiàng)目、澳大利亞的PANDORA項(xiàng)目、荷蘭的NEBLIB項(xiàng)目等,進(jìn)展迅速,也積累了豐富的經(jīng)驗(yàn)。
(1)美國的OAIS參考模型。OAIS即開放檔案信息系統(tǒng),1999年5月由美國空間數(shù)字系統(tǒng)咨詢委員會(huì)發(fā)布的來支持?jǐn)?shù)字資源的長(zhǎng)期保存和維護(hù)的參考模型。這一參考模型在2003年 3月通過評(píng)審,正式成為一項(xiàng)新的國際標(biāo)準(zhǔn)(ISO14721:2003)。此模型對(duì)數(shù)字信息的長(zhǎng)期保存和維護(hù)的檔案系統(tǒng)提供一個(gè)概念性的框架,描述了一個(gè)檔案系統(tǒng)存在的環(huán)境及功能組織和支持檔案處理的信息基礎(chǔ)結(jié)構(gòu)。在CCSDS和ISO的推動(dòng)下,OAIS參考模型成為了規(guī)范數(shù)字檔案系統(tǒng)普遍遵守的標(biāo)準(zhǔn),適用于范圍廣,因而被政府部門、圖書館、檔案館、文化傳承等領(lǐng)域很多組織所采用。
(2)澳大利亞的PANDORA項(xiàng)目。1996年澳大利亞國家圖書館創(chuàng)建的PANDORA是保護(hù)和存取澳大利亞網(wǎng)絡(luò)信息資源項(xiàng)目,主要是建立一個(gè)在選擇使用澳大利亞網(wǎng)絡(luò)信息資源歸檔系統(tǒng),同時(shí)也保護(hù)和存取澳大利亞電子資源制定政策和程序。該項(xiàng)目采取了選擇存取的方法主要用于收集和澳大利亞相關(guān)的有研究及保存價(jià)值的信息。它的特點(diǎn)是數(shù)據(jù)增長(zhǎng)快,數(shù)據(jù)規(guī)模大,各種類型的文件多,主要是文本文件和圖像文件。
(3)荷蘭的NEBLIB項(xiàng)目。網(wǎng)絡(luò)化歐洲存儲(chǔ)圖書館項(xiàng)目NEDLIB項(xiàng)目,是歐洲7個(gè)國家圖書館(荷蘭、法國、挪威、德國、葡萄牙、瑞士、意大利)以及3個(gè)主要出版社KLUWER、ELSEVIER、SPRINGER—VERLAG共同參與,以合作項(xiàng)目形式研究長(zhǎng)期保存基礎(chǔ)結(jié)構(gòu)。它起源于歐洲國家圖書館會(huì)議主持的書目記錄計(jì)算機(jī)化行動(dòng),1998年正式啟動(dòng),由荷蘭國家圖書館領(lǐng)導(dǎo),歐洲委員會(huì)的遠(yuǎn)程信息處理應(yīng)用計(jì)劃資助,合作開發(fā)一個(gè)通用的結(jié)構(gòu)框架和基本工具來建立電子出版物的存儲(chǔ)系統(tǒng)。
(1)建立健全法律保障體系。圖書館數(shù)字資源長(zhǎng)期保存必須要建立健全法律體系才能順利推進(jìn),完善的法制建設(shè)為圖書館數(shù)字信息資源長(zhǎng)期保存指明方向,數(shù)字資源長(zhǎng)期保存是一個(gè)多個(gè)行業(yè)、機(jī)構(gòu)和部門共同參與協(xié)作的系統(tǒng)工程,為了協(xié)調(diào)之間的利益和職責(zé)來制定相應(yīng)的政策法規(guī)。目前正在研究和即將推出的《圖書館法》是對(duì)數(shù)字資源長(zhǎng)期保存的權(quán)利和義務(wù)進(jìn)行規(guī)定,保證各個(gè)部門和機(jī)構(gòu)的利益不受侵犯,保證用戶充分利用可以承受的價(jià)格來使用這些資源。
(2)圖書館專業(yè)人才的培訓(xùn)。圖書館人員不但要具備圖書館專業(yè)知識(shí)還要有一定的外語知識(shí)和網(wǎng)絡(luò)信息知識(shí),才能勝任“信息導(dǎo)航員”、“ 網(wǎng)絡(luò)咨詢員”等工作。通過各種形式的培訓(xùn)對(duì)工作人員進(jìn)行繼續(xù)教育是圖書館開展數(shù)字資源長(zhǎng)期保存的一項(xiàng)重要措施,使工作人員成為高層次、全方位、復(fù)合型的圖書館管理人才。也是圖書館進(jìn)行數(shù)字資源長(zhǎng)期保存的有力保障。
(3)建設(shè)數(shù)字資源長(zhǎng)期保存的標(biāo)準(zhǔn)化。統(tǒng)一的技術(shù)和業(yè)務(wù)標(biāo)準(zhǔn)對(duì)圖書館數(shù)字資源長(zhǎng)期保存很重要。這些標(biāo)準(zhǔn)既有軟件的選擇還有數(shù)據(jù)的格式等。軟件是專門購買還是采用免費(fèi)的,數(shù)據(jù)格式是采用一種還是幾種等等,這些都必須落實(shí)到實(shí)處。這樣統(tǒng)一的標(biāo)準(zhǔn)才會(huì)在數(shù)據(jù)轉(zhuǎn)換和數(shù)據(jù)遷移更具有一致性和可操作性。
(4)利益平衡關(guān)系。在數(shù)字資源長(zhǎng)期保存中,主要是大型圖書館數(shù)字資源為主,中、小型圖書館資源大多是受益者角色。必須要有專門機(jī)構(gòu)和組織來制定相應(yīng)的補(bǔ)償機(jī)制。平衡好各個(gè)機(jī)構(gòu)的利益,實(shí)現(xiàn)參與方的多贏,數(shù)字資源長(zhǎng)期保存才能長(zhǎng)遠(yuǎn)的發(fā)展。
(5)采用適當(dāng)?shù)募夹g(shù)和措施。當(dāng)信息的營(yíng)建或軟件的規(guī)范或程式發(fā)生變化時(shí),營(yíng)建與軟件也會(huì)發(fā)生變化,信息將無法正常讀出,對(duì)于多媒體信息來說非常。對(duì)此情況常用的技術(shù)有:“仿真”、“更新”和“遷移”。“仿真”是用一個(gè)計(jì)算機(jī)系統(tǒng)去模擬另一個(gè)計(jì)算機(jī)系統(tǒng),使兩者的功能完全相同。“更新”就是通過復(fù)制,將數(shù)字信息從一個(gè)媒體拷貝到另一個(gè)媒體上?!斑w移”是數(shù)字信息從一個(gè)硬件、軟件配置向另一個(gè)硬件、軟件配置轉(zhuǎn)移,或是向新一代的計(jì)算機(jī)技術(shù)轉(zhuǎn)換。
數(shù)字資源的長(zhǎng)期保存對(duì)科學(xué)、教育、文化和社會(huì)的可持續(xù)發(fā)展至關(guān)重要,數(shù)字資源長(zhǎng)期保存是一項(xiàng)艱巨而復(fù)雜的任務(wù),面臨著經(jīng)濟(jì)、技術(shù)、法律、安全等多方面的問題,數(shù)字資源保存不僅僅是單個(gè)機(jī)構(gòu)和個(gè)人的責(zé)任,還關(guān)系到整個(gè)人類社會(huì)的生存和發(fā)展,需要政府的鼎力支持和社會(huì)各方面力量的共同努力。高校圖書館通過制定數(shù)字資源保存政策能夠保障并實(shí)現(xiàn)學(xué)術(shù)成果的有效存取,為人類文明的傳承貢獻(xiàn)一份力量。形成數(shù)字資源長(zhǎng)期保存的技術(shù)環(huán)境與社會(huì)氛圍,在瞬息萬變的信息時(shí)代做好數(shù)字資源的長(zhǎng)期保存工作。
A Research on Strategies for Long-term Storage of Digital Resources in Libraries of Universities and Colleges
SHI Na
(Libruary of Changsha Normal College,Changsha,Hunan 4101001,China)
AS it started relatively late in our country to save digital resources,there was less polices in libraries of universities and colleges in respect to save digital resources.As a result, the libraries of universities and colleges shall combine the actual situation in our country,develop a reasonable,perfected policy to guide the practice of the long-term storage of digital resources.
digital resources;Long-term preservation;strategy
G250.73
A
2095-980X(2015)02-0112-02
2015-01-15
本文系2013年湖南省情與決策咨詢研究課題(2013BZZ13 0),課題名稱:“湖南省數(shù)字資源長(zhǎng)期保存的策略研究”。
施納(1971-),女,湖南長(zhǎng)沙人,館員,碩士(本科),主要研究方向:數(shù)字資源。