王學(xué)琴 何菊香 羅濤
(東南大學(xué)圖書館,南京 210096)
美國國會圖書館認(rèn)為數(shù)字保存是對數(shù)字內(nèi)容進行長時間的積極管理,以確保持續(xù)訪問[1]。美國伊利諾伊州學(xué)術(shù)與研究圖書館聯(lián)盟認(rèn)為數(shù)字保存是為了確保需要的文件可以訪問和使用[2]。國家科技圖書文獻中心(National Science and Technology Library,NSTL)發(fā)布的《數(shù)字文獻資源長期保存共同聲明》指出,為切實保障圖書館對所采購知識內(nèi)容的長期保存,圖書館擁有對所采購數(shù)字文獻資源的合理的存檔權(quán)、處理權(quán)和服務(wù)權(quán)[3]。芝加哥大學(xué)圖書館的Lindsey[4]提出基于獲取、管理、保存、提供數(shù)字內(nèi)容等維度的數(shù)字保存方案。筆者認(rèn)為,數(shù)字資源長期保存可以理解為以數(shù)字資源為保存對象,通過長期保存確保存檔數(shù)據(jù)能隨時被發(fā)現(xiàn)、獲取和利用。
國外基于區(qū)域性圖書館聯(lián)盟的數(shù)字資源長期保存發(fā)展較好,而國內(nèi)的數(shù)字資源長期保存則以國家戰(zhàn)略為主,區(qū)域力量較弱。江蘇省高等學(xué)校數(shù)字圖書館(JALIS)是典型的區(qū)域性圖書館聯(lián)盟之一,在數(shù)字資源長期保存上具有主體及資源優(yōu)勢,但尚未系統(tǒng)開展數(shù)字資源長期保存工作。本文在分析JALIS開展數(shù)字資源長期保存工作的必要性、可行性的基礎(chǔ)上,對數(shù)字資源長期保存的要素進行分析,然后對JALIS開展數(shù)字資源長期保存工作的具體實施路徑進行設(shè)計,既可為JALIS今后的工作打下基礎(chǔ),又可為同類型區(qū)域性圖書館聯(lián)盟提供可復(fù)制的經(jīng)驗。
JALIS有必要參與到數(shù)字資源長期保存工作中。首先,數(shù)字資源長期保存工作具有重要戰(zhàn)略意義和實踐意義,且已經(jīng)納入國家戰(zhàn)略規(guī)劃。國家數(shù)字科技文獻資源長期保存體系(National Digital Preservation Program,NDPP)是國家級數(shù)字保存計劃,已取得了很大進展,但因復(fù)雜性、可變性原因呈現(xiàn)出范圍廣、難度大等特點,需要學(xué)術(shù)界、圖書館界等多方力量的參與以推動保存戰(zhàn)略的進一步發(fā)展。其次,在當(dāng)前復(fù)雜多變的環(huán)境下,高校、科研院所等科研機構(gòu)面臨資源安全的威脅,而且隨著疫情常態(tài)化、國內(nèi)外政治及網(wǎng)絡(luò)環(huán)境的變化,數(shù)字資源建設(shè)、服務(wù)、保存等工作面臨巨大考驗。JALIS是圖書館地區(qū)資源建設(shè)服務(wù)聯(lián)盟、采購聯(lián)盟,組團采購資源數(shù)量多,其成員館負(fù)責(zé)外文數(shù)據(jù)庫引進及談判等工作,資源安全挑戰(zhàn)較大,因而需要通過圖書館聯(lián)盟的長期保存來降低數(shù)字資源引進的風(fēng)險。最后,國內(nèi)數(shù)字保存工作啟動較晚,以國家為主導(dǎo),區(qū)域性保存工作未與國家保存形成體系,因JALIS與國內(nèi)其他區(qū)域性圖書館聯(lián)盟具有共性,其長期保存工作的研究與實踐可以為同類型圖書館聯(lián)盟提供借鑒。
JALIS開展數(shù)字資源長期保存工作具有較強的可行性:①成立較早,組織機構(gòu)完善,具有規(guī)范的運行體制和管理機制,成員館之間具有較強的數(shù)字資源建設(shè)與服務(wù)能力,且凝聚力強、合作緊密;②成員館的數(shù)字資源長期保存意識較強,前期積累卓有成效,重視對高質(zhì)量引進資源存檔權(quán)的獲取和保存,成員館之間經(jīng)過協(xié)商選擇特定機構(gòu)負(fù)責(zé)重要資源的存檔工作;③國內(nèi)自主研發(fā)第一代圖書館管理系統(tǒng)——匯文圖書館管理系統(tǒng)的匯文軟件是由江蘇省教育廳控股,南京大學(xué)、東南大學(xué)參股組成,同時也是下一代圖書館服務(wù)系統(tǒng)較早的踐行者,其開發(fā)的新一代智慧圖書館服務(wù)平臺在智慧校園、智慧圖書館建設(shè)中成果突出,因此JALIS從事數(shù)字資源長期保存工作具有技術(shù)優(yōu)勢。
明確保存主體及責(zé)任體系是數(shù)字資源長期保存工作的第一要素,要解決的是由誰來保存、誰來參與的問題。從機構(gòu)設(shè)置角度而言,JALIS應(yīng)該是江蘇省數(shù)字資源長期保存工作的第一責(zé)任主體,各成員館可以作為第二責(zé)任主體,即合作保存機構(gòu)。就責(zé)任分配而言,需要明確第一、第二責(zé)任主體在整個保存體系中的定位、角色和職責(zé),制定管理運行機制,在人力資源、經(jīng)費、技術(shù)方面進行投入和保障等,建立起數(shù)字資源長期保存工作的責(zé)任體系。此外,數(shù)字資源長期保存的戰(zhàn)略規(guī)劃和各項政策制定也需要責(zé)任主體牽頭執(zhí)行、完成和更新。
保存對象即選擇保存的資源內(nèi)容,它與保存主體的戰(zhàn)略目標(biāo)和定位密不可分,同時不同的保存對象,其管理機制及技術(shù)方案也會有所不同。因此,應(yīng)首先根據(jù)一定的選擇標(biāo)準(zhǔn)確定保存對象,充分考慮JALIS作為長期保存責(zé)任體系的定位、與國家戰(zhàn)略保存存檔節(jié)點的關(guān)系、保存資源的重復(fù)性等。具體來說,需要與國家級存檔節(jié)點就保存內(nèi)容、技術(shù)方案、管理機制等各方面反復(fù)溝通,充分了解NDPP的保存現(xiàn)狀與規(guī)劃方案,NDPP已經(jīng)保存或即將保存的資源內(nèi)容可不納入JALIS保存對象范圍。此外,還應(yīng)當(dāng)評估資源的學(xué)術(shù)價值、使用價值、風(fēng)險程度、可獲得性及存檔難度等。當(dāng)前,JALIS牽頭引進的資源,以及各成員館的學(xué)術(shù)資源、專家報告、中外文電子圖書、特色數(shù)字內(nèi)容等都可以作為戰(zhàn)略保存對象。
戰(zhàn)略規(guī)劃為數(shù)字資源長期保存工作提供指導(dǎo)方向和基本保障,具體而言,需要制訂目標(biāo)和工作計劃等,而目標(biāo)包括總體目標(biāo)和分階段目標(biāo)。戰(zhàn)略規(guī)劃的制定應(yīng)圍繞數(shù)字資源保存的全生命周期,所含的條款應(yīng)包括:①數(shù)字保存對象的選擇標(biāo)準(zhǔn)、原則,以及保存對象的范圍和類型;②組織管理機制,包括組織機構(gòu)管理、存檔節(jié)點及數(shù)據(jù)管理、法律權(quán)益管理、工作流程管理、人員經(jīng)費管理等,以及各級存檔節(jié)點的合作保存機制和反饋機制;③技術(shù)體系和標(biāo)準(zhǔn),如格式標(biāo)準(zhǔn)、元數(shù)據(jù)標(biāo)準(zhǔn),以及已保存數(shù)據(jù)的可持續(xù)性管理方面的標(biāo)準(zhǔn)等。同時,戰(zhàn)略規(guī)劃還應(yīng)當(dāng)根據(jù)數(shù)字資源長期保存工作的現(xiàn)狀和未來的發(fā)展進行修訂和調(diào)整。只有通過制定科學(xué)有效的戰(zhàn)略規(guī)劃,規(guī)范長期保存工作的發(fā)展方向,才能保證存檔數(shù)據(jù)的持續(xù)性和有效性。
完備的保存技術(shù)體系是數(shù)字資源長期保存工作的核心保障。當(dāng)前,國內(nèi)外各級數(shù)字保存機構(gòu)都選用了一定的國際技術(shù)標(biāo)準(zhǔn),規(guī)范長期保存的技術(shù)流程,從技術(shù)上推動數(shù)字倉儲的實現(xiàn)和優(yōu)化。數(shù)字保存聯(lián)盟(Digital Preservation Coalition,DPC)提供了數(shù)字保存工作的國際通用操作標(biāo)準(zhǔn)和技術(shù)標(biāo)準(zhǔn),包括存檔接口標(biāo)準(zhǔn)、存檔系統(tǒng)標(biāo)準(zhǔn)、元數(shù)據(jù)標(biāo)準(zhǔn)等[5],CLOCKSS采用LOCKSS技術(shù)進行數(shù)字保存[6],Portico使用開源軟件作為存檔系統(tǒng)[7],NDPP長期保存系統(tǒng)的技術(shù)架構(gòu)采用OAIS框架并遵循ISO16363標(biāo)準(zhǔn)[8]。目前已經(jīng)制定的數(shù)字存儲技術(shù)標(biāo)準(zhǔn)及眾多技術(shù)領(lǐng)域的最佳實踐和案例,可以作為JALIS存檔節(jié)點建設(shè)的技術(shù)參考。此外,保存技術(shù)體系中還應(yīng)當(dāng)包含保存內(nèi)容的復(fù)制或備份標(biāo)準(zhǔn)、遷移標(biāo)準(zhǔn)、數(shù)據(jù)或格式更新標(biāo)準(zhǔn)、存檔系統(tǒng)標(biāo)準(zhǔn)、合作保存機構(gòu)數(shù)據(jù)上傳標(biāo)準(zhǔn)等內(nèi)容。
下文按照評估現(xiàn)狀、確定目標(biāo)、保存工作開展與實施、可持續(xù)管理與評估、觸發(fā)機制5個方面對JALIS開展數(shù)字資源長期保存工作的實施路徑進行設(shè)計。該路徑具有可操作性,且路徑設(shè)計和實施中融入了評估指標(biāo),便于驗證長期保存工作的效果。
評估現(xiàn)狀是指對JALIS現(xiàn)狀進行評估,分析其當(dāng)前開展數(shù)字資源長期保存工作的能力現(xiàn)狀,從而確定數(shù)字資源長期保存的發(fā)展目標(biāo)和方向。DPC提供的快速評估模型[9]可用于對某組織數(shù)字資源保存狀況的成熟度進行打分,各項指標(biāo)分為以下5個等級:0-無意識,即組織幾乎沒有意識到支持?jǐn)?shù)字資源保存活動的必要性;1-有意識,即組織意識到支持?jǐn)?shù)字資源保存活動的必要性;2-基本支持,即數(shù)字資源保存工作得到了支持,且得到基本水平的管理;3-妥善管理,即數(shù)字資源保存活動在組織內(nèi)部得到很好的管理和支持;4-優(yōu)化狀況,即數(shù)字資源保存工作在組織內(nèi)部得到積極主動管理、提高和發(fā)展。對JALIS及部分成員館進行調(diào)研,評估當(dāng)前JALIS數(shù)字資源長期保存能力及所處的水平(見表1)。當(dāng)前JALIS數(shù)字資源長期保存大部分處于1級水平,說明有數(shù)字資源長期保存的意識,但是機制和流程上不夠完善。組織能力是服務(wù)能力的基礎(chǔ),但JALIS的“組織生存能力”“政策與策略、信息技術(shù)能力”等指標(biāo)仍處于較低水平;“內(nèi)容保存”“元數(shù)據(jù)管理”等服務(wù)能力指標(biāo)水平也有待提升。其中,鑒于JALIS豐富的資源引進及數(shù)字資源建設(shè)經(jīng)驗,組織能力中的“法律保障”以及服務(wù)能力中的“獲取、轉(zhuǎn)移和吸收”與“發(fā)現(xiàn)和訪問”這幾個部分相對較好,處于2級水平。
表1 JALIS數(shù)字資源長期保存能力快速評估初步結(jié)果
JALIS在數(shù)字保存機構(gòu)設(shè)置及管理機制上起步較晚,但是也陸續(xù)開展了一些實踐。例如:江蘇省有10余所高校圖書館及科研機構(gòu)簽署了NSTL的《數(shù)字文獻資源長期保存共同聲明》,表示愿意參與到國家的數(shù)字資源長期保存戰(zhàn)略體系中,并承諾有義務(wù)推動所采購資源在中國本土實現(xiàn)長期保存。JALIS還資助了多項數(shù)字資源長期保存建設(shè)項目和科研項目,如長期保存建設(shè)項目“中外文電子圖書長期保存與利用”,其主要目標(biāo)是構(gòu)建電子圖書長期保存與利用平臺,采集江蘇省高校圖書館所采購的Springer、Wiley、Elsevier等數(shù)據(jù)庫中的外文電子圖書,經(jīng)轉(zhuǎn)換加工上傳到平臺進行長期保存,現(xiàn)階段以保存為主,需要時可面向全省高校圖書館提供服務(wù)。此外,JALIS還對江蘇省高校圖工委采購的約53萬種超星電子書進行長期保存,并以鏡像站點的方式為全省高校圖書館提供服務(wù)。
對JALIS當(dāng)前數(shù)字資源長期保存現(xiàn)狀進行評估以后,需要確定JALIS數(shù)字資源長期保存戰(zhàn)略發(fā)展目標(biāo)及戰(zhàn)略規(guī)劃。首先要思考JALIS與國家戰(zhàn)略的關(guān)系。目前NDPP已經(jīng)選擇3個機構(gòu)作為存檔節(jié)點,JALIS的方向之一是作為國家級戰(zhàn)略保存的存檔節(jié)點,但是作為國家戰(zhàn)略節(jié)點需要自上而下的統(tǒng)籌規(guī)劃,而且與機構(gòu)自身的存儲能力直接相關(guān)。綜合多種因素考慮,JALIS更適合作為區(qū)域性數(shù)字資源長期保存牽頭機構(gòu),聯(lián)合成員館做好江蘇省的數(shù)字資源尤其是學(xué)術(shù)資源的長期保存,并以國家級存檔節(jié)點的要求來提高自身存檔能力,成為國家戰(zhàn)略存檔節(jié)點的儲備力量,這可作為長期目標(biāo)。同時,根據(jù)表1所示的評估結(jié)果可知,目前JALIS所有指標(biāo)評估結(jié)果處于0~2級,因此評估指標(biāo)結(jié)果的階段性提升可以作為短期發(fā)展目標(biāo)。
明確保存責(zé)任體系,確定保存對象,是長期保存工作開展的重要環(huán)節(jié),同時也需要科學(xué)的戰(zhàn)略政策和規(guī)范的管理作為支持,結(jié)合強有力的技術(shù)支撐,保障數(shù)字資源長期保存工作順利實施。
(1)明確保存責(zé)任體系,發(fā)揮主體監(jiān)管作用。由JALIS牽頭成立數(shù)字資源長期保存工作小組,為數(shù)字資源長期保存工作第一責(zé)任人。小組成員由專職人員擔(dān)任或從各成員館抽取,負(fù)責(zé)數(shù)字資源長期保存戰(zhàn)略規(guī)劃和標(biāo)準(zhǔn)的制定、具體工作實施等。同時,JALIS受江蘇省教育廳管理,開展數(shù)字資源長期保存工作需要持續(xù)穩(wěn)定的經(jīng)費支持及上級管理機構(gòu)的行政支持。
(2)制定標(biāo)準(zhǔn),確定長期保存對象。首先,在保存對象選擇標(biāo)準(zhǔn)方面,NDPP制定的保存目標(biāo)資源選擇標(biāo)準(zhǔn)是:“選擇使用價值高、學(xué)術(shù)價值高、風(fēng)險高、保存可操作性強的數(shù)字科技文獻資源,優(yōu)先部署長期保存,并創(chuàng)造條件保存其他具有保存價值和消除風(fēng)險作用的數(shù)字文獻資源”[10]。JALIS以此為參考,從以下角度確定保存對象:①學(xué)術(shù)和使用價值高;②保存可操作性強;③JALIS及成員館買斷的具有永久使用權(quán)的資源內(nèi)容,例如回溯資源等;④NDPP等保存機構(gòu)未保存的高質(zhì)量資源;⑤江蘇省高校產(chǎn)生的高質(zhì)量學(xué)術(shù)資源,例如專家學(xué)術(shù)報告、視頻報告等;⑥其他特色數(shù)字內(nèi)容。其次,在保存對象的內(nèi)容和范圍方面,對于電子期刊、電子圖書等全文數(shù)字資源,NDPP以保存現(xiàn)刊為主,收藏的電子圖書目前僅限于6家出版社,范圍較小。JALIS數(shù)字資源長期保存對象的類型包括:①JALIS及成員館牽頭引進的外文電子期刊資源及電子圖書可作為長期保存的主要對象,如Elsevier、Taylor & Francis等國際知名學(xué)術(shù)出版社及ACM、ACS等學(xué)(協(xié))會出版的電子圖書等,保存內(nèi)容由出版商提供;②高質(zhì)量學(xué)術(shù)視頻、報告等,江蘇省高校數(shù)量多,學(xué)術(shù)資源豐富且質(zhì)量高,數(shù)字視頻、數(shù)字報告、科研數(shù)據(jù)等可以作為JALIS長期保存的重要內(nèi)容之一,并可與機構(gòu)知識庫建設(shè)相結(jié)合,保存內(nèi)容由各高校提供;③軟件或數(shù)據(jù)庫等,例如買斷的Endnote某版本軟件和其他數(shù)據(jù)處理軟件、WOS回溯數(shù)據(jù)等可以作為保存對象;④其他特色數(shù)字內(nèi)容,各高校或各機構(gòu)特色資源的數(shù)字化,或特色的數(shù)字內(nèi)容,例如古籍資源、地方數(shù)字文化資源等也需要進行保存。
(3)建立規(guī)范管理機制,做好戰(zhàn)略政策保障。首先,圍繞保存對象和目標(biāo),制定戰(zhàn)略規(guī)劃和各項政策,國內(nèi)外發(fā)展實踐中的相關(guān)政策可以作為政策制定的參考。其次,建立規(guī)范的數(shù)字內(nèi)容上傳、存檔、校驗、可揭示的業(yè)務(wù)流程及系統(tǒng)部署,例如NDPP的保存節(jié)點采用的是DPS系統(tǒng)[11],明確保存方、資源提供方的法律權(quán)益及條款等。
(4)加強保存技術(shù)支持,保障保存工作順利開展。①在數(shù)字內(nèi)容獲取上,數(shù)字資源“共建共享”的定位要拓展到資源“共建共享共存”,對于付費采購數(shù)字資源,JALIS及成員館可以通過采購資源談判或聯(lián)合采購談判獲得存檔權(quán);對于買斷的資源,必須獲得存檔權(quán),提供符合存檔格式的標(biāo)準(zhǔn)文件;對于自建的高質(zhì)量學(xué)術(shù)資源,則由各資源建設(shè)單位提供并上傳到存檔中心。②在技術(shù)平臺搭建上,JALIS負(fù)責(zé)建立存儲中心,依國家標(biāo)準(zhǔn)技術(shù)建設(shè)存儲系統(tǒng),搭建數(shù)據(jù)上傳中心為各成員館提供提交數(shù)字內(nèi)容的通道。各成員館提交的數(shù)字內(nèi)容在上傳中心校驗合格后,轉(zhuǎn)入存檔中心存儲。存儲中心應(yīng)當(dāng)與國家存儲節(jié)點保持互通互聯(lián),國家有權(quán)利對于存儲的資源進行備份和調(diào)用。③在資源的存檔和揭示上,大部分高校已經(jīng)上線或即將上線下一代圖書館管理系統(tǒng),其側(cè)重于數(shù)字資源的管理和揭示,對于JALIS需要觸發(fā)使用的存檔資源,可以通過下一代圖書館管理系統(tǒng)進行發(fā)布和揭示,同時由于高校的數(shù)字資源較大概率融合在下一代圖書館管理系統(tǒng)中,下一代圖書館管理系統(tǒng)可以作為長期保存對象的篩選途徑之一。
持久性和延續(xù)性是數(shù)字資源長期保存機構(gòu)的發(fā)展目標(biāo)之一,可持續(xù)管理與長效評估機制是必不可少的環(huán)節(jié)。鄭建程等[12]提出數(shù)字內(nèi)容格式、保存系統(tǒng)、保存服務(wù)都具有可持續(xù)性。存檔機構(gòu)需要對戰(zhàn)略政策、存檔工作流程、存檔數(shù)據(jù)進行可靠評估,及時更新優(yōu)化相關(guān)政策及工作流程。同時,建立數(shù)據(jù)保護及更新、繼承機制,因為存檔數(shù)據(jù)及格式標(biāo)準(zhǔn)日新月異,當(dāng)前存儲的格式不一定適應(yīng)未來的使用,要從政策、技術(shù)上搭建數(shù)據(jù)更新的通道和方法,并做好保存數(shù)據(jù)的長期備份。此外,當(dāng)JALIS不能再作為存檔機構(gòu)進行長期保存時,已保存的數(shù)字內(nèi)容如何安全地遷移到繼承機構(gòu)中,也是可持續(xù)管理中必須考慮的問題,技術(shù)力量強大的成員館或其他國家存檔節(jié)點可以作為繼承機構(gòu)的備選。
機構(gòu)對數(shù)字資源進行長期保存的最終目的是確保保存對象在需要的時候可以被訪問和使用。觸發(fā)機制要確保保存對象的可獲得性,即存檔的數(shù)字內(nèi)容在合法約定的時候可以提供給特定的資源需求方。JALIS作為合法的資源保存方提供長期保存服務(wù),首先要保證特定用戶對長期保存數(shù)字資源的持續(xù)、可靠利用,同時還要保證保存資源提供方的合法利益不受侵害。CLOCKSS與Portico等都制定了觸發(fā)機制,觸發(fā)機制是指當(dāng)資源提供方的數(shù)據(jù)受自然災(zāi)害等不可抗力因素導(dǎo)致服務(wù)無法繼續(xù)提供服務(wù),或資源提供方因自身原因不再持續(xù)出版或不再經(jīng)營,原平臺資源服務(wù)停止等情況下,為用戶提供備選方案,滿足用戶的資源需求。JALIS當(dāng)前的數(shù)字資源服務(wù),遇觸發(fā)情況不能提供服務(wù)資源時可以通過現(xiàn)有資源服務(wù)平臺或成員館的下一代圖書館管理系統(tǒng)平臺提供給需求方。
數(shù)字資源長期保存相關(guān)研究及實踐在國內(nèi)已開展20余年,國家級數(shù)字資源長期保存體系也制定了科學(xué)、合理的發(fā)展戰(zhàn)略和實施方案,相較于國外的數(shù)字保存研究及發(fā)展實踐而言,仍舊有很大的發(fā)展空間。區(qū)域性聯(lián)盟的數(shù)字資源長期保存工作實施過程中也會面臨很多可預(yù)見的問題:一是政策及行政保障問題,長期保存工作需要自上而下推動,需要上級管理單位及成員館的大力支持,從目前調(diào)研結(jié)果來看,當(dāng)前各成員館對于長期保存的意識稍有不足;二是團隊建設(shè)問題,JALIS聯(lián)盟的長期保存工作目前缺乏一支具有理論和實踐兼?zhèn)涞膶I(yè)人才隊伍,專業(yè)隊伍的培養(yǎng)需要投入大量精力;三是技術(shù)問題,長期保存節(jié)點建設(shè)和版權(quán)方面存在的各類標(biāo)準(zhǔn)和技術(shù)問題等都是實踐工作中存在的難點。鑒于數(shù)字資源本身的復(fù)雜性及長期保存工作的技術(shù)、人力物力等各方面挑戰(zhàn),地方各級圖書館及相關(guān)力量應(yīng)積極加入數(shù)字資源長期保存工作中,參照國際標(biāo)準(zhǔn)及國家標(biāo)準(zhǔn),在區(qū)域性長期保存工作中行動起來。