文·于熒熒
隨著數(shù)字時代中信息技術的換代更迭,對數(shù)字檔案存儲提出了要求越來越高,各國都在為改進和推進數(shù)字檔案存儲作出不懈努力,以尋求長久、安全、合適的解決方案。目前,保護數(shù)字檔案的目的已不僅僅是保護其在物理性能上不受損害,而是要建立以信息完整性為主要特征的電子檔案管理與維護體系,這便涉及到從數(shù)據(jù)保護到隱私立法以及知識產權保護等多方面問題。眾多法律和監(jiān)管的框架會對數(shù)字檔案的實體保存、訪問利用產生深刻影響,這也要求我們從數(shù)字檔案的各個層面去開展研究,以創(chuàng)建有利于數(shù)字檔案保護和利用的法律環(huán)境。
數(shù)字檔案信息存在著來自物理、技術、人為、機構等多方面的威脅。其中,物理威脅源于自然事件或時間等因素,包括介質、硬件、存儲設施的故障等。技術威脅包括歸檔格式的過時或破壞性軟件導致的錯誤。人為威脅包括檔案管護的失誤,內部和外部的攻擊等。機構威脅包括目標任務的改變、法律制度的瓦解等(見表1)。值得用戶信賴的數(shù)據(jù)庫應當了解其系統(tǒng)內部存在的威脅與風險。
表1 數(shù)字檔案存在的一般風險
網絡服務故障 信息的可訪問性因文件名稱的解析、目錄的錯誤放置和管理的失敗而丟失。組件過時介質、硬件、軟件的組件因時間推移出現(xiàn)與其他系統(tǒng)組件不兼容的情況,或因文件格式過時而阻止內容解碼和呈現(xiàn)。操作員錯誤 操作員在處理系統(tǒng)組件時引入無法檢測的錯誤,或是操作系統(tǒng)在恢復任務期間產生錯誤。自然災害 洪水、火災、地震等。外部入侵 恐怖襲擊、黑客攻擊等。內部入侵 內部人員欺詐、報復或惡作劇等行為。組織機構和經濟的瓦解與困難數(shù)據(jù)庫運行機構因無法承擔高昂的運行成本導致數(shù)據(jù)庫無法運行,或因組織機構解散、破產或任務變更等使其離了有關部門的監(jiān)管。
上述列舉的風險印證了一個事實,即數(shù)字檔案存儲不僅僅是技術問題,更是組織和管理問題,甚至說要保持數(shù)字檔案存儲的持久性與完整性,組織和管理更為重要。德國數(shù)字資源長期保存網絡(Nestor)項目組認為,能夠長期運行的數(shù)字存儲庫是一個復雜且相互關聯(lián)的系統(tǒng)。所以,存儲檔案的數(shù)據(jù)庫不僅需要持續(xù)的監(jiān)控、規(guī)劃和維護,也需要主動行動和實施戰(zhàn)略等,為其執(zhí)行數(shù)字保存任務提供堅實的保障。這是一項極其昂貴而復雜的工作,需要營造包括檔案管理者、利益相關者、資助者以及與其他檔案數(shù)據(jù)庫項目在內的協(xié)作環(huán)境,來應對已經產生和即將產生的大量數(shù)字檔案。
數(shù)字檔案存儲系統(tǒng)的可信度是衡量系統(tǒng)優(yōu)劣的重要因素。在確定系統(tǒng)可信度時,要通盤考慮、協(xié)調統(tǒng)一,建立可以確保數(shù)據(jù)庫正常運行的一系列組織與程序,包括科學的標準規(guī)定、先進的治理方式、完善的組織結構、合適的人員配備、健康的財務狀況、可持續(xù)的資金供給能力、合法的經營合同許可、應承擔的責任義務以及能夠與之相匹配的數(shù)據(jù)和隨時承接項目的繼承者,以保證數(shù)據(jù)庫系統(tǒng)的順利運行并完成其相應的使命。
加拿大多倫多大學教授羅斯(Ross)、英國格拉斯哥大學教授安德魯(Andrew)提出,數(shù)據(jù)庫必須用多種方法和手段來建立并維持其可信狀態(tài)。為獲取公眾對檔案管理的信任,必須對數(shù)據(jù)庫進行定期審核和認證,將審核清單作為客觀評估的工具,成為本地信息收集、評估或國際或國家認證過程的組成部分。使用審核清單,以自我評估為起點是數(shù)據(jù)庫了解其功能的一種有效機制,這一機制的建立可以在一定程度上抵御某些潛在威脅以及系統(tǒng)內部固有的風險。
審核和認證目前國內外尚無一套核心的標準和要求,而要實現(xiàn)這種統(tǒng)一的標準和要求,又有眾多困難。應該說在數(shù)字檔案管理中,并非所有的數(shù)據(jù)庫都是“平等的”。就國家而言,有地方、區(qū)域、國家和國際層面的數(shù)據(jù)庫以及數(shù)字檔案館;就數(shù)字檔案館而言,還可分為國家檔案館、地方檔案館、社區(qū)檔案館、機構檔案館、商業(yè)檔案館和學校檔案館等。此外,存儲庫類型(機構存儲庫、開放存取存儲庫、數(shù)字存儲庫)的激增,也使檔案分層管理的需要變得更加清晰。對這些存儲庫而言,其主要目的并非保存或明確優(yōu)先級,因而選擇認證將在無形之中給他們帶來許多壓迫感,這也是他們不會進行認證的原因之一。雖然美國芝加哥的研究圖書館中心(CRL)、英國數(shù)字保存研究中心(DCC)、德國Nestor項目組已為此做出很多努力,然而要達到數(shù)據(jù)庫完全標準化仍還有很長的路要走。
關于審核和認證清單,可大體分為三個部分。一是組織基礎設施,二是數(shù)字檔案管理,三是基礎設施和安全(見表2)。在經歷嚴格的審核之后,定期將審核和認證結果向公眾公布,既增強透明度,也有利于獲得公眾對檔案工作的信任。
表2 審核和認證清單項目及具體要求
數(shù)字對象的管理數(shù)據(jù)庫的數(shù)字對象管理職責,主要體現(xiàn)在“組織”和技術等方面,比如攝取管理和提供長期訪問數(shù)字對象所需的存儲庫功能、流程和過程。這些要求根據(jù)存檔功能可分為6組,即允許在OAIS系統(tǒng)模型下進行;在攝取的初始階段,解決數(shù)字內容的獲取問題;在攝取的最后階段,將獲取的數(shù)字內容放入表格中變?yōu)闄n案信息包(AIP)進行長期保存;在不斷變化的技術環(huán)境中,建立保持聲像、文件檔案最新狀態(tài)的策略和機制;使用AIP進行長期保存的最低條件;允許系統(tǒng)內定位和管理數(shù)字對象的最小級元數(shù)據(jù);具備使要保存的數(shù)字對象準確生成、傳播并保持真實版本的能力。技術基礎設施和安全可以分為三層,一是一般系統(tǒng)基礎結構要求;二層是基于系統(tǒng)基礎設施要求的適當技術,以及與之相適應的為數(shù)據(jù)庫指定社區(qū)使用服務的有關技術、策略和附加標準與要求;三是安全性,包括從IT系統(tǒng)(服務器,防火墻或路由器)到消防系統(tǒng)再到洪水檢測中涉及人為因素的部分。
眾所周知,所有數(shù)據(jù)庫建設的最終目的都是使檔案內容能夠長期保存和使用。為能夠更好地處理數(shù)據(jù)庫和用戶之間的關系,更從容地應對因檔案存儲內容和技術過時而帶來的挑戰(zhàn),歸檔前存檔機構與檔案提供者應簽訂存檔協(xié)議,通過制定書面標準、規(guī)范存儲對象、明確存儲形式和檔案管理者、提供者應盡的義務等,促進數(shù)據(jù)庫管理規(guī)范化,并規(guī)避未來可能發(fā)生的麻煩。
數(shù)據(jù)庫能夠標識它所存儲的數(shù)字對象屬性,這一過程從數(shù)據(jù)庫的任務聲明就開始了。比如,有的存儲庫可能只承諾保留文本內容,而不以電子檔案方式在屏幕上顯示其確切外觀;有的則可能承諾保留電子檔案的確切外觀和布局,而其他則可能選擇在攝取過程中使數(shù)據(jù)得到規(guī)范化。
此外,還可以根據(jù)自己的館藏特色來制定存儲方案。每個檔案館館藏檔案內容是不同的,為了實現(xiàn)館藏檔案利用最大化,精準滿足各種需求,我們應根據(jù)各自館藏檔案的特點編制、開發(fā)符合自身特點的詞庫與軟件,形成具有自身館藏特色的數(shù)據(jù)庫系統(tǒng)。
事實上,數(shù)字檔案的存儲并非僅局限于文書檔案,還應包含不同載體的檔案。如瓦努阿圖文化信息網(VCIN)中的電影和有聲檔案館(NFFSA)保存的照片、音頻和視頻,國家博物館的人工制品,國家遺產登記冊檔案中的文字、音頻和視頻,國家圖書館的書籍和報紙等。用戶不僅能夠從中查看所有可公開訪問的檔案信息,還能夠清楚地了解不同檔案之間的關聯(lián)。比如用戶若想研究文化儀式,不僅可以在國家博物館的數(shù)據(jù)庫中,看其藏品是如何運用到由國家攝影、NFFSA錄制的特定儀式中,查看該藏品的數(shù)字化照片,還可以瀏覽國家圖書館保存的與其內容相關的電子文檔,收聽錄音,查看NFFSA中有關儀式的照片和錄像。這樣,用戶就能夠非常便捷、全面地了解博物館中的藏品。
以多樣化、全覆蓋的格式來保存檔案內容也是實現(xiàn)檔案真實性、持久性的路徑之一。如美國佛羅里達圖書館自動化中心(FCLA)的數(shù)字保存?zhèn)}儲軟件(DAITSS)實現(xiàn)了基于格式轉換的主動保存策略,包括向前遷移、規(guī)范化和本地化。DAITSS能夠完全處理AIFF、AVI、JPEG、JP2、JPX、PDF、純文本、QuickTime、TIFF、WAVE、XML和XML DTD12種不同的文件格式,并且在數(shù)據(jù)攝?。╥ngest)階段實現(xiàn)了幾種格式的標準化。目前,澳大利亞國家檔案館已盡可能實現(xiàn)了現(xiàn)有數(shù)據(jù)存儲格式的全覆蓋。
了解數(shù)據(jù)是如何以及在何處創(chuàng)建,并通過重新定義傳統(tǒng)的訪問概念來確保數(shù)據(jù)訪問可行性是確保其可以被使用的第一步。由于我們無法預見數(shù)字檔案的所有用途,因此就要盡可能地保持多樣的、開放的訪問渠道以突破館藏的極限,以增加訪問系統(tǒng)的預期壽命;要在積極與用戶互動的同時,暢通用戶的利用和反饋渠道,努力完善數(shù)據(jù)庫系統(tǒng),并在此基礎上預測未來用戶的訪問需求;對于要攝取的各類型數(shù)字對象,存儲庫應制定相應的書面標準,可以由存儲庫管理者單獨制定,也可以與其他機構聯(lián)合制定。書面標準中要準確指定需傳輸?shù)臄?shù)字對象、與對象關聯(lián)的文檔以及對訪問的各種限制。此外,存儲庫還要清楚地列出與該數(shù)字檔案相關聯(lián)的其他信息。
數(shù)字革命改變了檔案工作者的工作范圍,需要檔案工作者擁有信息化、數(shù)字化方面的知識、技能與品質,以滿足用戶對檔案信息創(chuàng)建和系統(tǒng)訪問的個性化需求,保護數(shù)字檔案免受信息技術變革的沖擊,并用創(chuàng)新的技術和手段來推進檔案工作的發(fā)展。
1.要有相應的知識儲備。包括擁有檔案學理論知識與檔案工作實踐經驗,明晰檔案與其他信息管理領域之間的關系,熟知現(xiàn)代組織中檔案的形成流程、不同的歸檔選擇和相應的技術要求,掌握發(fā)現(xiàn)、保存和管理元數(shù)據(jù)的法律、制度、監(jiān)管和治理框架,以及平臺系統(tǒng)中的檔案來源、背景、標記語言和保證或控制檔案質量的方法;了解電子商務、電子政務運作的基本概念和信息、通信技術的安全管理制度,以及審計和規(guī)范化測評的方法、規(guī)則。
2.要有一定的技能和品質。包括交流能力、研究能力和影響力,應急管理能力和業(yè)務工作創(chuàng)新能力,靈活和準確的判斷力,咨詢和談判能力,風險評估和管理能力,系統(tǒng)設計和推廣能力,準備業(yè)務案例的能力,建模和分析能力(包括功能和工作流程分析)等。
找出解決數(shù)字檔案存儲難點的辦法,不是一朝一夕、一個部門的所能完成的,需要檔案工作者、檔案研究者、檔案機構以及相關部門間共同努力、不懈探索,以尋得最佳解決方案。在這一方面我們已經取得了一些成績,但前進的路還很漫長,需要我們做好打持久戰(zhàn)的準備并建立必勝的信念,以助推檔案工作不斷向數(shù)字化、信息化的進程邁進。