王燕 徐紅利
摘要:數(shù)字檔案館是檔案行業(yè)的新興事物,是國家檔案事業(yè)信息化建設(shè)的重要歷史發(fā)展階段。河南省檔案事業(yè)“十一五”發(fā)展規(guī)劃提出:運用現(xiàn)代信息技術(shù)開發(fā)利用檔案信息資源,在條件具備的地方建設(shè)電子文件中心和數(shù)字檔案館。
關(guān)鍵詞:數(shù)字檔案館 檔案行業(yè)信息化
近年來國家在深圳、青島2個檔案館試點建設(shè)數(shù)字檔案館,并將成功經(jīng)驗向各行業(yè)各地方推廣。那么什么是數(shù)字檔案館?在總結(jié)成功經(jīng)驗的基礎(chǔ)上,目前大家比較認可的定義是:以網(wǎng)絡(luò)為支撐,以數(shù)據(jù)庫為核心,以檔案專業(yè)的管理軟件為工具,通過建設(shè)“三個平臺”——網(wǎng)絡(luò)支持平臺、業(yè)務(wù)管理平臺、信息服務(wù)平臺,實現(xiàn)數(shù)據(jù)傳輸網(wǎng)絡(luò)化、業(yè)務(wù)管理自動化、信息服務(wù)在線化。
一、數(shù)字檔案館的基本結(jié)構(gòu)。
進行數(shù)字檔案館建設(shè),首先必須要搞懂它的基本結(jié)構(gòu),否則就會無從下手。其實,在數(shù)字檔案館這么一句簡單的定義中已經(jīng)揭示了它的基本結(jié)構(gòu):即網(wǎng)絡(luò)支持平臺、業(yè)務(wù)管理平臺、信息服務(wù)平臺。這3個平臺既相對獨立,又緊密相連。每一個平臺針對的對象不同,解決的問題不同。
數(shù)字檔案館3個平臺的組成結(jié)構(gòu)可以參照OSI(開放系統(tǒng)互聯(lián)參考模型)來理解。OSI是國際標(biāo)準(zhǔn)化組織于1978年定義的一個描述網(wǎng)絡(luò)層次結(jié)構(gòu)的標(biāo)準(zhǔn)模型,通過OSI保證了各種類型網(wǎng)絡(luò)的兼容性,互操作性。OSI說明了信息在網(wǎng)絡(luò)中是如何傳輸?shù)模约案鲗釉诰W(wǎng)絡(luò)中的功能和它們的框架概念。
與OSI模型功能相似,在數(shù)字檔案館3個平臺中,當(dāng)前層平臺的下一層平臺都為當(dāng)前層提供服務(wù)。3個平臺的結(jié)構(gòu)為傳統(tǒng)檔案工作向數(shù)字檔案館過度提供了理想的結(jié)構(gòu)模型。
二、數(shù)字檔案館各層平臺的功能。
1.網(wǎng)絡(luò)支持平臺。
從檔案傳統(tǒng)管理模式來看,網(wǎng)絡(luò)支持平臺對應(yīng)的是檔案信息的存儲利用模式。傳統(tǒng)檔案工作在這個平臺上主要考慮檔案的庫房容量,檔案是以單份文件獨立存放或是卷冊存放保存。檔案卷冊是裝袋保存或是裝盒保存,檔案案卷上如何標(biāo)識,檔案信息如何組織起來對外提供利用等。庫房管理和檔案案卷組織存放形式是傳統(tǒng)檔案工作的基礎(chǔ),沒有這個基礎(chǔ)檔案管理無從談起。
網(wǎng)絡(luò)支持平臺中重點考慮的一個方面是海量數(shù)據(jù)存儲。海量數(shù)據(jù)是數(shù)字檔案館的一個鮮明特點,它既是數(shù)字檔案館對外提供利用的基礎(chǔ),也是加工和處理的對象。一般來說數(shù)字檔案館可以成為一個單位最大的數(shù)字信息庫,存儲量以“T”計。在硬件配置時應(yīng)考慮大容量硬盤或磁盤陣列,在做異地備份時可以考慮光盤。
另一個考慮的重點是保存信息的多樣性。隨著信息技術(shù)的發(fā)展,我們產(chǎn)生的電子信息日益呈現(xiàn)出多媒體化,這種趨勢將來會越來越明顯。如我們平時經(jīng)常遇到的工程圖紙信息(掃描圖tif、工程CAD圖紙)、文書檔案信息(原文及批文sif、word、htm)、電子圖書(CEB)、電子期刊(CAJ、PDF)、電子版規(guī)程規(guī)范(PDF),圖片信息(JPEG、BMP、GIF)等。為用戶保存和提供多媒體信息是網(wǎng)絡(luò)支持平臺應(yīng)完成的功能,千兆甚至萬兆以太網(wǎng)和高速交換機為大容量信息傳遞提供了硬件基礎(chǔ)。
2.業(yè)務(wù)管理平臺。
對應(yīng)于業(yè)務(wù)管理平臺,傳統(tǒng)檔案管理模式可以劃分為的6個工作環(huán)節(jié),即:收集、整理、保管、鑒定、統(tǒng)計、提供利用。這6個環(huán)節(jié)體現(xiàn)了檔案的日常工作,規(guī)范了檔案信息的流向,保證了進出檔案庫的信息都是完整、準(zhǔn)確、有效的。在數(shù)字檔案館設(shè)計中應(yīng)考慮實現(xiàn)這6個環(huán)節(jié)的功能,以便和傳統(tǒng)紙質(zhì)檔案的管理相兼容。
從計算機網(wǎng)絡(luò)角度看,這一層平臺是數(shù)字檔案館非常重要的一層,起著承上啟下的重要作用。這一層主要對應(yīng)于OSI模型中的會話層和表示層。在OSI模型中,會話層主要功能是為會話實體間建立連接,表示層主要功能是為通信提供一種公共語言。這兩層的功能映射到業(yè)務(wù)管理平臺中主要通過數(shù)據(jù)庫和檔案編號體系來完成,而數(shù)據(jù)庫的管理在整個數(shù)字檔案館中起著核心的作用。檔案管理人員通過數(shù)據(jù)庫完成對數(shù)字檔案信息的各種相關(guān)操作,同時接收信息服務(wù)平臺發(fā)送過來的服務(wù)請求。所有數(shù)字信息經(jīng)過檔案編號體系編碼后進入數(shù)字檔案館進行有序保管,完成一個歸檔過程。檢索出來的信息通過這一層分類排序提供給信息服務(wù)平臺,完成一個服務(wù)過程。檔案6個工作環(huán)節(jié)通過數(shù)據(jù)庫和檔案編號體系相互作用共同完成數(shù)字檔案館的系統(tǒng)操作及日常維護。
在業(yè)務(wù)管理平臺,數(shù)字檔案館可以和工作流程中的上一級進行對接和連通,使檔案工作得以延伸,從根本上解決數(shù)字檔案歸檔率低的難題。以設(shè)計行業(yè)CAD圖紙歸檔為例,通過和出版崗位的繪圖儀連通,構(gòu)筑同一個數(shù)字化管理平臺,實現(xiàn)在出版CAD圖紙的同時完成歸檔,可以使CAD圖紙歸檔率達到95%以上。
3.信息服務(wù)平臺。
在傳統(tǒng)檔案管理模式中,信息服務(wù)平臺對應(yīng)于檔案服務(wù)形式。檔案部門根據(jù)用戶的需求選擇不同的服務(wù)方式,提供給用戶不同的檔案產(chǎn)品。比如用戶可以用查卡片的方式檢索檔案,也可以利用計算機檢索,還可以咨詢檔案管理人員。不同的服務(wù)方式帶來了不同的操作,但結(jié)果應(yīng)當(dāng)是相同的。
從計算機網(wǎng)絡(luò)角度來看,該層平臺對應(yīng)于OSI模型中的應(yīng)用層。與應(yīng)用層功能相似,信息服務(wù)平臺是數(shù)字檔案館3個平臺中的最高層平臺,也是最靠近用戶的一層平臺。它不同于其他層平臺之處在于它不為任何一個平臺提供服務(wù),它只為數(shù)字檔案館以外的用戶提供服務(wù),用戶通過信息服務(wù)平臺完成對系統(tǒng)的操作。該層的任務(wù)是研究用戶的需求,如何為用戶提供方便、準(zhǔn)確、舒適的服務(wù)。
信息服務(wù)平臺提供能瀏覽多種媒體格式的瀏覽器,在一個界面環(huán)境下完成多媒體信息的瀏覽或下載,方便了用戶對檔案全文信息的檢索和利用。
三、數(shù)字檔案館信息處理模式和發(fā)展歷程。
在3層平臺結(jié)構(gòu)中,用戶對數(shù)字檔案館提出的需求是一層一層向下傳遞,在完成相關(guān)操作后信息又一層一層向上傳遞,最后提供給用戶。比如用戶要完成一個檢索,首先經(jīng)過信息服務(wù)平臺接收處理并識別是什么需求,分析后傳遞給業(yè)務(wù)管理平臺。在業(yè)務(wù)管理平臺啟動數(shù)據(jù)庫的檢索,通過對網(wǎng)絡(luò)支持平臺中實體文件的檢索,完成需要信息的查詢,然后向上傳遞回業(yè)務(wù)管理平臺進行排序或分類,最后提供給信息服務(wù)平臺,完成一次操作。用戶最終看到了檢索結(jié)果。
數(shù)字檔案館結(jié)構(gòu)的形成經(jīng)歷了一個發(fā)展歷程,它的發(fā)展和整個檔案管理軟件的發(fā)展相一致。在早期單機版的計算機輔助管理檔案階段,只能部分實現(xiàn)“業(yè)務(wù)管理平臺”這一層的功能。這一階段的特點是以單個的計算機為基礎(chǔ),以對檔案卷冊的目錄級管理為重點,具有簡單的查詢、打印、排序等功能,沒有網(wǎng)絡(luò)支持平臺和為用戶服務(wù)的平臺。隨著網(wǎng)絡(luò)本身的發(fā)展以及網(wǎng)絡(luò)數(shù)據(jù)庫的出現(xiàn),具有“網(wǎng)絡(luò)支持平臺”部分功能的檔案管理軟件開始出現(xiàn),但還不能保存管理檔案的全文。電子檔案的出現(xiàn)使得檔案管理軟件跨入第二代。第二代檔案管理軟件以網(wǎng)絡(luò)為基礎(chǔ),以檔案的全文管理為重點,具有網(wǎng)絡(luò)查詢、瀏覽、下載全文等功能,初步具備了3個平臺的結(jié)構(gòu)。所以我們稱電子檔案是數(shù)字檔案館的初級階段,數(shù)字檔案館是電子檔案發(fā)展到一定階段的必然產(chǎn)物,數(shù)字檔案館可以稱之為第三代檔案管理軟件。第三代檔案管理軟件以檔案整體的數(shù)字化為基礎(chǔ),以檔案管理中的歸全率完整率為突破口,從電子文件的收集階段開始介入進行管理,實現(xiàn)了檔案工作的延伸和拓展,達到了確保檔案電子版全文的歸全率和完整率的目的;同時檔案全文內(nèi)容也可以進行檢索,檢索方式從原來的目錄檢索過度到全文內(nèi)容檢索。這些功能的完成需要3個平臺互相作用,缺一不可。
從數(shù)字檔案館的整體結(jié)構(gòu)來說,數(shù)字檔案館的建設(shè)是一個系統(tǒng)工程,并非一朝一夕就能完成,它對一個單位的網(wǎng)絡(luò)、計算機、檔案管理、電子檔案管理甚至相關(guān)部門都提出了較高的要求。對系統(tǒng)需求進行分析時宜從最高層入手,最低層結(jié)束。進行建設(shè)時宜從最低層入手,最高層結(jié)束。3層平臺的結(jié)構(gòu)為我們研究數(shù)字檔案館提供了很好的模型,也為建設(shè)數(shù)字檔案館提供了理想的參照。
作者簡介:
王燕,(1980.03-),女,河南省鄭州市,職稱:館員。本科學(xué)歷,研究方向:電子檔案管理及數(shù)字檔案館建設(shè)。