陳麗榕
【摘 要】隨著社會經(jīng)濟(jì)水平的不斷提高,傳統(tǒng)的紙質(zhì)檔案已經(jīng)無法滿足檔案管理工作的需要,因此需要使用電子檔案。電子檔案的歸檔比較方便,并且還能夠長期的保存,論文主要探討電子文件歸檔與長期保存的技術(shù)路徑。
【Abstract】With the continuous improvement of social and economic level, the traditional paper archives can no longer meet the needs of archives management, so we need to use electronic archives. The archiving of electronic documents is convenient and can be preserved for a long time. This paper mainly discusses the technical path of archiving and long-term preservation of electronic documents.
【關(guān)鍵詞】電子文件:歸檔;長期保存;技術(shù)路徑
【Keywords】electronic documents; archiving; long-term preservation; technical path
【中圖分類號】G275.2 【文獻(xiàn)標(biāo)志碼】A 【文章編號】1673-1069(2018)08-0167-02
1引言
檔案的信息化管理需要一定的技術(shù)支撐,通過建立電子檔案數(shù)據(jù)庫,來完成檔案的管理并且還能夠?qū)崿F(xiàn)檔案的信息共享。電子檔案在進(jìn)行歸檔保存的時候需要通過一些技術(shù)來實(shí)現(xiàn),其中需要注意的就是保持電子檔案格式的標(biāo)準(zhǔn)化。
2 電子文件檔案概述
電子檔案在進(jìn)行管理的時候需要建立數(shù)據(jù)庫,通過數(shù)據(jù)庫來完成檔案的存儲以及管理等工作。數(shù)據(jù)庫管理系統(tǒng)中承擔(dān)文件職責(zé)的數(shù)據(jù)或者是文件的主要組成成分都可以稱為電子文件。目前大多數(shù)數(shù)據(jù)庫中都存在著大量的表格,這些表格中還會有不同的字段,這些字段中含有不同類型的數(shù)據(jù)。數(shù)據(jù)庫中數(shù)據(jù)表的數(shù)據(jù)就是電子檔案的內(nèi)容,表結(jié)構(gòu)以及表間關(guān)系是一些電子文檔的背景信息,比如數(shù)據(jù)庫權(quán)限、日志以及結(jié)構(gòu)信息等。這些背景信息也是構(gòu)成電子文檔的重要因素。
數(shù)據(jù)庫中的電子文件與傳統(tǒng)的電子文件有著很大的不同,因?yàn)閿?shù)據(jù)庫中的電子文件之間存在一定的聯(lián)系,并且其內(nèi)部的邏輯關(guān)系也比較復(fù)雜,也就是說數(shù)據(jù)庫中的電子文件是一個有機(jī)的整體,但是不同數(shù)據(jù)庫中的電子文檔只能由自己管理系統(tǒng)中的軟件讀取。傳統(tǒng)的電子文檔進(jìn)行歸檔的時候檔案內(nèi)容已經(jīng)辦畢了,但是數(shù)據(jù)庫中的電子文檔可以隨著檔案的變化而進(jìn)行調(diào)整[1]。
3 電子文件歸檔與長期保存難點(diǎn)
3.1 歸檔范圍的確定
電子文件歸檔的依據(jù)是歸檔范圍,但是數(shù)據(jù)庫中的電子文檔之間都是相互聯(lián)系的,這也就導(dǎo)致了歸檔范圍難以確定。如果在進(jìn)行歸檔的時候?qū)⑷康奈募w檔,那么就會有一些多余的信息出現(xiàn),使得電子文檔不夠簡潔。但是如果只選擇其中一部分文件進(jìn)行歸檔,那么就會造成檔案信息的丟失,從而降低了檔案的價值。同時,由于電子檔案的數(shù)據(jù)是處于動態(tài)變化中的,這樣也很難確定歸檔范圍。
當(dāng)前很多數(shù)據(jù)庫在研究電子文件的時候,分為兩種不同的方式。首先是整體論,這種方式是在整體的電子文件數(shù)據(jù)庫中挑選歸檔文件,但是其需要后臺管理系統(tǒng)做技術(shù)支撐。還有一種是分散論,就是對所有的數(shù)據(jù)進(jìn)行分析,找出需要管理保存的文件,然后再制定具體的管理辦法。這種方式是在管理系統(tǒng)的前臺進(jìn)行電子文件管理的,但是與整體論一樣都是選擇有價值的文件進(jìn)行歸檔處理。
3.2 歸檔方法的選擇
電子文件進(jìn)行歸檔的時候可以選擇物理歸檔,也可以選擇邏輯歸檔。其中邏輯歸檔不會對電子文件的存儲方式和位置進(jìn)行改變,只是將權(quán)限做了移交。但是物理歸檔時將電子文件從原有的系統(tǒng)中脫離出來,移交給專門的檔案管理部門。如果電子文件是保存在數(shù)據(jù)庫中的,那么進(jìn)行歸檔處理的時候就要考慮數(shù)據(jù)庫的安全、效率、規(guī)模以及類型等問題,因?yàn)閿?shù)據(jù)庫中的電子文件會隨著實(shí)際情況而發(fā)生變化。采取邏輯歸檔的方式,那么一旦業(yè)務(wù)系統(tǒng)遭到破壞,就會影響到電子文件,使得歸檔工作不能有效進(jìn)行。但是選擇物理歸檔的話,電子文件一旦離開數(shù)據(jù)庫就無法進(jìn)行讀取,因此也是應(yīng)該考慮到的問題。
3.3 電子文件的可讀性
電子文件從生成到保存都需要計(jì)算機(jī)系統(tǒng)作為技術(shù)支撐。但是電子文件在整個生命周期中對用戶都是不透明的,用戶操作的時候只能通過DBMS,但是DBMS的類型不同的話,那么電子文件之間也不能互操作,這樣電子文件對計(jì)算機(jī)系統(tǒng)的依賴程度比較高,管理起來也就比較困難。因此進(jìn)行歸檔的時候,不僅要保證電子文件的信息、背景以及內(nèi)容沒有缺失,還要保證電子文件在別的系統(tǒng)中仍然有可讀性。比較傳統(tǒng)的方式是將電子文件以及系統(tǒng)一起保存。但是這種方式需要對系統(tǒng)進(jìn)行專門的歸檔,同時當(dāng)出現(xiàn)新的系統(tǒng)時還要重新進(jìn)行歸檔,使得管理成本升高。因此應(yīng)該選擇更加科學(xué)的歸檔方式,不僅要保證電子文件的安全、完整以及真實(shí),同時還應(yīng)該降低對系統(tǒng)的依賴,使其在不同的系統(tǒng)中都能夠讀取。
3.4 電子文件的長期保存
當(dāng)電子文件歸檔后主要的目標(biāo)就是長期保存。因?yàn)閿?shù)據(jù)庫中的電子文件之間是相互聯(lián)系并且依賴系統(tǒng)的,因此不能選擇傳統(tǒng)的長期保存方式。進(jìn)行電子文件長期保存的時候,應(yīng)該考慮到所選擇的技術(shù)、管理以及相關(guān)政策等多方面的因素。但是由于我國的電子文件管理起步比較晚,因此相關(guān)的標(biāo)準(zhǔn)規(guī)范還不夠完善,同時相關(guān)的管理方式以及保存技術(shù)還比較落后,這樣導(dǎo)致在電子文件長期保存的時候沒有相應(yīng)的參考,也是一個難點(diǎn)問題。
4 電子文件歸檔與長期保存的技術(shù)路徑
4.1 技術(shù)總體方案
進(jìn)行電子文件歸檔與長期保存的時候,需要解決的問題比較多,比如不同類型DBMS的差異性、電子文件背景信息、結(jié)構(gòu)以及內(nèi)容的封裝、電子文檔長期保存的實(shí)現(xiàn)方式等。通過分析采用一些技術(shù)手段來解決上述的一些問題,首先是不同DBMS電子文件的歸檔,由ODBC提供統(tǒng)一的數(shù)據(jù)接口。對電子文件的信息內(nèi)容等進(jìn)行封裝的時候由DPT實(shí)現(xiàn),這種方式是以SIARD數(shù)據(jù)庫歸檔標(biāo)準(zhǔn)以及XML可擴(kuò)展標(biāo)記語言為基礎(chǔ)的,使得電子文件對系統(tǒng)的依賴性降低。進(jìn)行歸檔電子文件的長期保存的時候以信息包的形式流轉(zhuǎn)在各管理模塊中,而對歸檔的電子文件進(jìn)行歸檔的時候可以使用DVT。這樣通過各種技術(shù)可以解決電子文件歸檔和長期保存時遇到的各種難題。
4.2 集中歸檔時采取統(tǒng)一數(shù)據(jù)接口
目前市面上存在的數(shù)據(jù)管理系統(tǒng)比較多,不同類型甚至同一系統(tǒng)不同版本之間的電子文檔格式都是不同的,因此不同系統(tǒng)的文件不能互相操作。而ODBC則形成了一套標(biāo)準(zhǔn)的規(guī)范,其可以在數(shù)據(jù)系統(tǒng)與電子文件之間建立統(tǒng)一的接口,這樣就可以通過不同的系統(tǒng)對電子文件進(jìn)行讀取,也為電子文件的集中歸檔提供了方便。
4.3 基于XML開展數(shù)據(jù)封裝
數(shù)據(jù)庫在發(fā)展的過程中產(chǎn)生的數(shù)據(jù)模型比較多,比如對象模型、網(wǎng)狀模型以及層次模型等,但是這些數(shù)據(jù)模型對于系統(tǒng)的依賴程度比較高,歸檔的時候比較困難。而還有一種模型是關(guān)系數(shù)據(jù)模型,其數(shù)據(jù)結(jié)構(gòu)基礎(chǔ)是二維表,這樣就很好地解決了電子文檔對系統(tǒng)的依懶性問題。對這種數(shù)據(jù)模型的電子文件進(jìn)行保存的時候可以選擇將二維表轉(zhuǎn)化為XML格式,這樣使得電子文件比較容易讀取,因此目前很多數(shù)據(jù)庫都在使用這種模型。XML是W3C推薦的標(biāo)準(zhǔn),其特點(diǎn)是具有較高的靈活性以及可擴(kuò)展性,這樣用戶就能自定義標(biāo)簽格式,電子文檔就能在不同的管理系統(tǒng)中進(jìn)行操作。
4.4 基于OAIS進(jìn)行數(shù)據(jù)的長期保存
進(jìn)行電文文件的長期保存時使用OAIS技術(shù)能夠提供基本概念框架與參考模型,使得系統(tǒng)中的電子文件能夠長期的保存和讀取。OAIS中的參考模型有保存規(guī)劃模塊、存取模塊、數(shù)據(jù)管理模塊、檔案存儲模塊以及攝取模塊等,同時信息數(shù)據(jù)是以信息包的形式存在的,能夠在各模塊之間流轉(zhuǎn)。
對電子文件進(jìn)行保存的時候,首先應(yīng)該將其轉(zhuǎn)換為符合XML規(guī)范的SIARD文件,然后以數(shù)據(jù)包的形式進(jìn)入攝取模塊,對電子文檔的所有信息進(jìn)行檢驗(yàn),使其能夠符合封裝的標(biāo)準(zhǔn)。檔案存儲模塊能夠?qū)IP封裝為可以長期保存的AIP檔案信息,進(jìn)行封裝的時候要保證檔案的內(nèi)容是完整可靠的。
5 結(jié)語
隨著科學(xué)技術(shù)的不斷發(fā)展,電子文件的管理方式也越來越多。但是由于我國的電子文件管理起步比較晚,因此相關(guān)制度以及技術(shù)都比較落后。進(jìn)行電子文件歸檔和長期保存的時候,可以使用一些技術(shù)手段,比如XML、OAIS等。
【參考文獻(xiàn)】
【1】鄭秀玉. 試論電子文件歸檔方式和途徑的選擇[J]. 蘭臺內(nèi)外, 2006(5):43-43.