王宏卿
檔案數(shù)字化是隨著計算機(jī)技術(shù)、掃描技術(shù)、OCR技術(shù)、數(shù)字?jǐn)z影技術(shù)(錄音、錄像)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、存儲技術(shù)的發(fā)展而產(chǎn)生的一種新型檔案信息形態(tài),它把各種載體的檔案資源轉(zhuǎn)化為數(shù)字化的檔案信息,以數(shù)字化的形式存儲,網(wǎng)絡(luò)化的形式互相連接,利用計算機(jī)系統(tǒng)進(jìn)行管理,形成一個有序結(jié)構(gòu)的檔案信息庫,及時提供利用,實現(xiàn)資源共享。隨著時代進(jìn)步和科技發(fā)展,檔案數(shù)字化是今后一段時間內(nèi)檔案管理工作不可或缺的重要組成部分,此項工作周期長、任務(wù)重、要求嚴(yán),因此深入思考檔案數(shù)字化過程中存在的問題意義重大。筆者結(jié)合工作實踐,就檔案數(shù)字化工作中應(yīng)注意事項與大家進(jìn)行探討交流。
首先,掃描是數(shù)字化檔案的重要步驟。眾所周知,掃描是紙質(zhì)檔案數(shù)字化中的關(guān)鍵環(huán)節(jié),掃描工作的好壞影響著整個數(shù)字化工作的質(zhì)量。
就硬件而言,在信息采集設(shè)備中,一般的掃描儀只能掃描有限幾種類型的紙張,如A3、A4或更小的紙張,而實際工作中存在一些紙張較大的檔案資料,普通掃描儀滿足不了相關(guān)需求,會導(dǎo)致掃描件成像不全。而信息存儲設(shè)備則要求更高,設(shè)備的運行速度、容量以及成像像素都影響著紙質(zhì)檔案掃描后的質(zhì)量。信息提取設(shè)備配備的不足,會影響和局限數(shù)字檔案的利用,使得部分?jǐn)?shù)字化后的檔案無法提取和識別。
就軟件而言,操作系統(tǒng)的不統(tǒng)一,很容易造成規(guī)范性、服務(wù)性、共享性的不統(tǒng)一。
就成本而言,經(jīng)濟(jì)成本偏高,非一般單位所能承受,如設(shè)備的購置、維修、維護(hù)及耗材的定期更換,人員的定期業(yè)務(wù)培訓(xùn),專業(yè)掃描公司的聘用等。時間成本過大,影響紙質(zhì)檔案掃描時間的因素有很多,如硬件設(shè)備、軟件設(shè)備、人員操作熟練程度等。
就操作人員而言,需要其具有相關(guān)的專業(yè)知識,做好檔案整理、掃描準(zhǔn)備、正式掃描、圖像處理等工作,要分工清楚,責(zé)任明確,專人專類或?qū)H藢>怼嵤n案數(shù)字化的過程中,須對原有檔案進(jìn)行撤架、拆封、編號、標(biāo)記等一系列的處理工作,在此過程中如有操作不當(dāng)會對原件造成損壞。掃描前,檔案原件必須完整、排序正確,要整理好需要掃描的各類檔案目錄,對所有檔案按要求編制統(tǒng)一規(guī)范的檔號,并確定相關(guān)的字段名和字段類型,避免造成卷目混亂和損害。在拆除原檔案裝訂時,要注意保護(hù)檔案原件,對折損嚴(yán)重影響掃描質(zhì)量的原件要按規(guī)定預(yù)先修整。對模糊不清的檔案進(jìn)行特殊處理,確保檔案數(shù)字化質(zhì)量。檔案形成于不同年代,載體、字跡復(fù)雜多樣,字跡清晰度和紙張質(zhì)量差異很大,印章的色差也不同,所以在掃描前要根據(jù)檔案的具體狀況,適當(dāng)進(jìn)行整理,視需要進(jìn)行登記或做出標(biāo)識,在登記標(biāo)注時不易字體偏大過重,尤其是脆弱紙張要小心處理。掃描前整理的不規(guī)范會直接影響掃描的速度和質(zhì)量,造成漏掃、重復(fù)掃描甚至損壞原件,減少原件的憑證價值和歷史價值。
正式掃描中操作人員要經(jīng)常檢查、解決、協(xié)調(diào)掃描過程中出現(xiàn)的各種問題。如檔案目錄錄入時可能存在錯誤情況,需要仔細(xì)核對。對字跡模糊不清的檔案,需記錄下來單獨處理,掃描時,避免對檔案原件壓制用力,翻頁動作要輕,幅度要小,不要盲目追求速度,忽視質(zhì)量。而相應(yīng)參數(shù)設(shè)定的不規(guī)范性也會影響錄入圖像的清晰度。在參數(shù)設(shè)置問題上,雖然國家和地方出臺了相關(guān)的標(biāo)準(zhǔn)和條例,但也只是給出了原則性的規(guī)定,是粗線條的,籠統(tǒng)的,這就需要操作人員主觀判斷,根據(jù)實際情況做出適當(dāng)?shù)恼{(diào)整,做到因件而異,“量體裁衣”。
掃描后,要對圖像質(zhì)量進(jìn)行檢查,減少掃描件混亂、缺失、失真等情況的發(fā)生,如紙張較大的檔案需掃描多次再經(jīng)后期處理合成,批量處理的檔案會造成少數(shù)掃描件失真,后期處理不當(dāng)會導(dǎo)致掃描件與原件對比時發(fā)生遺漏和缺失,發(fā)現(xiàn)不符合要求的,要進(jìn)行再處理,如去掉掃描紙張中明顯的裝訂孔、文件中明顯的污垢等。掃描后的文件圖像應(yīng)保持檔案的原貌,字跡清楚不失真,無錯掃、漏掃,對文件圖像質(zhì)量有問題的應(yīng)重新掃描。
其次,是檔案數(shù)字化后的安全管理。現(xiàn)在對于普通的紙質(zhì)檔案,我們已經(jīng)有了非常成熟的管理制度和技術(shù),對于檔案的調(diào)閱也有著嚴(yán)格的審批制度,在選址、防火、防盜等方面也有相應(yīng)的措施來保障文件檔案的安全。但對于數(shù)字檔案,還沒有詳細(xì)的、操作性強(qiáng)的安全管理制度。這就需要檔案管理者不斷適應(yīng)計算機(jī)技術(shù)的發(fā)展,打破原來傳統(tǒng)的模式,運用新的科學(xué)技術(shù)進(jìn)行管理,創(chuàng)新思維、技術(shù)來適應(yīng)新的社會檔案管理的需要。面對大量產(chǎn)生的電子文件和照片、音頻、視頻等以數(shù)字為載體的聲像檔案,管理人員往往會在不經(jīng)意間造成數(shù)字檔案管理的漏洞,形成安全隱患。另外,計算機(jī)技術(shù)發(fā)展迅速也是造成各種攻擊以及破壞手段層出不窮的因素,數(shù)字檔案的安全包括網(wǎng)絡(luò)、系統(tǒng)、信息、物理等方面,因此,日益增加的數(shù)字檔案管理是有很多環(huán)節(jié)容易出現(xiàn)問題的。綜上所述,數(shù)字化檔案信息,保證信息載體的可靠性、安全性,已經(jīng)成為所有檔案管理者必須首要解決的問題。這就意味著數(shù)字檔案管理在主機(jī)服務(wù)器、存儲設(shè)備、系統(tǒng)軟件、硬件等基礎(chǔ)安全、網(wǎng)絡(luò)安全及操作人員管理的安全等方面都要具有很高的安全保證、管理及防范措施。
就基礎(chǔ)安全而言,主要是指涉及到系統(tǒng)存貯的檔案數(shù)據(jù)的安全問題,包括硬盤、操作系統(tǒng)、數(shù)據(jù)庫管理系統(tǒng)、數(shù)據(jù)存貯和備份、數(shù)據(jù)格式的轉(zhuǎn)換以及各類電子文件的保管和異地存貯策略等。硬件的損壞,軟件的故障這兩大因素會給系統(tǒng)中的檔案數(shù)據(jù)帶來威脅。這就需要管理人員在選擇硬件時充分考慮到硬件的品牌、可擴(kuò)展性、兼容性以及軟件的可靠性和可恢復(fù)性。防止由于硬件的升級、硬件設(shè)備的意外損壞、數(shù)據(jù)版本的更新、數(shù)據(jù)格式的轉(zhuǎn)換、存貯介質(zhì)的老化、失效等造成的數(shù)據(jù)丟失、數(shù)據(jù)損壞甚至是計算機(jī)系統(tǒng)的破壞和癱瘓等情況的發(fā)生。
選擇什么樣的操作系統(tǒng)來確保應(yīng)用系統(tǒng)的安裝和運行呢?目前主流的操作系統(tǒng)有Windows、MACOS X和Linux,在操作性能和安全性能方面各有優(yōu)缺點,關(guān)鍵是如何選擇滿足用戶實際需求的操作系統(tǒng)和數(shù)據(jù)庫管理系統(tǒng)。尤其是基于Windows XP的數(shù)字化檔案系統(tǒng),今后的系統(tǒng)升級和安全維護(hù)是檔案安全管理的重點,需要盡快找到妥善的解決辦法。系統(tǒng)的主要設(shè)備、軟件、數(shù)據(jù)、電源等應(yīng)有備份,并有技術(shù)和組織措施,能在較短時間內(nèi)恢復(fù)系統(tǒng)運行。服務(wù)器的UPS電源要保證在停電后10小時內(nèi)仍能保持正常工作,保證電源穩(wěn)定和雙路供電,并對相關(guān)設(shè)備進(jìn)行安全接地,定期進(jìn)行軟件更新升級、系統(tǒng)漏洞掃描,及時安裝補(bǔ)丁程序。對檔案數(shù)據(jù)要自動、定期備份,定期檢查,不僅要做好本地數(shù)據(jù)備份,還要根據(jù)現(xiàn)有條件做好數(shù)據(jù)異地備份,妥善保存?zhèn)浞萦涗?,只有這樣才能有效預(yù)防突發(fā)的各類狀況,確保數(shù)字檔案信息萬無一失。
就網(wǎng)絡(luò)安全而言,主要以技術(shù)手段進(jìn)行約束。如:將信息內(nèi)網(wǎng)和互聯(lián)網(wǎng)進(jìn)行物理隔離,設(shè)立雙網(wǎng)防火墻,在內(nèi)部網(wǎng)和公共網(wǎng)絡(luò)之間建立一個安全網(wǎng)關(guān),保護(hù)私有網(wǎng)絡(luò)資源免遭其他網(wǎng)絡(luò)使用者的擅用和入侵。對IP地址和計算機(jī)進(jìn)行綁定,保護(hù)網(wǎng)絡(luò)不從內(nèi)部被攻擊,即使是內(nèi)部攻擊也能及時找到相對應(yīng)的設(shè)備,給予反制措施。設(shè)立身份認(rèn)證、修改權(quán)限、訪問權(quán)限和訪問模式,用身份認(rèn)證的形式來確認(rèn)訪問的合法性,通過可靠的身份認(rèn)證確定用戶身份,再通過網(wǎng)絡(luò)訪問控制系統(tǒng)設(shè)置網(wǎng)絡(luò)訪問規(guī)則,有效保護(hù)內(nèi)部檔案資料,防止信息外泄。修改權(quán)限只限定指定的檔案工作者擁有,而訪問權(quán)則指定有該權(quán)限的用戶擁有。建立訪問日志,對網(wǎng)絡(luò)活動進(jìn)行審計和監(jiān)測。必要時對重要檔案進(jìn)行分級加密,根據(jù)組織或職務(wù)級別設(shè)立查看檔案的密級程度。定期更換口令,防止口令外泄。在用戶終端安裝防病毒軟件,防止數(shù)字化檔案系統(tǒng)感染病毒,造成巨大損失。
就操作人員的管理安全而言,要采取嚴(yán)格有效的管理措施。要不斷建立和完善數(shù)字化檔案安全的管理制度,對存在不足或需要改進(jìn)的制度及時進(jìn)行修訂,做到有“法”可依,違“法”必懲。要加強(qiáng)人員安全管理,明確安全責(zé)任,建立專人負(fù)責(zé)制,及時終止離崗人員的訪問和修改權(quán)限,做到內(nèi)部嚴(yán)密控制。要建立檔案工作應(yīng)急預(yù)案,定期演練,加強(qiáng)員工安全培訓(xùn),不斷提高員工安全意識。
檔案數(shù)字化是信息化時代對檔案管理的挑戰(zhàn),也是檔案管理的機(jī)遇,既具有存儲、檢索便捷,傳輸快速,信息共享等優(yōu)點,是傳統(tǒng)紙質(zhì)檔案望塵莫及的,也不可避免地存在一些缺陷和不足,我們只有清醒地認(rèn)識到這些問題,才能理解檔案數(shù)字化建設(shè)還有諸多難題亟待我們深入研究解決,否則將給未來的檔案事業(yè)留下很多缺憾。
(作者單位:河北港口集團(tuán)有限公司)endprint