肖鍵敏
摘 要:隨著科學(xué)技術(shù)的發(fā)展,我們所處的信息化時(shí)代,決定了檔案管理工作也正在向電子化、網(wǎng)絡(luò)化方面邁進(jìn)。信息技術(shù)為檔案管理提供了便利,也帶來了一定的困難和挑戰(zhàn)。本文將從學(xué)校的角度出發(fā),解析學(xué)校檔案管理在網(wǎng)絡(luò)環(huán)境下存在的問題,探討OCR技術(shù)如何有效加速實(shí)現(xiàn)紙質(zhì)文檔電子化,思考學(xué)校檔案的電子化管理的方法,從而提高學(xué)校檔案的利用率,讓學(xué)校檔案資料發(fā)揮其應(yīng)有的作用。
關(guān)鍵詞:檔案信息;電子化;OCR技術(shù)
1 檔案信息電子化基本現(xiàn)狀
1)缺乏通用性信息管理功能的檔案軟件。目前,多數(shù)基層檔案館(室)對計(jì)算機(jī)的應(yīng)用單一,開發(fā)功能簡單,使現(xiàn)代化設(shè)備不能盡其用,檔案部門各自開發(fā)的軟件不能互用,這制約了檔案信息電子化的進(jìn)程。
2)標(biāo)準(zhǔn)化、規(guī)范化工作有待提高。檔案信息管理電子化的前提是基礎(chǔ)工作的規(guī)范化和標(biāo)準(zhǔn)化。但由于多種原因,目前檔案業(yè)務(wù)基礎(chǔ)差,案卷質(zhì)量不高,特別是各類檔案的著錄細(xì)則相容性不強(qiáng),系統(tǒng)軟件移植性差;檔案自動(dòng)化工作尚無統(tǒng)一標(biāo)準(zhǔn)。
3)檔案信息管理人員素質(zhì)尚需提高。實(shí)現(xiàn)檔案信息電子化,要求管理人員有較高的知識層次和先進(jìn)技術(shù)水平,不能僅僅滿足于一般的計(jì)算機(jī)操作。目前,許多檔案部門缺乏現(xiàn)代高技術(shù)人才,其中檔案、信息處理復(fù)合型人才就更奇缺,大部分檔案人員現(xiàn)代技術(shù)水平偏低。盡管引進(jìn)了現(xiàn)代化設(shè)備,仍不能充分發(fā)揮作用,就談不上檔案信息電子化了。
2 檔案信息化建設(shè)的風(fēng)險(xiǎn)識別
檔案信息化在給人們帶來方便快捷的同時(shí),也給人們帶來了不少擔(dān)憂:1)信息安全問題,2)知識產(chǎn)權(quán)問題。這些問題的產(chǎn)生,在一定程度上阻礙了檔案信息化工作的順利進(jìn)展。目前,用于解決上述問題的對策除了技術(shù)以外,也有很多學(xué)者呼吁應(yīng)盡快出臺關(guān)于檔案信息化的法規(guī)、政策和標(biāo)準(zhǔn)。但問題是,技術(shù)本身就是一把雙刃劍。問題主要不在于技術(shù),而在于人性。我們看到,復(fù)制技術(shù)既可用于信息共享,也可用于侵犯他人知識產(chǎn)權(quán);過濾技術(shù)既可用于自律,也可用于搜集他人的隱私信息;加密技術(shù)既可用于信息安全防范,也可被恐怖分子和極端民族主義分子用于秘密通信,從事破壞和顛覆國家政權(quán)的犯罪活動(dòng)。
1)數(shù)字檔案信息對計(jì)算機(jī)設(shè)備的依賴性。數(shù)字檔案信息從傳輸、存儲到顯示都是通過計(jì)算機(jī)實(shí)現(xiàn)的,計(jì)算機(jī)是生成數(shù)字檔案信息的前提和基礎(chǔ),離開了計(jì)算機(jī)的軟硬件條件,人工不可能將數(shù)字檔案信息存儲到存儲介質(zhì)上,也不可能識別存儲在存儲介質(zhì)上的數(shù)字檔案信息。因此數(shù)字檔案信息對計(jì)算機(jī)及其相關(guān)設(shè)備具有絕對的依賴性。
2)數(shù)字檔案信息的不安全性。除了數(shù)字檔案信息對計(jì)算機(jī)設(shè)備的極強(qiáng)依賴性之外,處在系統(tǒng)網(wǎng)絡(luò)中的數(shù)字檔案信息表現(xiàn)出的不安全性十分明顯。網(wǎng)絡(luò)安全的薄弱性是不可忽視的。計(jì)算機(jī)網(wǎng)絡(luò)系統(tǒng)并不安全,有時(shí)會出現(xiàn)某些隱患,從而使數(shù)字檔案信息化為烏有。另外計(jì)算機(jī)病毒的威脅、黑客攻擊、誤操作、信息失真等因素都會造成數(shù)字檔案信息丟失的問題,帶來難以估量的損失。這些都意味著確保數(shù)字檔案信息的保密性、完整性、真實(shí)性和可用性極富挑戰(zhàn)意義。
3)數(shù)字檔案信息對標(biāo)準(zhǔn)的依賴性。在數(shù)字檔案信息的形成與管理中使用標(biāo)準(zhǔn),有助于數(shù)字檔案信息在存取與保存時(shí)的完整性。標(biāo)準(zhǔn)的使用不僅有利于數(shù)字檔案信息的科學(xué)管理,同時(shí),遵守與使用標(biāo)準(zhǔn)還便于數(shù)字檔案信息隨技術(shù)的發(fā)展在新、舊數(shù)字平臺間轉(zhuǎn)換,這將直接降低保存數(shù)字檔案信息的費(fèi)用。因?yàn)椋S著技術(shù)的發(fā)展,數(shù)字檔案信息在新、舊數(shù)字平臺間的轉(zhuǎn)換是通過不同的標(biāo)準(zhǔn)與規(guī)范進(jìn)行的,如果數(shù)字檔案信息按標(biāo)準(zhǔn)進(jìn)行管理,就會降低數(shù)據(jù)格式變換的頻率。格式變換、數(shù)據(jù)遷移的頻率降低,所需的費(fèi)用自然就降低了。
同時(shí),數(shù)字檔案信息還存在數(shù)據(jù)的巨大性、存儲格式的多樣性等特點(diǎn)。
3 OCR技術(shù)有效加速實(shí)現(xiàn)紙質(zhì)文檔電子化
偶然在網(wǎng)上找了一篇實(shí)用文檔,想要復(fù)制保存下來,結(jié)果卻發(fā)現(xiàn)網(wǎng)頁進(jìn)行了限制,面對密密麻麻的文字信息,難道要一個(gè)字一個(gè)字的敲上去嗎?如果沒有OCR,大概會有不少人這么干。
OCR是一種將圖像中的文字轉(zhuǎn)換成可編輯的文本格式的技術(shù),簡單來說,將你無法復(fù)制保存的文檔拍下來,通過文檔識別軟件進(jìn)行識別,獲得可編輯可保存的電子文檔。
3.1 OCR技術(shù)有效加速實(shí)現(xiàn)紙質(zhì)文檔電子化
云脈文檔識別內(nèi)置成熟的OCR技術(shù),加速實(shí)現(xiàn)紙質(zhì)文檔電子化。相比一個(gè)字一個(gè)字的錄入,這種批量識別存儲的方法不僅提高了紙質(zhì)文件信息電子化速度,更是提高了檔案錄入的準(zhǔn)確性。
紙質(zhì)文檔管理系統(tǒng)的投入,不僅可以優(yōu)化電子化工作流程提升員工工作效率,更有效減少電子化過程中所造成的人力、物力的浪費(fèi)。
3.2 紙質(zhì)文檔管理助力檔案資源價(jià)值發(fā)揮
建立電子檔案乃大勢所趨,不說當(dāng)代信息依托互聯(lián)網(wǎng)傳播,就從信息保存角度來講,和書柜、紙箱之類的存儲容器相比,云盤存儲更現(xiàn)代也更安全。
紙質(zhì)文件受存儲媒介和存儲環(huán)境影響,容易出現(xiàn)蛀蟲、焚毀、損壞、字跡模糊等問題,收發(fā)不易,保存困難,查閱更是不便,文檔利用率低,根本無法充分發(fā)揮檔案資源應(yīng)有的價(jià)值。
云脈紙質(zhì)文檔管理系統(tǒng)可以將識別文件和識別結(jié)果保存在云端,同時(shí)內(nèi)置關(guān)鍵字檢索功能,用戶可以通過文件名、關(guān)鍵字、日期等方式快速查詢到相關(guān)文件,相比較起在扎堆的文件堆里找一份資料,現(xiàn)代化式的檢索方法更得年輕一代的認(rèn)可。
3.3 及時(shí)更新文件動(dòng)態(tài)設(shè)置權(quán)限安全分享
文檔電子化為了更好地實(shí)現(xiàn)信息存儲和利用。在云脈紙質(zhì)文檔管理系統(tǒng)中檢索到的文件可以通過在線傳送、設(shè)置瀏覽權(quán)限等方式進(jìn)行分享。傳統(tǒng)的紙質(zhì)檔案更新不便,不能及時(shí)反映當(dāng)前情況,而通過建設(shè)數(shù)字化檔案,能夠快速及時(shí)地更新檔案資料,讓相關(guān)人員隨時(shí)了解動(dòng)態(tài)。
目前云脈紙質(zhì)文檔管理系統(tǒng)被廣泛應(yīng)用于企事業(yè)單位大量紙質(zhì)材料的電子化管理,如檔案局、圖書館、政府機(jī)構(gòu)、金融保險(xiǎn)等領(lǐng)域。為現(xiàn)代無紙化辦公提供高效服務(wù),推進(jìn)文件信息電子化。
4 解決好電子文件歸檔工作才能真正實(shí)現(xiàn)檔案電子化
電子文件歸檔方式和途徑的選擇。紙質(zhì)檔案的載體較為穩(wěn)定安全,而電子文件的載體穩(wěn)定性差,易損壞,因此歸檔方式的選擇至關(guān)重要。經(jīng)實(shí)踐檢驗(yàn),利用磁盤,脫機(jī)采集數(shù)據(jù)的介質(zhì)移交方式容易造成數(shù)據(jù)丟失。如遇質(zhì)量較差的磁盤,會影響文件的可讀性。為防止數(shù)據(jù)丟失需制作多份備份盤存檔,這不僅加大了工作量,也增加了存貯磁盤的數(shù)量,簡便而安全的方式是采用網(wǎng)絡(luò)移交歸檔,并利用光盤存貯。
無論利用何種途徑歸檔,必須由電子文件形成單位按統(tǒng)一格式編目整理后,傳輸給檔案部門,不能由檔案部門自行從網(wǎng)上下載,以保證電子文件形成部門對其數(shù)據(jù)的真實(shí)性、準(zhǔn)確性負(fù)責(zé)。檔案部門接收的電子文件一律應(yīng)存入光盤,最好不用磁盤存貯。
5 結(jié)束語
隨著電子網(wǎng)絡(luò)技術(shù)的不斷發(fā)展,學(xué)校檔案電子化管理必將產(chǎn)生新的問題,尋求新的思路。因此,作為檔案管理者,要不斷加強(qiáng)自身業(yè)務(wù)學(xué)習(xí),與時(shí)俱進(jìn),在應(yīng)用中發(fā)現(xiàn)問題,在思考中解決問題,將學(xué)校檔案電子化管理推向新的高度。
參考文獻(xiàn)
[1]紀(jì)鐵利.有關(guān)檔案電子化管理的幾點(diǎn)思考[J].計(jì)算機(jī)光盤軟件與應(yīng)用,2012.
[2]于柏云.淺議信息時(shí)代的檔案電子化管理[J].蘭臺世界,2012.
[3]趙戈.信息時(shí)代的檔案電子化管理初探[J].北京檔案,2010.