王調(diào)江
摘 要:隨著信息時(shí)代的到來,檔案數(shù)字化建設(shè)已經(jīng)成為檔案管理的必然發(fā)展趨勢(shì)。本文對(duì)南京工程學(xué)院紙質(zhì)檔案數(shù)字化建設(shè)中遇到的問題及應(yīng)對(duì)措施進(jìn)行了討論,以期為其他高校紙質(zhì)檔案數(shù)字化建設(shè)提供參考和借鑒。
關(guān)鍵詞:南京工程學(xué)院;紙質(zhì)檔案數(shù)字化;實(shí)踐;思考
隨著計(jì)算機(jī)技術(shù)、掃描技術(shù)、掃描矩陣CCD技術(shù)、OCR技術(shù)、數(shù)字?jǐn)z影技術(shù)、數(shù)據(jù)庫技術(shù)、多媒體技術(shù)、存儲(chǔ)技術(shù)等現(xiàn)代信息技術(shù)的發(fā)展,檔案信息利用服務(wù)的網(wǎng)絡(luò)化、遠(yuǎn)程化成為新形勢(shì)下檔案利用的一種新方式,人們更加重視檔案信息資源的開發(fā)利用。早在2000年12月,國家檔案局、中央檔案館就將“加快檔案信息化建設(shè)”“加快檔案數(shù)字化進(jìn)程”列入《全國檔案事業(yè)發(fā)展“十五”規(guī)劃》中。同月,國家檔案局又在中國檔案管理現(xiàn)代化建設(shè)研討會(huì)上宣布:十五期間,我國將加快數(shù)字化檔案館的建設(shè)。
紙質(zhì)檔案數(shù)字化就是采用掃描儀等設(shè)備對(duì)紙質(zhì)檔案進(jìn)行數(shù)字化加工,使其轉(zhuǎn)化為存儲(chǔ)在磁帶、磁盤、光盤等載體上的數(shù)字圖像,并按照紙質(zhì)檔案的內(nèi)在聯(lián)系,建立起目錄數(shù)據(jù)與數(shù)字圖像關(guān)聯(lián)關(guān)系的處理過程(《DA/T31-2017紙質(zhì)檔案數(shù)字化規(guī)范》)。紙質(zhì)檔案數(shù)字化建設(shè)是信息社會(huì)的要求,它有效地保護(hù)了檔案原件,方便了檔案的查閱,極大地提高了工作效率。
一、我校紙質(zhì)檔案數(shù)字化工作基本情況
我校紙質(zhì)檔案數(shù)字化建設(shè)起步較晚,2013年才正式開始啟動(dòng),剛開始的時(shí)候兩年開展一次,通過對(duì)外公開招標(biāo)方式進(jìn)行紙質(zhì)檔案數(shù)字化加工。2017年起,紙質(zhì)檔案數(shù)字化工作納入學(xué)校每年的檔案工作計(jì)劃,采用對(duì)外公開招標(biāo)和檔案館自己加工相結(jié)合的方式,每年新歸檔的新生錄取名冊(cè)、畢業(yè)生成績(jī)單、學(xué)籍卡、畢業(yè)生驗(yàn)印名冊(cè)、學(xué)位授予名冊(cè)等由檔案館工作人員自己加工處理,其余的仍然采用對(duì)外公開招標(biāo)方式。
我校非常重視紙質(zhì)檔案數(shù)字化工作,成立了由檔案館館長(zhǎng)牽頭、檔案館全體工作人員參與的紙質(zhì)檔案數(shù)字化工作小組,檔案一室(主要負(fù)責(zé)紙質(zhì)檔案和實(shí)物檔案)負(fù)責(zé)提供需要數(shù)字化的紙質(zhì)檔案清單,檔案二室(主要負(fù)責(zé)電子檔案和網(wǎng)絡(luò)管理)負(fù)責(zé)紙質(zhì)檔案數(shù)字化項(xiàng)目的招標(biāo)和組織實(shí)施、協(xié)調(diào)管理。檔案館全體工作人員分工協(xié)作,每人負(fù)責(zé)幾個(gè)檔案門類,從確定當(dāng)年紙質(zhì)檔案數(shù)字化的范圍,到圖片掃描質(zhì)量和數(shù)據(jù)掛接準(zhǔn)確率的檢查,全程跟進(jìn)。歷年來,我校已完成紙質(zhì)檔案數(shù)字化10000余卷?,F(xiàn)就我校在紙質(zhì)檔案數(shù)字化前處理、目錄數(shù)據(jù)庫建立、檔案掃描、圖像處理、數(shù)據(jù)掛接、數(shù)字化成果驗(yàn)收與移交等基本環(huán)節(jié)中遇到的問題和大家進(jìn)行交流、討論,希望集思廣益,總結(jié)經(jīng)驗(yàn),讓其他檔案人在做紙質(zhì)檔案數(shù)字化時(shí)少走些彎路。
二、我校紙質(zhì)檔案數(shù)字化過程中遇到的問題與對(duì)策
正式啟動(dòng)紙質(zhì)檔案數(shù)字化工作前,我校更新了檔案管理軟件,并就紙質(zhì)檔案數(shù)字化工作進(jìn)行了專項(xiàng)調(diào)研,但紙上得來終覺淺,實(shí)際操作起來困難要多得多,只能是摸著石頭過河。
1.檔案工作經(jīng)費(fèi)有限,專項(xiàng)經(jīng)費(fèi)投入不足,檔案數(shù)字化建設(shè)人才缺乏
檔案數(shù)字化建設(shè)投入的資金不足,人才缺乏,導(dǎo)致檔案數(shù)字化工作起步艱難,這是很多基層檔案部門面臨的共性問題?!昂娩撘迷诘度猩稀薄榱俗層邢薜慕?jīng)費(fèi)發(fā)揮最大的作用,我們根據(jù)檔案的利用率、亟待搶救程度、珍貴程度統(tǒng)籌規(guī)劃,確定了分階段開展紙質(zhì)檔案數(shù)字化工作的原則。首先是歷年新生錄取名冊(cè)、畢業(yè)生成績(jī)單、學(xué)籍卡、畢業(yè)生驗(yàn)印名冊(cè)、學(xué)位授予名冊(cè)等,這一部分檔案是日常工作中利用率最高的。其次是建國前的老檔案,我校館藏中有不少新中國成立前的老檔案,這一部分檔案由于年代久遠(yuǎn),紙質(zhì)已經(jīng)發(fā)黃發(fā)脆,使用檔案原件會(huì)加劇檔案的破損,亟待盡快搶救。再接下來是教職工人事任免、職稱評(píng)定、表彰獎(jiǎng)勵(lì)和科研項(xiàng)目等,每年職稱評(píng)審的時(shí)候,都會(huì)有很多老師前來查詢。最后是其他檔案,按照年度由近往前推,依次進(jìn)行數(shù)字化掃描。
2.數(shù)字化前的準(zhǔn)備工作
紙質(zhì)檔案數(shù)字化過程中,經(jīng)常遇到案卷內(nèi)目錄與文件內(nèi)容不相符的情況,尤其是老檔案,經(jīng)常出現(xiàn)題目擬寫不全、頁碼漏編、漏文件等情況,因此一定要做好數(shù)字化前的準(zhǔn)備工作。
首先要確定哪些案卷需要數(shù)字化,對(duì)需要數(shù)字化的案卷最好先檢查一遍,看看頁碼編寫有無錯(cuò)誤,卷內(nèi)文件目錄與文件內(nèi)容相不相符。頁碼編寫錯(cuò)誤或者漏編的要重新編寫;對(duì)有文件而沒有目錄的要補(bǔ)充目錄;對(duì)有目錄而沒有文件或者檔案有所缺失、缺頁的,要如實(shí)填寫《館藏檔案卷內(nèi)文件材料登記備查表》,經(jīng)檔案館和立卷歸檔部門相關(guān)人員認(rèn)可簽字。在掃描時(shí)將《備查表》掃描在所缺內(nèi)容位置,這樣在查閱該卷檔案時(shí),其缺失、不完整等情況就一目了然。
其次對(duì)于涉密檔案,要求在數(shù)字化前對(duì)檔案全宗進(jìn)行摸底,由館長(zhǎng)和部門保密員共同確定涉密案卷并進(jìn)行詳細(xì)登記,如上級(jí)單位下發(fā)的具有保密性質(zhì)的文件和學(xué)校管理過程中產(chǎn)生的涉密文件等。出于涉密信息安全考慮,我校暫未對(duì)涉密紙質(zhì)檔案進(jìn)行數(shù)字化,如確實(shí)需要數(shù)字化,待條件成熟時(shí)由檔案館自己來進(jìn)行。
3.紙質(zhì)檔案數(shù)字化時(shí)掃描頁的確定
我校剛開始紙質(zhì)檔案數(shù)字化時(shí),不少檔案都是挑掃的,這雖然在一定程度上緩解了當(dāng)時(shí)經(jīng)費(fèi)緊張的壓力,但也留下了很多遺留問題。一是數(shù)字化加工從業(yè)人員對(duì)區(qū)分和剔除掃描或不掃描文件的界定能力有限,經(jīng)常是該掃描的沒有掃,不需要掃描的又掃了。二是時(shí)間長(zhǎng)了,檔案館工作人員也不一定記得哪些掃描了,哪些沒有掃描,以后想再補(bǔ)做數(shù)字化時(shí)只能整卷重掃,反而造成人力、物力、財(cái)力等資源浪費(fèi)。三是從長(zhǎng)遠(yuǎn)發(fā)展要求來看,建設(shè)數(shù)字檔案館對(duì)檔案的整體數(shù)字化程度有明確的要求,“東一榔頭西一棒子”,不如步步為營(yíng),久久為功,一次少做點(diǎn),但一次做全、做好。因此原則上應(yīng)將確定為數(shù)字化對(duì)象的紙質(zhì)檔案全部掃描,不宜進(jìn)行挑掃,如確有不需要掃描的頁面應(yīng)加以標(biāo)注。
掃描時(shí)一般只掃描原文,但在實(shí)際工作中,我們發(fā)現(xiàn),案卷的卷皮和備考表有時(shí)也有一定的信息量,這一類卷皮和備考表最好掃描。卷內(nèi)文件目錄也最好掃描,便于數(shù)字化圖片合成PDF時(shí)參考頁號(hào)起止。
近年來,隨著大家檔案意識(shí)的提高及管理的規(guī)范化,許多兼職檔案員在立卷錄入時(shí)就上傳了對(duì)應(yīng)的WORD、EXCEL電子文件,有的人認(rèn)為紙質(zhì)檔案數(shù)字化時(shí)這一部分檔案不需要掃描了,再次掃描是浪費(fèi)時(shí)間。但我們認(rèn)為WORD、EXCEL文件容易更改,而且很多時(shí)候這種電子文件是沒有加蓋公章或電子簽章的,不能作為電子檔案存儲(chǔ),必須重新掃描。
4.歷史檔案案卷目錄和卷內(nèi)文件目錄的著錄
歷史檔案案卷目錄和卷內(nèi)文件目錄中很多是手寫的,有的是繁體,有的是簡(jiǎn)寫,有的是草書,有的是自創(chuàng)體,總之是五花八門,在寫的過程中,一筆畫的增減,一個(gè)字的有無,都影響到檔案內(nèi)容的真實(shí)。紙質(zhì)檔案數(shù)字化加工公司從業(yè)人員文化程度普遍偏低,經(jīng)過系統(tǒng)檔案專業(yè)教育的人員很少,有的人甚至沒有接受過任何培訓(xùn)就直接上崗,加上有的人責(zé)任心不強(qiáng),難免在實(shí)際著錄工作中出現(xiàn)差錯(cuò)。對(duì)這一類手寫的歷史檔案目錄,我校采取組織檔案館工作人員集中著錄的方式,著錄人員遇到潦草難辨的手寫體或者繁、簡(jiǎn)寫字時(shí)第一時(shí)間跟其他工作人員一起辨認(rèn),如還不能確認(rèn),再向退休老教師和寫草書的書法愛好者請(qǐng)教。這樣一方面可以保證著錄的正確率,另一方面也可以大大節(jié)約紙質(zhì)檔案數(shù)字化經(jīng)費(fèi)。
5.涉及人名的紙質(zhì)檔案數(shù)字化
有關(guān)學(xué)生的新生錄取名冊(cè)、畢業(yè)生成績(jī)單、學(xué)籍卡、畢業(yè)生驗(yàn)印名冊(cè)、學(xué)位授予名冊(cè)等,要求掛接到人,一張新生錄取名冊(cè)上所有的新生名字都關(guān)聯(lián)同一張數(shù)字化圖片,輸入“張三”,有關(guān)“張三”的新生錄取名冊(cè)、畢業(yè)生成績(jī)單、學(xué)籍卡、畢業(yè)生驗(yàn)印名冊(cè)、學(xué)位授予名冊(cè)等都能一次查詢出來并可以選擇性地進(jìn)行打印。有關(guān)教師人事任免、職稱評(píng)定、表彰獎(jiǎng)勵(lì)、科研項(xiàng)目等涉及個(gè)人切身利益的文件材料,我們要求數(shù)字化加工公司在文件標(biāo)題內(nèi)錄入所有相關(guān)人員名字。
6.紙質(zhì)檔案數(shù)字化時(shí)是否拆卷
紙質(zhì)檔案數(shù)字化時(shí)是否進(jìn)行拆卷,拆卷后是否需要重新裝訂的問題,從檔案保護(hù)的角度考慮,反復(fù)裝訂本身就會(huì)對(duì)檔案有破壞,加上操作人員的熟練程度和責(zé)任心問題,很難做到在原來打孔或者裝訂的位置進(jìn)行裝訂,一定程度上會(huì)影響到檔案壽命。但從掃描圖片質(zhì)量來說,拆卷后進(jìn)行掃描質(zhì)量要比不拆卷好很多,特別是對(duì)于一些裝訂線和內(nèi)容很接近的文件,不拆卷的話很難把內(nèi)容掃描完整。另外,拆卷后如果發(fā)現(xiàn)卷內(nèi)有頁碼編錯(cuò)或者漏編的情況,可以及時(shí)更正,保證了文件的連續(xù)性,也避免了掛接的時(shí)候因?yàn)轫摯a錯(cuò)誤而導(dǎo)致PDF合成錯(cuò)誤。我校沒有實(shí)施立卷改革,紙質(zhì)檔案一直是以卷為單位進(jìn)行整理,除了裝訂成書的,在數(shù)字化掃描前都要進(jìn)行拆卷,拆除裝訂物,待掃描結(jié)束后再重新裝訂起來。
7.掃描設(shè)備的選擇
掃描設(shè)備的選擇應(yīng)特別注意對(duì)檔案實(shí)體的保護(hù),盡量采用對(duì)檔案實(shí)體破壞性小的掃描設(shè)備進(jìn)行數(shù)字化。比如近期形成的紙質(zhì)厚實(shí)、平整的A4紙大小的文件材料,可以用高速掃描儀;新生錄取名冊(cè)那種又薄又卷的紙張和發(fā)黃發(fā)脆的歷史老檔案必須用平板掃描儀,以免破壞檔案;裝訂成書的拆卷時(shí)容易破壞檔案,重新裝訂時(shí)也無法恢復(fù)原貌,最好用書刊掃描儀。
8.紙質(zhì)檔案數(shù)字化成果驗(yàn)收
紙質(zhì)檔案數(shù)字化成果驗(yàn)收包括掃描圖片驗(yàn)收和數(shù)據(jù)掛接驗(yàn)收兩個(gè)方面。
紙質(zhì)檔案數(shù)字化工作專項(xiàng)調(diào)研時(shí),我們發(fā)現(xiàn)有的單位在實(shí)施數(shù)字化時(shí)對(duì)掃描圖片分辨率沒有提出明確要求,紙質(zhì)檔案數(shù)字化加工公司為了追求掃描速度有意降低圖片分辨率,導(dǎo)致圖片打印時(shí)失真、模糊。因此我校根據(jù)項(xiàng)目招標(biāo)文件和項(xiàng)目合同,制定了紙質(zhì)檔案數(shù)字化工作流程和各環(huán)節(jié)操作規(guī)范,對(duì)紙質(zhì)檔案數(shù)字化全過程進(jìn)行有效地控制,確保數(shù)字化成果質(zhì)量。一般文件的掃描分辨率要求不小于300dpi,照片和需要高精度仿真復(fù)制的檔案,掃描分辨率要求不小于600 dpi。每天一上班,我們會(huì)安排專人把前一天掃描的圖片全部拷出來,組織全館工作人員進(jìn)行完整度、清晰度、偏斜度檢查,數(shù)字圖像不完整、無法識(shí)別或圖像失真度較大的圖像和漏掃、重掃、多掃等情況,一一列表反饋要求調(diào)整或重掃并及時(shí)跟進(jìn)重新檢查。
紙質(zhì)檔案數(shù)字化加工公司完成數(shù)據(jù)掛接工作后,檔案館工作人員對(duì)照紙質(zhì)檔案數(shù)字化移交清單,逐卷逐件檢查,首先是看掛沒掛,然后是掛了的能不能打開,打開以后再檢查PDF圖像合成正確不正確,并抽樣檢查打印效果。
9.紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全管理
必須加強(qiáng)紙質(zhì)檔案數(shù)字化各環(huán)節(jié)的安全管理,確保檔案實(shí)體和檔案信息的安全。一是確保紙質(zhì)檔案不受破壞,輕拿輕放。二是確保紙質(zhì)檔案實(shí)體不要丟失,檔案領(lǐng)取、收回需要詳細(xì)的交接清單,檔案館分管老師和數(shù)字化加工公司執(zhí)行經(jīng)理共同清點(diǎn)無誤后雙方簽字方可進(jìn)行交接出庫、入庫。三是確保數(shù)字化后的成果不外泄,與數(shù)字化加工公司簽訂保密協(xié)議,明確要求數(shù)字化工作人員不得攜帶U盤、移動(dòng)硬盤等設(shè)備進(jìn)入辦公場(chǎng)所。四是確保檔案數(shù)據(jù)傳輸過程中的安全。由于計(jì)算機(jī)病毒的存在,在數(shù)據(jù)傳輸過程中,容易被計(jì)算機(jī)病毒所感染,加上惡意攻擊等行為,需要對(duì)應(yīng)水平的技術(shù)保障體系,并做好檔案數(shù)據(jù)的備份工作。
三、對(duì)我校紙質(zhì)檔案數(shù)字化工作的幾點(diǎn)思考
我校紙質(zhì)檔案數(shù)字化工作還處于探索論證的初級(jí)階段,為了有效確保檔案數(shù)字化建設(shè)取得快速發(fā)展,必須認(rèn)識(shí)到目前數(shù)字化建設(shè)過程中存在的問題,積極改善當(dāng)前所面臨的一系列問題,通過加強(qiáng)對(duì)數(shù)字化建設(shè)的重視程度,提高檔案管理工作人員專業(yè)技能素養(yǎng)以及不斷完善檔案管理制度,確保相關(guān)信息安全等措施來促進(jìn)學(xué)校數(shù)字化建設(shè)的快速發(fā)展。
1.提高認(rèn)識(shí),更新觀念,高度重視紙質(zhì)檔案數(shù)字化工作。我們要加強(qiáng)《檔案法》和《高等學(xué)校檔案管理辦法》的學(xué)習(xí)和宣傳力度,增強(qiáng)全體教職工的檔案意識(shí),提高學(xué)校領(lǐng)導(dǎo)對(duì)檔案工作和紙質(zhì)檔案數(shù)字化工作重要性的認(rèn)識(shí),促進(jìn)檔案信息化建設(shè)與學(xué)校其他工作同步發(fā)展,將檔案數(shù)字化納入學(xué)校信息化發(fā)展規(guī)劃,實(shí)現(xiàn)檔案管理系統(tǒng)與辦公自動(dòng)化系統(tǒng)、教務(wù)系統(tǒng)、科研系統(tǒng)等的對(duì)接,做好校內(nèi)各部門(單位)在辦公自動(dòng)化過程中形成的電子文件的歸檔與管理工作,提升檔案工作服務(wù)學(xué)校和社會(huì)的能力。
2.提升檔案管理安全意識(shí)。很多人對(duì)檔案安全工作的認(rèn)識(shí)還只停留在紙質(zhì)檔案等載體的安全保密上,對(duì)網(wǎng)絡(luò)化中的檔案信息的安全、保密問題認(rèn)識(shí)不足,以為信息沒丟就是做好信息的安全保密工作了。我們要加強(qiáng)檔案管理安全宣傳,了解、認(rèn)識(shí)檔案檔案管理安全的重要性,在日常工作中主動(dòng)采取并落實(shí)相應(yīng)的安全措施,預(yù)防安全問題的發(fā)生。建立并嚴(yán)格執(zhí)行安全責(zé)任制度,減少人為因素導(dǎo)致的檔案安全隱患,采用加密、防火墻、入侵檢測(cè)以及數(shù)字簽名等安全保障技術(shù),提升電子檔案安全性。
3.積極引進(jìn)和培養(yǎng)檔案數(shù)字化人才。檔案數(shù)字化是一種新的檔案管理模式,其安全管理與傳統(tǒng)模式有很大區(qū)別,對(duì)檔案數(shù)字化管理人員的素質(zhì)提出了更高的要求,既要懂得檔案管理工作規(guī)范,又要熟悉計(jì)算機(jī)、檔案管理軟件、圖像處理等現(xiàn)代技術(shù)。
4.加強(qiáng)檔案數(shù)字化軟硬件設(shè)施建設(shè)?!肮び破涫?,必先利其器。”軟硬件設(shè)施建設(shè)是做好檔案數(shù)字化工作的基礎(chǔ)和前提,我們要加大基礎(chǔ)設(shè)施投入,不斷改進(jìn)和完善與檔案數(shù)字化建設(shè)相匹配的檔案基礎(chǔ)設(shè)施建設(shè),配備性能良好的計(jì)算機(jī)、掃描儀、打印機(jī)、照相機(jī)、翻錄設(shè)備,擁有足夠存儲(chǔ)空間的服務(wù)器,建立專門的數(shù)據(jù)庫,升級(jí)檔案管理軟件,保證檔案數(shù)字化建設(shè)的順利進(jìn)行。
參考文獻(xiàn):
[1]王良成,馬淑桂,郝晨輝 ,程春雨,杜琳琳,蔡 偉,宋 涌,王大眾,田 軍,曹 燕,李華峰.國家檔案局檔案科學(xué)技術(shù)研究所;國家檔案局信息管理中心;國家檔案局技術(shù)部. DA/T 31-2017紙質(zhì)檔案數(shù)字化規(guī)范
[2]孟凡華 于佩蘭.豐寧滿族自治縣檔案局.檔案館(室)數(shù)字化建設(shè)存在的問題及對(duì)策.辦公室業(yè)務(wù)[J],2016
[3]彭薈吉.海南大學(xué).高校檔案數(shù)字化建設(shè)的常見問題及解決對(duì)策.信息化建設(shè)[J]城建檔案,2020
(作者單位:南京工程學(xué)院檔案館)