檔案信息數(shù)字化若干問(wèn)題的研究
檔案信息數(shù)字化建設(shè)已成為各高校檔案館的重要任務(wù)。通過(guò)高校檔案數(shù)字信息化工作調(diào)研,對(duì)高校檔案信息數(shù)字化工作中出現(xiàn)的業(yè)務(wù)模式選擇、外包公司的選擇與合同簽訂、檔案前期整理、各類檔案信息數(shù)字化順序、信息數(shù)字化存儲(chǔ)格式以及檔案管理與檔案數(shù)字化檢查等若干問(wèn)題進(jìn)行總結(jié)并探討相應(yīng)的解決策略。
高校檔案;檔案信息數(shù)字化;數(shù)字化外包
隨著檔案信息化建設(shè)需要,檔案數(shù)字化已經(jīng)成為各高校檔案館的重要任務(wù)。我校檔案館即將對(duì)檔案館內(nèi)現(xiàn)有檔案進(jìn)行數(shù)字化掃描,在數(shù)字化之前進(jìn)行了一系列調(diào)研工作。這次調(diào)研對(duì)武漢幾所部屬高校以及省屬市屬高校進(jìn)行調(diào)研,這些高?;旧隙家验_始了檔案信息數(shù)字化工作。有些高校已經(jīng)對(duì)檔案信息數(shù)字化業(yè)務(wù)積累了豐富的經(jīng)驗(yàn)、有些正在掃描過(guò)程中,調(diào)研發(fā)現(xiàn)他們都經(jīng)歷過(guò)各種共性或個(gè)性的問(wèn)題。由于高校的共通性,其他高校在開展數(shù)字化業(yè)務(wù)過(guò)程中也可能面臨這些問(wèn)題。因此,總結(jié)這些問(wèn)題所在并研究合適的解決辦法,對(duì)于我校的檔案信息數(shù)字化業(yè)務(wù)工作的順利開展有很好的借鑒推動(dòng)作用,同時(shí)可以為即將開展此項(xiàng)工作的高校檔案館提供有益的參考。
(一)檔案信息數(shù)字化業(yè)務(wù)模式選擇
調(diào)研的所有高校統(tǒng)一選擇了業(yè)務(wù)外包的方式來(lái)完成數(shù)字化掃描工作。業(yè)務(wù)外包的概念在1990年《企業(yè)的核心競(jìng)爭(zhēng)力》中首次提出,檔案業(yè)務(wù)外包具體指檔案機(jī)構(gòu)通過(guò)整合利用外部專業(yè)化資源,達(dá)到降低成本、提高效率、提高自身核心競(jìng)爭(zhēng)力的管理模式。業(yè)務(wù)內(nèi)包可總結(jié)為依靠檔案館自身力量完成檔案信息數(shù)字化工作。各高校檔案館正式工作人員一般都在十余人左右,而各檔案館分為查詢利用、業(yè)務(wù)指導(dǎo)、技術(shù)信息、理論編研等部門,每個(gè)部門分配人員基本能保證檔案館的正常運(yùn)轉(zhuǎn),如果選擇內(nèi)包的方式進(jìn)行數(shù)字化掃描,首先人力上就會(huì)嚴(yán)重缺乏。根據(jù)“業(yè)務(wù)外包”的概念,對(duì)于高校檔案館來(lái)說(shuō)核心業(yè)務(wù)是檔案管理、服務(wù)利用和理論編研,信息數(shù)字化業(yè)務(wù)作為非核心業(yè)務(wù)外包給有專業(yè)資質(zhì)的掃描公司一方面利于檔案信息數(shù)字化業(yè)務(wù)順利展開,另一方面檔案館工作人員有更多的時(shí)間和精力投入到管理、利用與科研等核心工作中。其次,數(shù)字化掃描是一項(xiàng)技術(shù)性業(yè)務(wù),需要專業(yè)的設(shè)備與技術(shù),檔案館沒(méi)有數(shù)字化設(shè)備,也缺少懂得數(shù)字化技術(shù)的專業(yè)人才,并且數(shù)字化檔案加工流程較為復(fù)雜和漫長(zhǎng),如果選擇內(nèi)包的方式會(huì)花費(fèi)大量的人力物力,也影響數(shù)字化業(yè)務(wù)的速度與進(jìn)度。而專業(yè)的檔案外包公司不僅配備最先進(jìn)和完善的設(shè)備,同時(shí)具備豐富得數(shù)字化人才。由專業(yè)檔案外包公司承擔(dān)檔案信息數(shù)字化工作在質(zhì)量和效率上更有保障。
(二)外包公司的選擇與合同簽訂
合適外包公司的選擇是能否成功完成數(shù)字化外包業(yè)務(wù)的關(guān)鍵。選擇外包公司時(shí)應(yīng)考慮公司資質(zhì)、業(yè)務(wù)經(jīng)驗(yàn)、業(yè)務(wù)能力、技術(shù)狀況等方面。選擇一個(gè)資質(zhì)高、業(yè)務(wù)能力強(qiáng)、業(yè)務(wù)經(jīng)驗(yàn)多、技術(shù)能力好的外包公司,有助于檔案館信息數(shù)字化的順利完成,而且足夠的經(jīng)驗(yàn)?zāi)茏屚獍藛T對(duì)于各種各樣的問(wèn)題快速反應(yīng),并找出解決方案,節(jié)省時(shí)間和外包費(fèi)用。反之,資質(zhì)差、經(jīng)驗(yàn)不足的外包公司不僅影響檔案信息數(shù)字化進(jìn)度甚至信息化費(fèi)用也隨之增多。因此,檔案館應(yīng)結(jié)合自身情況綜合考量,選擇合適的外包公司,保證檔案信息數(shù)字化順利完成。
檔案信息數(shù)字化是一個(gè)長(zhǎng)期、復(fù)雜的工作,檔案館與外包公司必須按規(guī)定簽訂外包合同?,F(xiàn)階段,高校檔案館在業(yè)務(wù)外包方面經(jīng)驗(yàn)缺乏,通過(guò)調(diào)研總結(jié)得到一些簽約經(jīng)驗(yàn)可以借鑒。外包合同中各項(xiàng)條款應(yīng)具體、詳實(shí),合同中應(yīng)明確服務(wù)范圍、服務(wù)履行期限、驗(yàn)收標(biāo)準(zhǔn)、賠償責(zé)任、爭(zhēng)端解決方法、保密協(xié)議等,另外還可將合同中未提到但日后工作中遇到的問(wèn)題簽訂補(bǔ)充條款來(lái)規(guī)范外包商行為、保障自身權(quán)益。一般情況下,合同簽約時(shí)間不宜過(guò)長(zhǎng),根據(jù)調(diào)研各高校經(jīng)驗(yàn)來(lái)看,一年一簽,可以較好的保障高校利益。
(一)檔案的前期整理
高校檔案館館藏檔案歷史悠久,館藏量較大,每一個(gè)時(shí)期的檔案整編方法不盡相同,按照現(xiàn)今檔案整理標(biāo)準(zhǔn),庫(kù)存檔質(zhì)量參差不齊,所以對(duì)于庫(kù)存檔案的清庫(kù)整理尤為重要。以我校為例,業(yè)務(wù)指導(dǎo)室從2012年開始對(duì)庫(kù)存檔案進(jìn)行清庫(kù)核對(duì),將庫(kù)存檔案中缺頁(yè)漏頁(yè)、案卷或卷內(nèi)題名錯(cuò)誤、日期錯(cuò)誤等歷史遺留問(wèn)題全部重新整理,便于檔案信息化掃描工作的進(jìn)行。很多高校檔案系統(tǒng)中沒(méi)有歷史檔案的卷內(nèi)條目,這也是由于早期檔案整理的不規(guī)范造成的,那么進(jìn)行掃描時(shí)卷內(nèi)文件如何掛接也是在開展檔案信息化業(yè)務(wù)之前需要確定的問(wèn)題。對(duì)于歷史檔案卷內(nèi)文件的處理方式基本分為兩類:1.首先在檔案管理系統(tǒng)中將缺少的卷內(nèi)條目進(jìn)行錄入,然后再進(jìn)行掃描掛接;2.在掃描時(shí)同步掛接。這兩種方式各有利弊,第一種更加便于掛接,錯(cuò)誤率較低,但是前期的錄入工作巨大,耗時(shí)較長(zhǎng);而第二種方式掛接時(shí)對(duì)工作人員要求較高,必須非常小心仔細(xì),否則很容易發(fā)生掛接錯(cuò)誤。各高??梢愿鶕?jù)自身情況來(lái)選擇歷史檔案卷內(nèi)條目的處理方式。
(二)各類檔案信息數(shù)字化順序
1.對(duì)于高校檔案利用來(lái)說(shuō),教學(xué)類檔案無(wú)疑是使用頻率最高的一類,學(xué)生的招生、學(xué)籍、學(xué)位、成績(jī)等都是需要經(jīng)常查詢的,所以首先應(yīng)從教學(xué)類檔案開始數(shù)字化。2.文書類檔案,包括黨群和行政檔案。高校在黨群、行政管理工作中形成的文件是高校正常運(yùn)行的基礎(chǔ)與指導(dǎo),查詢利用檔案的數(shù)量也不在少數(shù),所以對(duì)于黨群和行政檔案的數(shù)字化也刻不容緩。3.聲像檔案中的照片檔案是高校歷史最珍貴的記錄,很多老舊的照片經(jīng)過(guò)時(shí)間變遷已經(jīng)模糊、發(fā)黃甚至破損,一旦損毀便無(wú)法挽回,很多高校對(duì)于照片檔案的掃描也格外重視。4.基建檔案中的各類圖紙也是掃描工作的重點(diǎn)。以我校為例,基建圖紙是科技檔案中查閱頻率較高的一類,很多基建圖紙已經(jīng)模糊破損了,這些圖紙對(duì)于學(xué)?;?xiàng)目的后期維修改造至關(guān)重要。其他類別檔案包括設(shè)備、科研、財(cái)務(wù)、人事、出版等各高校暫時(shí)未列入信息化范圍。
(三)信息數(shù)字化儲(chǔ)存格式
調(diào)研發(fā)現(xiàn),TIFF圖像數(shù)據(jù)格式占用儲(chǔ)存空間大,JPGE和雙層PDF文件是較為主流的儲(chǔ)存格式。《電子文件歸檔與管理規(guī)范》和《紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》兩個(gè)檔案數(shù)字化規(guī)范標(biāo)準(zhǔn)對(duì)此也有規(guī)定。雙層PDF文件是一種包含文本層和圖像層的雙層結(jié)構(gòu)PDF格式文件,文件內(nèi)容同時(shí)包含文本層和圖像層,既可以100%保留原始版面效果(包括公章、簽名),又可以通過(guò)下層的文字信息支持選擇、復(fù)制、全文檢索等功能。因此檔案數(shù)字化建立全文數(shù)據(jù)庫(kù),雙層PDF文件格式能實(shí)現(xiàn)目錄檢索和全文檢索功能,不僅有效提高了查詢利用的工作效率而且極大的方便了電子文件的管理。信息數(shù)字化掃描中色彩模式的選擇可根據(jù)檔案本身狀況來(lái)決定,一般文件可用黑白掃描,節(jié)約成本;紅頭文件以及帶有印章的文件就需要用到彩色掃描,層次更加豐富;對(duì)于老檔案若用黑白掃描則效果不佳,圖片發(fā)黑不清,最好選擇彩色掃描,清晰度更高,更好的顯示檔案的原貌。
高校在檔案信息化過(guò)程管理階段,需要注意的問(wèn)題很多,在此重點(diǎn)討論兩個(gè)關(guān)鍵問(wèn)題。
(一)檔案管理
很多歷史檔案見證著高校的發(fā)展歷程,極其珍貴,一旦損壞或者遺失將造成無(wú)法挽回的損失。信息數(shù)字化過(guò)程中,檔案出庫(kù)進(jìn)庫(kù)需要嚴(yán)格管理。檔案出庫(kù)時(shí)將出庫(kù)檔案進(jìn)行登記,填寫出庫(kù)單,包括出庫(kù)日期、檔案類別、具體件數(shù)、頁(yè)數(shù)、經(jīng)手人等。入庫(kù)時(shí)也要填寫檔案入庫(kù)單,嚴(yán)格核對(duì)是否與出庫(kù)信息相符,細(xì)化到每卷頁(yè)數(shù)是否一致,以免造成不必要的損失。檔案拆卷與裝訂也需仔細(xì)謹(jǐn)慎。許多歷史檔案年代久遠(yuǎn),紙張變得非常脆弱,若隨意翻折或拆卷大意,容易造成檔案的人為損壞。由于外包人員不是專業(yè)的檔案業(yè)務(wù)人員,對(duì)于檔案裝訂工作存在不規(guī)范或者錯(cuò)誤操作,檔案館應(yīng)安排相關(guān)部門負(fù)責(zé)人協(xié)助指導(dǎo)外包人員完成裝訂工作,盡量避免檔案損壞或者丟卷、漏頁(yè)等人為操作失誤。由于高校檔案中有部分保密檔案,因此檔案信息數(shù)字化安全管理也必須注意,應(yīng)在雙方合同中簽訂保密協(xié)議,并且在信息數(shù)字化掃描過(guò)程中嚴(yán)格加以把關(guān)。實(shí)體檔案出入庫(kù)房手續(xù)齊全,嚴(yán)禁數(shù)字化工作人員攜帶U盤、移動(dòng)硬盤等儲(chǔ)存設(shè)備進(jìn)入掃描工作間,如需網(wǎng)絡(luò)也應(yīng)在獨(dú)立的局域網(wǎng)內(nèi)操作,防止網(wǎng)絡(luò)安全隱患。
(二)檔案信息化檢查
掃描完成的案卷必須及時(shí)檢查,主要檢查內(nèi)容包括:掃描的影像數(shù)據(jù)與對(duì)應(yīng)的目錄數(shù)據(jù)掛接是否準(zhǔn)確、是否有缺掃漏掃或者重復(fù)掃描、掃描的完整度與清晰度等問(wèn)題,如出現(xiàn)問(wèn)題應(yīng)及時(shí)與外包人員溝通,指導(dǎo)其更正,確保信息數(shù)字化質(zhì)量。數(shù)字化檢查工作也分為兩種方式,一種是僅抽檢,另一種是全部檢查。全部檢查雖然更加耗時(shí)耗力,但是保證了掃描檔案的質(zhì)量,為以后的順利使用打下了基礎(chǔ)。最后還要做好數(shù)據(jù)的安全保存和備份工作,一般采取移動(dòng)硬盤與光盤雙套載體備份,檔案數(shù)據(jù)庫(kù)也應(yīng)定期及時(shí)更新,保證數(shù)據(jù)庫(kù)的安全與完整。
以上是在我校檔案信息數(shù)字化之前進(jìn)行考察調(diào)研的工作中所歸納總結(jié)的若干問(wèn)題及解決策略?,F(xiàn)今各高校陸續(xù)開展了檔案信息數(shù)字化工作,信息化之前有必要將上述問(wèn)題了解清楚,為檔案信息數(shù)字化工作順利開展提供保證。當(dāng)然,檔案信息數(shù)字化工作還有很多需要注意的方面,在此文中無(wú)法詳盡,有待進(jìn)一步在實(shí)踐中深入研究與探討。
[1]朱復(fù)成.美國(guó)圖書館業(yè)務(wù)外包的得失與啟示[J].大學(xué)圖書館學(xué)報(bào),2000(1):30-32.
[2]吳燕平.內(nèi)包,還是外包——對(duì)檔案數(shù)字化工作的思考[J].檔案管理,2012(5):20-23.
[2]郭金光.雙層PDE技術(shù)及在檔案數(shù)字化中的應(yīng)用[J].陜西檔案,2013(1):26-27.