檔案信息數(shù)字化是隨著計算機(jī)網(wǎng)絡(luò)技術(shù)、數(shù)據(jù)庫技術(shù)以及多媒體技術(shù)的發(fā)展而產(chǎn)生的一種新型檔案信息形態(tài),是檔案資源長期保存和高效利用的必然要求。高校檔案數(shù)字化建設(shè)工作作為高?!皵?shù)字化校園”建設(shè)的重要組成部分,是高校檔案管理信息化建設(shè)的重要內(nèi)容,是檔案信息資源共享的基礎(chǔ)。從目前國內(nèi)高校檔案數(shù)字化建設(shè)狀況來看,由于各校的資金、人員、檔案狀況不同,在建設(shè)方式、建設(shè)內(nèi)容、建設(shè)進(jìn)度上也有一些差異。本文談一些在檔案數(shù)字化建設(shè)工作中的經(jīng)驗(yàn)與體會,旨在拋磚引玉,共同探討。
1 結(jié)合實(shí)際,充分論證實(shí)施方案
1.1 摸清家底、熟悉館藏檔案。各館在進(jìn)行數(shù)字化建設(shè)時,需要對檔案的情況詳細(xì)進(jìn)行摸底評估,對館藏檔案的種類、數(shù)量、案卷質(zhì)量以及檔案的整理方法、著錄方法、檔號編制方法進(jìn)行詳細(xì)了解,做到對檔案數(shù)字化建設(shè)的工作量心中有數(shù),從而制定科學(xué)的建設(shè)方案。如,有些高校是由幾所高校合并組建,各校的檔號編制方法不同,甚至同一個學(xué)校,相同類別檔案,不同年代有不同的檔號編制方法,檔案的情況較復(fù)雜,數(shù)字化建設(shè)的工作量很大;而有些高校館藏檔案只有一個全宗號,品種也相對簡單,工作量相對較小。
1.2 完善基礎(chǔ)設(shè)施條件。檔案資源數(shù)字化建設(shè)工作離不開現(xiàn)代化的軟、硬件設(shè)施保障。引進(jìn)檔案網(wǎng)絡(luò)管理系統(tǒng)是檔案信息網(wǎng)絡(luò)化管理的前提;大存儲量的服務(wù)器、磁盤陣列、電腦、普通激光掃描儀、A3寬幅彩色激光掃描儀、普通激光打印機(jī)、A3寬幅激光彩色打印機(jī)、照片打印機(jī)、刻錄機(jī)、照相機(jī),等等,這些都是必不可少的硬件設(shè)施。
1.3 因校制宜、制訂實(shí)施方案。在摸清家底的情況下,根據(jù)各校、各館的具體情況,因地制宜,制訂建設(shè)實(shí)施方案。比如,我館保存有建校32年來的黨群、行政、教學(xué)、科研等十個門類的檔案17763卷,考慮到專職人員技術(shù)力量較薄弱,同時要保證有較快的建設(shè)步伐的情況下,決定采用“自建與外包相結(jié)合”的方式進(jìn)行建設(shè),即檔案目錄中心建設(shè)和新增檔案數(shù)字化自己建設(shè),存量檔案數(shù)字化采用外包的方式,從“檔案目錄中心”和“檔案全文數(shù)據(jù)庫”兩方面入手同步進(jìn)行開展建設(shè)工作。在建設(shè)中,采用利用率高、重要的檔案優(yōu)先建設(shè)的原則,第一階段進(jìn)行學(xué)生錄取審批表、學(xué)歷學(xué)位名冊、學(xué)生成績大表、各類圖紙等檔案資源數(shù)字化,第二階段進(jìn)行文件類檔案的數(shù)字化,第三階段進(jìn)行其他檔案資料的數(shù)字化工作。總體來說,對于圖紙、照片、錄像制品以及年代久遠(yuǎn)的檔案資料,采用外包形式,建設(shè)速度快,也能保證質(zhì)量,性價比較好。當(dāng)然,如果在人員、技術(shù)力量充足的情況下,可考慮采用完全自建的方式。
2 詳細(xì)制定著錄標(biāo)準(zhǔn)、掃描標(biāo)準(zhǔn)
2.1 詳細(xì)制定著錄標(biāo)準(zhǔn)。在制定著錄標(biāo)準(zhǔn)前,如果存在原有檔案資料檔案號不同的情況,首先要給所有老檔案重新編制檔號,再分全宗類別進(jìn)行著錄方法和標(biāo)準(zhǔn)的制定。要根據(jù)檔案網(wǎng)絡(luò)管理系統(tǒng)的實(shí)際情況制定著錄標(biāo)準(zhǔn),比如,我館根據(jù)“南大之星”管理系統(tǒng)制定的教學(xué)檔案成績大表著錄標(biāo)準(zhǔn):
[案卷級著錄]:
[正題名]:鄭州輕工業(yè)學(xué)院××院(系)××專業(yè)××級(××班)本科(或?qū)??學(xué)生成績總表及畢業(yè)(論文)設(shè)計成績評定書。
[起止時間]:進(jìn)校年度+月+日,如:1982.09.01,離校年度+月+日,如:1986.07.01。
[歸檔單位]:落款公章或系名稱。
[一級目錄]:檔案年度,如:1986。
[二級目錄]:JX。[三級目錄]空白不填。
[實(shí)體分類號]:一級目錄一二級目錄,如:1986-JX。
[全宗號]:001。[保管期限]:永久。[密級]:秘密。
2.2 分類別制定適宜的掃描標(biāo)準(zhǔn)和方法。高校檔案館的檔案種類較多,如學(xué)生學(xué)籍材料、行政、黨群發(fā)文、基建檔案、錄像帶檔案、照片檔案,等等。同一類檔案由于年代不同,其載體材質(zhì)也不盡相同,特別是年代久遠(yuǎn)的檔案資料,存在著紙張變黃、字跡模糊、破損的情況,要根據(jù)具體情況制定掃描的標(biāo)準(zhǔn)與方法。比如:照片檔案,掃描參數(shù):彩色600DPI;紙質(zhì)檔案,掃描參數(shù):彩色300DPI;基建圖紙,掃描參數(shù):彩色20xFRk7hbrLcJaz9DenYbxzhmLGaK0LEGvVrK6nYTWgWQ=0DPI;文件格式:PDF和]PG兩套;圖像傾斜度控制在±3%以內(nèi);圖像周邊無黑邊;圖像里雜點(diǎn)為最小文字30%大小以上一律去除,等等。我館在數(shù)字化建設(shè)中,對于字跡模糊的檔案,采用先行復(fù)印(加黑),再對復(fù)印件進(jìn)行掃描的方式,保證了較好的掃描效果。
3 實(shí)時跟進(jìn)校驗(yàn),保證檔案著錄、掃描質(zhì)量
在檔案數(shù)字化建設(shè)工作中,要求工作人員一輸一校,著錄、掃描錯誤率要小于1%。同時,要有專門人員進(jìn)行檔案數(shù)字化質(zhì)量的核查工作,核查人員要每日跟進(jìn),及時解決在著錄、掃描過程出現(xiàn)的問題,如:簡化字、繁體字的識別;檔案掃描的精度問題,等等。我館在建設(shè)過程中,每天安排核查人員按25%左右的比例進(jìn)行抽檢,如錯誤率超出范圍,及時提示著錄、掃描人員重新校驗(yàn),并加大抽檢比例。檔案著錄、掃描中隨時會出現(xiàn)一些新的問題、新的情況,可以制定“檔案著錄、掃描注意事項(xiàng)”,若著錄、掃描中出現(xiàn)問題,先參照“注意事項(xiàng)”執(zhí)行,如沒有說明的及時添加進(jìn)去,并一直移交下去,讓每一個跟進(jìn)人員知曉。如,我館制定的“檔案著錄、掃描注意事項(xiàng)”:
(1)正題名中出現(xiàn)年度統(tǒng)一用阿拉伯?dāng)?shù)字著錄。
(2)綜合類檔案中有財務(wù)總賬之類材料,只需輸入案卷級。
(3)文件級目錄中出現(xiàn)的涉及個人的表,表名中沒有體現(xiàn)人名,統(tǒng)一在表名后加上括號注明人名。
(4)頁碼只敲了正面,背面沒敲的問題,無需重新改頁碼,按實(shí)體所敲號碼數(shù)著錄即可。
(5)圖像里雜線予以完全去除。
(6)同一頁圖像里原實(shí)體分離的予以拼接合成處理。
(7)壓邊裝訂檔案分拆掃描,壓邊信息盡量完整。
在掃描質(zhì)量控制中,有一個細(xì)節(jié)問題要注意,即掃描的精度要根據(jù)掃描件的打印效果來確定,而不是通過電腦的觀看效果,因?yàn)閮烧哂幸欢ǖ恼`差。
4 批量掛接再次抽查,做好原始數(shù)據(jù)備份工作
4.1 適時批量掛接、數(shù)據(jù)抽查。為保證數(shù)字化建設(shè)成果的及時運(yùn)用,根據(jù)各校檔案的利用情況,適時進(jìn)行數(shù)字信息的批量上傳、掛接工作。如,對于黨群、行政發(fā)文,利用文檔掃描儀進(jìn)行掃描,保存為PDF格式,同步標(biāo)注信息,分階段上傳;對于成績單、招生名冊等學(xué)籍檔案利用高速掃描儀、文檔掃描儀進(jìn)行掃描,存為JPEG、PDF格式,同步標(biāo)注信息,及時上傳等。
在進(jìn)行數(shù)據(jù)上傳、掛接過程中,要再進(jìn)行數(shù)據(jù)的校驗(yàn)工作,進(jìn)行目錄和電子文件掛接校驗(yàn),如錯誤率超出1%,要求外包公司重新掛接并校驗(yàn)。如我館制定的數(shù)據(jù)質(zhì)量抽查記錄表:
4.2 數(shù)據(jù)的備份工作。為保證檔案數(shù)據(jù)的安全性,要及時做好數(shù)字化信息的備份工作。原始電子文件采用移動硬盤和光盤2套備份策略;檔案數(shù)據(jù)庫采用每日12點(diǎn)和24點(diǎn)在SQL數(shù)據(jù)庫中進(jìn)行2套備份方式,1套為移動硬盤備份,1套為服務(wù)器SCSi硬盤備份。
4.3 檔案信息安全保密工作。進(jìn)行檔案數(shù)字化建設(shè)工作時,要做好檔案資源的安全保密工作。建設(shè)工作中要制定相配套的《檔案加工登記表》、《檔案驗(yàn)收、還檔登記表》等,每張表格均標(biāo)明日期、全宗號、目錄號、數(shù)量、張(頁)數(shù)、重量、破損情況等相關(guān)信息,并要求相關(guān)交接人員簽字確認(rèn),做到每份檔案的去向都登記在冊,一目了然,保證檔案資源不會出現(xiàn)丟失的現(xiàn)象。同時,要做好檔案信息保密工作,尤其是黨群、行政類的一些涉密文件,在文件的掃描過程,處理方法要恰當(dāng),要控制接觸范圍,避免泄密。數(shù)字化建設(shè)外包公司離場時,必須要求其刪除設(shè)備存儲器中的所有相關(guān)數(shù)據(jù)。
5 數(shù)字化建設(shè)中需要重點(diǎn)關(guān)注的問題
高校檔案數(shù)字化建設(shè)是一項(xiàng)系統(tǒng)的工程,涉及面廣,工作量大,需要重點(diǎn)關(guān)注幾個方面的問題:一是標(biāo)準(zhǔn)制定、流程設(shè)計工作。在數(shù)字化管理制度、建設(shè)標(biāo)準(zhǔn)、工作流程的設(shè)計上精益求精,標(biāo)準(zhǔn)化的規(guī)范體系的確立就顯得尤為重要,它是檔案數(shù)字化建設(shè)高質(zhì)量的堅(jiān)實(shí)基礎(chǔ)。在實(shí)施過程中嚴(yán)格把關(guān),保證高效、高質(zhì)量地完成數(shù)字化建設(shè)工作。二是檔案數(shù)字化信息的核查工作。由于建設(shè)人員對著錄規(guī)則、掃描標(biāo)準(zhǔn)理解不盡相同,加之錄入、掃描過程中的疏忽等原因,會出現(xiàn)各種各樣的錯誤或問題。在這樣一個動態(tài)的數(shù)據(jù)提交過程中,層層核查是確保數(shù)據(jù)質(zhì)量,最大限度地減少建設(shè)過程中錯誤的重要措施之一。三是檔案數(shù)字化資源的安全工作。在數(shù)字化建設(shè)承建單位的選擇上,要嚴(yán)格把關(guān),檔案數(shù)字化工作的承建單位應(yīng)該有特定資質(zhì),承建單位要嚴(yán)格遵守《保密守則》和檔案法律法規(guī),嚴(yán)格按照數(shù)字化工作流程進(jìn)行工作,不能出現(xiàn)因?yàn)槿藶榈脑蛟斐蓹n案原件的污染、破損、斷裂甚至失竊等無法挽回的損失,確保數(shù)字化加工中檔案原件和檔案信息的安全。
高校檔案數(shù)字化建設(shè)工作是檔案管理信息化建設(shè)的關(guān)鍵環(huán)節(jié),通過檔案目錄中心和檔案全文數(shù)據(jù)庫的建設(shè),整合檔案信息管理系統(tǒng)、學(xué)生檔案傳遞系統(tǒng)、檔案信息發(fā)布系統(tǒng)等,最終構(gòu)建數(shù)字檔案館工作平臺,從根本上擺脫傳統(tǒng)手工管理模式,對檔案原件的保護(hù)力度得以增強(qiáng),降低了檔案工作人員的勞動強(qiáng)度,大大提高了檔案的查詢效率,極大方便了廣大師生對檔案資源的查詢與利用,為檔案信息資源共享奠定堅(jiān)實(shí)的物質(zhì)基礎(chǔ)和技術(shù)保