章小四
【摘要】本文著重分析高校封閉全宗檔案進行數(shù)據(jù)遷移時數(shù)據(jù)審核出現(xiàn)的問題,結合南京工程學院三個封閉全宗數(shù)據(jù)遷移的實際情況,提出從數(shù)據(jù)有效性、一致性及分布審核三個方面確保遷移工作的質量,從而促進檔案的長期保存及數(shù)字檔案資源的開發(fā)利用。
【關鍵詞】高校封閉全宗;數(shù)據(jù)遷移;數(shù)據(jù)審核;長期保存;開發(fā)利用
作為教育與科研輔助型機構的高校檔案館,其館藏的數(shù)字資源更是信息時代國家數(shù)據(jù)資源的重要構成。而一些合并高校因合并辦學的特殊性,往往出現(xiàn)同一全宗的檔案保存在不同的檔案管理系統(tǒng)中。由此合并高校紛紛選擇將合并前全宗進行數(shù)據(jù)遷移,并同步開展對應的數(shù)據(jù)審核工作,從而不斷推進檔案資源信息化建設工作。
一、高校封閉全宗的內涵及特征
根據(jù)教育部和國家檔案局制定的《高等學校檔案管理辦法》及國家檔案局發(fā)布的《高等學校檔案實體分類法》的規(guī)定:一個學校應為一個獨立全宗;對因學校撤銷或合并,其撤銷或合并的檔案,應本著集中保管、方便利用的原則,經協(xié)議由一?;蚝喜⒑蟮膶W校檔案部門統(tǒng)一保存。其中,各個被撤銷學校形成的所有檔案即可視為一個已完結全宗或封閉全宗。由此可見,高校封閉全宗至少需具備兩個特征:第一,它是一個獨立全宗;第二,該全宗不再產生新的檔案。而合并組建而成的高校,遵循“不同全宗不能分散、同一全宗不能混淆”的原則,應對并入的各個學校單獨設立全宗,由此其檔案部門則至少保存有兩個及以上全宗,當中非合并后高校的檔案即屬封閉全宗。
二、南京工程學院封閉全宗數(shù)據(jù)遷移的工作基礎
前身追溯至1915年創(chuàng)建的同濟醫(yī)工學堂附設機師科的南京工程學院,于2000年6月由原兩所國家示范性高等工程專科學?!暇C械高等??茖W校、南京電力高等??茖W校合并組建而成,2001年3月,原核工業(yè)部的南京工業(yè)學校并入其中。由此形成除“南京工程學院”以外的三個全宗,依次為“南京機械高等??茖W?!保ê喎Q“機?!保ⅰ澳暇╇娏Ω叩葘?茖W?!保ê喎Q“電?!保┘啊澳暇┕I(yè)學校”(簡稱“工業(yè)學?!保?個全宗含各類檔案總數(shù)共計1萬余卷,其中民國時期檔案23卷。
2013年,南京工程學院檔案館引進新的數(shù)字檔案管理綜合平臺,并配以專門的檔案管理系統(tǒng)服務器、數(shù)臺專門的計算機設備,以及其他網絡設備,截至2015年,館藏檔案的數(shù)據(jù)遷移工作基本完成,包括合并前三個學校的全宗。由于新舊數(shù)字檔案管理系統(tǒng)的差異,導致這三個全宗的數(shù)據(jù)庫出現(xiàn)不同程度數(shù)據(jù)的缺失、無效或不一致等一系列問題。同年檔案館全面開展三個全宗的數(shù)據(jù)遷移及審核工作,并同步實施數(shù)據(jù)審核監(jiān)管制度、檔案信息系統(tǒng)安全與數(shù)據(jù)網絡安全防范等輔助工作。
三、南京工程學院封閉全宗數(shù)據(jù)審核存在的問題
(一)數(shù)據(jù)有效性與一致性審核存在的問題。主要有如下幾點:
1.當檔案進行數(shù)據(jù)遷移時,由于新舊數(shù)字檔案管理系統(tǒng)的差異,使得檔案在不同系統(tǒng)中的文件格式不盡相同,故檢查數(shù)據(jù)是否完整、準確且有效,是數(shù)據(jù)遷移有效性審核的重要內容。以電專全宗目錄著錄為例,其大部分著錄項都可從舊系統(tǒng)中直接或間接導入,但如“分類號”“檔號”等項,只能通過手動修改或添加才能補充完整,具體著錄項對應關系。此外,由于早期該全宗的“年度”“分類號”等著錄項不同于目前的規(guī)范,如“圖1”所示,按照檔案實錄的原則,工作人員只能在新系統(tǒng)中重新設置數(shù)據(jù)表,再以紙質目錄為依據(jù),逐份錄入,操作繁瑣。
2.數(shù)據(jù)遷移時,數(shù)據(jù)一致性審核在于檢查電子文件是否與所在檔案內容一致,包括電子文件數(shù)量及電子文件內容兩方面。一般數(shù)據(jù)遷移采用一次遷移、分次遷移與定期遷移等相結合的方式,遷移時電子文件會多次合并,出現(xiàn)一份檔案重復關聯(lián)同一份電子文件的現(xiàn)象。同時,由于數(shù)據(jù)按既定順序在不同電子文件間同步遷移,而不同文件切換速度有差異,就可能導致與某一份檔案對應的電子文件關聯(lián)了另一份檔案。
(二)數(shù)據(jù)分布審核存在的問題。機專、電專及工業(yè)學校3個全宗所包含檔案類型多、案卷總量大。鑒于機專、電專及工業(yè)學校成立各自的學校檔案室時間較長,三個學校的辦學特色各不相同,且檔案信息化推行的時間也較早,因此,在進行新舊數(shù)據(jù)庫數(shù)據(jù)遷移時,三個全宗案卷數(shù)量及各類型檔案統(tǒng)計的工作量就比較大,各類檔案大致分布如“圖2”(按永久、長期、短期來分,以案卷為單位統(tǒng)計)。
尤其是對各個學校每一種類型檔案數(shù)量的統(tǒng)計,就可能出現(xiàn)重復或遺漏等偏差。若上述數(shù)據(jù)審核不細致,勢必會導致后期系統(tǒng)的檢全率及檢準率有較大誤差,為避免這些問題,需逐一排查,其工作量不言而喻。
四、南京工程學院封閉全宗數(shù)據(jù)審核工作的實施
(一)數(shù)據(jù)分布審核的實施。當合并前全宗數(shù)據(jù)由舊系統(tǒng)導入新系統(tǒng)后,可利用專門設計的統(tǒng)計軟件,在選定不同門類后,再設置“條件字段”,如“保管期限”“檔案類型”等,核查導入新系統(tǒng)各全宗的案卷數(shù)量是否完整、檔案類型是否缺失。若出現(xiàn)案卷或檔案類型數(shù)量前后不一致的情況,可直接鎖定該部分數(shù)據(jù),再重新比對舊系統(tǒng)中對應全宗的案卷數(shù)量或某類型檔案數(shù)量,確保數(shù)據(jù)準確無誤,從而快速有效地完成數(shù)據(jù)遷移時全宗數(shù)據(jù)的分布審核。
(二)數(shù)據(jù)有效性審核的實施。高校已完結全宗數(shù)據(jù)遷移時,可根據(jù)新系統(tǒng)的結構及特性,設定案卷目錄及卷內文件目錄數(shù)據(jù)表結構、字符集及數(shù)據(jù)類型等。具體數(shù)據(jù)審核可通過設定字段類型判斷字段是否符合規(guī)定、字段是否為必填項判斷案卷關鍵著錄項是否遺漏、字段是否空值判斷目錄著錄是否完整等,其中卷內文件目錄數(shù)據(jù)表還應包含表名“T_FILE_DAG_JN_T125.WENHAO”的必填字段“文號”。當導入的數(shù)據(jù)不符合數(shù)據(jù)表字段的限定條件時,數(shù)據(jù)審核會顯示數(shù)據(jù)錯誤,并列出錯誤類型及所在位置,工作人員據(jù)此實施數(shù)據(jù)的有效性審核。若顯示錯誤為普遍錯誤時,如工業(yè)學校全宗1984年至1991年文書檔案按“永”“長”“短”劃分,形成諸如分類號“長”案卷,此類案卷數(shù)據(jù)遷移時,會出現(xiàn)分類號轉換為“null”的錯誤,審核人員可通過軟件直接批量修改。
(三)數(shù)據(jù)一致性審核的實施。檔案工作人員對電子文件數(shù)量及電子文件內容的審核,可用系統(tǒng)程序語言設計的審核電子文件的小程序來完成。審核過程有:1.先判斷檔案關聯(lián)的電子文件是否存在。2.再通過文件名是否重復判斷電子文件是否重復,如若重復,則進行相應的操作。這種數(shù)據(jù)審核的小程序,能快速有效地批量完成系統(tǒng)電子文件的一致性審核,確保導入新系統(tǒng)的電子文件數(shù)量精準無誤,檔案與關聯(lián)電子文件一一對應。
(四)審核輔助工作的實施。已完結全宗數(shù)據(jù)審核輔助工作的實施:1.通過落實數(shù)據(jù)審核監(jiān)管制度,監(jiān)管工作人員參照建立的數(shù)字檔案信息數(shù)據(jù)標準,在審核過程中及審核階段性結束期間,不間斷對已錄入系統(tǒng)數(shù)據(jù)進行核實把關,工作人員責任到位,不斷修正各項數(shù)據(jù),從而確保數(shù)據(jù)質量。2.在數(shù)據(jù)審核過程中,充分應用信息系統(tǒng)安全與數(shù)據(jù)網絡安全防范技術,檔案工作人員通過系統(tǒng)服務器定期更新數(shù)據(jù),并對專門的計算機設置防病毒、防火墻技術,再對交換機、路由器及光纖等網絡設備進行安全監(jiān)管。
五、南京工程學院封閉全宗數(shù) 據(jù)審核工作的意義
(一)數(shù)據(jù)審核是維護檔案信息長期保存的基礎。不論是將檔案數(shù)字化還是直接將電子文件作為檔案保存,都先要涉及數(shù)據(jù)庫系統(tǒng)構建、數(shù)據(jù)管理、數(shù)據(jù)存儲、元數(shù)據(jù)管理等多項數(shù)字檔案長期保存技術,而這些技術的工作基礎就是數(shù)據(jù)庫系統(tǒng)當中的各項數(shù)據(jù)。伴隨信息技術的不斷發(fā)展,保存數(shù)字檔案信息資源的軟硬件環(huán)境隨之變化,當數(shù)據(jù)庫及其他配套軟件升級時,尤其是發(fā)生數(shù)據(jù)遷移時,系統(tǒng)中的數(shù)據(jù)則需相應以新的存儲格式來變換或存儲,出現(xiàn)數(shù)據(jù)的輸入、輸出、傳遞等環(huán)節(jié),每一個環(huán)節(jié)的數(shù)據(jù)處理,都會直接或間接影響整個數(shù)據(jù)庫系統(tǒng)的運作,進而決定保存在系統(tǒng)中的數(shù)字檔案信息資源是否能被識別、檢索,及至利用。由此,檔案工作人員須對數(shù)據(jù)處理的每個環(huán)節(jié)不間斷進行數(shù)據(jù)重新審核、監(jiān)管,確保數(shù)字檔案資源的長期保存。
(二)數(shù)據(jù)審核是確保檔案信息資源有效開發(fā)的關鍵。實現(xiàn)檔案信息資源的開發(fā)利用,要先完成檔案信息資源的數(shù)字化建設,即實現(xiàn)紙質等載體檔案的數(shù)字化及電子文件的歸檔。其中判斷檔案信息數(shù)字化的一項重要指標就是制定數(shù)字檔案的數(shù)據(jù)標準,包括一般數(shù)據(jù)標準及元數(shù)據(jù)標準等。雖然目前國際上還未形成統(tǒng)一的數(shù)據(jù)標準規(guī)范,但國內檔案管理系統(tǒng)中編碼檔案描述方案(即檔案信息資源描述方式)卻大致相同,均含檔案目錄、數(shù)據(jù)模型及文件定義類型等,它們在系統(tǒng)中都以數(shù)據(jù)單元的形式呈現(xiàn)。編碼檔案描述方案作為一種為適應檔案館及數(shù)據(jù)庫的需要而開發(fā)的資源描述方式,為保證數(shù)據(jù)的長期有效,構建過程中檔案工作人員必須要進行數(shù)據(jù)審核,確保其各項組成部分能利用軟件控制系統(tǒng)文件的結構化顯示、查詢及檢索,從而提供數(shù)字檔案開發(fā)利用的渠道。
六、結束語
數(shù)據(jù)審核是保障數(shù)據(jù)遷移工作質量必不可少的環(huán)節(jié),它會直接影響檔案信息的長期保存及開發(fā)利用。正如南京工程學院,雖并校近20年,但為促進合并前3個已完結全宗的檢索利用,學校檔案館在引進新的數(shù)字檔案管理系統(tǒng)的同時,特開展了已完結全宗檔案的信息化建設,積極推進合并前全宗檔案信息的數(shù)據(jù)遷移。在整個遷移過程中,檔案技術人員更是對所有案卷級和文件級目錄格式、電子文件等都進行了全面的審核,并對照核實紙質目錄及館藏檔案,確保了這些數(shù)據(jù)的唯一性。這種保質保量的遷移工作,才是維護檔案信息長期保存的基礎,更是確保檔案信息資源有效開發(fā)的關鍵。
【參考文獻】
[1]南京工程學院歷史沿革[EB/OL]. http://www.njit.edu.cn/xxgk/lsyg.htm.
[2]南京工程學院檔案館簡介[EB/OL]. http://dag.njit.edu.cn/bggk/bgjj.htm.
[3]馮潔.電子文件遷移研究[D].蘇州大學,2012.