任冬莉 華宏
中共中央辦公廳、國務(wù)院辦公廳印發(fā)的《國家電子文件管理“十三五”規(guī)劃》(以下簡稱《規(guī)劃》)中提出“十三五”電子文件管理工作目標(biāo),“到2020年,電子文件管理體制機(jī)制和法規(guī)制度更加健全,電子文件法律地位和行政效力得以確立;電子文件保管利用更加規(guī)范,國家對核心電子文件資源的管理進(jìn)一步加強(qiáng);主要基礎(chǔ)標(biāo)準(zhǔn)和重點(diǎn)行業(yè)標(biāo)準(zhǔn)制定發(fā)布,逐步形成比較完備的標(biāo)準(zhǔn)體系;電子文件管理在重點(diǎn)領(lǐng)域和重點(diǎn)信息系統(tǒng)中得到廣泛應(yīng)用……”并在主要任務(wù)部分中提出“明確各類電子文件歸檔范圍和構(gòu)成要求,推進(jìn)立檔單位向同級國家綜合檔案館移交電子檔案”?!兑?guī)劃》確立了電子文件管理工作在檔案事業(yè)中的重要地位,提出的工作目標(biāo)也成為“十三五”期間檔案工作的主要任務(wù)之一。國家檔案局基于《文書類電子文件元數(shù)據(jù)》(DA/T 46-2009)、《版式電子文件長期保存格式需求》(DA/T 47-2009)和《基于XML的電子文件封裝規(guī)范》(DA/T 48-2009)標(biāo)準(zhǔn)制定并于2012年發(fā)布的《電子檔案移交與接收辦法》,則成為各級國家綜合檔案館開展電子檔案移交與接收工作的標(biāo)準(zhǔn)依據(jù)。
南京市檔案館為配合國家檔案局的測評工作于今年初開展了電子檔案移交與接收的試點(diǎn)工作。通過試點(diǎn),結(jié)合工作中發(fā)現(xiàn)的問題和困難,我們對如何開展好電子檔案的移交與接收有了一定的認(rèn)識,也多了些思考。
一、試點(diǎn)目的和試點(diǎn)單位選擇
1.試點(diǎn)的目的
隨著社會信息化程度的提高,OA系統(tǒng)的廣泛使用,特別是近年來檔案信息化進(jìn)程的推進(jìn)和數(shù)字檔案室的建設(shè),大量的電子文件、電子檔案應(yīng)運(yùn)而生?!峨娮訖n案移交與接收辦法》規(guī)定,電子檔案自形成之日起滿五年就應(yīng)該向同級國家檔案館移交。按此規(guī)定的年限,電子檔案的移交和接收必須提上日程。但對檔案館而言,電子檔案的接收完全不同于傳統(tǒng)的接收工作,不僅是形式、流程和標(biāo)準(zhǔn)的不同,更重要的是手段和方法的不同。單靠《電子檔案移交與接收辦法》無法很好地完成電子檔案的移交和接收,必須結(jié)合實(shí)際,提出一個(gè)科學(xué)、有效、實(shí)用的移交和接收辦法。我們力圖通過試點(diǎn)工作,為全面開展電子檔案的移交與接收提供一個(gè)范本式的模型,并根據(jù)國家的相關(guān)標(biāo)準(zhǔn)和要求,對電子檔案移交與接收工作的流程、方法和要求制定一個(gè)實(shí)施辦法,即出臺《南京市電子檔案移交與接收實(shí)施辦法》,以規(guī)范全市的電子檔案移交與接收工作。
2.試點(diǎn)單位的選擇
截至2017年底,在進(jìn)館名錄的一級單位中共有9家單位的檔案室通過了4A以上數(shù)字檔案室的評定。其中一家檔案室還通過了國家檔案局示范數(shù)字檔案室的驗(yàn)收。我們從高起點(diǎn)、高標(biāo)準(zhǔn)的立意上選擇了該檔案室作為試點(diǎn)單位。旨在通過試點(diǎn)對提升全市的電子檔案移交與接收工作起到促進(jìn)作用,也突出其示范、標(biāo)桿的作用。同時(shí)我們對9家4A以上的數(shù)字檔案室進(jìn)行了問卷調(diào)查,調(diào)查內(nèi)容包括:電子檔案類別、電子檔案的文件格式、是否使用封裝包、是否使用CA、與OA銜接情況和電子檔案備份情況等。由于調(diào)查問卷的回收率不能令人滿意,后期我們又通過電話詢問和實(shí)地調(diào)研走訪對未提交問卷的單位進(jìn)行了調(diào)查。
二、試點(diǎn)工作內(nèi)容及情況
1.擬定工作草案
我們在參考了大量的文獻(xiàn)資料后,根據(jù)對相關(guān)標(biāo)準(zhǔn)、要求的理解,特?cái)M定了一個(gè)關(guān)于電子檔案“四性”檢測具體內(nèi)容和方法的草案,明確工作內(nèi)容和要求,據(jù)此進(jìn)行電子檔案的接收工作。
準(zhǔn)確性檢測,主要是對目錄信息準(zhǔn)確性、目錄和電子檔案內(nèi)容關(guān)聯(lián)準(zhǔn)確性、電子檔案內(nèi)容準(zhǔn)確性及電子檔案封裝包準(zhǔn)確性進(jìn)行檢測。包括電子檔案目錄信息是否符合檔案著錄規(guī)則要求的類型、長度、格式和值域,目錄信息內(nèi)容是否合理;電子檔案內(nèi)容與目錄信息是否關(guān)聯(lián),電子檔案元數(shù)據(jù)和目錄信息標(biāo)注是否一致;數(shù)字簽名和電子印章的檔案內(nèi)容的有效性;電子檔案封裝包的有效性等。
完整性檢測,主要是對電子檔案總量、目錄項(xiàng)目完整性、電子檔案完整性及電子檔案封裝包完整性進(jìn)行檢測。包括電子檔案數(shù)量與預(yù)定的移交接收數(shù)據(jù)量是否一致,檔案目錄項(xiàng)目是否填寫齊全,具有連續(xù)編號的數(shù)據(jù)(案卷號、件號、文號)是否有漏號現(xiàn)象,反映重要問題的電子檔案是否包括主要修改過程和辦理情況記錄,電子檔案內(nèi)容是否齊全完整,電子檔案封裝包的必填元數(shù)據(jù)是否完整等。
可用性檢測,主要是對目錄數(shù)據(jù)可用性、電子檔案內(nèi)容可用性、電子檔案內(nèi)容軟硬件環(huán)境進(jìn)行檢測。包括電子檔案目錄數(shù)據(jù)是否可以被正常訪問,電子檔案內(nèi)容是否可以被正常打開和瀏覽,電子檔案格式是否有利于長久保存,電子檔案的內(nèi)容大小是否與元數(shù)據(jù)記錄的大小一致,數(shù)字化加工的電子檔案內(nèi)容的相關(guān)指標(biāo)是否符合移交接收和長期保存的規(guī)定要求,電子檔案元數(shù)據(jù)中記錄的軟硬件環(huán)境是否符合移交接收和長期保存的規(guī)定等。
安全性檢測,主要是對目錄數(shù)據(jù)安全性、電子檔案病毒及軟件系統(tǒng)安全性進(jìn)行檢測。包括目錄數(shù)據(jù)著錄項(xiàng)目中的密級和控制標(biāo)識是否規(guī)范,電子檔案是否感染病毒,系統(tǒng)是否有隱含的安全漏洞等,確保電子檔案利用安全;防止電子檔案被刪除、更改。
其他還有關(guān)于移交載體的檢測。包括了移交數(shù)據(jù)的組織結(jié)構(gòu)等內(nèi)容。
2.接收電子檔案
本次檔案室移交的為2008—2013年永久、定期30年的電子檔案。包括電子檔案目錄2132條、電子檔案2060件(EEP包)和封裝軟件2件。移交方式為離線移交,移交載體為移動(dòng)硬盤。
南京市審計(jì)局自2008年起通過OA系統(tǒng)形成電子文件,并根據(jù)本單位的“歸檔范圍和保管期限表”對電子文件進(jìn)行了歸檔,形成了電子檔案。檔案室2013年起啟用了根據(jù)江蘇省地方標(biāo)準(zhǔn)《電子檔案基礎(chǔ)元數(shù)據(jù)數(shù)據(jù)庫結(jié)構(gòu)和封裝格式》(DB32/T1893-2011)制作的封裝包(EEP)。2016年根據(jù)《基于XML的電子文件封裝規(guī)范》(DA/T 48-2009)標(biāo)準(zhǔn)重新制作了封裝包,且部分文件進(jìn)行了CA認(rèn)證?,F(xiàn)使用的檔案管理模塊是嵌入本單位的OA系統(tǒng),由本單位自主研發(fā),真正意義上實(shí)現(xiàn)了無縫連接。
三、存在的問題與困難
南京市審計(jì)局的檔案工作多年來一直處于全市機(jī)關(guān)檔案工作的前列。檔案管理基本做到了有制度可循,有流程可控。在全市率先創(chuàng)建了5A數(shù)字檔案室,并于2017年通過國家檔案局的示范數(shù)字檔案室的驗(yàn)收。良好的工作基礎(chǔ)為我們開展電子檔案的移交與接收創(chuàng)造了很好的條件,也可以說試點(diǎn)單位的選擇具備了示范性和參考性。
我們根據(jù)“電子檔案‘四性’檢測方法(草稿)”的要求,對移交的電子檔案逐項(xiàng)進(jìn)行了檢測。(下列的問題僅限于本次試點(diǎn)工作)
1.檔案移交中的問題
(1)電子檔案目錄不規(guī)范?!叭掌凇表?xiàng)中填寫的為封裝日期而非文件形成日期;“密級”項(xiàng)中雖標(biāo)識了文件密級情況,但限制和內(nèi)部使用文件均只在“備注”項(xiàng)中標(biāo)識;目錄字段中缺少“文件大小”項(xiàng)。
(2)目錄數(shù)量與文件數(shù)量不一致。移交目錄2132條,減去71件涉密、限制和內(nèi)部使用文件,應(yīng)收EEP文件2061件,但實(shí)收數(shù)量為2060件,缺少1件(重復(fù)一次后仍缺少件),說明系統(tǒng)導(dǎo)出有缺失。需要說明的是,這里的文件數(shù)量實(shí)際是EEP的數(shù)量,而每個(gè)EEP內(nèi)還包括了從起草到正本的過程文件,數(shù)量是定稿和正本的幾倍。僅以此次移交為例,目錄是2132條,而文件總數(shù)卻是12081件。
(3)部分文件缺少數(shù)字簽名。因我館于2017年11月進(jìn)行網(wǎng)絡(luò)改造,造成兩端不通,現(xiàn)無法進(jìn)行CA認(rèn)證。
(4)部分原文打不開。造成此問題的原因是原發(fā)(收)文即為PDF格式文件,系統(tǒng)進(jìn)行批量數(shù)據(jù)格式轉(zhuǎn)換存在缺陷。
(5)在文件的命名上有不妥之處。收文(CEB格式)命名為“定稿”,轉(zhuǎn)換格式后的文件(PDF格式)命名為“正文”,這個(gè)命名方法不符合文書學(xué)中稿本定義的規(guī)則,有待商榷。
(6)壓縮文件不醒目。有壓縮文件4件,因在封裝包內(nèi),一時(shí)難以發(fā)現(xiàn)。
(7)檔號的命名需修改。新的《歸檔文件整理規(guī)則》的檔號命名方法應(yīng)從2017年起,而本次移交的電子檔案的檔號命名已經(jīng)通過系統(tǒng)重新統(tǒng)一更改。
需要說明的是,(4)(5)問題的出現(xiàn)都是因?yàn)閿?shù)字檔案室要求歸檔文件必須為PDF格式而導(dǎo)致的。
2.檔案接收中的困難
(1)檢測自動(dòng)化水平低。因無檢測軟件,所有檢測項(xiàng)目全靠人工分步、分項(xiàng)進(jìn)行,檢測質(zhì)量很難保證。同時(shí)檢測效率低下,如遇大批量電子檔案移交,將無法應(yīng)付。
(2)有些檢測項(xiàng)目無法界定和落實(shí)。例如殺毒的問題,不同的軟件針對不同的病毒,且病毒也是不斷地變化形式。我們不可能用一個(gè)軟件殺盡所有的病毒,因此就無法界定是否有病毒。
(3)封裝包的問題。本次進(jìn)館共移交了兩個(gè)版本的封裝包。2013年起啟用了根據(jù)江蘇省地方標(biāo)準(zhǔn)《電子檔案基礎(chǔ)元數(shù)據(jù)數(shù)據(jù)庫結(jié)構(gòu)和封裝格式》(DB32/T1893-2011)制作的封裝包(EEP)。2016年根據(jù)《基于XML的電子文件封裝規(guī)范》(DA/T 48-2009)標(biāo)準(zhǔn)重新制作了封裝包,且2016年版的封裝軟件不能兼容2013年版的封裝軟件。但在具體的電子檔案封裝檢測時(shí)卻不能完全對應(yīng)封裝包研發(fā)年度。在2008年到2013年的封裝檔案中既有2013年研發(fā)的封裝包文件,也有2016年研發(fā)的封裝包文件。因此,在檢測中如果遇到文件打不開的情況,就必須要分別用兩個(gè)不同的封裝軟件進(jìn)行試用。本次移交的2016年版的封裝軟件不能兼容2013年版。
(4)關(guān)于“四性”檢測的問題。我們擬定的“四性”檢測方案只是對“四性”的初步認(rèn)識,一定會有不足之處。但“四性”測什么?如何測?也一直是困擾檔案界的問題。國家檔案局近期頒布了《文書類電子檔案檢測一般要求》(DA/ T70-2018),為我們更好地開展電子檔案的“四性”檢測工作提供了依據(jù)。
四、存在問題的原因分析
針對以上問題,結(jié)合對數(shù)字檔案室的問卷調(diào)查和對部分?jǐn)?shù)字檔案室的調(diào)研,我們對一些問題進(jìn)行了分析,有了一些新認(rèn)識。
1.電子檔案類別單一
本次接收的電子檔案來源于數(shù)字檔案室,因此必定會受到數(shù)字檔案室的局限。本次接收的電子檔案是通過OA管理系統(tǒng)導(dǎo)出,主要是收文和發(fā)文,沒有公務(wù)郵件,也沒有網(wǎng)絡(luò)資源的歸檔。接收的電子檔案不包括數(shù)碼照片和業(yè)務(wù)檔案。我們分析是由于系統(tǒng)建設(shè)時(shí)沒有考慮到或無可參考的標(biāo)準(zhǔn)規(guī)范。如《數(shù)碼照片歸檔與管理規(guī)范》(DA/T 50-2014)、《照片類電子檔案元數(shù)據(jù)方案》(DA/T 54-2014)和《錄音錄像類電子檔案元數(shù)據(jù)方案》(DA/T 63-2017)等標(biāo)準(zhǔn)頒布滯后,一旦系統(tǒng)研發(fā)基本完成,很難作大的修改和補(bǔ)充。
問卷調(diào)查的“檔案類別”項(xiàng)也同樣反映出此問題,歸檔類別簡單,絕大部分為公文,照片、影像少許,網(wǎng)頁、郵件為零,僅有一家填寫了有業(yè)務(wù)檔案。
2.電子檔案格式問題
數(shù)字檔案室要求歸檔的電子檔案格式為PDF格式,非PDF格式文件要轉(zhuǎn)換成PDF格式歸檔。這里我們不討論格式轉(zhuǎn)換的可行性和可靠性等問題,指定單一格式本身就不合理。根據(jù)《電子文件歸檔與管理規(guī)范》(GB/T 18894-2002)、《公務(wù)電子郵件歸檔與管理規(guī)則》(DA/T32-2005)及《版式電子文件長期保存格式需求》(DA/T47-2009)標(biāo)準(zhǔn)的要求,CEB、PDF、 OFD、HTML、XML等格式都是允許歸檔的文件格式。目前廣泛使用的網(wǎng)絡(luò)資源存檔格式WARC也已成為國家標(biāo)準(zhǔn),如《信息和文獻(xiàn)WARC文件格式》(GB/T33994-2017)。早在2014年,美國國家檔案與文件署(NARA)就更新了《永久電子文件移交格式指南》(NARA Bulletin 2014-04),以列表形式明確了NARA接收電子文件類型和格式范圍,共10類約70種格式。每類電子文件的格式都明確了推薦格式、可接收格式及壓縮算法。在信息技術(shù)高速發(fā)展的環(huán)境中,檔案部門如不能采取開放的態(tài)度,不僅會影響檔案資源的豐富和完整,還將與整個(gè)社會漸行漸遠(yuǎn)。
問卷調(diào)查的“文件格式”項(xiàng)的情況要比試點(diǎn)單位多些,有CEB、PDF和XML等。
3.元數(shù)據(jù)問題
本次移交的電子檔案是包括元數(shù)據(jù)的。在元數(shù)據(jù)問題上我們沒有過多的糾結(jié),因?yàn)槟壳皩?shí)施的歸檔電子文件目錄的著錄項(xiàng)基本包含了《文書類電子元數(shù)據(jù)方案》中的關(guān)鍵元數(shù)據(jù)。但我們必須注意到2016年頒布的《黨政機(jī)關(guān)電子公文元數(shù)據(jù)規(guī)范》(GB/T33480-2016)中的關(guān)鍵元數(shù)據(jù)僅有18個(gè),且與《文書類電子元數(shù)據(jù)方案》的關(guān)鍵元數(shù)據(jù)存在一定的差異。下一步如何調(diào)整與統(tǒng)一非常重要,否則就失去了元數(shù)據(jù)的本來意義。也有研究人員發(fā)現(xiàn),元數(shù)據(jù)在遷移過程中有損失,特別是在兩個(gè)不同系統(tǒng)間的轉(zhuǎn)移時(shí)甚至有丟失的情況,這個(gè)問題應(yīng)該引起我們的重視。
4. CA的問題
本次移交因特殊原因此項(xiàng)沒有進(jìn)行。我們以為,有關(guān)CA的問題必須從OA或公文系統(tǒng)源頭上解決,單靠一個(gè)數(shù)字檔案室不可能解決電子公文管理方面的所有問題。CA認(rèn)證要具備一些條件和環(huán)境,除此之外,還涉及移出方、接收方和第三方,其中一方有變化就無法進(jìn)行認(rèn)證。
5.封裝的問題
這里的封裝不單指封裝包版本的問題,還包括封裝在哪個(gè)階段進(jìn)行,封裝哪些文件等。關(guān)于封裝包的利用問題,我們在調(diào)研中也聽到了不同的聲音。問卷調(diào)查顯示僅有一個(gè)單位實(shí)施了封裝。
(1)封裝時(shí)間。是在年度歸檔時(shí)完成封裝,還是在檔案移交進(jìn)館時(shí)進(jìn)行封裝各有利弊。封裝的目的是防篡改,根據(jù)文件的生命周期理論,檔案在檔案室保管階段的利用率是最高的。在檔案室保管階段,封裝了的文件體量在利用過程中會越來越大,而大部分?jǐn)?shù)據(jù)會變成冗余數(shù)據(jù)。一般檔案室的電子檔案利用都是在系統(tǒng)中通過申請、審批、批準(zhǔn)后方能使用。且會根據(jù)設(shè)置的權(quán)限,只能瀏覽或下載,要通過系統(tǒng)去篡改是很難的。所以,絕大部分檔案室沒有采用歸檔就封裝的方法。
(2)封裝內(nèi)容。是封裝所有(從文件起草至正本)文件,還是僅封裝定稿和正本?對應(yīng)紙質(zhì)檔案的歸檔要求,我們認(rèn)為僅封裝定稿和正本就可以。我們也分析了封裝所有文件的情況,有相當(dāng)一部分的文件為無重大修改、指示的過程文件,且在系統(tǒng)中操作人員用代碼替代的情況非常普遍。若干年后要查找代碼對應(yīng)的人員名單難度也會不小,故全部封裝的意義不大。
(3)封裝軟件。一般封裝軟件是由各單位委托科技公司研發(fā)的。科技公司不僅要根據(jù)各單位的OA情況、基于一個(gè)操作系統(tǒng)定制軟件,還會因標(biāo)準(zhǔn)規(guī)范的更迭,更新版本或打補(bǔ)丁包。當(dāng)新版本兼容老版本時(shí),只要新版本即可;但若新版本不兼容老版本時(shí),問題就很多了。要在兩個(gè)版本間交替使用,無形中增加了工作量,還會造成判斷失誤,同時(shí)會因操作系統(tǒng)的原因,影響封裝軟件的使用。并且,若每個(gè)進(jìn)館單位都要移交封裝軟件,那么檔案館僅單一用途的軟件就要保留若干個(gè),后續(xù)很難維護(hù)。雖說封裝軟件是基于XML開發(fā)的,但要在系統(tǒng)中利用一個(gè)封裝軟件去瀏覽所有移交的封裝文件,還存在很多的問題和不便。
五、對策思考
電子檔案的移交與接收工作是我們即將面臨的一項(xiàng)新工作。古人云“工欲善其事,必先利其器”,根據(jù)全市的情況,結(jié)合本次試點(diǎn),我們建議當(dāng)下要抓緊做好兩件事情。
一是編制并出臺《南京市電子檔案移交與接收實(shí)施辦法》。以國家檔案局的《電子檔案移交與接收辦法》為依據(jù),細(xì)化條款,力求做到科學(xué)、合理、可操作、可實(shí)施。在《實(shí)施辦法》中要明確移交電子檔案的基本要求、基本流程、類型與格式、“四性”檢查要求等。
二是開發(fā)“電子檔案移交與接收”模塊。在現(xiàn)有的文檔一體化系統(tǒng)中增加“電子檔案移交與接收”模塊,實(shí)現(xiàn)電子檔案的在線移交。“電子檔案移交與接收”模塊要具有“四性”檢測功能、CA認(rèn)證功能,并提供統(tǒng)一的封裝軟件。提供統(tǒng)一的封裝軟件非常重要,它不僅有利于電子檔案的永久有效保存,更有利于檔案館的檔案利用。
互聯(lián)網(wǎng)、大數(shù)據(jù)、人工智能等信息技術(shù)對檔案工作產(chǎn)生了極其深刻的影響,極大地改變了檔案工作的內(nèi)容、方法和手段,檔案工作正在經(jīng)歷一個(gè)從接收保管紙質(zhì)檔案到接收保管電子檔案,從管理檔案實(shí)體到管理電子數(shù)據(jù),從手工操作到信息化智能化操作,從檔案資源分散利用到互聯(lián)網(wǎng)共享的變革過程。需要加快推進(jìn)檔案工作的轉(zhuǎn)型升級,逐步實(shí)現(xiàn)以信息化為核心的檔案管理現(xiàn)代化。我們通過試點(diǎn),結(jié)合工作實(shí)踐提出了一點(diǎn)認(rèn)識與建議,目的是希望大家重視,能有更多的人參與討論,進(jìn)一步做好檔案館電子檔案的移交與接收工作。