文 / 張愛曾
檔案整理有多種方式,廣義上指的是考證、鑒定、編撰檔案,狹義上指的是檔案分類、編制目錄、排列案卷等[1]。檔案整理是為了更方便利用和保管檔案信息。從實(shí)踐角度看,檔案整理包括文本整理和數(shù)據(jù)整理兩大類。隨著現(xiàn)代信息技術(shù)的發(fā)展,各級(jí)檔案館數(shù)字化建設(shè)進(jìn)程加快,檔案整理已不再局限于文本,基于互聯(lián)網(wǎng)的數(shù)據(jù)整理變得越來越重要。
檔案文本不但包含了傳統(tǒng)類型的紙質(zhì)文件,同時(shí)也包含了一些簡(jiǎn)單的電子文件。文本整理是將文件轉(zhuǎn)化成檔案的必備條件之一,無論哪一種類型的文件,都需要通過詳細(xì)的整理才能更好地反映出歷史信息[2]。沒有經(jīng)過整理的只能叫做“原始檔案”,經(jīng)過整理的才是“系統(tǒng)檔案”?!霸紮n案”和“系統(tǒng)檔案”的區(qū)別在于:“原始檔案”僅要求有一定量的檔案信息,“系統(tǒng)檔案”則除了信息之外,還要求各類信息之間根據(jù)預(yù)定的順序進(jìn)行排列,以發(fā)揮出檔案的整體功能?!霸紮n案”僅強(qiáng)調(diào)信息元素的集合,“系統(tǒng)檔案”則進(jìn)一步強(qiáng)調(diào)信息之間的關(guān)系結(jié)構(gòu)。通常來說,只有經(jīng)過整理的具備內(nèi)部關(guān)系結(jié)構(gòu)的檔案,才能更好地反映出各文本信息的歷史關(guān)聯(lián),具備歷史記錄功能及歷史再現(xiàn)功能。
檔案文本整理的發(fā)展源遠(yuǎn)流長(zhǎng),至今已經(jīng)形成比較成熟的原則和方法。早在十六世紀(jì),歐洲檔案界就將“事由原則”作為檔案文本整理的基本原則,用于登記整理各皇室檔案。十八世紀(jì)初,“尊重全宗原則”在法國(guó)誕生,被檔案界廣泛采用。二十世紀(jì)中葉,荷蘭人論證了檔案文本整理的“來源原則”,由此確定了該原則在檔案文本整理中的地位。1908年,德國(guó)著名檔案學(xué)家布倫內(nèi)克構(gòu)建了“自由來源原則”,進(jìn)一步修正了原來的檔案文本整理基本原則,按照一定比例分配檔案信息來源和事由[3]。我國(guó)近現(xiàn)代以來比較流行的是“尊重全宗原則”。何嘉蓀教授提出了“客觀全宗”概念,對(duì)我國(guó)檔案文本整理的影響較大。從檔案文本整理的歷史淵源看,保持文本歷史關(guān)聯(lián)是檔案界永恒的追求。
檔案文本的歷史關(guān)聯(lián)也叫做檔案內(nèi)在關(guān)聯(lián),主要是指文本產(chǎn)生以及處理中構(gòu)建起的內(nèi)部聯(lián)系,一般體現(xiàn)在檔案文本的來源、保存的時(shí)間、信息內(nèi)容及表現(xiàn)形式等方面,其中檔案文本來源的關(guān)聯(lián)最為重要[4]。但是檔案文本來源關(guān)聯(lián)與歷史關(guān)聯(lián)并非是等同的,而只是歷史關(guān)聯(lián)的展現(xiàn)形式之一。當(dāng)前的檔案文本整理有不少只是強(qiáng)調(diào)文本來源關(guān)聯(lián),用這種來源方式掩飾更本質(zhì)與宏觀的歷史關(guān)聯(lián),存在一定的偏頗。所以檔案文本整理要有較高的歷史性原則,而不是只堅(jiān)持本文來源原則。文本歷史關(guān)聯(lián)可以在檔案整理的多個(gè)層次得到應(yīng)用,如全宗劃分層次、檔案分類層次、立卷層次等。此外,保存時(shí)間的關(guān)聯(lián)、信息內(nèi)容的關(guān)聯(lián)、表現(xiàn)形式的關(guān)聯(lián)等,也可以作為檔案歷史劃分的依據(jù),使檔案文本的歷史關(guān)聯(lián)更加豐富。
檔案數(shù)據(jù)是一種數(shù)字化的信息形式,可以在數(shù)據(jù)庫中得到永久保存。相對(duì)于檔案文本來說,數(shù)據(jù)形式有了計(jì)算機(jī)和互聯(lián)網(wǎng)的支持,賦予了檔案整理新的功能及意義。檔案數(shù)據(jù)主要反映出以下三種信息。首先是檔案內(nèi)容,這是檔案的本質(zhì)所在,同時(shí)也是檔案信息最大的主體,可以充分體現(xiàn)出歷史原貌。其次是檔案形式,即檔案信息格式、代碼標(biāo)準(zhǔn)、排列規(guī)則等。再次是數(shù)據(jù)載體,即數(shù)據(jù)通過怎樣的平臺(tái)進(jìn)行整理和傳輸。由此可見,檔案數(shù)據(jù)的整理方式,主要圍繞內(nèi)容、形式、載體進(jìn)行,將內(nèi)容進(jìn)行數(shù)字化處理,形成適合網(wǎng)絡(luò)儲(chǔ)存和傳播的格式,而載體也多種多樣,包括數(shù)據(jù)庫、網(wǎng)絡(luò)平臺(tái)、各種新媒體等。檔案數(shù)據(jù)整理在文本整理的基礎(chǔ)上有了大幅飛躍,在理論意義上可以達(dá)到永久保存,儲(chǔ)存空間也更大,在信息分析、傳輸、修正等方面具備更多優(yōu)勢(shì)。
通過檔案數(shù)據(jù)整理,形成了豐富的數(shù)據(jù)檢索目錄,如全文索引、題目索引、案卷索引等,或者根據(jù)文號(hào)、類型、地名、人名等進(jìn)行檢索,構(gòu)建一個(gè)全面性的搜索網(wǎng)絡(luò),使檔案數(shù)據(jù)在整理之后能夠提供強(qiáng)大的服務(wù)功能。而隨著互聯(lián)網(wǎng)及信息技術(shù)的發(fā)展,檔案數(shù)據(jù)整理更方便地對(duì)每一份檔案所包含的信息進(jìn)行詳細(xì)描述,有效錄入單份檔案的全部特征,并通過網(wǎng)絡(luò)平臺(tái)任意組合這些特征,在多途徑的條件下實(shí)現(xiàn)全方位檢索。檔案數(shù)據(jù)整理既反映了各檔案信息的歷史關(guān)聯(lián),又反映了信息之間的邏輯聯(lián)系。從這方面看,檔案數(shù)據(jù)整理在很大程度上超越了文本整理,但又離不開文本整理的特質(zhì)。首先,文本整理作為原始檔案最初的整理形式,在檔案管理過程中不可或缺,數(shù)據(jù)整理需要文本整理的支撐,才能發(fā)揮出更大的作用。其次,數(shù)據(jù)整理是文本整理的“加強(qiáng)版”,甚至在某些情況下可以脫離文本整理,在互聯(lián)網(wǎng)上采集更多的信息,但許多珍貴的權(quán)威的檔案,還是需要文本進(jìn)行提供。
檔案數(shù)據(jù)整理需要一定的載體才能順利實(shí)現(xiàn)。從當(dāng)前的情況看,檔案數(shù)據(jù)整理的載體形式主要有數(shù)據(jù)庫、信息采集軟件、文本掃描系統(tǒng)、智能檢索系統(tǒng)及各類新媒體等[5]。其中數(shù)據(jù)庫建設(shè)是檔案數(shù)據(jù)整理的核心環(huán)節(jié),只有具備合適的數(shù)據(jù)庫,才能使檔案數(shù)據(jù)整理有實(shí)踐意義。目前比較流行的數(shù)據(jù)庫有SQL server、Oracle、Aceess、MySQL等,具體采用哪種數(shù)據(jù)庫要視數(shù)據(jù)系統(tǒng)的實(shí)際情況而定。信息采集軟件則是用于捕捉網(wǎng)絡(luò)相關(guān)信息,不斷豐富檔案資源庫內(nèi)容。文本掃描系統(tǒng)用于檔案文本的掃描著錄,對(duì)原始文本進(jìn)行數(shù)字化處理。智能檢索系統(tǒng)是提供檔案服務(wù)的重要方式,用戶可以通過各類型的檢索享受到檔案數(shù)據(jù)整理所帶來的便利性。此外,隨著網(wǎng)絡(luò)新媒體的快速普及,越來越多的檔案館開始通過新媒體平臺(tái)傳播信息,如通過官方微博、微信公共號(hào)等,為廣大用戶提供檔案服務(wù)入口,增進(jìn)檔案館與用戶之間的聯(lián)系,使數(shù)據(jù)系統(tǒng)有更多的平臺(tái)對(duì)公眾開放服務(wù)。
檔案是為社會(huì)服務(wù)的,這是一個(gè)不爭(zhēng)的事實(shí)。社會(huì)的發(fā)展離不開人類的各種社會(huì)活動(dòng),這些實(shí)踐活動(dòng)涵蓋了社會(huì)的方方面面,甚至具體到每一個(gè)事件,都會(huì)生成一定的檔案信息。與此相對(duì)應(yīng)的是,所有檔案信息都有一個(gè)屬于自己的具體事件。而當(dāng)社會(huì)實(shí)踐活動(dòng)完成之后,事件就會(huì)成為一段歷史。無論是檔案文本整理還是數(shù)據(jù)整理,都存在著歷史關(guān)聯(lián)性,這也說明兩種整理都是為了實(shí)現(xiàn)檔案的社會(huì)性。歷史和檔案也是相對(duì)應(yīng)的,檔案有著較強(qiáng)的歷史價(jià)值,即便時(shí)過境遷,原來的社會(huì)活動(dòng)場(chǎng)景已無法再現(xiàn),但檔案記錄了當(dāng)時(shí)的痕跡,提供給后人查閱的機(jī)會(huì)。傳統(tǒng)檔案整理主要是文本整理模式,相對(duì)來說在全面性和保存性方面有所欠缺,但檔案文本是最原始、最真實(shí)的信息,同時(shí)也是檔案數(shù)據(jù)的母體,絕大多數(shù)的檔案數(shù)據(jù)都是通過檔案文本數(shù)字化轉(zhuǎn)變而來的。所以,充分發(fā)揮檔案數(shù)據(jù)整理的優(yōu)勢(shì),填補(bǔ)文本整理中的空缺,有利于找到檔案和歷史的一一對(duì)應(yīng)之處,最終揭開歷史真實(shí)的“面紗”。
檔案與社會(huì)活動(dòng)關(guān)聯(lián)密切,兩者的主客體關(guān)系也是動(dòng)態(tài)的。在社會(huì)實(shí)踐活動(dòng)發(fā)展的過程中,逐漸形成有價(jià)值的檔案。在這種情況下,社會(huì)活動(dòng)是主體,檔案是客體。當(dāng)社會(huì)活動(dòng)結(jié)束以后,逐漸成為一段歷史,只在檔案中留下記錄痕跡,這時(shí)檔案就變?yōu)橹黧w了。檔案文本整理主要是為了分類原始檔案,對(duì)已經(jīng)發(fā)生的社會(huì)活動(dòng)進(jìn)行重構(gòu)。任何歷史片段都是由社會(huì)活動(dòng)碎片組成的。檔案工作者在厘清檔案與社會(huì)活動(dòng)的關(guān)系之后,需要對(duì)這些碎片進(jìn)行必要的整理,確保檔案信息的真實(shí)性,能夠?qū)ι鐣?huì)負(fù)責(zé)、對(duì)歷史負(fù)責(zé)[6]。而檔案數(shù)據(jù)整理則是基于文本整理發(fā)展起來的,在幫助文本整理重構(gòu)社會(huì)活動(dòng)方面,數(shù)據(jù)整理可以起到很好的輔助作用。首先,數(shù)據(jù)的便捷性擴(kuò)大了社會(huì)活動(dòng)的重構(gòu)范圍,有助于檔案文本滿足多樣性的社會(huì)活動(dòng)利用需求。其次,在社會(huì)活動(dòng)重構(gòu)的過程中,檔案文本提供了詳細(xì)的依據(jù),重要文本內(nèi)容可以進(jìn)行數(shù)字化處理,形成長(zhǎng)久的保存方案,將一些社會(huì)活動(dòng)資料納入到數(shù)據(jù)整理中,從而形成文本和數(shù)據(jù)的雙重保護(hù)。
文本整理是一項(xiàng)傳統(tǒng)的檔案整理方式,需要大量的人工處理,工作效率較低。而數(shù)據(jù)處理借助計(jì)算機(jī)和互聯(lián)網(wǎng),形成了自動(dòng)化的處理模式,極大地解放了人力。在數(shù)字化時(shí)代,檔案信息可以在不同的載體上面自由轉(zhuǎn)換,提升了檔案整理效率。但這只是一種整理模式上的進(jìn)步,文本整理依然不可或缺,兩者是一個(gè)有機(jī)的整體。許多卷宗還是需要經(jīng)過文本的初步整理,才能提供更多的數(shù)據(jù)來源。從形式上看,文本整理是一種有形的整理,而數(shù)據(jù)整理超越了紙質(zhì)資料,將有形化為無形,可以在網(wǎng)絡(luò)平臺(tái)上實(shí)現(xiàn)深度檢索[7]。對(duì)于文本整理來說,文件排列與著錄是隔離的,需要單獨(dú)進(jìn)行,而數(shù)據(jù)整理則有效合并了這兩個(gè)環(huán)節(jié),這樣可以解決文件不能及時(shí)著錄的問題,更真實(shí)地對(duì)歷史情況進(jìn)行反映。無論是檔案文本還是檔案數(shù)據(jù),具備更多聯(lián)系的“文件集合”遠(yuǎn)比單一文件的價(jià)值高,這就需要兩種處理方式相互補(bǔ)充,發(fā)掘出一定數(shù)量的“文件集合”功能,全面提升文本整理的覆蓋范圍,并使數(shù)據(jù)整理具備豐富的資源潛力。
信息裂變是數(shù)據(jù)的一大關(guān)鍵功能,在數(shù)據(jù)整理中,信息裂變可以大大拓展檔案文本的范圍。例如數(shù)據(jù)整理捕捉到一條原始的文本信息,就會(huì)比對(duì)數(shù)據(jù)庫中是否存在關(guān)聯(lián)信息,這樣就會(huì)發(fā)現(xiàn)第二條、第三條甚至更多的相關(guān)信息,而且后面的信息也可能存在關(guān)聯(lián)度,這樣就產(chǎn)生了信息裂變現(xiàn)象,使得一條檔案信息能夠帶出一系列的關(guān)聯(lián)信息。數(shù)據(jù)整理根據(jù)檔案文件之間的邏輯聯(lián)系,構(gòu)建起一個(gè)龐大的數(shù)據(jù)檢索系統(tǒng),有利于信息裂變的快速實(shí)現(xiàn)。這種現(xiàn)象在生活中有著極大的應(yīng)用價(jià)值,例如歷史學(xué)家在翻閱歷朝歷代文本檔案的同時(shí),可以通過數(shù)據(jù)系統(tǒng)的搜索,全面掌握與主題相關(guān)的各種信息,便于自身的專題研究;地質(zhì)學(xué)家在分析地震災(zāi)害的過程中,除了翻閱氣象檔案之外,還可以借助信息裂變的方式,深入數(shù)據(jù)系統(tǒng)查找相關(guān)信息,這有利于地震災(zāi)害原因的準(zhǔn)確發(fā)現(xiàn),根據(jù)一定規(guī)律現(xiàn)象為地震預(yù)防提供決策依據(jù)。由此可見,無論是文本整理還是數(shù)據(jù)整理,都能在信息裂變的基礎(chǔ)上擴(kuò)大檢索范圍,在提高檔案文本利用價(jià)值的同時(shí),也使數(shù)據(jù)系統(tǒng)發(fā)揮出更大的效用。
參考文獻(xiàn):
[1]呂永明.檔案整理和數(shù)字化加工服務(wù)外包的實(shí)踐與思考[J].檔案與建設(shè),2016(8):69-71.
[2]劉麗平.歸檔文件按“件”還是按“卷”整理問題研究[J].北京檔案,2017(4):21-24.
[3]鄭慧玲.檔案的物質(zhì)結(jié)構(gòu)與檔案整理[J].山西檔案,2014(2):48-50.
[4]王協(xié)舟,尹偉灃.《歸檔文件整理規(guī)則》解讀——基于新舊規(guī)則兩個(gè)標(biāo)準(zhǔn)的文本分析[J].檔案學(xué)通訊,2017(4):75-79.
[5]朱琪.民國(guó)檔案數(shù)字化前原數(shù)據(jù)整理編目[J].中國(guó)檔案,2015(2):50-51.
[6]郭鵬.北京大學(xué)對(duì)清代內(nèi)閣大庫檔案的整理及其啟示[J].山西檔案,2016(6):15-17.
[7]王勤.規(guī)范檔案整理 促進(jìn)檔案移交——解讀《中央檔案館文件級(jí)檔案接收質(zhì)量檢查辦法》[J].中國(guó)檔案,2016(12):29.