文/哈爾濱工程大學(xué)檔案館 車艷紅
高校實現(xiàn)檔案館藏數(shù)字化的途徑主要有三個方面:包括了學(xué)校獨立完成建檔、檔案館之間相互合作、館藏檔案數(shù)字化工作外包。文章探討高校對檔案數(shù)字化建設(shè)的管理,研究以外包的方法來建設(shè)檔案數(shù)字化。
高校紙質(zhì)檔案實現(xiàn)數(shù)字化的途徑主要有三方面:
(一)學(xué)校獨立完成建檔。高校應(yīng)獨立完成檔案數(shù)字化建設(shè),根據(jù)高校的實際情況,比如高校的經(jīng)濟情況,人力情況等,制定合理的開展目標(biāo),完成高校檔案的數(shù)字化轉(zhuǎn)換工作。
(二)檔案館之間相互合作。相互合作可以在人才和技術(shù)方面解決問題,很多時候館藏檔案數(shù)字化的開展,不能夠保證質(zhì)量,主要因素是人才上的缺少,經(jīng)過各個館藏之間的相互合作,可以有效解決技術(shù)人才問題,實現(xiàn)館藏檔案數(shù)字化工作。
(三)館藏檔案數(shù)字化工作外包。外包工作能夠很好地保證數(shù)字化質(zhì)量問題,而且完成效率會更高。
隨著現(xiàn)代科學(xué)技術(shù)的不斷發(fā)展,高校館藏檔案實施數(shù)字化技術(shù)上的問題得到了逐步完善,實現(xiàn)數(shù)字化策略方面,主要存在的問題是數(shù)字化成本承受能力問題。出現(xiàn)的成本問題主要包括三個方面的成本,也就是在人力投入上出現(xiàn)的成本問題、時間投入上出現(xiàn)的成本問題和在資金投入上出現(xiàn)的成本問題。因此高校館藏檔案數(shù)據(jù)化建設(shè)時,要根據(jù)各自單位在時間、人力和財力上的具體情況,對高校館藏檔案開展數(shù)字化建設(shè)。本文關(guān)于實現(xiàn)館藏檔案數(shù)字化建設(shè),主要是從外包數(shù)字化建設(shè)方面寫作,以此來實現(xiàn)高校館藏檔案數(shù)字化。
(一)高校館藏數(shù)字化建設(shè)內(nèi)容。建設(shè)高校館藏檔案數(shù)字化,其主要建設(shè)內(nèi)容有三個方面:1.檔案專題建庫,并且在建立的數(shù)據(jù)庫要提供使用,而且在建庫前要對檔案專題信息化采集。2.建立檔案目錄信息化和數(shù)字化,而且要對該目錄下的內(nèi)容建立數(shù)據(jù)庫。3.實施載體檔案的數(shù)字化,這些方面的工作,主要是將一些紙質(zhì)檔案數(shù)字化,比如照片檔案、紙質(zhì)檔案以及一些音頻檔案,要實現(xiàn)這些檔案的數(shù)字化,檔案在數(shù)據(jù)庫建設(shè)方面,要對影像檔案建立數(shù)據(jù)庫,同時還要建立多媒體數(shù)據(jù)庫。
(二)高校館藏檔案數(shù)字化數(shù)據(jù)庫建設(shè)。高校館藏檔案數(shù)字化數(shù)據(jù)庫建設(shè)主要包括四個方面的內(nèi)容:1.目錄數(shù)據(jù)庫建設(shè)。高校要建立館藏檔案的數(shù)字化,首先要建立的是館藏檔案目錄數(shù)字化,檔案目錄建立過程中,可以根據(jù)學(xué)校各個檔案的基本情況,通過著錄標(biāo)引,建立以原始檔案保存狀態(tài)為編目錄單位的各種檔案基本目錄數(shù)據(jù)庫,這個方面的工作,主要是對以前保存的手工檔案目錄計算機化,這個目錄的計算機化主要包括卷目錄計算機化和卷內(nèi)目錄計算機化。2.專題檔案內(nèi)容數(shù)據(jù)庫建設(shè)。對專題檔案內(nèi)容數(shù)據(jù)庫建設(shè)方面,要根據(jù)學(xué)習(xí)實際情況,也就是檔案信息化程度的實際情況和數(shù)字檔案館建設(shè)的實際情況,對現(xiàn)有的檔案數(shù)據(jù)庫進行深度挖掘,這種挖掘特指某一專題檔案內(nèi)容,對專題目錄建立一種從目錄到整個內(nèi)容的數(shù)據(jù)庫。比如在高校中的中醫(yī)院、師范學(xué)校,這些高校本身就有著很強的特色,他們有很多檔案信息資源,對這些高校檔案做深度挖掘工作,并且建立數(shù)字化檔案,再將數(shù)字化的檔案上傳到專題數(shù)據(jù)庫中,能夠?qū)崿F(xiàn)這些資源的有效利用。3.聲像檔案數(shù)據(jù)庫的建設(shè)。聲音檔案和圖像檔案能夠更加直觀地展示高校歷史沿革,對高校聲音和圖像檔案數(shù)據(jù)庫建立,可以實行各類高校的聲音和圖像檔案以統(tǒng)一標(biāo)準(zhǔn)收錄到數(shù)據(jù)庫中,統(tǒng)一管理可以實現(xiàn)資源的有效使用,還可以提高管理效率。4.館藏檔案全文數(shù)據(jù)庫建設(shè)。全文檔案數(shù)據(jù)庫的建立,可以把高校的一些珍貴檔案館藏實現(xiàn)全文管理,這些珍貴的館藏檔案包括了人事檔案實物和原件、聲像檔案實物和原件、黨政檔案實物和原件,對這些檔案進行數(shù)字化的處理工作以后,要編訂好相應(yīng)的關(guān)鍵詞索引、責(zé)任者索引和題名索引,把這些內(nèi)容上傳到管理系統(tǒng)中,可以實現(xiàn)檔案的全文管理。
(三)館藏檔案數(shù)字化的實現(xiàn)方法。在流程上主要可以進行七個方面的工作:1.對檔案的鑒定和整理流程。鑒定和整理工作要根據(jù)館藏檔案開展的實際情況進行,要根據(jù)檔案的內(nèi)容作篩選工作,確定需要實現(xiàn)數(shù)字化的范圍,一定要分清輕重緩急、分階段有序開展。開展中可以進行五個方面的工作內(nèi)容:第一個是館藏中有很多的珍貴檔案,要對這些檔案做數(shù)字化處理。第二個對于檔案中,有的檔案是有著永久管理權(quán)限,也有著永久使用權(quán)限,對這些檔案做優(yōu)先數(shù)字化處理。第三個是學(xué)校檔案中有的檔案能夠體現(xiàn)學(xué)校的特色文化價值,要對這方面的檔案做數(shù)字化處理。第四個是學(xué)校檔案中有的能夠代表高校特色,要對這些檔案做數(shù)字化處理。第五個是高校檔案有的利用價值高,而且利用率大,這些檔案要做好數(shù)字化處理。使用編制確定館藏目錄,對需要館藏的資料做數(shù)字化鑒定,使用文件目錄來確定哪些檔案需要優(yōu)先數(shù)字化??衫镁幾牒玫臋n案資料來取代檔案原件作為數(shù)字化內(nèi)容,使用這種方法來鑒定檔案數(shù)字化,可以在工作效率上提高,還可以在質(zhì)量上提高。高校館藏檔案工作的開展,要根據(jù)上文中提出的幾種方法,有機結(jié)合高校的實際情況,靈活使用這些方法,才可以在館藏檔案工作方面確保質(zhì)量。2.檔案交接。做檔案交接工作方面要明確分工開展,當(dāng)天借出的檔案內(nèi)容,使用的原則應(yīng)該是當(dāng)天要歸還。如果高校檔案數(shù)字化工程是外部其它公司進行,就需要注意檔案在交接時的安全問題,交接過程中雙方都需要指派相應(yīng)的負(fù)責(zé)人做好交接清點工作,同時做好簽字確認(rèn)。3.檔案拆卷、掃描。檔案在做拆卷工作上,其原則是不能夠破壞原有裝訂基準(zhǔn),數(shù)字化處理過程中對資料的掃描工作要符合相應(yīng)標(biāo)準(zhǔn),這個標(biāo)準(zhǔn)一般是《中華人民共和國行業(yè)標(biāo)準(zhǔn)紙質(zhì)檔案數(shù)字化技術(shù)規(guī)范》。開始的數(shù)字化處理工作要確保檔案在拆卷、掃描圖像這些方面和原有檔案保持一致,還要保持其整潔性。4.圖像處理工作。掃描的檔案資料上,有很多是圖片資料,掃描以后的檔案圖像,還需要做進一步的圖像處理。有著同一編號的檔案和這些檔案的附件,要進行合并處理,使檔案在合并以后形成一個檔案,不能夠出現(xiàn)亂序現(xiàn)象,更不能夠出現(xiàn)混檔情況,文件要以檔案的編號進行命名工作,一般的次序是目錄號、案卷號、檔號,按照這些來進行儲存工作,其目的是方便在掛靠工作時能夠更好地融入系統(tǒng)。普通的文本掃描工作中是按照300DPI分頁進行黑白二值掃描,使掃描以后形成一種整體PDF文檔;老舊文檔有著泛黃情況掃描過程中使用的技術(shù)是300DPIPGB真彩掃描,完成掃描以后形成一個整體PDF文檔;掃描的檔案資料中有著一些是打印資料文檔,工作時要對其制作成為雙層的PDF文檔;使用掃描技術(shù)以后,文檔中沒有明顯的墨跡出現(xiàn);圖像要求能夠做到縮放的百分之一百,照片進行掃描技術(shù)方面,要求使用的像素是在600DPI以上,同時在掃描完成以后的圖片還要做加工處理工作,一般是修邊處理、去污處理,使圖片沒有暗影,也沒有其它信息干擾。掃描完成以后的電子圖片。傾斜度要保證在1度之內(nèi),不可以出現(xiàn)缺損現(xiàn)象和折疊現(xiàn)象,要確定圖片的完整性。5.數(shù)據(jù)檢查。數(shù)字化處理工作完成以后,還要做質(zhì)量檢查,這個檢查主要使用抽查的方法進行,要求抽查的數(shù)量要達到8%,抽查數(shù)據(jù)合格率要在95%以上。數(shù)字化檔案檢查工作主要包括三個方面的內(nèi)容:第一個質(zhì)量抽查。抽查中如果發(fā)現(xiàn)有不合格的數(shù)據(jù),要及時更改,一般采用重新返工掃描方法。第二個是數(shù)據(jù)監(jiān)測。在數(shù)據(jù)檢測工作方面,主要有三個方面的工作內(nèi)容,也就是數(shù)據(jù)準(zhǔn)確率核對工作、數(shù)據(jù)運行情況檢測工作和數(shù)據(jù)庫病毒檢測工作。第三個是數(shù)據(jù)利用監(jiān)測。這個工作開展時,是在檔案資料數(shù)字化處理完成以后,在掛靠到系統(tǒng)運行時,對外使用過程中,是否有不合理的情況或者是出現(xiàn)錯誤的情況,對這些方面檢測。6.數(shù)據(jù)整理。這個數(shù)據(jù)的整理工作主要是指在數(shù)據(jù)化處理完成以后,數(shù)據(jù)經(jīng)過檢查合格,對這些數(shù)據(jù)做備份整理工作和檔案需要掛接在運行系統(tǒng)中提供利用作整理工作。數(shù)據(jù)在備份工作方面,主要是指可移動式備份,采用的主要方法是硬盤備份、光盤備份等。備份方面,為了保證其安全性,一般采用備份在兩種方法以上。一般的備份方法,最為常用的方法是硬盤備份,數(shù)據(jù)生成以后,都是儲存在計算機的硬盤上,使用直接備份的方法,可以生成兩份數(shù)據(jù),保存在兩個硬盤上,并且做好標(biāo)記,就可以實現(xiàn)備份要求,這種方法簡單適用而且方便。光盤備份采用的是DVD刻錄技術(shù),選擇光盤備份,一般情況下光盤的容量在4.5G左右,這種情況下,高校的檔案資料完成數(shù)字化以后,其容量都會大于一張光盤的容量。因此使用光盤技術(shù)備份,要對大的數(shù)據(jù)庫做化整為零處理,使數(shù)據(jù)均勻分配在各個光盤中。掃描完成以后的檔案數(shù)據(jù),檢查確定沒有錯誤的情況下,把這些數(shù)據(jù)掛靠在系統(tǒng)中進行運行。7.裝訂還原。檔案掃描完成以后要做還原處理,在還原處理中的檢查工作是保證還原質(zhì)量的關(guān)鍵舉措,這個是檔案數(shù)字化以后的后續(xù)工作,在專業(yè)上叫做數(shù)字化后處理。還原處理要做好四個方面的工作:一是對照目錄清點檔案,看是否有未歸還檔案。二是檔案是否有損壞情況。三是還原裝訂是否按照國家的標(biāo)準(zhǔn)進行。四是是否完成合同要求。檔案檢測工作,一般要求是全數(shù)檢查法,要確保沒有遺漏。
綜上所述,館藏檔案數(shù)字化外包過程中主要包括七個方面的內(nèi)容,這些是對檔案的鑒定和整理流程、檔案交接、檔案拆卷掃描、圖像處理工作、數(shù)據(jù)整理、數(shù)據(jù)檢查、裝訂還原。完成好這七個方面的內(nèi)容,可以實現(xiàn)館藏檔案的數(shù)字化處理,實現(xiàn)檔案的數(shù)字和信息化,適應(yīng)現(xiàn)在社會的發(fā)展。