文 / 趙紅霞
在信息時(shí)代,檔案信息資源的數(shù)量日益增加。在整合檔案信息資源的過(guò)程中,越來(lái)越多的傳統(tǒng)檔案館意識(shí)到跨資源平臺(tái)建設(shè)以及深度挖掘的重要性??缙脚_(tái)和跨類別的檔案信息資源整合有利于將分散的檔案信息資源進(jìn)行有效的管理,提高資源利用效率,完善檔案信息資源配置[1]。用戶對(duì)檔案信息資源進(jìn)行搜索,往往不滿足于單一的檔案數(shù)據(jù)資源,還追求數(shù)據(jù)質(zhì)量以及服務(wù)體驗(yàn)?;ゲ僮鲄f(xié)定下,可以實(shí)現(xiàn)信息資源系統(tǒng)之間的數(shù)據(jù)交換和轉(zhuǎn)換,是一種有效提升資源整合效率的方式。如何實(shí)現(xiàn)互操作與檔案信息資源整合的完美融合,是現(xiàn)代檔案館發(fā)展中面臨的挑戰(zhàn)。
檔案信息資源的種類有很多,數(shù)據(jù)資源規(guī)模比較龐大。在計(jì)算機(jī)出現(xiàn)以前,檔案信息的分類整理主要以人工方式進(jìn)行,效果并不理想。在信息學(xué)領(lǐng)域,檔案信息資源整合被表述為“互操作”?,F(xiàn)有的互操作協(xié)議有很多種,包括OAI-Dienst協(xié)議、DLIOP、STARTS、SDLIP、OAI協(xié)議以及OpenURL等[2]。
較早用在檔案館中的互操作協(xié)議是ANSI/NISO Z39.50協(xié)議。它解決了不同檔案系統(tǒng)之間的數(shù)據(jù)交流和數(shù)據(jù)庫(kù)異構(gòu)問(wèn)題,擴(kuò)大了檔案檢索范圍。此后,Eliot Christian提出采用XML的編碼方式,對(duì)Z39.50進(jìn)行了編碼規(guī)范,實(shí)現(xiàn)了檔案系統(tǒng)間的多源數(shù)據(jù)檢索和擴(kuò)領(lǐng)域搜索。
1990年代以來(lái),美國(guó)一些大學(xué)針對(duì)檔案資源的“隱藏”文檔進(jìn)行了研究,并推出了STARTS和SDLIP等互操作協(xié)議。STARTS和SDLIP協(xié)議可以支持用戶的分布式搜索,實(shí)現(xiàn)檔案數(shù)據(jù)系統(tǒng)以及分布式檔案機(jī)構(gòu)之間的服務(wù)通信。隨后,OAI協(xié)議以及OpenURL等互操作協(xié)議逐步加入到了檔案信息資源整合中。挪威檔案數(shù)字館利用OAI互操作協(xié)議實(shí)現(xiàn)了用戶對(duì)檔案目錄的搜索訪問(wèn),使得OAI協(xié)議成為了檔案信息資源整合過(guò)程中比較常用的互操作協(xié)議之一。
在大數(shù)據(jù)時(shí)代,圖片、音頻以及影像等檔案資源庫(kù)的建設(shè),豐富了檔案信息資源的類別。然而,在檔案信息增多的同時(shí),資源的信息化程度卻不高,給檔案信息資源整合的互操作帶來(lái)了負(fù)面的影響。
互操作以互聯(lián)網(wǎng)信息技術(shù)為基礎(chǔ),通過(guò)對(duì)同類資源或者同型資源進(jìn)行數(shù)據(jù)交換和轉(zhuǎn)換,實(shí)現(xiàn)檔案信息資源的有效整合。我國(guó)檔案信息化發(fā)展的時(shí)間并不長(zhǎng),很多檔案信息資源未能實(shí)現(xiàn)信息化,比如一些歷史文件、訪談資料以及案例紀(jì)要等,阻礙了檔案信息資源整合中的互操作進(jìn)程[3]。
檔案資源的信息化是檔案信息資源整合的前提。在互操作過(guò)程中,可以通過(guò)對(duì)檔案信息進(jìn)行交換或轉(zhuǎn)換,來(lái)實(shí)現(xiàn)檔案信息資源整合的目標(biāo)。它以信息化的資源載體形式為基礎(chǔ),如果資源的信息化程度不高,會(huì)給整個(gè)互操作過(guò)程帶來(lái)阻礙,甚至導(dǎo)致檔案信息資源整合失效。
構(gòu)建檔案信息資源系統(tǒng)時(shí),會(huì)設(shè)置多個(gè)子系統(tǒng),以此實(shí)現(xiàn)不同類別檔案信息的查找、讀取和保存等。檔案系統(tǒng)和子系統(tǒng)中,元數(shù)據(jù)結(jié)構(gòu)以及系統(tǒng)語(yǔ)義結(jié)構(gòu)相互之間存在很大的差別,限制了檔案信息整合過(guò)程中的互操作。
除了元數(shù)據(jù)結(jié)構(gòu)和系統(tǒng)語(yǔ)義結(jié)構(gòu),系統(tǒng)語(yǔ)言編程、數(shù)據(jù)庫(kù)系統(tǒng)、應(yīng)用軟件、數(shù)據(jù)格式等因素的差異,也會(huì)限制檔案信息資源整合的異構(gòu)系統(tǒng)互操作。圖片檔案信息系統(tǒng)以及文字檔案信息系統(tǒng)之間的互操作,由于系統(tǒng)屬性存在很大差別,文字檔案和圖片檔案間的互操作轉(zhuǎn)化存在很大的困難。
異構(gòu)系統(tǒng)的互操作需要跨越多個(gè)不同系統(tǒng),實(shí)現(xiàn)跨資源類型的檔案信息整合。目前,還沒(méi)有研發(fā)出可以兼容各種計(jì)算機(jī)編程語(yǔ)言的檔案信息資源系統(tǒng)。由于技術(shù)條件的限制,跨系統(tǒng)和跨資源類型的互操作很難取得良好的成效,也造成檔案信息資源整合的質(zhì)量和效果不佳。
檔案信息資源整合在互操作協(xié)議下,可以實(shí)現(xiàn)資源系統(tǒng)間的文件交換和轉(zhuǎn)換。在進(jìn)行檔案信息互操作之前,需要獲得系統(tǒng)的權(quán)限認(rèn)可,由于互操作系統(tǒng)的智能識(shí)別不足,檔案搭建平臺(tái)、數(shù)據(jù)庫(kù)系統(tǒng)等不能準(zhǔn)確地給予相關(guān)文件訪問(wèn)、閱讀權(quán)限,使得檔案信息整合的過(guò)程受到了影響,甚至不能進(jìn)行檔案信息的交換或轉(zhuǎn)換。
檔案信息資源整合的過(guò)程涉及到多個(gè)檔案信息系統(tǒng)或子系統(tǒng),不同系統(tǒng)間的檔案信息閱讀、訪問(wèn)權(quán)限互不相同。在互操作協(xié)議下,實(shí)現(xiàn)檔案信息整合的目標(biāo)必須打破權(quán)限帶來(lái)的限制。由于互操作系統(tǒng)智能識(shí)別的障礙,系統(tǒng)往往會(huì)將互操作行為認(rèn)定為非法入侵,導(dǎo)致檔案信息整合的失敗。
互操作系統(tǒng)智能識(shí)別不足不僅表現(xiàn)在身份識(shí)別上,而且包括資源內(nèi)容、數(shù)量大小等方面的識(shí)別處理上,容易導(dǎo)致操作人員訪問(wèn)權(quán)限過(guò)大,在進(jìn)行頻繁、大量的數(shù)據(jù)轉(zhuǎn)換訪問(wèn)后容易造成檔案信息資源的受損甚至破壞,給檔案信息資源庫(kù)帶來(lái)不利的影響。
在網(wǎng)絡(luò)時(shí)代,人們可以通過(guò)網(wǎng)絡(luò)實(shí)現(xiàn)信息資源的交流和共享,但也帶來(lái)了安全隱患。檔案信息系統(tǒng)處在一個(gè)開放的網(wǎng)絡(luò)環(huán)境中,在對(duì)檔案信息進(jìn)行整合時(shí),涉及到大量的數(shù)據(jù)信息的處理,網(wǎng)絡(luò)病毒、惡意軟件以及系統(tǒng)安全漏洞等因素的存在,給檔案信息資源整合帶來(lái)了很大的安全隱患[4]。
檔案信息資源整合的互操作涉及到信息的轉(zhuǎn)換和交換,但是目前檔案機(jī)構(gòu)沒(méi)有做好文件安全防范的相關(guān)工作,給檔案信息資源帶來(lái)了安全上的風(fēng)險(xiǎn)。此前出現(xiàn)的企業(yè)檔案信息泄露、保險(xiǎn)檔案信息泄露等,給人們帶來(lái)了很大的負(fù)面影響。
互操作協(xié)議下,對(duì)檔案信息訪問(wèn)、處理以及轉(zhuǎn)換更加頻繁,且涉及到系統(tǒng)訪問(wèn)權(quán)限的開放,使得檔案信息整合過(guò)程更加容易遭受安全威脅。在文件安全防護(hù)上,現(xiàn)在比較常見的是防火墻技術(shù)、加密與認(rèn)證技術(shù)、網(wǎng)絡(luò)入侵檢測(cè)以及網(wǎng)絡(luò)安全漏洞的掃描。這些手段可以進(jìn)行常規(guī)的網(wǎng)絡(luò)安全防護(hù),對(duì)于一些高級(jí)病毒等就很難進(jìn)行有效的識(shí)別處理,給檔案信息整合帶來(lái)安全隱患。
檔案資源的全面信息化是檔案信息資源整合的必要前提。通過(guò)建立圖片、文字、音頻以及影像等不同類型的檔案信息資源庫(kù),將檔案資源以數(shù)字化的形式上傳到檔案信息資源系統(tǒng)中來(lái)提高檔案資源的信息化。
實(shí)現(xiàn)檔案全面信息化,可以通過(guò)加強(qiáng)電子檔案的建設(shè)來(lái)實(shí)現(xiàn)。目前,電子檔案的普及程度還不高,主要是由于電子檔案系統(tǒng)的不完善使得電子檔案的安全防護(hù)難以得到保證。不少檔案機(jī)構(gòu)在進(jìn)行檔案建設(shè)時(shí),多采用紙質(zhì)形式來(lái)進(jìn)行檔案信息建設(shè),以加強(qiáng)信息安全,這也降低了檔案信息的信息化程度。通過(guò)轉(zhuǎn)變檔案機(jī)構(gòu)相關(guān)人員的理念,在紙質(zhì)檔案的基礎(chǔ)上加強(qiáng)電子檔案的建設(shè),是實(shí)現(xiàn)檔案全面信息化重要的一步。
檔案信息資源存在不同的系統(tǒng),運(yùn)營(yíng)各個(gè)資源系統(tǒng)的編程語(yǔ)言、數(shù)據(jù)庫(kù)、操作協(xié)議等都存在很大的差別,給網(wǎng)絡(luò)檔案資源整合的互操作帶來(lái)了很多異構(gòu)系統(tǒng)產(chǎn)生的限制。構(gòu)建異構(gòu)系統(tǒng)的互操作體系,將各個(gè)資源系統(tǒng)進(jìn)行聯(lián)合,通過(guò)體系化的資源系統(tǒng)建設(shè),打破各個(gè)系統(tǒng)內(nèi)資源數(shù)據(jù)訪問(wèn)的限制,可以更好地在互操作協(xié)議下進(jìn)行檔案信息資源整合。
構(gòu)建異構(gòu)系統(tǒng)互操作體系需要解決系統(tǒng)中存在的元數(shù)據(jù)結(jié)構(gòu)、系統(tǒng)語(yǔ)義結(jié)構(gòu)以及數(shù)據(jù)庫(kù)結(jié)構(gòu)上存在的差異問(wèn)題。在這個(gè)構(gòu)建過(guò)程中,需要建立一個(gè)可以對(duì)各種編程語(yǔ)言環(huán)境都進(jìn)行兼容的檔案信息資源系統(tǒng),實(shí)現(xiàn)異構(gòu)系統(tǒng)間的語(yǔ)義轉(zhuǎn)換,從而促成檔案信息資源整合過(guò)程中數(shù)據(jù)信息交換或轉(zhuǎn)換的實(shí)現(xiàn)。構(gòu)建異構(gòu)系統(tǒng)互操作體系需要搭建一個(gè)基于異構(gòu)系統(tǒng)互操作體系的訪問(wèn)協(xié)議,打破過(guò)去由異構(gòu)系統(tǒng)間的差異帶來(lái)的數(shù)據(jù)訪問(wèn)和轉(zhuǎn)換限制,這個(gè)協(xié)議可以看做是異構(gòu)系統(tǒng)互操作體系內(nèi)的“通行證”。它不僅使檔案信息資源整合過(guò)程中文件安全能夠得到有效保障,而且能促進(jìn)整合效率和質(zhì)量的提高。構(gòu)建異構(gòu)系統(tǒng)互操作體系需要搭建具備規(guī)范、統(tǒng)一標(biāo)準(zhǔn)的異構(gòu)系統(tǒng)互操作檔案信息資源平臺(tái),這樣可以達(dá)成各個(gè)檔案信息資源系統(tǒng)間的“默契”,優(yōu)先給體系內(nèi)的成員開辟數(shù)據(jù)信息訪問(wèn)權(quán)限,提高檔案信息資源整合過(guò)程中的效率。
互操作系統(tǒng)的智能識(shí)別關(guān)系到檔案信息資源整合的質(zhì)量和效率。在當(dāng)前的互操作系統(tǒng)中,由于數(shù)據(jù)庫(kù)系統(tǒng)、語(yǔ)言環(huán)境以及語(yǔ)義結(jié)構(gòu)等方面存在的一些技術(shù)障礙,導(dǎo)致互操作系統(tǒng)智能識(shí)別能力的不足。
提高互操作系統(tǒng)智能識(shí)別,首先需要加強(qiáng)對(duì)不同檔案信息資源之間的識(shí)別。以圖片檔案信息和文字檔案信息為例,兩者的文件內(nèi)容形式不同,導(dǎo)致檔案信息存儲(chǔ)方法存在很大的差別。圖片檔案信息需要互操作系統(tǒng)對(duì)圖片內(nèi)容進(jìn)行掃描轉(zhuǎn)化,以特殊的語(yǔ)義翻譯工具將其翻譯成文字檔案信息,再在文字檔案信息資源系統(tǒng)中進(jìn)行相應(yīng)的匹配,從而實(shí)現(xiàn)檔案信息資源整合過(guò)程中的數(shù)據(jù)信息交換和轉(zhuǎn)換。這個(gè)過(guò)程中,互操作系統(tǒng)涉及到跨資源類型的識(shí)別,如果系統(tǒng)的跨資源智能識(shí)別能力不足,就會(huì)導(dǎo)致整合檔案信息資源整合過(guò)程的互操作失效。
提高互操作系統(tǒng)的智能識(shí)別還需要加強(qiáng)系統(tǒng)的數(shù)據(jù)識(shí)別的兼容性。兩個(gè)檔案信息資源系統(tǒng)的構(gòu)建可能會(huì)采取不一樣的編程語(yǔ)言,對(duì)系統(tǒng)的定義也會(huì)產(chǎn)生很大的分歧。在兩個(gè)檔案信息資源系統(tǒng)之間的資源整合過(guò)程中,文件內(nèi)容的編碼等存在很大的不同,需要提高互操作系統(tǒng)的智能識(shí)別兼容性,更好地對(duì)各個(gè)系統(tǒng)的編碼進(jìn)行準(zhǔn)確的讀出,實(shí)現(xiàn)檔案信息資源整合目標(biāo)。
檔案信息安全問(wèn)題是檔案信息資源整合過(guò)程中涉及到的一個(gè)重大的問(wèn)題。如果檔案信息遭到病毒的入侵,不僅會(huì)造成檔案信息資源的損壞,而且可能導(dǎo)致檔案信息的泄露,造成個(gè)人隱私受到侵害,甚至泄露國(guó)家機(jī)密。加強(qiáng)互操作下檔案信息資源整合的安全防護(hù)需要兼顧檔案信息資源的內(nèi)部安全和外部安全。
強(qiáng)化檔案信息資源的內(nèi)部安全,首先要加強(qiáng)檔案信息資源的安全防護(hù),通過(guò)改進(jìn)文件加密技術(shù)對(duì)文件進(jìn)行保護(hù)。文件加密技術(shù)可以有效地防止非相關(guān)人員的文件訪問(wèn),防止文件信息的泄露。此外,還需要加強(qiáng)檔案信息資源系統(tǒng)的建設(shè),以更加高級(jí)的編程語(yǔ)言以及語(yǔ)言邏輯搭建系統(tǒng),讓一些非法人員找不到系統(tǒng)的漏洞,從而提高內(nèi)部檔案信息資源的保護(hù)。
強(qiáng)化檔案信息資源的外部安全,可以利用防火墻技術(shù)對(duì)檔案信息資源進(jìn)行安全保護(hù)。防火墻技術(shù)能夠?qū)W(wǎng)絡(luò)環(huán)境中的一些危險(xiǎn)因素如病毒、惡意軟件等進(jìn)行識(shí)別,將其擋在防火墻之外,通過(guò)杜絕與危險(xiǎn)因素的接觸來(lái)保障檔案信息資源的安全。檔案信息資源的整合會(huì)產(chǎn)生大量的數(shù)據(jù)讀取、訪問(wèn),在這個(gè)過(guò)程中需要對(duì)訪問(wèn)人員的身份進(jìn)行準(zhǔn)確的識(shí)別,掃描出一些借助“身份”的非法訪問(wèn)行為,保障檔案信息資源的安全。強(qiáng)化檔案信息資源的外部安全還可以通過(guò)設(shè)立異常情況預(yù)警系統(tǒng)來(lái)加強(qiáng)檔案信息資源整合過(guò)程的安全防護(hù),當(dāng)系統(tǒng)對(duì)一些危險(xiǎn)因素進(jìn)行識(shí)別后,系統(tǒng)會(huì)產(chǎn)生異常,通過(guò)預(yù)警系統(tǒng)可以做出一些預(yù)先的防護(hù)措施,保障檔案信息資源整合的安全。