武 琳 紀(jì)舜麗
基于網(wǎng)絡(luò)的檔案開(kāi)放目錄是指檔案網(wǎng)站提供的以館藏為檢索內(nèi)容,以檔案信息為處理對(duì)象并以計(jì)算機(jī)網(wǎng)絡(luò)作為傳輸載體、以原文信息或著錄項(xiàng)信息作為檢索結(jié)果的網(wǎng)絡(luò)信息檢索系統(tǒng)。這是檔案利用工作從手工檢索過(guò)渡到計(jì)算機(jī)檢索的重要表現(xiàn)形式。利用者通過(guò)網(wǎng)絡(luò)對(duì)檔案館數(shù)據(jù)庫(kù)的檔案信息實(shí)現(xiàn)遠(yuǎn)程檢索,從而達(dá)到在線利用檔案的目的。檔案開(kāi)放目錄比較全面反映檔案館館藏信息,“不僅可以使用戶進(jìn)行遠(yuǎn)距離檢索,降低檢索成本,提高檢索效率,而且可以及時(shí)反映檔案信息的變化情況,不存在時(shí)間上的延遲”。
一、我國(guó)檔案開(kāi)放目錄的發(fā)展現(xiàn)狀
目前,我國(guó)大部分檔案網(wǎng)站都推出了檔案開(kāi)放目錄,有些還停留在原始的目錄瀏覽階段,為紙質(zhì)版本的數(shù)字化,但多數(shù)已建立起具有查詢功能的檢索系統(tǒng)。國(guó)家級(jí)檔案館的在線數(shù)據(jù)庫(kù)尚未建立,從省、市、區(qū)(縣)三級(jí)檔案館網(wǎng)站的檔案開(kāi)放目錄來(lái)看,各地建設(shè)水平參差不齊,部分系統(tǒng)有一定亮點(diǎn),但整體質(zhì)量不高。
(一)國(guó)內(nèi)開(kāi)放目錄典型調(diào)查
本文以北京、上海、遼寧、沈陽(yáng)、紹興和青島等地的檔案開(kāi)放目錄為典型案例,進(jìn)行了調(diào)查統(tǒng)計(jì),見(jiàn)表1。
(二)典型案例分析
除以上幾個(gè)網(wǎng)站外,對(duì)比全國(guó)多個(gè)開(kāi)放目錄的內(nèi)容及功能可知:
1、檔案種類(lèi)
文書(shū)檔案是檔案開(kāi)放檢索的主體,但提供全文使用的網(wǎng)站很少,部分網(wǎng)站對(duì)這些文書(shū)進(jìn)行掃描,以圖片格式保存后提供線上利用,如北京市檔案館的全文閱覽系統(tǒng)。其次,照片、錄像開(kāi)始加入到系統(tǒng)中,有些照片提供免費(fèi)查看并可下載,視頻的可鏈接率較低,但可看出檔案館開(kāi)始重視對(duì)多媒體信息的提供。
2、數(shù)據(jù)內(nèi)容
目前幾乎所有的檔案館都提供革命歷史檔案、民國(guó)檔案及建國(guó)后檔案,政務(wù)色彩較濃,對(duì)特色檔案的開(kāi)發(fā)不夠。北京與沈陽(yáng)的勞模檔案、沈陽(yáng)與上海的工商檔案、北京的訴訟檔案、大連的調(diào)配書(shū)、湖北的辛亥革命檔案以及福建省檔案館包括體育、地政、海關(guān)、禁毒、閩臺(tái)關(guān)系、名老中醫(yī)等多達(dá)59個(gè)專(zhuān)題檔案材料的提供給各級(jí)檔案館開(kāi)了個(gè)好頭,但就全國(guó)范圍來(lái)講,專(zhuān)題檔案檢索依然任重而道遠(yuǎn)。
3、著錄層次
很多系統(tǒng)都在檔案題名上建立了二次鏈接,但著錄項(xiàng)大多數(shù)為責(zé)任者、形成時(shí)間、發(fā)文單位、文件編號(hào)、檔號(hào)等幾項(xiàng),缺乏其他描述。然而也有比較出色的,如上海檔案館網(wǎng)上檢索服務(wù)系統(tǒng)。對(duì)每個(gè)文件,系統(tǒng)都提供了詳細(xì)的文件著錄項(xiàng)目,并可鏈接查看所屬全宗、類(lèi)別、案卷的詳細(xì)信息。
4、檢索功能
檔案檢索大體可分為案卷級(jí)和文件級(jí)兩種,案卷級(jí)在數(shù)量上比文件級(jí)占優(yōu)。系統(tǒng)的設(shè)置通常將這兩個(gè)類(lèi)別分開(kāi),利用者需要在不同的數(shù)據(jù)庫(kù)進(jìn)行檢索。上海的查詢系統(tǒng)給這些數(shù)據(jù)庫(kù)提供了統(tǒng)一的檢索入口,利用者可以選擇案卷級(jí)、文件級(jí)或者對(duì)所有檔案進(jìn)行查詢,不受檔案著錄層次的限制。另外值得一提的是,上海開(kāi)放目錄采用文件夾內(nèi)層層瀏覽的形式,使利用者在直觀感受檔案組織層級(jí)的同時(shí),隨時(shí)在每一層級(jí)內(nèi)查詢所需檔案,既增強(qiáng)了靈活性,又可提高目標(biāo)針對(duì)性。
5、檢索效率
雖然幾乎每個(gè)系統(tǒng)都提供了關(guān)鍵詞檢索,但目前所謂的“關(guān)鍵詞檢索”實(shí)質(zhì)上只是對(duì)文件標(biāo)題進(jìn)行檢索,且加上著錄質(zhì)量總體不高,特別是很多照片檔案都沒(méi)有詳細(xì)描述,在這種情況下,檢全率低成為各系統(tǒng)普遍存在的問(wèn)題。
6、提供方法
由于庫(kù)藏量小,特別是數(shù)字化信息在系統(tǒng)中所占的比例還很小,很多開(kāi)放目錄都無(wú)法提供高吸引力的檔案資源。紹興市檔案信息網(wǎng)通過(guò)開(kāi)放目錄與網(wǎng)站欄目“視頻點(diǎn)播”的對(duì)接,實(shí)現(xiàn)“紹興新聞視頻庫(kù)”庫(kù)藏的在線觀看,與遼寧的“聲像檔案”出自同一原理,這種站點(diǎn)資源與目錄系統(tǒng)的整合值得注意。
7、資費(fèi)標(biāo)準(zhǔn)
很多網(wǎng)站提供了部分檔案的免費(fèi)查看或下載,但也有部分檔案館對(duì)檔案實(shí)行有償使用。如浙江省和青島市檔案館就對(duì)大多數(shù)館藏實(shí)行利用收費(fèi)。以青島市檔案館為例,利用者在該檔案館網(wǎng)站進(jìn)行注冊(cè)并以現(xiàn)金、查檔卡、郵局匯款或銀行匯款等方式交納查檔費(fèi)后成為高級(jí)會(huì)員,可通過(guò)“留言板”或“在線提交查閱需求”要求查閱所有開(kāi)放的檔案資料全文信息。這種行為目前受歡迎程度不大,但是否具有市場(chǎng)前景關(guān)鍵還在于檔案館能否提供高質(zhì)量、高實(shí)用性的檔案材料。
二、構(gòu)建我國(guó)檔案開(kāi)放目錄的途徑
(一)內(nèi)容選擇
1、把握利用需求,有選擇地?cái)?shù)字化館藏
“根據(jù)了解,目前一般區(qū)(縣)檔案館館藏量在12-15萬(wàn)卷,按每卷檔案50頁(yè)計(jì)算,大約共600-750萬(wàn)頁(yè)。如將這些檔案全文數(shù)字化,按照目前市場(chǎng)價(jià)格(掃描和輸入0.25-0.4元/頁(yè))計(jì)算,一個(gè)區(qū)(縣)級(jí)檔案館全文數(shù)字化將需投入150-200萬(wàn)元?!比欢啊迤陂g,中央財(cái)政對(duì)縣級(jí)公共圖書(shū)館、文化館基礎(chǔ)設(shè)施共投入136.4億元,比‘九五期間增長(zhǎng)約50%。而對(duì)比之下,同期中央財(cái)政對(duì)縣級(jí)國(guó)家綜合檔案館的投入則為零?!痹诖饲樾蜗?,對(duì)所有館藏檔案進(jìn)行全文數(shù)字化顯然脫離實(shí)際。因此。檔案目錄數(shù)字化應(yīng)成為檔案數(shù)據(jù)庫(kù)建設(shè)的首選環(huán)節(jié),然后逐步擴(kuò)展到檔案原文的數(shù)字化。檔案館必須正確把握本館的利用需求,根據(jù)目前檔案利用的實(shí)際情況有選擇地進(jìn)行數(shù)字化。強(qiáng)調(diào)突出館藏特色,把有限的資源用在最需要的地方。
2、整合檔案資源,增加民生檔案的比例
“民生檔案包括社會(huì)保險(xiǎn)檔案、醫(yī)療保險(xiǎn)、最低生活保障檔案、婚姻登記檔案、房地產(chǎn)檔案、拆遷安置檔案、人口計(jì)生檔案、藥品食品監(jiān)督檔案、環(huán)境檢測(cè)檔案、土地承包和林權(quán)改革檔案等百姓關(guān)注、涉民密切的20余個(gè)門(mén)類(lèi)檔案?!痹谶^(guò)去很長(zhǎng)一段時(shí)間內(nèi),檔案館與民眾的生活一直處于相對(duì)脫離的狀態(tài)。造成這種局面的原因之一便是檔案部門(mén)長(zhǎng)期注重對(duì)政府機(jī)構(gòu)文書(shū)的收集,缺少對(duì)社會(huì)變遷的記錄,另一原因是檔案部門(mén)缺乏服務(wù)意識(shí)。但隨著近年來(lái)群眾維權(quán)意識(shí)的提高,檔案意識(shí)也隨之增強(qiáng),到檔案館查檔解決實(shí)際問(wèn)題的趨勢(shì)越來(lái)越突出。據(jù)四川省檔案館查閱利用室的工作人員介紹,2007年“查閱社保養(yǎng)老、房屋產(chǎn)權(quán)、婚姻登記檔案的人員增長(zhǎng)特別明顯……以成都市為例,2007年該市檔案利用人(次)增長(zhǎng)幅度達(dá)到50%,金牛區(qū)、錦江區(qū)、青羊區(qū)甚至達(dá)到了60%以上。從生老病死到衣食住行,民生檔案與百姓生活漸行漸近。”0這種現(xiàn)象在全國(guó)其他地方檔案館也普遍存在,據(jù)張家港市檔案館利用情況的統(tǒng)計(jì),“2005年和2006年的個(gè)人利用比例分別為87%和81%。……民生類(lèi)檔案的查閱則在此期間從579卷次/年上升到5740卷次/年,增幅達(dá)十倍之巨,并且在‘十五期間一直高高占據(jù)檔案利用量榜首之位?!边@種個(gè)人與機(jī)構(gòu)查檔比例大逆轉(zhuǎn)的出現(xiàn)反映了群眾對(duì)檔案利用需求的一種新趨勢(shì),說(shuō)明民生檔案正成為群眾關(guān)注的熱點(diǎn)。
3、多媒體檢索
檔案載體類(lèi)型多種多樣,常見(jiàn)的包括紙張、縮微膠片、照相印刷品、實(shí)物、電影膠片、磁帶、聲音磁盤(pán)、錄像帶、視頻卷帶等。將載體類(lèi)型作為其基本檢索途徑,利用
者可以選擇其所關(guān)心的一種或幾種載體類(lèi)型限制檢索結(jié)果,專(zhuān)指度強(qiáng),檢索效率高。目前,我國(guó)還很少將載體類(lèi)型作為檢索途徑(上海很可能是全國(guó)惟一的一家),少數(shù)網(wǎng)站建立了獨(dú)立的照片檔案目錄,但收錄照片數(shù)量很少,且缺乏詳細(xì)著錄。在目前的技術(shù)背景下,文字是最主要的檢索手段,圖像檢索還未得到大范圍推廣,多媒體文件只有配合詳細(xì)的文字描述,才能取得用戶預(yù)期的查詢結(jié)果。因此,檔案館應(yīng)加強(qiáng)多媒體檔案著錄,早日實(shí)現(xiàn)真正意義上的多媒體檢索。
(二)系統(tǒng)功能方面
1、完善系統(tǒng)使用指南
使用幫助工具的提供是國(guó)外網(wǎng)站優(yōu)于國(guó)內(nèi)網(wǎng)站的一個(gè)明顯特征,這在專(zhuān)業(yè)檢索系統(tǒng)的使用中尤其重要。特別是在大眾較為生疏的檔案領(lǐng)域,一定的提示與引導(dǎo)將大大提高檢索的效率。從我國(guó)各檔案館網(wǎng)站提供的開(kāi)放目錄來(lái)看,利用者明知所需檔案存于庫(kù)中卻難以檢出的情況非常普遍。因此,當(dāng)利用者輸入關(guān)鍵詞但沒(méi)有得到理想結(jié)果時(shí),系統(tǒng)需要有相應(yīng)的自動(dòng)響應(yīng),提示查詢者更換主題或提供相似檢索詞,以改善查詢結(jié)果,使利用者耐心在系統(tǒng)上停留。
2、編制索引輔助查詢
除檢索幫助及使用指南外,方便利用的最便捷方式是提供專(zhuān)題目錄,并編制各種索引。主題瀏覽和索引利用都是提高利用效率的方法,尤其對(duì)于不熟悉庫(kù)藏或不擅于編寫(xiě)檢索式的利用者更是如此。開(kāi)放目錄索引可以以全宗號(hào)或拼音、筆畫(huà)為序建立樹(shù)型連接,讓利用者對(duì)某一機(jī)構(gòu)形成檔案或某一專(zhuān)題所有相關(guān)材料有一個(gè)總體把握,符合檔案的來(lái)源原則,既起到引導(dǎo)作用,又使部分利用者不至因檢索式編寫(xiě)不當(dāng)而導(dǎo)致漏檢。由于檢索系統(tǒng)建設(shè)還處于初期,所存條目少,這個(gè)問(wèn)題目前在我國(guó)檔案開(kāi)放目錄中表現(xiàn)不明顯,但隨著系統(tǒng)內(nèi)容逐漸增加,索引的編制將越來(lái)越迫切。
3、實(shí)現(xiàn)系統(tǒng)無(wú)縫鏈接
自檔案館開(kāi)始網(wǎng)站建設(shè)以來(lái),“專(zhuān)題展覽”、“特色展廳”等欄目一直是各檔案館網(wǎng)站的亮點(diǎn)。但檔案開(kāi)放目錄與網(wǎng)站其他內(nèi)容處于完全分開(kāi)的兩套系統(tǒng),目錄與網(wǎng)頁(yè)信息無(wú)法實(shí)現(xiàn)相互鏈接,使得很多存在于網(wǎng)絡(luò)的全文資料無(wú)法于庫(kù)內(nèi)檢索時(shí)直接獲得,利用者需要兩邊同時(shí)搜索才可確定所需信息是否存在。因此,在檢索系統(tǒng)自身建設(shè)的基礎(chǔ)上,如何實(shí)現(xiàn)網(wǎng)上展覽材料與查詢系統(tǒng)的無(wú)縫鏈接是檔案開(kāi)放目錄建設(shè)的一大課題。
4、采用標(biāo)準(zhǔn)兼容技術(shù)
目前提供檔案開(kāi)放原文在線閱覽的網(wǎng)站不多,北京市檔案館的檔案全文檢索閱覽系統(tǒng)是其中較為典型的一個(gè)。雖然該系統(tǒng)目前只提供了北平市五個(gè)部門(mén)專(zhuān)題目錄數(shù)據(jù)庫(kù)近152萬(wàn)頁(yè)的數(shù)字化檔案,但也可以看出開(kāi)放目錄數(shù)據(jù)庫(kù)將提供全文利用的趨勢(shì)。惟一的不足是,在該系統(tǒng)上查看檔案無(wú)論是圖片還是文檔都要安裝原文瀏覽的Accex控件,而這些插件的安裝只有對(duì)IE瀏覽器重新設(shè)置才不至于被~dOW$拒絕。這是許多利用者較為反感的事情。因此,使用與瀏覽器標(biāo)準(zhǔn)兼容的技術(shù),消除利用障礙,是檔案開(kāi)放目錄檢索系統(tǒng)建設(shè)應(yīng)注意的另一問(wèn)題。
5、統(tǒng)一人口,跨庫(kù)檢索
清代檔案庫(kù)、民國(guó)檔案庫(kù)、革命歷史檔案庫(kù)及現(xiàn)行a公開(kāi)文件目錄作為最常見(jiàn)的四個(gè)數(shù)據(jù)庫(kù)構(gòu)成了我國(guó)檔案館網(wǎng)站的信息檢索系統(tǒng),而前三個(gè)數(shù)據(jù)庫(kù)一般是以檔案開(kāi)放目錄的形式存在。各網(wǎng)站共同的特點(diǎn)是利用者在檢索時(shí)只能選取其中的一個(gè)數(shù)據(jù)庫(kù)進(jìn)行查詢。如果利用者檢索的專(zhuān)題其時(shí)間連續(xù)性較強(qiáng)的話則需遍歷若干個(gè)數(shù)據(jù)庫(kù)才能得到完整的材料,這就給利用者帶來(lái)很大的不便。因此,提供統(tǒng)一的檢索入口,實(shí)現(xiàn)跨庫(kù)檢索是目前檔案信息檢索系統(tǒng)建設(shè)需要努力的方向。