錢琴 張毅
摘 要:紅色文獻(xiàn)是老一輩無(wú)產(chǎn)階級(jí)革命斗爭(zhēng)的真實(shí)記錄,大力發(fā)展建設(shè)紅色文獻(xiàn)數(shù)據(jù)庫(kù)對(duì)于提升民族凝聚力,弘揚(yáng)愛(ài)國(guó)主義精神有著重要意義。華東師范大學(xué)圖書館采用基于國(guó)際圖像互操作框架IIIF的開(kāi)源特藏資源管理系統(tǒng)Omeka技術(shù),對(duì)館藏紅色文獻(xiàn)進(jìn)行加工整理,通過(guò)功能和特點(diǎn)的具體分析,結(jié)合具體案例,探索紅色特藏資源數(shù)據(jù)庫(kù)建設(shè)之路。
關(guān)鍵詞:紅色文獻(xiàn);特藏;IIIF;Omeka
引言
2021年是中國(guó)共產(chǎn)黨成立100周年,習(xí)近平總書記在黨史學(xué)習(xí)教育動(dòng)員大會(huì)上強(qiáng)調(diào):“加強(qiáng)新時(shí)代大學(xué)生黨史學(xué)習(xí)教育,對(duì)于引導(dǎo)大學(xué)生大力發(fā)揚(yáng)紅色傳統(tǒng)、傳承紅色基因,賡續(xù)共產(chǎn)黨人精神血脈,增強(qiáng)開(kāi)拓前進(jìn)的勇氣和力量,具有重要戰(zhàn)略意義?!备鞲咝Mㄟ^(guò)一系列紅色主題展覽,紅色故事經(jīng)典誦讀,讓紅色基因根植于青年一代心中。紅色文獻(xiàn)作為先進(jìn)文化思想的精華是我們研究紅色文化的重要資料,圖書館對(duì)于紅色文獻(xiàn)應(yīng)做好收集、整理、記錄、展示和傳承,建立特色數(shù)據(jù)庫(kù),可以使珍貴的紅色文化遺產(chǎn)得到長(zhǎng)期有效的保護(hù)。本文將系統(tǒng)梳理總結(jié)高校圖書館紅色文獻(xiàn)研究動(dòng)態(tài),研究摸索圖書館自建紅色文獻(xiàn)數(shù)據(jù)庫(kù)共享展示平臺(tái),為紅色文化建設(shè)與保護(hù)提供借鑒。
一、文獻(xiàn)調(diào)查分析
筆者通過(guò)在中國(guó)知網(wǎng)調(diào)研檢索,時(shí)間從2000年1月至2021年9月,主題為:“紅色文獻(xiàn)”并含“數(shù)據(jù)庫(kù)”,“紅色文獻(xiàn)” 并含“數(shù)字”,“紅色文獻(xiàn)”并含“圖書館”為條件,檢索得到共計(jì)104篇文獻(xiàn),其中包含紅色文化29篇,紅色文獻(xiàn)20篇,數(shù)據(jù)庫(kù)建設(shè)11篇,文獻(xiàn)資源數(shù)字化3篇,圖1從文獻(xiàn)的發(fā)表年度可以看出,紅色文獻(xiàn)的保護(hù)與研究得到越來(lái)越廣泛的共識(shí)。
二、高校圖書館紅色特藏資源數(shù)據(jù)庫(kù)調(diào)查分析
1.背景與調(diào)查
新中國(guó)成立前,紅色資源廣泛認(rèn)可界定范圍為:中國(guó)共產(chǎn)黨成立至新中國(guó)成立前,中國(guó)共產(chǎn)黨機(jī)關(guān)以及根據(jù)地出版的各種書籍和雜志等。由于年代久遠(yuǎn),以及當(dāng)年的印刷技術(shù),紙張質(zhì)地等,很多文獻(xiàn)出現(xiàn)破損毀壞,紙張非常脆弱等現(xiàn)象,已不適合借閱瀏覽,不能發(fā)揮其歷史價(jià)值和教育意義,如何讓紅色文獻(xiàn)“活起來(lái)”,發(fā)揮其文明傳承價(jià)值成為亟待解決的問(wèn)題,因此,圖書館對(duì)于紅色文獻(xiàn)數(shù)據(jù)庫(kù)的開(kāi)發(fā)刻不容緩。
目前,各館藏機(jī)構(gòu)特藏?cái)?shù)據(jù)庫(kù)主要集中為:民國(guó)時(shí)期資源庫(kù)、地方歷史文獻(xiàn)庫(kù)、古代地方志、古籍庫(kù)、書畫庫(kù)等,新中國(guó)成立前,紅色文獻(xiàn)數(shù)據(jù)庫(kù)并不多。整理紅色文獻(xiàn)對(duì)于高校思想政治教育、科研教輔、校園文化建設(shè)具有重要意義。筆者調(diào)查到有紅色特藏?cái)?shù)據(jù)庫(kù)的高校分別有:中國(guó)石油大學(xué)發(fā)布的紅色文獻(xiàn)數(shù)據(jù)庫(kù)、井岡山大學(xué)圖書館建立的“井岡山特色文獻(xiàn)資源庫(kù)”、延安大學(xué)圖書館發(fā)布的“延安時(shí)期中共中央機(jī)關(guān)報(bào)全文數(shù)據(jù)庫(kù)”、上海市委黨校圖書館發(fā)布的“晉綏日?qǐng)?bào)”數(shù)據(jù)庫(kù),此外還有如萬(wàn)方數(shù)據(jù)開(kāi)發(fā)的《紅色文化專題數(shù)據(jù)庫(kù)》以及陜西人民出版社開(kāi)發(fā)的《紅色檔案——延安時(shí)期文獻(xiàn)檔案匯編》等。
2.存在的問(wèn)題
通過(guò)調(diào)研發(fā)現(xiàn),各館藏機(jī)構(gòu)以及認(rèn)識(shí)到紅色資源開(kāi)發(fā)的重要性,但現(xiàn)有資源平臺(tái)在功能設(shè)計(jì)、開(kāi)放共享方面仍存在以下幾個(gè)問(wèn)題。
(1)現(xiàn)有的數(shù)據(jù)庫(kù)功能單一,平臺(tái)利用率低。目前,現(xiàn)有的數(shù)字資源平臺(tái)資源尚不全面,一部分?jǐn)?shù)字平臺(tái)僅支持簡(jiǎn)單的瀏覽,或不提供圖像瀏覽,大部分特藏資源只對(duì)本校讀者服務(wù),紅色文化輻射力和影響力甚微。
(2)缺乏多元異構(gòu)數(shù)字資源共享利用平臺(tái)。各館藏機(jī)構(gòu)采用的技術(shù)框架、資源格式和應(yīng)用程序各不相同,由于沒(méi)有統(tǒng)一標(biāo)準(zhǔn),這些已經(jīng)進(jìn)行數(shù)字化處理的資源被封鎖在信息“孤島”里,不同平臺(tái)數(shù)字資源難以交換共享。
(3)少有圖像資源深入挖掘功能。注釋對(duì)于相關(guān)學(xué)術(shù)數(shù)據(jù)庫(kù)具有很大的推動(dòng)作用,目前,大多數(shù)庫(kù)僅提供簡(jiǎn)單瀏覽、縮放等操作,缺乏圖像資源研究者和提供者溝通的橋梁,無(wú)法支持與資源互動(dòng),對(duì)原始文獻(xiàn)挖掘的深度不夠,鮮有能夠?qū)崿F(xiàn)內(nèi)容注釋、添加評(píng)語(yǔ)等功能。
三、華東師范大學(xué)新中國(guó)成立前紅色文獻(xiàn)數(shù)據(jù)庫(kù)實(shí)踐
1.新中國(guó)成立前紅色文獻(xiàn)資源現(xiàn)狀
華東師范大學(xué)目前有專門的紅色文獻(xiàn)資料庫(kù),文獻(xiàn)室中的一些資料由于年代久遠(yuǎn),存在著不同程度的破損,紙張非常脆弱,為更好地發(fā)揮紅色文獻(xiàn)的歷史價(jià)值和教育價(jià)值,圖書館已對(duì)部分圖書進(jìn)行數(shù)字化處理,以便從標(biāo)題、分類、出版社,作者等方面進(jìn)行檢索。目前已數(shù)字化105本,總計(jì)10895頁(yè),其中最早為1926年5月出版的《中國(guó)共產(chǎn)黨五年來(lái)之政治主張》,其中不乏老一輩無(wú)產(chǎn)階級(jí)革命家毛澤東、朱德等著作如《在延安文藝座談會(huì)上的講話》《論解放區(qū)戰(zhàn)場(chǎng)》經(jīng)典紅色文獻(xiàn)以及一些外國(guó)記者如詹姆斯·貝特蘭、斯諾等一批外國(guó)著名作家、記者的著作。
2.設(shè)計(jì)與創(chuàng)新
華東師范大學(xué)新中國(guó)成立前紅色文獻(xiàn)數(shù)據(jù)庫(kù)采用Omeka發(fā)布平臺(tái),結(jié)合國(guó)際圖像互操作框架(IIIF),對(duì)于館藏資源和海量紅色資源進(jìn)行統(tǒng)一整理收割與共享,建立多元異構(gòu)數(shù)字圖像資源一站式整合平臺(tái)。
(1)Omeka發(fā)布平臺(tái)。Omeka是一個(gè)免費(fèi)開(kāi)源的網(wǎng)絡(luò)發(fā)布平臺(tái),基于Omeka圖書館、博物館、檔案館等機(jī)構(gòu)可以實(shí)現(xiàn)數(shù)字資源收集、展覽、網(wǎng)絡(luò)發(fā)布等。具有強(qiáng)大的可擴(kuò)展性和靈活性,對(duì)于特藏資源集成化展示建設(shè)有著廣泛的應(yīng)用。華東師范大學(xué)新中國(guó)成立前紅色文獻(xiàn)數(shù)據(jù)庫(kù)采用資源管理與發(fā)布的Omeka系統(tǒng),下載omeka classic版本,上傳安裝所采用的Apache服務(wù)器,并下載安裝Finalshell服務(wù)器網(wǎng)絡(luò)管理軟件,連接已設(shè)置的主機(jī)和端口。完成Omeka的安裝部署之后可在后臺(tái)進(jìn)行系統(tǒng)一般信息的設(shè)置,如管理員郵件地址、站點(diǎn)名稱、站點(diǎn)描述等信息。Omeka 作為支持IIIF的資源管理系統(tǒng),可在其官網(wǎng)PLUGINS選項(xiàng)中下載安裝所需的插件Universal Viewer瀏覽器作為IIIF的功能實(shí)現(xiàn)。
(2)國(guó)際圖像互操作框架技術(shù)。國(guó)際圖像互操作框架(IIIF)基于HTTP技術(shù),提供各類應(yīng)用程序編程接口(Application Programming Interface,API)以實(shí)現(xiàn)對(duì)互聯(lián)網(wǎng)圖像資源的開(kāi)放收割與處理。各機(jī)構(gòu)可以加入全球共享同盟(IIIF-C)來(lái)實(shí)現(xiàn)本機(jī)構(gòu)的資源共享,只要下載安裝相關(guān)API,將自身資源在這些成員單位上進(jìn)行共享展示。用戶只需安裝專門瀏覽器(Universal Viewer)即可使用這些數(shù)字資源。Universal Viewer瀏覽器在文化遺產(chǎn)機(jī)構(gòu)中較為流行,它可以演示不同類型的媒體資源,如數(shù)字圖像、音頻、視頻等。本庫(kù)采用 Universal Viewer瀏覽器實(shí)現(xiàn)電子書的深度縮放瀏覽,旋轉(zhuǎn)、分享、注釋、保存,還可以對(duì)圖片進(jìn)行轉(zhuǎn)化修改。任何通過(guò)IIIF方式發(fā)布的紅色資源,都可以通過(guò)IIIF-manifest連接,使讀者可以瀏覽全球的紅色資源。
(3)數(shù)據(jù)庫(kù)框架設(shè)計(jì)。新中國(guó)成立前紅色文獻(xiàn)數(shù)據(jù)庫(kù)設(shè)計(jì)一共分為4層,底層為數(shù)據(jù)層:數(shù)據(jù)來(lái)源主要是館藏紅色資源,以及采用IIIF發(fā)布的紅色資源。第二層為Omeka特藏資源管理發(fā)布平臺(tái),主要負(fù)責(zé)元數(shù)據(jù)的接入、處理、圖像數(shù)據(jù)的上傳、圖像資源發(fā)布等,第三層為IIIF層,在Omeka系統(tǒng)插件區(qū)中通過(guò)下載安裝IIIF專用瀏覽器UnivesalViewer,在瀏覽器中添加manifest地址,可以實(shí)現(xiàn)IIIF資源無(wú)縫連接,以此收割海量紅色資源。頂層為展示層,紅色資源可以實(shí)現(xiàn)深度縮放、平移、搜索、比較、分享等功能,頁(yè)面右側(cè)有元數(shù)據(jù)查看功能。
3.新中國(guó)成立前紅色文獻(xiàn)數(shù)據(jù)庫(kù)系統(tǒng)實(shí)施
經(jīng)過(guò)系統(tǒng)的前期部署,新中國(guó)成立前紅色文獻(xiàn)數(shù)據(jù)處理主要分為兩個(gè)部分,圖像數(shù)據(jù)和元數(shù)據(jù)的處理與導(dǎo)入,以及網(wǎng)頁(yè)主題設(shè)計(jì)。
第一部分為圖像數(shù)據(jù)的上傳,在上傳之前首先用圖像批量處理軟件DjVuToy將所有的DjVu文件全部轉(zhuǎn)換成TIF圖像文件,此部分轉(zhuǎn)換圖片時(shí)需將每個(gè)文件按序建立文件夾,將不同書籍轉(zhuǎn)換的文件放入不同文件夾中,共計(jì)105個(gè)文件夾,本機(jī)存放路線,例如:D->zhuanhuan。
Omeka系統(tǒng)的所有圖片資源設(shè)置為4個(gè)文件夾,分別為:fullsize,original,square_thumbnails,thumbnails,其中original文件夾用來(lái)存放所有圖片的源文件,打開(kāi)finalshell,將此前批量轉(zhuǎn)好的105個(gè)文件夾復(fù)制至路徑finalshell->omaka-main->files->original-> D->zhuanhuan中。
此外圖片的處理還涉及兩個(gè)部分:
一、做縮略圖。本網(wǎng)站采用的Universal Viewer瀏覽器在左側(cè)使用縮略圖預(yù)覽模式,使得讀者瀏覽閱讀時(shí)更為便捷。縮略圖的處理如下,使用命令行調(diào)用ImageMagick對(duì)目錄圖片進(jìn)行處理,使用到的ubuntu命令行為:for file in*/*.tif;do convert-thumbnail 164x200^-quality75%$file ${file%%.*}.jpg;done,在同一目錄下生成,源圖片和縮略圖可以同時(shí)然后復(fù)制到fullsize,square_thumbnails,thumbnails三個(gè)文件夾中去。
二、圖片加學(xué)校圖書館水印。首先將水印文件:logo.png提前放在:/var/www/sy/目錄下,再次使用ubuntu命令行:find -type f -exec bash -c ‘[[ -n “$(file -bi “$1” | grep tif)” ]] && composite -gravity center ?-geometry +1+1 ? /var/www/sy/logobig.png ? “$1” tif:”$1” - {} \; ? 即可將所有源文件加上水印,使得水印和源圖片融為一體。
第二部分為元數(shù)據(jù)的導(dǎo)入。此部分共建立6張表與Omeka數(shù)據(jù)庫(kù)的批量導(dǎo)入,分別為omaka_element_texts.xlsx,omeka_files.xlsx,omeka_items.xlsx,omeka_records_tags-ok.xlsx,omeka_search_texts.xlsx和omeka_tags.xlsx。其中omeka_files.xlsx為每張圖片存放的物理地址,omeka_tags.xlsx為每篇文章的標(biāo)簽分類,有出版年份、出版社等。6張表做好后打開(kāi)navicat,連接IP地址,在omeka_main目錄下先復(fù)制備份,然后再導(dǎo)入表。
第三部分為網(wǎng)站主題選擇。Omeka官網(wǎng)上可以下載不同風(fēng)格的主題頁(yè)面或者可以自己設(shè)計(jì)主題,Omeka官網(wǎng)提供了12種不同風(fēng)格的主題頁(yè)面,通過(guò)下載源文件,然后存放在omaka-main/themes目錄下即可使用。本網(wǎng)站采用的“ The Daily”風(fēng)格,用戶可以自由配置該主題,通過(guò)改變頁(yè)面顏色、logo文件,以及設(shè)置頁(yè)面圖片尺寸和頁(yè)面顯示設(shè)定等操作。本網(wǎng)站最終頁(yè)面展示12本書,每行4本,一共3行。頁(yè)面布局簡(jiǎn)潔大方,讀者使用時(shí)一目了然,非常適合小型網(wǎng)站書展模式。此外網(wǎng)頁(yè)采用終端自適應(yīng)設(shè)計(jì),在各類移動(dòng)設(shè)備上也能輕松展示,隨時(shí)隨地獲取資源。
四、結(jié)論與展望
當(dāng)前,開(kāi)發(fā)共享各類特藏資源的學(xué)術(shù)研究、文化教育以及文化遺產(chǎn)的保存得到廣泛共識(shí)。IIIF提供了一個(gè)統(tǒng)一的收割和管理分布于世界各地的不同數(shù)字資源的協(xié)議,通過(guò)IIIF的使用,可以使得圖像資源存儲(chǔ)機(jī)構(gòu)突破自身資源限制,經(jīng)過(guò)IIIF發(fā)布的圖像可以極為方便地進(jìn)行互操作,實(shí)現(xiàn)和其他館藏機(jī)構(gòu)之間的圖像資源的共享利用,最終形成全國(guó)高校圖書館紅色資源共建,優(yōu)勢(shì)互補(bǔ)的共享平臺(tái)。
參考文獻(xiàn):
[1]賈翠玲.延安時(shí)期紅色文獻(xiàn)搜集整理與數(shù)字化建設(shè)[J].延安大學(xué)學(xué)報(bào),2016
[2]付躍安.國(guó)際圖像互操作框架(IIIF)及在數(shù)字資源集成中的應(yīng)用[J].圖書館論壇,2020
[3]吳加琪 基于Omeka的專題數(shù)字文化資源小型收集網(wǎng)站建設(shè)研究[J].現(xiàn)代情報(bào),2017
[4]張 毅,陳 丹.基于Omeka與IIIF的特藏資源庫(kù)建設(shè)研究與實(shí)踐[J].大學(xué)圖書館學(xué)報(bào),2020
(作者單位:華東師范大學(xué)圖書館)