關(guān)鍵詞:圖書館;特藏;EBM;按需數(shù)字化
摘要:文章介紹了數(shù)字化的設(shè)備以及數(shù)字化過程中需要考慮的因素。圖書館可以引進(jìn)EBM,借鑒國外的管理模式,大膽嘗試對特色資源按需數(shù)字化,加速特藏的流通,更好地為讀者服務(wù)。
中圖分類號:G250文獻(xiàn)標(biāo)識碼:A文章編號:1003-1588(2015)03-0096-02
1高校圖書館特藏數(shù)字化
普通高校評估要求高校圖書館有長期積累、獨具特色的資源,每個高校都有自己的重點學(xué)科,所具有的電子資源也都各有側(cè)重。在網(wǎng)絡(luò)環(huán)境下,人類獲取信息的手段和方式越來越多,圖書館館藏如果僅停留在普通水平上,就與互聯(lián)網(wǎng)無異。在檢索方便快捷方面,圖書館與baidu、Google相比并不占優(yōu)勢。OCLC在2006年進(jìn)行的一項全球調(diào)查顯示,89%的高校學(xué)生首選Google等網(wǎng)絡(luò)搜索引擎搜集信息資源,而選擇圖書館的比例僅占2%。由此,高校圖書館如果想保持永久的生命力,致力于特色資源建設(shè)是其必然選擇。特色資源的收藏并不是目的,其目的在于最大限度地實現(xiàn)資源共享,提供特色服務(wù)。如果所有紙質(zhì)特藏資源內(nèi)容都能提供電子目錄摘要,那么在讀者有需要時就可以按需數(shù)字化或打印,在共享的同時又保護(hù)了珍貴的原始資料。
2數(shù)字化的設(shè)備
書刊掃描儀是專為書刊、期刊、報紙、古籍、易損壞文檔而設(shè)計的A2大幅面掃描設(shè)備,掃描出來的圖像,可直接用于印刷。目前國內(nèi)沒有任何企業(yè)生產(chǎn)制造此類型的掃描設(shè)備,國內(nèi)市場上也只有幾個國外品牌的書刊掃描儀,國外有圖書館用這種書刊掃描儀把所有圖書掃描成電子檔,存儲在數(shù)據(jù)庫里,建立虛擬圖書館,供人們網(wǎng)上閱讀。以下介紹3種圖書掃描儀(機(jī))。
2.1美國Kirtas全自動書刊掃描儀(Espresso Book Machine)
美國Kirtas全自動書刊掃描儀簡稱EBM,是技術(shù)先進(jìn)、功能卓越和最受歡迎的書刊數(shù)字化的全自動電子設(shè)備,可實現(xiàn)自動翻頁、自動掃描、批量數(shù)字化處理功能,可以把傳統(tǒng)的印刷書刊、雜志以及很多珍貴的古代書籍知識以數(shù)字化的方式儲存下來。 EBM是一種集成式按需印刷系統(tǒng),主要由美國On Demand Books,LLC(ODB)公司的EspressNet軟件系統(tǒng)、打印系統(tǒng)、書帖整理對齊系統(tǒng)、裝訂系統(tǒng)、裁切系統(tǒng)構(gòu)成,其中EspressNet的軟件系統(tǒng)相當(dāng)于一個指揮調(diào)度中樞和核算中心,而打印系統(tǒng)、書帖整理對齊系統(tǒng),膠訂系統(tǒng)、裁切系統(tǒng)的功能則相當(dāng)于一個印刷裝訂廠。該掃描儀2003年11月獲得美國科學(xué)技術(shù)創(chuàng)新最優(yōu)獎。據(jù)ODB公開的資料, 已經(jīng)有近61臺EBM安裝在世界各地的書店、圖書館和大學(xué)。其中大學(xué)書店21家,獨立書店19家,圖書館14家,其他連鎖書店7家。劍橋大學(xué)出版社擁有一臺,用來把劍橋圖書館收藏的重要的學(xué)生用書數(shù)字化。中國僅有一臺,在中國出版集團(tuán)。EBM主要用于絕版圖書、專業(yè)性強(qiáng)的學(xué)術(shù)著作、個人出版和根據(jù)顧客需求專門定制的圖書。
2.2谷歌圖書掃描機(jī)
2004年12月,谷歌啟動了一項名為“數(shù)字圖書館”的工程,即把全球知名大學(xué)和研究機(jī)構(gòu)所屬圖書館的藏書轉(zhuǎn)化為電子書。這些圖書館包括斯坦福大學(xué)、哈佛大學(xué)、密歇根大學(xué)、牛津大學(xué)所屬圖書館及紐約公共圖書館等。在谷歌啟動“數(shù)字圖書館”之前,業(yè)界通常使用光學(xué)字符識別軟件(OCR)來實現(xiàn)紙質(zhì)書的數(shù)字化。但OCR軟件要求被掃描的圖書每頁必須平整放置。而對于整本書籍來說,不損壞書籍裝訂的通行掃描方法是:將圖書一頁頁打開放在玻璃面板上壓平。另一種方式是把已裝訂的圖書一頁頁拆開。由此可見,上述兩種圖書掃描方式效率都不高,且容易毀壞書籍。而谷歌所開發(fā)的批量化圖書掃描技術(shù)解決了這一難題。谷歌向USPTO提交的圖書掃描專利申請說明書顯示,工作人員把被掃描書籍放入谷歌專門開發(fā)的圖書硬件設(shè)備后,該設(shè)備所配備的紅外技術(shù)攝像頭將檢測被掃描書籍的三維形態(tài)和角度,然后把該信息傳輸至OCR軟件,并進(jìn)行失真校準(zhǔn),使OCR軟件能夠更準(zhǔn)確地識別被掃描文本。利用谷歌最新的圖書掃描技術(shù),被掃描圖書既不用放在玻璃面板上壓平,也不用將其一頁頁拆開,因此其掃描速度和準(zhǔn)確率都大幅提高。2013年11月15日,谷歌與美國作家協(xié)會(Authors Guild)之間長達(dá)八年之久的版權(quán)爭議告一段落,曼哈頓聯(lián)邦地區(qū)華裔法官陳卓光(Denny Chin)做出判決,表示谷歌掃描圖書是擁有益處的公平行為。谷歌電子掃描的內(nèi)容是經(jīng)過“高度改編的”,并不會侵犯原創(chuàng)市場。按照新的判決,谷歌將能夠繼續(xù)電子掃描存在版權(quán)爭議的約2,000萬冊圖書。
2.3DIY圖書掃描儀
研究生Daniel Reetz 自制了DIY圖書掃描儀,整個掃描儀由兩個相機(jī)、兩個小燈以及回收來的木板等組成,OCR軟件則用的是開源。掃描一本400頁的圖書僅用時20分鐘。耗時三天,總花費300美元(包括2臺佳能Power shot A590相機(jī))。使用這個掃描儀也極其簡單:將書本攤開放到V型托盤上,按按鈕開始,翻頁時當(dāng)然也是“全自動”(全部自己動手),300美元的東西你不能寄希望它有多么智能。當(dāng)然還存在其他問題,最為重要的是:自制圖書掃描儀的版權(quán)問題,即你購買一本書后是否擁有了它所有形式的所有權(quán)。
田甜:高校圖書館特藏按需數(shù)字化探索田甜:高校圖書館特藏按需數(shù)字化探索3特藏按需數(shù)字化需要考慮的因素
3.1特藏數(shù)字化的后期制作
數(shù)字化后的圖像有時會扭曲,所有圖像頁面需要裁切和修正。一般有自動和人工兩部分,全自動掃描儀一般都具有裁切、移除不想要的部分等功能,根據(jù)書的大小,花費的時間也不等。有時也還需要人工用圖像編輯軟件來處理,這項工作大都外包。
3.2特藏數(shù)字化的質(zhì)量、成本和數(shù)字化所需時間三者之間的關(guān)系
特藏數(shù)字化的質(zhì)量、成本和數(shù)字化所需時間三者之間的關(guān)系為:質(zhì)量越高,后期制作需要越多,花費越大;質(zhì)量越高,后期制作需要越多,數(shù)字化持續(xù)時間越長;數(shù)字化持續(xù)時間越長,顧客的數(shù)字化請求越少。鑒于“客戶”將支付前期數(shù)字化的成本,必須找到質(zhì)量、成本、所需時間的最佳平衡點。筆者建議:①質(zhì)量方面,如果圖書館是幫助讀者盡快有效地得到信息,那么內(nèi)容能滿足用戶需要就可以,不需要達(dá)到商業(yè)出版的作品質(zhì)量。②時間方面,滿足用戶需要的數(shù)字化內(nèi)容應(yīng)該盡快交付,應(yīng)該告知用戶交付使用的時間表。③成本方面,如果前期的成本仍然很高,可以依據(jù)數(shù)字化的產(chǎn)品綜合價值,降低首次數(shù)字化的成本,因為以后可能還會有大量用戶,并非所有的數(shù)字化成本都必須由首位客戶支付。數(shù)字化副本和打印品必須讓一般的大學(xué)生用戶能夠負(fù)擔(dān)得起,考慮到按需的屬性,價位應(yīng)該在學(xué)術(shù)文本書和大眾平裝書之間。
3.3數(shù)字化管理和存儲設(shè)備
目前劍橋大學(xué)根據(jù)現(xiàn)存的打印和數(shù)字化流程,僅存貯PDF格式的文檔。有些圖書館可能也想存貯高質(zhì)量的JPG或者是TIFF格式的文件。圖書館在考慮按需數(shù)字化時,需要考慮以下問題:①假定外部有數(shù)字化圖書館,是否還有必要在本館保存數(shù)字化的產(chǎn)品。②產(chǎn)權(quán)問題或者說原始資料的所有者是否授權(quán)。
4結(jié)語
綜上所述,雖然最初的投資比較大,但EBM全自動書刊掃描儀提供了一種快速高效的全文數(shù)字化方式。當(dāng)然,圖書館也可以租用設(shè)備或者使用第三方(代理)加工數(shù)字化。盡管在按需數(shù)字化服務(wù)中可能有高利潤,但這種需求可能僅限于特定的讀者。特藏重在用而不是藏,圖書館工作人員應(yīng)該考慮怎樣最大化地滿足讀者的需要,讓特藏快速、高效地流通,更好地為讀者服務(wù)。
參考文獻(xiàn):
[1]Ian Rowlands,David Nicholas, Peter Williams,etal. The Google generation: the information behavior of the researcher of the future [R]. Aslib Proceedings,2008(60):290-310.
[2]EBM Locations: List View [EB/OL].[2014-06-06].http://ondemandbooks.com/ebm_locations_list.php.
[3]谷歌勝訴 掃描圖書是合法使用[EB/OL].[2014-06-06].http://it.sohu.com/201311
15/n390185443.shtml.
[4]圖書掃描儀DIY僅300美元[EB/OL].[2014-06-06].http://www.molei.net/article/7976.html.
[5]Henry P.Zulu. Digitalization of Scholarly Works at the Special Collections of the University of Zambia Library[D].長春:東北師范大學(xué),2010.
(編校:周雪芹)