我國(guó)的文獻(xiàn)信息資源可按照歷史時(shí)期大致劃分為古籍文獻(xiàn)資源和現(xiàn)代文獻(xiàn)資源。古籍文獻(xiàn)不僅指書寫或印刷于1912年以前具有中國(guó)古典裝幀形式的書籍,還包括同時(shí)期的甲骨文、金文、簡(jiǎn)帛、碑刻、輿圖、檔案、契約、尺牘、手札等初期書籍或特種文獻(xiàn),等同于古典文獻(xiàn)或歷史文獻(xiàn);現(xiàn)代文獻(xiàn)泛指近現(xiàn)代的圖書、報(bào)紙雜志等文獻(xiàn),載體形式方面既包括紙張、音像等傳統(tǒng)載體,也包括數(shù)字網(wǎng)絡(luò)載體。
隨著現(xiàn)代計(jì)算機(jī)信息技術(shù)的迅猛發(fā)展與網(wǎng)絡(luò)應(yīng)用的普及,數(shù)字化已成為對(duì)不同時(shí)代類型的文獻(xiàn)資源進(jìn)行整理與加工的重要手段。如電子書的閱讀、數(shù)字圖書館的建立、網(wǎng)絡(luò)讀書頻道的開通、數(shù)字出版業(yè)的興起等等,它使得“鴻篇巨著”能隨身攜帶、隨處翻閱,使閱讀更加輕松便捷[1]。所謂文獻(xiàn)資源數(shù)字化即是利用計(jì)算機(jī)信息技術(shù)將各類文獻(xiàn)與信息中的語言文字或圖形符號(hào)進(jìn)行數(shù)字化整理與加工,并轉(zhuǎn)化為數(shù)字媒體形式的索引數(shù)據(jù)庫和全文數(shù)據(jù)庫。雖然目前從事文獻(xiàn)資源數(shù)字化開發(fā)建設(shè)的企業(yè)、學(xué)術(shù)機(jī)構(gòu)及個(gè)人大多以贏利性或功利性為目的,但文獻(xiàn)資源數(shù)字化的成果或產(chǎn)品大多具備基于超鏈接設(shè)計(jì)的瀏覽閱讀環(huán)境、強(qiáng)大的檢索功能和研究支持功能,客觀上便于用戶檢索、發(fā)現(xiàn)、識(shí)別和獲取所需文獻(xiàn)信息,有利于學(xué)術(shù)研究和大眾閱讀,有利于文獻(xiàn)資源的保護(hù)與利用。無論古籍文獻(xiàn)數(shù)字化還是現(xiàn)代文獻(xiàn)數(shù)字化的目的與作用均是如此,但這兩種類型文獻(xiàn)資源的數(shù)字化處理卻有性質(zhì)上的區(qū)別,社會(huì)意義方面也有所不同。
古籍文獻(xiàn)數(shù)字化經(jīng)過三十余年的探索與發(fā)展,已有不少專家學(xué)者對(duì)其概念與內(nèi)涵進(jìn)行了闡釋,一致認(rèn)為古籍文獻(xiàn)數(shù)字化(即古籍?dāng)?shù)字化)是利用計(jì)算機(jī)信息技術(shù)對(duì)古籍及其內(nèi)容進(jìn)行整理和加工,屬于古籍整理的范疇,是古籍整理的一部分。不過,目前尚未有人對(duì)古籍文獻(xiàn)數(shù)字化的古籍整理性質(zhì)做進(jìn)一步的說明與分析。北京書同文數(shù)字化技術(shù)有限公司的張軸才先生對(duì)古籍文獻(xiàn)數(shù)字化的認(rèn)識(shí)可給人們些許啟示,他認(rèn)為:狹義的典籍?dāng)?shù)字化是把整理后的古籍文獻(xiàn)內(nèi)容,從紙面轉(zhuǎn)換為數(shù)字,與相關(guān)的數(shù)字化工具結(jié)合在一起,達(dá)到字字可查、句句可檢的水準(zhǔn),提供給文史工作者使用。這是一個(gè)基礎(chǔ)工作。目的不是取代文史工作者(也永遠(yuǎn)取代不了),而是讓學(xué)者“如虎添翼”(季羨林老先生在我們贈(zèng)送北京大學(xué)《四部叢刊》時(shí)講的話)。進(jìn)行深層次的研究(廣義的數(shù)字化:標(biāo)引、???、版本對(duì)比、注釋、同義詞語、韻律、批評(píng))。這些我們做不好,這些工作是文史工作者的使命,當(dāng)然要配合一定的工具[2]。張軸才所說的狹義的古籍文獻(xiàn)數(shù)字化是將已運(yùn)用編纂、??薄?biāo)點(diǎn)、注釋和今譯等方法整理過的古籍轉(zhuǎn)化為數(shù)字媒體形式的數(shù)據(jù)庫,這一層次的古籍文獻(xiàn)數(shù)字化在本質(zhì)上與現(xiàn)代文獻(xiàn)數(shù)字化并無二致。廣義的古籍文獻(xiàn)數(shù)字化涉及選擇底本、???、注譯和編纂等傳統(tǒng)古籍整理專業(yè)知識(shí),屬于更高層次的古籍文獻(xiàn)數(shù)字化。隨著計(jì)算機(jī)智能化程度的提高,將來還有可能產(chǎn)生利用計(jì)算機(jī)進(jìn)行自動(dòng)編纂、自動(dòng)注釋、自動(dòng)???、自動(dòng)斷句標(biāo)點(diǎn)等智能化整理。目前所談的古籍文獻(xiàn)數(shù)字化多半是廣義上的,本文所討論的古籍文獻(xiàn)數(shù)字化也是如此。
對(duì)古籍的信息與內(nèi)容進(jìn)行數(shù)字化處理、建設(shè)數(shù)據(jù)庫是古籍文獻(xiàn)數(shù)字化的表現(xiàn)形式,其實(shí)質(zhì)在于借助數(shù)字化的手段完成古籍的影印、點(diǎn)校、注釋、輯佚、索引、編纂等一系列傳統(tǒng)古籍整理方法。這里有兩層含義:一是將人工整理的成果數(shù)字化;二是智能化整理,并將整理成果數(shù)字化。所以古籍文獻(xiàn)數(shù)字化不是現(xiàn)代計(jì)算機(jī)信息技術(shù)背景下產(chǎn)生的一種全新的、單一的古籍整理方法,它在本質(zhì)上是傳統(tǒng)古籍整理方法的延續(xù)與創(chuàng)新,進(jìn)一步來說是古籍整理數(shù)字化。
現(xiàn)代文獻(xiàn)數(shù)字化最終成果的表現(xiàn)形式雖然與古籍文獻(xiàn)數(shù)字化基本相同,都是各種類型的索引數(shù)據(jù)庫和圖文數(shù)據(jù)庫,但現(xiàn)代文獻(xiàn)數(shù)字化的開發(fā)建設(shè)過程要比古籍文獻(xiàn)數(shù)字化“單純”的多?,F(xiàn)代文獻(xiàn)數(shù)字化也有兩層含義:一是依靠現(xiàn)代計(jì)算機(jī)信息技術(shù)來完成文獻(xiàn)組織方式與載體的數(shù)字化轉(zhuǎn)變;二是圖書報(bào)刊文獻(xiàn)資源的數(shù)字化出版。現(xiàn)代文獻(xiàn)數(shù)字化體現(xiàn)的是不同類型文獻(xiàn)載體形式的數(shù)字化、網(wǎng)絡(luò)化,其本質(zhì)上是文獻(xiàn)資源組織與服務(wù)的數(shù)字化、網(wǎng)絡(luò)化與多媒體化。
古籍具有不可再生性,今人不可能制作或再造古籍,古籍經(jīng)過數(shù)字化處理后形成的數(shù)字化成果或產(chǎn)品就不能再稱為古籍,只能是古籍整理的產(chǎn)物。而現(xiàn)代文獻(xiàn)無論利用多么先進(jìn)的數(shù)字信息技術(shù)對(duì)其進(jìn)行處理與加工,它還是現(xiàn)代文獻(xiàn),性質(zhì)不會(huì)發(fā)生改變。所以現(xiàn)代文獻(xiàn)數(shù)字化應(yīng)該說是一種技術(shù)活兒,掌握一定的數(shù)字信息技術(shù)就可以勝任這項(xiàng)工作。以上所述表明古籍文獻(xiàn)數(shù)字化與現(xiàn)代文獻(xiàn)數(shù)字化性質(zhì)上有如下區(qū)別:古籍文獻(xiàn)數(shù)字化是古籍整理數(shù)字化;現(xiàn)代文獻(xiàn)數(shù)字化是文獻(xiàn)資源組織與服務(wù)的數(shù)字化。
文獻(xiàn)資源數(shù)字化給文獻(xiàn)資源的內(nèi)容表現(xiàn)形式和用戶利用模式帶來了革新性變化。數(shù)字化背景下文獻(xiàn)載體的類型不再是普通的印刷型的圖書、期刊、資料、特種文獻(xiàn)等,而是出現(xiàn)了印刷型文獻(xiàn)與數(shù)字化的文獻(xiàn)信息并存并用、相互補(bǔ)充的文獻(xiàn)信息資源結(jié)構(gòu),出現(xiàn)文獻(xiàn)載體向多樣化的方向發(fā)展[3]。對(duì)用戶而言,文獻(xiàn)資源數(shù)字化使文獻(xiàn)信息的檢索與利用模式發(fā)生了根本性變化,大眾用戶可以通過網(wǎng)絡(luò)與數(shù)字媒體便捷地獲取所需信息資源以提高自身綜合素養(yǎng);學(xué)術(shù)研究人員可以在短時(shí)間內(nèi)完成以往需要很長(zhǎng)時(shí)間才能完成的資料搜集工作,并更便利地獲取相關(guān)研究所需資料。不過,文獻(xiàn)資源數(shù)字化也有消極意義,一是數(shù)字化使文獻(xiàn)信息利用者尤其是大眾閱讀群體面對(duì)海量文獻(xiàn)信息茫然無措,甚至“喪失自己的自主性,喪失反思和批判的能力,成為信息爆炸的奴隸,被信息洪流所異化”[4]。二是文獻(xiàn)資源數(shù)字化使學(xué)術(shù)研究的抄襲和拼湊現(xiàn)象加劇,助長(zhǎng)了社會(huì)浮躁和學(xué)術(shù)不端之風(fēng)。但這只是整個(gè)社會(huì)發(fā)展過程中的問題,并不是數(shù)字化本身的過錯(cuò)。數(shù)字化文獻(xiàn)的廣泛應(yīng)用,對(duì)于人文科學(xué)的深入發(fā)展、對(duì)現(xiàn)代知識(shí)體系的形成具有積極正面的作用和深遠(yuǎn)的影響[5]。
文獻(xiàn)資源數(shù)字化從表面上看,是文獻(xiàn)信息資源組織、開發(fā)、傳播和利用途徑多元化,有利于文獻(xiàn)資源利用與保護(hù),促進(jìn)資源共享。進(jìn)一步來講,文獻(xiàn)資源數(shù)字化對(duì)一個(gè)國(guó)家的經(jīng)濟(jì)建設(shè)與文化建設(shè)具有重要意義,有利于提高國(guó)家的科技和文化軟實(shí)力。古籍文獻(xiàn)數(shù)字化與現(xiàn)代文獻(xiàn)數(shù)字化的意義均包括上述內(nèi)容,但古籍文獻(xiàn)數(shù)字化的意義還有現(xiàn)代文獻(xiàn)數(shù)字化不具備的一面:其一,古籍文獻(xiàn)數(shù)字化有助于傳統(tǒng)文化的繼承和創(chuàng)新。古籍文獻(xiàn)數(shù)字化代表著古籍整理的未來與方向,而古籍是中華民族優(yōu)秀傳統(tǒng)文化的重要載體,古籍文獻(xiàn)數(shù)字化自然而然就成為繼承和創(chuàng)新我國(guó)傳統(tǒng)文化的重要手段。借助現(xiàn)代計(jì)算機(jī)信息技術(shù),我們可以對(duì)古籍的內(nèi)容進(jìn)行深度地整理和挖掘,進(jìn)而可以使人們便捷地學(xué)習(xí)了解和研究本民族的傳統(tǒng)文化。當(dāng)今社會(huì),只有數(shù)字化產(chǎn)品才能迅速、準(zhǔn)確地進(jìn)行傳遞和交流,才能夠?yàn)榛ヂ?lián)網(wǎng)信息平臺(tái)提供有價(jià)值的信息資源,使傳統(tǒng)文化在信息傳播的深度、廣度、速度上有一個(gè)質(zhì)的飛躍。通過對(duì)傳統(tǒng)文化的深入了解與接觸,能夠增強(qiáng)我們的民族自尊心和對(duì)本族文化的自信心,取其精華棄其糟粕,彌合文化的斷層,增強(qiáng)民族凝聚力,使中國(guó)傳統(tǒng)文化獲得健康的發(fā)展,推進(jìn)社會(huì)的穩(wěn)定和諧進(jìn)步[6]。其二,古籍文獻(xiàn)數(shù)字化有助于優(yōu)秀傳統(tǒng)文化的弘揚(yáng)和傳播。將汗牛充棟的古代典籍?dāng)?shù)字化,并通過互聯(lián)網(wǎng)以數(shù)字媒體的形式傳輸?shù)绞澜绺鞯?,可以使全世界范圍的炎黃子孫方便、快捷地學(xué)習(xí)本民族的優(yōu)秀傳統(tǒng)文化,也便于全世界范圍的漢學(xué)家們更好地研究中國(guó)傳統(tǒng)文化,進(jìn)而讓全世界人們感受到中國(guó)傳統(tǒng)文化歷久彌新的魅力。從長(zhǎng)遠(yuǎn)上來講,古籍文獻(xiàn)數(shù)字化有助于保存中華民族文化的獨(dú)立品格,并將中華民族優(yōu)秀傳統(tǒng)文化的深厚內(nèi)涵弘揚(yáng)和傳播于全世界,進(jìn)而維護(hù)世界文化的多元性存在。
[1]孫翠亭,佟郡.“圖書數(shù)字化”能否開辟閱讀新時(shí)代?[J].發(fā)明與創(chuàng)新(綜合版),2010,(1):26.
[2]張軸材.典籍?dāng)?shù)字化與搜索:源與流,深與淺[EB/OL].http://www.guoxue.com/zt/gjszh/yjwz_027.htm.
[3]周力,郭振安.文獻(xiàn)資源數(shù)字化與圖書館文獻(xiàn)信息資源建設(shè)[J].河北科技圖苑,1998,(S1):60-61.
[4]孫偉平.論信息時(shí)代人的新異化[J].哲學(xué)研究,2010,(7):113-119.
[5]鄭永曉.文獻(xiàn)數(shù)字化背景下的學(xué)術(shù)研究——以人文科學(xué)為例 [EB/OL].[2012-11-16].http://www.guoxue.com/?p=4459.
[6]尹小林.古籍?dāng)?shù)字化的使命與前景[EB/OL].http://www.guoxue.com/zt/gjszh/yjwz_026.htm.