• <tr id="yyy80"></tr>
  • <sup id="yyy80"></sup>
  • <tfoot id="yyy80"><noscript id="yyy80"></noscript></tfoot>
  • 99热精品在线国产_美女午夜性视频免费_国产精品国产高清国产av_av欧美777_自拍偷自拍亚洲精品老妇_亚洲熟女精品中文字幕_www日本黄色视频网_国产精品野战在线观看 ?

    墓志文獻(xiàn)數(shù)字化建設(shè)初探

    2012-08-15 00:45:22張居蘭
    關(guān)鍵詞:墓志圖文檢索

    張居蘭

    (平頂山學(xué)院圖書館,河南平頂山,467000)

    一、墓志文獻(xiàn)數(shù)字化建設(shè)的必要性

    在華夏文化數(shù)千年的發(fā)展歷程中,我們的先人留下了浩如煙海般的各種文獻(xiàn)資料,這些古籍記載了中國歷史和文化的演進(jìn)脈絡(luò),是極為珍貴的文化遺產(chǎn)。從文獻(xiàn)流傳、保存形式來看,中國古代文獻(xiàn)可分為傳世古代文獻(xiàn)、出土文獻(xiàn)、民間古代文獻(xiàn)、域外古代漢籍四大類。墓志指放在墓里的刻有死者生平事跡的石刻,一般屬于出土文獻(xiàn)。它們是記載墓主人行跡的第一手資料。墓志在漢代開始出現(xiàn),到南北朝直至隋唐時期,其發(fā)展已經(jīng)進(jìn)入至成熟階段。這一時期,墓志數(shù)量眾多,內(nèi)容豐富,是進(jìn)行歷史文化研究必不可少的資料。宋代之后,在出土文獻(xiàn)中,墓志仍然占有較大比重,具有重要的學(xué)術(shù)研究意義,也具有一定的文物價值。

    可以說,墓志文獻(xiàn)是歷史演進(jìn)的直接見證,也是中華民族寶貴的文化遺產(chǎn),具有極高的歷史價值。墓志文獻(xiàn)屬于不可再生的文化資源,近年來,盡管國家加大了對墓志文獻(xiàn)的保護(hù)力度,使其保存環(huán)境得到改善,但隨著歷史的推進(jìn),墓志文獻(xiàn)古籍還是會不可避免地出現(xiàn)損毀,乃至消亡。目前,墓志文獻(xiàn)整體保存環(huán)境不盡人意,各藏館保存條件參差不齊,墓志文獻(xiàn)保護(hù)、傳承、利用狀況令人擔(dān)憂。因此,如何在保護(hù)的基礎(chǔ)上更好地利用這些寶貴的墓志文獻(xiàn)資源是歷史學(xué)和圖書館學(xué)共同面臨的重要課題。

    有鑒于此,采用數(shù)字化手段對墓志文獻(xiàn)進(jìn)行處理,既可以使墓志文獻(xiàn)的原圖原貌得以永久保存,又可以通過數(shù)據(jù)庫和網(wǎng)絡(luò)手段對墓志文獻(xiàn)進(jìn)行發(fā)布,避免閱讀原文對墓志造成的損傷,從而方便、快捷、無損地開發(fā)和利用這些寶貴資源。

    目前,在學(xué)術(shù)界一些部門和個人對于包括墓志文獻(xiàn)在內(nèi)的漢文古籍的數(shù)字化建設(shè)也做出了一些嘗試。出版了數(shù)字化文獻(xiàn)的全文,還有相關(guān)索引、書目等工具書,為墓志文獻(xiàn)的數(shù)字化提供了良好的范例和有益的經(jīng)驗(yàn)。傳統(tǒng)古籍整理的方式一般都是人為的手工方式,這是一項(xiàng)非常艱難、枯燥、復(fù)雜的工作,需要占用大量的時間和精力,對古代墓志文獻(xiàn)的整理也不例外。長期以來,改善工作條件,提升工作效率一直都是古籍整理工作者的強(qiáng)烈期盼,而隨著現(xiàn)代科技的發(fā)展,計(jì)算機(jī)信息處理技術(shù)已經(jīng)成為了實(shí)現(xiàn)這一愿景的有效手段。

    二、墓志文獻(xiàn)數(shù)字化所面臨的主要問題與解決途徑

    墓志文獻(xiàn)數(shù)字化雖然是墓志文獻(xiàn)保護(hù)、利用與開發(fā)的理想方式,但在具體實(shí)踐過程中,由于技術(shù)條件限制,仍然面臨不少問題。

    (一)墓志文獻(xiàn)數(shù)字化所面臨的主要問題

    1.墓志文獻(xiàn)中冷僻字的處理

    在墓志文獻(xiàn)中,異體字、通假字和不規(guī)范字的使用十分常見。因此,墓志文獻(xiàn)數(shù)字化過程中不可避免地會遇到字體障礙,這突出地表現(xiàn)在兩個方面:一個是對字體的識別障礙,即準(zhǔn)確錄入冷僻漢字的人需要有較好的文字學(xué)基礎(chǔ),而對于普通的計(jì)算機(jī)操作人員來說要做到這一點(diǎn)則有較大困難;另一個則是技術(shù)障礙,目前廣泛應(yīng)用的Unicode字符集雖能較好地解決字庫問題,但是與不少軟件難以兼容,常用的輸入法和搜索引擎也不支持大字符集,導(dǎo)致眾多的冷僻字無法準(zhǔn)確顯示和檢索。[1]因此,如何處理冷僻漢字仍是墓志文獻(xiàn)數(shù)字化過程中必須要克服的一道難題。

    2.缺乏統(tǒng)一的墓志文獻(xiàn)數(shù)字化處理標(biāo)準(zhǔn)

    目前,雖然不少部門和單位都在從事墓志文獻(xiàn)數(shù)字化工作,但相互聯(lián)系較少,所采取的途徑也都有所差異。因此產(chǎn)生的墓志文獻(xiàn)的數(shù)字化成果形式各異,不利于墓志文獻(xiàn)數(shù)字化的可持續(xù)發(fā)展,也不利于墓志文獻(xiàn)數(shù)字化資源共享。這其中的主要原因除了缺乏有效的協(xié)調(diào)規(guī)劃外,缺乏可以依據(jù)的統(tǒng)一標(biāo)準(zhǔn)也是其中重要的因素。此外,相關(guān)研究的支持功能也亟待完善。[2]

    3.墓志文獻(xiàn)數(shù)字化軟件有待改進(jìn)

    對墓志文獻(xiàn)數(shù)字化而言,處理軟件的功能是影響處理過程和成果的直接因素。目前,掃描與圖像處理技術(shù)的發(fā)展已較為成熟,可供選擇的數(shù)字化加工系統(tǒng)種類頗多,不過現(xiàn)在使用較多的OCR軟件對墓志文獻(xiàn)中的部分繁體字和不規(guī)范用字的識別效果較差,必須用人工的方式加以校對,而這就需要耗費(fèi)大量的時間和人力。可以說,如何克服數(shù)據(jù)加工軟件在處理文字方面的缺陷,提高檢索速度,有效提高OCR在古文獻(xiàn)識別上的準(zhǔn)確度是墓志文獻(xiàn)數(shù)字化所面臨的一個重大課題。

    4.文獻(xiàn)信息的準(zhǔn)確檢索

    墓志文獻(xiàn)數(shù)字化的主要目的和基本功能之一就是迅捷、精確地檢索到所需要的內(nèi)容,而在這方面的表現(xiàn)也是評判其優(yōu)劣的重要標(biāo)準(zhǔn)。全文本的數(shù)字化墓志文獻(xiàn)已經(jīng)能夠做到實(shí)現(xiàn)所有字符的檢索,但是準(zhǔn)確度較低的問題還須得到解決;圖像版可以確保信息的準(zhǔn)確無誤,但難以進(jìn)行全文檢索。采用對有效檢索點(diǎn)標(biāo)引的方式,可以在一定程度上解決上述問題,但仍會不可避免地遺漏某些信息。由于墓志文獻(xiàn)中普遍存在使用通假字、異體字的現(xiàn)象,就使得內(nèi)容的精確檢索更加困難。因此,推進(jìn)后控詞庫建設(shè),實(shí)現(xiàn)關(guān)聯(lián)檢索也是墓志文獻(xiàn)數(shù)字化必須要解決的問題。

    (二)墓志文獻(xiàn)數(shù)字化存在問題的解決途徑

    1.圖文互現(xiàn)是實(shí)現(xiàn)墓志文獻(xiàn)數(shù)字化的必要方式

    在實(shí)際研究過程中,研究者往往需要對墓志文獻(xiàn)的原始圖版進(jìn)行核對、勘驗(yàn)。因此,圖文互現(xiàn)是實(shí)現(xiàn)墓志文獻(xiàn)數(shù)字化不可缺少的一環(huán)。圖文互現(xiàn)就是將墓志文獻(xiàn)分別以圖像、文本兩種形式存儲,并將文本置于與之相應(yīng)的圖像之下,建立索引關(guān)系,實(shí)現(xiàn)圖文對照。圖文互現(xiàn)的方式能夠彌補(bǔ)圖像版文獻(xiàn)在內(nèi)容檢索和文字編輯上的缺陷,同時還可以有效地驗(yàn)證文本的準(zhǔn)確性,使得使用者不僅能夠看到原始面貌的墓志文獻(xiàn),也可以迅捷精準(zhǔn)地查詢到所需要的內(nèi)容。特別是對于研究者而言,他們對于墓志文獻(xiàn)原始版本信息和文本的準(zhǔn)確性有更高的要求,通過圖文對照則可以有效解決此類問題,為研究者提供可以相互參照的圖文資源。

    2.文獻(xiàn)整理與計(jì)算機(jī)專業(yè)人員應(yīng)當(dāng)確保深入合作

    墓志文獻(xiàn)數(shù)字化是歷史文化與現(xiàn)代信息技術(shù)的結(jié)合,這就需要通曉與墓志文獻(xiàn)整理相關(guān)的歷史學(xué)、考古學(xué)和文字學(xué)知識的人才和掌握現(xiàn)代信息網(wǎng)絡(luò)知識和多媒體技術(shù)的專業(yè)人員深入?yún)f(xié)作。墓志文獻(xiàn)數(shù)字化雖然是近年來才出現(xiàn)的文獻(xiàn)整理樣式,但究其實(shí)質(zhì)依舊屬于古籍整理的范疇,因此要順利完成墓志文獻(xiàn)的數(shù)字化過程,就必須擁有一批具有扎實(shí)文獻(xiàn)學(xué)、歷史學(xué)基本功的人員。同時,在數(shù)據(jù)采集與處理、數(shù)據(jù)庫設(shè)計(jì)、應(yīng)用平臺建設(shè)等方面必須有計(jì)算機(jī)專業(yè)人員參與,以保障墓志文獻(xiàn)數(shù)字化的技術(shù)可靠性。

    3.制定墓志文獻(xiàn)數(shù)字化的統(tǒng)一標(biāo)準(zhǔn)

    在我國,墓志文獻(xiàn)分布相當(dāng)廣泛,幾乎在各地都有發(fā)掘出土;其儲存也較為分散,分布在各級各地的博物館、文化機(jī)構(gòu)、考古部門,也包括為數(shù)不少的個人收藏。所以,建立完整的墓志文獻(xiàn)資源庫需要多地合作。因此,有必要建立統(tǒng)一的標(biāo)準(zhǔn),包括墓志文獻(xiàn)的分類標(biāo)準(zhǔn)、錄入規(guī)則、軟件和數(shù)據(jù)庫的應(yīng)用規(guī)范,數(shù)字化加工、利用的統(tǒng)一標(biāo)準(zhǔn)。顯然,標(biāo)準(zhǔn)的一致和規(guī)范既有利于夯實(shí)墓志文獻(xiàn)數(shù)字化資源共享的基礎(chǔ),也可以有效推動墓志文獻(xiàn)數(shù)字化的深入發(fā)展。

    4.整體規(guī)劃,共建共享

    墓志文獻(xiàn)數(shù)字化對于傳統(tǒng)文化的保護(hù)、研究、利用具有重要的促進(jìn)作用。同時,這一工程又具有鮮明的基礎(chǔ)性、學(xué)術(shù)性、公益性的色彩。為使得墓志文獻(xiàn)數(shù)字化工作能夠持之以恒地開展下去,就有必要建立協(xié)調(diào)和指導(dǎo)機(jī)制,制定較為完善的總體規(guī)劃并加以實(shí)施。規(guī)劃應(yīng)包括數(shù)字化對象的內(nèi)容、重點(diǎn)、分工狀況,以及相關(guān)準(zhǔn)則、規(guī)范。[3]應(yīng)當(dāng)說,這些問題的解決,可以有效避免重復(fù)建設(shè)和資源浪費(fèi),提高工作效率,并且實(shí)現(xiàn)墓志文獻(xiàn)數(shù)字化工程的共建共享。

    三、墓志文獻(xiàn)數(shù)字化數(shù)據(jù)庫建設(shè)技術(shù)路線

    墓志文獻(xiàn)數(shù)據(jù)庫是組織、存儲和管理相關(guān)數(shù)據(jù)的存儲器,也是墓志文獻(xiàn)數(shù)字化的主要載體,在墓志文獻(xiàn)數(shù)字化建設(shè)過程中具有重要地位,而其技術(shù)流程可以從以下幾個方面著手實(shí)施:

    (一)技術(shù)選擇

    目前,墓志文獻(xiàn)數(shù)據(jù)庫的系統(tǒng)建設(shè)多采用Java的Web信息技術(shù),在進(jìn)行數(shù)據(jù)搜索方面亦可采納Oracle 9i的Oracle Text技術(shù)。同時,可以配合使用J2EE的Struts、Hibernate框架的MVC技術(shù)框架,以保證處理數(shù)據(jù)的廣泛性和持久性。

    (二)數(shù)據(jù)選擇與加工

    墓志文獻(xiàn)數(shù)字化數(shù)據(jù)庫建設(shè)要根據(jù)出土墓志文獻(xiàn)的年代、文獻(xiàn)價值等確定收錄標(biāo)準(zhǔn),對于磨損嚴(yán)重,或是有重大歷史文化價值的墓志應(yīng)當(dāng)優(yōu)先進(jìn)行數(shù)字化處理。從對墓志保護(hù)的角度出發(fā),應(yīng)以墓志文獻(xiàn)的原始文本圖像作為主要數(shù)據(jù)來源,盡力實(shí)現(xiàn)全文本化。考慮到圖像要占用較大的存儲空間,可以采用Oracle 9i數(shù)據(jù)庫系統(tǒng)用以支持多媒體數(shù)據(jù),并采取技術(shù)措施對系統(tǒng)進(jìn)行優(yōu)化,以有效解決運(yùn)行速度的瓶頸制約。根據(jù)墓志文獻(xiàn)的特點(diǎn),對有關(guān)內(nèi)容進(jìn)行合理分類編輯,努力建設(shè)內(nèi)容全面的墓志文獻(xiàn)數(shù)據(jù)庫。

    (三)數(shù)字化處理

    該項(xiàng)工作主要是對墓志文獻(xiàn)進(jìn)行掃描、檢測、圖像處理、文本錄入等,在處理過程中,要盡量實(shí)施文本錄入,保證圖文能夠比照。為確保文獻(xiàn)能夠有效地保護(hù)和使用,掃描時應(yīng)當(dāng)采取全彩模式,300 dpi,JPEG格式保存,并且應(yīng)當(dāng)按照頁碼順序重新命名,同時對掃描后圖像的順序、偏斜度、完整性、清晰度進(jìn)行檢測,針對不同問題采取糾偏、去污、裁邊等方式進(jìn)行校正。

    (四)對墓志原文圖像進(jìn)行標(biāo)注

    對于開發(fā)或購置墓志文獻(xiàn)編輯系統(tǒng),應(yīng)當(dāng)對文中有效的檢索點(diǎn)進(jìn)行抽取和標(biāo)引,如墓志的名稱、墓主人、時代等信息進(jìn)行標(biāo)注,力求做到圖文的全文檢索,應(yīng)當(dāng)注意防止標(biāo)引過于瑣碎或過于簡括而影響檢索效果。

    (五)數(shù)據(jù)資源發(fā)布

    在完成數(shù)據(jù)庫的信息錄入、加工、檢測等程序后,下一步就應(yīng)當(dāng)將圖像數(shù)據(jù)、文本數(shù)據(jù)、標(biāo)引數(shù)據(jù)進(jìn)行合成,并整理入庫,編撰為墓志電子文獻(xiàn)。在正式開始發(fā)布前,應(yīng)當(dāng)再進(jìn)行一次全面數(shù)據(jù)庫測試,確認(rèn)條件成熟后,將數(shù)據(jù)庫資源正式發(fā)布,實(shí)現(xiàn)墓志文獻(xiàn)的數(shù)字化應(yīng)用。

    總之,墓志文獻(xiàn)數(shù)字化是一項(xiàng)既急迫又十分有價值的文化工程,它對于保護(hù)和傳承古代文化,開展科學(xué)研究都有著重要的促進(jìn)意義。只要選擇正確的技術(shù)路徑,持之以恒地進(jìn)行努力,墓志文獻(xiàn)數(shù)字化工程必定會取得突出的成效,成為開展科研工作的有力工具。

    [1] 李兵,劉國政,符永馳,等.從中醫(yī)古籍?dāng)?shù)據(jù)庫建設(shè)看中醫(yī)古籍?dāng)?shù)字化[J].中國中醫(yī)藥信息雜志,2009(3).

    [2] 李國新.中國古籍資源數(shù)字化的進(jìn)展與任務(wù)[J].大學(xué)圖書館學(xué)報(bào),2002(1).

    [3] 陳力.中文古籍?dāng)?shù)字化方法之檢討[J].國家圖書館學(xué)刊,2005(3).

    猜你喜歡
    墓志圖文檢索
    畫與理
    五代墓志所見遼代史料考
    遼耶律公迪墓志考
    南陽出土兩方唐代墓志
    2019年第4-6期便捷檢索目錄
    專利檢索中“語義”的表現(xiàn)
    專利代理(2016年1期)2016-05-17 06:14:36
    賦與唐代墓志
    圖文配
    海外英語(2013年9期)2013-12-11 09:03:36
    圖文配
    海外英語(2013年10期)2013-12-10 03:46:22
    國際標(biāo)準(zhǔn)檢索
    揭西县| 长泰县| 沁阳市| 七台河市| 潼关县| 陈巴尔虎旗| 通渭县| 时尚| 临洮县| 南平市| 潼关县| 蒲城县| 云安县| 浑源县| 内丘县| 前郭尔| 正阳县| 绥德县| 革吉县| 黄骅市| 五家渠市| 来安县| 察雅县| 三亚市| 内乡县| 宁河县| 灵丘县| 河东区| 长葛市| 济阳县| 轮台县| 滨州市| 秭归县| 隆安县| 长子县| 南漳县| 虎林市| 剑阁县| 永吉县| 黄平县| 元阳县|