崔陽兵
摘?要:文章分析了數(shù)字人文時代圖書館地方文獻(xiàn)的特征,并從地方文獻(xiàn)數(shù)據(jù)源、地方文獻(xiàn)大數(shù)據(jù)采集與分析、文獻(xiàn)過濾與價值提取、地方文獻(xiàn)大數(shù)據(jù)分析結(jié)果可視化表達(dá)等角度闡述了圖書館地方文獻(xiàn)大數(shù)據(jù)分析流程,最后提出了地方文獻(xiàn)大數(shù)據(jù)分析平臺構(gòu)建策略,以期為相關(guān)研究提供參考。
中圖分類號:G250文獻(xiàn)標(biāo)識碼:A文章編號:1003-1588(2020)09-0112-02
關(guān)鍵詞:數(shù)字人文時代;圖書館;地方文獻(xiàn);大數(shù)據(jù)
在信息技術(shù)的帶動下,數(shù)字人文應(yīng)運(yùn)而生,數(shù)字人文是指用計(jì)算機(jī)技術(shù)處理和分析傳統(tǒng)的人文研究資料,并將人文學(xué)科方法論與計(jì)算工具相結(jié)合進(jìn)行人文研究[1]。圖書館作為重要的知識服務(wù)機(jī)構(gòu),在地方文獻(xiàn)資源的搜集、存儲、使用方面發(fā)揮著重要作用。使用大數(shù)據(jù)技術(shù)對海量的地方文獻(xiàn)資源進(jìn)行處理,從中挖掘出有價值的數(shù)據(jù)資源供用戶使用,可以有效提升地方文獻(xiàn)的使用效率,更有效地發(fā)揮出地方文獻(xiàn)的學(xué)術(shù)價值、歷史價值[2]。同時,數(shù)字技術(shù)與人文社科研究的有機(jī)結(jié)合使圖書館的地方文獻(xiàn)資源存儲方式由傳統(tǒng)的紙質(zhì)存儲向數(shù)字化轉(zhuǎn)變,大數(shù)據(jù)技術(shù)分析平臺的建立也為圖書館地方文獻(xiàn)的量化分析和智能處理奠定了基礎(chǔ),使圖書館可以為用戶提供更高質(zhì)量的服務(wù)。
1?數(shù)字人文時代圖書館地方文獻(xiàn)的特征
數(shù)字人文時代的一個重要特征就是將數(shù)字技術(shù)與人文研究結(jié)合在一起,使地方文獻(xiàn)成為重要的數(shù)字化資源。大數(shù)據(jù)環(huán)境下,圖書館地方文獻(xiàn)的特征體現(xiàn)在分析對象向數(shù)字化方向轉(zhuǎn)變以及分析方法向智能化和多樣化方向轉(zhuǎn)變兩個方面。
1.1?地方文獻(xiàn)向數(shù)字化方向轉(zhuǎn)變
圖書館傳統(tǒng)的地方文獻(xiàn)分析首先需要搜集原始資料,為了將紙質(zhì)載體的地方文獻(xiàn)搜集起來,圖書館員要耗費(fèi)大量的時間和精力。面對數(shù)量龐大、浩如煙海的地方文獻(xiàn)資源,圖書館很難搜集完整,并且傳統(tǒng)的文獻(xiàn)分析方法效率低下、手段落后,很難從地方文獻(xiàn)中挖掘出有價值的資源[3],同時也很難驗(yàn)證文獻(xiàn)的真實(shí)性,從而導(dǎo)致后期用戶在使用地方文獻(xiàn)過程中出現(xiàn)問題。數(shù)字人文時代,大數(shù)據(jù)技術(shù)的出現(xiàn)在很大程度上解決了圖書館在地方文獻(xiàn)分析方面存在的問題。依托大數(shù)據(jù)分析平臺對地方文獻(xiàn)資源進(jìn)行搜集、分析、挖掘,將傳統(tǒng)的文獻(xiàn)處理方式轉(zhuǎn)化為大數(shù)據(jù)數(shù)字化分析方式,可以促進(jìn)分析對象向數(shù)字化方向轉(zhuǎn)變,使分析結(jié)果更具真實(shí)性、客觀性、可靠性。
1.2?分析方法向數(shù)字化和智能化方向轉(zhuǎn)變
在數(shù)字人文時代,地方文獻(xiàn)資源逐步實(shí)現(xiàn)了數(shù)字化,圖書館對于地方文獻(xiàn)資源的分析方法也逐步向數(shù)字化和智能化方向過渡。傳統(tǒng)模式下,圖書館對地方文獻(xiàn)資源的分類對比、邏輯分析主要通過人力完成[4],而地方文獻(xiàn)大數(shù)據(jù)分析平臺主要通過大數(shù)據(jù)技術(shù)對地方文獻(xiàn)進(jìn)行分析與挖掘,對挖掘出來的知識資源進(jìn)行加工和重組,從而發(fā)現(xiàn)地方文獻(xiàn)資源背后潛在的規(guī)律。數(shù)字人文時代,圖書館只有改變原有的地方文獻(xiàn)資源分析理念,才能拓寬研究范圍,為用戶提供更有效的服務(wù)。
2?數(shù)字人文時代圖書館地方文獻(xiàn)大數(shù)據(jù)分析的要求
2.1?結(jié)合地方文獻(xiàn)的特點(diǎn)進(jìn)行分析
不同種類的地方文獻(xiàn)資源對數(shù)據(jù)處理效率、數(shù)據(jù)處理精準(zhǔn)度有不同的要求[5],因此,圖書館在利用大數(shù)據(jù)分析地方文獻(xiàn)的過程中,需要結(jié)合其特點(diǎn)、種類,采用適當(dāng)?shù)姆治龇椒ㄅc分析策略。
2.2?掌握用戶的實(shí)際需求
在對地方文獻(xiàn)進(jìn)行大數(shù)據(jù)分析的過程中,圖書館只有根據(jù)地方文獻(xiàn)的特點(diǎn)制定合理的大數(shù)據(jù)分析策略,才能提高地方文獻(xiàn)采集、利用、管理的效率和有效性,從而實(shí)現(xiàn)地方文獻(xiàn)分析對象、分析策略和分析結(jié)果的有機(jī)統(tǒng)一;只有根據(jù)用戶的實(shí)際需求選擇適合的大數(shù)據(jù)技術(shù)標(biāo)準(zhǔn)并構(gòu)建合理的數(shù)據(jù)處理機(jī)制,才能保障地方文獻(xiàn)資源分析結(jié)果的質(zhì)量[6]。
2.3?規(guī)避分析過程中可能出現(xiàn)的風(fēng)險
大數(shù)據(jù)背景下,由地方文獻(xiàn)組成的海量資源數(shù)據(jù)呈現(xiàn)出數(shù)據(jù)規(guī)模快速上漲、數(shù)據(jù)分散存儲及不同結(jié)構(gòu)種類數(shù)據(jù)協(xié)同融合的趨勢,導(dǎo)致地方文獻(xiàn)資源的管理、分析、存儲、傳輸難度加大。同時,伴隨地方文獻(xiàn)資源規(guī)模的不斷擴(kuò)大和種類的增多,地方文獻(xiàn)資源呈現(xiàn)出價值密度低以及無用數(shù)據(jù)比例上升的現(xiàn)象。此外,大數(shù)據(jù)分析平臺的結(jié)構(gòu)、大數(shù)據(jù)分析人員的技能、數(shù)據(jù)預(yù)測分析軟件的可用性以及用戶滿意度都成為影響圖書館地方文獻(xiàn)大數(shù)據(jù)分析效率和風(fēng)險控制的重要因素。
3?數(shù)字人文時代圖書館地方文獻(xiàn)大數(shù)據(jù)分析流程
數(shù)字人文時代,圖書館地方文獻(xiàn)大數(shù)據(jù)分析流程主要由地方文獻(xiàn)數(shù)據(jù)源、地方文獻(xiàn)大數(shù)據(jù)采集與存儲、文獻(xiàn)過濾與價值提取、知識發(fā)現(xiàn)、地方文獻(xiàn)數(shù)據(jù)分析結(jié)果呈現(xiàn)五部分組成,詳見圖1。
地方文獻(xiàn)數(shù)據(jù)源主要由圖書館館藏資源、地方文獻(xiàn)數(shù)據(jù)庫、地方知識文化網(wǎng)站等組成。大數(shù)據(jù)背景下,圖書館主要通過云計(jì)算、云存儲、數(shù)據(jù)集成等技術(shù)對地方文獻(xiàn)數(shù)據(jù)源進(jìn)行采集與存儲,在這個過程中要盡可能提高價值密度,降低大數(shù)據(jù)分析平臺的負(fù)荷,同時要對提取的文獻(xiàn)數(shù)據(jù)資源進(jìn)行深度挖掘并根據(jù)用戶需求進(jìn)行精準(zhǔn)匹配。此外,圖書館還需要將數(shù)據(jù)資源轉(zhuǎn)化為可供用戶使用的形式并推送至用戶。
4?數(shù)字人文時代圖書館地方文獻(xiàn)大數(shù)據(jù)分析平臺構(gòu)建策略
4.1?增強(qiáng)圖書館對地方文獻(xiàn)資源的分析能力
在對地方文獻(xiàn)資源進(jìn)行分析的過程中,增強(qiáng)圖書館的分析能力是為用戶提供科學(xué)高效知識服務(wù)的前提和基礎(chǔ)。首先,圖書館要使用大數(shù)據(jù)技術(shù)對用戶使用地方文獻(xiàn)資源的需求、內(nèi)容、方法、模式進(jìn)行分析、預(yù)測、判斷;其次,圖書館要確保大數(shù)據(jù)分析平臺在分析地方文獻(xiàn)資源過程中的安全、有效、可控;再次,圖書館應(yīng)選擇科學(xué)高效的算法工具提取地方文獻(xiàn)資源中有價值的部分;最后,圖書館地方文獻(xiàn)大數(shù)據(jù)分析平臺要具備實(shí)時分析能力和可視化分析能力。
4.2?提高大數(shù)據(jù)平臺的分析、存儲及處理能力
數(shù)字人文時代,地方文獻(xiàn)資源的來源具有多樣性,因此,首先,圖書館地方文獻(xiàn)大數(shù)據(jù)分析平臺應(yīng)具備良好的智能化管理功能,能對海量地方文獻(xiàn)資源進(jìn)行采集、存儲、挖掘、運(yùn)算、分析以及配置;其次,隨著圖書館地方文獻(xiàn)資源總量的快速增長,圖書館應(yīng)構(gòu)建滿足大數(shù)據(jù)平臺實(shí)時分析和即時傳輸需求的網(wǎng)絡(luò),保障大數(shù)據(jù)資源存儲管理的高效、便捷、安全;再次,圖書館要重視提升地方文獻(xiàn)大數(shù)據(jù)分析平臺的分析能力,在保障大數(shù)據(jù)資源安全可靠及快速傳輸?shù)那疤嵯?,?yōu)化大數(shù)據(jù)分析平臺的結(jié)構(gòu),使地方文獻(xiàn)大數(shù)據(jù)分析平臺的運(yùn)算能力得到有效提升。
4.3?提高地方文獻(xiàn)資源的科學(xué)性
數(shù)字人文時代,圖書館只有保障地方文獻(xiàn)資源具有較高的可靠性和科學(xué)性,才能實(shí)現(xiàn)對地方文獻(xiàn)有效的分析,從而使大數(shù)據(jù)分析結(jié)果更加全面和科學(xué)。首先,圖書館既要對地方文獻(xiàn)資源進(jìn)行采集,又要對其進(jìn)行有效存儲。其次,圖書館應(yīng)建立科學(xué)的地方文獻(xiàn)資源儲存和分析流程,保障地方文獻(xiàn)大數(shù)據(jù)資源存儲的可靠性和分析的可行性。再次,圖書館應(yīng)對大數(shù)據(jù)資源進(jìn)行有效過濾和深度價值挖掘,構(gòu)建符合圖書館地方文獻(xiàn)服務(wù)需求的大數(shù)據(jù)資源分析流程。最后,地方文獻(xiàn)資源大數(shù)據(jù)分析結(jié)果應(yīng)具備可靠性和可用性。可靠性是指保障地方文獻(xiàn)大數(shù)據(jù)的來源與大數(shù)據(jù)分析結(jié)果是可靠的,在地方文獻(xiàn)大數(shù)據(jù)分析過程中應(yīng)避免出現(xiàn)經(jīng)驗(yàn)主義的現(xiàn)象[7];可用性是指地方文獻(xiàn)大數(shù)據(jù)分析平臺提供的分析結(jié)果是可用的,能滿足圖書館的服務(wù)需求。
5?結(jié)語
數(shù)字人文時代,用戶對圖書館地方文獻(xiàn)服務(wù)的質(zhì)量、內(nèi)容和模式都提出了更高的要求。在此背景下,圖書館只有了解用戶需求并對地方文獻(xiàn)資源進(jìn)行深度挖掘與分析,才能為其提供更有價值的服務(wù)。
參考文獻(xiàn):
[1] 陳紅彥.古籍文本數(shù)據(jù)格式化比較研究[M].上海:上海遠(yuǎn)東出版社,2017:93-96.
[2] 徐俊.論大數(shù)據(jù)環(huán)境下公共圖書館地方文獻(xiàn)數(shù)據(jù)服務(wù)體系的構(gòu)建[J].圖書館研究與工作,2017(5):60-63.
[3] 王娟.云計(jì)算環(huán)境下地方高校圖書館區(qū)域特色文獻(xiàn)保障體系建設(shè)與服務(wù)模式探討[J].農(nóng)業(yè)圖書情報(bào)學(xué)刊,2014(10):24-28.
[4] 王亮亮,齊月.大數(shù)據(jù)環(huán)境下黑龍江地方文獻(xiàn)資源的開發(fā)與保障體系研究[J].圖書館學(xué)刊,2016(6):42-44.
[5] 孫軍.大數(shù)據(jù)時代縣級公共圖書館數(shù)字化創(chuàng)新發(fā)展研究:以阜寧縣圖書館地方文獻(xiàn)數(shù)字化建設(shè)為例[J].文教資料,2015(20):56-57.
[6] 侯勇,王護(hù)寧,徐俊.大數(shù)據(jù)背景下公共圖書館館藏地方文獻(xiàn)利用的探討:以安徽地方戲曲文獻(xiàn)為例[J].大學(xué)圖書情報(bào)學(xué)刊,2016(3):84-87.
[7] 劉海燕.大數(shù)據(jù)環(huán)境下地方特色數(shù)據(jù)庫的建設(shè):武漢城市文化文獻(xiàn)數(shù)據(jù)庫建設(shè)探析[J].科技通報(bào),2018(7):280-283.
(編校:周雪芹)