【摘要】 本文采用文獻(xiàn)調(diào)查法,利用中國(guó)知網(wǎng)學(xué)術(shù)期刊數(shù)據(jù)庫(kù),對(duì)主題詞“大數(shù)據(jù)”“高校圖書(shū)館”等進(jìn)行簡(jiǎn)單檢索和布爾邏輯檢索,研究目前大數(shù)據(jù)環(huán)境對(duì)高校圖書(shū)館發(fā)展的研究情況,分析高校圖書(shū)館大數(shù)據(jù)環(huán)境中的各種類型數(shù)據(jù),為了更好地發(fā)揮這些數(shù)據(jù)優(yōu)勢(shì)來(lái)服務(wù)用戶,對(duì)高校圖書(shū)館的數(shù)據(jù)管理進(jìn)行優(yōu)化路徑分析。
【關(guān)鍵詞】 大數(shù)據(jù);高校圖書(shū)館;數(shù)據(jù)管理;路徑
【DOI編碼】 10.3969/j.issn.1674-4977.2021.01.038
Abstract: In this paper,using the method of literature survey and CNKI academic journal database,the subject words "big data" and "University Library" are simply searched and Boolean logic searched. The current research situation of University Library Development in big data environment is studied,and various types of data in University Library big data environment are analyzed,in order to better play the advantages of these data to serve This paper analyzes the optimization path of university library data management.
Key words: big data;university library;data management;path
最早提出大數(shù)據(jù)時(shí)代到來(lái)的是全球知名咨詢公司麥肯錫在2011年5月發(fā)表了一篇報(bào)告《大數(shù)據(jù):創(chuàng)新、競(jìng)爭(zhēng)和生產(chǎn)力的下一個(gè)前沿》,從這一刻起,大數(shù)據(jù)開(kāi)始備受各行各業(yè)的關(guān)注。圖書(shū)館作為保存?zhèn)鬟f人類文化知識(shí)的機(jī)構(gòu),其具有各種豐富的數(shù)據(jù)資源,高校圖書(shū)館作為圖書(shū)館中的一種,在承載著圖書(shū)館屬性的基礎(chǔ)上,自然具有更強(qiáng)的大數(shù)據(jù)環(huán)境,高校圖書(shū)館如何能利用這種大數(shù)據(jù)環(huán)境進(jìn)行高效的數(shù)據(jù)管理,從而為全校教學(xué)、科研乃至社會(huì)機(jī)構(gòu)或者國(guó)家所服務(wù)是值得思考的問(wèn)題。
1 大數(shù)據(jù)定義
麥肯錫公司給出的定義:大數(shù)據(jù)是一種規(guī)模大到在獲取、存儲(chǔ)、管理、分析方面大大超出了傳統(tǒng)數(shù)據(jù)庫(kù)軟件工具能力范圍的數(shù)據(jù)集合。
目前對(duì)于大數(shù)據(jù)沒(méi)有統(tǒng)一的定義,筆者認(rèn)為大數(shù)據(jù)定義可以簡(jiǎn)要概括為海量數(shù)據(jù)+處理辦法,實(shí)際上就是利用先進(jìn)的處理數(shù)據(jù)的辦法,將海量數(shù)據(jù)挖掘出有價(jià)值的數(shù)據(jù),并將這些有利用價(jià)值的數(shù)據(jù)進(jìn)行可視化,還能利用一定的技術(shù)方法存儲(chǔ)這些海量數(shù)據(jù),對(duì)數(shù)據(jù)安全做好防護(hù)等一系列的問(wèn)題。
2 研究概況
通過(guò)檢索中國(guó)知網(wǎng)數(shù)據(jù)庫(kù),采用簡(jiǎn)單檢索模式,檢索時(shí)間為2020年7月20日,對(duì)主題詞“大數(shù)據(jù)”進(jìn)行檢索,得到檢索結(jié)果214130條(其中由于2020年僅過(guò)去半年多,目前發(fā)文量為18201條,中國(guó)知網(wǎng)預(yù)測(cè)2020年整年發(fā)文量可達(dá)到46891條,可以看出仍是持續(xù)走高的趨勢(shì),這里按照知網(wǎng)預(yù)測(cè)發(fā)文量進(jìn)行計(jì)算),可以看出以“大數(shù)據(jù)”為主題的發(fā)文量是從2011年開(kāi)始增多,直到2016年是持續(xù)增長(zhǎng),在2016到2018年增長(zhǎng)速度有所回落,但從2019年又出現(xiàn)迅猛增長(zhǎng)的趨勢(shì)。通過(guò)主題分布,可以得到以主題“大數(shù)據(jù)”為檢索詞進(jìn)行檢索,熱度最高的分別為:大數(shù)據(jù)、大數(shù)據(jù)時(shí)代、大數(shù)據(jù)技術(shù)、crop selection、大數(shù)據(jù)背景下、big data、云計(jì)算、大數(shù)據(jù)分析、數(shù)據(jù)挖掘、人工智能、大數(shù)據(jù)環(huán)境、Hadoop、互聯(lián)網(wǎng)金融、大數(shù)據(jù)平臺(tái)、物聯(lián)網(wǎng)。
在上述檢索結(jié)果中輸入主題詞“圖書(shū)館”,得到5370條結(jié)果,筆者又進(jìn)行擴(kuò)檢,采用高級(jí)檢索模式,將主題詞設(shè)為“數(shù)據(jù)”并含“圖書(shū)館”進(jìn)行檢索,得到34487條,其中關(guān)于高校圖書(shū)館有6730條,占19.51%??梢?jiàn)高校圖書(shū)館在大數(shù)據(jù)環(huán)境下,關(guān)于數(shù)據(jù)方面的論文也占有一席之地,具有研究?jī)r(jià)值,其中研究熱度從高到低為:高校圖書(shū)館、圖書(shū)館、大數(shù)據(jù)、academic libraries,大數(shù)據(jù)時(shí)代、數(shù)據(jù)挖掘、大數(shù)據(jù)環(huán)境、new data、數(shù)據(jù)庫(kù)、數(shù)據(jù)挖掘技術(shù)、大數(shù)據(jù)背景下等。
3 高校圖書(shū)館中數(shù)據(jù)資源
3.1 資源數(shù)據(jù)
高校圖書(shū)館的館藏體系中包含大量的專業(yè)性的紙質(zhì)資源數(shù)據(jù),這些紙質(zhì)資源數(shù)據(jù)隨著時(shí)間的推移,數(shù)量會(huì)越來(lái)越多。隨著信息技術(shù)的不斷發(fā)展,數(shù)字圖書(shū)館已經(jīng)成為了圖書(shū)館中很重要的一個(gè)部分,智慧圖書(shū)館也在不斷發(fā)展中,目前的高校圖書(shū)館中的資源數(shù)據(jù)不僅包括紙質(zhì)資源數(shù)據(jù),還有大量的數(shù)字?jǐn)?shù)據(jù),而且數(shù)字資源較紙質(zhì)資源相比更新速度快,遠(yuǎn)程可獲取,可以滿足多人同時(shí)使用,因此用戶更加青睞使用數(shù)字化資源。
3.2 環(huán)境數(shù)據(jù)
目前大多數(shù)高校圖書(shū)館都具有監(jiān)控設(shè)備,很多圖書(shū)館已經(jīng)做到了360度無(wú)死角全程監(jiān)控,在這些監(jiān)控設(shè)備中存在大量的監(jiān)控?cái)?shù)據(jù);圖書(shū)館保存文獻(xiàn),其空間需要一定條件的溫度和濕度,讀者在自修室學(xué)習(xí)的時(shí)候,對(duì)其室內(nèi)的溫度,照明度都有一定的要求,這些都會(huì)產(chǎn)生大量的數(shù)據(jù);當(dāng)讀者進(jìn)出圖書(shū)館時(shí),刷卡通過(guò)門(mén)禁系統(tǒng),每時(shí)每刻會(huì)產(chǎn)生海量數(shù)據(jù),高校圖書(shū)館如果能將這些環(huán)境數(shù)據(jù)管理好,會(huì)為智慧圖書(shū)館做出很人性化的數(shù)據(jù)支撐。
3.3 用戶數(shù)據(jù)
高校圖書(shū)館中的用戶多為師生,可以說(shuō)受眾群體比較穩(wěn)定,圖書(shū)館的宗旨是全心全意為用戶服務(wù),用戶在享受圖書(shū)館提供的服務(wù)過(guò)程中會(huì)產(chǎn)生大量的行為數(shù)據(jù),這對(duì)于大數(shù)據(jù)環(huán)境起到至關(guān)重要的作用。用戶在圖書(shū)館注冊(cè)制卡的過(guò)程中,圖書(shū)館可以掌握用戶的身份數(shù)據(jù);當(dāng)用戶發(fā)生圖書(shū)借閱行為時(shí),會(huì)產(chǎn)生大量的借閱行為數(shù)據(jù);當(dāng)用戶瀏覽高校圖書(shū)館網(wǎng)站,查看推薦書(shū)目時(shí)會(huì)產(chǎn)生用戶偏好數(shù)據(jù)等。這些用戶數(shù)據(jù)足以構(gòu)成用戶行為大數(shù)據(jù)環(huán)境,高校圖書(shū)館如果能將這些用戶數(shù)據(jù)有效挖掘利用,在大量數(shù)據(jù)的基礎(chǔ)上,通過(guò)建立數(shù)學(xué)模型,建立用戶畫(huà)像,預(yù)測(cè)用戶行為,從而更有針對(duì)性地為用戶提供精準(zhǔn)化服務(wù)。
3.4 業(yè)務(wù)數(shù)據(jù)
高校圖書(shū)館的工作人員在提供服務(wù)的過(guò)程中,也會(huì)產(chǎn)生大量的業(yè)務(wù)數(shù)據(jù)。采訪部門(mén)在采購(gòu)紙質(zhì)圖書(shū)或者電子圖書(shū)時(shí)的數(shù)據(jù);編目部門(mén)在加工圖書(shū)時(shí)產(chǎn)生的MARC數(shù)據(jù),有條件的圖書(shū)館還需要轉(zhuǎn)換成RFID數(shù)據(jù);圖書(shū)館服務(wù)器中存在大量的數(shù)據(jù);參考咨詢過(guò)程中產(chǎn)生的價(jià)值量很高的數(shù)據(jù);流通部門(mén)在流通過(guò)程中產(chǎn)生的大量的借還、續(xù)借等數(shù)據(jù);閱讀推廣過(guò)程中產(chǎn)生的用戶喜好數(shù)據(jù)等等,這些都是高校圖書(shū)館中的數(shù)據(jù)資源,為大數(shù)據(jù)環(huán)境做好了充足準(zhǔn)備。
4 高校圖書(shū)館數(shù)據(jù)管理優(yōu)化路徑探析
4.1 館內(nèi)數(shù)據(jù)
4.1.1 建立機(jī)構(gòu)知識(shí)庫(kù)
針對(duì)以上梳理出的高校圖書(shū)館中存在的大數(shù)據(jù)環(huán)境,可見(jiàn)建立機(jī)構(gòu)知識(shí)庫(kù)的重要性,機(jī)構(gòu)知識(shí)庫(kù)可以針對(duì)每個(gè)高校不同的特點(diǎn)進(jìn)行有針對(duì)性的建設(shè),宗旨就是將一切高校圖書(shū)館中產(chǎn)生的有利用價(jià)值的數(shù)據(jù)全部收錄,當(dāng)用戶需要某項(xiàng)數(shù)據(jù)時(shí),通過(guò)檢索該校圖書(shū)館的機(jī)構(gòu)知識(shí)庫(kù),可以快捷、方便的查找到所需數(shù)據(jù)的過(guò)程。高校圖書(shū)館在建立機(jī)構(gòu)知識(shí)庫(kù)時(shí)需要考慮的問(wèn)題很多,其難點(diǎn)在于怎么樣對(duì)這些數(shù)據(jù)進(jìn)行保護(hù),為不同人群提供更有針對(duì)性的數(shù)據(jù),這些是值得各個(gè)高校圖書(shū)館深思的問(wèn)題。
4.1.2 可視化屏幕
對(duì)于大數(shù)據(jù)的有效管理方式就是數(shù)據(jù)的可視化,可視化會(huì)更直觀的看出發(fā)展趨勢(shì)以及問(wèn)題所在。目前很多高校圖書(shū)館針對(duì)用戶的基礎(chǔ)數(shù)據(jù)等方面做了大數(shù)據(jù)可視化展示,但對(duì)于真正意義上的大數(shù)據(jù)管理還有一定差距,例如通過(guò)用戶的進(jìn)出館數(shù)據(jù)分析,可以在可視化屏幕上清楚的統(tǒng)計(jì)出實(shí)時(shí)數(shù)據(jù),通過(guò)這個(gè)數(shù)據(jù)也能推測(cè)出相同情況下用戶的人數(shù)等數(shù)據(jù),通過(guò)用戶借閱圖書(shū)信息,也能夠很輕松地預(yù)測(cè)出哪類用戶在什么時(shí)間范圍內(nèi)會(huì)借這類圖書(shū),這些都是高校圖書(shū)館通過(guò)大數(shù)據(jù)分析,建模成功預(yù)測(cè)的數(shù)據(jù)信息,高校圖書(shū)館應(yīng)善于將這些挖掘出的大數(shù)據(jù)體現(xiàn)在可視化屏幕上。
4.2 館外數(shù)據(jù)
高校圖書(shū)館隸屬于所在高校,有很多平行部門(mén),要多與其他相關(guān)部門(mén)合作,協(xié)助其他部門(mén)提供數(shù)據(jù)服務(wù),既讓其他相關(guān)部門(mén)了解到高校圖書(shū)館提供數(shù)據(jù)服務(wù)的能力,又能提升圖書(shū)館在高校中的地位,從而為高校圖書(shū)館贏得更多話語(yǔ)權(quán)。
4.2.1 與科研處合作
高校圖書(shū)館可以與科研處合作管理全校教師的科研數(shù)據(jù),將全校教師科研成果管理好,也可以將這些科研數(shù)據(jù)放到圖書(shū)館的機(jī)構(gòu)知識(shí)庫(kù)中,這樣不僅可以使全校教師快速查找、利用所需數(shù)據(jù),還能便于高校分析哪些科研成果可以成為一項(xiàng)特色項(xiàng)目,在大數(shù)據(jù)的環(huán)境下可以敏銳的發(fā)現(xiàn)研究熱點(diǎn)。另外,在日后教育部門(mén)填報(bào)數(shù)據(jù)時(shí)也能快速起到數(shù)據(jù)支撐作用。
4.2.2 與教務(wù)處合作
今年的疫情來(lái)勢(shì)洶洶,全國(guó)上下齊心協(xié)力抗戰(zhàn)病毒,各個(gè)高校都采取了線上教學(xué)模式,從這次疫情可以看到,學(xué)生們的教材出現(xiàn)很大的問(wèn)題。眾所周知高校圖書(shū)館屬于教輔部門(mén),不僅收錄紙質(zhì)版資源,還收錄電子版資源,如果高校圖書(shū)館能夠建立電子版教材庫(kù),這將為教學(xué)提供莫大的幫助。就能在疫情期間為師生提供充足的教材保障。對(duì)于各個(gè)專業(yè)電子教材的收集,這些數(shù)據(jù)也是海量的,需要高校圖書(shū)館能夠承載這些大數(shù)據(jù)。
4.2.3 與人事處合作
人事處的職責(zé)是統(tǒng)籌全校教職工情況,每年需要進(jìn)行教師職稱評(píng)定情況,高校圖書(shū)館可以與人事處合作,建立教師檔案數(shù)據(jù)庫(kù),將教師的相關(guān)數(shù)據(jù)錄入,通過(guò)大數(shù)據(jù)分析,也能選班出更適合晉級(jí)的教師,更優(yōu)秀的教師,還通過(guò)統(tǒng)籌全校教師數(shù)據(jù)信息,也能為人事處招聘人才提供更精準(zhǔn)的數(shù)據(jù)。
5 結(jié)語(yǔ)
高校圖書(shū)館擁有得天獨(dú)厚的數(shù)據(jù)優(yōu)勢(shì),在大數(shù)據(jù)環(huán)境下系統(tǒng)性地管理好產(chǎn)生的數(shù)據(jù)資源, 這些海量數(shù)據(jù)會(huì)讓高校圖書(shū)館服務(wù)錦上添花,通過(guò)這些數(shù)據(jù)能夠更精準(zhǔn)的定位用戶,幫助預(yù)測(cè)用戶的行為等,還能通過(guò)與其他部門(mén)合作共同提供數(shù)據(jù),幫助高校圖書(shū)館提升自己的地位,高校圖書(shū)館在數(shù)據(jù)管理方面還有很遠(yuǎn)的一段路要走,但是目前已經(jīng)可以看見(jiàn)曙光就在前面,讓我們圖書(shū)館人砥礪前行。
【參考文獻(xiàn)】
[1] 百度百科.大數(shù)據(jù)[EB/OL].[2020-07-23].https://baike.baidu.com/item/大數(shù)據(jù)/1356941.
[2] 蔡翠紅.國(guó)際關(guān)系中的大數(shù)據(jù)變革及其挑戰(zhàn)[J].世界經(jīng)濟(jì)與政治,2014(5):124-160.
[3] 魏來(lái).基于數(shù)據(jù)管理的智慧圖書(shū)館功能框架研究[J].數(shù)字圖書(shū)館論壇,2018(4):2-7.
[4] 吳秀明,劉云,高凡.大數(shù)據(jù)背景下圖書(shū)館閱讀推廣研究綜述[J].四川圖書(shū)館學(xué)報(bào),2020(3):97-100.
【作者簡(jiǎn)介】
張雙雙(1988-),女,碩士,研究方向?yàn)閳D書(shū)情報(bào)及相關(guān)。